サイトアイコン BergamotMagic

PYTHON日記 ”Python実践データ加工/可視化100本ノック”をやってみた 4

第2章(ノック21〜40)

 第2章は、エクセルファイルの操作です。エクセルVBAで加工することも当然できるのですが、PYTHONでも同様のことができるというわけです。最近エクセルをPYTHONで操作するという本なども出ていますが、エクセルとより親和性が高いVBAではなくあえてPYTHONを使うメリットがよく分かりませんし、そもそもセキュリティポリシーを盾にPYTHON環境をインストールを認めない職場が多いと思うので実用性に疑問符です。ただし、それはエクセルファイルを単体で加工・活用する場合であって、エクセルで作成されたデータを他のフォーマットのデータと統合して分析・加工する処理をオートメーション化するのであればメリットが出てきます。

 それにしても、エクセルは、セルサイズを細分化して方眼紙代わりに使ってみたり、紙のイメージに近づけるためにセルを結合してみたり、データとして活用するには適していない使われ方をしていますね。総務省が2020年にまとめた「統計表における機械判読可能なデータの表記方法の統一ルールの策定」が普及していくといいのにと思いますが、多分無理でしょう。

 結局データ活用の際にエクセルファイルを作った人(組織)の癖を把握して、プログラムで加工・修正するといった前処理は今後も欠かせないと思います。別に総務省にケチをつける気はありませんが、メールアドレスの「@」を「_atmark_」に変えて、スパムメール対策になると本当に思っているのでしょうか。

 いろいろ能書きをたれましたが、やってみるとピボットテーブルを作れたり、ブック内の複数のシートを指定できるなど、結構器用なことができることがわかり、なるほどと感心しました。

 この章での私が学んだ主な内容、感想は以下のとおりです。後半は作成したデータを可視化するメソッドが続いていますが、実際に使うときに復習することにし、この要約では省きました

モバイルバージョンを終了