サイトアイコン BergamotMagic

PYTHON日記 ”Python実践データ加工/可視化100本ノック”をやってみた 3

第1章(ノック1〜20)

 第1章です。ネットにアップされているデータ(csvファイル)をデータ処理しやすくするための加工方法について学びます。この章で解説されている内容は、csvをエクセルで読み込んでエクセル上で処理することもできますが、pythonでデータ処理をする基本事項の解説という側面もあるので、やってみて損はないと思います。PCでデータ処理するといつも悩まされる日付型(datetime)データについても触れられており参考になりました。

 教材データは法人情報データです。元データがどこのものか分かりませんが、法人番号制度が始まって法人情報のデータ化が進んでいるんだなあと思いました。私が探してみた範囲ではgBizINFOで似たようなデータを提供していました。

 作業はpyhtonの基本ライブラリであるpandas、OS、glob、matplotlib、seabornなどを使います。ところでpythonの優位性は構文がわかりやすいことに加え、豊富なライブラリ群にあると言われています。素人発想で間違っているかもしれませんが、言語の特徴というのは言語本体よりもライブラリのラインアップによるように思います。swiftなんかも独自ライブラリに加え、python用のライブラリをそのままインポートできれば便利なような気がするんですがどうなんでしょうか。

 閑話休題。この章での私が学んだ主な内容、感想は以下のとおりです。

モバイルバージョンを終了