エンジニアブログ

エンジニアブログ

Pythonでの統計処理

logo2.gif やまかわ 2011年08月25日

こんにちはこんにちは山川です。

7/30に行われた札幌Python 3.1 で40分ほどPythonでの統計処理についてイントロを話してきました。
資料は以下です。

統計といえば R がおなじみ(SPSSとか使えるお金があるところは別ですが)ですが、
ロジックを作り込む場合や周辺処理が多い場合はPythonでやった方が便利な場面がけっこうあります。

データの前処理/後処理については R を利用する場合でもPerlなりRubyなりで加工することが多いですので、それだったら統計部分も同じスクリプトでかけた方が便利じゃないかろうか、Pythonだと割と統計用の道具がそろっているので便利だよーという話でした。

で、Python の使い道ですが、割と他に無いライブラリが結構そろっていることが多く、他の開発言語で難しいことが割合簡単に出来てしまうことがあります。今回の numpy/scipy だけでなく、やたらよくできた画像処理ライブラリ PIL なども良いですね。それからハイパー自然言語処理ライブラリ NLTK の存在や、OpenCV の公式 binding も Python ですし、使いたいライブラリがある場合は選択肢に入れると良いんじゃないかなあと思います。

あとWindowsでもだいたい動くのはほんとうに素晴らしいですねー。