勉強会「データサイエンティスト実践セミナー Sparkによる機械学習とディープ・ラーニング」に参加したので報告。
この勉強会はIBMが開催してるBig Data University Tokyo Meetup #9というイベントです。登壇者もIBMの2人でした。
一つ目の発表は PySpark の MLLib の SVM の簡単なチュートリアルでした。(Jupyterノートへのリンク)
このチュートリアルの中のデータ可視化で使われてる Brunel というライブラリが良いですね。どんな感じかというとインタラクティブなグラフのデモとかを見てもらえば。
チュートリアルを見た感じでは、複雑なグラフ、例えば棒グラフと折れ線グラフを1枚のグラフに表示する様なの、を簡単に書けるのが売りっぽい感じ。報告書用のある程度美麗なグラフを簡単に作れそう、というのが売りなのかな、と思いました。
インストール方法は詳しくはここに書かれてますが、 自分のJupyter環境にも $ pip install brunel
で簡単に導入できました。
BrunelをWebサービスとして動かすことも出来るらしいです。データ可視化ライブラリ、最近はたくさんあるなーという感じですね。
二つ目の発表は、Sparkでdeep learningという予定だったのですが、Numpyで多層パーセプトロンを作るよ、という話になったみたいでした。SparkML の deep learning の話なのかと期待してたので多少残念でした。