Oisix・機械学習勉強会に参加しました。
食品関係のECサイトとかをされているOisix様の主宰する勉強会です。発表内容の資料は上記リンクのconnpassから取得できます。
最初の発表は「レビューのネガポジ RandomForest vs LSTM」でした。レビュー文章を形態素解析して入力とするとRFでもLSTMでも80%程度、文字単位のLSTMにすると90%程度出るよ、という話でした。あまり工夫しなくても90%出るのであれば興味深いです。
次の話は、F@N Communicationsの方の「異常値検知をしてる話」。色々綺麗な手法を使うよりも、移動平均で求めたTrendと、週による周期成分、で簡単に解析できたが、残差が正規分布してなくて誤検知も多かった、という話でした。まずは簡単な手法でいいから早く解析しよう、というのは、色々身に覚えがあってちょっと反省。
3番目の話は、カラビナテクノロジーの方の「トピックモデルでテキストをクラスタリングしてみた」という話。MeCab(neologd)+gensimでLDAしました、という話。入門的内容として良い紹介だと思います。
4番目が、「インパクトのあるデータ分析をするための鬼十則」。技術的な話ではなく、データ解析チームを率いる上での心構えとか考え方みたいな話でした。
最後が、「葉物野菜を見極めたい! by Keras」。既存のCNN(VGG16をimagenet)を再利用してFineTuningして、野菜の画像識別するのをKeras+TensorFlowで簡単にできるよ、というお話しでした。勉強になりました。