NaviPlus Engineers' Blog

セミナー報告:AWS Summit Tokyo 2017 Day2

AWS Summit Tokyo 2017に参加しました。

AWS Well-Architected フレームワークによるクラウドベストプラクティス

AWS上でシステムを組む上での設計指針についての話でした。詳しくはAWS による優れた設計を直接読んでいただければ良いとは思います。
個人的に重要だと思ったのは、「可用性 = MTTF / (MTTF+MTTR)」という式の話でしょうか。故障を減らす(MTTFを小さくする)だけでなく、故障からの復旧時間を小さくする(MTTRを小さくする)のも重要、というかMTTRさえ十分小さいなら故障は許容すべき、というのは重要な設計原則だと思いました。
また、自社サーバだけでシステムを構築する際と違って、本番と同じ規模の検証用サーバを使って検証出来る、というのも重要な観点ですね。

Going Serverless with AWS

AWS サーバーレスアプリケーションモデルの概要の話でした。またキヤノン社でのサーバレスの取り組みについての講演がありました。
AWSでのサーバレスアプリはまだ不慣れで詳しくはないのですが、例えばこの chalice とか使えば Python の bottle/flask のような感覚で簡単にサーバレスアプリが書けそうではありますね。
また、PyWrenというのも初めて知りました。AWS Lambdaを使って並列化することで高速に計算したりS3を高速に読み書きするフレームワークのようです。これ、便利そうではありますが、EMRとかに比べて費用はどんな感じになるんだろう。

Amazon Aurora for PostgreSQL

Aurora に PostgreSQL 互換版も出たよ、という話。RDS版のPostgreSQLを使うよりはAurora版を使え、という感じ。
この発表は途中で抜けて、別の会場へと移動しました。

[JapanTaxi] Athena 指向アナリティクス 〜真面目に手を抜き価値を得よ〜

JapanTaxi様の、Athenaを使った解析基盤の話。Athenaのメリットとしては、課金はスキャン量依存、S3をそのままデータソースに出来る、というのが利点だとのことでした。Athenaに向かないことも沢山(前処理後処理的なものなど)ありそれらはEMRを使っている、ETLにはEmbulkを、可視化はredashだそうです。
AthenaからS3読むの、速度がどの程度でるのでしょうね。そのうち試してみないと。

Gunosy における AWS 上での自然言語処理・機械学習の活用事例(仮)

Gunosy様で行っている、記事分類、属性判定、スコアリングに関する話でした。
記事分類は、ニュース記事をカテゴリ分類する話です。クラウドソーシングで作成した教師データを元に、形態素解析して多クラス分類にかけているようです。
属性判定は、年齢性別地域などを、記事への反応からCNNを使って求めているそうです。うーむ、なぜCNNなのか、ちょっと不思議ですね。
評価に関しては、アルゴリズムやUIに関して、CTRや滞在時間に関してA/Bテスト的なことを行って、ユーザ満足度の最適化を行っているそうです。