監視プラットフォームを変えてみようと思い立ち……
弊社の監視プラットフォームは、古き良きnagios+muninで運用されてます。
さすがに、クラウドサービスを使っている中で、仮想マシン立てたら、コンフィグファイル書き換えて、プロセスの再起動してが、面倒になってきました。
設定を間違えますし、監視の設定を忘れたりもしますから。
そこで、弊社も大分流行に乗り遅れた感もありながら、Prometheus+grafanaを導入することにしました。
PrometheusはPULL型(監視する側が、監視される側へ取りに行く)ですが、AWSやAzure、GCEは、APIで仮想マシンの情報を取得して、動的に変更してくれるのは便利ですね。らくちん。
構築とか……?
構築に関しては、検索してもらえれば、様々なWEBがでてきますので、そちらを参考に。
監視される側は、新規に立てる仮想マシンを中心に、Ansibleでexporter(監視エージェントですね)をインストールしていきました。
そんな訳で!
こんな感じで仮想マシン監視のダッシュボードができあがりました。
まだまだ、ミドルウェアのダッシュボード作成とか、アラートの作成とかやることは沢山ありますが、まずは、一段落です。