Monitoring System稼働

Zabbixをベースにしたモニタリングシステムの稼働を開始しました。
基本的にRHEL系をターゲットにしたテンプレートを集中的に作成しているため、Debian他は後回しになってしまっているため、現状ではサポートシステムはRHEL 6/7,CentOS 6/7,AmazonLinuxということになります。AmazonLinux2はまだテストできていませんが、基本的には大丈夫だと思います。
ただ、AmazonLinux2はまだ未成熟な感じが強いですね。

ひとまずはメトリクスを収集できること、サービスダウンへの自動Restartを実装済みになっています。
また、自動起動としてchkconfigやsystemctlから拾い出せるサービスはLLDでの自動ディスカバリの対象となります。サービスリスト表がまだ限定的なので、主要なシステムサービスがメインのディスカバリとなります。
syslogとかatとかcronとかntp系などの基本部分ですね。systemctlならrestart=alwaysでも定義してしまえばいいですし、initdでもrespawnという手はありますが、不測の事態というのはあるものですから、外からスクリプトを叩く回復動作があってもいいじゃない、ということで。無用の場合はオフにできるようになっています。

httpdやmysqldなどはそれに伴う別のメトリクスアイテムを定義したいということもあり、いわゆるミドルウェアサーバは別テンプレートとして定義していっています。

これに伴って、Zabbixにストアしたアイテムデータから月次のレポートを吐き出そうと思い、Grafanaから出力できないかな、と試みたのですが、Grafana-reporterがいまいちまともに動いてくれず…。grafanaのAPIをうまく叩けていないのが原因っぽいのですが。
しかし、結局PDFにしなくてもSnapshotを出力したほうが、インタラクティブに確認できるので、正直こちらのほうが利便性は高いかなと思いなおしました。

紙ベース至上主義の方々には申し訳ないのですが、グラフはSnapshotで提供させていただければ、と思います。
Grafanaの権限管理がもう少し細かくやれればいいのですが…。

さて、それとは別にメールベースでのレポーティングも必要ですので、月次のレポーティングのためにzabbix apiを久しぶりにたたきました。

なんというか、REST API全盛期にJSON-RPCを叩く、ってとっても悲しい気分になるのですが、もくもく会に参加させていただき、もくもくと作っていました。
人の目があると集中度合いがここまで変わるのか、ともくもく会開催がエンジニアの間で流行ってるのはそういうことか、と実感しました。
ハッカソンとかはまたちょっと違うのでしょうが。

成果はまた別の投稿で。