質問

2009年01月22日 09時22分
  • 監視システム(オープンソース)の導入について

質問

お世話になります。

現在監視システムの導入を検討しています。
「Nagios」「Hobbit」「ZABBIX」「Hinemos」辺りが有力です。

検討を進めておりますが、情報収集の速度UPと見落としを防ぐ
ため、みなさまのお知恵を拝借できればと思います。

1)監視の概要
・pingによる死活監視
・システムリソース監視(CPU、メモリ、HDD)
・プロセス監視
・ログ監視
・上記内容が閾値を超えたらメールを飛ばします
・下記2の対象を統合的に監視

2)監視の対象
Windows(Windows Server 2003)・・・AD/DNS/DHCP×1台、ファイルサーバ×1台
Linux(CentOS 5.2)・・・Webサーバ×1台、WebのDBサーバ×1台、CRM用サーバ×2台
Netscreen-5GT・・・Firewall

実際に上記の内、いずれかの監視システムの導入されておられ、
1を実現するにあたっての「注意点」や「困った点」を教えて
いただければと思います。

2009年01月22日 09時22分

3件の回答があります

回答

私のところは、Nagios,Cactiを利用しています。

Nagiosのいいところは、pluginが充実しているのと、自作Pluginをつくれるところかなぁと。
結構簡単につくれるので、自分の取りたいデータを簡単にとることができますね。
Cactiも同様で、数字さえ吐き出せれば簡単にグラフ化できるので便利です。

両方とも英語なので、なれるまでがやっぱり大変です。
NagiosはWeb画面を日本語化しているProjectがあるので
そちらを使わせてもらっていますが、日本語にしたら余計にわからなくなったという…(これは私が英語Nagiosになれていたためですが…)

WindowsもPluginを入れて色々とNagiosで監視しております。
Hinemosは結構いいなぁと思っていたんですが、
Hinemosマネージャーが要求するスペックが少し高めなので結局Nagiosになりました。
Hinemosは、Webから見れないので運用チームの誰でも見れるとかがまだできないので、そのあたりも考慮しました。

ご参考までに

2009年01月22日 11時32分

回答

ZABBIXを使っています。

1)監視の概要
・pingによる死活監視
問題なくできますが、fpingが必要になります。

・システムリソース監視(CPU、メモリ、HDD)
・プロセス監視
こちらはエージェントの導入が必須になります。

・ログ監視
やったことがないのでわかりません。

・上記内容が閾値を超えたらメールを飛ばします
問題ないです。

・下記2の対象を統合的に監視

2)監視の対象
Windows(Windows Server 2003)・・・AD/DNS/DHCP×1台、ファイルサーバ×1台
Linux(CentOS 5.2)・・・Webサーバ×1台、WebのDBサーバ×1台、CRM用サーバ×2台
Netscreen-5GT・・・Firewall

Windows、Linuxともエージェントを入れることができれば、けっこうな情報が入手できます。
入れられない場合は、死活監視、ポート監視ぐらいしかできないかと思います。
ただしSNMPを導入していれば違うかもしれません(うちでは使ってないので…)
NetScreenについても、死活監視、ポート監視ぐらいですが、SNMPを導入(ry

困った点は、エラー判定が厳しいらしく、ちょっとしたことでも通知メールが飛んできます。
実際調べると問題ないことが多いです。なので、設定を工夫する必要があります
(1分間に何回エラーが発生したら本当のエラーとする、など)

一回設定が終わってしまえば(それまでが大変ですが…)運用状況のグラフなども自動生成されますので
使い勝手はよいと思います。
また、ほとんどすべての設定がWEBブラウザからできますので、その辺も楽なところだと思います。

2009年01月22日 10時38分

回答

現在の職場ではありませんがNagiosを導入した実績があります。
当時と比べても現在は書籍が発売されていますし情報収集に苦労することは少ないかと思います。
また、Nagios単体ではなく「GroundWork」でしたらパッケージ化されており導入も比較的容易にできるかと思います。
有償サポート版と無償のものがあったと思います。

現在Hinemoについて動作検証を行っています。
Nagiosから入った私に「できる事が多すぎてわかりづらい」イメージがあります。

Windows系のリソース監視についてはNagiosの方が簡単にできそうな気がします。
何れにしてもサーバ側にエージェントのインストール等が必要となってきます。

ネットワーク部分の監視というか管理にはCacitを使用しています。
SNMPベースでトラフィックや機器の負荷・メモリ状態をグラフ化できます。
MRTGをバージョンアップさせたものだとご理解いただければ近いかもしれません。

困った事ではないですが、GUIが英語ですので運用をされる方に拒否反応があればNGとなりますね。ご自身が利用されるなら問題ないかと思いますが。
以上、参考になれば幸いです。

2009年01月22日 09時40分

あなたもコメントしましょう!