質問
おはようございます。
そこで、ファイルサーバとVPNが問題が発生した時に、
すぐに検知できるように、監視をしたいと思っています。
勤務先ではZABBIXのWindows エージェントをインストールし、
サーバー側でCPU使用率やDISK空き容量他、閾値を越えたら
メールを送出するようにしています。
VPNに関連するものはまだ監視していませんが他拠点にあるホストとの
通信ができなくなることを閾値にして、やはりメール通知することは
可能です。
ご参考まで。
お疲れ様です。
弊社では、サーバーは一括でZabbixで管理をしていますが、イベントログの内容は管理はしていません。
あくまでも、運用サービスの停止を防ぎたいのであれば、サーバーの内部状態(サービスの起動やOSの状態)も大事ですが、外部要因(スイッチ等のネットワーク機器の故障)や電源装置まわりの障害検知も大事になってくるように思われます。
弊社では、ハードウェア周りは、サーバー標準のツール(富士通製ですので、ServerView Operation Manager)を利用しています。
電源は、PowerChuteで管理をしています。
あまりいろいろ用意をすることになると、大げさになり過ぎるケースもありますから、どこまでの管理とするかを決められることをおすすめします。
イベントログの単体管理であれば、主にイベントログでクリティカルイベントを拾うようにすればよいと思います。
NotifEventLog
http://www.atmarkit.co.jp/fwin2k/win2ktips/1276notifb/notifb.html
というようなツールで実現できるかと思います。
監視による監視項目は1日にして出来る物ではないと思っています。
まずは、クリティカルやワーニングイベントをとり、不必要な物をどんどん除外していく形で精度を高めていけばよいかと思います。
サービスの起動状態確認は、主にポートが解放されているかになると思いますので、上記のZabbixのようなネットワーク系管理ツールで監視するのがベストだともいます。
弊社は、通知に関してはEメール通知でパトライト通知を利用しています。
メールでの配信であってもネットワークがやられると、メールサーバーも配信できなくなることにより、通知ができなくなるため、障害の検知が遅れることを防ぐための対策です。
(今のところ、そのような大きな問題は無いのですが・・・)
監視ツールに関しては、
No.2779 ネットワーク機器の管理ツールについて
https://syszo.com/okweb3/EokpControl?&tid=26630&event=QE0004
もご参考にしてください。
弊社の事例等も可能な限り、ご提供しますので、具体性等が見えればまたお知らせいただければ、お力になれるかもしれません。
質問
弊社では、ファイルサーバとVPNの2つが特に大事な部分であり、
他は止まっても影響度は少ないし、最悪運用回避できます。
そこで、ファイルサーバとVPNが問題が発生した時に、
すぐに検知できるように、監視をしたいと思っています。
今、考えている方法としては、
以下の2つですが、どちらも問題があります。
(1)イベントログを自動で検知してアラートを飛ばす
ただし、あらかじめ問題となるイベントログがわかっていないといけませんが、
それがわかりません。。。
(2)サービスの起動状態を監視する
ただし、サービスが起動していても、
正常に動作していない場合は検知できない。。。
毎日イベントログを目視でチェックするのは、
効率が悪いので自動的に監視するような仕組みにしたいと思っています。
ご助言お願いいたします。
また、皆様のところで、行っていることとかあれば、
ぜひ教えてください。