質問

2012年09月14日 15時21分
  • サーバー ハード障害の予兆について

情シスのオープンナレッジ『Syszo』サービス終了のお知らせ

質問

データサーバー1台、ターミナルサーバー2台の計3台サーバーを保有しています。

先日、電源ユニットの故障でデータサーバーがダウンし、販売管理ソフトが間停止しました。メーカー保守に入っているので、約3時間後には復旧したのですが、経営者からは「二度と発生しないように手を打て」と指示が出ました。

電源ユニットについては、予備を購入して冗長化しておこうと思っていますが、他のメカ的な障害についてどうしようかと悩んでいます。

せめて障害の予兆を掴むことが出来ないかなと思っているのですが、みなさんのところでは、注意していることや導入した設備・ソフト等あるのでしょうか?

4件の回答があります

回答

そのサーバはタワー型でしょうか、ラック型でしょうか?
いずれにしても「電源ユニット」だけ予備を持っていてもほとんど出番がないでしょうし、交換するにも2時間くらいはかかるかもしれません。
金をかけて1台予備のサーバを置いて故障時には瞬時に切り替えるくらいのことをしないと「二度と発生しないように手を打て」にはならないと思います。

問題はそうまでして「二度と発生しないように手を打て」する必要があるのかとも思いました。ウチの会社なら3時間で復旧するならよいほうです。
金をかけるくらいなら1日くらい止まってもいい
というのがウチのスタンスです
(リアルタイムの商売をしていないからですけど)

2012年09月14日 16時38分

回答

スレ主様

お疲れ様です。

I○Mなんかは、「弊社Serverには他社にはない障害予兆の仕組みがあり、信頼性が高い」と売り込んできていますが。

>販売管理ソフトが間停止しました。約3時間後には復旧したのですが
>経営者からは「二度と発生しないように手を打て」と指示が出ました。

御社の規模や形態がわかりませんが、この3時間での機会損失が何億円とでるのであれば、確かに「2度と無いように」しないといけないと思います。
そうでなくても、まぁ経営者の立場からしたら、そう言う指示を出すでしょう。

やり方は幾つかありますが、金額しだいですね。
仮想Serverやストレージを物理的に2台以上用意して、何かあったら切り替える。
言うのは簡単ですが、やるのは大変ですが・・・。

経営者の方と、予算や緊急度・重要度をよく話し合われたほうが良いと思います。

次は「地震が来てシステムが使えなくなったら困るから、クラウド上で動くシステムに変更だ」でしょうか。

2012年09月14日 17時02分

回答

障害対策・・・当社でもいろいろ検討しております。

結局どこまでやるかですが、現在ところ仮想化技術を利用して可用性を高めようとしているところです。
しかし、ストレージはひとつに集約してますので、こいつがやられると結局とまってしまう。冗長化を組むことは出来るのだが、結局費用がどんどん重なるだけ。

ということで、最近IAサーバー自身は、どんどん信頼性が下がってきているように思え、それを回避するために仮想化としてます。(よく壊れたので。業務を止まることはなかったが、部品交換でとめる必要があった)
ネックとなるストレージですが、これは今までトラブルに遭ったことがない。1HDD自身は壊れますが。ということで、ストレージを信じてサーバー仮想化をすすめてます。

2012年09月14日 17時16分

回答

みなさんのコメントを拝見して、つまるところは「どこまでコストが掛けられて、許容できるリスクはどこまでか」を経営者と擦り合わせしていくことが必要だなと思いました。色々な方法論を提示しながら経営者と相談してみようと思います。ありがとうございました。

2012年09月18日 16時10分

あなたもコメントしましょう!