質問

2015年10月08日 10時43分
  • SMU(Storage Management Utility)が切断される

情シスのオープンナレッジ『Syszo』サービス終了のお知らせ

質問

HP Storage Works
P2000 G3 FC を使用しています。
コントローラについては
●冗長モード アクティブ ULP
●冗長性ステータス リダンダント
●コントローラAとBは正常動作中
●RAID 6で構成
●管理エンクロージャは3本

SMUをモニタしていると、
不定期ではありますが、
●システムとの通信が失われました●と表示されることがたまにあり、不安定さを感じています。
不定期なので時間範囲に関係ないのですが
多いと1時間に2~3回程度。(1日2回という日もあり)
その間は操作不能となり、また自然復旧するといった感じを繰り返しています。

この原因について考えられる点などアドバイス頂けると助かります。

11件の回答があります

回答

お疲れ様です。

症状から見るに、コントローラーの故障が疑われるような気がします。
可能であれば、コントローラーのファームをあげた上で同様の症状が出るようであれば、サポートにコントローラーの交換を依頼されてみては如何でしょうか?

なにをもってシステムとの通信断が発生しているという判断になっているのかはわかりませんが、個人的見解になりますが、MSAはコントローラーまわりの故障がかなり多いように思います(実経験かなりあり)ので、制御系が怪しい動きをしている場合は、さくっと交換して切り分けた方が早いように思います。

MSAはエントリーモデルですので(エントリーモデルだから故障が多いというのもおかしな話しですが)、もしそれなりのクリティカルな稼働を求められるようであれば、hpの場合、3PARなどのもう少し上位のストレージを選択された方がよいように思います。

2015年10月09日 01時14分

回答

早速のご回答ありがとうございます。
早速、コントローラ故障の件も含めて検討したいと思います。

2015年10月09日 12時30分

回答

HPサーバ製品 MSA 含め 3PARなども多々運用しております。

サポートに問合せすれば、ログの取り方の手順や必要なツールなど提供してくれます。
それをサポートが解析してくれます。

というか、専門家でなければどこの何をどのように見て良いかわからないと思います。
結果的にコントローラの交換であったとしても、ログによる裏付けがないと
交換はしてもらえないですよ。

サポートには入ってますよね?

回答

お疲れ様です。
はい、もちろん保守サポートには入っておりますので、
早速、ログの収集方法から伺って対応したいと思います。

ありがとうございます!

2015年10月09日 14時10分

回答

HPサーバ製品 MSA 含め 3PARなども多々運用しております。

サポートに問合せすれば、ログの取り方の手順や必要なツールなど提供してくれます。
それをサポートが解析してくれます。

というか、専門家でなければどこの何をどのように見て良いかわからないと思います。
結果的にコントローラの交換であったとしても、ログによる裏付けがないと
交換はしてもらえないですよ。

サポートには入ってますよね?

回答

お疲れ様です。
はい、もちろん保守サポートには入っておりますので、
早速、ログの収集方法から伺って対応したいと思います。

ありがとうございます!

2015年10月09日 14時20分

回答

お疲れ様です。
はい、もちろん保守サポートには入っておりますので、
早速、ログの収集方法から伺って対応したいと思います。

ありがとうございます!

2015年10月09日 14時22分

回答

続報ですが、
ログを収集しようとすると ●システムとの通信が失われました● が発生してしまい、
これが発生したあとに、ログアウトせず再度ログ取得を試みると、
ログの保存 ボタンが反応しなくなっていました。
一度、ログアウトしながら、2~3回試みましたがどれも結果は同じでした。

2015年10月09日 15時42分

回答

なかなか重たい症状のようですね。。。
冗長構成ならスタンバイ機に切り替えたほうがよいでしょう。

そうでないなら、可能な限り速やかにバックアップを取って、代替機の準備を
検討された方がよいでしょう。
上記の判断はサポート対象外と思われるので速やかに社内で相談する内容です。

並行して、サポートに状況を共有して対策をとりましょう。

ちなみに、アラートやエラーが発生した際にメールで通知が飛ぶような設定はされてましたでしょうか?
今後はそういった監視の仕組みを導入された方がよいと思います。

回答

サポートへ問い合わせたところ、

MC Management Controller(管理コントローラ)の再起動 あるいは、 ファームアップデートを案内されました。
まず、業務に支障のない管理コントローラから再起動してみる事にします。

2015年10月15日 17時18分

回答

一応、解決した結果報告です。
まず、SMUから MCコントローラの再起動を試みます。

SUMログイン → ツール → コントローラのシャットダウンまたは再起動
動作:再起動
コントローラ:マネジメント
コントローラ A あるいは B を片方ずつ再起動

これでエラーでできない場合があるので その時は Tera Term などから実行します。

SMU の IP (コントローラ A か B)(ブラウザのSMU画面は必ず閉じてから行うこと)

ログイン 基本 SMUと同じ

以下コマンドを入力
restart mc A または B (接続している方が再起動されるとアクセスが途切れるので注意)

Continew で Yes または y または 何も入力せずEnter

これでコントローラ A または B を片方ずつ再起動します。

再起動時間数分程度

結果的に 切断エラーはなくなりましたが、ファームアップデートを実施するまでは
再発するだろうとの事でした。

アップデートだとストレージアクセスに影響するため、業務に影響のない時間帯で行うしかありません。

2015年10月22日 15時53分

あなたもコメントしましょう!