質問

2008年07月14日 19時12分
  • 社内ファイルサーバ不具合時の判断について

情シスのオープンナレッジ『Syszo』サービス終了のお知らせ

質問

50名ほどの会社で管理者をしています。
クライアントPCから社内ファイルサーバにデータをアップロードする際、
転送速度が速くなったり遅くなったり安定しません。
問題ないサーバと比較すると2GB程度のファイルで倍以上の時間がかかります。
メーカーサポートに問い合わせ診断を仰ぐと、ハード、ソフトともに問題なしという回答。
そこでやむなくNICを増設し解決を図ろうとしたのですが、ユーザから
「サーバ機器たるもの、問題を抱えたまま部品増設で対応するなどあり得ない」
という指摘を受けました。
私の感覚では、サービス用サーバならその通りだと思いますが、社内ファイルサーバについては
それほど神経質にならなくてもよいのではないかと感じます。
もちろんバックアップは取っています。
皆様はこのような場合、どのように判断されますでしょうか。
今の会社では実質ひとりで管理しているので周りに相談できる人がいません。
皆様のお考えをお聞かせいただければと思います。
よろしくお願いいたします。

6件の回答があります

回答

このような場合に、確かにNICの交換・増設も1つの選択肢だとは思いますが、その前にもう少し分析をした方が良いかもしれません。
一応、サーバーがWindowsである前提でお話しいたします。

この場合であれば、サーバー側のイベントログやパフォーマンスログを確認されてみてはいかがでしょうか?
本当にNetworkだけの問題なのか?、それともサーバー側のディスク書き込み部分で問題ではないのか?、それともサーバー側で動作しているソフトの負荷が一時的に高くなっているためではないのか?などを、推測するためにはログの分析が必要な気がします。

「サーバ機器たるもの、問題を抱えたまま部品増設で対応するなどあり得ない」

確かにおっしゃるとおりだとは思います。しかし、サーバーを運用している立場として、いつまでも問題を抱えたままの状態で徹底的に原因を分析している訳にはいかないと思います。そのあたりは、うまく判断してください。

2008年07月15日 00時44分

回答

NICを増設することで解決することが既に見えているということでしょうか?
もし転送性能が安定していない原因を掴めていないのであれば、それを把握
するのが先決ではないかと私は考えます。

ファイルサーバに10BASE/100BASEのNICがあり、ディスクがSATAやUltra ATA
133であれば、サーバによるデータのネットワーク転送がボトルネックにな
る可能性がありますので、1000BASE対応のNICに交換することで性能向上を
見込むことができます。もし Windows Server であればタスクマネージャ
のネットワークタブでネットワークがボトルネックとなっているかを確認
できるかと思います。

ファイルサーバによっては、I/Oバッファのサイズを最適な値に設定するこ
とで転送速度を向上させることができるかもしれません。

その他、ディスクを接続しているインターフェース、CPU性能、メモリ搭載
量など可能性として考えられる原因は様々です。

幸い問題のないサーバもあるとのことですので、問題のサーバとの相違が
何なのかが原因究明の手がかりになるでしょう。もしご自身で究明するこ
とが困難であるならば、HW構成など、詳細な状況を可能な限りご説明頂け
ると、原因究明の手助けができるのではないかと思います。

回答

言葉だけで取れば
「サーバ機器たるもの、問題を抱えたまま部品増設で対応するなどあり得ない」と言うほうがおかしいと思います。
他の方も言われるように問題を特定できる努力は必要ですが、それだけのスキルがない場合や、やってみても原因がわからない場合は「部品を換える」というのは正しいと思います。
NICはそんなに高いものではないのでやってみてはどうでしょう。
前のを殺して新しいのだけにしてみるとか...

ただし今回の場合、「転送速度が速くなったり遅くなったり安定しません」というのが気になります。 原因はサーバではないかもしれませんね。

2008年07月15日 08時19分

回答

私の経験からお話しします。

私も以前サーバー機において、このような症状が発生しました。

これを解決するにあたり、ハードの異常についてはイベントログを解析することで何かしら情報を得られると思ったが、それはなく、ネットワーク状況を調べると、どうもAutoNegoがころころ変わっているような感じだった。
そこで、L2スイッチのポートを固定にしたところ、それでも安定しなかった。よって、NICを交換したところ安定して通信できるようになりました。
まずは、調査できるところからやってみて、それでも状況がつかめないようであれば、一度ハードメーカに言って交換してもらって様子を見るという手がよいのかも。

2008年07月15日 08時47分

回答

全体を俯瞰で見ている我々からしたら、「パソコン一台くらい壊れてもどうということはない」「データ(資料)が消えてもバックアップを戻せば大丈夫」と考えますが、利用者にとっては「自分のパソコンが壊れる」「自分の作った資料が消える」(自分の仕事が止まる⇒自分の評価が下がる)ということに、大きな恐怖感を抱くようです。

まぁ、往々にして、騒ぐ人ほどパソコンでたいした仕事はしてなかったりしますが。

利用部門からクレームが来たら、逆に「買い換えるチャンス」と考えます。
その人に合議書を書いてもらって、その人の上司にハンコを貰って、稟議書を提出してしまいます。
合議書を書くのを嫌がるのであれば「気晴らしに文句を言いたかっただけだろう」と判断します。

今回の場合は、「ハード、ソフトともに問題なしという回答」らしいので、新品に買い換えても解決しなかった場合に問題になりますね。

という内容のことを、その方に説明して「手を付けられるところから順を追って原因究明するほうが妥当」と理解をお願いします。

回答

参考URLを紹介したかったので、新規のコメントにしました。

まず、パフォーマンスログの見方(分析)に関するサイトを、思い出したので紹介します。これを参考にどの辺が問題なのか?を探ってみてください。
(以前、私もファイルサーバーのボトルネックを探すのに、参考にしました)
(問題の無い方のファイルサーバーでも、同じようにログを取って比較するとわかりやすいと思います)
(今回のような場合であれば、とりあえず主要な値をグラフに出しておいて、見ていれば何となく原因がつかめるような気がします)

次に、現在のファイルサーバーのスペックを見ました。

PentiumD 2.8GHz x2 / RAM1GB / NIC 1000BASE x2(オンボード)
/ HDD SATA RAID5 / Windows Storage Server 2003 R2

私から見て、気になる点(バランスが悪い?)と思える点は、2つあります。

1.CPUなどのスペックに比較して、メモリの搭載量が少ない

サーバーで1GBですと、サーバーOSが動作するのに使ってしまって、空きが無いように思われます。せめて2GB、出来れば4GB程度積んだ方が余裕があるのでは?と思います。確か、ファイルサーバーの場合であれば、メモリの空き容量はキャッシュとして使われたと記憶しています。

2.頻繁に2GB程度のファイルを書く用途で、「SATA RAID5」では能力不足?

SATAのHDDの回転数や購入時期、HDDの本数にもよりますが、少し能力不足のような気がしています。(2GBのだファイルを頻繁に…であれば、SASにするかHDDの本数を増やしたり、RAIDのレベルを変えると思います)
RAID5 の場合には、HDDの本数が増えると、パフォーマンスが上がります。

もし一旦フォーマットしても構わない状態で、RAIDカードなどが対応しているのであれば、「RAID 1+0」にしてみても良いかもしれません。

メーカー保証が受けられなくなるため、お薦めはしませんが、最近の高速になった SATA HDD に変えるだけで速くなりそうな気はします。(最近の320GB以上のプラッタを採用しているHDDは、単純に速くなっています)

以上です。どこまでこのサーバーにお金と時間をかけられるのかがわかりませんが、まずはパフォーマンスログの分析を進めて、問題点の特定をされてみてください。

今回指摘をいただいたユーザは、ハードウェアに詳しく自分なりの判断基準というのがはっきりしている方で、なかなか認識の違いというか、状況に応じて判断しているという部分が伝わりにくいようです。

何となく「きたみりゅうじ」氏マンガに出てくる「(自称)パワーユーザー」のような方なのかなぁ、と勝手に想像しました。
(PCを自作して、パーツをいろいろ交換しては、ベンチマークを取る事が楽しい、みたいな…)
(勝手な想像です。実は前は、バリバリ汎用機の運用系をやってました、みたいな人だと、「ハハァ、おっしゃる事は、確かにごもっともではありますが…(今の管理者は私なので、こちらに任せておいてくれませんか?)」となるのかもしれませんね)

2008年07月15日 13時36分

あなたもコメントしましょう!