質問
皆様の知恵を拝借したく
トラブルの原因が特定できず困っています。 アドバイス等いただけると助かります。 藁をもすがる感じになってきました。
【状況/環境】 ・・--------------------------- Windows2008R2 NicA - HUB① - ・PC複数台 NicB - HUB② - ・PC1台 NicC(無効化) NicD(無効化) という状況下でWebサービスを提供しています。
ある日の朝、急に・PC複数台でアプリのレスポンスが悪いとの事 調査した結果
PINGの応答 ①NicA - ・PC複数台 異常:100msec以上 ②・PC複数台 - ・PC複数台 正常:1msec ③NicB - ・PC1台 正常:1msec
②③が問題ないのでN/W経路上のトラブルではないと切り分けし サーバに問題があると推測
【復旧対応】 ・・--------------------------- あ)構成変更 NicA(無効化) NicB - HUB② - ・PC1台 NicC - HUB① - ・PC複数台 NicD(無効化) 一旦、復旧、念のためサーバ再起動した しかし翌日朝に事象再発 この構成のまま次を対応
い)Webサービスの再起動実施 復旧せず pingの応答が100msec以上が多発 対応前との違いは、多少早い応答がある
う)NicCのデバイス無効/有効 復旧した(pingの応答が早くなった) しかし、過去通常は1msecで安定していたのに対し 40msec位がまれにでる
え)サーバの再起動 復旧した(pingの応答が早くなった) 1msecで安定
しかし、きっと明日朝事象が再現するので夜間の動きを 調査予定
【その他調査】 ・・--------------------------- Windowsイベントログやデバイスではエラーを検出なし Webサービスのログなどでも事象に直結するようなエラーは 検出なし
現在は代替えサーバを準備し、問題のサーバを切り離し 詳細調査予定ですが、次の調査を攻めあぐねてまして。。。
なにか、気づきややってみたらというアドバイス ありますでしょうか
最初はNIC故障を疑い、次にWebアプリを疑ったのですが。。。 OSのネットワークサービスみたいな部分を疑うべきなのか そこにWebアプリがなにかわるさしているかを疑うべきか。。。
なんかのURLリンクとかでもかまいません脳味噌が動けば!!
ハードの問題を検出できない以上 wiresharkを使って見たら問題発見出来るかもしれませんね
同一セグメントであればループしている可能性があります。ミラーポートにPCを接続してwiresharkでTCPパケットを見れば手がかりになると思います。
HUB①も交換してみてはどうでしょう。
故障の観点だと HUB①、LANケーブル、でしょうか。交換してみて再発するなら Windowsの SNPが怪しい気がします。
ご参考 https://blogs.technet.microsoft.com/jpntsblog/2010/03/22/scalable-networking-pack/
nicが故障なのかhub①のポートが悪いのか。hub①のポート差し替えてみては?n/w経路上のトラブルでないと切り分けているようですがnicAとhub①の経路は?
クライアントPC側のLANケーブル、HUBを取り替える。 クライアントPC側のNIC故障により全体への影響を疑う。 サーバーのNICは変えておられるのでサーバー側の可能性は低いかと。ただしサーバー側のLANケーブルも交換されていないので交換してみる。 おそらくクライアントPC側のNIC故障・HUB・LANケーブル不良で変なトラフィックが発生している可能性があります。
皆様 多くのご意見ありがとうございます やはりhub含めN/Wの問題を再度検討となりました。 物理構成図が無かったり色々再ヒアリングすると謎が多いのでやれることが多々あるので頑張れそうです。
ありがとうございます‼ このお礼はいつか精神的に(嘘)
アカウントをお持ちのかたはこちら
アカウントをお持ちでないかたはこちら
ログインすることであなたのお困り事を全国の情シス担当者へ質問することができます。
質問
皆様の知恵を拝借したく
トラブルの原因が特定できず困っています。
アドバイス等いただけると助かります。
藁をもすがる感じになってきました。
【状況/環境】
・・---------------------------
Windows2008R2
NicA - HUB① - ・PC複数台
NicB - HUB② - ・PC1台
NicC(無効化)
NicD(無効化)
という状況下でWebサービスを提供しています。
ある日の朝、急に・PC複数台でアプリのレスポンスが悪いとの事
調査した結果
PINGの応答
①NicA - ・PC複数台
異常:100msec以上
②・PC複数台 - ・PC複数台
正常:1msec
③NicB - ・PC1台
正常:1msec
②③が問題ないのでN/W経路上のトラブルではないと切り分けし
サーバに問題があると推測
【復旧対応】
・・---------------------------
あ)構成変更
NicA(無効化)
NicB - HUB② - ・PC1台
NicC - HUB① - ・PC複数台
NicD(無効化)
一旦、復旧、念のためサーバ再起動した
しかし翌日朝に事象再発
この構成のまま次を対応
い)Webサービスの再起動実施
復旧せず
pingの応答が100msec以上が多発
対応前との違いは、多少早い応答がある
う)NicCのデバイス無効/有効
復旧した(pingの応答が早くなった)
しかし、過去通常は1msecで安定していたのに対し
40msec位がまれにでる
え)サーバの再起動
復旧した(pingの応答が早くなった)
1msecで安定
しかし、きっと明日朝事象が再現するので夜間の動きを
調査予定
【その他調査】
・・---------------------------
Windowsイベントログやデバイスではエラーを検出なし
Webサービスのログなどでも事象に直結するようなエラーは
検出なし
現在は代替えサーバを準備し、問題のサーバを切り離し
詳細調査予定ですが、次の調査を攻めあぐねてまして。。。
なにか、気づきややってみたらというアドバイス
ありますでしょうか
最初はNIC故障を疑い、次にWebアプリを疑ったのですが。。。
OSのネットワークサービスみたいな部分を疑うべきなのか
そこにWebアプリがなにかわるさしているかを疑うべきか。。。
なんかのURLリンクとかでもかまいません脳味噌が動けば!!