IT ネットワーク

【ネットワーク】トラブルシューティングの方法・原因

投稿日:

どうも社内ニートです。

いつもネットワークエンジニアとしての考え方や抽象的なことを記事にしていますが、
たまには技術よりのことも書こうと思います。

トラブルシューティング

トラブルシューティングの仕方はネットワーク構成や環境によって千差万別です。
あくまで一般的に、基礎的な方法をご紹介します。

トラブルの内容を把握し、原因を特定する

むやみにトラブルシューティングを行っても、無駄に時間を消費するだけです。
トラブルの内容を把握し、ある程度原因を推測した上で、
トラブルシューティングを行うことで、トラブル解決にかかる時間短縮に繋がります。

ヒアリング

お客様や現地の作業員から正しくトラブルの内容をヒアリングしましょう。
お客様や現地の作業員は焦っていることが多いので、
インターネットが見れない』や『本社へ通信できない』としか言わない場合が多いです。
具体的にトラブルの事象を知るために、

  • どこからどこの通信ができないのか
  • どのプロトコルができないのか。
  • 何時頃から起きているか。

具体的にヒアリングを行いましょう。
自分が作業員の場合は明確に事象を把握したり、伝えられるようにしましょう。

構成を把握する

トラブルの原因を正しく把握するためには構成の把握が必要です。
構成を把握するためには構成図が必要となってきます。
作業前に構成図をファイルサーバ等からローカルPCに保存したり、
構成図を印刷して持っていく等をして、いつでも構成図を確認できるようにしておきましょう。
また、通常の案件であれば構成図は作成するとは思いますが、
簡易的な検証でも構成図は作成するクセをつけましょう。

ping・tracerouteを行う

ping・tracerouteを行って、どの区間に障害が発生しているのかを特定しましょう。
そこまでホップ数がないのであればゲートウェイ、その次のルータ…と近いものからpingを打っていったり、
届かない対象へtracerouteを行い、どこまで応答があるのかを確認しましょう。

ネットワーク機器からping・tracerouteを行う際の注意点

ルータ等のネットワーク機器から実施する場合は送信元を意識してください。
下記の図のような場合、ルータで何も設定せずにping・tracerouteを行うとWAN側のインタフェースを送信元に行います。
実際に通信できないのはお客様の社内LANからです。
WAN側インタフェースを送信元にした状態でルータで行ったpingが届いてしまうと、ルータに被疑はないと勘違いしてしまいます。
ネットワーク機器でping・tracerouteを行う場合は送信元を意識して行うようにしましょう。

ログを確認する

トラブルが発生している機器のログが閲覧可能な場合は確認しましょう。
何時頃から発生しているかをヒアリングできでいれば、その時間付近のログを確認しましょう。
ログには『ケーブルが抜けた』とか様々な情報が表示されます。
ログを確認することで速やかに原因を特定する場合が多いです。

よくあるトラブルの原因

よくあるトラブルの原因をご紹介します。

物理的な障害・ミス

物理的なトラブルは結構あります。
特によくあることはLANケーブルが抜けているケーブルの差し間違えです。
検証の場合は爪の折れているLANケーブルを使用していて、
ケーブルが半挿しの状態になっている
場合がよくあります。
ごく稀ですが、ケーブルや機器の故障もあります。

speed/duplex間違い

インタフェースのspeed/duplexの間違いも結構多いです。
基本的にはauto/autoが多いですが、
回線サービスによってはspeed/duplexが固定のサービスがあります。
回線終端装置はspeed/duplexが固定なのに、ネットワーク機器側はauto/autoだと、
インタフェースはduplexがhalfでリンクアップします。
通信は繋がるけど通信速度が遅い場合はspeed/duplexの間違いを疑ってみてください。
通信はできてしまうので、中々気付きにくいトラブルです。

MTU/MSSの調整間違い

ごく稀にMTU/MSSの調整間違いがあります。
基本的に多くのネットワーク機器では、フラグメントはしてしまいますがMTU/MSSを自動調整してくれます。
回線サービスの中にはMTUが固定でフラグメントをしないサービスがあり、
ネットワーク機器側でMTU/MSSを調整する必要がある場合があります。
pingは通るけど、Web通信等のサービスが閲覧できない場合はMTU/MSSの調整間違いの可能性があります。

設定間違い

設定間違いが一番多いトラブルの原因です。
設定間違いをしないために、事前の検証や事前のレビューをしっかりと行いましょう。
それでも100%防ぐことは不可能です。
100%防ぐ方法があったら教えて欲しいです。。

FWやACLを疑う

pingが通らないけどWeb通信はできるというように、
あるプロトコルはOKだが、別のプロトコルはNGという場合は、
FW(ファイアウォール)や、ルータのAccess List(ACL)機能で制限されている場合があります。
ping(ICMP)は社内のルールとして許可しないというお客様も多く、pingが通らなくて正解という場合もあります。
事前に通信要件を洗い出して確認したり、通信要件一覧のようなドキュメントとして残しておくと早く解決できます。

DNS

他の通信は問題ないがWeb通信ができないといように
Web通信だけできないという場合はDNSを疑いましょう。
DNSで名前解決できるかを確認しましょう。
Windows端末からであれば『nslookupコマンド』や、
ネットワーク機器からであれば『ping yahoo.co.jp』というような確認方法があります。
最近のSD-WAN機器ですと、
ポータル(ダッシュボード、オーケストレータ、呼び方は色々です)へアクセスする際に名前解決が必須なものもあります。

まとめ

今回はあくまで一般的なトラブルシューティングの方法として、トラブルの特定方法とよくある原因をご紹介しました。
ご紹介した以外にもトラブルの原因は多々あります。
トラブルは起きないことが最善ではありますが、
起きてしまったら強く記憶に残りますので成長のチャンスと切り替え解決に向けて頑張りましょう。。

-IT, ネットワーク

Copyright© 社内ニート@ネットワークブログ , 2020 All Rights Reserved Powered by STINGER.