ネットワーク監視は、最適な可用性とパフォーマンスを確保するために、コンピュータネットワークを検出、マッピング、監視するプロセスです。WhatsUp Gold などのネットワーク監視ツールを使用すると、ネットワーク上のすべてが効率的に動作しているかをチェックして、問題が顕在化する前に対処することができます。
このページでは、OSI 参照モデル、一般的なデバイスタイプ、ネットワーク監視システムの5つの機能などの基本的な概念を説明します。
ネットワークについて理解するには、まず、オープンシステム相互接続 (Open Systems Interconnection、OSI) モデル (OSI 参照モデル) についての理解が必要です。
OSI 参照モデルは、ネットワークプロトコルを使用するネットワークの主要機能を標準化したものです。これに基づいて、異なるベンダーの様々なデバイスがネットワークを介して相互に通信できます。
OSI モデルでは、ネットワーク通信は 7 つの論理レイヤにグループ化されます。デバイスは、各レイヤで OSI 標準化プロトコルを使用して通信します。
レイヤ | 機能 |
---|---|
レイヤ 7: アプリケーション層 | 通信コンポーネントを実装するアプリケーションと対話し、ユーザーが利用するアプリケーションにネットワークサービスを提供します。 |
レイヤ 6: プレゼンテーション層 | 受信データと送信データを、あるプレゼンテーション形式から別の形式に変換します (データ暗号化、テキスト圧縮など)。 |
レイヤ 5: セッション層 | コンピュータ間の接続をコントロールします。接続を確立、管理、および終了します。 |
レイヤ 4: トランスポート層 | 1 つまたは複数のネットワークを介して、送信元から宛先ホストへのデータ転送を保証します。 |
レイヤ 3: ネットワーク層 | IP アドレスを使用してネットワーク上の 2 つのノード間でデータパケットをルーティングします。 |
レイヤ 2: データリンク層 | MAC アドレスを使用してデータリンクとポート間の接続を検出できます。物理層でのエラーも検出し、ノード間の信頼できる接続を提供します。 |
レイヤ 1: 物理層 | 同軸ケーブルやファイバーケーブルなどの物理メディア上でビットストリームを送信します。 |
ネットワーク監視には、(2) データリンク層、(3) ネットワーク層、(7) アプリケーション層、の各レイヤが最も一般的に使用されます。ネットワーク監視システムは、これらのレイヤでネットワーク上のデバイスとその接続方法を検出して、ネットワークトポロジーマップを生成し、ネットワークを監視します。
ルーターはネットワークを接続するデバイスです。プライベートネットワークをインターネットに接続し、また、ユーザーをインターネットに接続します。ルーターは、情報の移動に最適なパスを選択するディスパッチャーとして機能します。ルーターはレイヤ3デバイスです。
スイッチは、コンピュータ、プリンタ、サーバー、その他のデバイスをプライベートネットワークに接続します。スイッチは、ネットワーク上のデバイスが相互に通信できるようにするコントローラとして機能します。スイッチはレイヤ2デバイスです。
ファイアウォールはネットワークを保護します。ルールに基づいて着信トラフィックと送信トラフィックをコントロールし、信頼できるプライベートネットワークと、インターネットなどの信頼できるとは限らないネットワークとの間にセキュリティで保護された防御壁を築きます。
ネットワークは、アプリケーションと情報をユーザーに提供しますが、アプリケーションと情報は、サーバー上で稼働します。サーバーはユーザーからの要求を受け取り、応答します。例えば、Web サイトにアクセスする場合、Web サーバーは、ローカルデバイスに Web ページを「提供」します。ほかにも、電子メールサーバーやデータベースサーバーなどがあります。
ほとんどのプライベートネットワークはインターネットに接続されています。インターネットは、リモートユーザーを中央のオフィスに接続し、顧客を Web サイトに接続します。
プライベートネットワークは、ルーターを使用してインターネットに接続されます。情報は、データパケットの形式でインターネット経由で送信されます。各データパケットには、ルーターが情報を送信するために使用する宛先 IP アドレスが含まれています。ルーターは、インターネットからデータパケットを受信すると、プライベートネットワークに転送します。
データパケットは、悪意あるトラフィックを除外してプライベートネットワークを安全に保護するため、まず、ファイアウォールを通過する必要があります。ファイアウォールは、インターネットとプライベートネットワーク間のトラフィックをフィルタリングすることによってこれを行います。着信データパケットにファイアウォールのルールによってフラグが立てられると、そのパケットはプライベートネットワークからブロックされます。
ファイアウォールは、インターネットとプライベートネットワーク間のユーザーアクセスもコントロールします。例えば、プライベートネットワーク上のユーザーがピアツーピアなどの特定のプロトコルを使用できないようにファイアウォールを設定できます。ファイアウォールで、プライベートネットワークを、不正アクセス、マルウェア、その他のセキュリティ脅威から保護する1つの方法です。
ファイアウォールを通過したデータパケットは、プライベートネットワーク上のスイッチが受信します。スイッチは、ラップトップ、サーバー、プリンタ、その他のデバイスをプライベートネットワークに接続します。これらのデバイスは、ネットワークインタフェースカード (Network Interface Card、NIC) を使用してスイッチに接続されます。各 NIC には、一意のメディアアクセスコントロール (Media Access Control、MAC) アドレスがあります。スイッチは、これらの MAC アドレスを使用してデバイス間でデータを送信します。
ネットワークを監視することは、どうして重要なのでしょうか?ネットワークは IT インフラストラクチャのライフラインであり、ネットワークに障害が発生すると、アプリケーションやビジネスオペレーションに必要な情報の流れが停止してしまうからです。
ネットワークは動的な環境です。ネットワーク管理者は、ネットワークに新しいユーザー、テクノロジー、アプリケーションを追加するよう絶えず求められます。ネットワークのパフォーマンスは高いレベルに維持する必要がありますが、こういった変更によってパフォーマンスが悪化する可能性があります。
ネットワークに問題が発生すると、ユーザー、アプリケーション、ビジネスに悪影響が及ぶ前に根本原因を解明して解決しなければなりません。断続的なパフォーマンス問題の場合は特に再現や診断が困難で、問題はより深刻になります。断続的なネットワークパフォーマンス問題を解決するには、ネットワークトラフィックの監視が効果的な場合がよくあります。
多くの IT 部門は、サービスレベルアグリーメント (Service Level Agreements、SLA) を満たすことを求められます。
SLA とは何であり、IT 部門にとってどのような意味があるでしょうか?SLA は、IT と事業主との間の契約です。SLA を満たすと、それに応じた報酬が与えられる場合もあります。SLA は、パフォーマンスを保証するために、測定され、レポートされます。
パフォーマンスの低下とダウンタイムは収入の損失に直結するので、SLA を満たすことは非常に重要です。電子商取引の Web サイトでは、1時間の中断で何百万もの収益を失う可能性があります。
SLA 要件は非常に厳しい場合があります。例えば、4ナイン SLA は 99.99% の稼働時間を必要とします。つまり、許容される中断時間は1年に1時間未満ということになります。
SLA の要件が厳しければ厳しいほど、実装と維持にかかるコストが高くなります。4ナインや5ナインを提供するには、ネットワークスイッチを冗長ペアで設定した上、さらに、障害が発生した場合にスワップが容易に可能なように、3 つ目のスイッチさえ必要かもしれません。
以上を踏まえて、次に、ネットワーク監視システム (Network Monitoring Systems、NMS) の基本を説明します。
ネットワーク監視システムは、次の5つの基本的な機能を提供します。
ネットワーク監視システムがそれぞれの機能として提供できる能力は、システムごとに異なります。
ネットワーク監視は、検出プロセスから始まります。ネットワーク上に何がどのように接続されているかわからなければ、監視しようがありません。NMS は、ネットワーク上のデバイス - ルーター、スイッチ、ファイアウォール、サーバー、プリンタなど - を検出します。
NMS は、デバイスの監視方法を定義する監視テンプレートのライブラリを持っています。WhatsUp Gold では、このテンプレートをデバイスロールと呼びます。デバイスロールは、タイプとベンダーに固有であり、Cisco のルーターと、Dell のサーバーとでは、監視する内容は異なります。検出プロセスが終了すると、検出された各デバイスに適切なデバイスロールが自動的に割り当てられます。
それぞれのネットワーク監視システムが有する検出機能には違いがあります。すべての NMS はネットワーク上のデバイスを検出しますが、すべての NMS が、デバイスがネットワークにどのように接続されているかを検出するとは限りません。例えば、ネットワーク上のサーバーを検出した NMS が、そのサーバーにどのスイッチが接続しているかについては検知していないかもしれません。
ネットワーク監視システムが、レイヤ 2/3 検出機能を有している場合は、ネットワーク上のデバイス間のポート間接続を検出できます。効果的なネットワーク監視を行うには、ネットワーク上に何があるかを知るだけでは十分ではなく、すべてがどのように接続されているかを知る必要があります。
なぜかというと、あるデバイスのパフォーマンス問題が、別のデバイスのパフォーマンスに影響を与える可能性があるからです。例えば、スイッチに障害が発生した場合、そのスイッチに接続されているすべてのデバイスがネットワークを経由した通信ができなくなります。それがもし CRM システムをサポートするサーバーを接続するスイッチだったとしたら、大問題になります。
ネットワーク管理者の目は最も貴重な診断ツールであり、ネットワークを理解しやすく視覚化することによって、ネットワーク問題のトラブルシューティングに要する時間を短縮できます。
ネットワークの配線は複雑に絡み合っており、実際に配線をチェックしながら接続を確認するのは気が遠くなる作業です。ネットワーク監視システムは、ごちゃごちゃした配線クローゼットをすっきりとしたわかりやすいグラフィックにまとめたネットワークマップを生成します。ネットワークマップには、デバイスと最新のステータスが表示されます。
NMS の中には、ネットワークマップを作成するのに多くの手作業を要するものや、ネットワークを把握しているネットワーク管理者の知識に頼って単に描画ツールだけを提供するものもあります。
ネットワーク監視システムは、監視対象をどう監視するかを定義した組み込みのデバイスロールを提供します。デバイスロールは、変更を加えてカスタマイズしたり、新しく作成したりできます。監視方法には様々な選択肢があり、組織の事情に応じた監視が可能です。
ネットワーク管理者がネットワーク上のデバイスについて監視したいものの「ビッグ5」は、Ping による可用性と待機時間、CPU 利用率、メモリ使用量、ディスク使用量、およびインタフェース使用率です。
ほとんどのネットワーク監視ツールは、スイッチ内のファンや電源など、ハードウェアコンポーネントの監視を提供します。配線クローゼットの温度も監視可能です。また、HTTP、TCP/IP、FTP などのネットワークサービスを監視することもでき、ネットワークトラフィックの監視も可能です。
ネットワーク監視システムは、問題が発生したときにネットワーク管理者に通知します。電子メール、テキスト、ロギングなどによって警告通知を行います。
しきい値ベースの警告設定機能があれば、問題の兆候が見られた時点で警告を通知し、顕在化してユーザー、アプリケーション、ビジネスに影響が及ぶ前に問題に対応できます。例えば、ルーターの CPU 使用率が 80% を超えた場合に警告通知するよう設定できます。そうすれば、ネットワーク管理者は、ルーターが完全に稼働不能に陥る前に、積極的に調査を開始して問題解決することができます。
CPU 使用率、メモリ使用量、インタフェース使用率などのパフォーマンスメトリクスは、時間ごとに変動します。ピーク時に数秒間もしくは数分間だけ、しきい値を超える可能性があります。そのたびに警告通知を受けることを回避するため、警告設定に時間のファクターを加えることも可能です。例えば、CPU 使用率が、10分以上の間 80% を超え続けたときに警告通知を行うように設定できます。
ネットワーク管理者も、食事をしたり、眠ったり、家族と時間を過ごしたりする必要があります。警告通知を行わないブラックアウト期間を設定できる NMS もあります。また、エネルギーコストの節減のために夜間にプリンタをシャットダウンするような場合は、夜間のプリンタからの警告を一時停止するようにも設定できます。
ネットワーク管理者は、ネットワークの設計、分析、再設計というライフサイクルを継続的に行っています。
NMS は、このライフサイクルをサポートするために、リアルタイムの監視データと経時的な監視データを提供します。これらのレポートを利用して、次のようなことが可能になります。
NMS は、ダッシュボードと呼ばれる Web ページで監視情報を提供します。ダッシュボードには、例えば、CPU 使用率のトップ10を表示するビュー、メモリ使用量のトップ10を表示するビューなど、ベンダーが推奨するビューが組み込まれています。
ネットワーク管理者は、概要ダッシュボードをチェックして、ネットワーク全体の状況を把握します。パフォーマンス問題などがあれば、ダッシュボードをドリルダウンして、個々のデバイスや監視の詳細情報を確認し、問題の根本原因を解明します。
ほとんどの NMS はカスタマイズ可能です。ネットワーク管理者は、内部クライアント用にそれぞれ適切なダッシュボードを作成することができます。例えば、管理者用ダッシュボード、幹部役員用ダッシュボード、ヘルプデスク用ダッシュボード、システムやアプリケーションの担当者用ダッシュボードなどを作成できます。
ネットワーク監視システムは、パフォーマンスデータを取得するため、次のような標準プロトコルを使用して、ネットワークデバイスとサーバーにポーリングします。
一部の NMS では、PowerShell のようなスクリプト言語をサポートし、Windows Server 用のカスタムモニタを作成し、SQL クエリを実行してデータベース用のカスタムモニタを作成します。
最も広く使用されている監視プロトコルは、SNMP と WMI の 2 つです。ネットワーク管理者がネットワークとデバイスの状態をチェックできるよう、何千もの監視データを提供します。
SNMP は、ルーター、スイッチ、ワイヤレス LAN コントローラ、ワイヤレスアクセスポイント、サーバー、プリンタなど、ほぼすべてのネットワーク接続デバイスからデータを収集する標準プロトコルです。
SNMP は「オブジェクト」を照会することで機能します。オブジェクトは、NMS が情報を収集するものです。例えば、CPU 使用率は SNMP オブジェクトです。CPU 使用率オブジェクトに対するクエリを実行すると、NMS がアラートとレポートに使用する値が返されます。
SNMP によって照会されるオブジェクトは、管理情報ベース (MIB) で維持されます。MIB は、管理対象デバイスによって公開されるすべての情報を定義します。例えば、Cisco ルーターの MIB には、CPU 使用率、メモリ使用率、インタフェースの状態など、そのルーターを監視するために Cisco によって定義されたすべてのオブジェクトが含まれます。
MIB 内のオブジェクトは、標準化された数値化システムを使用してカタログ化されます。各オブジェクトには、独自の一意のオブジェクト識別子 (OID) があります。
MIB ブラウザを提供する NMS もあります。MIB ブラウザを使用すると、デバイス上で監視する追加のオブジェクトを見つけたりするのが簡単になります。
WMI は、Windows を実行しているコンピュータシステムから情報を取得するための Microsoft Windows の標準規格で、Web ベースのエンタープライズ管理を行うことができます。このプロトコルは、WMI エージェントを実行するデバイスから情報を受信するオペレーティングシステム・インタフェースを作成します。
オペレーティングシステム、ハードウェアやソフトウェアのデータ、リモートシステムやローカルシステムのステータスとプロパティ、設定情報、セキュリティ情報、プロセスとサービスの情報に関する詳細を収集します。次に、これらすべての詳細をネットワーク管理ソフトウェアに渡し、ネットワーク管理ソフトウェアがネットワークの状態、パフォーマンス、および可用性を監視します。
WMI は Windows ベースのシステムとアプリケーションの専用プロトコルですが、SNMP やその他のプロトコルでも機能します。ただし、Microsoft は CIM コマンドレットを優先して Windows での WMI コマンドを非推奨にしているので、PowerShell を使用して WMI を管理している場合は、CIM コマンドレットを使用する必要があります。
WhatsUp Gold を使うと、簡単で効率的なネットワーク監視を実現できます。単一の統合ネットワーク管理ダッシュボードから、IT インフラストラクチャ全体の可用性 (死活監視) とパフォーマンスを監視、管理でき、統合されたアラームシステムにより、速やかに問題を検出し、警告通知します。物理および仮想 サーバーの監視、アプリケーションパフォーマンスの監視、帯域使用の監視、ネットワークトラフィック監視、ログ管理、設定管理などがすべて統合されています。クラウドでもオンプレミスでも、ネットワークの全体像を正確に把握でき、迅速なトラブルシューティングが可能です。
ネットワーク監視ソフトウェア WhatsUp Gold について詳しくは、 製品説明ウェビナーをご覧ください。または、無料試用版をダウンロードしてお試しいただくこともできます。そのほか、疑問点があればお気軽にお問い合わせください。