ネットワーク監視テクノロジー – ちょっと覚えておくと良いこと

ネットワークが拡張し続け、複雑化が進むにつれて、ビジネス継続のためにネットワークの可用性とパフォーマンスを確保することの重要性は増していきます。ネットワークの可用性とパフォーマンスを確保するには、ネットワークを完全に可視化し、パフォーマンスを常時チェックして遅延や停止を回避するための優れたネットワーク監視ソリューションが必要です。

ネットワーク監視ソリューションは多数存在しますが、効果や効率には大きな差異がある可能性があります。ネットワーク監視ソリューションを選択する上で考慮に入れるべきネットワーク監視技術について、以下で説明します。

トポロジーのマッピング

接続されているすべてのデバイス、コントロールポイント、相互接続関係を含んだネットワークトポロジーのマップを作成します。ネットワークが拡張していくと、ネットワークトポロジーのマッピングを手作業で行うのは大変な作業になってきます。適切なネットワーク監視ソフトウェアは、トポロジーマップを自動的に作成し、デバイスがネットワークに接続されたり切断されたりした場合は、リアルタイムでマップを更新できます。何かネットワーク問題が発生した際には、デバイスのネットワークでの接続状況を表示するトポロジーマップは不可欠です。

自動化されたレイヤ 2/3 の検出とマッピングは、ミッションクリティカルなアプリケーションやデバイスを速やかに判別してチェックし、ネットワーク問題の根本原因を解明するのに役立ちます。

フェイルオーバーによる可用性確保

ネットワークマップは、障害点の診断にも役立ちます。障害時に備えて、フェイルオーバー機能を組み込んで冗長性を確保することで、高可用性を維持できます。トポロジーは、障害点が発生した場合もほかのデバイスは稼働し続けられるような構成が推奨されます。

ベースラインの測定

システムのパフォーマンスが悪化したり、疑わしいアクティビティが発生したりといった、通常でない事態を検知するためには、すべてがスムーズに稼働している場合のベースラインを把握しておく必要があります。ネットワークの稼働状況をチェックするための測定項目を定義して、ベースラインを測定します。

ネットワーク問題の警告

ベースラインが把握できたら、通常のスムーズな稼働状態からどの程度の差異が認められれば標準外とみなすべきなのかを決定します。潜在的な問題が発生していると想定される測定値をしきい値とし、しきい値を超えたら警告を通知するよう、ネットワーク監視ソフトウェアを設定します。優れたネットワーク監視ツールは、問題が検出されたら自動修正を行うようにも設定できます。

警告設定には注意が必要です。警告の数が多すぎると、いわゆる警告疲れに陥って、本当に重要な警告を見逃しやすくなります。問題が大きくなる前に警告を得るにはある程度の余裕が必要ですが、しきい値が低いと不要な警告がたくさん発生してしまいます。たとえば、サーバーの CPU 使用率のベースラインが50% の場合、使用率が90% に達すればすぐにチェックする必要がありますが、60% であれば心配する必要はないかもしれません。

また、アクティビティが急増したとしても、それが計画的なものであれば、警告通知する必要はありません。午前2時にアクティビティの異常な増大があったとしても、通常その時間帯にバックアップを取ることになっている場合は警告通知を抑制すべきです。

ポリシーとプロシージャ

ポリシーやプロシージャを作成するのが好きな人はあまりいないでしょうが、ネットワークを適切に設定し、問題が発生したとき何をすべきかがわかるよう、文書化したポリシーとプロシージャを準備しておくことは重要です。ポリシーの策定時には、次のような点を考慮して決定する必要があります。

  • どのデバイスと機器を監視するべきか?
  • どのような情報を収集する必要があるか?
  • データにアクセスできるのは誰で、どのようにしてアクセスすべきか?
  • どの変数を警告通知のトリガーとして使用するか?
  • 警告通知は誰が受け取るべきか?
  • アラート警告通知を受信したら、どのように対処すべきか?

ネットワーク監視の統合

ネットワーク監視のために、様々な異なるツールを使用している組織はたくさんありますが、多様なツールを使用してデバイス、サーバー、VM、アプリケーションを監視していると、問題が複雑化します。それぞれの監視ツールが症状を検出して警告を出すと、どこから手を付ければいいのかわからず、根本原因の解明が困難になります。

問題があること自体はすぐにわかっても、依存関係が明瞭になっておらず、依存関係の検出に手間取って、問題解決の糸口を見つけるのに時間がかかります。ネットワーク監視が1つのソリューションに統合されていると、単一のインタフェースから相互依存関係も把握でき、根本原因を速やかに解明することができます。

ネットワーク監視ソリューションの中には、分散環境の複数のロケーションのネットワークを監視できるものもあります。

プロアクティブなネットワーク監視

主要なネットワークコンポーネントは、常時監視する必要があります。ネットワーク監視ソリューションがリアルタイムで更新するネットワークの稼働状況のダッシュボードを画面上で開いたままにしておき、ネットワークで何が起こっているかを一目で確認できるようにするといった方式がよく使われています。

監視手法としては、問題が起こった時にネットワーク監視ソフトウェアが発信する警告通知に対応すればいい場合が多いですが、ミッションクリティカルな監視対象に関しては、プロアクティブに監視の目を光らせる必要があります。次のような監視が重要です。

  • 可用性の監視: ネットワーク上のリソースとサービスを継続的に監視して、アプリケーションやサービスが利用可能なことを確認する必要があります。パフォーマンス要件を満たすために必要な帯域幅が確保されているかどうかもチェックすべきです。
  • インタフェースの監視: エラー、パケット損失、破棄、使用率リミットなどに関するインタフェース監視を行うことで、アプリケーションやサービスのパフォーマンス低下によって引き起こされる潜在的なネットワーク問題を特定するのに役立ちます。トラフィック速度と帯域幅使用率のスナップショットから問題の解明につなげることができます。
  • ディスクの監視: ディスクに問題があると、データが破損する恐れが出てきます。ストレージのアレイと使用可能なスペースの状態を管理することは不可欠です。将来のニーズに対応するのに十分な容量があり、システムが期待どおりに稼働していることを確認する必要があります。
  • ハードウェアの監視: ネットワークで使われるハードウェアは、ITインフラストラクチャのバックボーンです。ハードウェアの障害はパフォーマンスに影響を与え、それが重要な機器なら、ネットワークのダウンに結びつく可能性もあります。CPU 使用率、電源の状態、温度、その他の潜在的な障害ポイントを監視する必要があります。

ダッシュボードのカスタマイズ

高度なネットワーク監視ソリューションでは、ドメインやユーザーに特化したカスタムダッシュボードを作成して、組織の状況に応じた合理的で効率的なネットワーク管理を行うことができます。

ダッシュボードは、サーバー、アプリケーション、仮想、ワイヤレス、クラウド、ネットワークトラフィックなど、様々なレポートを、思い通りに配置したり、表示内容を設定し直したりして、カスタマイズできます。ネットワーク全体のオーバービューから、チェックしたい箇所にドリルダウンするようにも設定できます。

リモート監視

眠っているときに電話で起こされ、ネットワーク障害の苦情を受けたとき、オフィスまで出向かないとネットワークで何が起こっているのか把握できないとしたら、これほど悲惨なことはありません。物理的にその場所にいなくても、手元のデバイスからネットワークの状況をすべて確認、診断して解決できるリモート監視・管理機能は不可欠です。

自動化

最後に、可能な限りすべてを自動化することの重要性を強調しておきます。時間のかかる手作業をするためには、他のプロジェクトから一時的に抜ける必要があり、それまで何をしていてどこまで進んだのかを覚えておかなければなりません。また、自動化によって人的エラーを防ぐこともできます。管理者にかかる負担が軽減され、トラブルシューティングにかかる時間が削減できます。自動修復アクションを組み込んでおくことも可能です。