ネットワークが順調に稼働するように管理するためには、ネットワークを監視して何が起こっているのかを把握する必要があります。それも、ただ漫然にネットワーク監視を行うだけではなく、最善の方法、ネットワーク監視のベストプラクティスを実践することが重要です。
このブログでは、ネットワーク監視の8つのベストプラクティスをご紹介します。
複数のネットワーク管理システムを併用していると、責任の所在があいまいになり、ダッシュボードも多くなって管理作業が複雑化します。何か問題が生じた場合、それぞれのシステムの担当者が他システムに問題があるのではないかと疑心暗鬼になります。
IT 部門の全員がアクセスできる単一のネットワーク監視ソリューションを利用することは、いろいろと絡み合ってくる複雑な状態を抜け出して管理をシンプルにし、管理コストの削減にもつながります。
ネットワーク監視ソリューションをどこにデプロイすればいいかという問題に関して、オペレーティングシステムが監視システムに到達できさえすれば、デプロイ先はどこでも構わないというのが一般的な回答です。Amazon Web Services (AWS) や Microsoft Azure、その他のクラウド環境内にソリューションを導入することも、デスクの下のシステムでネットワーク監視を実行することもできます。
監視するすべてのシステムに到達でき、かつ、高可用性を実現できる場所に監視ソリューションを展開するのが最善策です。
それがないとユーザーが作業できないシステムや、稼働しないと損失が発生するシステムを監視する必要があります。
例えば、ルーターがダウンして、何も接続できなくなれば、支払い処理その他、経済的または生産的な機能を失うので、大きな損失になります。中断にまでは至らないとしても、パフォーマンスが低下して顧客が使うアプリケーションの反応が遅延したり、社員の使うシステムの遅延で業務に支障が生じたりしても、損害につながります。
ネットワーク監視というと、スイッチ、ルーター、その他のネットワーク専用デバイスを監視することだと思う人がいるかもしれませんが、ネットワークには Web が含まれており、Web も監視の対象になります。ネットワークを介して実行されるアプリケーションも、ネットワーク監視ソリューションを使用して効果的に監視できます。重要なのは、業務や収益創出のために何が必要で何が重要であるかを熟慮して監視対象を決定することです。
警告通知に関するベストプラクティスは、直感に反するように聞こえるかもしれませんが、少ないほどより良い、です。重要な問題を見落とすことは論外ですが、問題をすべて警告すればいいというわけではありません。1つの例をご紹介しましょう。ある部門で使っていた監視ツールは、システムがダウンすると、たとえそれが1分間のダウンであっても電子メールで通知します。監視ツールは2分ごとに警告通知を送り続け、担当者は2分ごとに対応しなければならず、とうとう警告を無視し始めました。
ログインして対処しなければならない場合にだけ、警告の電子メールが送信されるように設定することが推奨されます。対処する必要のない状況で電子メールで警告通知することは、スパムと同等であり、スパムメールは無視されます。
パフォーマンスの警告情報は、アクションを起こす必要がある場合に出すようにするのが肝要です。
例えば、CPU 使用率、特に仮想環境の CPU 使用率を考えてみてください。多くの人は、CPU 使用率が30分間90%を超えた場合に警告が欲しいと思うかもしれません。ですが、それは、適切に設計されたインフラストラクチャでは普通に起こり得ることです。アラートを受け取ったら、ログインして、プロセスを停止して CPU を解放するなど、何か対処しなければ、と思うのが自然ですが、それをする必要があるでしょうか?仮想環境では、切り替えて調節できるので、システムはその容量の限界近くまで実行可能です。
CPU 使用率であれば、30分の間99%以上が続いたらログインしてプロセスを停止した方がいいので、その場合に警告を電子メールで通知し、アクションを促すようにするのが適切でしょう。
警告通知を行わなくても、システムは重要な情報を収集し続けており、ネットワーク監視ダッシュボードやレポートを見ればパフォーマンスの詳細な履歴情報は得られます。
何をどうレポートするべきかについては、その企業ごとに異なるので、一般的な推奨事項のようなものはありませんが、柔軟性の高いレポート作成機能は重要です。
まず、ネットワークが満たすべき要件の内容を整理し、どのようなレポートがどのような頻度で必要なのかを定義する必要があります。
監視ソリューションには、前月の稼働時間のレポートを経営陣に送信するように設定したり、ネットワーク帯域使用率に関する日次レポートを作成したり、ネットワーク計画のために詳細なパフォーマンスの履歴情報をレポートするようにする、などといったことが簡単にできる機能が必要です。
レポート作成をスケジューリングすることは重要です。どういった傾向があるのかを追跡し、何をする必要があるのかを判断するのに十分な期間と頻度でデータを取得して、レポート作成できる必要があります。レポートの頻度は、機能の重要度とイベントや問題の深刻性に依存します。頻繁にチェックする必要があるものは、確実にレポート作成するようにします。
作成するレポートの性質は様々で、ネットワーク管理者には詳細まで落とし込んだレポートが必要であり、経営幹部にはネットワークの全体的な健全性が一目で把握できるわかりやすいレポートが必要です。
ネットワーク監視システムに拡張性を持たせることは、8つのベストプラクティスの最初に述べた、単一のソリューションで統括的に監視できることと密接に関連します。単一のソリューションを使用するメリットは、拡張が容易でなければ活かすことができません。ネットワーク監視ソリューションを選択する際は、ネットワークのニーズに合わせてどれだけ適切に拡張できるか、拡張に伴う追加コストがあるかどうかも判断基準になります。
プログレスが提供するネットワーク監視ソリューション、WhatsUp Gold にはいくつかのエディションと展開オプションがあります。単一の WhatsUp Gold があれば十分な場合が多いですが、複数の WhatsUp Gold サーバーを分散配置する分散型エディションや、マネージド・サービス・プロバイダ用の MSP エディションもあります。また、「スケーラビリティポーラー」を活用して、最大 100,000 モニタまで拡張するオプションもあります。
このネットワーク監視のベストプラクティスは、プログレスの eBook、IT Infrastructure Monitoring for Dummies (英語) からごく一部を抜粋したものです。ご興味がお有りの場合は、ダウンロードしてお読みください。
Get our latest blog posts delivered in a weekly email.