EasyBlocks監視シリーズをご検討中のお客様から、よく次のような質問をいただきます。
「監視の適用可能規模として100台程度と記載されていますが、推奨される監視項目数はどの程度ですか?」「 Ping監視のみを行う場合、200台や300台程度の監視対象にも対応可能ですか?」といった内容です。
そこで今回は、当社が推奨する100台程度を超える監視対象台数を設定し、実際にEasyBlocks 監視の負荷状況を測定しました。
※なお、実測結果を含め、100台以上の監視対象台数での動作を推奨・保証するものではありませんので、ご了承ください。
はじめに
今回の試験では、EasyBlocks 監視に監視対象を100台から最大500台まで登録し、Ping監視のみを実施して、EasyBlocks 監視の負荷状況を測定します。
冒頭で触れた「どの程度の監視項目数が推奨されるか?」というよくあるお問い合わせに対しては、「1台あたり3~5項目程度」が推奨となります。
例えば、Ping監視、SSHポート監視、HTTPポート監視を設定した場合、これで3項目とカウントされます。そのため、監視対象台数が100台であれば、全ての監視対象に上記3項目を設定することは、推奨範囲内となります。
実測パターン
今回は、EasyBlocks 監視のCPUやメモリの使用状況を可視化し、負荷の状況を確認します。
負荷状況を確認する内容はそれぞれ以下の通りです。
<パターン1>
監視対象台数:100台
監視項目:Ping監視
監視間隔:1分間隔
<パターン2>
監視対象台数:200台
監視項目:Ping監視
監視間隔:1分間隔
<パターン3>
監視対象台数:300台
監視項目:Ping監視
監視間隔:1分間隔
<パターン4>
監視対象台数:500台
監視項目:Ping監視
監視間隔:1分間隔
なお、負荷状況確認項目は共通して「CPUロードアベレージ」「利用可能メモリ」とします。
CPUロードアベレージは、5分平均 / 利用可能メモリは全メモリに対する利用可能メモリの比率を%表示 / 正常値かどうかの判断は一般的にCPUのコア数で判断(EasyBlocks 監視のCPUはQuad coreなので、ロードアベレージ4以下なら一般的には正常値という判断になります。)
全パターン、24時間分のデータとなります。
EasyBlocks 監視を使った監視設定やEasyBlocks リソース監視を使ったリソース監視、リソース可視化等の設定は公開済みの記事がありますのでこちらを参照してください。
・「EasyBlocks監視」Ping監視の簡単なセットアップ方法
・「EasyBlocks監視」障害を検知するしきい値の簡単な設定方法
・EasyBlocksでの死活監視とログ取得の重要な設定!メール通知のセットアップ方法
・「EasyBlocks監視」特定ポート監視をするためのセットアップ方法
・【新製品情報】EasyBlocks リソース監視を試してみた
実測結果
負荷結果 <パターン1>
CPUロードアベレージ(5分平均)
最大値:0.32
平均値:0.08
利用可能メモリ
最大値:74.7869%
最小値:74.0406%
平均値:74.4752%
負荷結果<パターン2>
CPUロードアベレージ(5分平均)
最大値:0.61
平均値:0.11
利用可能メモリ
最大値:75.0156%
最小値:73.5023%
平均値:74.2432%
負荷結果<パターン3>
CPUロードアベレージ(5分平均)
最大値:0.59
平均値:0.15
利用可能メモリ
最大値:75.0297%
最小値:73.9133%
平均値:74.5628%
負荷結果<パターン4>
CPUロードアベレージ(5分平均)
最大値:1.04
平均値:0.24
利用可能メモリ
最大値:74.7293%
最小値:70.5177%
平均値:72.538%
負荷結果<まとめ>
パターン1から4までの結果として、全パターンでCPUやメモリの負荷状況は、監視対象台数を増やしてもそれほど大きな変化はありませんでした。
ただし今回試した内容としては正常系の場合となります。
監視対象に異常が発生してPing疎通が出来なくなった際、異常が発生しているホストに対して『異常時の監視処理』が実施されます。
メール通知や設定している通知方法の処理も加わり、監視状況一覧も対象ホスト部分がCRITICAL表示への変更されるなど、様々な内部処理が実行されます。
そのため、EasyBlocks 監視自身の負荷状況は通常時よりも高負荷になります。
負荷結果<参考>
参考までに、「パターン4の測定時に監視対象を100台程度Ping疎通出来ない状態とした際のCPUロードアベレージ」を測定しました。
瞬間なので1分間平均のCPUロードアベレージデータを使用しますが、9時40分くらいに100台程度のPing疎通不可ホストを試したところ、CPUロードアベレージの最大値が「2.72」となりました。
その後、5分程度で全ホスト復旧させたためそこからなだらかに落ち着いていますが、障害発生した場合の処理が加わることで高負荷になることは間違いありませんので、この点を加味して設定内容を設計することを推奨します。
さいごに
今回は4パターンでEasyBlocks 監視の負荷状況を確認しました。
100台程度 :負荷に問題なし
200〜500台(正常時):負荷に問題なし
500台(障害時) :高負荷の可能性あり
以上の結果から、当社で推奨している監視対象数が100台程度の負荷結果としては全く問題のない負荷状況となり、仮に監視項目数をさらに増やしても特段問題ない負荷状況といえます。
しかしながら、実運用では監視対象に障害が発生することを想定すると監視対象台数が500台などの当社推奨台数より大幅に多い場合には何らかの問題が発生する可能性が考えられますので、推奨台数前後の監視対象台数での運用を推奨します。
今後の開発の参考にさせていただきますので、適用可能規模を広げたモデルをご希望のお客様がいらっしゃいましたら、定期開催している直近のウェビナーや無料相談会にて是非ご意見いただければと思います。