Service Availability Monitoring

Warning: Splunk AppDynamics is ended support for Service Availability Monitoring. Customers who have never purchased SAM will no longer be able to do so. Renewals and additional licenses by existing customers of SAM that are purchased before June 2021, for a one-year term only, are permitted. All existing users of SAM can continue to use it. See Support Advisory: Service Availability Monitoring End of Life (EOL) Notice.

To access Service Availability Monitoring, select Home > Servers > Service Availability (left navigation menu).

The Service Availability Monitoring feature of Server Visibility enables you to monitor internal or external HTTP and HTTPS services. You configure service monitoring from the Controller UI. After you configure monitoring for a service, Service Availability Monitoring evaluates the service:

  • The Agent evaluates each response, based on your specified violation rules, and flags each response as failed (rule violation) or successful (no violation).
  • The service monitor maintains a rolling buffer of evaluated responses. This buffer has a configurable window size (number of evaluated responses), success threshold (number of successful responses), and failure ratio (number of failed responses).
  • The monitor collects evaluated responses until the response buffer is full. Then, it evaluates the service as:
    • NORMAL - Successful responses are greater than or equal to the success threshold.
    • CRITICAL - Failed responses are greater than or equal to the failure threshold.
  • When the buffer is full, the monitor re-evaluates the service every time it evaluates a new response.

For example, with the following values:

  • Success threshold = 3
  • Failure threshold = 1
  • Results window size = 5

The Agent waits until five check results are received, and from these five results, if there is one failure, then the target state is CRITICAL. If there are at least three successful results, then the target state is NORMAL.

モニタ対象サービスの表示

モニタ対象サービスは、モニタ対象サービスリストで確認できます。結果ウィンドウで応答バリデータを評価することで、状態が決定されます。応答バリデータは、サービスから受信された応答に対して評価を行うために使用される設定ルールです。

次の状態があります。

  • NORMAL:結果ウィンドウの成功応答の数が設定した成功しきい値以上。
  • CRITICAL:結果ウィンドウの失敗応答の数が設定した失敗しきい値以上。
  • UNKNOWN:マシンエージェントがデータを提供していない。

モニタ対象サービスリスト

上部のナビゲーションバーから、[Servers] > [Service Availability] の順に選択すると、モニター対象サービスのリストが表示されます。アクションツールバーを使用して、新しいモニタ対象サービスを追加したり、詳細を表示したりすることで、モニタ対象サービスを管理します。

サービスの可用性

モニタ対象サービスの詳細

モニタ対象サービスを選択してダブルクリックすると、関連する詳細が表示されます。

モニタ対象サービスの詳細

サービスの可用性の設定

デフォルトでは、設定変更は少なくとも変更の 2 分間以内に有効になるため、設定を変更した後にマシンエージェントを再起動する必要はありません。サービスの作成後にサービスのプロトコル、ターゲット、またはメソッドが変更された場合、サービスの状態は UNKNOWN に設定され、新しい設定で再評価されます。

注意: この機能を設定するには、ユーザにサーバの可視性の設定権限が必要です。

デフォルトでは、次のアドレスが制限されています。

  • ループバックアドレス:localhost, 127.0.0.1, ::1(IPv6)
  • サイト ローカルアドレス:192.168.0.0/16, 10.0.0.0/8, 172.16.0.0/12, fec0::/8(IPv6)
  • リンクローカルアドレス:169.254.0.1 - 169.254.255.254, fe80::/10(IPv6)
  • 任意のローカルアドレス:0.0.0.0, ::(IPV6)
  • マルチキャストアドレス:224.0.0.0/4(224.0.0.0 to 239.255.255.255), ff00::/8(IPV6)

設定パネルにアクセスするには、次の操作を行います。

  1. コントローラの上部のナビゲーションバーから、[Servers] > [Service Availability] を選択します。モニタ対象サービスのリストが設定されている場合は表示されます。
  2. サービスを追加するには、[Add] を選択します。3 つのタブを持つ [Add Service Monitoring Configuration] パネルが表示されます。サービスモニタリング設定の追加
  3. [Main] タブで、必要なフィールドを指定し、設定を保存します。各フィールドには、ヘルプを提供するためのツールチップが関連付けられています。[Main] 設定パネルの説明については、次の表を参照してください。
    フィールド 説明 デフォルト 必須
    Name このターゲット設定の名前。この名前は、サービスの可用性リストに表示されます。 N/A あり
    ターゲット(Target) モニター対象のリソース(たとえば、http://myThirdPartyService.com/data)。要求の送信に使用する HTTP メソッド(GET、POST、HEAD)を指定します。 N/A あり
    Server モニタリングを実行するマシンエージェントの名前。ドロップダウンには、サーバの可視性が有効になっているサーバのみが表示されます。 N/A あり
    Socket Timeout 完全な HTTP 応答の接続が成功した後の待機時間(ミリ秒単位)。 30000 あり
    Success threshold NORMAL 状態の結果パネル内で必要な成功の数。 3 あり
    Check Interval チェックの間隔(秒単位)。
    注: この間隔を 60 秒超に設定すると、モニタ対象サービスのメトリックグラフで表示のギャップが発生します。
    10 あり
    結果ウィンドウのサイズ サービスの状態を決定する際に使用する最新の結果の数。 5 あり
    Connect Timeout サービスが接続要求に応答するまでの待機時間(ms 単位)。 30000 あり
    障害しきい値 CRITICAL 状態の結果ウィンドウ内で必要な失敗の数。 1 あり
    Max response size 収集する最大応答サイズ(バイト単位)。 5,000 あり
    Follow redirects 非推奨。リダイレクトに従って、サービスの状態を判別します。 いいえ いいえ
  4. [Request Configuration] タブで、リクエストヘッダーを指定します。要求とともに送信するカスタマイズされたヘッダーのリストを定義できます。たとえば、リストでデスクトップまたはモバイルブラウザを模倣できます。POST リクエストのリクエスト本文を定義することもできます。資格情報が必要な場合は、"Authorization" ヘッダーを指定できます。
    プロトコル フィールド 値の種類(Value Type) デフォルト 説明
    HTTP ヘッダー名と値のペア 文字列 要求とともに送信するカスタマイズされたヘッダー。
    本文 文字列 要求とともに送信するデータ。通常は POST に使用されます。
  5. [Response Validators] タブで、検証ルールを設定します。モニタ対象サービスの正常性を検証するためにマシンエージェントが使用するルールのリストを提供できます。いずれかのルールに違反した場合、応答は失敗と見なされます。ルールごとに、 [HTTP property]、 [operator]、および [value] を指定できます。演算子のリストは、最初のドロップダウンで選択したプロパティによって異なります。 設定の編集

サービスの正常性のモニタリング

イベントは、状態が変更されるたびにコントローラに送信され、さらに定期的(デフォルトでは 5 分ごと)にコントローラに送信されます。
  1. システムプロパティの appdynamics.machine.agent.sam.event.updateIntervalMillis を設定して、更新間隔を変更できます。「設定プロパティのリファレンス」を参照してください。
  2. イベントは、[Monitored Service details] パネルおよび [Server Visibility Events] リストから表示できます。サーバーの可視性のイベントリスト
  3. 詳細を確認するには、イベントをダブルクリックします。 イベントの詳細
  4. イベントのプロパティは次のとおりです。
    オプション 説明
    カテゴリ カスタム
    イベントタイプ サービスの可用性
    プロパティ 重大度
    注: 値として ERROR(失敗)または INFO(合格)を指定できます。

アラートの設定

モニタ対象サービスのアラートを作成するには、次の手順を使用します。

  1. [Servers] パネルから、[Alert & Respond] を選択します。
  2. [ポリシー(Policies)] を選択します。
  3. [Create Policy Manually] を選択します。ポリシーがすでに存在している場合は、このオプションが表示されないことがあります。[+] をクリックして、ポリシーを手動で追加します。
  4. [Custom Events] で、[+] をクリックしてカスタムイベントを追加します。カスタムイベントフィルタの追加
  5. [Policy] パネルの [Actions] セクションで、ポリシーに違反した場合に実行するアクションを追加し、ポリシーを保存します。