Kibana-aggregation-and-metrics
Kibana-集計とメトリック
Kibanaの学習中によく出くわす2つの用語は、バケットとメトリック集約です。 この章では、Kibanaで彼らが果たす役割と、Kibanaの詳細について説明します。
Kibana集計とは何ですか?
集約とは、特定の検索クエリまたはフィルターから取得したドキュメントのコレクションまたはドキュメントのセットを指します。 集約は、Kibanaで目的の視覚化を構築するための主要な概念を形成します。
視覚化を実行するたびに、基準を決定する必要があります。つまり、どの方法でデータをグループ化してメトリックを実行するかを決定する必要があります。
このセクションでは、2種類の集計について説明します-
- バケット集約
- メトリック集約
バケット集約
バケットは主にキーとドキュメントで構成されます。 集約が実行されると、ドキュメントはそれぞれのバケットに配置されます。 そのため、最後にバケットのリストがあり、それぞれにドキュメントのリストがあります。 Kibanaで視覚化を作成しているときに表示されるバケット集約のリストを以下に示します-
バケット集約には次のリストがあります-
- 日付ヒストグラム
- 期間
- フィルター
- ヒストグラム
- IPv4範囲
- 範囲
- 重要な用語
- 条項
作成中に、バケット集約用にそれらの1つを決定する必要があります。 バケット内のドキュメントをグループ化します。
例として、分析のために、このチュートリアルの開始時にアップロードした国のデータを考慮してください。 国インデックスで利用可能なフィールドは、国名、地域、人口、地域です。 国のデータには、人口、地域、地域とともに国の名前があります。
地域ごとのデータが必要だと仮定しましょう。 次に、各地域で利用可能な国が検索クエリになるため、この場合、地域がバケットを形成します。 以下のブロック図は、R1、R2、R3、R4、R5、およびR6が取得したバケットであり、c1、c2 ..c25がバケットR1〜R6の一部であるドキュメントのリストであることを示しています。
各バケットにいくつかの円があることがわかります。 これらは、検索条件に基づいたドキュメントのセットであり、各バケットに該当すると見なされます。 バケットR1には、ドキュメントc1、c8、およびc15があります。 これらの文書は、他の地域と同じように、その地域に該当する国です。 したがって、バケットR1の国を数えると、R2は3、6、R3は6、R4は2、R5は5、R6は4です。
したがって、バケットの集約により、ドキュメントをバケットに集約し、上記のようにそれらのバケットにドキュメントのリストを作成できます。
これまでのバケット集約のリストは次のとおりです-
- 日付ヒストグラム
- 期間
- フィルター
- ヒストグラム
- IPv4範囲
- 範囲
- 重要な用語
- 条項
次に、これらのバケットを1つずつ詳細に形成する方法について説明します。
日付ヒストグラム
日付ヒストグラム集計は、日付フィールドで使用されます。 したがって、視覚化に使用するインデックスは、そのインデックスに日付フィールドがある場合、この集計タイプのみが使用できます。 これは、複数バケットの集約です。つまり、複数のバケットの一部としてドキュメントの一部を持つことができます。 この集約に使用される間隔があり、詳細は以下に示すとおりです-
バケットの集計を日付ヒストグラムとして選択すると、日付関連のフィールドのみを表示するフィールドオプションが表示されます。 あなたのフィールドを選択したら、次の詳細がある間隔を選択する必要があります-
そのため、選択されたインデックスから選択されたフィールドと間隔に基づいたドキュメントは、ドキュメントをバケットに分類します。 たとえば、間隔を月単位として選択した場合、日付に基づいたドキュメントはバケットに変換され、月に基づいて、つまり1月から12月にドキュメントがバケットに入れられます。 ここで、1月、2月、.. 12月がバケツになります。
期間
この集計タイプを使用するには、日付フィールドが必要です。 ここで、日付範囲があります。つまり、日付から日付までが指定されます。 バケットには、指定されたフォームと日付に基づいたドキュメントが含まれます。
フィルター
Filtersタイプの集約では、バケットはフィルターに基づいて形成されます。 ここでは、1つのドキュメントが1つ以上のバケットに存在できるフィルター基準に基づいて形成されたマルチバケットを取得します。
フィルターを使用して、ユーザーは以下に示すようにフィルターオプションでクエリを記述できます-
[フィルターの追加]ボタンを使用して、選択した複数のフィルターを追加できます。
ヒストグラム
このタイプの集約は数値フィールドに適用され、適用された間隔に基づいてドキュメントをバケットにグループ化します。 たとえば、0-50、50-100、100-150など。
IPv4範囲
このタイプの集約が使用され、主にIPアドレスに使用されます。
contriesdata-28.12.2018というインデックスはIPタイプのフィールドがないため、上記のようなメッセージが表示されます。 IPフィールドがある場合は、上に示すように、FromおよびToの値を指定できます。
範囲
このタイプの集約には、タイプ番号のフィールドが必要です。 範囲を指定する必要があり、ドキュメントは範囲内のバケットにリストされます。
必要に応じて、[範囲の追加]ボタンをクリックして範囲を追加できます。
重要な用語
このタイプの集約は、主に文字列フィールドで使用されます。
条項
このタイプの集約は、利用可能なすべてのフィールド、つまり、数値、文字列、日付、ブール値、IPアドレス、タイムスタンプなどで使用されます。 これは、このチュートリアルで作業するすべての視覚化で使用する集計です。
選択したメトリックに基づいてデータをグループ化するオプションの順序があります。 サイズは、ビジュアライゼーションに表示するバケットの数を指します。
次に、メトリック集約について説明しましょう。
メトリック集約
メトリック集計は、主にバケットに存在するドキュメントで実行される数学計算を指します。 たとえば、数値フィールドを選択した場合、それに対して実行できるメトリック計算は、COUNT、SUM、MIN、MAX、AVERAGEなどです。
私たちが議論するメトリック集約のリストはここに与えられます-
このセクションでは、私たちが頻繁に使用する重要なものについて議論しましょう-
- 平均
- カウント
- Max
- Min
- Sum
メトリックは、すでに上で説明した個々のバケット集約に適用されます。
次に、ここでメトリック集約のリストについて説明しましょう-
平均
これにより、バケットに存在するドキュメントの値の平均が得られます。 たとえば-
R1からR6はバケットです。 R1にはc1、c8およびc15があります。 c1の値が300、c8が500、c15が700であるとします。 次に、R1バケットの平均値を取得します
R1 = c1の値+ c8の値+ c15の値/3 = 300 + 500 + 700/3 = 500。
バケットR1の平均は500です。 ここで、ドキュメントの価値は、国のデータを考慮すると、その地域のその国のエリアである可能性があります。
カウント
これにより、バケットに存在するドキュメントの数がわかります。 地域に存在する国の数が必要だとすると、それはバケットに存在するドキュメントの合計になります。 たとえば、R1は3、R2 = 6、R3 = 5、R4 = 2、R5 = 5、R6 = 4になります。
Max
これにより、バケットに存在するドキュメントの最大値が得られます。 地域バケットに地域ごとの国データがある場合、上記の例を検討してください。 各地域の最大値は、最大面積を持つ国になります。 したがって、各地域から1つの国、つまり R1からR6。
in
これにより、バケットに存在するドキュメントの最小値が得られます。 地域バケットに地域別の国データがある場合、上記の例を検討します。 各地域の最小値は、最小面積を持つ国になります。 したがって、各地域から1つの国、つまり R1からR6。
Sum
これにより、バケットに存在するドキュメントの値の合計が得られます。 たとえば、地域の総面積または国が必要な場合に上記の例を考慮すると、地域に存在するドキュメントの合計になります。
たとえば、地域R1の合計国を知るには、3、R2 = 6、R3 = 5、R4 = 2、R5 = 5およびR6 = 4になります。
R1からR6よりも地域に面積のあるドキュメントがある場合、その地域について国ごとの面積が合計されます。