Anchor | ||||
---|---|---|---|---|
|
Table of Contents | ||
---|---|---|
|
概要
個数やCount Distinct、合計や平均などの関数を適用することで、データをサマリー形式へ変換します。これは、統計分析に最適です。
これは、データ変換モジュールの「集計」ステップを使用して実行します。注意:これはビルトインステップのため、デフォルトでトランスフォーメーション一覧から利用することができます。
集計のタイプ
以下の表は、データのトランスフォーメーションに使用する、様々なタイプの集計を示しています。
集計のタイプ | 利用できるデータ型 | 説明 |
なし | テキスト、数値 | フィールドに集計を適用しません。このようなフィールドは、グループ化に使用されます。 |
外す | テキスト、数値 | フィールドを排除します。 |
個数 | テキスト、数値 | フィールド内のすべての値をカウントします。 |
Count distinct | テキスト、数値 | フィールド内のすべてのユニーク値をカウントします。 |
最大 | 数値 | フィールドの最大値を返します。 |
最小 | 数値 | フィールドの最小値を返します。 |
合計 | 数値 | フィールド内のすべての値を合計します。 |
平均 | 数値 | フィールド内のすべての値を平均します。 |
こちらの例では、データを集約するシンプルなTransformation
ステップの設定
集計ステップを設定するには、以下の手順に従います。
- トランスフォーメーションを実行するデータを含むインプットステップを、最低でもひとつ準備します。フローに集計ステップを追加する準備ができたら、以下の手順に従います。
- 変換フロービルダーの画面左側からトランスフォーメーションステップボタンをクリックして、すべてのステップを表示します。
- トランスフォーメーションステップ一覧から「集計」オプションをキャンバスへドラッグします。
フロー内のこれより前にあるステップと接続します。
設定パネルを使用して、各データフィールドに適用する集計のタイプを選択します。
Note 各集計タイプについての詳細は、上記の表を参照してください。
- 設定が完了したら、「適用」ボタンをクリックします。データプレビューパネルに、集計が適用された結果が表示されます。
集計ステップを利用した例
こちらの例では、
データを集約するシンプルなTransformation Flow(データ変換フロー)の作成方法について紹介します。こちらのフローでは、Input Step(入力ステップ)の設定、Aggregate transformation Step(集約データ変換ステップ)の適用、データベースへのデータの保存、について説明します。フローには、さらに多くのStep(ステップ)を含めることが可能です。
...