集計
概要
個数やCount Distinct、合計や平均などの関数を適用することで、データをサマリー形式へトランスフォーメーションします。これは、統計分析に最適です。
これは、データトランスフォーメーションモジュールの「集計」ステップを使用して実行します。注意:これはビルトインステップのため、デフォルトでトランスフォーメーション一覧から利用することができます。
集計のタイプ
以下の表は、データのトランスフォーメーションに使用する、様々なタイプの集計を示しています。
集計のタイプ | 利用できるデータ型 | 説明 |
なし | テキスト、数値 | フィールドに集計を適用しません。このようなフィールドは、グループ化に使用されます。 |
外す | テキスト、数値 | フィールドを排除します。 |
個数 | テキスト、数値 | フィールド内のすべての値をカウントします。 |
Count distinct | テキスト、数値 | フィールド内のすべてのユニーク値をカウントします。 |
最大 | 数値 | フィールドの最大値を返します。 |
最小 | 数値 | フィールドの最小値を返します。 |
合計 | 数値 | フィールド内のすべての値を合計します。 |
平均 | 数値 | フィールド内のすべての値を平均します。 |
ステップの設定
集計ステップを設定するには、以下の手順に従います。
- トランスフォーメーションを実行するデータを含むインプットステップを、最低でもひとつ準備します。フローに集計ステップを追加する準備ができたら、以下の手順に従います。
- トランスフォーメーションフロービルダーの画面左側からトランスフォーメーションステップボタンをクリックして、すべてのステップを表示します。
- トランスフォーメーションステップ一覧から「集計」オプションをキャンバスへドラッグします。
フロー内のこれより前にあるステップと接続します。
設定パネルを使用して、各データフィールドに適用する集計のタイプを選択します。
注意:各集計タイプについての詳細は、上記の表を参照してください。
各集計タイプについての詳細は、上記の表を参照してください。
- 設定が完了したら、「適用」ボタンをクリックします。データプレビューパネルに、集計が適用された結果が表示されます。
集計ステップを利用した例
- 右上隅にある「作成」ボタンをクリックします。
「トランスフォーメーションフロー」を選択します。
注意:こちらのオプションが表示されない場合は、トランスフォーメーションフローへのセキュリティアクセス権が付与されていない可能性があります。アクセス権取得について詳細な情報は、こちらを参照してください。
こちらのオプションが表示されない場合は、トランスフォーメーションフローへのセキュリティアクセス権が付与されていない可能性があります。アクセス権取得について詳細な情報は、こちらを参照してください。
- トランスフォーメーションフロービルダーへ移動します。
- 画面左側にある「インプットステップ」ボタンへマウスオーバーします。インプットステップパネルが現れ、すべてのデータ取得ステップが表示されます。
- ステップのひとつをキャンバスへドラッグします(今回の手順では、レポートステップを例として説明します。他のインプットステップについて、詳細な情報は、こちらを参照してください)。
- ステップをドラッグすると、ポップアップが表示され、フローで使用するレポートを選択することができます。
- レポート名を入力して必要なレポートを選択し、カラム(列)が表示されたら、「レポート追加」をクリックします。
- トランスフォーメーションフローパネルにレポートフィールドが表示され、設定をすることができます。
- 設定タブで、データを取得するフィールドのみを選択します。
- ステップ名の変更や、説明の追加など、さらなる変更を加えることができます。
設定が完了したら、「適用」ボタンをクリックします。
警告:設定内容を保存するためには、「適用」ボタンをクリックしなくてはいけません。こちらボタンをクリックする前に、別の場所をクリックすると、設定した内容は失われます。
設定内容を保存するためには、「適用」ボタンをクリックしなくてはいけません。こちらボタンをクリックする前に、別の場所をクリックすると、設定した内容は失われます。
- データプレビューパネルには、設定したデータソースから取得されたデータが表示されます。
- データプレビューパネルから直接フィールドにトランスフォーメーションを適用することもできます。詳細は、こちら参照してください。
- ステップ設定パネルには新しくフィールドタブが表示されます。こちらのタブは、ステップから取得されたデータフィールドを管理するために使用します。
- トランスフォーメーションフローに他のステップを追加することもできます。
- データの集計準備が整ったら、以下のステップに従います。
- ステップビルダーのトランスフォーメーションステップアイコンにマウスオーバーをすることで、トランスフォーメーションステップパネルを展開し、集計ステップをキャンバスへドラッグします。
- 次に、インプットステップ(他のステップを追加している場合は、その前のステップ)と集計ステップを接続します。ステップにマウスオーバーし、接続点を集計ステップへドラッグします。
- 集計ステップアイコンをクリックして、設定を行います。トランスフォーメーションフローパネルには、以前のステップからの各フィールドが表示されます。
各フィールドに設定する集計のタイプを選択します。
集計のタイプ 利用できるデータ型 説明 なし テキスト、数値 フィールドに集計を適用しません。このようなフィールドは、グループ化に使用されます。 外す テキスト、数値 フィールドを排除します。 個数 テキスト、数値 フィールド内のすべての値をカウントします。 Count distinct テキスト、数値 フィールド内のすべてのユニーク値をカウントします。 最大 数値 フィールドの最大値を返します。 最小 数値 フィールドの最小値を返します。 合計 数値 フィールド内のすべての値を合計します。 平均 数値 フィールド内のすべての値を平均します。 - 「適用」をクリックします。トランスフォーメーションされたデータが、データプレビューパネルに表示されます。
- さらにトランスフォーメーションステップを追加することで、データのトランスフォーメーションを継続することができます。
- 書き込み可能なデータベースへデータを保存する準備が整ったら、以下のステップに従います。
- アイコンにマウスオーバーをし、「アウトプットステップ」パネルを展開して、「SQL データベースにアウトプット」ステップをキャンバスへドラッグします。
- 次に、集計ステップ(または、フロー内のその前のステップ)とアウトプットステップを接続します。
- 画面右側のパネルから、アウトプットステップの設定をします。こちらのステップの設定について詳細な情報は、こちらを参照してください。
注意:デフォルトでは、アウトプットステップは赤色に強調して表示されることで、エラーが発生していることを示します。これはつまり、設定が完了していないことを意味します。 - 上部のヘッダーメニューにある「実行」ボタンをクリックすることで、ドラフト(編集中)のフローを実行することができます。
- または、フローを完全実行するために保存します。「公開」ボタンをクリックしてください。
- 表示されるポップアップに、名前や適切なアクセス権などの詳細情報を入力します。
- 「保存」ボタンをクリックします。