Anchor | ||||
---|---|---|---|---|
|
こちらの例では、データを集約するシンプルなTransformation Flow(データ変換フロー)の作成方法について紹介します。こちらのフローでは、Input Step(入力ステップ)の設定、Aggregate transformation Step(集約データ変換ステップ)の適用、データベースへのデータの保存、について説明します。フローには、さらに多くのStep(ステップ)を含めることが可能です。
Table of Contents | ||
---|---|---|
|
概要
個数やCount Distinct、合計や平均などの関数を適用することで、データをサマリー形式へトランスフォーメーションします。これは、統計分析に最適です。
これは、データトランスフォーメーションモジュールの「集計」ステップを使用して実行します。注意:これはビルトインステップのため、デフォルトでトランスフォーメーション一覧から利用することができます。
集計のタイプ
以下の表は、データのトランスフォーメーションに使用する、様々なタイプの集計を示しています。
集計のタイプ | 利用できるデータ型 | 説明 |
なし | テキスト、数値 | フィールドに集計を適用しません。このようなフィールドは、グループ化に使用されます。 |
外す | テキスト、数値 | フィールドを排除します。 |
個数 | テキスト、数値 | フィールド内のすべての値をカウントします。 |
Count distinct | テキスト、数値 | フィールド内のすべてのユニーク値をカウントします。 |
最大 | 数値 | フィールドの最大値を返します。 |
最小 | 数値 | フィールドの最小値を返します。 |
合計 | 数値 | フィールド内のすべての値を合計します。 |
平均 | 数値 | フィールド内のすべての値を平均します。 |
ステップの設定
集計ステップを設定するには、以下の手順に従います。
- トランスフォーメーションを実行するデータを含むインプットステップを、最低でもひとつ準備します。フローに集計ステップを追加する準備ができたら、以下の手順に従います。
- トランスフォーメーションフロービルダーの画面左側からトランスフォーメーションステップボタンをクリックして、すべてのステップを表示します。
- トランスフォーメーションステップ一覧から「集計」オプションをキャンバスへドラッグします。
フロー内のこれより前にあるステップと接続します。
設定パネルを使用して、各データフィールドに適用する集計のタイプを選択します。
注意:各集計タイプについての詳細は、上記の表を参照してください。
- 設定が完了したら、「適用」ボタンをクリックします。データプレビューパネルに、集計が適用された結果が表示されます。
集計ステップを利用した例
- 右上隅にある「作成」ボタンをクリックします。
「Transformation Flow(データ変換フロー)トランスフォーメーションフロー」を選択します。
こちらのオプションが表示されない場合は、Transformation Flow(データ変換フロー)へのセキュリティアクセス権が付与されていない可能性があります。アクセス権取得について詳細な情報は、Note 注意:こちらのオプションが表示されない場合は、トランスフォーメーションフローへのセキュリティアクセス権が付与されていない可能性があります。アクセス権取得について詳細な情報は、こちらを参照してください。
- Transformation Flow(データ変換フロー)ビルダーへ移動します。トランスフォーメーションフロービルダーへ移動します。
- 画面左側にある「Input Step(入力ステップ)」ボタンへマウスオーバーします。Input Step(入力ステップ)パネルが現れ、すべてのデータ取得Step(ステップ)が表示されます。
Step(ステップ)のひとつをキャンバスへドラッグします(今回の手順では、Report Step(レポートステップ)を例として説明します。他のInput Step(入力ステップ)について、詳細な情報は、インプットステップ」ボタンへマウスオーバーします。インプットステップパネルが現れ、すべてのデータ取得ステップが表示されます。 - ステップのひとつをキャンバスへドラッグします(今回の手順では、レポートステップを例として説明します。他のインプットステップについて、詳細な情報は、こちらを参照してください)。
- Step(ステップ)をドラッグすると、ポップアップが表示され、フローで使用するレポートを選択することができます。ステップをドラッグすると、ポップアップが表示され、フローで使用するレポートを選択することができます。
- レポート名を入力して必要なレポートを選択し、カラム(列)が表示されたら、「Add Report(レポート追加)レポート追加」をクリックします。
- Transformation Flow(データ変換フロー)パネルにレポートフィールドが表示され、設定をすることができます。トランスフォーメーションフローパネルにレポートフィールドが表示され、設定をすることができます。
- Configure(設定)タブで、データを取得するフィールドのみを選択します。設定タブで、データを取得するフィールドのみを選択します。
- Step(ステップ)名の変更や、説明の追加など、さらなる変更を加えることができます。ステップ名の変更や、説明の追加など、さらなる変更を加えることができます。
設定が完了したら、「Apply(適用)適用」ボタンをクリックします。
設定内容を保存するためには、「Apply(適用)」ボタンをクリックしなくてはいけません。こちらをクリックする前に、別の場所をクリックすると、設定した内容は失われます。Warning 警告:設定内容を保存するためには、「適用」ボタンをクリックしなくてはいけません。こちらボタンをクリックする前に、別の場所をクリックすると、設定した内容は失われます。
- データプレビューパネルには、設定したデータソースから取得されたデータが表示されます。
- データプレビューパネルから直接フィールドに変換を適用することもできます。詳細は、こちら参照してください。データプレビューパネルから直接フィールドにトランスフォーメーションを適用することもできます。詳細は、こちら参照してください。
- Step(ステップ)設定パネルには新しくField(フィールド)タブが表示されます。こちらのタブは、Step(ステップ)から取得されたデータフィールドを管理するために使用します。ステップ設定パネルには新しくフィールドタブが表示されます。こちらのタブは、ステップから取得されたデータフィールドを管理するために使用します。
- Transformation Flow(データ変換フロー)に他のStep(ステップ)を追加することもできます。トランスフォーメーションフローに他のステップを追加することもできます。
- データの集約準備が整ったら、以下のステップに従います。 Step(ステップ)ビルダーのTransformation Step(変換ステップ)アイコンにマウスオーバーをすることで、Transformation Step(変換ステップ)パネルを展開し、Aggregate Step(集約ステップ)をキャンバスへドラッグします。
- さらにTransformation Step(変換ステップ)を追加することで、データの変換を継続することができます。
- 書き込み可能なデータベースへデータを保存する準備が整ったら、以下のステップに従います。 アイコンにマウスオーバーをし、「Output Step(出力ステップ)」パネルを展開して、「SQL Database Output Step(SQLデータベース出力ステップ)」をキャンバスへドラッグします。
- 次に、Aggregate Step(集約ステップ)(または、フロー内のその前のStep(ステップ))とOutput Step(出力ステップ)を接続します。 画面右側のパネルから、Output Step(出力ステップ)の設定をします。こちらのStep(ステップ)の設定について詳細な情報は、こちらを参照してください。
- 「Save(保存)」ボタンをクリックします。
次に、Input Step(入力ステップ)(他のStep(ステップ)を追加している場合は、その前のStep(ステップ))とAggregate Step(集約ステップ)を接続します。Step(ステップ)にマウスオーバーし、接続点をAggregate Step(集約ステップ)へドラッグします。
Aggregate Step(集約ステップ)アイコンをクリックして、設定を行います。Transformation Flow(データ変換フロー)パネルには、以前のStep(ステップ)からの各フィールドが表示されます。
各フィールドに設定する集約の機能を選択します。
Expand | |||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| |||||||||||||||||||||||||||
|
注意:デフォルトでは、Output Step(出力ステップ)は赤色に強調して表示されることで、エラーが発生していることを示します。これはつまり、設定が完了していないことを意味します。
上部のヘッダーメニューにある「実行」ボタンをクリックすることで、ドラフト(編集中)のFlow(フロー)を実行することができます。
または、Flow(フロー)を完全実行するために保存します。「Publish(公開)」ボタンをクリックしてください。
表示されるポップアップに、名前や適切なアクセス権などの詳細情報を入力します。
...
- データの集計準備が整ったら、以下のステップに従います。
- ステップビルダーのトランスフォーメーションステップアイコンにマウスオーバーをすることで、トランスフォーメーションステップパネルを展開し、集計ステップをキャンバスへドラッグします。
- 次に、インプットステップ(他のステップを追加している場合は、その前のステップ)と集計ステップを接続します。ステップにマウスオーバーし、接続点を集計ステップへドラッグします。
- 集計ステップアイコンをクリックして、設定を行います。トランスフォーメーションフローパネルには、以前のステップからの各フィールドが表示されます。
各フィールドに設定する集計のタイプを選択します。
なし : (利用できるデータ型:テキスト、数値) - フィールドに集計を適用しません。このようなフィールドは、グループ化に使用されます。
外す : (利用できるデータ型:テキスト、数値) - フィールドを排除します。
個数 : (利用できるデータ型:テキスト、数値) - フィールド内のすべての値をカウントします。
Count distinct : テキスト、数値フィールド内のすべてのユニーク値をカウントします。
最大 : (利用できるデータ型:数値) - フィールドの最大値を返します。
最小 : (利用できるデータ型:数値) - フィールドの最小値を返します。
合計 : (利用できるデータ型:数値) - フィールド内のすべての値を合計します。
平均 : (利用できるデータ型:数値) - フィールド内のすべての値を平均します。- 「適用」をクリックします。トランスフォーメーションされたデータが、データプレビューパネルに表示されます。
- さらにトランスフォーメーションステップを追加することで、データのトランスフォーメーションを継続することができます。
- 書き込み可能なデータベースへデータを保存する準備が整ったら、以下のステップに従います。
- アイコンにマウスオーバーをし、「アウトプットステップ」パネルを展開して、「SQL データベースにアウトプット」ステップをキャンバスへドラッグします。
- 次に、集計ステップ(または、フロー内のその前のステップ)とアウトプットステップを接続します。
- 画面右側のパネルから、アウトプットステップの設定をします。こちらのステップの設定について詳細な情報は、こちらを参照してください。
注意:デフォルトでは、アウトプットステップは赤色に強調して表示されることで、エラーが発生していることを示します。これはつまり、設定が完了していないことを意味します。 - 上部のヘッダーメニューにある「実行」ボタンをクリックすることで、ドラフト(編集中)のフローを実行することができます。
- または、フローを完全実行するために保存します。「公開」ボタンをクリックしてください。
- 表示されるポップアップに、名前や適切なアクセス権などの詳細情報を入力します。
- 「保存」ボタンをクリックします。