Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Table of Contents
classcontents

 

概要


個数やCount Distinct、合計や平均などの関数を適用することで、データをサマリー形式へ変換します。これは、統計分析に最適です。Distinct、合計や平均などの関数を適用することで、データをサマリー形式へトランスフォーメーションします。これは、統計分析に最適です。


これは、データ変換モジュールの「これは、データトランスフォーメーションモジュールの「集計」ステップを使用して実行します。注意:これはビルトインステップのため、デフォルトでトランスフォーメーション一覧から利用することができます。 


集計のタイプ

以下の表は、データのトランスフォーメーションに使用する、様々なタイプの集計を示しています。

集計のタイプ利用できるデータ型説明
なしテキスト、数値フィールドに集計を適用しません。このようなフィールドは、グループ化に使用されます。
外すテキスト、数値フィールドを排除します。
個数テキスト、数値フィールド内のすべての値をカウントします。
Count distinctテキスト、数値フィールド内のすべてのユニーク値をカウントします。
最大数値フィールドの最大値を返します。
最小数値フィールドの最小値を返します。
合計数値フィールド内のすべての値を合計します。
平均数値フィールド内のすべての値を平均します。

 

 



ステップの設定

集計ステップを設定するには、以下の手順に従います。


  1. トランスフォーメーションを実行するデータを含むインプットステップを、最低でもひとつ準備します。フローに集計ステップを追加する準備ができたら、以下の手順に従います。
  2. 変換フロービルダーの画面左側からトランスフォーメーションステップボタンをクリックして、すべてのステップを表示します。トランスフォーメーションフロービルダーの画面左側からトランスフォーメーションステップボタンをクリックして、すべてのステップを表示します。
  3. トランスフォーメーションステップ一覧から「集計」オプションをキャンバスへドラッグします。
    Image Removed
    Image Added

  4. フロー内のこれより前にあるステップと接続します。

  5. 設定パネルを使用して、各データフィールドに適用する集計のタイプを選択します。

     

    Note

    注意:各集計タイプについての詳細は、上記のを参照してください。


    Image Modified
     



  6. 設定が完了したら、「適用」ボタンをクリックします。データプレビューパネルに、集計が適用された結果が表示されます。

 

...



集計ステップを利用した例

こちらの例では、

データを集約するシンプルなTransformation Flow(データ変換フロー)の作成方法について紹介します。こちらのフローでは、Input Step(入力ステップ)の設定、Aggregate transformation Step(集約データ変換ステップ)の適用、データベースへのデータの保存、について説明します。フローには、さらに多くのStep(ステップ)を含めることが可能です。

 


こちらの例では、集計ステップを利用したトランスフォーメーションフローの作成方法を紹介します。こちらのフローは、インプットステップの設定、集計トランスフォーメーションステップの適用、データベースへのデータの保存、を含みます。フローには、さらに多くのステップを含めることが可能です。



  1. 右上隅にある「作成」ボタンをクリックします。
  2. Transformation Flow(データ変換フロー)トランスフォーメーションフロー」を選択します。

    Noteこちらのオプションが表示されない場合は、Transformation Flow(データ変換フロー)へのセキュリティアクセス権が付与されていない可能性があります。アクセス権取得について詳細な情報は、

    注意:こちらのオプションが表示されない場合は、トランスフォーメーションフローへのセキュリティアクセス権が付与されていない可能性があります。アクセス権取得について詳細な情報は、こちらを参照してください。


    Image RemovedImage Added

  3. Transformation Flow(データ変換フロー)ビルダーへ移動します。トランスフォーメーションフロービルダーへ移動します。
  4. 画面左側にある「Input Step(入力ステップ)」ボタンへマウスオーバーします。Input Step(入力ステップ)パネルが現れ、すべてのデータ取得Step(ステップ)が表示されます。
    Image Removed
    Step(ステップ)のひとつをキャンバスへドラッグします(今回の手順では、Report Step(レポートステップ)を例として説明します。他のInput Step(入力ステップ)について、詳細な情報は、インプットステップ」ボタンへマウスオーバーします。インプットステップパネルが現れ、すべてのデータ取得ステップが表示されます。

    Image Added

  5. ステップのひとつをキャンバスへドラッグします(今回の手順では、レポートステップを例として説明します。他のインプットステップについて、詳細な情報は、こちらを参照してください)。
  6. Step(ステップ)をドラッグすると、ポップアップが表示され、フローで使用するレポートを選択することができます。ステップをドラッグすると、ポップアップが表示され、フローで使用するレポートを選択することができます。

    Image Modified

  7. レポート名を入力して必要なレポートを選択し、カラム(列)が表示されたら、「Add Report(レポート追加)レポート追加」をクリックします。

    Image Modified

  8. Transformation Flow(データ変換フロー)パネルにレポートフィールドが表示され、設定をすることができます。トランスフォーメーションフローパネルにレポートフィールドが表示され、設定をすることができます。
  9. Configure(設定)タブで、データを取得するフィールドのみを選択します。設定タブで、データを取得するフィールドのみを選択します。
    Image Removed
    Image Added

  10. Step(ステップ)名の変更や、説明の追加など、さらなる変更を加えることができます。ステップ名の変更や、説明の追加など、さらなる変更を加えることができます。
  11. 設定が完了したら、「Apply(適用)適用」ボタンをクリックします。

    Warning設定内容を保存するためには、「Apply(適用)」ボタンをクリックしなくてはいけません。こちらをクリックする前に、別の場所をクリックすると、設定した内容は失われます。

    警告:設定内容を保存するためには、「適用」ボタンをクリックしなくてはいけません。こちらボタンをクリックする前に、別の場所をクリックすると、設定した内容は失われます。

  12. データプレビューパネルには、設定したデータソースから取得されたデータが表示されます。
    Image Removed
    Image Added

  13. データプレビューパネルから直接フィールドに変換を適用することもできます。詳細は、こちら参照してください。データプレビューパネルから直接フィールドにトランスフォーメーションを適用することもできます。詳細は、こちら参照してください。
  14. Step(ステップ)設定パネルには新しくField(フィールド)タブが表示されます。こちらのタブは、Step(ステップ)から取得されたデータフィールドを管理するために使用します。ステップ設定パネルには新しくフィールドタブが表示されます。こちらのタブは、ステップから取得されたデータフィールドを管理するために使用します。
    Image Removed
    Image Added

  15. Transformation Flow(データ変換フロー)に他のStep(ステップ)を追加することもできます。トランスフォーメーションフローに他のステップを追加することもできます。
  16. データの集約準備が整ったら、以下のステップに従います。
  17. Step(ステップ)ビルダーのTransformation Step(変換ステップ)アイコンにマウスオーバーをすることで、Transformation Step(変換ステップ)パネルを展開し、Aggregate Step(集約ステップ)をキャンバスへドラッグします。
    Image Removed
    次に、Input Step(入力ステップ)(他のStep(ステップ)を追加している場合は、その前のStep(ステップ))とAggregate Step(集約ステップ)を接続します。Step(ステップ)にマウスオーバーし、接続点をAggregate Step(集約ステップ)へドラッグします。
    Image Removed
    Aggregate Step(集約ステップ)アイコンをクリックして、設定を行います。Transformation Flow(データ変換フロー)パネルには、以前のStep(ステップ)からの各フィールドが表示されます。
    Image Removed
    各フィールドに設定する集約の機能を選択します。
    Expand
    title展開してAggregate(集約)のタイプを参照する
    Aggregate(集約)のタイプ利用できるデータタイプ説明
    None(なし)テキスト、数値フィールドに集約を適用しません。このようなフィールドは、グループ化に使用されます。
    Remove(外す)テキスト、数値フィールドを排除します。
    Count(個数)テキスト、数値フィールド内のすべての値をカウントします。
    Count distinctテキスト、数値フィールド内のすべてのユニーク値をカウントします。
    Max(最大)数値フィールドの最大値を返します。
    Min(最小)数値フィールドの最小値を返します。
    Sum(合計)数値フィールド内のすべての値を合計します。
    Average(平均)数値フィールド内のすべての値を平均します。
    Image RemovedApply(適用)」をクリックします。変換されたデータが、データプレビューパネルに表示されます。
    Image Removed
  18. さらにTransformation Step(変換ステップ)を追加することで、データの変換を継続することができます。
  19. 書き込み可能なデータベースへデータを保存する準備が整ったら、以下のステップに従います。
  20. アイコンにマウスオーバーをし、「Output Step(出力ステップ)」パネルを展開して、「SQL Database Output Step(SQLデータベース出力ステップ)」をキャンバスへドラッグします。
    Image Removed
  21. 次に、Aggregate Step(集約ステップ)(または、フロー内のその前のStep(ステップ))とOutput Step(出力ステップ)を接続します。
  22. 画面右側のパネルから、Output Step(出力ステップ)の設定をします。こちらのStep(ステップ)の設定について詳細な情報は、こちらを参照してください。
    注意:デフォルトでは、Output Step(出力ステップ)は赤色に強調して表示されることで、エラーが発生していることを示します。これはつまり、設定が完了していないことを意味します。
    Image Removed
    上部のヘッダーメニューにある「実行」ボタンをクリックすることで、ドラフト(編集中)のFlow(フロー)を実行することができます。
    Image Removed
    または、Flow(フロー)を完全実行するために保存します。「Publish(公開)」ボタンをクリックしてください。
    Image Removed
    表示されるポップアップに、名前や適切なアクセス権などの詳細情報を入力します。
    Image Removed
  23. Save(保存)」ボタンをクリックします。

...

  1. データの集計準備が整ったら、以下のステップに従います。
  2. ステップビルダーのトランスフォーメーションステップアイコンにマウスオーバーをすることで、トランスフォーメーションステップパネルを展開し、集計ステップをキャンバスへドラッグします。

    Image Added

  3. 次に、インプットステップ(他のステップを追加している場合は、その前のステップ)と集計ステップを接続します。ステップにマウスオーバーし、接続点を集計ステップへドラッグします。

    Image Added

  4. 集計ステップアイコンをクリックして、設定を行います。トランスフォーメーションフローパネルには、以前のステップからの各フィールドが表示されます。

    Image Added

  5. 各フィールドに設定する集計のタイプを選択します。

    なし : (利用できるデータ型:テキスト、数値) - フィールドに集計を適用しません。このようなフィールドは、グループ化に使用されます。
    外す : (利用できるデータ型:テキスト、数値) - フィールドを排除します。
    個数 : (利用できるデータ型:テキスト、数値) - フィールド内のすべての値をカウントします。
    Count distinct : テキスト、数値フィールド内のすべてのユニーク値をカウントします。
    最大 : (利用できるデータ型:数値) - フィールドの最大値を返します。
    最小 : (利用できるデータ型:数値) - フィールドの最小値を返します。
    合計 : (利用できるデータ型:数値) - フィールド内のすべての値を合計します。
    平均 : (利用できるデータ型:数値) - フィールド内のすべての値を平均します。

    Image Added

  6. 適用」をクリックします。トランスフォーメーションされたデータが、データプレビューパネルに表示されます。

    Image Added

  7. さらにトランスフォーメーションステップを追加することで、データのトランスフォーメーションを継続することができます。
  8. 書き込み可能なデータベースへデータを保存する準備が整ったら、以下のステップに従います。
  9. アイコンにマウスオーバーをし、「アウトプットステップ」パネルを展開して、「SQL データベースにアウトプット」ステップをキャンバスへドラッグします。

    Image Added

  10. 次に、集計ステップ(または、フロー内のその前のステップ)とアウトプットステップを接続します。
  11. 画面右側のパネルから、アウトプットステップの設定をします。こちらのステップの設定について詳細な情報は、こちらを参照してください。
    注意:デフォルトでは、アウトプットステップは赤色に強調して表示されることで、エラーが発生していることを示します。これはつまり、設定が完了していないことを意味します。

    Image Added

  12. 上部のヘッダーメニューにある「実行」ボタンをクリックすることで、ドラフト(編集中)のフローを実行することができます。

    Image Added

  13. または、フローを完全実行するために保存します。「公開」ボタンをクリックしてください。

    Image Added

  14. 表示されるポップアップに、名前や適切なアクセス権などの詳細情報を入力します。

    Image Added

  15. 保存」ボタンをクリックします。