データトランスフォーメーションモジュールは、データに対して様々なタイプのトランスフォーメーションを実行することができます。これは、フローにドラッグできるトランスフォーメーションステップや、インラインフィールドトランスフォーメーションの実行、データ変換を含みます。このモジュールに含まれるトランスフォーメーションステップの他に、プラグインをダウンロードしてインストールすることで、環境にさらにステップを追加することもできます。
こちらは、トランスフォーメーションを実行する様々な方法の詳細です。
- ビルトイントランスフォーメーション:データトランスフォーメーションモジュールに含まれる、トランスフォーメーションステップパネル内のトランスフォーメーションを指します。これらは、セットアップの必要がありません。
- ダウンロード可能なトランスフォーメーションステップ:トランスフォーメーションステップパネルで利用することのできる特定のプラグインをマーケットプレイスからダウンロードし、インストールします。(利用可能なオプションは、マーケットプレイスのトランスフォーメーションステップ項目を参照してください。)
- インラインフィールドトランスフォーメーション:データ上で直接実行できるトランスフォーメーション機能を指します(データプレビューパネル内、またはステップの設定パネル)。
以下の表は、データに対して実行できるすべてのトランスフォーメーションです。トランスフォーメーションフロー内での使用方法は、名称をクリックして詳細を確認してください。
トランスフォーメーション | タイプ | 説明 |
集計 | ビルトイントランスフォーメーションステップ | 個数やCount Distinct、合計や平均などの関数を適用することで、データをサマリー形式へトランスフォーメーションします。 |
計算フィールド | ビルトイントランスフォーメーションステップ | ステップの他のフィールドに基づく計算フィールドを作成します。 |
フィルター | ビルトイントランスフォーメーションステップ | ステップのデータにフィルターを適用します。 |
マージ | ビルトイントランスフォーメーションステップ | 設定された接続フィールドに基づき2つのデータセットをマージします。 |
分割 | ビルトイントランスフォーメーションステップ | 入力データセットを複製して、同様の出力データセットを作成します。 |
PMMLモデル予測 | ダウンロード可能なトランスフォーメーションステップ | プラットフォームへPMMLファイルとして保存されたモデルをステップへ統合し、データへ適用します。 |
PFAモデル予測 | ダウンロード可能なトランスフォーメーションステップ | PFAモデルをステップへ統合し、データへ適用します。 |
H2Oモデル予測 | ダウンロード可能なトランスフォーメーションステップ | H2O.aiで作成されたモデルをステップへ統合し、データへ適用します。 |
Rモデル予測 | ダウンロード可能なトランスフォーメーションステップ | Rモデルをステップへ統合し、データへ適用します。 |
データの型変換 | インラインフィールドトランスフォーメーション | フィールドのデータ型を別の型へ変換するために使用する機能です。例えば、テキストを数値やSQL日付、SQLタイムスタンプへ変換します。 |
フィールドの複製 | インラインフィールドトランスフォーメーション | データフィールドのコピーを作成します。 |
Number Precision(数字の丸め(端数処理)) | インラインフィールドトランスフォーメーション | 数字の丸め処理を行います。 |
Sub-string(サブ文字列) | インラインフィールドトランスフォーメーション | 文字列を部分的に切り出します。 |
大文字と小文字を切り替え | インラインフィールドトランスフォーメーション | テキストをすべて大文字、すべて小文字、または単語の頭文字のみ大文字、に変換します。 |
White Space(半角スペース) | インラインフィールドトランスフォーメーション | データから半角スペースを排除します。 |