Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Table of Contents
classcontents

概要

Transformation Step(変換ステップ)は、H2Oクラウドインスタンスで作成されたデータサイエンスモデルをYellowfin内で使用し、予測などの結果を生成します。これは、データ変換モジュールのTransformation Step(変換ステップ)から実行されます。

...

Info

これまでマーケットプレイス (サポートサイト) に掲載されていたトランスフォーメーションステップを介したモデル予測のプラグインは、今後サポートされません (2023年11月1日をもって終了)。詳細はこちらの記事をご確認ください。これらのコードのレガシーバージョンへのアクセスをご希望の場合は、Yellowfin サポートチームまでお問い合わせください。

概要

トランスフォーメーションステップは、H2Oクラウドインスタンスで作成されたデータサイエンスモデルをYellowfin内で使用し、予測などの結果を生成します。これは、データトランスフォーメーションモジュールのトランスフォーメーションステップから実行されます。

前提条件

このStep(ステップ)を使用する前に、少なくともひとつのモデルが作成されているH2Oインスタンスへのアクセス権が付与されていることを確認してください。また、YellowfinへH2Oのこのステップを使用する前に、少なくともひとつのモデルが作成されているH2Oインスタンスへのアクセス権が付与されていることを確認してください。また、YellowfinへH2Oのプラグインをインストールしなくてはいけません。

Tip

こちらの項目を確認する前に、データ変換モジュールデータトランスフォーメーションモジュールについて事前に理解をしておくのが理想的です。

サポートしているモデル

現在サポートするモデルのタイプは、以下の通りです。現在サポートしているモデルのタイプは、以下の通りです。

    • ディープラーニング
    • 分散ランダムフォレスト

...

Note

出力カラム(列)のデータ型は、モデル内で指定されているデータ型を引き継ぎますが、特に指定されていない場合は、デフォルトとしてテキストが使用されます。

...

 

 

PMML Transformation Step(変換ステップ)の編集

PMMLファイルを、別のモデルを使用したものに置き換えるか、入力、または出力設定を変更することで、PMML Step(ステップ)を編集することができます。しかし、これはTransformation Flow(データ変換フロー)に影響を与えます。

多くの場合、フローはより複雑な構造を持ちますが、今回の例では、非常にシンプルなTransformation Flow(データ変換フロー)を表示しています。

 

Image Removed

 

...

    • 勾配ブースティングマシン

サポートしているPMMLファイルのバージョン

PMML Transfomation Step(変換ステップ)は、バージョン3.0以降のPMMLファイルを完全にサポートします。しかし、それ以前のバージョンでも機能するものもあります。また、PMMLの標準ではPMMLファイルに複数のモデルを含めることができても、PMML Step(ステップ)はPMMLファイル内のひとつのモデルしか認識することができません。ファイル内に複数のモデルがある場合、Yellowfinは最初のモデルを使用します。

 

PMML Step(ステップ)の設定

フローにPMML Transformation Step(変換ステップ)を追加したら、これを設定しなくてはいけません。これには、PMMLモデルのアップロードが含まれます。モデルが適切に解析されたら、モデル内で指定されている入力フィールドと出力フィールドの設定をします。注意:使用されているモデルに、入力フィールドと出力フィールドが指定されているものとします。

入力設定

モデルの入力は、計算を実行するために必要なデータのフィールドを参照します。例えば、回帰モデルの場合、入力はモデルに必要な独立変数の一覧です。PMML Step(ステップ)を適切に実行するためには、データフィールドを、モデルが必要とするフィールドとマッピングしなくてはいけません。

 

出力設定

モデルの出力は、モデルが生成するようにデザインされた一連の結果フィールドです。出力が通常ひとつの予測されたフィールドである回帰モデルのような場合は、たったひとつのフィールドから出力を構成することもできます。しかし一方で、クラスタリングモデルの場合は、出力として指定された数のクラスタ、または各クラスタの重心までの距離を持つフィールドのいずれかを設定することができます。出力を設定する際にユーザーは、利用可能なフィールドから、どのフィールドを結果に表示するのか選択することができますが、少なくともひとつの出力フィールドを選択しなくてはいけません。出力フィールドのデータ型は、モデル内で指定されたものになりますが、特に指定されていない場合は、結果はテキストと見なされます。

例えば、モデルは客室等級と年齢を元に、タイタニックの乗客が支払った料金を予測するようにデザインすることができます。この場合、設定される入力は等級と年齢であり、選択される結果フィールドは料金です。

 

PMML Transformation Step(変換ステップ)の使用方法

こちらの項目は、PMML Transformation Step(変換ステップ)を使用してデータサイエンスモデルをYellowfinへ統合する方法について紹介します。

...

    • 一般化された線形モデル
    • 一般化された低ランクモデリング
    • k平均法
    • XGBoost(H2OがLinux上で起動している場合に利用可能)

一般的なワークフロー

こちらがプロセスの簡単な概要です。こちらの項目では、これらのステップの大部分について、詳細に説明します。

  1. アクセス可能なH2Oインスタンスを準備するか、新しくセットアップをして、データサイエンスモデルを構築します。
  2. Yellowfinインスタンスへ、H2Oのプラグインをインストールします。
  3. Yellowfinのデータトランスフォーメーションモジュールを使用して、トランスフォーメーションフローを作成します。これには、モジュールへのデータインポートと、必要に応じて、その他トランスフォーメーションの適用が必要です。
  4. フローでH2Oトランスフォーメーションステップを使用し、これを設定します。ステップの設定方法は、以下の情報を参照してください。
  5. ステップを実行し、モデルがデータを使用して生成する出力を確認します。

ステップ設定の詳細