...
Table of Contents | ||
---|---|---|
|
概要
YellowfinのPMMLモデル予測ステップは、PMMLファイルの形式で保存されたデータサイエンスモデルをYellowfinへインポートし、データへ適用することで予測などの結果を生成することができます。ステップは、Transformation Flow(データ変換フロー)を作成することで、Yellowfinのデータ変換モジュール内で機能します。
このTransformation STep(変換ステップ)を使用するためには、BIプラットフォームへPMMLのプラグインをインストールしなくてはいけません。プラグインをインストールすることで、データ変換モジュールのTransformation Step( 変換ステップ)一覧にPMML Step(ステップ)が表示されます。このTransformation Step(変換ステップ)は、PMMLモデルを統合し、適用するために使用されます。プラグインのインストール方法については、YellowfinのPMMLモデル予測ステップは、PMMLファイルの形式で保存されたデータサイエンスモデルをYellowfinへインポートし、データへ適用することで予測などの結果を生成することができます。ステップは、トランスフォーメーションフローを作成することで、Yellowfinのデータトランスフォーメーションモジュール内で機能します。
このトランスフォーメーションステップを使用するためには、BIプラットフォームへPMMLのプラグインをインストールしなくてはいけません。プラグインをインストールすることで、データトランスフォーメーションモジュールのトランスフォーメーションステップ一覧にPMMLステップが表示されます。このトランスフォーメーションステップは、PMMLモデルを統合し、適用するために使用されます。プラグインのインストール方法については、こちらを参照してください。
Tip |
---|
こちらの項目を確認する前に、データ変換モジュールデータトランスフォーメーションモジュールについて事前に理解をしておくのが理想的です。 |
必要なTransformation Steps(変換ステップ)
データ変換モジュールは、異なる「Steps(ステップ)」を使用することでTransformation Flows(変換フロー)を作成します。こちらの手順では、少なくとも2種類のStep(ステップ)が必要です。
注意:フローには複数のSteps(ステップ)を追加することができますが、少なくとも最初の2つはPMMLモデルが結果を生成するために必要となります。
...
必要なデータトランスフォーメーションステップ
データトランスフォーメーションモジュールは、異なる「ステップ」を使用することでトランスフォーメーションフローを作成します。こちらの手順では、少なくとも2種類のステップが必要です。
注意:フローには複数のステップを追加することができますが、少なくとも最初の2つはPMMLモデルが結果を生成するために必要となります。
- データソースからデータを取得し、Yellowfinへ読み込む「インプットステップ」。これはモデルに使用するデータのため、データソースへのアクセス権が付与されており、データが適切な形式であることを確認してください。異なるタイプのインプットステップを使用することで、様々な方法でデータを取得することができ、すべてのステップがPMMLステップをサポートします。各ステップの使用や設定方法については、こちらの項目を参照してください。
- 「PMMLモデル予測ステップ」。このStep(ステップ)は、PMMLモデルが作成するようにデザインされた出力を生成します(例えば、データに基づく予測の作成)。これは、データモデル(PMMLファイル形式)をデータ変換モジュールに読み込み、フロー内の前のStep(ステップ)(例:接続されているStep(ステップ))から取得されたデータへ適用することで機能します。このStep(ステップ)を入力フィールドと一致させ、出力フィールドを指定するように設定しなくてはいけません。(」。このステップは、PMMLモデルが作成するようにデザインされた出力を生成します(例えば、データに基づく予測の作成)。これは、データモデル(PMMLファイル形式)をデータトランスフォーメーションモジュールに読み込み、フロー内の前のステップ(例:接続されているステップ)から取得されたデータへ適用することで機能します。このステップを入力フィールドと一致させ、出力フィールドを指定するように設定しなくてはいけません。(注意:このStep(ステップ)は、必要なプラグインをYellowfinへインストールすることで、Transformation Step(変換ステップ)一覧に表示されるようになります。)このステップは、必要なプラグインをYellowfinへインストールすることで、トランスフォーメーションステップ一覧に表示されるようになります。)
Note |
---|
Output Step(出力ステップ)は、PMMLモデルの結果を、書き込み可能なデータベースに保存する場合に必要になります。アウトプットステップは、PMMLモデルの結果を、書き込み可能なデータベースに保存する場合に必要になります。 |
データ変換モジュールにより、ユーザーは異なるタイプのTransformatsion Flow(変換フロー)を作成し、必要に応じてPMML Step(ステップ)を含めることができます。例えば、他の方法で変換されたデータにPMMLモデルを適用し、それが生成する結果をさらなる変換に使用することができます。
データトランスフォーメーションモジュールにより、ユーザーは異なるタイプのトランスフォーメーションフローを作成し、必要に応じてPMMLステップを含めることができます。例えば、他の方法でトランスフォーメーションされたデータにPMMLモデルを適用し、それが生成する結果をさらなるトランスフォーメーションに使用することができます。
サポートしているモデルタイプ
YellowfinのPMMLモデル予測ステップがサポートするデータサイエンスモデルのタイプは、以下の通りです。
- 関連ルール
- クラスタモデル
- 一般的な回帰
- ナイーブベイズ
- k最近傍法
- ニューラルネットワーク
- 回帰
- ルールセット
- スコアカード
- サポートベクターマシン
- ツリーモデル
- アンサンブルモデル
サポートしているPMMLファイルのバージョン
PMML Transfomation Step(変換ステップ)は、バージョン3.0以降のPMMLファイルを完全にサポートします。しかし、それ以前のバージョンでも機能するものもあります。また、PMMLの標準ではPMMLファイルに複数のモデルを含めることができても、PMML Step(ステップ)はPMMLファイル内のひとつのモデルしか認識することができません。ファイル内に複数のモデルがある場合、Yellowfinは最初のモデルを使用します。
PMML Step(ステップ)の設定
フローにPMMLモデル予測ステップを追加したら、これを設定しなくてはいけません。これには、PMMLモデルのアップロードが含まれます。モデルが適切に解析されたら、モデル内で指定されている入力フィールドと出力フィールドの設定をします。注意:使用されているモデルに、入力フィールドと出力フィールドが指定されているものとします。
入力設定
モデルの入力は、計算を実行するために必要なデータのフィールドを参照します。例えば、回帰モデルの場合、入力はモデルに必要な独立変数の一覧です。PMML Step(ステップ)を適切に実行するためには、データフィールドを、モデルが必要とするフィールドとマッピングしなくてはいけません。
出力設定
モデルの出力は、モデルが生成するようにデザインされた一連の結果フィールドです。出力が通常ひとつの予測されたフィールドである回帰モデルのような場合は、たったひとつのフィールドから出力を構成することもできます。しかし一方で、クラスタリングモデルの場合は、出力として指定された数のクラスタ、または各クラスタの重心までの距離を持つフィールドのいずれかを設定することができます。出力を設定する際にユーザーは、利用可能なフィールドから、どのフィールドを結果に表示するのか選択することができますが、少なくともひとつの出力フィールドを選択しなくてはいけません。出力フィールドのデータ型は、モデル内で指定されたものになりますが、特に指定されていない場合は、結果はテキストと見なされます。
例えば、モデルは客室等級と年齢を元に、タイタニックの乗客が支払った料金を予測するようにデザインすることができます。この場合、設定される入力は等級と年齢であり、選択される結果フィールドは料金です。
PMMLモデル予測ステップの使用方法
こちらの項目は、PMMLモデル予測ステップを使用してデータサイエンスモデルをYellowfinへ統合する方法について紹介します。
...
Note |
---|
出力カラム(列)のデータ型は、モデル内で指定されているデータ型を引き継ぎますが、特に指定されていない場合は、デフォルトとしてテキストが使用されます。 |
...
PMMLモデル予測ステップの編集
PMMLファイルを、別のモデルを使用したものに置き換えるか、入力、または出力設定を変更することで、PMML Step(ステップ)を編集することができます。しかし、これはTransformation Flow(データ変換フロー)に影響を与えます。
多くの場合、フローはより複雑な構造を持ちますが、今回の例では、非常にシンプルなTransformation Flow(データ変換フロー)を表示しています。
...
PMMLトランスフォーメーションステップは、バージョン3.0以降のPMMLファイルを完全にサポートします。しかし、それ以前のバージョンでも機能するものもあります。また、PMMLの標準ではPMMLファイルに複数のモデルを含めることができても、PMMLステップはPMMLファイル内のひとつのモデルしか認識することができません。ファイル内に複数のモデルがある場合、Yellowfinは最初のモデルを使用します。