PMMLモデル予測
概要
YellowfinのPMMLモデル予測ステップは、PMMLファイルの形式で保存されたデータサイエンスモデルをYellowfinへインポートし、データへ適用することで予測などの結果を生成することができます。ステップは、トランスフォーメーションフローを作成することで、Yellowfinのデータトランスフォーメーションモジュール内で機能します。
このトランスフォーメーションステップを使用するためには、BIプラットフォームへPMMLのプラグインをインストールしなくてはいけません。プラグインをインストールすることで、データトランスフォーメーションモジュールのトランスフォーメーションステップ一覧にPMMLステップが表示されます。このトランスフォーメーションステップは、PMMLモデルを統合し、適用するために使用されます。プラグインのインストール方法については、こちらを参照してください。
こちらの項目を確認する前に、データトランスフォーメーションモジュールについて事前に理解をしておくのが理想的です。
必要なデータトランスフォーメーションステップ
データトランスフォーメーションモジュールは、異なる「ステップ」を使用することでトランスフォーメーションフローを作成します。こちらの手順では、少なくとも2種類のステップが必要です。
注意:フローには複数のステップを追加することができますが、少なくとも最初の2つはPMMLモデルが結果を生成するために必要となります。
- データソースからデータを取得し、Yellowfinへ読み込む「インプットステップ」。これはモデルに使用するデータのため、データソースへのアクセス権が付与されており、データが適切な形式であることを確認してください。異なるタイプのインプットステップを使用することで、様々な方法でデータを取得することができ、すべてのステップがPMMLステップをサポートします。各ステップの使用や設定方法については、こちらの項目を参照してください。
- 「PMMLモデル予測ステップ」。このステップは、PMMLモデルが作成するようにデザインされた出力を生成します(例えば、データに基づく予測の作成)。これは、データモデル(PMMLファイル形式)をデータトランスフォーメーションモジュールに読み込み、フロー内の前のステップ(例:接続されているステップ)から取得されたデータへ適用することで機能します。このステップを入力フィールドと一致させ、出力フィールドを指定するように設定しなくてはいけません。(注意:このステップは、必要なプラグインをYellowfinへインストールすることで、トランスフォーメーションステップ一覧に表示されるようになります。)
アウトプットステップは、PMMLモデルの結果を、書き込み可能なデータベースに保存する場合に必要になります。
データトランスフォーメーションモジュールにより、ユーザーは異なるタイプのトランスフォーメーションフローを作成し、必要に応じてPMMLステップを含めることができます。例えば、他の方法でトランスフォーメーションされたデータにPMMLモデルを適用し、それが生成する結果をさらなるトランスフォーメーションに使用することができます。
サポートしているモデルタイプ
YellowfinのPMMLモデル予測ステップがサポートするデータサイエンスモデルのタイプは、以下の通りです。
- 関連ルール
- クラスタモデル
- 一般的な回帰
- ナイーブベイズ
- k最近傍法
- ニューラルネットワーク
- 回帰
- ルールセット
- スコアカード
- サポートベクターマシン
- ツリーモデル
- アンサンブルモデル
サポートしているPMMLファイルのバージョン
PMMLトランスフォーメーションステップは、バージョン3.0以降のPMMLファイルを完全にサポートします。しかし、それ以前のバージョンでも機能するものもあります。また、PMMLの標準ではPMMLファイルに複数のモデルを含めることができても、PMMLステップはPMMLファイル内のひとつのモデルしか認識することができません。ファイル内に複数のモデルがある場合、Yellowfinは最初のモデルを使用します。