...
- PMML内でモデルを構築し、XML形式で保存します。(説明の中ではこのファイルを、PMMLファイルと言います)
- Yellowfinのデータトランスフォーメーションモジュールへ移動します。(「作成」ボタン>「トランスフォーメーションフロー」)
- データを取得するインプットステップから、トランスフォーメーションフローの作成を始めます。(基礎的なフローの作成方法は、こちらを参照してください。また、他のデータの取得方法については、こちらを参照してください)
- 取得されたデータが、データプレビューパネルに表示されます。さらにデータをトランスフォーメーションするために、ステップを追加することもできます。
- PMMLモデルを使用する準備ができたら、以下の手順に従います。
- トランスフォーメーションステップ一覧から、PMMLモデル予測ステップをキャンバスへドラッグします。(注意:こちらのステップが表示されない場合は、PMMLプラグインがインストールされているかを確認してください)
- 接続ポイントを使用して、最後のステップをPMMLトランスフォーメーションステップへ接続します。
- 次に、PMMLステップを設定します。(設定画面が表示されるように選択されていることを確認してください)
- PMMLファイルをアップロードします。アップロード方法には、以下の2つがあります。
- 指定されたパネルにファイルをドラッグするか、ファイル選択から対象のファイルを選択します。(ファイルがローカルに配置されている場合は、こちらの方法を実施してください)
- または、「Load from Path(ファイルパスから読み込み)」トグルを有効にして、ファイルパス、またはURLを入力し、「Load File(ファイルの読み込み)パスから読み込み」トグルを有効にして、ファイルパス、またはURLを入力し、「ファイルの読み込み」ボタンをクリックします。
- PMMLファイルにアクセスするためには完全URLを入力します。例:http://dmg.org/pmml/pmml_examples/knime_pmml_examples/ElNinoLinearReg.xml
(注意:URLを使用してPMMLファイルを読み込む場合は、インターネット接続が必要です。インターネット接続がない場合は、ファイルを読み込むことができません)
Windows端末での完全ファイルパスの例は、以下の通りです。
C:\Users\admin\Desktop\audit_cluster.xml
Linux端末でのファイルパスの例は、以下の通りです。
/root/audit_cluster.xml
注意:ファイルが解析されない場合や、入力したパスが無効の場合は、以下のエラーメッセージが表示されます。
注意2:ドラッグ&ドロップを使用してファイルをアップロードする場合、最初のアップロード時にファイル名が消えることがあるかもしれませんが、ステッ上でアクションを実行することで、再び表示されます。ドロップを使用してファイルをアップロードする場合、最初のアップロード時にファイル名が消えることがあるかもしれませんが、ステップ上でアクションを実行することで、再び表示されます。
- ファイルのアップロードに成功すると、入力フィールドをマッピングし、出力を指定するための詳細な設定オプションが表示されます。表示される入力と出力フィールドは、モデルに応じて異なります。
- 最初に、モデルに必要な入力カラム(列)を、取得されたファイル内の適切なカラム(列)とマッピングします。今回の例では、モデルは収入、年齢、性別を入力に必要としています。
注意:正確な結果を導くためには、正確なマッピングをしなくてはいけません。データフィールド名は、モデル内のフィールド名と同一ではない場合もあります。選択したフィールドが、モデルが予期するデータ型と一致していることを確認しなくてはいけません(不適切なマッピングがされた場合は、エラータブに各データ値のエラーが生成されます)
注意2:すべての入力フイールドは必ずマッピングしなくてはならず、すべてが適切にマッピングされない限り、ステップは実行されません。 - 次に、どのモデル出力結果を生成するか選択します。Configure(設定)パネルには、モデルが生成するようにデザインされたすべての出力が表示されます。複数の出力を選択することができます(が、少なくともひとつの出力フィールドを選択しなくてはいけません)次に、どのモデル出力結果を生成するか選択します。設定パネルには、モデルが生成するようにデザインされたすべての出力が表示されます。複数の出力を選択することができます(が、少なくともひとつの出力フィールドを選択しなくてはいけません)
注意:「デフォルトターゲット」出力フィールドは、モデルのデフォルト出力を含みます。PMMLファイルが明確に出力フィールドを指定していない場合は、「デフォルトターゲット」オプションのみを使用することができます。 - 入力と出力フィールドを適切に設定したら、「Save(保存)保存」ボタンをクリックします(注意:モデルを設定し、Save(保存)ボタンをクリックする前に、Configure (設定)パネル以外の場所をクリックすると、設定した内容は失われます)モデルを設定し、保存ボタンをクリックする前に、設定パネル以外の場所をクリックすると、設定した内容は失われます)
設定を保存すると、モデルの結果とともに、データプレビューパネルにカラム(列)が表示されます。(注意:今回の例では、2つの出力フィールドを選択しているため、2つの新規結果カラム(列)が表示されています)
Note 出力カラム(列)のデータ型は、モデル内で指定されているデータ型を引き継ぎますが、特に指定されていない場合は、デフォルトとしてテキストが使用されます。
- さらなるトランスフォーメーションを行うこともできますし、結果をデータベースに保存することもできます。
...
多くの場合、フローはより複雑な構造を持ちますが、今回の例では、非常にシンプルなトランスフォーメーションフローを表示しています。
- 上記の例に見られるように、フローにはDelimited File(区切り文字付きファイル)から入力値をマッピングし、出力を生成するように構成されたPMMLモデルが含まれています。これは、生成された予測値を集約します。選択されたモデルは入力値として収入、年齢、性別が必要であり、いくつかの出力フィールドを持ちます。上記の例に見られるように、フローには区切り文字付きファイルから入力値をマッピングし、出力を生成するように構成されたPMMLモデルが含まれています。これは、生成された予測値を集計します。選択されたモデルは入力値として収入、年齢、性別が必要であり、いくつかの出力フィールドを持ちます。
- 入力フィールドを再設定することで、このステップを編集することができます(例えば、入力データが変更された場合)。この場合、新しいマッピングが有効である限り、ステップの実行は成功します。
- または、Configure(設定)パネルから別のPMMLファイルを読み込むことで、PMMLモデルを変更することができます(PMMLトランザクションステップが選択されていることを確認してください)または、設定パネルから別のPMMLファイルを読み込むことで、PMMLモデルを変更することができます(PMMLトランザクションステップが選択されていることを確認してください)
- ステップの入力、出力設定フィールドは、新しいモデルのものに変更されます。
- 新しい入力フィールドへデータをマッピングし(データ型が一致していることを確認しましょう)、生成する結果を選択します。
注意:前回のステップから取得されるデータと、新しいモデルの要件が一致することを確認しましょう。一致しない場合は、データを変更しなくてはいけない場合があります。
注意2:新しいモデルが、前回のモデルと同一のフィールド名で構成される場合は、自動的にマッピングされます。 - 「Save(保存)保存」ボタンをクリックします。
- 入力フィールドを正確に設定することで(データ型が一致)、モデルは選択された出力フィールドに基づく結果とともに新しいカラム(列)を生成します。(以前の結果に基づくカラム(列)を削除します)
- しかし、ここでフロー内の残りのステップを再実行しなくてはいけません。実行ログには、残りのステップは未実行であると表示されます(下図のAggregate Transformation(集計トランスフォーメーション)ステップを参照)しかし、ここでフロー内の残りのステップを再実行しなくてはいけません。実行ログには、残りのステップは未実行であると表示されます(下図の集計トランスフォーメーションステップを参照)
- 次のステップをクリックして、設定が正確であることを確認し(新しいフィールドが生成された場合、それらも設定しなくてはいけません)、「Apply(適用)適用」をクリックします。
- この手順を、フロー内の残りのすべてのステップで行います。
...