...
Table of Contents | ||
---|---|---|
|
概要
Transformation Step(変換ステップ)は、H2Oクラウドインスタンスで作成されたデータサイエンスモデルをYellowfin内で使用し、予測などの結果を生成します。これは、データ変換モジュールのTransformation Step(変換ステップ)から実行されます。
前提条件
このStep(ステップ)を使用する前に、少なくともひとつのモデルが作成されているH2Oインスタンスへのアクセス権が付与されていることを確認してください。また、YellowfinへH2Oのプラグインをインストールしなくてはいけません。
Tip |
---|
こちらの項目を確認する前に、データ変換モジュールについて事前に理解をしておくのが理想的です。 |
サポートしているモデル
現在サポートするモデルのタイプは、以下の通りです。
- ディープラーニング
- 分散ランダムフォレスト
- 勾配ブースティングマシン
- 一般化された線形モデル
- 一般化された低ランクモデリング
- k平均法
- XGBoost(H2OがLinux上で起動している場合に利用可能)
一般的なワークフロー
こちらがプロセスの簡単な概要です。こちらの項目では、これらのStep(ステップ)の大部分について、詳細に説明します。
- アクセス可能なH2Oインスタンスを準備するか、新しくセットアップをし、データサイエンスモデルを構築します。
- YellowfinインスタンスへH2Oのプラグインをインストールします。(プラグインは、マーケットプレイスからダウンロードできます。)プラグインのインストール方法は、こちらを参照してください。
- Yellowfinのデータ変換モジュールを使用して、Transformation Flow(データ変換フロー)を作成します。これには、モジュールへのデータのインポート、そして必要に応じたその他変換の適用が必要です。
- フローにH2O Tranformation Step(変換ステップ)を使用し、これを設定します。ステップの設定方法は、以下の情報を参照してください。
- Step(ステップ)を実行し、モデルがデータを使用して生成する出力を確認します。
Step(ステップ)の設定詳細
H2Oステップを設定するためには、有効なURLからH2Oのインスタンスへ接続し、データサイエンスモデルを選択しなくてはいけません。次に、モデルの入力フィールドを設定します。これは、データ変換フローからのデータとのマッピングにより行います。他のデータサイエンスモデル(PMMLなど)の出力の設定とは異なり、出力フィールドの設定をする必要はありません。生成される結果は、モデルの作成時に定義されます。
サポートしているモデルのカテゴリー
Yellowfinがサポートするモデルのタイプは、一般的に4つのカテゴリーに分類することができます。以下の一覧を参照してください。注意:モデルのカテゴリーを確認するには、H2O内のモデルの出力項目を参照してください。
以下は、各カテゴリーが生成するそれぞれの出力タイプです。
回帰:このカテゴリーに属するモデルは、データのすべてのロウ(行)について実際の予測値を生成します。
二項式:このタイプのモデルは、すべてのロウ(行)について予測されるクラスのテキストラベルを出力します。
多項式:(上記に準ずる)
クラスタリング:このようなモデルは、すべてのロウ(行)が属するクラスタのインデックス番号を示します。
モデルの出力の確認
多くの場合、ユーザーはモデルの出力を把握しています。しかし、H2Oのインスタンスからモデルを選択することで、出力を確認し、その設定を把握することができます。例えば、バイナリモデルの場合、出力はモデルのパラメーター内で確認することができます。
モデルの出力のデータ型
出力カラム(列)のデータ型は、モデル内の設定により異なります。「クラスタリング」と「回帰」カテゴリーに属するモデルの場合、これは「数値型」になります。他のカテゴリー場合は、「テキスト型」になります。
YellowfinでのH2O.aiの使用
パート1:H2O.aiのセットアップ
H2Oは、予測モデルを使用することのできる、モダンオープンソースAIプラットフォームです。最新バージョンのH2Oは、こちらからダウンロードすることができます。
H2Oは、ローカル端末上で使用することもできますし、URLを通してアクセス可能な公的なスペースで使用することもできます。
H2Oをローカル端末上で実行するには、以下の手順に従います。
H2O.aiをダウンロードします。
ディレクトリへファイルを解凍します。
ターミナル(Appleターミナル、またはMSDOS)を開き、取得されたフォルダへ移動します。
「」からjarを実行します。これにより、H2O.aiサーバーが起動します。
デフォルトでは、H2O.aiサーバーは「」で実行されます(適切にセットアップされた場合)。注意:H2OインスタンスのURLや、その他設定をカスタマイズすることができます。
H2O URL
H2Oインスタンスへの接続を確立するためには、インスタンスのURLが必要です。ローカル端末に設定されている場合、これはデフォルト設定()、またはローカルセットアップでも、リモートアクセス(リモートアクセスをする場合は、安定したインターネット接続が必要です)においてもIPアドレスを含む設定()になります。
注意:適切に認識されるために、