Anchor | ||||
---|---|---|---|---|
|
...
Rは、統計的計算のための強力なプログラミング言語、およびソフトウェア環境です。Rで作成されたスクリプトをYellowfinと組み合わせることで、データの高度な統計分析を行うことができます。
Rモデル予測ステップを使用することで、Rを使用して作成された分析モデルやアプリケーションをYellowfinで使用することができます。このStep(ステップ)を通してRスクリプトを使用することで、Yellowfinのデータ上で生成するようにデザインされた結果を得ることができます。Rモデル予測ステップを使用することで、Rを使用して作成された分析モデルやアプリケーションをYellowfinで使用することができます。このステップを通してRスクリプトを使用することで、Yellowfinのデータ上で生成するようにデザインされた結果を得ることができます。
前提条件
こちらのStep(ステップ)を使用するためには、以下の設定が必要です。こちらのステップを使用するためには、以下の設定が必要です。
- Rserveパッケージが実行されているRインスタンスへのアクセス
- 少なくともひとつの有効なRスクリプト
- YellowfinインスタンスへRのプラグインのインストール。Rのプラグインは、マーケットプレイスからダウンロードすることができます。
Rスクリプトを使用するためにデータ変換モジュールを使用するユーザーは、スクリプトを熟知し、入力や出力要件を把握していなくてはいけません。Rスクリプトを使用するために、データトランスフォーメーションモジュールを使用するユーザーは、スクリプトを熟知し、入力や出力要件を把握していなくてはいけません。
Rserveについて詳細な資料は、こちらを参照してください。:https://cran.r-project.org/web/packages/Rserve/Rserve.pdf
一般的なワークフロー
こちらがプロセスの簡単な概要です。こちらの項目では、これらのStep(ステップ)の大部分について、詳細に説明します。こちらがプロセスの簡単な概要です。こちらの項目では、これらのステップの大部分について、詳細に説明します。
- Rのインスタンスへのアクセスを確立するか、自身でセットアップをします。Rスクリプトを記述し、それが有効であることを確認します。このインスタンスは、スクリプトを実行するために使用されます。
- YellowfinインスタンスへRのプラグインをインストールします。(プラグインは、Yellowfinインスタンスへ、Rのプラグインをインストールします。(プラグインは、マーケットプレイスからダウンロードできます。)プラグインのインストール方法は、こちらを参照してください。
- Yellowfinのデータ変換モジュールを使用して、Transformation Flow(データ変換フロー)を作成します。これには、モジュールへのデータのインポート、そして必要に応じたその他変換の適用が必要です。
- フローにR Tranformation Step(変換ステップ)を使用し、これを設定します。(ステップの設定方法は、以下の情報を参照してください。)
- Step(ステップ)を実行し、スクリプトがデータを使用して生成する出力を確認します。Yellowfinのデータトランスフォーメーションモジュールを使用して、トランスフォーメーションフローを作成します。これには、モジュールへのデータインポートと、必要に応じて、その他トランスフォーメーションの適用が必要です。
- フローにRトランスフォーメーションステップを使用し、これを設定します。(ステップの設定方法は、以下の情報を参照してください。)
- ステップを実行し、スクリプトがデータを使用して生成する出力を確認します。
データ包括モードのタイプ
Rモデル予測ステップにより生成される結果は、以下のオプションに応じます。
- 追加:追加は、既存のデータにカラム(列)が追加された場合に使用されます。このオプションは、Rスクリプトが追加されたカラム(列)とともに、元のデータを返すようにデザインされている場合に使用されます。追加は、既存データにカラム(列)が追加された場合に使用されます。このオプションは、Rスクリプトが追加されたカラム(列)とともに、元のデータを返すようにデザインされている場合に使用されます。
- 置き換え:スクリプトが特定のカラム(列)を出力し、元のデータを返す必要のない場合にこちらのオプションを使用します。
...
こちらはスクリプトの内訳と、それをYellowfin内でどのように設定するのかを示しています。
- yfData:yfDataは入力データを含むデータフレーム、またはスクリプトの前のステップから渡されるデータです。これは、Step(ステップ)の設定時に、入力変数として提供する名前です。yfData:yfDataは入力データを含むデータフレーム、またはスクリプトの前のステップから渡されるデータです。これは、ステップの設定時に、入力変数として提供する名前です。
- yfData[1]/yfData[3]:スクリプトはデータフレーム全体を入力し、カラム(列)1とカラム(列)3を追加します。こちらの例は、特定のデータカラム(列)を指定する場合のインデックスの使用方法を示しています。
- outData:出力変数の名前です。組み合わせられた結果は、こちらの変数へ保存されます。
これらの変数名は、R Step(ステップ)内でスクリプトを設定する際に使用します。(例を以下に示します)これらの変数名は、Rステップ内でスクリプトを設定する際に使用します。(例を以下に示します)
例2:置き換え
このスクリプトは、入力されるデータからひとつの数値カラム(列)のみを取得し、そのカラム(列)上で計算を実行するように記述されています。置き換えオプションは、このスクリプトを設定する際に使用します。
...
Rserveが実行されている最新バージョンのR(少なくともv3.4.0以降)を準備することを推奨します。最新バージョンは、こちらからダウンロードすることができます:https://cran.r-project.org/mirrors.html Rserveを実行するR環境にはRStudioの使用を推奨します。
以下のコマンドを参照して、Rインスタンスをセットアップしてください。
Windows端末上でのRの実行
- ローカルのWindows端末にRをインストールします。
R環境から以下のコマンドを実行します。(ローカルからRserveへアクセスするため)
Code Block install.packages("Rserve") #This installs Rserve package library(Rserve) #This loads Rserve package Rserve() #This starts Rserve
- コマンドの実行に成功すると、Rserveがインストールされ、起動します。これで、Rスクリプト Transformation Step(変換ステップ)を通して、Yellowfinへ統合する準備が整いました。コマンドの実行に成功すると、Rserveがインストールされ、起動します。これで、Rスクリプトトランスフォーメーションステップを通して、Yellowfinへ統合する準備が整いました。
以下のコマンドを使用して、Windows端末上でRserveを実行し、外部からのアクセスを有効にします。
Code Block run.Rserve(args=" --RS-enable-remote")
...
ターミナルから以下のコマンドを実行します。
Code Block sudo apt-get update sudo apt-get install r-base r-base-dev sudo apt-get install gdebi-core wget https://download1.rstudio.org/rstudio-0.99.896-amd64.deb sudo gdebi -n rstudio-0.99.896-amd64.deb
インストール後、以下のコマンドを実行してRを起動します。
Code Block sudo -i R
Rが起動したら、以下のコマンドを実行してRserveをインストールします。
Code Block install.packages("Rserve") #This installs Rserve package library(Rserve) #This loads Rserve package
- 外部からアクセスできるようにRを実行するためには、以下のステップを実行します。
- Rserveがインストールされたら、Rを停止します。
以下のコマンドを使用して、Rserveを起動します。
Code Block R CMD Rserve --RS-enable-remote --RS-port port
ここでポートは、Rを起動するポート番号を示します。
- コマンドの実行に成功すると、リモートからRへアクセスできるようになります。
Note |
---|
このTransformation Step(変換ステップ)を適切に機能させるためには、RインスタンスとRserveの適切なセットアップと実行が必要です。このトランスフォーメーションステップを適切に機能させるためには、RインスタンスとRserveの適切なセットアップと実行が必要です。 |
パート2:Transformation Flow(データ変換フロー)内でのRスクリプトの使用
...