Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Anchor
top
top

...

Expand
title日付&時間

日付の外挿

指定した期間により、表に表示される日数範囲を延長します。期間内の日数、または単位の両方で定義することができます。

日付範囲内の日

選択した2つの日付カラム(列)間の日数を返します。

現在までの日数

選択した日付カラム(列)と現在の間の日数を返します。(期間の日数)

日付範囲内の月数日付範囲内の月

選択した2つの日付カラム(列)間の月数を返します。

現在までの月数

現在の日付と選択された日付の月数差です(期間の月数)。

期間平日数

選択した日から現在までの平日数を返します。

日付範囲内の年

選択した2つの日付カラム(列)間の年数を返します。

現在までの年数

選択した日付カラム(列)と現在の間の年数を返します。(期間の年数)

Expand
title統計

デシル(十分位数)

デシル(十分位数)は、結果を降順(10-1)に並べ十区分し、ランク付けしたもので、分散を見るために使用します。

偏差Deviation

平均からの偏差の数です。

線形回帰 (Linear Regression)

線形近似曲線は、シンプルな線形データの分析に適しています。データポイントが線形パターンを描くとすれば、そのデータは線形と考えられます。線形近似曲線は通常、一定の割合で増減していることを示します。

相加平均 (Mean)

数値一覧の算術平均(または、単なる平均)は、一覧内のすべてを合計した値を、一覧内のアイテム数で除算した値を示します。

中央値 (Median)

中央値は、サンプル、母集団、または確率分布の上半分と下半分を分ける値を示します。

最頻値 最頻度 (Mode)

最頻度は、データセット内で最頻の値を示します。

移動平均 (Moving Average)

移動平均の近似曲線は、データのパターンや傾向をより明確に示すために、データの変動をスムーズにします。

移動平均は、期間オプションで設定された特定数のデータポイントを平均し、その平均値を線で描くためのポイントとして使用します。

例えば、期間を2に設定した場合、最初の2つのデータポイントの平均が、近似曲線の最初のポイントとして使用されます。そして、二番目、三番目のデータポイントが、二番目のポイントとして使用される、という具合に曲線を形成していきます。

移動合計 (Moving Total)

直近のN期間の合計です。

単純予測 (Naïve Forecasting)

単純予測は、移動平均予測の特殊な形態で、平滑化に使用される期間を1に設定したものです。そのため、期間tの予測はシンプルに、期間t-1となります。

単純な予測モデルのため、ひとつの期間しか予測することができず、中長期間の予測ツールには適していません。

多項式回帰 (Polynomial Regression)

多項式近似曲線は、変動するデータの表示に使用される曲線です。例えば、大きなデータセットの増減を分析する場合に適しています。多項式の次数は、データの変動数や、描く曲線数(山や谷の数)により決まります。二次多項式近似曲線には通常、山と谷がひとつずつあり、三次多項式近似曲線には、ひとつか2つ、四次多項式近似曲線には、最大で3つあります。

四分位数 (Quartile)

四分位数は、結果を降順(4-1)に並べ四区分し、ランク付けしたもので、分散を見るために使用します。

標準偏差 (Standard Deviation)

標準偏差は、値のセットの分散の尺度です。これは、確率分布、確率変数、母集団、複数集合に適用することができます。

標準得点 (Standard Score)

標準得点は、平均値を上回る、もしくは下回る標準偏差数を示します。これにより、調査で頻繁に実施される様々な正規分布での観測と比較することができます。

階段状回帰(Stepped Regression)  指定されたカラム(列)に対して、階段関数を実装します。
傾向(Trend)  日付期間の延長線上に、メトリック(数値)の傾向を表示します。
三重指数平滑法(Triple Exponential Smoothing)入力されたデータセットに基づき、三重指数平滑法の結果を返します。

差異Variance

データセット間の差を返します。

加重移動平均Weighted Moving Average

より新しい値に重きをおいた、加重移動平均を返します。

...

Expand
titleクリックして展開する

Yellowfinは、高度な関数を使用することで、Rスクリプトをレポートビルダーに統合することができます。

  1. Yellowfin-R jar」をダウンロードし、Yellowfin/appserver/webapps/ROOT/WEB-INF/libへコピーします。
  2. R」をダウンロードして、インストールします。
  3. Rserve」をインストールします。Rserveは、TCP/IPサーバーであり、Rを初期化したり、Rライブラリーへのリンクを必要とすることなく、他のプログラムが、様々な言語からRの機能を使用することを許可します。以下のコマンドを使用します。   install.packages("Rserve")
    install.packages("magrittr")
    install.packages("rattle") (linux requires special installation)
  4. Rserve」を起動します。YellowfinがRに接続するためには、Rserveが起動していなくてはいけません。Rコンソールで、以下のコマンドを入力します。
    library(Rserve)
    Rserve()
  5. Rスクリプトのために、「RSCRIPT_PATH」を定義します。すべてのRスクリプトは、ユーザーのために、閲覧、編集権限のあるディレクトリに配置しなくてはいけません。RSCRIPT_PATHディレクトリを指定する、環境変数を設定します。例:
    RSCRIPT_PATH=/home/foo/Rscripts

...

Expand
titleクリックして展開する

YellowfinにRスクリプトを理解させ、実行させるためには、以下に記載されているように、若干異なるスクリプト構造を使用します。

サンプルスクリプト、<R_file_name>.Rを見てみましょう。Yellowfinから渡された入力パラメーターは、<R_file_name>.R.input.csvで利用可能になります。処理が進むと、Rスクリプトは、結果(ひとつのカラム(列)のみ)を<R_file_name>.R.result.csv に書き込みます。

以下は、Neural NetworksのためのRスクリプトのサンプルです。こちらのスクリプトをコピーすれば、エラーを発生することなくRが動作します。

Code Block
titleSample R-Script : neural-net-script.R
setwd("C:/R/R-3.2.3/bin/x64")
library(rattle)   #
To access the weather dataset and utility commands.
library(magrittr) # For the
%>% and %<>% operators.
building <- TRUE
scoring  <- ! building
# A pre-defined value is used
to reset the random seed so that results are repeatable.
crv$seed <- 42 
# Load the data.
rPATH  <-
Sys.getenv("RSCRIPT_PATH")
rINPUT <- paste0(rPATH ,"/neural-net-script.r.input.csv")
rOUTPUT <- paste0(rPATH
,"/neural-net-script.r.result.csv")
dataset <-
read.csv(file=rINPUT, header=FALSE, sep=",")
# Note the user
selections. 
# Build the
training/validate/test datasets.
set.seed(crv$seed) 
crs$nobs <- nrow(dataset) #
366 observations 
crs$sample <- crs$train
<- sample(nrow(dataset), 0.7*crs$nobs) # 256 observations
crs$validate <-
sample(setdiff(seq_len(nrow(dataset)), crs$train), 0.15*crs$nobs) # 54
observations
crs$test <-
setdiff(setdiff(seq_len(nrow(dataset)), crs$train), crs$validate) # 56
observations
# The following variable
selections have been noted.
crs$input <-
c("V1", "V2", "V3", "V4","V5")
crs$target 
<- "V6"
#============================================================
# Neural Network 
#============================================================
# Build a neural network model
using the nnet package.
library(nnet, quietly=TRUE)
# Build the NNet model.

set.seed(199)
crs$nnet <-
nnet(as.factor(V6) ~ .,data=dataset[crs$sample,c(crs$input, crs$target)],size=10,
skip=TRUE, MaxNWts=10000, trace=FALSE, maxit=100)
#============================================================
# Score a dataset. 
#============================================================
# Obtain probability scores for
the Neural Net model on weather.csv [validate].
#crs$pr <- predict(crs$nnet,
newdata=dataset[crs$validate, c(crs$input)], type="class")
#crs$pr <- predict(crs$nnet,
newdata=dataset[crs$validate, c(crs$input)], type="class")
crs$pr <- predict(crs$nnet,
newdata=dataset, type="class")
write.table(crs$pr,
file=rOUTPUT, row.names=FALSE, col.names = FALSE)

Rスクリプトの呼び出し

Expand
titleクリックして展開する

一度インストールをすれば、高度な関数メニューから、こちらの機能を使用することができます。

関数の適用

レポートビルダー -

...

データステップ

高度な関数を適用する場合、まず始めに、関数を適用するフィールドを表に追加しなくてはいけません。関数を適用する場合、表内にフィールドのコピーが2つ必要になることがあります。ひとつは元の値(売上額、など)を表示するため、もうひとつは関数(例えば、売上額の最上位から10位を表示、など)を適用するために必要です。

...

  1. 以下のいずれかの方法で、フィールドドロップダウンメニューを開きます。


    1. カラム(列)/ロウ(行)一覧から
    2. 表のプレビューから
  2. 一覧から「高度な関数」オプションを選択し、高度な関数表示を開きます。
  3. 以下の関数オプションを入力します。
    1. フィールドに適切な集計を適用します。これにより、必要なすべての集計の最上位にこの関数が適用されます。
    2. 分析」、「統計」、「統計関数」、および「テキスト」から、使用する関数タイプを選択します。」から、適用したい関数タイプを選択します。
    3. 一覧から、使用する関数名を選択します。選択すると、関数の横にその説明が表示されます。一部の関数には追加のパラメーターが必要です。追加のパラメーターは、関数を選択した後に定義する必要があります。一覧から、使用したい関数名を選択します。関数名を選択すると、その関数の説明が、横のボックスに表示されます。いくつかの関数は、関数を選択してから、パラメーターの定義を要求されます。
    4. 関数が「グラフ」ページにのみ表示されるように設定することもできます。これにより、関数を適用するフィールドの追加のコピーを表示目的で作成する際に、追加のフィールドで表が煩雑にならないようにすることができます。関数を「グラフ」ページにのみ表示されるように設定することもできます。これにより、関数を適用するフィールドの追加のコピーを表示目的で作成する際に、追加のフィールドで表が煩雑にならないようにすることができます。
  4. 定義したら、「保存」をクリックして関数を適用します。

レポートビルダー -

...

グラフステップ

レポートビルダーの「グラフ」ステップから、表内のフィールドに関数を適用するには、以下の手順を実行します。レポートビルダーのグラフステップから、表のテーブルに関数を適用する場合は、以下の手順を実行します。

  1. 画面の左下部にある「+」ボタンをクリックします。
  2. 高度な関数」を選択して、使用するフィールドを一覧から選択し、「高度な関数」表示を開きます。
  3. 関数オプションを入力します。
    a. フィールドに適切な集約を適用します。これにより、必要なすべての集約の最上位に、この関数が適用されます。
    b. 「分析」、「統計」、「テキスト」から、適用したい関数タイプを選択します。
    c. 一覧から、使用したい関数名を選択します。関数名を選択すると、その関数の説明が、横のボックスに表示されます。いくつかの関数は、関数を選択してから、パラメーターの定義を要求されます。
    d. 関数を「グラフ」ページのみに表示するように設定することもできます。これにより、表示目的で関数を適用するフィールドのコピーを追加する場合に、追加されたフィールドで表を煩雑にすることがありません。
  4. .関数の定義が完了したら、「保存」ボタンをクリックして、適用します。

...

  1. フィールドのドロップダウンメニューを開きます。
  2. 高度な関数」を選択し、関数を適用するフィールドを選択して、高度な関数表示を開きます。
  3. 関数オプションを入力します。
    関数オプションを入力します。aa. フィールドに適切な集約を適用します。これにより、必要なすべての集約の最上位に、この関数が適用されます。b フィールドに適切な集約を適用します。これにより、必要なすべての集約の最上位に、この関数が適用されます。
    b. 「分析」、「統計」、「テキスト」から、適用したい関数タイプを選択します。c. 一覧から、使用したい関数名を選択します。関数名を選択すると、その関数の説明が、横のボックスに表示されます。いくつかの関数は、関数を選択してから、パラメーターの定義を要求されます。d」から、適用したい関数タイプを選択します。
    c. 一覧から、使用したい関数名を選択します。関数名を選択すると、その関数の説明が、横のボックスに表示されます。いくつかの関数は、関数を選択してから、パラメーターの定義を要求されます。
    d. 関数を「グラフ」ページのみに表示するように設定することもできます。これにより、表示目的で関数を適用するフィールドのコピーを追加する場合に、追加されたフィールドで表を煩雑にすることがありません。
  4. 関数の定義が完了したら、「保存」ボタンをクリックして、適用します。

    データ変換の適用

以下の手順を実行することで、フィールドのデータを変換することができます。

  1. 前述のセクションで説明したように、「高度な関数」表示を開きます。

  2. 「データ変換」タブを選択します。適用する変換の種類を選択するインターフェースが表示されます。

  3. 変換に適した集計を選択します。上記で説明されているように、「高度な関数」表示を開きます。

  4. データ変換」タブを選択します。 こちらの画面から、変換したいデータを選択します。

  5. 変換に適切な集約を選択します。

  6. 追加」ボタンをクリックし、変換を選択して適用します。これで、選択したデータタイプに使用可能な変換の一覧が表示されます。デフォルトでは、Java date converterとNumeric divide convertor(1000で除算することができるなど)のコンバーターが組み込まれています。

  7. 画面に表示されるコンバーターの指示に従って操作し、「画面の指示に従って操作し、「保存」をクリックします。」ボタンをクリックします。

  8. 注意:必要に応じて、「追加」リンクをクリックして新しいタイプを作成すれば、複数のコンバーターをデータタイプに追加することができます。必要に応じて、「追加」ボタンをクリックして新しいタイプを作成することで、複数のコンバーターをデータに追加することができます。