Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Anchor
top
top

...

Expand
title統計


デシル(十分位数)

デシル(十分位数)は、結果を降順(10-1)に並べ十区分し、ランク付けしたもので、分散を見るために使用します。

偏差Deviation

平均からの偏差の数です。

線形回帰 (Linear Regression)

線形近似曲線は、シンプルな線形データの分析に適しています。データポイントが線形パターンを描くとすれば、そのデータは線形と考えられます。線形近似曲線は通常、一定の割合で増減していることを示します。

相加平均 (Mean)

数値一覧の算術平均(または、単なる平均)は、一覧内のすべてを合計した値を、一覧内のアイテム数で除算した値を示します。

中央値 (Median)

中央値は、サンプル、母集団、または確率分布の上半分と下半分を分ける値を示します。

最頻度 (Mode)

最頻度は、データセット内で最頻の値を示します。

移動平均 (Moving Average)

移動平均の近似曲線は、データのパターンや傾向をより明確に示すために、データの変動をスムーズにします。

移動平均は、期間オプションで設定された特定数のデータポイントを平均し、その平均値を線で描くためのポイントとして使用します。

例えば、期間を2に設定した場合、最初の2つのデータポイントの平均が、近似曲線の最初のポイントとして使用されます。そして、二番目、三番目のデータポイントが、二番目のポイントとして使用される、という具合に曲線を形成していきます。

移動合計 (Moving Total)

直近のN期間の合計です。

単純予測 (Naïve Forecasting)

単純予測は、移動平均予測の特殊な形態で、平滑化に使用される期間を1に設定したものです。そのため、期間tの予測はシンプルに、期間t-1となります。

単純な予測モデルのため、ひとつの期間しか予測することができず、中長期間の予測ツールには適していません。

多項式回帰 (Polynomial Regression)

多項式近似曲線は、変動するデータの表示に使用される曲線です。例えば、大きなデータセットの増減を分析する場合に適しています。多項式の次数は、データの変動数や、描く曲線数(山や谷の数)により決まります。二次多項式近似曲線には通常、山と谷がひとつずつあり、三次多項式近似曲線には、ひとつか2つ、四次多項式近似曲線には、最大で3つあります。

四分位数 (Quartile)

四分位数は、結果を降順(4-1)に並べ四区分し、ランク付けしたもので、分散を見るために使用します。

SPC - 関数(SPC - Functions)関数ユーザー定義の機能を追加した、高度な移動平均機能です。
  • 信頼度の上限値と下限値を表示
  • 移動平均から指定した標準偏差を加算または減算することで、外れ値をハイライト表示。
SPC - ステップの変化(SPC - Step Change)ステップの変化ユーザーが設定した値だけ、データが平均値の上または下に移動したことを検出します。

標準偏差 (Standard Deviation)

標準偏差は、値のセットの分散の尺度です。これは、確率分布、確率変数、母集団、複数集合に適用することができます。

平均値からの標準偏差(Standard Deviation from Mean)選択されたフィールドの平均値から離れた標準偏差の各値の数を計算します。また、選択したしきい値に基づき値を削除します。

標準得点 (Standard Score)

標準得点は、平均値を上回る、もしくは下回る標準偏差数を示します。これにより、調査で頻繁に実施される様々な正規分布での観測と比較することができます。

デジタル回帰(Digital Regression)指定されたカラム(列)に対して、階段関数を実装します。
傾向(Trend)日付期間の延長線上に、メトリック(数値)の傾向を表示します。
三重指数平滑法(Triple Exponential Smoothing)入力されたデータセットに基づき、三重指数平滑法の結果を返します。

分散(Variance)

データセット間の差を返します。データセット間の分散を返します。

加重移動平均Weighted Moving Average

より新しい値に重きをおいた、加重移動平均を返します。


...

Expand
titleクリックして展開する

YellowfinにRスクリプトを理解させ、実行させるためには、以下に記載されているように、若干異なるスクリプト構造を使用します。

サンプルスクリプト、<R_file_name>.Rを見てみましょう。Yellowfinから渡された入力パラメーターは、<R_file_name>.R.input.csvで利用可能になります。処理が進むと、Rスクリプトは、結果(ひとつのカラム(列)のみ)を<R_file_name>.R.result.csv に書き込みます。

以下は、Neural NetworksのためのRスクリプトのサンプルです。こちらのスクリプトをコピーすれば、エラーを発生することなくRが動作します。

Code Block
titleSample R-Script : neural-net-script.R
setwd("C:/R/R-3.2.3/bin/x64")
library(rattle)   #
To access the weather dataset and utility commands.
library(magrittr) # For the
%>% and %<>% operators.
building <- TRUE
scoring  <- ! building
# A pre-defined value is used
to reset the random seed so that results are repeatable.
crv$seed <- 42 
# Load the data.
rPATH  <-
Sys.getenv("RSCRIPT_PATH")
rINPUT <- paste0(rPATH ,"/neural-net-script.r.input.csv")
rOUTPUT <- paste0(rPATH
,"/neural-net-script.r.result.csv")
dataset <-
read.csv(file=rINPUT, header=FALSE, sep=",")
# Note the user
selections. 
# Build the
training/validate/test datasets.
set.seed(crv$seed) 
crs$nobs <- nrow(dataset) #
366 observations 
crs$sample <- crs$train
<- sample(nrow(dataset), 0.7*crs$nobs) # 256 observations
crs$validate <-
sample(setdiff(seq_len(nrow(dataset)), crs$train), 0.15*crs$nobs) # 54
observations
crs$test <-
setdiff(setdiff(seq_len(nrow(dataset)), crs$train), crs$validate) # 56
observations
# The following variable
selections have been noted.
crs$input <-
c("V1", "V2", "V3", "V4","V5")
crs$target 
<- "V6"
#============================================================
# Neural Network 
#============================================================
# Build a neural network model
using the nnet package.
library(nnet, quietly=TRUE)
# Build the NNet model.

set.seed(199)
crs$nnet <-
nnet(as.factor(V6) ~ .,data=dataset[crs$sample,c(crs$input, crs$target)],size=10,
skip=TRUE, MaxNWts=10000, trace=FALSE, maxit=100)
#============================================================
# Score a dataset. 
#============================================================
# Obtain probability scores for
the Neural Net model on weather.csv [validate].
#crs$pr <- predict(crs$nnet,
newdata=dataset[crs$validate, c(crs$input)], type="class")
#crs$pr <- predict(crs$nnet,
newdata=dataset[crs$validate, c(crs$input)], type="class")
crs$pr <- predict(crs$nnet,
newdata=dataset, type="class")
write.table(crs$pr,
file=rOUTPUT, row.names=FALSE, col.names = FALSE)


Rスクリプトの呼び出し

Expand
titleクリックして展開する

一度インストールをすれば、高度な関数メニューから、こちらの機能を使用することができます。

...