データ解析をしてみる(分析編1)|M-1の信頼性は?
さて、今日からは本題に入っていきたいと思います。
一般化可能性理論に基づいた信頼性の評価です。
今回はフリーパッケージの「R」を用いて分析したいと思います。
(Rについてはココなどをもとにダウンロードしてみてください。)
利用するデータはコレm1_2010.dat です。
半帖庵さん記載の審査員×演者の2元データを構成しなおしています。
審査員(judge)は7人(J1-J7)、演者(subject)は9人(S1-S9)です。
valueには100点満点の得点が入っています。
このデータをもとにまずは分散の推定を行い、その後信頼性を計算します。
今回のプログラムは「無料統計ソフトR(CRAN)で心理学」さんのプログラムに手を加えて作成しました。
まずは今回推定に利用するパッケージを読み込みます。
(事前にCRANなどからインストールが必要です。)
##パッケージの読込
library(lme4)
その後、データを読み込みます。
(事前にディレクトリを指定くださいね。)
##データの読み込み
dat <- read.table("m1_2010.dat", header=T)
dat
さて、ここから分散成分の推定に入るわけですが、今回は以下を想定します。
- 演者は沢山いる演者の母集団から抽出された標本である
- 審査員は沢山いる審査員の母集団から抽出された標本である
こういう考え方を変量モデルといいます。
この変量モデルのもとで分散成分を推定します。
(なお、演者と審査員の交互作用は測定の反復がないため考えません。)
推定プログラムは以下の通りです。
##2因子変量モデルの分散成分
mod1 <- lmer(value ~ 1 + (1|judge) + (1|subj), data=dat)
mod1##分散成分の抽出(G研究)
varcomp <- VarCorr(mod1)output <- rep(NA, length(varcomp)+1)
for(i in 1:length(varcomp)){
output[i] <- varcomp [ [ i ] ][,1]
}
names(output) <- c(names(varcomp), "Residual")
output <- sort(output, na.last=T, decreasing=T)
output["Residual"] <- attr(varcomp, "sc")1^2
上記を実行したあとに、
>output
を実行すると分散成分が出力されます。
これで分散成分が推定されました。
ここからはD研究(信頼性の計算)です。
ここまでの段階では、
得点の分散=演者の分散+審査員の分散+誤差分散
となります。
しかし、M−1の場合、「全ての演者の漫才に同一の審査員が点数を評価」します。
この場合、審査員は変量ではなく母数として扱うため、
得点の分散=演者の分散+誤差分散
となります。
これを元に信頼性係数を構成すると
信頼性係数=演者の分散/(演者の分散+(誤差分散/審査員の人数))
となります。
誤差分散を審査員の人数で割るのは、審査員の人数の平均値の分散を用いるためです。
これをRで実行すると、
##信頼性の推定(D研究)
var.a <- output[ ["subj"] ]
var.e <- output[ ["Residual"] ]
reliability1 <- function(b){
denom <- var.a + var.e / (b)
alpha1 <- var.a / denom
return(alpha1)
}
reliability1(b=7)
となります。
この結果、返される値が
0.9327869
です。
これが信頼性係数です。
分散成分を推定したときの水準数(審査員の数)とD研究のときの水準数が同一のときを「クロンバックのα係数」といいます。
昨日のエントリーで述べた学力テスト(だいたい0.85~0.90)とほぼ同様の信頼性係数ということです。
M−1の評価は思っていた以上に、(今回の検討の枠組みでは)信頼性がある、といえるのではないでしょうか?
今日はここまで。