データ解析をしてみる(分析編3)|フィギュアとM−1

さて、まずはフィギュアの「スケート技術」の信頼性を求めてみます。


データはコチラ
figure.dat 直
です。


データの形式は審査員×スケーターの2元データです。
審査員(judge)は7人(J1-J7)、スケーター(subject)は23人(S1-S23)です。
valueには得点が入っています。
審査員はM−1と同じ数です。
スケーターにはもちろん、安藤美姫浅田真央が含まれています。
(データ入力してて気づいたのですが、武田奈也って参加していなかったのですね。調べると、怪我してしまっている様子・・・。すごく好きなんですけど。。。)


このデータについて信頼性係数を求めてみましょう。
プログラムは12・29のエントリーで記載したものとほぼ同様です。


実際に求めてみると、信頼性係数は

0.9847685

となります。


M−1の信頼性係数は約0.93でしたから、フィギュアのスケート技術評価の信頼性はかなり高いと言えるでしょう。


さて、一般化可能性理論の枠組みでもう少し検討を深めてみましょう。


信頼性の計算過程を行う「D研究」において、審査員を増やして信頼性係数をもとめると、増やす前に比較して係数は高くなります。
審査員を増やすほど評価が安定してくるわけです。


ではここからは「M−1グランプリの信頼性をフィギュアの技術評価と同じ程度に高めるにはどのくらいの審査員の数が必要か」を検討したいと思います。


M−1の信頼性係数を算出プログラムの

reliability1(b=7)

b=7の数値(ここでは7人の審査員)を変化させることで、審査員の数を増やしたときの信頼性係数を得ることができます。



フィギュアの技術評価と同じ水準まで信頼性を高めるためには、審査員を30人くらいに増やさないといけないようです。
壮観ですね(笑)


当然、競技によって必要とされる信頼性の高さが違うわけですから、30人に増やす必要性はあまりないでしょう。
あくまで今回の検討は複数競技間の信頼性比較の一例です。
フィギュアの審査の詳細はあまりよくわかりませんが、もしかしたら評価視点はある程度構造化されているのかもしれません。
その場合は信頼性も高くなりやすいですから、M−1の評価構造とは大きく違うと言えるでしょうね。


今年はここまで。