予測と記述のはざま

ちょっと前の記事でも紹介しましたがルグランさんがAKB総選挙の予測をしていました。
もちろん順位を事前に予測しようという試みが興味を引くのもあるのですが、どういう変数を投入し、どういうモデルが作られているか、結果として推定された各変数のウェイトはどのくらいなのかにデータ分析に携わるものとしては興味があるわけです。


予測は「当てる」ことに意味が大きいですが、同時に予測モデルを利用して意思決定をする人間にとっては納得性も重要となります。
「今まで当たってるし、これからも当たりますよ」というわけにはいかず、「何故このモデルだと現象を説明できるか」をロジカルに場合に寄っては定性的な情報を踏まえて記述することが重要になります。
非常に複雑なモデルを組めば予測精度を高めることはできますが(データに過剰適応する可能性も大きいですが)、わかりやすい記述は難しくなります。
逆もまた然りです。


また記述においては、現象の背後における要因に関するの知識・経験則、論理的思考力が非常に重要になってきます。
当該事象を予測する上で考慮するのに望ましい要因をピックアップしきれているか。
あるいは、要因間の相互関係はどのようになっているのか。
特定の領域に特化したアナリストの場合、この辺りは個人でカバーすることができますが、広い領域を扱う場合は複数人の知見を集合させる必要があります。
こうなると所謂データ解析スキルだけではどーにもなりにくいところがありますね。


こうした予測と記述の狭間で思考し、意義のあるアウトプットを提供するというのは、様々な知恵を絞る必要がありますが、分析屋さんにとっては一番の見せ所であり、自己研鑽になるのだなぁ、と最近とみに感じております。


今日はここまで。