因子分析にまつわるエトセトラ

マーケティングリサーチではアンケートデータに対して因子分析を行う機会があります。
20〜30年くらい前から多分行われているんでしょうかね。
なので、結構、昔の推定法を使っていたり、解釈の仕方がいびつだったり思える部分があります。
今日は個人的な見解のもとに因子分析にまつわるエトセトラをつらつらと書いてみます。

  • 推定法は何を使うのか?

最尤法とか主因子法、主成分法(というか主成分分析)とか色々選べますね。
一番スタンダードなのは最尤法だと思います。
主因子法を使っているケースも見かけるのですが、計算機の処理能力が十分に高い現代において使うメリットはさほどありません。
よく最尤法を使ってエラーが出たから推定法を変える、ということも見かけますが、その場合は往々にしてデータに問題があるので、推定法を変えるよりはデータ自体を吟味したほうがよいでしょう。

  • 因子分析をすると、今まで他ののアプローチでは見えてこなかった要因(因子、軸)が明らかになる?

表現の違いはあれど、こういうことが期待されるケースがあります。
基本的には観測変数間の共通性を分析していくので、劇的に新しい要因が見えてくることはないでしょう。
あるとすれば、分析者が何も考えずに変数を決めて、因子分析をするという稀有なケースでのみです。
というか、観測変数として分析に用いる変数を設定する場合には、仮説をもって設定を行うことが望ましいです。
(望ましいという言い方をしていますが、敢えて言うならマストである。)
時々、思いつくままに変数を設定して、因子分析をすることがありますが、大抵は当該事象を捉えるにあたって因子の概念が重複したり、明らかに概念が不足していたりします。
(ここらへんが世間でイメージされるデータマイニングの世界(実際のデータマイニングの世界と異なる)とアプローチが異なる部分です。)
なので、最低限の仮説は必要です。

  • 回転はどうすればいいの?

うーん、これは難しいです。
解釈の容易さとデータとの整合が結構トレードオフの関係にあるような気がします。
なので、明確には答えられません。
プロマックス回転(斜交回転)、バリマックス回転(直交回転)あたりがリサーチの現場では使われているでしょうか?
学術的には斜交回転が主流ですが・・・。

  • 因子分析にはいくつか種類があるの?

通常、因子分析と使われる場合は「探索的因子分析」を指すことが多いです。
一方で「検証的因子分析」というアプローチもあります。

細かい説明は流石にシンドイのでこちらの平易な文章で非常によくまとまっているページを参照ください(すばらしいです)。

どちらか一方を使うというよりは、「仮説構築→探索的因子分析でデータから導かれる因子構造を把握→仮説ブラッシュアップ→検証的因子分析でデータとの適合を確認する」というコンボで進めるのがよいでしょう。


ここで重要なのは、探索的因子分析でわかることはデータに依存するということです。データでとっている以上のことは導かれません。
なので、アンケートの場合はデータをとる前にMECEをしっかり考えて聴取する必要があります。
たとえば、商品カテゴリーに対するニーズが対象であれば、事前に想定されるニーズを思い描き、先行研究を引っ張りだし、専門家にインタビューし、ユーザーにも簡単に聞いてみて項目を考えるわけです。
「データをとったあとで、どうにかなるだろう」はどうにもなりません。
卒論を書く学生でも、定量分析の経験が浅い実務家も同じ過ちを犯しがちですが、これは重要なことだと思います。
(まぁ、実際は後だしじゃんけん的な因子分析をすることも多いですが。。。)

以上、あくまで私見をつらつらと。
今日はここまで。