予測市場と集合知研究部会に行ってきた

3/11(金)に開催の下記のセミナーに途中まで参加してきました。

途中に地震があったこともあり、最後まで聴くことはできませんでしたが(その日の顛末はコチラ。)


〇The 6th SIG PMKT Workshop


記憶が曖昧になっているところもありますが、サマリを。



■みんなの気分で株式市場が分かるか?(東大・和泉先生)
・【つかみ】ヘムライン指数⇒スカートの裾丈と景気の相関関係


twitterデータを使って、ダウ・ジョーンズを予測する。
 -twitterデータはPOMSという心理尺度で定量
 -FuzzyNeauralNetworkで予測(目的:DJNA、予測;過去のDJNAと過去のPOMS「平穏」尺度
 -予測精度は高いが、過去のDJNAの寄与率がかなり高い・・・。


掲示版データをつかって株価(?)予測
 -Yahoo!株式の投稿数や強気比率(IDX化)を用いて予測
 -SVM回帰
 -結果として、活発性は把握できる


・日銀月報をつかって予測
 -日銀金融経済月報
  -内容の一貫性が重視されている
  -数値に表れないメッセージを含んでいる
  -(感想:半構造化されているテキスト、といえる)
 -共起関係に基づく主要単語をPCA⇒Jaccard係数による共起関係の把握⇒言語ネットワークで特徴づけ
 -かなり当たる


■インターネット調査による世論観測実験(萩原氏)

・ネットを観測装置とし、経済現象や気象情報のように収集・分析する科学が必要


・現象がアナログ的
 -多様な方法・指標でデータが収集・分析される
 -因果関係の仮説を作り、検証することができる


・Macromill Daily
 -Gallup Dailyに着想を得る(1500call a day)
 -基本的にはフレームからランダムで抽出(サンプルに限りがある高齢層の重複比率はやや高い)
 -設問:内閣支持、政党支持、内閣の仕事ぶり、センチメント(8つの感情)
 -感情と支持率の関係(感情プライミング
 -選択肢にわからないを作る(女性の判断保留を検出)


世論調査と選挙予測(松田氏
・海外の論文では、世論調査に「コスト評価」の視点も加わっている

・朝日:電話調査増による訪問調査回収の減:調査員・フィールドの質も寄与している?

・有効回答と不能表の割合

・調査モード間の時系列回収率カーブ(累積)は、ほぼ同じ形状を描く

・郵送調査のエリア特性:面接は大都市になるほど回収率減るが、郵送はさほど影響なし

・TDM(Tailored Design Method:対象者優先仕様法)

RDD:08年福田改造内閣支持率
 -質問文:「改造」という言葉の有無
 -運用の違い:重ね聞き(答えない人に再度聴く)
 ⇒不支持と支持にGAP発生

・携帯電話限定層の影響:毎日10.11.26記事
 ⇒面接法による検証しているが・・・妥当?

・mixed-mode-survey:松田(2009)Journalism
 ⇒Paradox of Choice(選択肢が多いと決められない)が発生

沈黙の螺旋理論

(以上で退出)


■所感
和泉先生の話は非常に興味深く、もう少し細かいところまで聴いてみたくなる内容でした。日銀月報のように、「プロが書く」、「半構造化されている(必要な情報が漏れなく記載、時系列処理がしやすい)」データというのは、定量化⇒予測のチカラを発揮しそうです。


萩原さんの話は、Journalism1月号の内容とほぼ同一ですが、その細かいマインド面なども理解できるお話でした。既に次のステージにサービス展開を試みるとのお話もありましたので期待です。


松田さんのお話は、意外にも知られていない調査のTipsが沢山あり、非常に勉強になりました。是非、本にまとめていただけないかなぁ、と願います。


今日はここまで、