予測市場と集合知研究部会に行ってきた
3/11(金)に開催の下記のセミナーに途中まで参加してきました。
途中に地震があったこともあり、最後まで聴くことはできませんでしたが(その日の顛末はコチラ。)
記憶が曖昧になっているところもありますが、サマリを。
■みんなの気分で株式市場が分かるか?(東大・和泉先生)
・【つかみ】ヘムライン指数⇒スカートの裾丈と景気の相関関係
・twitterデータを使って、ダウ・ジョーンズを予測する。
-twitterデータはPOMSという心理尺度で定量化
-FuzzyNeauralNetworkで予測(目的:DJNA、予測;過去のDJNAと過去のPOMS「平穏」尺度
-予測精度は高いが、過去のDJNAの寄与率がかなり高い・・・。
・掲示版データをつかって株価(?)予測
-Yahoo!株式の投稿数や強気比率(IDX化)を用いて予測
-SVM回帰
-結果として、活発性は把握できる
・日銀月報をつかって予測
-日銀金融経済月報
-内容の一貫性が重視されている
-数値に表れないメッセージを含んでいる
-(感想:半構造化されているテキスト、といえる)
-共起関係に基づく主要単語をPCA⇒Jaccard係数による共起関係の把握⇒言語ネットワークで特徴づけ
-かなり当たる
■インターネット調査による世論観測実験(萩原氏)
・ネットを観測装置とし、経済現象や気象情報のように収集・分析する科学が必要
・現象がアナログ的
-多様な方法・指標でデータが収集・分析される
-因果関係の仮説を作り、検証することができる
・Macromill Daily
-Gallup Dailyに着想を得る(1500call a day)
-基本的にはフレームからランダムで抽出(サンプルに限りがある高齢層の重複比率はやや高い)
-設問:内閣支持、政党支持、内閣の仕事ぶり、センチメント(8つの感情)
-感情と支持率の関係(感情プライミング)
-選択肢にわからないを作る(女性の判断保留を検出)
■世論調査と選挙予測(松田氏
・海外の論文では、世論調査に「コスト評価」の視点も加わっている
・朝日:電話調査増による訪問調査回収の減:調査員・フィールドの質も寄与している?
・有効回答と不能表の割合
・調査モード間の時系列回収率カーブ(累積)は、ほぼ同じ形状を描く
・郵送調査のエリア特性:面接は大都市になるほど回収率減るが、郵送はさほど影響なし
・TDM(Tailored Design Method:対象者優先仕様法)
・RDD:08年福田改造内閣支持率
-質問文:「改造」という言葉の有無
-運用の違い:重ね聞き(答えない人に再度聴く)
⇒不支持と支持にGAP発生
・携帯電話限定層の影響:毎日10.11.26記事
⇒面接法による検証しているが・・・妥当?
・mixed-mode-survey:松田(2009)Journalism
⇒Paradox of Choice(選択肢が多いと決められない)が発生
・沈黙の螺旋理論
(以上で退出)
■所感
和泉先生の話は非常に興味深く、もう少し細かいところまで聴いてみたくなる内容でした。日銀月報のように、「プロが書く」、「半構造化されている(必要な情報が漏れなく記載、時系列処理がしやすい)」データというのは、定量化⇒予測のチカラを発揮しそうです。
萩原さんの話は、Journalism1月号の内容とほぼ同一ですが、その細かいマインド面なども理解できるお話でした。既に次のステージにサービス展開を試みるとのお話もありましたので期待です。
松田さんのお話は、意外にも知られていない調査のTipsが沢山あり、非常に勉強になりました。是非、本にまとめていただけないかなぁ、と願います。
今日はここまで、