第28回Tokyo.Rに参加してきた

先週土曜日にTokyo.Rへ行ってきました。
最近のデータ解析への注目も相まって、前回参加させていただいたときより人数の規模が非常に大きくなっていました。。。

今回で28回目、丸3年続けているとのことで、@yokkunsさんや運営に携わっている方々には本当に頭が下がります。
単純に情報交換だけでなく、モチベーションの維持・高揚→アクションの流れを参加者自身の内部で起こるなど、R言語というよりもデータ解析業界への貢献は非常に大きいのではと思います。
ますますの発展をお祈りする次第です。


さて、僕の今回の目的は@dichikaさんの欠測データ処理の話でした。
期待どおりの内容で、講演や資料は欠測データ処理の基本的な考え方が無駄なく整理されていて、自分の中の断片的な知識が統合されたように感じました。
(いや、もっとはやく自分の中で勉強して統合したほうがよかったわけですが。。。)


この発表から感じたのが以下のツイート。

欠測データ処理はデータの量が多いと意味が薄くなるように見えるが、収集時に起こっているメカニズムの問題なのでどんなデータでも検討すべきである、と再認識。


データが豊富にあったりして、かつ先験的な当該データに対する知識がないとついついリストワイズ削除したくなるわけです。
とはいえ、欠測パターン&その背後の現象に目を向けていないと「おや?」と思うことになりがちです(まぁ、問題が大きい場合は相当おかしい感じに結果がなっていきますので、稀でありますが。)
欠測処理の方法論そのものも重要なわけですが、その前提として、欠測パターンやその影響度を論理的に評価することの重要性を改めて感じた次第です。


@sanoche16さんのブランドエクイティ理論の枠組みに則った評価サイトテキスト整理→スコアリング分析紹介も興味深かったです。


なんだかあの場でコメントするのは憚られたのですが、本分析の枠組みが既存のエクイティ評価の代替となりえるかはなかなか難しいところです。
(理由はいくつかありますが、興味のターゲット層と評価サイト書込者のズレや、検討したい視点でデータが集めにくい場合があることなどがあげられるでしょう。)


ただ、このアプローチの魅力はその問題を超えると思っていて、CBBEに基づいた整理情報からはブランド戦術見直しの上での視点やHowtoactのタネが得られやすいのではと思います。
ただ羅列されている情報ではなく、特定の枠組みの則って整理されていること(逆に言えばただそれだけで)、「使える」度合は大きく変化するように思います。


意図されていて、なのか結果としてなのかはわかりませんが、発表された視点は実践的に面白い内容と感じました。


@wdkzさんのShinyについての内容は、非エンジニアの僕は半分以上落伍していたのですが、「結果としてできること」に思わずおぉっ、と驚いてしまいました。


表現の幅(ビジュアル的な意味ではなく)が拡張することで、僕自身が今までハードル高いと思っていたことが「できやすい環境が整いつつある」ことを肌で感じました。


@yokkunさんの階層ベイズの話では、僕自身が階層ベイズの理解で足りていない所を気付けました。
対象者毎の反復測定状況を僕はあまり考慮していなかったのですが、質疑応答の中のチョロっとしたコメント内容にハッと気付くことがあり。。。
やはり、手を動かしてみないとダメだなぁ、と。


懇親会では@bob3bob3さんや@dichikaさんに何人かご紹介いただき、色々と刺激をいただくことができました。
(非エンジニア&面白い話題を提供できない僕にはこうしたつながりが非常にありがたく。。。)


ありがとうございました!