4月23日ウェッブ利用社会統計(American Journal of Preventive Medicineオンライン版掲載論文)
2014年4月23日
4月20日Wikipediaを疾患や健康の社会統計に利用している論文を紹介した。今日はGoogle上の検索データの社会統計利用について紹介する。論文はAmerican Journal of Preventive Medicineオンライン版に掲載されたサンディエゴ州立大学の調査で、「What’s the healthiest day ?(何曜日が一番元気?)」がタイトルだ。調査ではGoogle上で検索できるhealthyから始まる言葉を検討し、この中から全く健康とは関係ない項目を除外する。その上で、健康関係の検索数を曜日毎にまとめ、検索数の曜日毎の変化を調べている。結果は明快。検索のピークは月曜日と火曜日で、その後徐々に検索数が低下し土曜日が最低になる。そして日曜日に入ると急に検索数が上がり月曜日へと上昇して行く。これが何を意味するのかはまだまだ解析が必要だ。いい仮説が思いつけば、違う検索ワードを使って検証できるかもしれない。おそらく、この結果を起点に面白い調査が進む事だろう。ただ、一般メディアの健康情報提供はアメリカでは水曜日に行われるそうだ。とすると社会のリズムとは逆のリズムで情報が提供されている事になる。今日本でもビッグデータ利用は流行語になるほどで、国も研究促進を図っている。ただ情報処理法の研究だけでは片手落ちだ。社会動態について柔軟な頭で問題や方法を探し出してくる人材の発掘が大事ではないかと思う。もう一つ重要なのはデータの公開だ。もしプライバシーと言う言葉でほとんどのデータが公開されなくなると、この分野の発展はない。21世紀こそ「私たちが何を隠したいと思うのか?なぜ隠したいのか?」を真剣に問う事から始めなければならない。