4月20日:疫学=WiKi学?(Plos Computational Biology4月号掲載論文)
2014年4月20日
今日紹介する論文は誰もが膝を打つ。インフルエンザの流行予測は社会にとって重要なテーマであり、様々なモニターシステムが生まれている。我が国では厚労省が定期的に直前のインフルエンザ発生状況を公表している。ただ残念ながら1週間程度の時間差が生じるのは仕方ない。これに対する新しい方法として、グーグルはインフルエンザを調べるネットへのアクセス回数を処理してインフルエンザの流行をリアルタイムで調べる方法を開発し、Google Flu Trendサイトに情報を提供している。しかし、情報処理については全てグーグルの手の中で、例えば行政が利用するのは困難だ。今日紹介する論文は病気が増えるとその病気についてのサイトへのアクセスがリアルタイムで増える事を利用して流行を予測しようとしている点ではGoogle Flu Trendとアイデアは同じだ。違いは、アクセス回数も含めて全てが公開されているWikipediaを使う点で、自分で情報処理が出来る点で、処理方法がより透明になる。論文はハーバード大学のグループからフリーアクセス雑誌の一つPlos Computational Biologyに掲載された。タイトルは「Wikipedia usage estimates prevalence of influenza-like illness in the United States in Near Real-Time(Wikipediaを使って、インフルエンザ様病気のアメリカでの流行をほぼリアルタイムで測定する)」だ。研究は簡単で、Wikipediaにある16種類のサイトのアクセスを処理するアプリケーションを開発し、それから予測されるインフルエンザ様疾患の流行状態と、政府情報、Google Flu Trendを2007年から2013年まで比較している。さて結果だが、少なくともアメリカ合衆国ではWikipediaの公開情報を処理したアプリを使って予測した流行は政府発表とほとんど一致する。重要な事は政府発表がアメリカでは2週間後に示される事で、Wikipediaを使うと1日程度のずれで済んでしまう。また情報処理法が公開されていないGoogle Flu Trendと比べても予測率が約17%向上していると言う。Wikipediaでは情報が公開されているので、より素晴らしい予測アプリケーションを作れば更に正確な予測が可能になるだろう。この研究から学べるのは、情報が公開される事の重要性で、これにより始めて利用法は競争し合って改善していける。更に信頼できるしかしわかりやすい情報を提供するサイトの重要性だ。大事な時にアクセスされて初めて、新しい社会統計の核になる。疫学をWiki学にする新しいアイデアが我が国で噴出するのを夢見ている。