AASJホームページ > 新着情報 > 論文ウォッチ > 1月31日:何を隠したいのかを考える時代(1月30日号Science誌掲載論文)

1月31日:何を隠したいのかを考える時代(1月30日号Science誌掲載論文)

2015年1月31日

普通論文のイントロダクションには、研究の背景や、これまでの歴史など、著者の知識が示される。このおかげで、イントロダクションを読むと、それだけで物知りになる論文がある。今日紹介するマサチューセッツ工科大学、メディアラボからの論文は、匿名化されたビッグデータから個人を特定する可能性についての研究で、この分野全体の現状がよく分かるイントロダクションが書かれている。タイトルは「Unique in the shoping mall: On the re-identifiability of credit card metadata (ショッピングモールでのプライバシー:クレジットカードメタ情報の特定可能性について)」だ。タイトルにある通り、この論文ではクレジットカード情報の中から、特定の個人の行動を抜き出すには、どの程度の情報が必要かを調べている。まず、物知りになるのでイントロダクションに書かれている内容について紹介しよう。1)ビッグデータの解析が新しい科学、例えば計算社会学を生み、貧困や感染症の分析に使われている。2)会社もメタ情報の提供を進めており、例えばグーグルはリアルタイムの渋滞情報をドライバーに伝えている。3)この情報を科学として使うためには、情報公開が必要で、アメリカでは原則その方向に動いている。例えばボストンでは公共交通車両の全ての位置情報が提供されている。4)データは匿名化されているが、現在では自分の情報のツイートなどが当たり前で、携帯電話データも簡単に個人特定ができる。5)アメリカの個人支払いの60%はクレジットカードで、携帯電話での支払いも10億ドルに達しつつある。6)最後にこれが面白かったが、アメリカ人の89%はクレジットカードデータは個人情報として守られるべきと思っている一方、健康情報も同じように考えているのは68%、自分の居場所については62%。圧倒的に金銭的やりとりは隠したいようだ。これら全てに文献が引用されているので、このような論文は本当に助かる。さて、肝心の研究では、110万人、1万店舗、3ヶ月間分のクレジットカード全データの提供を受け、この中で特定の個人の情報を抜き出すための条件をシミュレーションしている。結果は予想通りで、例えば私がいつどこでいくらの買い物をしたかという情報が2回分わかれば(例えば尾行でもされて)60%の確率でビッグデータの中から私の情報を全て抜き出せるという結果だ。実際には5回分の情報があればほぼ100%特定できる。他にも、場所、時間、使った価格が不正確だった時のシミュレーション、男女差、収入との関係などを調べ、ある程度の情報で個人を抜き出せることを示している。まあなんとなく納得してしまうのは、女性や所得の多い方が特定しやすいという点だ。結論的には、ビッグデータも外から情報を加えると個人を特定できるという警告だが、それを踏まえてデータは公開されるべきだというのが著者の考えだ。私も全く同感だ。ゲノムも含むビッグデータにより、今全く新しい人類歴史学が始まろうとしているという実感を持つ。プライバシーは守るものという原則で私たちの社会は成り立っているようだが、ツウィッター、フェースブックを使った自己発信が当たり前になり、またドイツ首相のプライベート電話すら盗聴できる時代、私たちは何を隠したいのか、なぜ隠さなければならないのかなど真剣に考える時が来たと思う。


コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

*