この論文を読むまで知らなかったが、Hedonometerという面白い言葉があるようだ。世界中に満ち溢れる言葉のビッグデータを分析して、世界全体の気分、すなわち幸福か憂鬱かを図るという意味に近い(と私は受け取っている)。ただ使用された言葉からHedonometerを作るとすると言葉の持つ気分の分析が必須だ。今日紹介するバーモント大学からの論文は、このための精密な分析ツール開発を行うと同時に、言葉が使われる社会の傾向を調べようとした研究で米国アカデミー紀要に掲載された。タイトルは「Human language reveals a universal positivity bias(言語から人間が普遍的に持つ陽性的傾向がわかる)」だ。まずこの研究が取り組んだのは、グーグルBook Projectや、Web Crowl, ツイッター、映画やテレビの字幕、新聞などから10の言語の中から10万語を抜き出し、それぞれの単語を50人の人に1−9段階(悲しい、憂鬱から幸福まで)に分類してもらっている。トータルで24の異なるコレクションについて単語の気分を調べているので、全体でおそらく1千万近いデータを集めたことになる。次に各コレクションに集まった単語の気分値の分布を比べている。どの言葉のコレクションでも、陽の気分を持つ単語の方が、陰の気分を持つ単語より多い。詳しく紹介するのは難しいが、各コレクションの平均値と分布を眺めているだけで面白く、妙に納得する。例えばツイッターから抽出した単語のコレクションで見ると、スペイン語やポルトガル語のツイッター陽性度は群を抜いている。一方、同じラテン語系でもフランスのツイッターでの気分度はドイツ語や英語とほとんど同じだ。一方、アジア代表で提示されているインドネシア、韓国のツイッターになると陽の気分は少し低下する。さらに両国で比べると韓国の方が陰だ。妙に納得できないだろうか?次に各言語を比べて、気分度に言語間の差はあまりないこと、また単語の気分度は使われる頻度とは無関係であることを確認している。これにより、Hedonometerのための基礎データが各言語で揃ったことになる。最後に、新しく構築された英語、ロシア語、フランス語のHedonometerで「白鯨」「罪と罰」「モンテクリスト伯爵」の3冊の小説を分析している。もちろん小説になると単語自体に複雑なニュアンスがあり様々な問題があるようだが、それでもモンテクリスト伯では小説が幸福な気分で終わる一方、白鯨や罪と罰では憂鬱な気分で終わることがよくわかる。これらの結果から、著者らは、各単語を取り出して気分度を測定した結果が、程度の差はあっても全ての言語で陽への傾向が見られたことは、人類の社会性自体の傾向を反映していると結論している。そして、さらに多くの言語でこのHedonometerを作成し、私たちの社会全体を分析したいと述べて論文を締めくくっている。読後、まず日本語のHedonometerを早く作って欲しいと思った。例えば国会の答弁、やじ、そして特定のテーマについてのツイッターやフェースブック、材料は山ほどある。そこから見える日本社会はどんなだろう。早く見てみたい。
確かに、妙に納得しています。
陽と陰の境目はどこになるのですか?
数値的に間の5ですか?
全く個人的な感覚でガイドラインを示してはいないと思います。