現在使われている言葉の内400以上の言語がインドヨーロッパ語に属し、世界の半数が日常使っている。このルーツについては、これまで現ウクライナのステップ起源説と、現トルコのアナトリア起源説が存在していた。前者は牧畜の伝搬、後者は農耕の伝搬とともに言葉が拡大したと考えていた。
2003年、ニュージーランドのグループは、言語の比較からアナトリア起源説を提唱したが、その後古代DNAを調べる研究からは、インドやシベリアまでステップに暮らしたヤムナ民族のゲノム流入が発見されるとともに、アナトリアとステップとのゲノム交流がほとんどないこともわかり、最終的な起源は不明のままだった。
そこに昨年8月紹介した、インドヨーロッパ語(IEL)の分布に重ね合わせた徹底的古代ゲノム研究が行われ(https://aasj.jp/news/watch/20429)、現在アルメニア地方で生まれたIEL先祖がステップとアナトリアへ別々に伝搬したとするシナリオが提案された。
今日紹介するペルーのポンティフィシア大学やドイツ・ライプチッヒのマックスプランク研究所を中心とする、多くの言語学研究者が集まるコンソーシアムからの論文は、言語の系統樹を解析する方法を見直し、古代語を含めた多くの言語を比較してIELの起源を調べ、IELが8000年前にアルメニア地方で発生した可能性が高いことを示した研究で、7月28日号 Science に掲載された。タイトルは「Language trees with sampled ancestors support a hybrid model for the origin of Indo-European languages(古代語のサンプルを含めた言語系統樹はインドヨーロッパ語起源のハイブリッドモデルを支持する)」だ。
個々でハイブリッドモデルというのは、ステップモデルと、アナトリアモデルを組みあわせたモデルで、ステップとアナトリアの起源語のさらに先祖がおそらくカスピ海と黒海に挟まれた地域で生まれたと考えている。
言語や古代語が変化しているわけではないので、新しい考え方は解析方法を見直したことで生まれている。まず、比較可能なデータがある言語を古代語も含めてできるだけ多く比較している。この時古代語は、ともすると、それ以降の言語の起点として扱われてきたが(例えばラテン語とイタリア語や他のロマンス語の系統樹)、起源ではなく兄弟として緩く扱うことで、起源としてしまうことで起こる年代測定の間違いを防いでいる。
さらに、これまでの方法で間違いの原因となる様々なポイントを洗い出し、それを排除している。例えば意味で比べるとき、複数の同義語を含めないとか、ポリモルフィズムに影響されない処理方法などを用いて解析している。
その結果、8100年ぐらいにアルメニア地方で生まれたIELは、すぐに7種類の言語に分かれ、その一つがステップに伝搬、3種類がアナトリアに移行したモデルを提出している。
以前紹介したゲノム解析結果と近いが、このモデルではインドとイランが同じ起源と考えており、ステップから直接インドに入ったと考える説は否定されている。
結果は以上で、データサイエンスの進展を実感するとともに、情報として残っているゲノムと言葉の研究が今後も協調しながら進んでいき、人間とは何かを教えてくれることがよくわかった。