言語の面白い点は、脳の産物であるにもかかわらず、独立している点で、私たち個人の脳とinput・outputを繰り返すという制限の中でコミュニケーションに使われるためには、個人の脳構造と延長と、集団で共有する部分の2重構造を維持して進化を続けている(言語の2重構造としてJT生命誌研究館のブログにまとめておいたので是非お読みいただきたい:(http://www.brh.co.jp/communication/shinka/2017/post_000015.html)。だた、専門外の人間が直接言語進化を分析した論文を読む機会はそうない(本当は努力すればいいのだが)。ところが今週発行のNatureに英語を対象に、言語の進化研究の入り口と言っていいような論文がペンシルバニア大学から発表されたので紹介することにした。タイトルは「Detecting evolutionary forces in language change(言語の変化での進化の牽引力を検出する)」だ。
学校で英文法を学ぶ時、現在最もよく使われている断面を切り取って習うわけだが、実際には様々な単語の使い方が行われている。特に、時制を表す時、規則変化と不規則変化があり、work/workedとlight/lit, do/didの差がどのように生まれているのかはわかっているようで、わかっていない。実際diveについては現在でもdivedとdoveと両方が使われている。これがどちらかに収束するのが言語の進化の一つだが、この変化を200年近くにわたり描かれた文章を集めたビッグデータの解析から追いかけることができる。
これを行ったのが、この研究で、生態学や集団遺伝学で選択圧を特定されるため使われるnull model(帰無モデル)を用いてどの使い方が選ばれるのかを分析し、例えば規則変化へと収束する選択圧(wove-weaved, smelt-smelled)と、不規則変化型へ収束する(lighted-lit, waked-woke, sneaked-snuk, dived-dove)などが、null modelから見て明確な選択圧の結果だとしている。規則変化型への収束は、楽に覚えたいという私たちの脳から考えると当然だが、不規則型に収束する場合は様々な要因が見えてくる。例えば、自動車が普及して、driveという単語が使われ、droveという単語が頻繁に使われると、divedも引っ張られてdoveになるような例だ。
これ以外に、doの使い方の選択圧(say not—do not sayなど)や、フランス語型のIc ne secgeからI say notへの変化の選択圧の分析も行っているが省略する。
期待を持って読んだ後の感想としては、まだまだだなという印象だ。結局、言語だけをnull modelなどで分析して分かるのは、何か選択圧がありそうだという点だけで、この選択圧を特定する方法については明確ではない。この選択圧とはまさに文化や文明そのもので、今後バイアスをかけずに文明や文化との相関を調べるような新しい数理の開発とデータの整備が必要な気がする。とはいえ、コンピュータによりそれが可能になるエキサイティングな時代が来たことはわかる。