言葉の誕生

2019年8月20日

SNSシェア

言語の起源　I

2017年6月1日

今回から言語の起源と進化について見ていこうと思っている。おそらくこのコーナーを読んでいただいている読者の多くの方は、「え！言語の起源」と驚かれるのではと思う。

「進化研究を覗く」というタイトルを見て生物進化について知りたいとこのコーナーを訪れていただいている読者のほとんどは、純粋生物学分野の人たちのはずだ。ところが神経系の進化についての話が終わった頃から、「意識、自己」と、話が進化研究から脱線を始め、フロイトの話まで進んでしまった。もうたくさんと密かに思いながら、ここまで付き合ってきていただいたのではと本当に感謝している。それでも、私の専門とは全く異なる言語まで進まないことには「進化研究を覗く」は完成しないと思っている。というのも、言語もまた３８億年生命進化の結果だからだ。
一見進化とは無関係な話がなぜ延々続くことになったのか振り返ってみると、進化を「環境によるゲノム情報の選択」ではなく、「環境による統合された生物情報の選択」として捉えるために、生物個体に集合している情報を一つ一つ検討し始めたことに始まっている（図１）。

図１：人間には様々な情報がかたまって存在している。説明文中

進化を環境と生物情報全体の相互作用として捉えることの重要性は、動物進化を考えるとよくわかる。例えば神経記憶という情報がゲノム情報に加わると、環境が大きく変化して個体の適応性が低下しても、生存にかなった場所を見つけて生き延びることができる。すなわち、ゲノムに直接選択圧力がかかるのを、他の情報で防ぐことができる。隕石の衝突のようなビッグインパクトを除けば、この戦略は種の多様化に大きく貢献している。従って、閉じられた試験管内の大腸菌の進化で見られるルールを、自由に動くことが可能な動物に当てはめることはできない。

こう考えて、ゲノム、エピゲノム、神経回路などを、生物個体に集合している情報という観点からひとつひとつ検討してきた。地球上に存在する全ての生物情報媒体が集まっているのは図１に示したように人間だけだが、ゲノム、エピゲノム、神経回路は生物進化の異なる時期に現れ、その最後に人間だけに言語が発生している。そして、その都度生物多様性は急速に増大している。おさらいの意味で、もう一度これらの情報としての特徴を説明しよう（図１）。

生命誕生前の地球は完全に物理学の法則だけに支配され、情報として認められる因果性は存在しなかった。そこに生命誕生と並行して地球上最初の情報、すなわち塩基配列をコードとして用いたゲノム情報が誕生する。最初は機能を持つ高分子として現れたRNA(or DNA)が、たまたま4種類の塩基でできていたため、記号性を持つことになり、最終的に生命の情報媒体へと発展することになる。またこのおかげで複製が可能になり、情報の指示による化学反応の制御が可能になった。おそらく、ゲノム情報誕生が先で、そのあと現在のような生物が誕生したと思われるが、ゲノム情報は「非物理的因果性」として物理化学的因果性と合わさって、それ以前にはなかった生物という新しい因果システムが地球上に誕生し、生命の進化が始まった。

最初生物にはゲノムしか情報媒体は存在せず、当然進化は、核酸が本来持つ傾向からうまれる多様性を、環境が選択するという単純な図式の下で進む。組み替えによるゲノム情報の直接交換も行われることはあるが、原則として同じ情報が同時に個体間で共有されることはなく、環境にフィットした個体が選ばれ、子孫を残すことで進化が進む。

個体間で外界に関する解釈を共有できないというゲノム情報の難点は、クロマチン構造の調節を介して遺伝子のon/offを調節する機構、エピジェネティックス機構が誕生することで解決される（例えば温度の違いによりクロマチン構造は書き換えられる）。この機構は最初、情報が複雑化し大きくなったDNAをコンパクトにまとめるために発達したと考えられる。その後このクロマチン構造に関わる分子を遺伝子on/offを指令する情報として利用し、細胞分裂を繰り返してもそれを維持できるエピジェネティック機構が誕生すると、環境の状態を特定のクロマチン情報に転換して記憶し、異なる細胞同士で外界の刺激について同じ解釈を共有し対応することが可能になった。

具体的には、例えば環境により同じクロマチン構造の変化が異なる個体に誘導されることで、環境変化に合わせて遺伝子発現を変えることが可能になり、ゲノムの違いに影響されずに、個体を様々な環境で維持することができるようになった。この様々な環境に個体として適応できる能力により、さらに生物の多様化が可能になる。こうして生まれた同じクロマチン構造を共有するという特徴は、ゲノムは変化しないまま細胞が分化することを可能にし、生殖細胞と体細胞が区別される多細胞体制が可能になり、生命がさらに多様化する原動力になった。

しかし完全な情報という観点から見るとエピゲノムにはいくつかの問題がある。例えば、クロマチン構造による環境の解釈は、個体間・細胞間で共有できても、原則として子孫には伝わらない。すなわち、環境への対応は、個体が生きている時一回きりになる。また、ヒストンなどの分子の化学的変化に基づく反応は早くない。そしてなによりも、この情報はゲノムの存在が必須で、副次的な情報でしかない。

このエピゲノムが持つ情報としての独立性の欠陥を解決したのが、次に誕生した新しい情報媒体、神経ネットワークだ。もちろん個々の神経細胞自体には情報媒体としての機能はない。原始的な神経に見られる様に、感覚器がそのままシグナルを運動器に伝える様な構造では、外界の記憶が発生したとしても、それは全て神経細胞自体のクロマチン構造の変化が直接反映されたものだ。しかし、いったん神経細胞同士が結合してネットワークを形成すると、細胞自体の変化を超える、回路の構造が媒体となる情報が発生する。すなわちネットワーク結合のパターンと、ネットワークを構成する個々の神経細胞の特性の変化が統合された、DNAからは完全に独立した情報媒体が成立する。

この結果、外界の変化に迅速に反応するとともに、外界の変化を記憶したり、その変化に応じて行動を起こすことが可能になった。また、神経細胞興奮という同じ原理の上に形成される回路自体を複雑化することができるため、感覚、運動、記憶などのそれぞれの回路を複雑に連結することで、厖大な外界からの刺激の中から一部のみを選択するための基準、すなわち身体とは独立した神経回路の自己を形成し、また内外からの刺激を取り込んで、この神経回路の自己を常にアップデートすることが可能になり、さらにこの自己を基準として厖大な外界の刺激の中から重要なシグナルだけを選んで神経ネットワークの自己を書き換える過程、すなわち意識を生み出すことに成功した。

この神経ネットワークの機能について、道で知り合いに出会って、挨拶を交わすという行動を例に考えてみよう。人と出会うと、視覚、聴覚、あるいは嗅覚から特定の刺激を受けることになる。刺激自体は物理量の変化だが、全て神経ネットワークに転換した上で処理されるため、まず感覚神経の興奮へと転換され、神経ネットワークに入ってくる。刺激が神経回路上に表象される過程で、物理化学的刺激は完全にシンボル化された情報になる。この内外の刺激により誘導された興奮は、すでに形成されているその時点の神経ネットワーク（＝神経ネットワークの自己）を基準に選ばれ、この選択フィルターをパスした興奮だけが、その個体の既存の神経ネットワークと相互作用を始める。フィルタリングされる段階で、視覚、聴覚、嗅覚などの入り口の異なる情報が統合されるが、人に出会うセッティングでは、入力刺激の統合過程で形とや色が備わった顔のイメージが形成され、場合によっては音や匂いが統合される。こうしてできたイメージは、次にネットワークの自己を形成する様々なサブネットワークと結合することで、刺激の内容が特定されると同時に新しいイメージに発展する。このイメージに基づいて、挨拶を行うという選択が行われ「○○さんご無沙汰しています。××大学での実験はうまくいっていますか」と実際に挨拶することになる。

もちろん神経ネットワークの形成や活動は、ゲノムやエピゲノムの支配を受けているが、基本的には神経興奮という同じ原理を共有する神経細胞のネットワークに表象され、様々なネットワークを自由に重ねたり、連結することで、独自の情報を形成していくのが神経ネットワークの特徴だ。情報としての特徴を見ると、個体レベルで環境変化に対する反応を起こせるエピゲノム情報と比べても、外界の変化に対する反応は極めて早い。もちろん外界についての解釈を、他の個体と同時に共有することも可能だ。しかし、こうして生まれた回路パターンや活性は、まだその個体一回きりで、世代を超えて子孫に伝えることは難しい。

迅速に情報を処理できる神経ネットワークの進化へのインパクトは大きい。例えば急に襲ってきた様々な変化に対して、迅速に対応し、過去の記憶もたどりながら広い範囲を移動して新しい生存環境を探す可能性が生まれ、より広い環境の変化に集団で対応することが可能になった。

図２：環境が限られると、自然選択によって生物多様性は減じると考えられる（上段）。しかし、自分のゲノムにフィットする新しい環境を求めて移動できれば、当然個体の多様化に応じて種も多様化できる（下段）。

図２に示す様に、ダーウィン進化論では多様化した個体の中で、環境に最もフィットする個体が子孫を残すと考えるが、このままでは集団内の多様性は減少する（オレンジ色ばかりになる）。例えば中立説では、この問題を選ばれた個体のゲノムのほとんどは選択に貢献せず、そのまま多様性として維持されると考えることで、自然選択により多様性が増大することを説明していた。エピゲノム機構がこれに加わると、個体レベルでの適応が起こり、ゲノムに対して直接の選択圧が加わることを軽減することができるようになるが、結果的には中立説の考えの少し異なるバージョンといってもいいかもしれない。いずれにせよ、中立変異やエピゲノムの効果が合わさり、ゲノムの多様性を維持したまま個体数が維持され、集団内のゲノム多様性は自然選択で減少することはない。

この上に神経ネットワークが誕生すると（文字通りの動物の誕生）、ゲノムから独立した情報に基づいて個体自体が、自分にフィットした環境へと移動することで、種の多様性を増大させることができる様になった（図２下段）。このように、エピゲノムや、神経情報も統合された生命情報全体と環境との相互作用を考えることが進化を考える上でいかに重要かを再確認いただけただろうか。

しかし図１に示した様に、エピゲノムも神経情報も身体から独立していない、その個体一回限りの情報だ。このため、極めて稀な例を除いて、その情報が子孫に伝わることはない。この限界を初めて破った生物情報が言語だ。この情報の誕生が、進化にどれほどの影響を及ぼしたのかは、現在１００億人を越す人間が、地球上の隅々に生きていることを見るだけで理解できると思う。すなわち、科学をはじめこの人間の発展を支えた人間にしか存在しない高次機能は全て言語誕生から始まっていると言っていい。情報としてみると、同時代の個体と同じ情報を共有し、さらに一部を子孫に伝えることができる点が大きな変化だったと言える。
この様に進化研究を知るためには、他の動物とは際立って異なる人間の進化を抜きに終わることはできない。したがって「進化研究を覗く」も、図１に示した様に、この人間特有の進化の原動力となった身体から独立した情報、言語・文字・バーチャルメディアにいたるまで、その誕生と、生物進化へのインパクトについて考えるつもりにしている。しかし、ゲノム誕生、エピゲノム誕生、神経ネットワーク誕生と比べると、この作業はさらに困難であることは書いている私にもよくわかる。

というのも、これまで見てきた新しい情報の誕生は、少なくともそれに対応する物理化学的過程を構想することができた。例えば、RNAワールドで、偶然塩基配列がインデックス情報となり、最後にアミノ酸と結びついてシンボル情報になるといった過程だ。もちろん全ての過程を完全に解明できているわけではないが、エピゲノムも、神経ネットワークもそれが生命情報に統合される過程をなんとか説明できた。

図３：言語情報の生物学的研究の困難

一方言語誕生は神経ネットワークの活動から生まれたもので、それに対応する物理学的過程自体も神経回路へとシンボル化しているため、物質的痕跡が全く存在しない。このことを図３に示した。繰り返すが、言語のコンテンツとなる様々な情報は、物理化学的に記述される現象に対応していても、言語として表現されるまでに、一度ニューラルネットに転換され表象されるため、シンボル化されている。この特定の内容が表象されたニューラルネットを複数の個体が共有することができると、今度はそれが再度シンボル化され、言語ができる。このように、シンボルの体系から新たなシンボルの体系が生まれることが言語の生物学的研究の最大の困難で、私自身も言語の起源について説得力のあるアイデアがあるわけではない。

結局思いつくまま、言語誕生に関わる様々な研究を紹介することになると思うが、今後も是非お付き合いいただきたい。

[ 西川伸一 ]

チョムスキーから始めよう
2017年6月15日

図１　出典：wikipedia
言語学と生物学を結びつけたチョムスキー

写真は米国MITで50年以上にわたって言語学研究を続けているノーム・チョムスキー（Noam Chomsky）だ。本や論文は読んだことがなくても、名前を知らない人はほとんどいないと思う。
ギリシャ時代から現代まで、言語について多くが語られてきたが、近代言語学の父と呼ばれるソシュールも、一つの言語（例えばフランス語）の歴史や、言語の構造比較に基づいて、言語と文明・社会との関わりを考える研究が中心で（と言っても私は岩波書店一般言語学講義しか読んではいないが）、言語がどのように生まれてきたか、私たちの脳の持っている言語能力とはなにかについて述べることはなかった。

これに対し、チョムスキーは、まだ脳科学がほとんど発展していなかった1950-1970年、言語、特に単語を集めて文にする統語論について多くの著作を表し、統語過程の背景には、すべての言語に共通で普遍的な「生成文法」と、学習によって身につける「個別文法」が存在することを提唱した。そして、この生成文法は生まれつき備わっていると考えた。それまで、言語とは一人一人の個人が白紙の状態から学習するものと考えていた当時の言語学にとっては、この考えは大きなインパクトがあったはずだ。

１９６５年に書かれた「統辞理論の諸相」（福井直樹、辻子保子訳、岩波文庫）のなかで、生成文法について彼は次のように語っている。
「生成文法とは端的に言えば、明示的で明確に定義された方法を持って文に構造記述を付与する規則のシステムに他ならない。ある言語の話者が、誰でもその言語についての自分の知識を表している生成文法を身につけ、内在化していることは明らかである。だからと言って、話者がその文法の規則がどのようなものなのか気づいているとか、気づくことができるようになるとか、あるいは話者が自分の言語についての直接的知識を言語化したものが必ず正しいとか、そういったことにはならない」——すなわち、わたしたちが意識しないで、一定のレベルの意味のある言葉を話すことができるのは、私たちが生来身につけている生成文法による。
「生成文法は、話者が自分の言語知識について語るかもしれないことではなく、話者が実際に知っていることを明示的に述べようとするのである。」——すなわち、生成文法は私たちの頭の中で物語（文章）が形成されるプロセスに関わる。
「生成文法とは話者のモデルでも聴者のモデルでもないと念を押すことは、無意味ではないかもしれない」——すなわち、話者も聴者も同じ生成文法を共有している。
そしてこの生成文法の背景にある、母国語の種類にかかわらず人間の脳には全てに備わっている統語能力を普遍文法と呼んだ。今風に言えば、進化過程で変化してきた人間共通の脳神経回路構造の中には、外界、内界から得た表象をもとに物語を形成するための十分条件が備わっており、この人類共通の言語回路が、外からの学習によって書き換えられると、言語別、個別の文法が形成されるとする考えだ。

現在の脳科学に十分親しんだ読者の皆さんは、一定の統語能力が発生直後の脳回路に備わっていると考えることにはそれほど違和感はないはずだ。
もちろん、チョムスキーがこの革新的な説について述べた1950-1970年には、脳についての理解は限られていた。このため、個体の多様性が自然に発生することが自然の原理であることを説得するため、ダーウィンが家鳩などの多様化の例を執拗に提示したのと同じように、チョムスキーも生成文法や、普遍文法を、文例の分析からわかる現象論的には自明のこととして議論を展開した。しかし例えばガゼルの子供が生まれた時から歩けることは直接観察できるが、子供が私たちが十分理解できる言葉を話すようになるのに3年近くかかることを考えると、彼の説を脳科学的に検証するのは難しい。事実、チョムスキーがこの考えを最初に述べてからすでに50年が経っているが、生成文法に対応する脳神経回路を特定するような研究はまだないと言っていいだろう。

ただはっきりしているのは、チョムスキー以後、言語や言語能力の発生が重要な課題として多くの研究者に認められ、賛成・反対を問わず、生成文法や、普遍文法は必ず言語の発生に関する議論の中心になって来たことだ。この現象は一部の人には、チョムスキーがこの分野に神のごとく君臨しているように見えるらしい。普遍文法が神話になってしまった現状を憂いたトマセロ（サルを使って言語や社会性について優れた研究を展開している）は「Universal grammar is dead」というコメンタリーで、普遍文法から言語を考えるのではなく、バイアスなしに脳科学から言語の普遍性と多様性を考えることの重要性を述べている。私も全く同感で、脳科学的にも言語学的にも普遍文法という概念にまだエビデンスに基づいた内容が伴ったとは言い難い。

チョムスキーらの最近の論文
しかし、トマセロがこの批判的コメンタリーを書いた2009年から比べると、チョムスキー自身も変化しているのは当然だ。彼の今を知るには、最近書かれた論文や総説を読むのが一番だ。そう思いついて、この原稿を書くため彼が最近書いた総説を探してみた。彼は1928年生まれで、現在８９歳に近いと思うが、驚くことに今年に入ってすでに単独、あるいは共著で論文を３編発表していることがわかった。そこで彼が現在生成文法についてどう考えているのか、これらの総説に探ってみようと考えた。これらの総説論文から、チョムスキーの考えの論点を整理し、今回言語の発生を考える時の課題をリストすることが今回の目的だ。

図２　今回紹介する２０１２年に書かれた総説

幾つか論文をダウンロードして読んだ中で、共著だが2012年にTrends in Cogitive Scienceに発表された論文は、図も多く、また最初から言語とチョムスキーの統語理論を脳科学的に考えようとしているのでこの論文を中心に紹介することにした（図２）。この論文は、普遍文法の脳科学を目指して書かれているように思える。この論文を紹介しながら、必要に応じて彼が今年単名で発表した論文（Neuroscience and biobehavioral reviewsに発表した論文）にも言及する予定だ。

図３　総説の図１を改変して再掲している。内容は本文参照。

脳に普遍文法を探る
チョムスキーの最初の頃の著作と今回読んだ総説を比べると、５０年経った今、彼が自分の理論を脳科学として位置付け直そうとしているのがよくわかる。総説に掲載された図を改変した図３は、脳内の言語回路と、他の機能を担う回路との関係を描いたものだが、言語回路が結合する最も重要な脳回路は、外界との関係に関わる感覚運動回路と、概念や意図の形成に関わる内的な高次機能回路で、言語回路とそれぞれとの接点を、１）感覚〜運動接合部、と２）概念〜意図接合部と呼んでいる。すなわち言語活動とは、脳内の言語回路が、外界との相互作用を行う感覚・運動系、および脳内で概念、意図、意味などを発生させる高次脳回路を媒介することで成立すると考えている。

例えば、何かを考えてそれを言葉に出す時、内的高次回路、言語回路、感覚運動回路という順番でプロセスが進み、意味のある文章が発話される。あるいは、友達に出会って話をする時などは、友達を認識する感覚運動回路からスタートするが、あとは三つの回路を行ったり来たりすることになる。

この脳内言語活動において普遍文法に相当するのは、進化と発生過程で生まれた、人間共通の基礎言語回路になるが、現段階でこれが言語に特化した回路だと考える必要はないだろう。要するに、言語を可能にする言語能力が新しい脳回路形成過程で人間のみに現れたと考えればいいと思う。

言語学の課題は、この言語回路で行われる過程の解明だが、最近の総説では脳内に散在する様々な表象を「merge」（混合）して、新しい表象(文章)を生み出すのが言語回路の役割だとしている。残念ながらこのmergeを行う脳内での計算が、ランダムではなく、意味を生み出す法則についてはこの総説でもわからないままだ。文章には単語が順序だって並んでいることから、単語を並べることがこの回路の仕事と考えてしまうが、決して単語を並べることがMergeではないことを強調している。すなわち、言語回路は表象を順番に並べるのではなく、mergeによって塊（句）にまとめることが主要な役割だと考えている。確かに文章が発話されるとき、単語が順序立てて連なっているが、頭の中の塊をそのまま同時に伝えることができないという物理的制限のせいでこうせざるを得ないだけのことだ。また、各言語で個別の文法が発展しているのは、おそらく様々な文化的背景のなかでコミュニケーションをより正確に進めることが要求されるからだと言える。

このmergeについて、２０１７年のチョムスキーの総説では、言語も脳のコンピューティングであることを強調し、脳の中ではあらゆる表象が脳回路の活動であることを強調している。これは私が前回言語発生研究の難しさとして述べた、神経系ではあらゆるものが電気回路にシンボル化されているということと同じことだ。即ち “eat” “apple”のようにeatとappleがmergeしてeat appleという新しい表象が生まれるとき、eatもappleも神経回路にシンボル化して存在している点だ。チョムスキーは1990以降、この過程で働く法則としてminimalist programを提唱し、この総説でもStrong minimalist thesisについて述べているが、統語の法則がニュートン力学と同じように法則として存在するとする考え方で、脳科学的に説明することが難しい概念だと思う。この法則性は別として、単語が脳回路でどのように表象されているかという点は、言語を考える上で極めて重要な課題で、のちに詳しく議論したいと考えている。

以上まとめると、普遍文法とは頭の中に異なる表象を集めて新しい意味をもつ表象の塊を作るために生まれてきた人間特有の能力で、この能力は脳内で物語を作るために進化したもので、決してコミュニケーションの必要性で進化したとは考えていない。ただこの能力は、２次的にコミュニケーションにも使われるようになる。この結果、学習が必要な個別文法がコミニュケーション言語には必要になった。このように言語能力が、コミュニケーションのために進化したと考えないのがチョムスキーの普遍文法の一つの柱だが、これについても多くの異論があり、特に、言語の原子とも言える単語がどのように成立するのか考えるためには、コミュニケーションの問題を抜きにしては語れない。

すでに述べたが、チョムスキーの総説では、具体的な対象に対応するシンボルとして単語が存在しているのではなく、具体的な対象や行為と関連付けられる脳内の表象が単語に対応する。ただ、具体的な事物が脳内で表象されるとき、他の表象ともともと結合して塊を作っている。例えばサルはappleを理解するときは常にeat appleとして表象しているらしい。この、具体的な事物や行動が脳内回路に表象されるときすでに様々な塊と様々な程度で連結しているという可能性は、言語発生を考えるとき極めて重要な鍵になると私は考えており、これも別に議論するつもりだ。

図３を確かめる実験
詳しくは述べないが、この総説の目的は、図３で示した脳内のデザインを、実際の脳に存在する回路と対応させることが可能であることを示すことだ。例えば、この総説を読んで、人工的文法（artificial grammar）を用いた新しい言語認識研究法があるのを知った。人工文法とは、自然には存在しない単語や句の並びを聞いたときの脳の反応を調べる研究だが、生成文法が提唱されて以来５０年、急速に進展した脳のイメージングによりこのような実験が可能になった。

紹介されている実験を詳しく説明することは避けるが、このような方法論の進歩によって、言語を処理する際、脳内でどのネットワークが活性化されるのかがわかるようになってきた。言い換えると、言語理論と脳回路とを結びつける可能性が生まれたわけで、今後普遍文法など統語論の脳科学を進めるときには欠かせない手法になりつつある。もちろんチョムスキーも、この分野の進展を取り込み、理論を発展させようと考えている。

図４　ブローカ領域のウェルニッケ領域の脳内での位置。失語症の研究から、ブローカ領域に障害が起こると文法的に整った文章の発話が困難になる。一方ウェルニッケ領域が障害されると、言葉を聞いて理解するのが困難になる。ただ実際にはもっと複雑で、改めて紹介する。
（出典：wikipedia）

例えば、失語症の研究から文法的に整った文章を話すときに必須であることがあきらかにされていたブローカ領域（図４）は、運動性言語中枢と呼ばれ、図３で示す感覚運動回路を通した発話過程に関わっていることがわかっていた。人工的に単語を並べたセンテンスと、自然言語によるセンテンスを比べる研究から、ブロカ領域はどちらの刺激でも活性化されるが、自然言語を処理するときは、言語を聞いて理解するのに必要で知覚性運動中枢と呼ばれるウェルニッケ領域も同時に活動することなどがわかってきた。このような脳科学的データを集めることで、図３をより詳しい回路図へと仕上げることができるはずだ。
チョムスキーらも総説の最後に、言語過程には知覚性言語中枢（ウェルニッケ）と運動性言語中枢（ブロカ）に加えて、幾つかの脳領域が言語処理に関わっており、また単語や意味に関わる独立した領域も存在していることがわかってきた。これら領域のなかに具体的事物の表象がどう形成され、またそれがMergeされるのか、脳科学として研究が可能であることを強調している。この問題については、言語中枢の局在化の問題として取り上げて考えてみたい。

このように、新しいチョムスキーの総説を読むことで、脳科学として言語発生を扱うための課題を整理することができた。これ以外にも、

１）言語能力の進化と人類学、

２）チョムスキーは言語が進化するのではなく、言語能力が進化すると明快に断じているが、本当に言語自体は進化しないのか？
などについても、次回以降順次考えていきたいと思っている。

道具と言葉
2017年7月3日

前回チョムスキーの考えを詳しく説明しないまま、チョムスキーから始めてしまったので、この分野に興味を持っていなかったみなさんにはわかりにくい話になったと思う。説明している私自身も、彼の初期の生成文法についての考えを完全に理解できているわけではないので、余計にわかりにくくした。しかし、彼は言語学を脳科学や進化学、すなわち生物学として捉えるべきだと最初に考えた人で、そのことを伝えられるだけでも意味があったと思っている。言語の問題は生物学・脳科学の問題であるとする彼の考えに私も１００％賛同する。チョムスキーから始めた限りは、これから言語発達に関する様々な問題を、脳科学の問題として具体的に取り上げていこうと思っている。もちろん、議論のなかで必要とあればチョムスキーの考え方も参照しながら進めたい。

さて第一回は、「道具と言葉」というタイトルで、人間特有の脳機能の進化について考えてみたい。
現在地球上で言語を話すのは人間だけだ。そのため、人間と例えばチンパンジーの遺伝子を単純に比べることで、言語の遺伝子に到達できるという話をよく聞く。言語を考える時、わたしはこのような単純な発想は間違っていると思う。言語は、何か一つの能力が備わったことで急に現れたものではない。すなわち、長い進化の過程で様々な能力が蓄積した結果が、人間特有の性質の一つである言語に象徴されていると思う。一番わかりやすいのが複雑な発声を可能にする解剖構造だが、複雑な発声だけなら鳥類、あるいはイルカだって独特の解剖学的構造を発生させ実現している。一方、多くの点で人に近いと言える類人猿はこのような複雑な発声はほとんど不可能だ。このように、生物進化で獲得されてきた様々な独立した能力の蓄積が言語能力の背景にあるとするなら、言語に限らず人間を特徴付ける様々な高次機能を検討することも、言語の条件を知るためには重要だ。
例えば道具を使う能力について考えてみよう。この能力も、これまで人間特異的能力として考えられてきた。最近になって、サルやカラスなどが道具を使う能力を持つことが明らかになっているが（後述）、それでも道具が日常化して進化の道筋が変わったのは人間だけだろう。

世界で最も古い３３０万年前の石器は、アウストラオピテクスが居住していたと考えられるオルドワンで見つかっている。

図１　チンパンジーから現代人までの頭蓋、脳容積、歩行様式、歯、樹上生活の変化。石器が見つかるアウストラロピテクスから急速に犬歯が退化する。肉を道具で切り分ける社会が生まれ、個体間の関係も大きく変化した。その意味で、一夫一婦制も石器による起こった変化だとすら考えられる。(Nature Knowledge Project, Pontzer et al, Overview of hominin evokutionより引用：https://www.nature.com/scitable/knowledge/library/overview-of-hominin-evolution-89010983)

道具が生まれる前後の猿人から人間への変化を調べると、まず犬歯が消失する。これは道具を使うことで肉を引きちぎる必要がなくなり、口の中で噛み続けるためには犬歯が邪魔になったのだろうと考えられる。しかしもっと興味深いのは、男女の体格差が急速に減少することで、オーストラロピテクスでは２倍もあった大序の体格差が、エレクトスになると1.5倍と現代人の1.2倍に近づいている。おそらく、道具を使って肉を切り分けることで、１匹のオスがすべてを支配する権力構造が解消し、おそらく一夫一婦が原則となった共同体が生まれたことが、男女体重差の解消の背景にあるのだろう。

道具の研究が重要なのは、文字が出来るまでは歴史的検証に必要な遺物が全く存在しない言語の起源研究と異なり、石器という物証が残っていることだ。道具は当時の知的レベル、移動と交流など、当時の生活をかなりの確度で教えてくれる。

例えば道具の形態や出土の状況から、共同で狩りをしながら複数の家族が一緒に暮らしていることがわかれば、これを維持するためにどのレベルのコミュニケーションが必要かどうかわかるし、さらには一夫一婦制を前提とする社会なら、浮気のないシステムを守るためにかなり高度なルール設定が必要だったことも推察できる。このように、道具を通して明らかになる社会構造は、言語発生の条件について重要な資料になることまちがいない。

では道具を使う脳が発達するためにはどのような条件が必要だっただろうか？
これを知ろうと、道具を使う人間以外の動物の研究が進んでいる。この方向の研究のルーツは、有名な類人猿の生態研究者Jane Goodallが、葉っぱを使ってありを釣り上げるチンパンジーの報告に遡る。その後の研究の結果、様々な動物が道具を使うことが示されてきたが、中でも小枝を木の穴に挿入して虫をおびき出すニューカレドニアやハワイのカラスの行動は、最も原始的な道具使用の始まりとして研究が行われてきた。
この道具を使うハワイのカラス（アララと呼ばれている）の論文を読んだ時、不思議なことにチョムスキーの普遍文法を私は思い出してしまった。そこで、まずこのアララについての最新の研究から紹介しよう。

このアララが小枝を拾って、木の穴に突っ込んで隠れている虫をおびき出して食べる様子、あるいは小枝が落ちていない時は、枝を折って使う様子が、この論文を掲載したNatureによりYouTubeにアップされているので一度見て欲しい（https://www.youtube.com/watch?v=ZOUyrtWeW4Q）。

この論文では(Rutz et al, Discovery of species wide tool use in the Hawaiian crow、Nature, 537, 403, 2016 (http://www.nature.com/nature/journal/v537/n7620/abs/nature19103.html)),この小枝を使う行動がカラスに生まれつき備わった遺伝的なものか、あるいは学習により獲得されるものかを調べる目的で、７羽のカラスを道具を使う他の個体から隔離した環境でヒナから育て、教えなくても道具を使うようになるかを調べている。結論は明確で、全てのカラスが他の個体から習うことなく、道具を使えるようになるという結果だ。

「道具を使うという「文法」が生まれつき備わっており、学習する必要がない」と解釈しても良さそうなこの結論を読んだ時、私はすぐチョムスキーの普遍文法に似ているなと思った。しかし、枝を見た時、それをくわえて穴を探り、虫をおびき出すという一連の行動を実行する全過程が、ロボットのように生まれた時から頭に組み込まれているのだろうか？

論文を詳しく読むと、行動の順序が生まれた時から頭の中にプログラムされているのかどうかは判断が難しいことがわかる。最も重要な問題は、全てのカのカラスの道具使用を確認するのに５ヶ月もかかっている点だ。もし、行動の全てがプログラムされているなら、巣立ち（１ヶ月程度）直後から道具を使ってもよさそうだ。

ここからは私の想像だが、アララが習わないで道具を使えるのは、もともと習性として持っている遺伝的性質と、自分の数ヶ月にわたる学習が組み合わさった結果だと考えればどうだろう。もともと鳥は巣作りのために、木切れなどを拾って穴に突き刺す行動を習性として持っている可能性は高い（確かめたわけではない）。この習性を繰り返しているうち、たまたま虫をゲットする経験が続くと、この行動は記憶され、固定化し、枝を道具として虫取りに使うようになると考えることもできる。

このシナリオでは、他の個体の行動を学習する必要はない。しかし行動手順が最初から脳にプログラムされているわけではなく、たまたま持っていた習性が、この習性を持たない種よりははるかに高い確率で穴の中の虫をおびき出しゲットする経験につながり、これを自習のように繰り返すことで、一連の動作と得られる結果が記憶に固定化され、道具を使う能力が完成すると考える。
もちろんこの習性があれば、おなじ道具を使う方法を他の個体を見て学習してもいい。この場合はトライアンドエラーを繰り返す自習よりははるかに確実に獲得するだろう。しかし、もし枝を穴に突っ込むという習性がなかったら、この能力は生まれない。

道具を使う能力を考えると、私たちは虫を取るという目的、それを達成するための枝の機能についての表象をカラスが持っていると考える。そして、「普遍文法」と同じで、学習することなくこの能力が獲得されていることを観察すると、全てが遺伝的に決まってしまうと考える。しかし、人間の子供が文法的な言葉を話すのは１年半以上過ぎてからで、それまで様々な経験をする。とすると、アララに特定の遺伝的な習性が存在すれば、あとは試行錯誤を繰り返して道具を使う能力を獲得するように、意味のある統語法を支える普遍文法という能力も、脳の文法特異的な特別回路といったものではなく、様々な領域を統合する能力のような背景に、試行錯誤型の自習が加わった２段階で生まれると考えることも可能だ。このように、獲得に時間がかかる性質は、他の個体や社会からの学習がなくとも、試行錯誤という学習が加わった結果である可能性があることは常に注意する必要がある。

言語と同じで、人間の道具使用の発達についても多くの研究が発表されている。人間も生まれた時には道具を使う能力は全く備えていない。腕や手の運動機能は６ヶ月をすぎると備わってくる。この時から、周りにある様々な物体を触って確かめる試行錯誤により、見つけたものを自分で操作できるかどうかを自習する。この行動は、アララが枝を拾う習性に対応するかもしれない。この見つけたものを手で触って操作性を確かめる行動は一種の遊びに見える。実際、Rat-Fischerらの観察によれば、生後１８ヶ月まで道具とおもちゃの区別はない(Rat-Fischer et al, Journal of Experimental Child Psychology 113, 440, 2012)。すなわち、自分の目的と、物体の性質についての表象が機能として表象為直され、それに基づいて行動シナリオを表象できるためには、言語発生と同じだけの時間がかかることがわかる。

言語の発達も、生後半年ほどから訳のわからない赤ちゃん特有の発声が始まり、１２ヶ月頃より少しづつ意味のわかる単語の並びが出始め、２年目ぐらいに意味のある文章が出るようになるが、この時間的経過も道具使用の発達経過と似ているように思える。ただ、後に議論するが、言語は社会から離れて完全に自習することはできない。一方、おそらく簡単な道具であれば、社会から離れた人間も道具を使うのではないだろうか。実際、最初の道具が見つかる３００万年前にはおそらく言語は存在しなかった。このように、道具の使用と、言語の使用のように、人間に比較的特有の性質は、多くの点で重なると同時に、多くの点で独立している。
このことがわかるもう一つの例が、失語症患者さんの研究だ。後で詳しく説明するが、血管障害などで特定の脳領域の機能が失われた患者さんに見られる言語障害の研究は、言語に必要な脳回路の研究に大きな役割を果たしてきた。これを失語症と呼ぶが、この失語症の患者さんの中に、道具が使えくなってしまったケースが多く見られることが１９世紀の終わりから気づかれるようになった。これを「失行症」と呼ぶ (図２)。

このことがわかるもう一つの例が、失語症患者さんの研究だ。後で詳しく説明するが、血管障害などで特定の脳領域の機能が失われた患者さんに見られる言語障害の研究は、言語に必要な脳回路の研究に大きな役割を果たしてきた。これを失語症と呼ぶが、この失語症の患者さんの中に、道具が使えくなってしまったケースが多く見られることが１９世紀の終わりから気づかれるようになった。これを「失行症」と呼ぶ (図２)。

図２　失行症の患者さんが櫛を逆さまに向けて使おうとしているところ（出典：Wikipedia）

ほとんどの失行症は、左の後頭頂皮質の血管障害により起こる。患者さんは櫛とは何か、ハサミとは何かが理解できるにもかかわらず、櫛を逆さまにして髪に当てたり（図２）、ハサミを閉じたまま紙を切ろうとする。詳しい解説は避けるが、重要なのは多くの患者さんに、様々なタイプの失語が併発することだ。もちろん、多くの失語患者さんは失行を伴わないし、まれではあるが失語症状の全くない失行症の患者さんも存在する。このように、道具使用と言語能力は、働いている脳領域から見ても、多くの点で重なっていると同時に、多くの点で独立している。
このことは、言語を例えばブローカ領域、あるいはウェルニッケ領域がコントロールしていると局在論的に決めつけることは間違っていることを意味している。道具使用との比較から見ても、言語能力には多くの脳領域が関わり、またそれを統合するメカニズムが存在しているはずだ。
さて次回は、より言語に近い音楽に関する能力を言語能力と比べてみる。
[ 西川伸一 ]

音楽と言語

臨床医学では、一人一人の患者さんから得られる経験を大事する。これは症例報告という形式で発表される論文に現れている。滅多に起こらない病気の場合、ほとんどの医師は直接経験することなく終わる。しかし稀とはいえ、いつなんどき同じような患者さんが診察室にやってくるかもしれない。このためたった１例の経験でも、多くの医師と経験を共有することが重要で、これが症例報告を重視する伝統として生きている。今回は、このような症例報告論文の紹介から始めたいと思う。

図１　引用元、説明などは本文参照

論文のタイトルページを図１に示すが、兵庫県立リハビリテーション中央病院のグループがBrain and Cognitionに昨年発表した論文だ（S. Uetsuki et al. / Brain and Cognition 103 (2016) 23–29 ）。５３歳右利き女性で、左側頭葉に脳梗塞がおこり、その結果歌うことができなくなった患者さんの報告だ。この症例が報告された理由は、ウェルニッケ領域（前々回参照）を含む左側頭葉に大きな梗塞があるにもかかわらず、失語症はおこらず、音楽の表現だけが障害されている点だ。実際には発作直後の数日、カナと漢字両方の識字障害がみられているが、これはすぐ正常化している。音楽能力が犯されているが(失音楽症と総称しておく)、馴染みの音楽を聞かせると題名を当てることができる、要するに音楽を聞く方の障害はほとんどないが、ピッチの高低の表現、要するにメロディーを歌うことだけが犯されている。

専門家でなくともこの症例から以下のことがわかる。１）脳の局所的障害によって音楽能力が障害されること、２）失語と同じで、音楽能力の障害も、音楽を聞く時の障害と、音楽を表現する時の障害に分かれること、３）メロディーとリズムは全く別の場所によりコントロールされていること、４）音楽も言語もともに人間特有の高次脳機能だが、メロディーを表現する音楽能力と、言葉を話す言語能力とは別々の機能であること、などだ。

前回紹介した失語症や道具使用能力の異常・失行症を思い出していただきたいが、脳イメージングが発達するまで、特定の脳機能とそれを調節する領域の対応関係は、卒中などの脳障害の症例の解析が頼りだった。実際、脳障害の後、あるいは生まれつき音楽の認識や表現する能力が欠損している患者さんの症例報告は１９世紀後半から行われている。中でも有名なのは、作曲家ラベルが自動車事故の後、失語、失行、失読、識字障害とともに、作曲する能力を完全に失ったことを記載した症例報告だろう。ラベルの例から、障害によってはこのように、失語、失行、失音楽症が同時に障害されることもある。

実際には、失音楽症の表現は極めて多様で、個人差が大きく、失語症以上に決まった領域にマッピングが難しい。例えばラベルのようなプロの音楽家の失音楽症は左側頭葉の障害による場合が多いことが知られている。一方、多くの失音楽症の症例を集めて検討した研究（例えば2016年、Journal of Neuroscienceに報告された７７症例の検討：Sihvonen et al, J.Neurosci. 36:8872, 2016）では、失音楽症の半数に失語が合併しており、言語と音楽能力に関わる共通脳領域の関与を示している。また失音楽症は言語の犯されにくい右側頭葉の梗塞による症例が多いことも報告されており、最初紹介した日本の症例が珍しい例であることを示している。事実、右脳の障害で失音楽症が起こるケースが多いことは、右脳は芸術、左脳は論理という誰もが知っている通説に合致しているようにも思える。これまでの研究は、音楽能力の形成は、言葉と比べてもさらに個人差が大きいことがわかる。最近音楽の様々な要素を経験する時に活動する脳領域を調べる脳イメージング研究が進み、音楽の認識のさらなる複雑性が明らかになってきているが、話が膨大になるので、紹介はやめておく。

これまでの研究をまとめると、私たちは曲を聴くとき、あるいは音楽を表現するとき、一つの統合された全体として認識し、それを表現するが、実際にはメロディー、ハーモニー、リズム、絶対ピッチなどなど、様々な脳領域が別々に働いて集めた情報を、脳内で統合された表象に形成し直して認識している。神経回路的に考えると、それぞれの要素の表象には時間差があっても、正確に統一したリズムの中に統合され、一つの音楽として認識できる過程は、脳を理解するためには格好の課題と言える。しかも、同じような表象を多数の人間が共有できる。幸い音楽を聴かせる課題設定は、脳イメージング技術と相性がいいため、今後大きく発展する分野だと思う。

言語、道具、音楽それぞれの能力を支配する高次脳機能の関わりについて見てきたが、各活動は多くの脳領域が関わり独立に支配されていると同時に、多くの領域で機能的重なりが見られることを理解してもらえたと思う。この機能的重なりは重要で、それぞれの能力が、それを支配する共通の領域を介して相互作用を行えることを意味している。

この人間特有の３つの能力の進化をみると、短時間に急速に多様化、複雑化していることがわかる。例えば、道具は３００万年ぐらい前に開発されて以来、5万年前までほとんど変革を遂げることはなかった。しかし私たち現代人の先祖が言語を獲得するや否や、急速な進化が始まった。一方、言葉を持たなかったと考えられる（これについてはいつか議論したい）ネアンデルタール人では、道具の進化をあまり認めることはできない。

一方言語の方も道具により大きく変化する。私たち現代人でも、話された言葉をそのまま覚えておくのは難しい。これを克服しようと文字が誕生するより随分前から、頭に浮かんだ表象を書き留めて覚えるための道具を必要としたはずだ。この方向の道具の進化の中で、言語能力と道具を使う能力の相互作用が始まり、両者は言語を生み出すとともに急速な進化を果たし現代文明を作り上げた。言語と道具は今や、言語翻訳や、言語シミュレーションのような、人間の能力を大きく超える道具を作り出すことにすら成功し、またこの道具により世界の言語が変わろうとしている。

図２　最古の楽器。(出典：Wikipedia)

音楽と道具についても同じことが言える。最初、音楽は体を使って表現されていたはずだ。しかしおよそ35000年前には図２に示すフルートのような複雑な楽器が作られたという証拠が残っており（図２）、道具を使う能力と音楽能力がこの時期には相互作用を始めていたことがわかる。そして今、世界を見渡せば、言語に匹敵するぐらい多様な楽器が存在しているだけでなく、電子化、コンピュータ化などの道具との相互作用により、全く新しい音楽が誕生し、それが脳の成長に大きな影響を与えると考えられている。

この急速な進展は、個人の頭の中で３者の能力が相互作用するだけでは生まれない。次回の話題にしようと考えているが、言語、道具、音楽の３者が共通に持つ重要な特徴が、人間の脳の活動から生まれたにもかかわらず、個人個人の脳活動から独立できている点だ。すなわち、言語、道具、音楽は個体間のコミュニケーションが前提になっており、活動が意味を持つためには脳内に形成される表象が一人の個人の脳内で止まるのではなく、複数（多くの）脳内に同じような表象が形成されていることが必要になる。すなわち、３者に関わる脳活動は、他人（社会）と共有されることで、個人（人間）から独立することが可能になり、人間の活動であるにもかかわらず、人間から独立して進化できる。こうして独立して発展する、言語、道具、音楽を、個人個人は一生を通して学び続ける。このサイクルを繰り返すことで、言語、道具、音楽は進化するとともに、人間の脳回路を変化させてきた。
言語、道具、音楽の各能力が社会に共有されることで個人から独立し、独自の発展が可能になったことが、人類の脳構造はこの5万年ほとんど変わっていないにもかかわらず、３つの能力が急速な進歩をと人間だけが文明を形成できた理由だろう。このことは言語を考える上で最も大事な点で、詳しい議論は次回以降に改めて行う。

今回は最後に、私が音楽と言語を考える時大変参考になった、Steven Mithen著、『The Singing Neanderthal』を紹介する（図３）。

図３　Steven Mithen著『The Singing Neanderthals』のカバー。
もちろん私が紹介するより、音楽と言語の関わりについて興味を持たれる方には、直接読んでもらうのが一番だ。現在絶版になっているが、一度は邦訳（『歌うネアンデルタール : 音楽と言語から見るヒトの進化』熊谷淳子訳）も出版されており、日本語で読むことも可能だと思う。

Mithenの興味は言語の発生だが、「音楽能力なしに言語は誕生しなかった＝音楽能力が言語より先に発生した」と考えている。彼が提案する言語発生についての大胆な提案を私なりに改変したものを図４に示す。

図4 Steven Mithenの提案する言語発生に至る過程

チョムスキーと異なり、Mithenにとって、言語はあくまでもコミュニケーション手段から発生したものだ。同じようなコミュニケーションはサルだけでなく様々な動物で見られる（サルの会話の様子はYouTubeに多くの例が掲載されている。例えば、https://www.youtube.com/watch?v=JLOn8F0p96s参照）。そして伝達できるものは感情と一体化した情報だけだ。例えば、乳児と母親とのコミュニケーションを見てみれば、そこで行われている伝達が、専ら感情の伝達に限られているのがわかる。そしてこのために生まれるのが、彼がholistic languageとよぶ、一つのシラブルで伝えたいことの全てを表現する言葉だ。赤ちゃん言葉を例として説明すると、母親の乳房を求めて「mamama」と声を発した赤ちゃんに、お母さんもそれに合わせた赤ちゃん語で答えているとき使っている言葉がholistic languageになる。

感情のコミュニケーションという意味では、音楽も同じだ。言語の混じった歌という形式を取らない限り、ほとんどの音楽家は、音楽が感情を伝える手段である点では一致している。そして、この感情の伝達から、情報の伝達が発展する可能性も、太鼓が楽器としてだけでなく、離れた人間同士の情報伝達に使われるようになることを考えると理解できる。

図４のMithenのシナリオでは、直立歩行を果たし、集団で餌を漁る生活を始めた原始人は、まず交尾のための競争、そして私たちと同じように乳児との対話などに、限られたボキャブラリーのHolistic languageを発展させ、それを仲間同士の情報交換にも使っていた。情報伝達という観点から見ると、Holistic languageは極めて素朴なコミュニケーションにしか使えないのだが、古代原人の生活にとってそれ以上のコミュニケーション手段など実際には必要なかったのだろう。
そして約50万年前、ネアンデルタール人と別れた我々の祖先は、太鼓の音楽を情報伝達に使い始めたのと同じように、holistic languageを分節化し、感情と情報を分離することに成功する。一方、ネアンデルタール人は、ずっとholistic languageを使い続け、行動から感情を分離できないまま、文明の発展が行き詰まることになるというシナリオだ。

ネアンデルタールの遺跡を見ると、埋葬時に花を手向けるなど、豊かな感情表現の痕跡が残っている。しかし感情を伝達する音楽だけでは、文明の発展は限られている。一方、ホモサピエンスではさらに複雑な情報伝達手段が必要になる状況が生まれ、音楽脳に重なる形で、感情と情報を分離し、言語を分節化する能力が生まれる。残念ながらこのきっかけが何だったのかは今も謎のままだ。しかし、一旦独立した言語能力が生まれると、あとはそれぞれの機能が相互作用を繰り返し、現代文明へと突き進む。

このように、言語、道具、音楽という人類特異的能力は個人だけでなく、多数の人間の脳内で相互作用することで独自に進化する。このため、言語の発達を理解する時、この三者を常に念頭に置いて考えることは重要だ。
[ 西川伸一 ]

言語の二重構造
2017年8月1日

これまでの話で、言語の使用や発生が脳科学の問題であることは理解してもらったと思う。しかし前回見たように、記憶、自己、意識についての脳科学と、言語、道具、音楽などの脳科学には、他の個体とのコミュニケーションの必要性という決定的な違いが存在している。今回から、この問題について考えていきたい。議論を進めるにあたって、言語機能を人間特有の機能として考える立場をとり、様々な動物や、「歌う？」ネアンデルタール人も比較しながら議論を進めたいと思っている。

さて、チョムスキーは言語をコミュニケーションの観点から捉えることは、言語の本質を見誤らせると考えていた。これは、彼が言語の最も重要な条件は私達が生まれついて持っている統語能力（普遍文法）で、この人間共通に持つ能力があればおのずとコミュニケーションが可能になると考えたからだ。
たしかに私たちは必ずしも言語をコミュニケーションのためだけに使っているわけではない。ほとんどの人は、物を考える時にも言語に頼っていおり、特に複雑な内容を頭の中で考えようとするとき、言語に頼っていることに気づく。これは、言語が脳内でも覚書として、またチョムスキーが言うように統語に関わる論理的システムとして私達の思考を助けてくれるからだろう。しかしこの考えに立つと、「普遍文法を可能にする神経ネットワークの遺伝的背景」を追求することが言語発生の生物学としては重要な課題になり、基本的には言語の全てが私たちの脳内でとどまっていると唯脳論的に考えることになる。この結果、言語、道具、音楽が持つ全く新しい性質、すなわち私たちの身体的生命から独立できているという性質を見落としてしまう。（実際にはチョムスキーも普遍文法をinternal languageと、それが身体から外化され発展するexternal languageに分けているが、生物学的にこれをどう攻めるかは明らかでない。）

「言語も脳科学の問題と言った後で、言語は身体から独立している、とは何事ぞ」とお叱りを受けそうだ。これまでゲノム誕生に始まって、脳内神経ネットワークまで長々と生命が生み出してきた情報について見てきたが、ゲノム、エピゲノム、シグナル分子、神経ネットワークなどを媒体とする情報は全て私たちの身体とともに消滅していた（現在ではゲノム解読結果をPCに残すことが可能になってきて、この原則は崩れつつある）。一方、言い回しの癖や、発音など個人的な性質を除くと、言語は私たちが死んだあとも、独立した情報として残る（図１）。例えば日本語は私たちの生命を超えて存在し続ける。この意味で、言語は我々の身体から独立している。

最初に述べたように、言語も私たちの先祖の脳内活動から生まれ、また私たちの脳内活動が維持してきたもので、決して天から降ってきた情報システムではない。従って、「言語は脳科学の問題」ということも正しい。ただ、複数の個体間のコミュニケーションのための情報として発達したため、集団（社会）により共有される部分が生まれ、共通部分と個別部分の二重構造になった（図１）。これが個人が消滅しても、言語が続く理由だが、２重構造の成立と維持について、図１を眺めながら日本語を例にもう少し説明してみよう。

図１　言語以外の情報（この図ではゲノム、エピゲノム、神経情報を挙げている）は全て身体に拘束されており、身体とともに消滅する運命にある。言語も最初は脳内の活動の一つとして生まれるが、コミュニケーションのために発達し、複数（社会）で共有できる部分を形成したおかげで、この部分は個人の身体から独立した体系として成立できている。この体系は、常に変化しており新しくなっている。生まれてきた人間は、この新しい体系を習得する必要がある。従って、個々の個人から独立した体系自体も、私たちの脳とは無関係に存在するわけではなく、一生を通して学習され、また共通部分に一部がフィードバックされるという関係を保っている。おそらくこの言語の２重構造が、クオリアといった主観と客観の２元論の背景にある。個人から独立し、社会で共有できる言語の体系は現代文明のルーツで、今やその成果としてのゲノムプロジェクトを介して、本来なら身体に拘束されているゲノムやエピゲノムを身体から離して保存することに成功している。

私の頭の中には日本語の全てが存在しているわけではなく、ほんの一部が存在しているだけだ。すなわち、私が死んでも日本語はビクともしない。この意味で、日本語は私の身体とは別のところに存在している。そして私は生後すぐから現在まで、この日本語を学び続けることで、私の中の日本語を形成・維持・変化させいる。このように、日本語は個人から独立して存在していても、常に人間の脳と相互作用を続けている。言語とは新しく生まれた個人がそれを習い、使い続ける中で初めて維持されるシステムだ。将来もし誰も日本語を使わなくなれば、日本語という記録は残るだろうが、その時点で日本語の変化は停止する。図１はこの言語の２重構造（一人一人の個人の頭の上に小さな言語を置いた上に、共有部分としての大きな言語を描いている）を示している。

色の認識を例にさらに考えてみよう。２０世紀米国の分析哲学ではクオリア問題がよく議論された。これは私が赤色を見た時の主観的体験を客観的に、すなわち他の人に理解できる形で定義できるかについての議論だ。私は、この議論は図１に示した言語の２重構造を反映していると思う。考えてみると、私たちはそれぞれ赤色について主観的質感を持ち、個別に定義する。ただ、私のクオリアは、言語を学習する過程で言語の共通部分にある「赤色」という言葉が対応して初めて成立する。一方、言語の共通部分も多くの個人の赤色の体験からフィードバックを受けて変化し続けている。このような言語の２重構造のおかげで、実際には赤色に対する個人の質感と、言語の共通部分が代表する赤色との差など何ら意識することなく、「赤色」について多くの人と客観的に議論できる。

この言語の２重構造は、言語が独立して進化する原動力でもある。私たち個人はこれまで誰も経験したことのない新しい経験を日々繰り返している。この新しい体験は、当然言語化され、言語の共通部分へとフィードバックできるが、実際にはほとんどがフィルターされ、個人の経験で終わる（これは私たちの感覚が日々膨大なインプットを経験しながら、フィルターされ選ばれたほんの一部が神経ネットワークの自己を書き換えるのと似ている：７６話）。
次に、例えば空飛ぶ円盤を見た体験がフィルターを通って共通部分へとフィードバックされる条件を考えてみよう。これまで飛ぶ円盤を見た人は誰もおらず、あなたしか見た人はいないとしよう。当然空飛ぶ円盤を表現する言葉は言語の共通部分にはまだ存在しない。この時、「空飛ぶ円盤」が言語の共通部分を書き換えるためには、この体験をまず言葉で表現する必要がある。この過程で「空飛ぶ円盤」という最適の言葉に思い至り、めでたく共通部分に新しいボキャブラリーが誕生する。

この例からわかるのは、私たちの言語が、あらゆる概念を現存の単語を使って表現できるとてつもない力がある点だ。このことは、広辞苑でも大辞林でも、皆さんが使っている辞書を思い浮かべると理解できる。そこには日本語として使われるほとんどの単語が、他の単語で表現されている。これが空飛ぶ円盤を見たあなたが、「空飛ぶ円盤」という新しい表現に到達でき、新しい概念を「空飛ぶ円盤」という言葉として言語の共通部分にインプットできる理由だ。言語を構成する各要素は、脳内神経ネットワークと同じように、意味のネットワークを形成している。このネットワークが、個別の脳につながる言語システムからインプットうけ、不断に書き換えられている。
この２重構造に基づく進化力のお陰で、毎日の生活での言語体験がどんなに乏しく、またそっけなくとも、言語はますます豊かになることができる。このことは会話を主体とする戯曲と、小説の文章を比べるとすぐわかる。

少し古いが菊池寛の「父帰る」の一場面の会話を抜き出してみよう。

新二郎
ただいま。
母
やあおかえり。
賢一郎
大変遅かったじゃないか。
新二郎
今日は調べものがたくさんあって。
ああ肩が凝った。
母
さっきから御飯にしようと思って待っとったんや。
賢一郎
御飯がすんだら風呂へ行って来るとええ。
新二郎
たねは。
母
仕立物を持って行っとんや。

なんとそっけないことか。複雑な構文もないわけではないが、これももっと単純な構文に書き直せるだろう。それで用は足る。
実際、日常会話で長々と文章を述べようとしても、すらすらと文章を述べられる人はまれだ。私自身、対談の原稿が上がってくると、なんと意味不明の文章や、「あの」「あれ」「それ」と言った単語にならない単語を連発しているのに気付き、いつも幻滅する。結局、私たちの日常生活はこのようなそっけない乏しい言語の使用で終わっている。しかし、小説や、戯曲でも長いセリフを読むとき、私達の言語がいかに複雑で、高いレベルに達しているかよくわかる。これは個人の言語体験を超えて、言語の共通部分が急速に進化していることを物語っている。

説明が少し長くなったが、この言語の２重構造が、言語の最も重要な特徴で、この構造は言語がコミュニケーションを目的としているからこそ可能になった。この意味で言語の原点はコミュニケーションだと私は思っている。
ではこの構造はどのようにして生まれたのか？この言語誕生の問題に関しては、前回紹介した「歌うネアンデルタール人」の著者Steven Mithenの考え方に私も強く影響されており、彼の説を下敷きに考えていきたいと思っている（これ以後、言語という言葉を、言語発生前のプロト段階と発生後の言語の両方を含む意味で使うので注意してほしい）。
彼は言語の発生を考える時、コミュニケーションのために使われる体系をmanipulative languageとreferential languageの２段階に分けている(図２)。

図２:Mithenの考え方に従った言語発生の２段階。

いずれもコミュニケーションのために発達し、最初は一つの音の塊に、他の個体の行動を促すすべての情報が備わったholistic & manipulative languageだが、その後フレーズが単語に分節され、各単語が特定の概念を参照する、segmental & referential languageへと変化する。segmental languageはcompositional language（合成的言語）と読み替えることもできる。

Manipulative languageのわかりやすい例としては、赤ちゃんの発声を考えればいい。泣き声のことも、「ママママ」などいろんな発声があるだろうが、それを聞いた大人は何を望んでいるのか発声の意味を解釈し、何とか希望を叶えようと努力する。もちろんベテランのお母さんになると、声を聞くだけですぐに解釈することができるが、いずれにせよその発声により周りの人間が操作を受けることになる。これがmanipulative languageだ。
Manipulativeな発声は人間特有のものではなく、もともと多くの動物や鳥類で見ることができる。ヒョウ、ワシと危険のもとを区別して警告を発することで有名なベルベットモンキーの鳴き声を効いた仲間が安全なところに逃げるのは(YouTube参照：https://www.youtube.com/watch?v=hEzT-85gEdA)、それを聞いた仲間を適切な場所に逃がすためのmanipulative callの典型例だ。この鳴き声は一見ワシ、ヒョウと特定の危険の原因を参照(referential)しているように見えるが、声が単語として特定の動物を表象しているかどうかはかなり疑問だ。実際には、「空から危険が迫っているので地下に潜れ」のような、一言で全てを命令するholisticな内容を持つ鳴き声と言える。同じように、赤ちゃんの発声も「お腹が減った、おっぱいが欲しい」のようにひとつのフレーズが分節されないで表現されるholisticな言語だ。

Holistic & manipulative languageの構造がピッチやリズムの変化だけで表現される音の塊の上に、他人の行動を促す強い感情がかぶさっている点で、音楽と多くの共通性を有している。そのためMithenは、この段階のプロト言語が音楽と一体となって進化したと考えている。この考えに基づいて、彼は前回の図４で紹介したように、直立原人からネアンデルタール人までの進化過程で、Holistic languageは音楽とともに十分な進化を遂げ（複雑化、多様化）、例えば獲物のモノマネのなどのジェスチャーを組み合わせれば、ネアンデルタール人がグループで大型動物を狩る時のコミュニケーションを十分まかなうことができたと考えている。
もちろんこれが正しいかどうかは見てきたわけではないし、また遺物が残っているわけではないのでわからない。しかし、例えばレンジャー部隊が手の合図だけで、複雑なタスクを実行してしまうような映画を見ると、Hoistic languageの力は十分位理解できるし、十分あり得る話だと思う。

しかしこうして生まれた manipulative languageによるプロト言語段階はホモサピエンスの誕生とともにreferential languageへと変化して、今回議論したような、身体から独立した進化する言語体系が可能になった。強く感情に支配されるHolistic languageは身体から独立できず、進化の速度は極端に遅い。次回から言語発生にとって最も重要な段階に進んでいくが、この問題を考える前のコミュニケーションの基本条件として理解しなければならないのが、「他人も自分と同じように考えることができることの認識」、すなわち「Theory of Mind」の問題だ。次回はこれについて考えることにする。
[ 西川伸一 ]

言語・社会性・Theory of Mind
2017年8月15日

今回から２回にわたって言語発達と社会性について考える。

何歳ぐらいから私たちは周りの人の顔色を伺って過ごすようになるのだろうか？今現役を退いて、部屋でゆっくり論文を読んだり、原稿を書いたりして、あまり人とは接しない時間を持てるようになると、自分が人の顔色を常に伺っていることを実感する。一人の時間が終わると、家族や友人は言うに及ばず、街中で多くの見知らぬ人と出会う。行きすがりの人について一々深い空想を巡らせるほど偏執狂ではないが、顔をチラッと見て「急に襲ってはこないか」など無意識に判断している。ましてや満員電車に乗ろうものなら大変だ。周りの人をそれとなく窺い、争いが起こらないように、あるいは痴漢と間違えられないよう、最適のポジションを探してしまう。

家族ならある程度心が読めるが、赤の他人の心の中などほとんど何もわからないことがわかっているのに、人間は他人が何を考えているのかを知ろうと、多くの努力を払っている。程度の差はあれ、このように日々他人の心を読もうと常に努力するのは私だけではないはずだ。というのも今の世の中では、このような意図が欠けている人は、病気だと診断される。例えば自閉症スペクトラムと診断された人たちがその典型だ。

現在では、自閉症スペクトラムは病気ではなく脳の多様性として捉えることが普通になっている。この観点に立つと、自閉症スペクトラムの人は、他人の心を読もうとする悲しい人間の習性から解放された人たちということができる。ただ、問題は自閉症の人たちの多くが、言語障害など様々な社会への適応障害を同時に併発している点だ。従って、脳の多様性だと放っておくことはできず、社会と折り合いをつけるためのプログラムが用意される。プログラムの多くは、できるだけ早期に診断して、脳回路がフレキシブルな発達期のうちに介入して言語や社会性を回復させるよう計画されている。そこで、フロイトをもう一度思い出しながら、乳児の脳の発達を見てみよう。

脳科学的な表現を用いて言い換えると、フロイトは自我を、生まれたばかりの脳が持っている自己基盤が、体験により書き換えられた結果と考え、特に幼児期の体験の重要性を強調した（第７８話）。もちろん脳の自己の書き換えは一生を通じて行われており、自我の形成へ影響を持つ体験は幼児期に限らない（PTSD:心的外傷性ストレス障害はその典型だ）。ただ、幼児期にインプットされる体験は、外界からのインプットをほとんど受けたことのない脳に対する最初の体験である点、またインプットの種類が限られている（と私たちは思っており）点で、成長後の体験と比べるとそのインパクトは相対的に大きい。逆に言うと、体験を重ね、書き換えが進むと、体験のインパクトは低下するため、一般的な体験の自我形成への影響は低下する。繰り返すが、感覚器の発達していない乳児の体験は、個体間での違いが少ない。事実生後２−４ヶ月まで、耳は聞こえても成人の感覚入力の８割を占める視力はほとんどないと考えていい。当然母親の顔をはっきり認識はできない。このため、最初の経験は、音、匂い、そして母親との直接コンタクト、それも乳房に対する皮膚感覚や味を介して入ってくる。インパクトの大きい最初の体験は、個体間の多様性が限られているからこそ、人間の自我が持つ共通性の重要な要因になっている。フロイト的に言うと、「自我形成には、人類共通に「口唇期」の母親の体験が重要である」となる。

フロイトはこの体験が決して受身的なものでないことを見抜いており、これを「対象備給」と呼んだ（第７８回）。すなわち、乳児が目の前の対象に注意を払うことが、欲動にドライブされる能動的な過程であることをこの特殊な言葉で表現した。この力動を欲動というより本能といった方がいいかもしれない。乳児期にだけ「口唇追いかけ反射」とよばれる母親の乳房を探す反射が存在するが、これも能動的に体験を求める一つの駆動力になっている。実際この外界への能動性が乳児の特徴と考えられている。まだ視力が完全でなく物の区別がつかない３−４ヶ月までに、正常の赤ちゃんは必ず相手の顔をじっと見つめるようになるし、動く物体を追いかける。また、音がする方向に顔を向ける。このように、視覚が発達する時期までに、能動的に体験を積み重ね、最終的には家族とそれ以外を見分けることができるようになっている。フロイト的には、この過程こそが母親、父親と、自分の関係を理解し整理し、母親への欲動の抑制などが始まる重要な時期になるが、今回は議論せず先に進む。

図１は、米国疾病予防管理センターが、乳児の発達異常を発見するために公表しているチェックリストだが、もし乳児が音に反応せず、動くものを見つめず、笑わず、口に指を持って行かないならすぐに医師に相談せよと強い口調で警告している。もちろん自閉症スペクトラムが診断の対象ではないが、能動的に体験を求める行動が見られないことは、自閉症スペクトラムを含む、発達障害が強く疑われることを示している。

図１：米国疾病予防管理センターから出ている、発達障害早期発見のためのチェックリスト。

診療現場では、社会性の欠損、反復行動、そして言語の発達障害が自閉症スペクトラムの最も重要な診断基準になっている。図２は、Autism Speaksと呼ばれる自閉症スペクトラムの患者さんのために活動している団体のサイトから転載した表で、自閉症スペクトラムでみられる主要な症状、および関連する疾患が描かれている。

図２：自閉症最大の患者さん支援団体Autism Speaksが示している自閉症の主要症状と、他の様々な異常との関係を描いた図。
出典：http://www.autismspeaks.ca/about-autism/signs-and-symptoms/

この表から自閉症スペクトラムがいかに一筋縄でいは扱えない、多様な状態の集まりであるかがわかるだろう。特定の遺伝子変異に起因する一部の症例を除くと、自閉症の表現形はほとんど個性と言ってもいいほど多様だ。事実、最近急速に進展しているゲノム研究では、自閉症スペクトラムと関連する遺伝子はすでに１００を超え、特定の遺伝子だけで説明することは難しい。しかし、早期発見のための乳児の症状チェックリストをよく読むと、自閉症の背景には能動的に新たな体験を求める衝動の低下があるように私には思える。すなわち、他人の顔を伺い、心を読もうとする衝動を形成する脳回路が最初から低下している。事実、多くの研究は、自閉症スペクトラムの人は脳回路の構築が異なっていることを示唆している。例えば、扁桃体に留置した記録電極を用いた研究では、普通多くの神経が目に反応するのに反し、自閉症では口に反応することが明らかにされている。すなわち、自閉症では神経細胞レベルで刺激反応性が異なっていることを示している。

ただ、脳の状態が症状として現れるのは、これらの単一神経レベルの反応が統合された結果で、これを脳科学の言葉で説明するのはまだ簡単でない。例えば、先に挙げた自閉症児で低下している他人の心を読もうとする衝動と能力は、人間特有の性質として研究されているが、その神経科学的本態の理解にはまだまだ研究が必要だ。この能力をmind readingと分かりやすい形で表現することもあるが、心理学や哲学ではこれをTheory of Mind(ToM)と呼び、様々なテストが開発されてきた。中でも自閉症を理解するためのテストとして研究に使われるのが、False-beliefテスト（他人の間違った考えをわかるテスト）だ。

ToMテストの中で最も有名なのが「サリーとアンのテスト」とも呼ばれているテストだ。図３に示すように、このテストでは、２人の女の子が登場する一連の場面を理解させる。
「同じ部屋に、サリーはバスケットを、アンは箱を自分の持ち物をしまう場所として持っている。ある時サリーはアンの眼の前で自分のボールを自分のバスケットにしまう。サリーが去った後、アンはそのボールを自分のボックスに移して部屋を去る。その後サリーがボールで遊ぼうと部屋に帰ってくる。」
この状況を理解させた後、

１）ボールはどこにあるでしょうか？
２）サリーはどこにボールがあると思っていますか？
と質問する。

図３：ToMの能力を知るための定番都なっているサリーとアンのテスト。フランス語版Wikipediaの図を改変して示している。

質問に対し、３歳児までは実際に自分で見たことだけが優先され「ボールは箱にある」ことはわかるが、サリーがどう考えるかは理解できていないことが普通だ。しかし４歳児になると、「ボールは実際にはアンの箱の中にあるが、サリーはバスケットの中にあると思っている」ことがわかるようになる。ところが自閉症スペクトラムの子供は、４歳児をすぎても今ボールが箱の中にあることはわかっても、サリーがどう考えているかを理解できない。すなわち、他人の立場で考えようとするモチベーションがない。自閉症スペクトラムの症状は多様で、言語能力も個人により違っているが、自閉症スペクトラムの人に限って調べた研究でも、ToMと言語能力が相関することも明らかになっている。

余談になるが、最近このサリーとアンテストを、類人猿で行った論文がScienceに掲載された（Krupenye et al, Science, 354:110）。詳しくは紹介しないが、京都大学のチンパンジー施設やドイツマックスプランク研究所で行われたビデオを見ると、サリーとアンのテストがそのままサルでも理解できる様改造され利用されているのがわかる（https://www.youtube.com/watch?v=1s0dO_h7q7Q）。

さて、自閉症スペクトラムの児童研究からToMの発達と言語能力の発達が強く相関していることをわかってもらったと思うが、ではなぜこの様な強い相関がToMと言語間に生まれるのだろう。 ToMは、言葉が話せる様になった後に確認できるようになるため、自閉症児でのToMの障害は、言語能力の障害による二次的な結果ではないかという考えがある。もちろん否定はできないが、口唇期に始まる乳児脳の発達過程で体験を求めて外界へ注意を向ける本能や欲動が、自我の形成に大きく関わっていることを考えると、両方の障害はこの発達期に経験を求めて外界を注視する本能・欲動の低下に大きく影響されているのではないかと思える。図２に示した自閉症スペクトラムのもう一つの重要な症状、繰り返し行動も、外界への能動的注視が抑制され続けた結果、変化を嫌うようにったと考えることができる。

個人的な仮説に過ぎないが、もしこの本能・欲動の回路発生段階での形成が自閉症スペクトラムの子供でうまく形成されないとしたら、他人の気持ちを理解するという動機や、言葉を話そうとする動機も失われるだろうし、そもそも変化自体を嫌う性質が前面に出て、繰り返し行動が目立つようになる。こう考えると、自閉症の重要３症状を納得することができないだろうか。以前人間の行動の動機を支配するのは、結局感情であることについて説明した。実際、自閉症スペクトラムの成人の多くがアレキシサイミア（失感情症）を併発する確率が高いことが知られている。さらに機能的MRIを用いる研究から、自閉症スペクトラムでは感情のサーキットの一端を担う島皮質の活動が低下していることも示されている。このように能動的に体験を求める本能・欲動の障害を、感情障害の一つの表れと捉えることは可能だ。

しかし一方で、自閉症スペクトラムの人たちは音楽を通した感情の伝達や受容については普通の人と同じかそれ以上であることが多くの研究により明らかにされている。さらに、言葉の障害があっても、歌を通してであれば言葉を話せる例があることも報告されている。音楽も感情の伝達であることを考えると、音楽を介する感情の伝達は、自閉症スペクトラムの感情の表現や理解の障害に関わる島皮質とは異なる領域に支配されていると考えられる。いずれにせよ、音楽を介する感情伝達がほぼ正常であるということは、自閉症スペクトラムでは感情が欠如していると考えるより、感情の表現や受容のための一つの回路の形成がうまくいっていないと考える方が良さそうだ。現在では、この事実を利用して、音楽を介する感情の伝達回路を使って、自閉症スペクトラムの子供と交流し、できればもう一つの回路も回復させられないか、いわゆる音楽療法が盛んに行われている。
少し長くなりすぎたので、今回はここで終わる。次回も言語と社会性の問題について考えるが、まず今回残してしまった、自閉症スペクトラムの逆の症状を示す発達障害、すなわち人懐っこい社交性を持ち、知能に比して高い言語能力を持つWilliams症候群から始めたい。
[ 西川伸一 ]

言語の発達と社会性 II
2017年9月1日

前回から続いて、言語と社会性について考える。

前回、言語と社会性の発達が遅れ、反復行動を示す自閉症スペクトラム（ASD）を例に、他人の心を理解する能力theory of mind(ToM)に代表される社会性が言語能力に大きく影響し、またこの能力が生まれた時から脳が本能的に持っている能動的に外界へと経験を求める力動を条件にしている可能性について考察した。外界へと積極的に新しい経験を求める本能や情動は（モティベーションと言っていいかもしれない）、フロイトが自我形成に関わる力動として定義した「対象備給」に相当する。フロイトが考えたように、自我は最初から備わっているわけではない。誕生時に備わった最初の自我基盤を、能動的に得られる新しい経験によって書き換えることで形成される。従って、得られる経験の違いは自我の傾向に大きく影響するし、自我形成過程で経験を求める回路の一部が閉ざされてしまうと、形成される自我の安定性や構造は大きく変化する。
以前述べたように（意識と無意識＊http://www.brh.co.jp/communication/shinka/2017/post_000007.html）、すべての経験を自我の書き換えに使えるわけではない。毎日体験する膨大な神経インプットの中からほんの一部が選択され（意識過程）、それが自我の書き換えに使われる。この時どの経験を自我の書き換えに利用するかを選択するフィルターの一部は、書き換えられつつある自我そのものである点が重要で、この結果、初期に形成された自我の持つ傾向は、成長とともに増幅されていく。

ASDは外界へ向く力動の低下で、外界とのコミュニケーションに関わる多くのチャンネルが細くなっていると考えられるが、前回述べたように音楽を介する感情の表現や理解は正常以上に保たれている。このことは、自我形成に必要な外界とのコミュニケーションのためのチャンネルは多様で、太さも個人差が大きい。それぞれのチャンネルの総和が幼児期の個性を作る重要な要素として働くが、このチャンネルの種類や太さが遺伝的な原因で特定の偏りを示す場合、形成された自我に共通の特徴が現れることになる。

その一つの典型が、一見自閉症とは全く反対の症状を示す病気ウイリアムズ症候群(WS)に見られる。この病気は1961年にニュージーランドのWilliams医師らにより、大動脈弁の上部の狭窄と特徴的な行動異常と知能障害を示す発生異常としてCirculation誌に発表された（図１A）。

図１ A)　Williams症候群が初めて疾患として定義されたCirculation の論文。 B)　Creative Commonsとして登録されているNikitina等がActa Naturaeに掲載した総説論文。写真は全てこの論文から転載している。右端には、WSの子供による手本になる絵の模写を示している。一つ一つのアイテムは認識できても、その空間的位置関係の理解が失われているのがわかる。(Nikitina et al, Acta Naturae, 6,9, 2014)

無味乾燥な医学的表現で症状を列挙すると、１）時に致死的な大動脈の狭窄、２）特徴的な容貌、３）高カルシウム血症、などを中心とする身体的な異常と、精神的異常として、１）空間的バランスの認識異常（図１：簡単な絵もうまくコピーできない）、２）IQ５０程度の知能障害、３）高い社会性、４）怒りを理解する力の低下、４）正常以上のボキャブラリーや多弁、などが主症状として挙げられる。身体症状はもっと多彩で、例えば糖尿病の発症も多くのケースで見られる。後で述べるが、この多彩な症状はWSが７番染色体の大きな欠損により発症するためだ。ただ、ここでは精神症状に絞って見ていく。

残念ながら私も症例を見た経験がないので、生き生きと表現するのは難しいが、WSの行動についてもう少しわかりやすく説明してみよう。図１Bはロシアの研究者の総説から転載したWSの子供たちの写真だが、これを見ると,年齢にかかわらず皆楽しそうに笑っている。この人懐っこさは外見だけではない。「誰にも愛され、誰もを愛し、チャーミングな性格」と表現されるように、見知らぬ相手でもじっと目を見つめ、近くに寄って話しかける。同じ総説によると「In WS, the gregarious personality is characterized by a consistent increased interest and approach to strangers, …」と表現されており、「見知らぬ人（もの）に対して興味を持ち続け、近づこうとする」性質を持っている。これは外界からの経験を求める力動が低下したASDのまるで逆で、WSの子供は一般の子供以上に、外部と関わろうとする強い力動が発達していることがわかる。言い換えると、外部へのチャンネルが太いと言える。

この積極性はかなり早い時期から見られることが報告されているが、WSの子供が相手の怒りを理解できないことは、WSを理解するヒントになる。ASDの場合最初から人を避けるので問題はないが、WSの人懐っこい性質は無防備と裏腹で、危険を伴う。このことから、経験を求めて外へ向く本能は、ある程度抑制されており、ASDの場合はそれが強すぎるが、逆にWSではその抑制がはずれれており、人懐っこい性格につながっているのかもしれない。正しいかどうかはわからないが、わかりやすく理解するために、ASDの子供で細っているチャンネルの少なくとも一部がWSでは太くなっていると勝手に考えることにしている。

しかしこの考え方がまんざら間違っていないことが、脳イメージングによる研究で示されている。私たちの行動のモチベーションに関わる脳回路として、前頭前皮質と辺縁系の扁桃体、腹側線条体を結ぶ、褒美のシグナルを発生させ満足させる回路が存在し、感情と感覚や行動を支配している。なかでも扁桃体は表情から感情を理解する過程に関わる領域で、例えば見つめ合う行動にこの領域は必要だ。ただ、小さな扁桃体にも１３の核が存在し、ASDやWSの行動を扁桃体全体の活動状況と照らし合わせることは難しい。それでも、ASDでは扁桃体は大きくなって、興奮しやすいことが知られている。一方、怒りの症状に対して普通なら反応する扁桃体が、WSではほとんど活性化されない。想像をたくましくすれば、扁桃体の一部の活動が、外への動機づけのチャンネルの太さの調節に関わっており、ASDでは活性が高いため抑制され、一方WSでは活性が低いため抑制が効かないと考えることもできる。

ただ、これは外に向いたチャンネルのほんの一部だ。例えば、WSの子供は音楽能力が優れていることが知られており、この点ではASDと同じだ。このように、外部に向いたチャンネルの中には、音楽を介する感情のチャンネルのように、WS、ASD共通に太くなっているものもある。一方、前回議論したToMはASDだけでなく、これほど人懐っこいWSでも形成が遅れている。このことから、外部に向けられたチャンネルがToMの発達を決めるのではないこともわかる。
社会性の生物学の対象としてWSに注目が集まっているのは、７番目の染色体上の、7q11.23に構造的に非対立性組み替えが起こりやすい領域があり、ほぼ全てのWS症例でこの部分の欠損が見られるからで、欠損遺伝子の機能解析から社会性を分子生物学的に明らかにできるのではと期待されてきた。WSではほぼ例外なくこの領域の欠損があるが、WSには遺伝性はなく、両親は遺伝的にも正常だ。生殖細胞の発生過程や極めて初期の胚に新たに欠損が起こった結果症状が生まれると考えられている。

図２：7q11.23上にあるWSで欠損する領域（破線で欠損部分を示している）と、対応するマウスゲノム領域。NIkitinaの総説から転載。

WSのほぼ全てのケースで同じ欠損が見られとしても、実際には人懐っこい性格などの社会性を遺伝子から説明するのは簡単ではない。というのもWSでは欠損は片方の染色体だけに限局しており、さらに、欠損場所には26-28種類の遺伝子がコードされている(図２)。すなわち症状を理解するためには、遺伝子発現量の違いで起こる細胞レベルの変化をとらえ、それを脳の複雑な機能と対応づけるという難しい課題を克服する必要がある。
WSの遺伝異常を症状と関連づける目的で現在行われている研究の方向性の一つは、各遺伝子のノックアウトマウスの作成で、図３に示す様に、WSと関連がありそうな形質を示すマウスが作成されている。

図３　WSで欠損する遺伝子のマウスでの機能。

図３に示した様に、FZD9、STX1A、LIMK1,CLIP2、GTF2iなどが欠損すると、確かに様々な脳高次機能の異常が認められる。特にLIMK1, CLIP2では明確な空間認識の異常が検出されており、WSの症状のモデルになる可能性がある。また、FDZ9ノックアウトマウスでも海馬の細胞死の亢進、癲癇発作の閾値の低下とともに、やはり空間認識障害が報告されている。しかしほとんどの研究は遺伝子が完全に欠損したマウスの解析で、WSの様に片方の染色体だけで遺伝子が欠損するhemizygousマウスの解析はほとんど行われていない。おそらく、明確な異常が検出できないと考えられる。しかし、hemizygousでも変異が組み合わさった場合は、十分異常が検出できる可能性は大きく、今後の研究が待たれる。一方完全欠損が胎生致死のGTF2iについては、hemizygousマウスの行動解析が行われており、WSと同じで、初めて出会ったマウスに対しても警戒心が低下していることが報告されている。

以上の様にノックアウトマウスの解析からWSの症状理解のためのヒントが得られることは間違いないが、WSの多彩な症状をマウスの解析結果のみから推察することは難しい。そこでもう一つの方向として、WSで欠損する大きな領域の中の一部だけが欠損したWS症例を探す努力が並行して行われている。例えば、図２で示した領域のうち、STX1を残してそれより右側の遺伝子だけが欠損している場合でも、完全なWS症状を示すことが報告されており、WSにはSTX1より左側の遺伝子はあまり重要な役割を持っていないことが示された。また、LIMKは欠損していてもGTF2iが欠損しないケースでは、心臓の奇形と空間認識異常は見られるが、精神発達は正常であることが報告されている。この様に、不十分とはいえ少しづつ遺伝子と症状との対応が明らかになってきており、これまでの研究を総合すると、GTF2iに近い領域がWSの精神症状に深く関わると言っていいだろう。

そんな矢先、驚くべき論文がプリンストン大学からScience Advances7月号に発表された。この研究では、オオカミから犬へと家畜化が進む過程で獲得される人間に対する高い社会性をもたらせたゲノム変化の特定が試みられた。そして驚くことに、WSで欠損するGTF2iとその隣のGTFIRD1のコーディング領域の変異による分子の構造変化がこの社交性を説明することが示された。

図４：犬とオオカミを比べて、犬の社交性に関わる遺伝子がWSで欠損している遺伝子であることを示した論文（vonHolt et al, Science Advances e1700398, 2017）。

この研究も合わせて考えると、社交性に関わる脳回路形成にGTF2iとその近くの領域はますます重要になったと結論できる。
最後にWSの言語発達についてまとめておく。発表当初から、WSの多弁を含む高い言語能力に言語学者は大きな興味を抱いてきた。この結果、言語発達や起源についての著作には必ずWSの言語能力が記載される様になっている。ただ、研究が進むとWSには多くの精神発達障害が重なっており、言語能力についてもこれらの障害の影響が大きく、単純な枠組みで理解することは難しいことがわかってきた。このことを認識した上で、あえて単純化してWSの言語能力をまとめてみると次の様になるだろう。

１）言葉の理解や発達は遅れる（これはIQが６０前後であることを考えると当然と思える）。
２）赤ちゃん言葉やジェスチャーなど、外へ働きかける行動の発達は正常で遅れはない。
３）遅れて始まっても、言語の発達は急速で、特に流暢に言葉を使う。
４）ボキャブラリー、特に感覚と直接対応できる単語の記憶は普通の子供より優れている。
５）話し言葉の文法についてはおおよそ一般児と同じだが、ラテン系の屈折語で単語の性の区別が上手くできないなど、苦手な部分も存在する。
これらの結果は、知能の発達が遅れていても、言語を正常に獲得できること、さらにWSのように外界とコミュニケーションを取ろうとするモチベーションが高いと、一般児を凌駕する言語能力が獲得できることを示している。言い換えると、言語獲得には知能より高い社交性がより重要であることがわかる。
言語の２重構造を思い出してもらえば、知能の発達が遅れていても、言語が十分発達できることが理解できる。言語は私たちの脳から生まれてきたものだが、子供が言語を獲得するには、まず社会で維持されている言語にアクセスし、それを学ばなければならない。すなわち総体としての言語も、新しい社会のメンバーに使用されて初めて発展するため、必然的に子供が学びやすい構造を発展させてきた。このおかげで知能の発達が遅れていても、強い外部へのモチベーションを持つWSは高い言語能力を獲得できる。もちろんこのシナリオは私の想像でしかないが、ASDとWSの研究を通して言語の発生に必要な要因が明らかになると期待できる。
次回は言語と社会性の最後として、では社会で共通の言語部分が存在しないとき、人間は言語を獲得するのかを考えてみる。
[ 西川伸一 ]

言語と社会性　III
2017年9月15日

問題の重要性から、言語と社会性についての話が少し長くなってしまったが、最終回は、「社会で共有する言語にアクセスできずに育った個人はどうなるのか？」という問題を考えよう。

プサメティコス王の禁じられた実験
「言語は習わなくとも人間の脳機能として本来備わっている」という命題を確かめる方法が一つある。生まれたばかりの何人かの子供を、社会から隔離し他人との言語によるコミュニケーションが全くない状態で育ててみて、子供達だけが何らかの言語をコミュニケーションに使うようになるか調べることだ。どんな形であれ、もし彼らが共通のコミュニケーション手段を開発できれば、言語は習わなくても人間さえ集まれば自然に発生すると結論できる。しかしこの実験は理論的に可能でも、もちろん禁じられた実験だ。
ところがギリシャの歴史家ヘロドトスは、そんな禁じられた実験をした王様の話を書いている。それがエジプト第26王朝のファラオ（王）プサメティコス1世（紀元前664-610年）で、プサメティコスの禁じられた実験として知られている。プサメティコス1世は地球上に最初に誕生した言語は何か知る目的で、生まれたばかりの双子を誰も住まない島で言葉を全く使わずに成長させ、最初に何語を話すかじっと待った。そして2年目、ついに子供達が最初に発した単語が「bekos(フリギア語でパン)」だったので、最初の言語はフリギア語だと結論したという話だ。この話は、人間は習わなくとも言語を話すことができると古くから考えられていたことを示すエピソードだが、歴史家ヘロドトスの記述とはいえ、本当にあった話かどうかはわからない。

図１ミルクを作るプサメティコス１世のレリーフ（出典：Wikipedia）

この話を言語の二重構造性の観点から考えると、社会で共有する言語に全くアクセスできなくとも私たちの脳の延長として存在している言語を介して他人とコミュニケーションを図る本能により、社会で共有できる新しい言語を自然発生させ得ることを意味する。従って、プサメティコスの実験を「社会で共有される言語に全くアクセスできずに発達すること」と読み替えると、わざわざ人間を隔離する禁じられた実験は必要なく、世界を見渡せば同じような実験は現実に進んでいる。その一つは、幼児期に社会から完全に隔離された子供（野生児：Feral child）の言語発達で、もう一つは生まれつき完全に聴力が失われ、既存の言語から隔離されたろうあ者たちの言語だ.

野生児

図２インドで発見された野生児Kamala。最終的には２本足で立ち、普通の食事をするようになったが、単語は５０語を覚えるのがやっとだったとされている。（出典：Wikipedia）

古くから動物に育てられた野生児の話は数多く知られている。もっとも有名なのは1920年インドで発見された狼に育てられたと称するKamalaとAmalaで（図２）及び図３右端の本に詳しく記載されている。発見後9年たってようやく５０語を話すようになったことが記載され、社会から隔離され言語が全く存在しない条件で育てられると、人間社会に戻っても言葉を学習するのが難しいことを示している。
さらに最近では1972年にインドで発見された、やはり狼に育てられたと称するShemdeoについての研究が報告されており、1985年に亡くなるまで、一言も人間の言葉を話さなかったことが記載されている。

生後間も無く社会から隔離された（？）ケースをまとめると、最初は4足歩行で生肉を食べ、もちろん言葉を話すことはなく、人間に対しても強い警戒心を持つ。ただ時間が経ち、人間への警戒心がとけると、２足歩行や食事などは一般人と同じ様に振る舞えるまで回復するが、言語だけはほとんど回復しないことが共通だ。これらの話は一般の関心も高く、図３に例示するように、ノンフィクションとして繰り返し出版されている。

図３：動物に育てられた子供についての本は数多く出版されている。他にも、親のネグレクトで社会から隔離された育ったGenieについてのノンフィクションも読むことができる。（出典：Amazon.co.jp）

ただこれらの例は本当に狼によって育てられたのか、発見されるまでの状況について確たる証拠がないことや、科学的、心理学的な研究がしっかり行われていないことが多く、そのまま結論を鵜呑みにするのは危険だと思う。

これに対し、幼児期から極端なネグレクトをうけて社会から隔離され育ち、１３歳で発見された子供Genie(図３右写真)については詳しい科学的調査が行われ、研究論文も多く発表されている。Genieの場合は、１３歳まで全く言語から隔離されていたにもかかわらず、発見後の訓練で言語能力はおどろくべき発達をとげたことが記載されている。

野生児の観察から、人間の言葉の学習には重要な時期があり、その時期をすぎると言語を覚えることは人間でも難しいと結論された。事実、鳥がさえずる能力を獲得するためには決まった時期に鳴き声を学習する必要があることは、古くからよく知られた事実だ。しかし、Genieの例は、少なくとも人間に関しては、言語習得に絶対的な時期的制限はないことを示唆している。ただGenieの例からだけで、幼児期の学習が言語習得に必要ないと結論していいかは疑問だ。すなわちGenieが既存の言語からどの程度隔離されていたかについては、関係者の証言から想像する以外に方法がないことだ。いくら周りから謝絶された小部屋に隔離されていたとはいえ、部屋の外では様々な言葉が聞こえたはずだ。また、動物に育てられた子供と違い、ネグレクトの場合は、無言のまま行われたとしても、食事は人間により提供されたたはずで、当然父親や母親など世話をする人間との限られたコンタクトはあったはずだ。もし動物に育てられた野生児の言語が回復せず、言語を通したコミュニケーションから隔離されたネグレクトの子供の言語は回復するとすれば、希薄であってもこのような人間社会とのコンタクトが特定の時期にあったかどうかが言語の発達可能性を決めている可能性もある。

ろうあ者とSign Language(手話)
既存の言語を介するコミュニケーションは全くなくても、社会の中で他人と関わることで言語が自然に話せるようになることを示す例が知られている。ろうあ者と健常人、あるいは、ろうあ者の間に自然発生する手話だ。現在日本で多くのろうあ者に使われている日本手話（日本語対応手話とは異なる）も、日本語とは無関係にろうあ者のコミュニケーション手段として自然発生してきたものだ。ただ、最初から成り立ちを完全に追いかけることができる手話は多くない。
成り立ちが追跡できる手話は、Village sign language（村落手話：家庭内のHome signも含む）とdeaf community sign language（ろうあ社会手話）に大きく分けることができる。

Village sign language(VSL)は、家族や集落の中で（遺伝的に聴力障害が多い家族や集落である場合が多い）、ろうあ者とコミュニケーションを図るために自然発生してきた手話で、その誕生には必ず健常者が関わっている。中でもよく研究されているのが、4人のろうあの子供を持ったベドウィンの家族内に1930年ごろ誕生し、その後世代を重ねて、4000人の村落のすべてのろうあ者（１３０人）が共有するようになった手話、Al-Sayyid bedouin sign languagee(ASBL)だ。
ASBLだけでなく、他の自然発生手話からわかることは、発生した手話の文法構造は、家族内の健常人が話している言語の構文構造と必ずしも一致しない点だ。また、VSBLをはじめ様々な自然発生手話同士構文を比べても、特に手話に共通にみられる構文構造は見られない。それぞれのVSLは、それぞれ独自の構造を持っている。このことから、VSLが小さな集団から独自に発生し、発達してきた言語であることがわかる。

現在ABSLを利用している異なる世代のろうあ者が使っている単語や構文ルールが比べられ、最初ほとんど１−２語の構文というより発語から始まったABSLが、世代を重ねるとともに、様々なインプットを統合することで複雑化したことが明らかになっている。最初家族内で使い始めたシンボル化された単語が何で、構文がどんなものだったかについては、調べて見たが残念ながら記載はない。しかし現在では言語と呼ぶにふさわしい十分なボキャブラリーと文法構造を持ったABSLへと発展しているのを見ると、偶然に始まったにしても「シンボル化された単語を他の個体と共有する」スタートが切れれば、参加者が増えるに従って言語が自然に高い機能を持った複雑な言語へと発達することがよくわかる。
しかしABSLが既存の言語の影響を受けずに自然発生したと結論するのはまだ早い。言語を話す健常人は、一つのセンテンスが、各単語を決まった順番に並べること（構文）でできていることを知っており、構文ルールがコミュニケーションに必須であることはよくわかっている。さらにシンボル化された様々な単語を創作する段階でも、健常人の持つ単語の成り立ちや性質についての理解が、手話の成立過程でインプットされた可能性は否定できない。また、健常者も話しながら自然に身振りを使うのが普通で、これが手話発生に影響しないとは言えない。このように、健常者が母国語として使っている言語の構文と異なるというだけでは、VSLを既存の言語から独立した、独自に自然発生した言語であるということは難しい。

ニカラグアの手話
この懸念を完全に払拭し、一定の数のメンバーからなる集団内でコミュニケーションが必要になると、健常者の参加無しに、ろうあ者のみの力で言語を誕生させられることを示したのが、ニカラグア手話だ。
1977年聾唖学校が設立されるまで、ニカラグアのろうあ者の養育は各家庭に任されており、全く手話は存在しなかった。実際、こうして成長した現在６５歳以上のニカラグアのろうあ者は全く手話を使うことができない。その後1977年になって、30人規模の聾唖学校が設立され、1979年サンディニスタ政権誕生後は各地からろうあの子供が集められ生徒数が急速に増加、1983年には400人が特別学校で教育を受けるようになった。
この最初に集められた30人の集団から、最初のニカラグア手話が誕生し、これを基礎にして、学校に集まった生徒に受け継がれ、また多くの参加者からの新しいアイデアを取り込んで発展し、現在では子供から大人までニカラグアの多くのろうあ者に使用される言語に発展した。重要なことは、この言語発生過程のほとんどが追跡できることで、最初の発生に関わった第一世代および、その後のボキャブラリーや構文の発展に寄与した後の世代のほとんどが生きており、その時の様子を検証できる点だ。
詳細は省くが、以上の経過から、

１）ろうあ者が単独で健常者の中で生活する限り体系的な手話は生まれる確率が低いこと、
２）しかし一定の数のろうあ者が集まると、それ以前には存在しなかった体系的な手話が発生すること、
３）おそらく最初は１−２語からなる叫びのような発話とほとんど区別できない構造を持った言語でも、異なる個体で使われるシンボルの意味が共有されると（すなわち社会共有部分が発生すると）、あとは使用するメンバーの増加に応じて、進化を遂げ体系的な言語になること、
を示している。

図４：　見ると払うの文法的変化を体の向きを変えることで加えている例。このような新しいルールは一旦発生すると、瞬く間に全体で共有されるようになる。（Senghas and Coppola, Children creating language, Psychological Science, 12:323, 2001に掲載されている図。出典：Wikipedia）

例えば図４は　Ann Senghasの論文から転載した写真だが、手のサインは「見る」と「払う」を意味している。最初体の中央でだけで提示されていたこのサインは、第二世代になると体の中心だけでなく、左右に振ることで、様々な文法的変化を表すようになっている。しかも、一旦発生して便利だとわかると、瞬く間に同じ言語を使う集団全体に広がることも確認されている。一旦生まれると、言語は急速に進化する！！！
もちろん完全に聴覚を失ったろうあ者の中で自然発生したと言っても、発生に関わった子供達は当然文明の洗礼をうけており、人類最初の言語発生を反映していると結論するのは早いだろう。最初の言語が発生する時にはおそらく、集団で共有できるシンボルを生み出すのには長い時間がかかったかもしれない。しかし、人間は集まると、相手とのコミュニケーションを模索する中で、他の個体と共有できる単語と構文を発生させること、そしてどんなに小さなスタートでも、一旦社会で共有できる言語が生まれると、それ自身が異なる個体からのアイデアを統合して体系的言語へと進化できることを、ニカラグア手話ははっきりと示しているのではないだろうか。
次回は、これまでの議論をもう一度整理し直したいと考えている。
[ 西川伸一 ]

情報としての言語
2017年10月2日

これまで、言語誕生過程を構想するために７回にわたって言語の重要な特徴について見てきたが、先に進む前にここで少しこれまでのまとめの意味で、情報媒体としての言語の性質を同じ情報媒体のDNAと比較しながら見ることにする。

1、情報は受け手で決まる
現代は情報の時代で、私たちはどこにいっても情報と情報機器に囲まれ、情報なしに生きることはできないと感じている。職場への行き帰りを考えてみよう。時計が指す時刻に合わせて家を出る。駅では次の列車の時間や行き先をみて、遅れや変更がないかを知り、正しい列車に乗る。列車の中を見渡すと、新聞を読んだり、本を読んだり、あるいはタブレットでビデオを見たりしている人もいる。私はといえば、窓の外の景色、時間、車内のアナウンスなどを情報に、目的の駅に降り立つ。駅から職場までの道では、信号の色の指示に従って交差点を渡る。もちろん、信号無視の車が突っ走ってこないかも気をつける。このように私たちの行動のほとんどは、街にあふれる情報に依存して判断していることは間違いない。
半日の行動を思い返して考えてみて、私たちは何が情報で何が情報でないか判断に困ることはない。ところが、私が情報として利用しているものを、抽象的に定義しようとすると簡単ではない。というのも、掲示板の文字も、信号の色も、さらには窓の景色も、すべて職場に通う私には情報になる。一方、視覚障害の方にとっては、窓の景色も、信号の色も、掲示板の文字ですら情報としての価値を持たない。逆に、歩道の凹凸は視覚障害者には重要な情報だが、障害者でないと気にもならない。このように、何が情報かどうかは、それを必要としている受け手に依存している。そして何よりも、世の中のあらゆるものは、受け手によっては情報になりうる。

もちろん受け手だけが情報を決めるのではない。一般的に私たちが情報と認めるものの中には、出し手が情報としての性質を決めているものも多い。例えば、信号や掲示板の情報は、私が利用しなくとも、誰かの情報として提供したいという出し手の意図がある。もちろん、この原稿と同じで、出し手の情報としての意図が実現するかどうかは、受け手にかかっている。いずれにせよ、出し手が決める情報も、受け手が必ず想定されており、情報は受け手で決まる。
これまでの議論をまとめると(人間が受け手の情報に限ってではあるが)、情報は主に「受け手が行動する際に参考にする知識」であり、この中には「受け手の行動を変化させようと出し手が提供する知識」が含まれる。ただ、出し手の存在は必須ではない。突き詰めると、情報とは受け手の行動のための判断に使われる知識と定義していいだろう。

2、情報は物質ではないが、働くために情報媒体（物質）が必要

図１　クロードシャノンと、彼の課題をまとめた図
シャノンは、情報を物質媒体として正確に伝達するために必要な方法（電線でメッセージを伝える電話）を情報理論として体系化した。（写真と図はWiki Commonsより）

次に重要な情報の特徴は、「それ自体は物理的な量ではないが、それが働くためには必ず物理的媒体を必要とすること」をあげることができる。このことを科学的に体系化したのが米国のクロード・シャノンだが、情報媒体が情報と一体化しており、物質からできているので、情報にも物質性があると混同する人が多い。例えば「日本人のDNA」といった使い方がその例だろう。DNAは物質で、情報ではない。「日本人のDNA」の正しい表現は、「日本人のゲノム」だとおもう。

いずれにせよ、情報が物質でないことは少し考えればわかることだ。例えばこの文章はウェッブを通して約４千人の人に読んでもらっているが、読者に内容を紙に印刷して届けようとすると、コストも人手もかかる。これは、情報を媒体に移した途端物理量になり、その結果情報を移動させるのにも大きな物理的力が必要になる。しかしいつものようにウェッブにアップロードすると、一瞬で何千人、何万人、おそらくその気になれば億人単位の人にも同じ情報を送ることができる。これは情報がより分配しやすい媒体（デジタルパケット）に移されたからだが、情報の内容は同じだ。この媒体を選ばない特徴は情報に物質性がないからこそできる芸当だ。

この例では、私が伝えたかった内容（これも私の頭の中の神経ネットワークのパターンとして媒体化されているが）が情報で、PCに私が打ち込んだ時点で情報は電子媒体に移され、液晶画面上の各ピクセルの色の違いのパターンとして表現できるようになっている。このパターンは、そのままウェッブを通して何千、何万のPCに瞬時に伝達できるし、USBでもハードディスクにでも残しておける。
これまで議論してきたのは人間が出し手の（例では私が出し手）情報だが、人間が出し手でない生物が持つ情報、例えば遺伝情報でも同じで、情報自体に物質性はない。またどんなに大きなゲノムでも、DNAやRNAは当然のこと、紙の上のATCGの４文字でも、また電子媒体でも、異なる媒体を使って同じ内容を表現することができる。

もちろん生物の情報には一見物質ではないかと思えるようなものもある。例えばフェロモンにより接合が始まる例では、フェロモンという物質が情報のように見える。しかし、実際にフェロモンが必要とされる状況を考えると、例えば餌が欠乏したという情報をフェロモンが伝えていると考えられることから、フェロモン分子は情報媒体として働いていることになる。

このように、頭の中で情報と情報媒体は混乱し、どうしても媒体を情報そのものと勘違いする。しかし情報は物質でない点を押さえておけば、何が情報で何が情報でないか間違うことはない。人間が出し手の情報は、数学的に記述できても物質ではない。しかし重要なのは、媒体を介して物質世界で働き、物質と相互作用できることで、これこそがシャノンやチューリングにより始まった２０世紀の新しい科学革命、情報科学革命だ。

私が頭の中に浮かんだ文章を原稿としてPC上にインプットし、またメモリーにストーレージできるのも、すべてこの情報理論のおかげだ。しかし、人間が出し手でない情報、例えば遺伝情報がどう生物に利用され、脳への情報インプットがどのように記憶として残るのかオペレーション原理についてはわかっていないことも多い。すなわち、情報と媒体との関係は、生物学最大の問題として現在も残っている。

3、情報は生物とともに地球上に生まれた
異論のある人も多いと思うが、私は生命が誕生する以前の地球上に情報は存在しなかったと思っている。しかし待てよ、物理現象を記述するためには、対象となる物質の動きや質量の情報が必須であり、この意味であらゆる分子とその動きには情報が内在しているはずだ。生物誕生以前にも物理現象は地球で続いており、あらゆる物理現象に関して情報も存在していたはずだ。だとすると、情報は生命誕生以前から存在したと言えないだろうか？

答えはNoだ。情報は受け手が決める。物理現象に情報が存在するのは、人間がそれを解釈して利用するときだけで、物理現象が情報を持つかどうかは、それを情報として利用できる受け手の能力にかかっている。人間誕生前にも天体の動きは情報として利用されていたが、それは生命誕生後のことだ。一方、生命自体には誕生時から情報とその媒体が内在していた。この生物だけに情報とその媒体が内在し、また情報の受け手となれるという特徴により、物理世界には存在しなかった全く新しい原理が生まれたことをダーウィンは「種の起源」の最後のセンテンスで美しく表現している。

「もともと生命は、様々な力が、一握りの、あるいはひょっとするとたった一つの原型に吹き込まれて始まり、この惑星が重力法則による永遠に変わることのない回転を繰り返している間に、これほど単純な始まりから、最も美しく素晴らしい果てしない形態が進化し、また進化し続けている。このことを考えると、進化の壮大さに心が打たれる」（私の意訳）

この物理世界にはなかった進化する力を持った生命に最初吹き込まれた様々な力のひとつが、情報とその媒体であることは間違いない。

生命誕生を情報の誕生として認めると、地球最初の安定した情報媒体は核酸ということになる。では、この核酸が媒介している情報とは何か？答えは、ATCG４塩基の配列(コード)になるが、実際に核酸が媒介している情報はこれに止まらない。その先には、塩基の配列によって決まるRNAやDNAの構造や機能、アミノ酸に翻訳される場合はアミノ酸の配列、アミノ酸が形成する分子構造とその機能、さらには、その分子と結合する様々な分子、などなど情報のコンテンツは拡大する。わかりやすい例で言えば、「空」という単語の中に、太陽、月、星、そして無限の宇宙は言うに及ばず、それと反対の概念である陸までもが収束しているようなものだ。
このような媒体に無限の情報が表現されているという特徴は、生命の情報媒体全てに言えることではない。例えばフェロモンが担える情報には限界がある。しかし、核酸、脳回路、そして言語の３媒体には、このような限界は全くない。これまで見てきたように、３つの媒体とも質・量ともに無限に拡大できる。また、媒体をコピーすることができる（正確である必要はない：文字が生まれるまで言語も決して正確にはコピーできない）。さらにその媒体が表現している情報と外界との相互作用を様々なレベルで記録することができる。この特徴のおかげで、生命や人間の進化は進んできた。

4、DNAと言語の比較
DNAは情報媒体として働くために、４塩基配列をコードとして使っている。このコード自体は物質ではなく情報だが、媒体と一体化しているので、情報と実際の世界をつなぐ接点として考えればいいだろう。では、言語で塩基配列に対応するコードはなんだろう？これは人間が発声できる音の配列と言える。

図２　言語とDNAを媒体とした情報の比較

次にコードにより表現された単位が来る。言語の場合は単語だが、DNAの場合はアミノ酸からなるタンパク質だけではない。そこでとりあえず機能単位としておく。ただ、話を複雑にしないため、これ以降はアミノ酸に翻訳されてできるタンパク質が、言語での単語に相当するとして話を進める。

ここまで、なんとなく言語とDNAは似ているように述べてきたが、一つ大きな違いがある。すなわち情報の媒体の物質性だ。DNAはタンパク質に対応する情報を表現する媒体だが、この延長で言えば言語を媒介する音は情報の媒体であるのは間違いないが、物質性が希薄で、かなり特殊な媒体であるといえる。
例えば、文字が誕生するまで、言語の記録は私たちの脳内神経ネットワーク以外に記録することは難しかった。要するに、言語の体系は覚える以外、維持することは不可能だった。当然脳の記憶の仕組みから考えると、記録という面ではなはだ心もとない。しかし、以前議論したように言語の場合、個人の脳内に維持されている表象とともに、集団で共有される部分を持つ２重構造になっている。
言語の集団共通部分ではさらに物質性が希薄になる。しかし、集団で共有しているという性格のおかげで、各個人の脳内神経ネットワークの記憶の限界を補うことが可能になっている（次回もう一度議論する）。このように、文字が生まれる前の言語は、音という物質性の希薄な媒体（ほとんど持続できない）に依存しているため、この物質性のなさが、DNAとは大きく異なっていると言える。ただ、この問題は言語の２重構造を実現することで、ある程度解決している。幸い、言語媒体の抱える物質性の希薄性の問題は文字の誕生で解消する。

5、DNAも言語も、媒介する情報は部分と全体が常に一体化している。

図３　メタボリックマップと、分子ネットワーク

もともと生物学では、一つの遺伝子にコードされている分子も、大きなネットワークの中で様々な分子と関係を持って存在するとして研究が行われてきた。例えば、ある分子が加わる代謝マップに存在しないということすら情報になる。（Wiki Commonsより）

図３に代謝マップと、分子ネットワークの例を示したが、情報媒体としてのDNAから学ぶことができるもう一つの重要な点は、一つの情報は決してそれ自身で存在していないことだ。これまで、生命の情報を扱ってきた分子生物学は、どうしても個々の遺伝子に焦点を絞って研究してきた。このため、ともするとDNA媒体により表現されている情報が、特定のタンパク質についての情報であると思ってしまう。しかし、研究対象に選んだ遺伝子が一種類のタンパク質だけをコードしているとしても、その分子は生物の中で他の分子と直接結合するだけでなく、多くの分子と直接間接に相互作用を行っている。すなわち、一つの分子の情報の背景にはその分子だけでなく、多くの過程が背景として存在している。更にある細胞にこの分子が発現しているということだけではなく、例えばアルブミン分子をコードする情報には、赤血球や多くの細胞にはアルブミンが存在しないということも含まれている。結局個々の情報も、全てのゲノム情報と関連している。このことは生物学者なら肝に銘じていることで、生物のもつ部分と全体の特別な関係として研究者の頭を悩ませてきた。

しかし、言語になると、多くの人が言語体系は単語という部分が単純に集まったものとして考えてしまう。これは、多くの人が、言語とは意味しているもの（シニファン：記号）と意味されるもの（シニフェ）が一体化した記号が集まったものだと述べたソシュールの考えを鵜呑みにしているからかもしれない。しかし実際に私たちが「空」という言葉を頭に浮かべる時、決して大きな広い空だけではなく、太陽、月、星、海、陸地など同時に多くの単語を思い浮かべるのが普通だ。実際には空と聞いて、星を思い浮かべていることもあるだろうし、水平線を思い浮かべていることことすらあるだろう。このように、私たちの厖大な経験の一部を単語として記号化したのが言語で、決して記号を集めて経験を作り直しているわけではない。すなわち言語はシニフェとシニファンが一体化した記号を集めて形成されたものではない。

この点を理解するには、言語ともう一つの情報媒体、脳の神経ネットワークとの関係を見る必要がある。次回はこの問題を「言語と脳ネットワークを媒体とする情報の比較」というタイトルで考える。
[ 西川伸一 ]

脳と言語を情報の観点から比べる
2017年10月16日

前回DNAなど核酸と言語について、情報媒体としての観点から比較して、それぞれはあらゆる情報を表象することができるものの、言語を媒体として使う時に必要な「音」がDNAと比べた時、物理性に乏しいことを強調した。もちろん音も物理現象で、物理現象だからこそ情報を媒介できる。誤解を招かないためには、本当は音が物理性に乏しいという代わりに、音が持続性に乏しいといったほうがよかった。しかし、DNAが生物の情報媒体として誕生して以来、新しく進化してきた情報媒体はほとんど持続性に欠ける媒体で、決して世代を超えて情報を伝えることはできなかった。その最たるものが、情報の媒体としての脳の神経回路だ。事実、ある時自分が見たり考えたりしたことを覚えておくのは難しいし、ましてや他人や子孫に伝えることはもっと難しい。脳の神経回路を媒体とする情報の延長上に発展してきた言語が持続性に欠けるのは当然と言っていい。そこで今回から２回に分けて、情報媒体としての神経回路を言語を念頭に整理し直して、言語が神経回路を媒体にした情報処理システムに何を新たにもたらしたのか考えていきたい。

本題に入る前に、情報と情報媒体にまつわる混乱を整理する意味で、「言語は媒体か？情報か？」について少しだけ考えてみよう。言語は私たちが感じたり、考えたりした内容（＝情報）を表現するための媒体として利用されている。ただ、情報を表現するためにはどうしても、単語やさらに小さな単位の音節を一定の法則（文法）に従って並べる必要がある。この音節（単語）の並びに情報性が生まれるのは当然で、並びを正確に伝達する方法の開発が、シャノンの情報科学が生まれる発端となった。同じことは、DNAにも言える。DNA自体は情報媒体だが、一本のDNA鎖は異なる領域に分節され、それぞれの分節は４塩基の配列として表現されている。従って当然配列自体が情報性を持つ。このように情報媒体は情報を背負った途端にそれ自身が情報になる。これが情報と、情報媒体の区別についての混乱の原因になるので注意が必要だ。ただ、音の並びや、DNAの並びを情報として捉えて混乱させているのは、わたしたち人間自身で、実際には言語も、DNAも情報媒体以外の何物でもない。

本題に移ろう。脳については、神経細胞の進化過程から人間に特有な高次機能まで、何回にもわたってその情報処理の仕組みについて説明してきた。これまで議論した詳細については理解していただいていると思うが、おさらいをかねて、まず私たち人間の脳について、情報媒体という観点から整理してみよう。
さて今年のノーベル賞は概日周期のメカニズムを発見した３研究者に与えられたが、情報とは何かを考える良い材料になるので、概日リズムの話から始めよう。

図１：ノーベル財団の今年の医学生理学賞の受賞理由に掲載されている図。
(https://www.nobelprize.org/nobel_prizes/medicine/laureates/2017/press.html) (C) The Nobel Assembly at Karolinska Institute

「DNAは情報媒体として、概日リズム、すなわち地球の自転情報をコードしている」というと、驚かれるかもしれない。図１はノーベル財団から発表された受賞理由に掲載されていた図だが、概日リズムのメカニズムを説明している。しかし目を凝らしても、この図には地球の自転を感知する仕組みは一切見当たらない。それもそのはず、私たちの体にある一つ一つの細胞が概日周期を持っており、これが全てゲノムにコードされていることを明らかにしたことが今回のノーベル賞の受賞理由だ。この細胞レベルの概日周期も、視覚を通して感じた地球の自転情報で調整し直すことが可能だが、細胞の概日リズムの維持に光を感じることは必須ではない。これは、体から分離した培養細胞を真っ暗な部屋で培養しても、リズムは維持されることからわかる。このリズムは、生物進化の過程で、地球の自転という情報がDNAを媒体とした情報としてゲノム上に書き込まれた結果だ。

このことから、地球の自転のような宇宙レベルの情報ですらDNAを媒体とした情報へと書き換えられること、すなわちDNAがほぼ無限の情報を媒介できることがわかる。ただ、DNAに地球の自転情報を書き込むためには、偶然によるDNAにコードされた情報の変化と、変異した情報から生まれる形質の変化を選択し、最も外界にフィットした情報を固定化する途方もない進化の時間が必要だった。このことからDNAを媒体とする情報は、外界を記憶するというより、外界の情報（この場合地球の自転のサイクル）を自己に同化していると考えるほうがいい。しかし組み込む過程は不自由で機動性に欠けていても、DNAを情報媒体としてこれまで生物ゲノムに同化された外界の情報はほぼ無限と言ってもいい。

繰り返すが、この同化過程は、情報媒体に起こる偶然の変化に依存しており、外界の変化に素早く反応することは全くできない。例えば、個体の一生と言う時間スケールで情報に合わせて変化したり、あるいは情報を他の個体に伝達することは不可能だ。このことは、大腸菌を特定の栄養成分が欠けた培地に移して変化に適応させる時、ほとんどの個体が死滅する中で、何百万分の１の確率で生き残った個体だけが、次の世代を作るのを見ればよく理解できる。しかし、個体が外界の変化に適応して生きるためには、素早く外界の変化に適応できる能力の開発が必要なのは明白だ。この問題の解決として、様々なシグナルを使って外界をモニターする方法（例えばクオラムセンシングなど：2016年8月15日進化研究を覗く）が進化した。ただ、情報の解釈、及び記録の両方を実現できる情報媒体として進化したのは、ヒストンやDNAの修飾により遺伝子の利用を決めるエピジェネティック機構だ。この機構の進化により、外界の変化を受けて、細胞を安定的に外界に適応した状態へとシフトさせることが可能になった。この結果、細胞同士がコミュニケーションすることでそれぞれの分化状態を決めることが要求される多細胞体制も可能になった。

エピジェネティック機構はDNAの書き換えを必要としない。その代わりに、細胞内外の情報に従ってDNA上のヒストンやDNA自身を可逆的に修飾し、遺伝子発現を変化させる。すなわち、ゲノム情報の中の特定の組み合わせだけを機動的にON/OFFできるようにすることで、一種の記憶を可能にしたと言える。実際、原則としてエピジェネティックな情報は次世代に伝達されない。しかし、同じゲノムを共有する個体であれば、同じ外界からの刺激をエピジェネティックな記憶として多くの個体で共有することができる。言い換えると、生殖を通してしか伝達できないゲノム情報を、何通りにも違った使い方をできるようにしたのがエピジェネティックな機構と言える。

ただ、エピジェネティック機構を用いた媒体での情報処理には時間がかかり、迅速性にかける。一方、生物はさらに短い時間スケールの変化に囲まれている。特に、光、音、温度のような物理学的変化は短い時間スケールで変化することが普通だ。そして、これらの変化は生命にかかわることもある。しかし、神経系が発達するまでこのような早い変化に生物はついていくことができなかった。言い換えると、これらの問題の解決として進化したのが神経系と言える。
イオンチャンネルを通るイオンの流れをシグナルとして使うことは神経細胞以前から行われている。分かりやすいのが、ミトコンドリアのATP合成に使われるチャンネルだろう。しかし、電位差によって開閉するチャンネルを使って、細胞の端から端まで順番に活動を伝播させるシステムは神経系が最初だ。この膜電位の脱分極による興奮性は、急に開いたチャンネルを通るイオンの流れなので、刺激に対する秒単位の反応が可能になった。

図２：神経系はすべてのシグナルを、膜の興奮に収束させている

これに加えて、刺激の性質の異なる外界の情報を、細胞膜の興奮という統一した仕組みにいったん収束させることが可能になったことが（図２）、情報媒体としての神経系の特徴だ。この結果、神経系では、物理刺激も、化学刺激も全て同じ興奮原理を持った神経回路に統合して統一された情報として扱うことが可能になった。これにより、あらゆる種類の外界の変化を、迅速に捉え、一つの記憶として維持することができる、まったく新しい情報媒体が出来上がった。
ただ、膜の興奮そのものは、記憶というより、反射に近い。神経細胞内では、この迅速な反応は、短期、長期記憶と呼ばれる二つのメカニズムで持続される（図３）。

図３：短期記憶と長期記憶のメカニズム(ノーベル財団２０００年ノーベル医学生理学受賞理由：https://www.nobelprize.org/nobel_prizes/medicine/laureates/2000/press.html) (C) The Nobel Assembly at Karolinska Institute

図３は、エリック・カンデルの研究を紹介したノーベル委員会の受賞理由に掲載されたいた図を拝借したものだ。この図には、神経細胞内でのシグナル伝達系（PKA,　cAMPなど）の活性による短期記憶と、エピジェネティックな変化によって誘導される細胞の分化を用いた長期記憶のメカニズムが書かれている。すなわち、神経系の誕生で、これまでシグナル伝達や、細胞分化に関わってきた多くのメカニズムが、新しく誕生した興奮膜を中心に再編成されているのがわかる。

図４：情報媒体の進化の階層性

このように、DNA、エピジェネティック機構、神経と情報媒体の進化を振り返ってみると、新しい媒体が、古い媒体では困難だった様々な課題を解決するとともに、それ以前の情報媒体を、新しい媒体を核に再編成し直して利用していることがよくわかる（図４）。この結果、神経系では、興奮膜の反応時間から、エピジェネティック機構の時間、さらにはゲノムの時間まで統合された独特の時間を形成するのに成功している。
これらの時間は、一個の細胞内の時間で、例えば以前紹介したゴカイ幼生の神経が一本しかない光感受システムにも当てはまることだが、記憶・伝達という観点から見た時、神経系は別の方法でもうひとつの時間過程を形成するのに成功している。すなわち、シナプス形成による神経細胞同士が興奮を伝達できる回路の形成だ。例えばアメフラシの水管反射回路（図５）を思い出してもらいたい。この回路で神経細胞はシナプスで結合している。個々の細胞は刺激に応じて長短合わせた変化を遂げシナプスの興奮性も変化するが、これとは別に回路内では一つの細胞から細胞へと刺激のリレーが行われ、この興奮のリレー自体も回路特有の活動時間を形成している。すなわち、外界からの刺激に対して、細胞やシナプスといった個々のレベルだけでなく、回路全体として反応が起こり、記憶が形成される。

図５　単純なアメフラシの水管反射に関わる回路。(BRHホームページ参照：http://www.brh.co.jp/communication/shinka/2016/post_000024.html）

そして、この細胞間のつながりは、ほぼ無限に拡大できることから、私たちが例えばイメージを見たとき、脳の中では恐ろしく複雑な過程が進行し場合により記憶として回路レベル、細胞レベルに分散して残ることが推察できる。
この外界の刺激を認識、記憶する過程の延長に、言語が生まれるのだが、例えば、鳥を見たとき脳で起こっている過程の複雑さを考えると、「トリ」という言葉が刺激として持つ性質は、あまりにも単純に思える。私自身は、このギャップこそが、言語の重要な役割だと思っているので、次回は、さらに高等動物の記憶について整理しながら、言語の役割について考えてみたい。
[ 西川伸一 ]

人間の記憶
2017年11月1日

DNAから神経系まで、生物の持つ情報媒体をざっとおさらいしてきたが、今回は高次脳機能としての記憶について焦点を当て、言語との関係で考えてみたい。前回見たように、新しい情報媒体は、それまでの媒体ではできなかったことを実現してきた。とすると、言語は高次の脳機能ではできないことを可能にしたことになる。ただ、言語によって何が可能になったのかについて理解するためには、言語発生直前の脳を知る必要があるが、簡単ではない。結局現在の私たちの基本的な脳機能を理解した上で、何が新たに可能になったのかについて想像をめぐらすしかない。いずれにせよ、エピゲノムがゲノムの延長にあるように、言語は脳の高次機能の延長上に生まれた。個人的には、言語は動物の脳の持つ記憶とコミュニケーション機能の新しい展開として誕生したと思っているので、言語を念頭に置きながら、高次の記憶やコミュニケーション能力について考えてみよう。
記憶については既に何回か折に触れて説明してきたが、私たちが記憶として通常思い浮かべるような複雑な記憶について説明はしてこなかった。この問題が現在も研究途上で説明が難しいためだが、今回はあまり詳細にこだわらず、独断で記憶を論じてみたいと思う。

図１　細胞の短期変化から細胞の安定な分化が細胞レベルで記憶を支える。前回の図3も参照

まず記憶の細胞学的メカニズムを復習しよう。記憶は、神経細胞自身の興奮伝達特性の変化と、その結果起こる神経間の結合性の変化、そしてそれに続く神経ネットワークの変化により支えられている。前回再掲したエリック・カンデルのノーベル賞受賞業績紹介に掲載された図をもとに、記憶の持続時間という点から書き直してみると図１のようになるだろう。
まず神経刺激により誘導される生化学変化により短期間神経細胞やシナプスの刺激反応性が変化する。この刺激が一定期間続くと、次に新しい遺伝子発現が誘導され、シナプスの興奮伝達に関わる分子がさらに長期的に変化し、ポジティブ、ネガティブに伝達性が変わる。さらにこの過程が最終的にエピジェネティックな変化を起こすと、新しい神経間の伝達性の変化を安定的に維持することができる。この中には、シナプスの消失や、形態変化（例えばスパインの変化：http://www.brh.co.jp/communication/shinka/2017/post_000005.html）、さらには細胞の増殖による新しいネットワークの組み替えも含まれている。神経細胞は多様化しており、シナプス形成様式も多様で、個々の神経レベルではこの過程に様々な分子が関わるが、基本的なメカニズムは同じだ。
ただ細胞レベルのメカニズムからだけでは私たちの記憶システムを説明できない。これは、複雑な記憶には脳神経回路によるプロセッシングが必要で細胞レベルのメカニズムが共通だとしても、多数の細胞が参加する回路ができることを抜きにして、高次な記憶は形成できない。この時、外界のイメージから感覚器を介して入ってくる脳へのインプットを、神経回路活動の様々なパターンへと分解し、この中から必要な情報を集めて、知覚したイメージに対応する内部イメージが神経回路内に作り直される（＝すなわち外部のイメージが脳内に表象される）。この表象過程では、表象の再構成に必要な断片化された情報を集め直す必要があるが、そのためにそれぞれの情報を神経ネットワークに一時的に維持しておかないと、統合することは難しい。これらを短期の作業記憶と呼ぶが、新しい表象は短期に記憶された情報断片の統合として現れる。こうして生まれた新しい表象の中から、さらに長期に記憶する表象が選ばれ、私たちの記憶が誕生する。
この過程をもう少しわかりやすく説明するため、多くの絵画が展示されている、美術館の常設展示場を訪れたという状況を考えてみよう。私の場合、一枚ずつ足を止めて絵を見、またラベルから絵のタイトルや画家の名前を丹念に拾っているのだが、一度見ただけでは絵の詳細について覚えられない。したがって、絵を見て脳内に形成されたほとんどの表象は時間とともに消えてしまう。しかし、5年後にもう一度同じ展示場を訪れた時、絵が以前と変わりなく展示されていたら、確かに前に見たと思い出す絵は多い。これは、絵の表象を覚えていたというより、部屋の雰囲気などを覚えており、もう一度絵を前にして、初めて見た時の感覚が蘇ってくるのだろう。さらに、前もって美術館の予習をしておけば、絵を覚えられる可能性は高いし、画家について知識があるさらに覚えやすい。もしその画家が自分の好きな画家なら、もう忘れない。最近の研究では、スマフォで写真を撮るだけで、後で見直さなくても絵を覚える確率は高いようだ。要するに、絵を見るだけでなく、様々な情報が合わさると記憶に残るようだ。
しかし、知っている画家の絵だけが記憶に残るわけではない。それまで聞いたこともない画家の絵に強い印象を受けて忘れられなくなる絵も多い。個人的経験だが、アントワープ王立美術館で見たフーケの聖母子像がそうだった。それまでフーケの名前を全く知らなかったが、その時以来40年経っても忘れることはない。（余談だが、他にもJan Gossaertの艶かしい絵をはじめとして、個人的にはフランドルの画家の絵は一度見ただけで忘れられない絵が多かった。）

図２　アントワープ王立美術館所蔵のジャン・フーケの「ムランの聖母子像」、1981年に一度訪れた後は訪れる機会がないが、イメージは鮮明に残っている。
（出典：Wikipedia）

このような美術館での体験の記憶は短期、長期を問わずエピソード記憶と呼ばれる。
フーケの絵（図２）の前に立ったと想像してみよう。私たちは、決して写真機のように絵全体を認識しているわけではない。特に近くから見るときは、ほとんど無意識に（おそらくこれまで培ってきた習性に従って）、例えば顔や、乳房（私の場合だが）などの部分部分に視線を走らせ、イメージを取り込んでいく。このとき、網膜の特定の場所で補足されたイメージは色と形に別々に処理される。また無意識に視線を動かしていても、常にこの動きは視覚とは別にモニターされ、立体感を得る時の情報として使われる。要するに、一つのイメージはバラバラの要素として脳にインプットされるため、それぞれを一定時間保持しないと、全体を再構成しなおすことはできない。この各要素を短期の記憶として維持し、統合する過程に必要なのが「作業記憶」で、図３に示すように海馬と視覚野に関わる脳の４−５領域がネットワークを形成してこれに当たっている。この中で海馬が最も重要な役割を演じており、海馬が障害されると、新しい記憶を成立させることができなくなる。

図３：　視覚の表象形成と作業記憶。

網膜に結像したイメージは後頭葉の視覚野に投射されるが、同時に動眼筋肉など様々な視覚に関わる情報が脳内の様々な領域で処理される。こうして集まった情報は、海馬を中心に一時的に記憶される（作業記憶）。もし情報が足りない場合、ネットワークからの刺激により、足りない情報が集められることもあり、表象を完成させるためには、海馬を中心として様々な領域が活動する。こうしてできた表象は、さらに多くの脳領域と連合される。
このように視覚から表象が形成される過程に限ってもこれだけ複雑で、美術館ではそれぞれの絵を見ながらこの過程を繰り返すことになる。もちろん、絵を見ている時、聴覚を始め様々な感覚も並行して脳に入ってくる。それ以外にも、絵を見ながら様々なことを考えることもある。この場合、絵の表象を短期的に形成する過程が、他の脳領域の活動の影響を受けることになる。音が気になりすぎたり、絵とは関係ないことを考えたりしてしまうと、絵の表象の形成は抑制され、絵を見たことさえ気がつかないことすらある。しかし、同時に聞こえる音や匂いで、絵の印象が余計に強くなることもある。ふっと浮かんだ考えが、絵のイメージを強くすることもある。
神経興奮の基本メカニズムはあらゆる細胞で共通だ。絵を見ることも、作業記憶も、表象の形成も、そして連合も全て、この共通の神経興奮メカニズムを基盤にしている。そのおかげで、一つの神経活動は、他のあらゆる活動と相互作用することができる。その結果が記憶に影響して何の不思議もない。これが、記憶の連合と呼ばれる現象だ。
知っている画家の絵の方が覚えやすいのは、内部イメージとして存在する画家の知識が、今見ている絵の表象と脳内で連合されるからだ。画家を知っているという知識がどのように脳内で保持されているのか詳細はわからないが、今出来たばかりの絵の表象とは違い、年月を経た安定した長期記憶だ。新しい表象も安定した表象と連合することで、安定な記憶へと変換できる。
面白いのは、例えばスマフォで写真を撮るだけで絵が覚えやすくなるのは、スマフォで写真を撮影したという単純な記憶が、絵を見たという複雑な記憶と連合することで起こると推測される。２度目に展示室を訪れて、絵を思い出すのも、部屋の雰囲気といったより単純な記憶が絵と連合しているからではないだろうか。すなわち、単純な表象と連合させることで、複雑な表象が覚えやすくなる。この記憶の特徴は言語の発生を考える時に鍵になる。
一方、私が初めてフーケの絵を見ただけで記憶できたのは、情動が新しい表象の連合を後押ししてくれたおかげだ。すでに述べたが（http://www.brh.co.jp/communication/shinka/2017/post_000010.html）、情動は私たちの行動のエネルギー（力動）として、脳活動全体を支配する。情動を引き起こすためには、これまでの私の好みなどについての記憶が必要だが、強い情動が生じると、情動自体と、あるいは他の表象との連合の程度が高まり、２度と忘れることのない絵の記憶が私の脳の中に成立する。恐怖体験や大きな喜びの体験はよく覚えているのも同じことだ。
以前、刻々と知覚される膨大な情報が、神経ネットワーク上に形成された自己というフィルターで選択され記憶されることで、新しい自己が脳内にできることについて述べたが（http://www.brh.co.jp/communication/shinka/2017/post_000007.html）、こうして考えると、美術館での体験による表象の形成、連合、そして記憶と続く過程は、この新しい自己を脳神経ネットワークに書き換えることと同じであることがわかる。異論もあると思うが、私は長期記憶とは脳神経ネットワーク上の自己が新しく書き換えられたことだと思っている。
美術館での絵の鑑賞を例に記憶の成立に至る脳過程を見てきたが、短期の作業記憶から表象が形成され、最後に長期記憶として自己の脳神経ネットワークに統合される過程が、鑑賞している一枚一枚の絵で繰り返されるとすると、ほんの一部を除いてほとんどの絵の詳細は美術館を出た時には忘れているのも当然だ。実際、私たちが持つ作業記憶のキャパシティーは少ないと考えられている。アルツハイマー病で最も問題になるのがこのキャパシティーの少ない作業記憶だ。
しかし、この作業記憶が長期記憶に移行するときは、すべての作業記憶が記憶されるのではなく、より単純化された情報量を持つ表象が記憶されるのだと思う。情報量は低くとも、一つの表象が単独で記憶されるのではなく、それまで蓄積した全表象とつながるネットワークの一部として記憶されることで十分記憶として成立する。この一つの表象が自己の脳神経ネットワークに統合され全体と関わることも、言語の発生を考える上で重要なポイントになっている（最後に議論）。
では、４０年後の今、私がフーケの絵を思い出す時、脳内で何が起こっているだろう？目を閉じて絵を思い浮かべてもらいながら脳のどこが活動するかを調べると、なんと網膜から直接投射を受けている後頭葉にある一次視覚野が興奮することがわかっている。この結果は、脳内に記憶している内的イメージを思い浮かべる時、私たちは記憶から要素を選び出し、これを一次視覚野で集めなおして、あたかも新しい網膜刺激を受けたように思い出していることを意味する。とは言っても、今見てもらったばかりのフーケの絵を目を閉じて思い出す時、決して写真と同じように思い出していないはずだ。実際、赤い天使の中に浮き上がった真っ白い聖母が、左の乳房をキリストに与えようとしているといった大まかな像が浮かんでくる。しかし、夢を見るように鮮明なイメージがそのまま浮かぶことはないと思う（少なくとも私は）。写真を見直すと、鮮明なイメージを覚えているように思ってしまうが、実際には記憶されている内部イメージは簡略化されている。
記憶の成立から、呼び起こしまで詳細を省いて概略を述べてきた。この過程からわかるように、鮮明な記憶を維持することは膨大な神経活動が関わる大仕事で、毎日の一瞬一瞬を覚えることなど不可能に近い。代わりに、生まれてから神経ネットワーク状に形成してきた自己をフィルターとして、作業記憶から現れる表象の一部を随分簡略化して自己のネットワークに統合することで、長期記憶を成立させている。これが簡略化されていることは、成立した内部イメージを呼び起こそうとするとわかる。脳内からそれぞれの情報が一次感覚野に集められ、感覚として再現される。ただ、視覚のように複雑なイメージの場合、鮮明に思い出すことは難しいことから、決して写真のような鮮明なイメージ全体を記憶しているわけでないことがわかる。
このように記憶を理解すると、記憶にとっての言語の意味、すなわち言語にしかできないことが見えてくるので、最後にそれをまとめておく（検証された概念ではなく、私の個人的な妄想と理解してほしい）
まず、強い感情、絵が展示されている部屋のイメージ、あるいはスマフォで写真を撮ったという単純な行為と連合させるだけで、複雑な絵が覚えやすい例からわかるように、複雑な表象も感情や他の単純な表象と連合することで、覚えやすくなる。とすると、音の短い並びからできた情報量の少ない単語は、連合させることで複雑なイメージの記憶を助ける力がある。確かに、私たちの記憶はかなり言語に助けられている。言語を持たない動物の長期記憶のレパートリーは、私たちよりはるかに感情との連合に頼っているのではないだろうか。
言語（単語）は情報量としては単純なおかげで、記憶するために連合させる相手としては優れているため、最初は各表象が自己の神経回路に統合される助けとして脳内神経回路の一部として取り込まれる。重要なことは、脳内回路に取り込まれるということは、単語が一つのイメージに対応した表象として独立に存在するのではなく、自己の脳神経ネットワークに組み込まれた他の多くの表象と関わって存在していることを意味する。とすると、当然言語は「リンゴ」がリンゴにだけ対応するのではなく、リンゴではないミカンや、ブドウとも関わって、記憶を助ける働きを発揮する。この一つの単語が最初から、多くの他の単語と関わるという構造が、言語の最も重要な特徴になる。
最後に、内部イメージを呼び起こそうとしても、鮮明なイメージを呼び起こすのは難しいことを考えて欲しい。不明瞭なイメージでも、同じイメージに再び出会った時に、「あいつだ」と思い出すためには十分役にたつ。しかし、頭の中でプランを練るといった場合にイメージをこれ以上鮮明にするのは難しい。しかし一度フーケの絵を思い起こす時、「赤い天使」、「白い肌のマリア」、「腕の中のキリスト」、「キリストに飲ませる左の乳房」、と言葉を同時に呼び起こしてみると、イメージは格段と鮮明になる。これが、すなわち記憶の質を大きく高めてくれる。
最後に、今回議論した記憶は、陳述記憶や意味記憶と呼ばれる、脳神経ネットワークの連合を広げる方向での記憶だが、逆に回路を限定することで形成される記憶も存在する。例えば、一度自転車に乗れるようになると、もう乗り方を忘れないような、いわゆる熟練と言われる記憶で、手続き記憶と呼ばれている。個人的考えだが、言語には、この手続き記憶も重要な働きをしていると思っている。すなわち、単語と対応する最も重要な表象を最短で繋いで、意味記憶システムの関与を整理している。記憶という観点から見ると、言語は意味記憶と手続き記憶が統合された脳活動ではないかと思っている。
しかし、これらはすべて記憶に対する言語の意味で、記憶システムが言語のような情報量の少ない連合の相手が必要としたとはいえ、この要求だけから言語が生まれることはないと思う。そこで、次回はコミュニケーションについて考えてみる。
[ 西川伸一 ]

コミュニケーションと言語
2017年11月15日

前回、記憶の機能がいかに言語により高まったかについて私の考えを説明したが、駆け足だったので分かりにくかったかもしれない。そこで、図を使ってもう少し記憶と言語について説明してからコミュニケーションの問題に進むことにする。
私たちの脳への入力情報の７割以上が視覚からの入力であり、前回述べたが視覚表象の形成やその記憶は途方もなく複雑だ。ただ、作業記憶や長期記憶を形成するとき、より単純な情報と連合させることで、記憶を高めることができる。その最たる例が感情との連合で、おそらく言語を持たない動物の記憶の大半は感情と連合しているのではないだろうか（満開の花の思い出も、団子と連合している点で人間も同じだが）。この最も分かりやすい例が、メトロノームの音で、食べ物を連想させるパブロフの反射だ。同じことを、たまたま存在する簡単な表象と連合させることで記憶力を上げることができるが（mnemonicと呼んでいる）、都合の良い単純な連合相手はそうあるわけではない。この連合相手の機能を持つのが言語で、それ自身は情報量の少ない音の並びからなる単語を脳内で表象して連合の相手とすることで、複雑な情報の記憶を高めることができる。
言語を記憶のためのmnemonicな印（一種メモと考えればいい）と考えると、単語がそれに対応する対象の表象とリンクした途端、その表象は他の様々な表象が含まれた脳内ネットワークの中に組み込まれることになる。言語が存在する前から、りんごの表象は、ミカンやブドウの表象ともネットワークを作っており、さらには果物というカテゴリーの表象とも連合している。従って、単語の表象が実物の表象と連合した時から脳内の様々な表象のネットワーク内に言語も体系化されることになる（図１）。
とはいえ、りんごそのものの表象と、「りんご」という単語の表象は、ネットワークの中では、反射的に双方が想起されるほど密接に結びついている。これは音と実物の表象をリンクさせるパブロフの条件反射と同じで、この連合は手続き記憶成立に似た過程で形成されるのだろう。この結果、無意識にりんごという単語からりんごが浮かぶようになる（黄色の矢印）。さらに、果物は例えば食べると甘くて美味しいという感情に裏付けられた行為の記憶によってカテゴリー化されているだろう（赤い矢印）。すなわち、りんごの表象がリンクしている一連のアクションを表象するネットワークに単語もリンクすることになり、このアクションの表象が「私・食べる・りんご」といったプリミティブな文法の元になるように思える。

図１：メモ代わりの標識表象としての言語が脳内の表象のネットワークに組み込まれて、言語が成立する。言語としての統語は、それぞれの表象が属する様々なカテゴリーによって決まる。例えば、食べるという表象が最初から果物には属している。このような言語の構造のおかげで、新しい単語を学ぶとそれは実物についての表象を介して脳全体の表象ネットワークの中に位置付けられる。これが、私たちが急速に単語を覚えることのできる基盤だと私は思っている。

図１を見ながら繰り返すと、（文字のできる前の）言語とは、脳内に形成した重要な表象を覚えておくための単純なmnemonic表象として脳内ネットワークに形成される。脳内の複雑な表象と、単語というそれ自身音の並び以外の意味を持たない単純な表象（シンボル）が脳内で手続き記憶を通して実物の表象と結合した途端、単語は脳内表象のネットワークの中に組み込まれる。これにより、りんごという音からなる単語の表象は、実際のりんごの表象と結合することで、果物としてカテゴリー化され、果物以外のカテゴリーと比べて、様々な果物とより強く連合する。言い過ぎかもしれないが、一旦カテゴリー化されると文法に当たるものは頭の中で過去の行為の記憶として成立している。「りんご（かき、ぶどう、梨、メロン）、食べる、美味しい」というわけだ。これを普遍文法の原型と呼んでもいいが、実際には単語が対応するものや行為にリンクした私たちの行動様式で、子供が最初に話すほとんどの言葉の並び（統語）はこの行動様式を反映していると思う。
このように、生物の寿命が伸び、複雑な内容の記憶が要求されればされるほど、mnemonicな連合相手が必要になる。この要求が、いつどのように言語という解決手段を見出したのか、それが次の問題になるが、今述べたのは個人の記憶の問題で、言語が発生する前も何らかのmnemonicな表象を使っていたと思う。しかしそれが言語になるためには、個人レベルのmnemonicな表象を他の脳とも共有できるようになる必要がある。そしてこれを考えるためには、もう一つの言語の機能、コミュニケーションについて考える必要がある。
ほとんどの生物が、何らかのレベルでコミュニケーションを行っている。それら全てを網羅して考えると複雑になるので、コミュニケーションを同種の高等動物同士が体を接しないで行う情報のやり取りに限定して考えると、１）子孫を残すためにオスメスが行う生殖行動に向けたコミュニケーション（生殖行為自体とは異なる、例えば発情期を知らせるサイン）、2）個体間の階層性を示すためのコミュニケーション、３）そして縄張りを相手に知らせるコミュニケーション、を動物にとって個体間のコミュニケーションが必要な３種類の状況と考えることができる。このときコミュニケーションが成立するためには、こちらが伝えたい内容について自分自身で理解しているとともに、同じ理解を相手も共有する仕組みが必要だが、この３種類のコミュニケーションでは、本能的感情が共有する情報の中心にある。メーティングや階層性についてのコミュニケーションは、生殖本能や、生存本能に基づく感情により動かされた行動だが、あらゆる個体が本能として等しく持っている感情（＝情報）であるがゆえにコミュニケーションが図りやすい。
３つの中で、縄張りは直接対面しない個体間のコミュニケーションで、本能に基づく行為だが、様々なマークが縄張りの主張に使われる点で一層言語に近い。哺乳動物の場合、多くの動物の縄張りは、尿や糞など匂いの強いものを場所場所に残すことで主張される。これは、匂いが強い本能的感情を誘導するからで、このおかげで標識の意味を共有できる。クマのように、木に傷をつけて視覚的な標識を縄張りの主張に用いる種もあるが、実際には引っ掻いた場所に自分の皮膚や毛を擦り付けて残していることから、視覚的なシンボルに頼るわけではなく、印の付いた場所に匂いを付けて感情を惹起していることがわかる。遠吠えのような音で縄張りを主張する場合は、さらに言語に近いが、出し手と受け手が共有するのは、結局競争本能に基づく感情と言える。
一方多くの鳥類では匂いではなく、聴覚や視覚に訴える縄張りの主張が行われる。わが国で有名なのは、モズの高鳴きで、越冬場所を決めるまで鳴き声で縄張りを主張し続ける。他にも、極楽鳥の仲間のように美しい色を見せてメスを呼んだり、あるいはパッフィングと呼ばれる行動で相手を威嚇するなど多様で、これがバードウォッチャーを楽しませる（図２）。鳥の場合、いずれも感情を基盤とした本能的な行動であることがわかる。

図２：鳥の縄張り主張のための、モズの高鳴き（左）と、Victoria’s rifle birdのメーティング（左）。出典：Wikipedia

人間以外の哺乳動物と比べた時、鳥類には極めて複雑な音の並びを発することができる種類が多い。例えば、インコのモノマネからわかるように、鳥の中には様々な発声を学習することができ、その結果同じ種類でも場所によって鳴き方が異なるのを観察できる。しかし、その機能は生殖と縄張り、時に仲間に対する警告に限られており、共有する情報は本能的感情に限られる。しかし共有する情報が本能的感情だとしても、それに一つの表象を標識としてリンクさせる点で、形式としてはかなり言語に近い。（季刊生命誌70号では和多和宏さんによるキンカチョウの研究を紹介しています「小鳥がさえずるとき脳内では何が起こっている？」）
縄張り主張よりさらに高度なコミュニケーションが必要になるのは、社会生活を営み個体間で協力しあう時のコミュニケーションだろう。狼などの肉食動物や、チンパンジーの狩りなどが有名だが、この時のコミュニケーション手段はどれほど複雑なのだろうか？
例えばオオカミの群れが協力する狩りを考えてみよう（図３）。これまでの観察により、狼は多様な鳴き声を出せることがわかっている。このため協力して狩りをするとき、声を使って複雑なコミュニケーションを取っているのではと思ってしまうが、最近の論文では、狼が協力しておこなう狩りの途中ではそれほど複雑なコミュニケーションを必要としていないことが明らかにされている（MacNulty DR, Tallian A, Stahler DR, Smith DW (2014) Influence of Group Size on the Success of Wolves Hunting Bison. PLOS ONE 9(11): e112884. https://doi.org/10.1371/journal.pone.0112884）。すなわち、襲うという合図と、狩りに必要な自動的行動パターンを学習していることが重要で、狩りが一旦始まると個体間のコミュニケーションは必要ない。人間の争いでも修羅場になると、dog fightというようにコミュニケーション抜きで戦うのと同じだ。

図３：バイソンに立ち向かう狼の群れ：MacNulty DR, Tallian A, Stahler DR, Smith DW (2014) Influence of Group Size on the Success of Wolves Hunting Bison.
PLOS ONE 9(11): e112884. https://doi.org/10.1371/journal.pone.0112884の図１を転載。大きな群れでハンティングするときには、連携なく単独でのアタックでバイソンを倒すことが観察されている。

協力する狩りの例として有名なもう一つの例は、チンパンジーの集団によるヒヒの狩りだ。有名なジェーン・グドールの『In the shadow of man』にも、それまで毛づくろいをしていた集団が、急に立ち上がってヒヒを襲う行動を見せることが描かれているが、チンパンジーの狩りについての最も詳しい研究はBoeschらのコートジボアール・タイ国立公園での研究だろう（Boesch and Bosche, Hunting behavior of wild chimpanzees in the Tai’ National Park, American Journal of Physical Anthropology 78:547, 1989）。この論文によると、チンパンジーは実際の狩りより随分前から、胸をたたくドラミングやhootingと呼ばれる叫び声で狩りを始める合図を確認し、用意が出来たところで餌の声をキャッチすると、急に静かになって一定の距離を保って静かに獲物の方へと移動し、アタックすることが報告されている。さらに、タイ国立公園で観察されたグループでは、狩りの後獲物を奪い合うだけではなく、分け合うことも行われ、より高いレベルの協力関係が成立していると言える。さらには、追いかける役、行く手を遮る役などの分担も観察され、協力して狩りが行われており、獲物を食べる時の道具の使用も普通に観察される、知能的にも高度な集団と言える。しかし、狩り自体は、集団で狩りをするという意思の確認と、後は学習により身についた自発的な行動により行われていることから、役割分担といった複雑な関係を維持するために、コミュニケーションが存在しているのではないことがわかる。
以上のことから、集団の狩りは一見コミュニケーションが必要に思えるが、結局狼でも、チンパンジーでも、さらには私たちの先祖も、「ワー、オー」といった始まりの掛け声さえあればほとんどのことは済んでいたのではないだろうか。

図４：感情と意志の関係を、hootingの音で他の個体と共有できる。感情の伝達はコミュニケーションの原点。

ただ、感情を基盤としたコミュニケーションを侮るわけにはいかない。ゆっくり鑑賞した絵画の詳細を思い浮かべることの難しさについて前回強調したが、感情を伝える最も高度な伝達手段の音楽では、一度聞いた曲が気に入れば、プロでなくともそのフレーズを正確に思い出すことができる。このことは、感情がもともとコミュニケーションを図りやすい表象で、例えば「これから狩りをするぞ」といった行動の意思統一も、肉を食べたいという強い感情が簡単なhooting音と組み合わさるだけで、比較的簡単に共有できる（図４）。
一方、得られた獲物を餌の分配する行動は、より高いコミュニケーション能力が必要とされる。この行動には、全体の、あるいは他の個体のために、自分は諦めるという利他性が要求される。そこで、次回は利他性とコミュニケーションについて考えるところから始める。
[ 西川伸一 ]

「人類と利他性」
2017年12月1日

私のような専門外の人間が言語について考え始めると、取り止めがつかなくなる。もともとこの連載は体系的に書いてきたわけではないため、言語のように難しい問題になると、問題が頭に浮かぶたびに脱線、脱線を繰り返してしまう。読者の皆さんを混乱させて申し訳ないと思っている。実際、自分で読み直しても、思いつきで右往左往、読んでいただいている皆さんを混乱させるだけで終わっている。ただ、とりとめなく文章を書いているうちに、それとはなしにホモサピエンスで起こった言語の始まりが自分なりにふっと頭に浮かび始めた。勝手に「言語のマイスタージンガー仮説」と名付けている。これを新しい年の冒頭に持っていきたいと準備しているので、それまでは、思いつくまま飛び回る私の思考を我慢してお付き合いいただきたい。
さて前回、狼やチンパンジーの狩りでは、相互に協力するための利他的コミュニケーションはほとんどなく、肉を食べたいという感情の共有と、狩りに必要な手続記憶に基づく自発的行動の学習、そして他のチンパンジーがどのような行動を取るかについての予測力で行動していることを述べた。このような狩りで情報として共有されているのはあくまでも感情や本能で、我々が考えるような感情以外の情報のやり取りが起こるためには、人類に特異的な質的に異なるレベルのコミュニケーションの進化が必要だった。
この人類（ホモ属）特有のコミュニケーション能力の背景について、類人猿と様々な発達段階の人間の児童を丹念に比べる研究で明らかにしようとしているのがライプツィヒのマックス・プランク進化人類学研究所のマイケル・トマセロ（Michael Tomasello）のグループだ。前回述べた複数の類人猿が共同で行う狩りの様式を、彼は人類の狩りと区別してexplosive（一旦スウィッチが入るとあとはコントロールできず爆発するだけ）な狩猟と名付け、類人猿には人間のコミュニケーションに見られる、相互作用による調整が全く欠けていることを述べている。
このサルから人類への進化過程で生まれた新しい個体間の協力関係が新しいコミュニケーションを発展させ、その結果言語の発生に至ったと考える研究者はTomaselloに限らず多い。ただ、Tomaselloはこのことを示すために、同じ課題を類人猿と様々な年齢の人間の子供に行わせて、人間にしかできない能力を科学的に特定する実験を数多く行ってきた。
例えば以前紹介した熊本のチンパンジー飼育施設で行われたTheory of Mind（他の個体も自分と同じように考えていることの理解）が類人猿にも存在することを示す論文は、熊本の施設だけで行われたのではなく、チンパンジー、ボノボ、オラウーンタンを用いてドイツマックス・プランク進化人類学研究所のTomaselloの研究室でも同じ目的の実験が行われ、共同で発表されている。
この研究では、類人猿にもTheory of Mindが存在する、すなわち人類特有と思われていた能力が「猿にもある」ことを示している。確かにSF映画「猿の惑星」で人間と同じ知性を持つ猿が描かれていることからわかるように、ともすれば私たちの興味は「猿はどこまで人間と同じか」に向かう。しかし人類進化を考える上では、間違いなくTomaselloのように人間特有の能力であると検証できる性質、すなわち「猿にはできないこと」を一つ一つ明らかにすることのほうが重要だ。もともとできないことを証明するのは難しいため、このような実験結果は常に批判にさらされるし、普通すぐに「サルもできる」という論文が発表されることが多い。それでも頑なに両方を比べる実験を続け、サルと人間の子供の行動を知り尽くしたTomaselloの研究から学ぶことは多い。彼は多くの著書を出版しているが、Harvard University Pressから2014年に出版した『Natural History of Human Thinking』は、この他の個体との協力関係の変革から言語へと進む道がわかりやすく書かれており、人間特有の性質や能力とは何かに興味のある方にはオススメの本だ（邦訳がまだないのは残念だ）。

図１　Michael Tomaselloが２０１４年に出版した著作で、ここで説明している意図の共有を契機とした人間特有の能力の進化について書いている。

ではこれまでの研究から見えてきた人間特有の性質とは何か？またそれはどのように特定されたのか？誤解を恐れず単純化すると、Tomaselloを始めとする多くの研究者は、他の個体を助ける「利他性」を最も重要な人間特有の性質として挙げている。
もちろん他の個体を助けるかどうかだけで見れば、子供を育てる動物全てが利他性を持っていると言えるかもしれない。ただ、ここでいう「利他性」とはこのような本能的な利他性ではなく、本能的に持っている性質を超えて他を助ける利他性だ (例えば図２で施しと子育てを比較)。

図２：子育ても利他的だが、本能的と断じていいだろう。（写真はWikipediaより）

ではこのような高次元の利他性はどのように定義され、研究されているのか？わかりやすい例として、TomaselloのグループがPsychological Scienceに発表した「One for you, one for me: human’s unique turn-taking skills（一つを君に、もう一つは僕に：人間特有の順番性の能力）」という面白いタイトルのついた論文を取り上げてみよう（Melis et al, Psychological Science, 27:987, 2016 : http://journals.sagepub.com/doi/abs/10.1177/0956797616644070?url_ver=Z39.88-2003&rfr_id=ori:rid:crossref.org&rfr_dat=cr_pub%3dpubmed）
私たちは、協力しないと目的の物が得られない時、「最初に手に入れた物はまず君に、その次は僕に」と分配の順番を決めて協力することができる。しかしこの場合、一回の協力で手に入るのが一つだけだとすると、自分には何も手に入らないのに協力だけを行うという状況が生ずるのを認めなければならない。このためには、将来自分にも確実に回ってくる利益を想像して、一時的に我慢できる能力が必要になる。事実、３歳以前の幼児は、協力すれば欲しいものが手に入ることがわかっていても、自分に目的のものが回ってこないという状況を認めることができず、結局協力関係が成立しない。
この研究では、２本の紐を協力して引っ張れば、一個のボールを手に入れることができる２つの仕掛けを作り、片方の仕掛けからはボールが自分に、もう一方の仕掛けからはボールは相手に落ちるようにしておく。この使い方を理解させた後、２つの仕掛けを交互に操作して、順番にボールを手にするかどうかを、３.5歳児、５歳児、そしてチンパンジーで調べている。（同じ著者がProceeding of Royal Society Bに掲載したオープンアクセスの論文に、今回使われた仕掛けとよく似た図が掲載されているのでイメージを得るための参考にしていただきたいhttp://rspb.royalsocietypublishing.org/content/281/1796/20141973）。

図3：　サルの協力関係を調べる課題。この図は、本文で説明している実験とは異なるが、紐を同時に引かせて協力させるという点では本文で説明しているPsychological Scienceの論文と共通してる。

結果は明瞭で、５歳児ペアの場合、実験開始直後からほぼ１００％協力しあう戦略が成立する。すなわち、相手だけがボールを手に入れることを認め、交互に獲物が手に入るよう順番を決める戦略を立てる。ところが同じ戦略関係が成立する確率は、3.5歳児では６２％に落ちる。この時の様子を観察すると、５歳児では積極的な方が声をかけて、順番にボールを手に入れようと指示しているのがわかる。一方、3.5歳児ではこの戦略が成立するまでに試行錯誤が必要で、結局うまく協力が成立しないペアもある。すなわち、この利他的能力の発達は3.5歳がちょうど境界上にあると言える。それでも、最終的には順番にボールを手にするための戦略を見つけるペアは何組か生まれる。これに反し、チンパンジーで同じ実験を行うと、偶然協力してボールを手に入れることは観察できても、順番にボールを手にするための安定した協力関係が成立することはない。
以上の実験から、Tomaselloたちは、将来の自分の利益を考えて他人とゴールを共有し協力しあう高次の利他性は人類特有の性質だと結論している。ただこの利他的性質が完全に自己の欲望を殺す道徳的行為の誕生と勘違いしてはならない。幼児はサルのexplosiveな協力形態と同じように、あくまでも自分の利益を追求しようとする強い利己的動機で行動しており、それでも協力が成立している点が重要だ。この実験で選んだペアも、自然に支配的な子どもと、それに従う従属的な子どもの区別が生まれて、支配的な方が行動を支持する。ただ階層性が存在しても、協力し合ったほうが一番得をすることが理解されており、協力を促す指示を出す。
この実験で観察された高次の利他性が人類特有の性質だとしても、なぜそれが言語発生までの長い道の契機になったのだろうか。極めて単純化して言ってしまうと、Tomaselloは人類（Homo）だけが、同じゴールを達成しようとする意図を共有する能力を発生させ、このおかげで新しいレベルのコミュニケーションが可能になり、また利他性もこの能力をきっかけに誕生したと考えている。前回述べたチンパンジーの集団的狩りで見られるexplosiveな協力でも、同じゴールを追いかけているように見えるが、実際には各個体は自分の欲求を満たすというゴールを追いかけている点で、意図を共有しているとは言えない。チンパンジーの狩りでは、各個体の脳内に表象されているゴールは利己的で個別の意図だ。強いて言えば、食べたいという強い感情を共通して持っているだけだ。従って、先に述べた実験からわかる、将来の利益のために他人だけが獲物を得るという状況を我慢できる利他性をチンパンジーは持ち合わせていないことになる。
私自身にとっても、この「意図の共有」能力が類人猿と、人類を分ける分岐点に存在するという考え方は納得できる。そこでTomaselloがBehavioral and Brain Scienceに発表した総説をもとに、「意図とは」「意図の共有とは何か」を考えてみよう。
例えば、近くで発見した鹿をなんとか殺して肉にありつきたいと考えている古代人を考えてみよう。彼の頭の中では、殺した鹿がゴールとして浮かんでいる。しかし、目の前の鹿は生きている。ゴールを達成するためには、その時取り得る幾つかの可能性を考え、鹿を殺すのに最も確率の高い方法を決断する必要がある。いろいろ考えた挙句、近くの石を投げて動きを止めて、あとは飛びかかって首を締めようと決断すると、ここで初めて行動する意図が生まれる。もちろんうまくいく場合も、うまくいかない場合もあるだろう。このような、ゴールを目指して現実を変化させことが、意図的行為になる。
こんな風に考えるプロセスは人間だけでなく、チンパンジーにも存在する。どちらもゴールを達成すべく意図的行為を繰り返し、その成否を記憶することで、鹿を手に入れるための方法を学習する。ただ、例えば石で鹿の動きが止まる確率が低いことがわかると、当然他の個体が棒を持って近づいた方がうまくいきそうだ。しかし一人では石を投げるだけしかできない。他の個体と協力するするしかない。
ではこのような協力を成立させるのに何が必要か？

１）まず肉を食べたいという欲望の共有が必要で、これはサルの狩りでも観察できる。
２）生きた鹿を見ているだけでは欲望は満たせない。欲望を満たすには、殺された鹿をゴールとしてともにイメージする必要がある。これも恐らくサルでもできる。
３）難しいのは、一人が石を投げ、もう一人が棒で叩くというプランニングを可能する過程だ。感情とゴールを共有した上で、鹿をハントするという明確な意図を共有し、私が石、君が棒と取り決めることで初めて効率のいい狩りが成立する。
この３番目のプロセスを、Tomaselloのいう意図の共有と言っていいと思う。これが可能になるためにどのような脳回路の変化が起こる必要があったのかを明示するのは難しい。しかし、この回路の差が、その後の類人猿と、人類の脳構造の大きな差を生むことになる。図３に示すようにチンパンジーと人間の脳は、サイズ、特に前頭葉のサイズに大きな違いが見られるが、この進化の引き金も、意志の共有が可能になった結果なのかもしれない。事実、ロンドン大学のDunbarらは、類人猿や人類の前頭葉のサイズが、その種が生活している グループのサイズと比例することを示し、コミュニケーションの必要性が脳の発達を促した ことを示唆している（http://www.sciencedirect.com/science/article/pii/004724849290081J?via%3Dihub#!）

図4　人間とチンパンジーの脳。構造は同じだが、前頭葉が人間では著しく発達しているのがわかる。この差は、人類が類人猿から別れた後、急速に進化してきたものだ。（出典：Wikipedia）

この意図の共有を新しいコミュニケーションの様式の発生と言っていいだろう。Tomaselloは意図の共有が発生する生後の発達についても詳しい研究を行っているが、詳細はBehavioral and Brain Scienceを読んでいただきたい。ただ、このような研究の背景には、Tomaselloに限らず、子供の発達を研究している研究者一般が持っている「系統発生は個体発生を繰り返す」という考えがあると思う。
そこで次回は、「意図の共有」を切り口に、コミュニケーション能力の個体発生と、系統発生の比較をしてみよう。
[ 西川伸一 ]

個体発生と系統発生
2017年12月15日

自分自身で原著を確かめたわけではないが、「個体発生は系統発生を繰り返す」と反復説を唱えたのは、ドイツの生物学者エルンスト・ヘッケルだと習った。ヘッケルは１９世紀ドイツを代表する発生学者で、名前に心当たりのない人も、おそらく彼が残した「Kunstformen der Nature」に描かれている様々な生物の精緻なスケッチは見たことがあるのではと思う（図１）。進化の過程で生まれた形態や機能（系統発生）は、個体発生過程を制限するため、個体発生では系統発生が短い時間に反復されることが多いという考え方だ。
ヘッケルも私たちの行動や精神にまでこの考えを拡大する意図は毛頭なかったと思うが、あえてこじつけて人間の行動の発達をヘッケルの反復説的に表現すると、「人間の行動の発達では、最初から人間らしさが現れるわけではなく、多くの動物と共通の本能的欲動に支配される口唇期を経て、行動支配の中心が前頭葉に移る中で、人間特有の性質である利他性などが芽生える」となるのではないだろうか。これを逆から言い直すと、利他性など人間特有の行動のルーツを探ると、私たちが動物の本能として理解している様々な行動が必ずその背景に存在し、個々の能力は、個体の発達過程で順番に現れることになる。

図１：エルンスト・ヘッケルとKunstform der Naturに描かれた図。（出典：Wikipedia）

私個人の感想でしかないが、脳機能が関わる限り、行動の発達が系統進化と同じ順番で現れるとする反復説がそのまま当てはまるかは疑問だと思う。というのも、脳はその時々の経験に応じてネットワークを書き換える能力を持っているからだ。確かに脳ネットワークの枠組みは進化過程で生まれてきたもので、個体発生でも脳幹に支配される行動から、より前頭葉が関わる行動へと発達していく。しかし、誕生後の行動や能力の発達過程では、脳内にある全てのネットワークが連合可能で、これに日々刻々積み重なる外界の記憶も必要に応じて連合される。このため、系統発生過程で形成された様々な本能の回路も、新しい経験や、認識や価値の回路と自由に結合する可能性が常に存在する。例えば、口唇期をガイドするのは食欲本能が中心だと思うが、母親の匂いや、声を同時に聞くことで、本来ずっと後で発生してくる生殖本能が連合される可能性すらある。もちろん、新しい経験が思いもかけない連合を誘導する可能性も十分ある。
系統発生の結果として始まる最初の脳ネットワークの構造の個人差は大人と比べるとはるかに少ないと思うが、その後の経験は偶発的で多様だ。従って、ネットワークの書き換えも、経験の個別性の結果大きな多様性が生じてしまう。系統発生で獲得された本能のネットワークはどんなに共通でも、様々なネットワークと自由に連合させ、新しいネットワークへと再統合することができる。まさにこれが、人間の個性の源で、例えば生殖行動から子孫を作るという目的を切り離してしまうことも、その結果として性同一性障害が生まれることも、全て脳内でのニューラルネットワーク同士を自由に連合させられる特性に起因している。この意味で、行動の個体発生は、必ずしも行動の系統発生を正確に繰り返す必要はない。
しかし、脳のネットワークを自由に書き換えられるからといって、系統発生で獲得された本能から完全に解放されるかと言うと、病的なケースを除いて、系統発生で生まれた行動は、発達中のネットワークに統合され必ずどこかに潜んでいる。例えば、言語発生にはサルにはない人間特有のコミュニケーション能力が必要なこと、このコミュニケーション能力は人間特有の高いレベルの利他性がきっかけになっていることを説明した。では、この全く新しい人間特有の能力は、サルや他の哺乳動物に見られる本能から完全に独立しているのだろうか？
答えは、残念ながらNOだ。人間特異的な高次の能力や行動には、それに対応するより原始的な能力が必ず存在している。この意味で、人間特有の全く新しい能力の理解のためには、系統発生と個体発生を対応させ、人間特有の全く新しい能力（これは系統発生では辿れない）が、他の動物にも共通に存在する能力とどう関連して発達してくるのか研究する必要がある。
利他性を例に、さらに人間特有の能力と、他の動物に見られる能力との関係を見てみよう。利他性というからには、当然自分と他の個体を区別することが必要になる。
自分自身を認識できるか（self awareness）調べるために行われるのが、鏡に映った自分の体を自分と認識できるかについての実験で、例えば背中にこっそり印をつけておいて、鏡を見せた時にその印に気づいて自分の背中に注意を向けるかどうか実験する。人間の場合、２歳時以降からこの能力が認められ、さらに４歳児ではビデオで見た自分の姿も認識できる。一方、チンパンジーなどの旧世界ザルでもこの能力が認められるが、ビデオを通して見せた場合は、霊長類も自分とは認識できないようだ。また、より原始的な新世界ザルでは鏡に映った姿を決して自分と認識することはない。
自他が区別できるようになった後は、他の個体の行動を理解できるかが重要になるが、これについて最も有名な研究がミラーニューロンの発見だろう。このニューロンは、霊長類の餌をとる際の手のニューロンの活動を記録する実験を行う最中に、実験を行う研究者が餌のバナナをとったのを見たとき、必ず活動する神経を見つけたことに始まる。すなわち、相手の行動をあたかも自分の行動のように反応するミラーニューロンの発見は、２０世紀の神経生物学の最も重要な発見の一つと考えられている。人間の場合、霊長類のミラーニューロンに対応するニューロンを特定することは難しい。ただ、相手の行動を目で追いかける行動は１歳児までに見られることから、同じようなニューロンは間違いなく存在すると考えていいだろう。
自己と他を区別できるようになると、次は他の個体も自分と同じように考えているという認識（Theory of Mind）能力の発達が重要になる。これについては既に詳しく述べたが（http://www.brh.co.jp/communication/shinka/2017/post_000016.html）、最初は人間特有の性質と考えられてきたが、その後の研究で霊長類にもその能力が備わっていることが証明された。また、人間でも社会性に問題がある自閉症の子供たちにはこの能力が欠けていることも明らかになっている。
上に述べた他の個体の行動を理解する、いわば理性的能力の駆動力として欠かせない情動が、相手の感情を共有する共感能力だ。この共感こそが、他の個体とのコミュニケーションを図ろうとする原動力になり、この能力が低下するとAlexithymia（無感情症）に陥る。ただ、共感能力は人間以外の動物にも存在する。例えば、相手の痛みを共に感じる感情は、霊長類は言うに及ばず多くの哺乳動物で観察することができる。例えばマウスでも、痛みを訴える仲間のところにより頻回に寄り添う行動を示すことが観察されている。このことから、一定の集団で暮らす哺乳動物では、他の個体とのコミュニケーションを求める情動が様々な形で早くから進化していたことがわかる。
それもそのはずで、妊娠、出産を経て一定期間子供を育てなければ子孫が残せない哺乳動物の子育て（ケアリング：caring）には、子供への共感が必須だ。ほとんどの動物で、ケアリングは本能的な行動で、子供の発する声などの刺激を受けて活性化される視床・帯状皮質を中心とする辺縁系の進化により可能になっている。人間の子供への愛情も例外ではなく、同じ辺縁系からの情動なしには維持できない。しかし、人間の場合この辺縁系の本能のネットワークを様々な前頭葉皮質領域が連合することで本能とは別の行動が可能になっている。例えば、自分の子供以外をケアリングしたり、あるいは人間以外の動物の子供のケアリングもその例だろう。
ケアリングに関わる共感は、さらに進むとオスとメスの間の性行動や、つがいの形成（Pair bonding）にも見られるようになる。もちろんこの共感も、子孫を残すという目的を最も効率よく果たすよう進化した脳幹の回路に支配されており、本能の回路だ。実際、広く動物を見渡しても、子孫を残すという目的以外で生殖行動を起こすようになったのは人間だけではないだろうか。
さて人間のPair bondingの特徴は、一夫一婦（monogamous：もちろん例外もあるが）だろう。一般的に、子孫を残す目的の生殖行動は、類人猿を含む大半の哺乳動物で、強いオスだけが生殖本能を満たして子孫をのこす一夫多妻であることが多い。人間に近いチンパンジーもこのスタイルをとっている。攻撃性がなく、時に利他性すら示すとして、道徳の起源を探ろうと研究されているボノボですら、一夫一婦制の家族を作ることはない（極端に言うと相手を選ばない乱交型と言えるかもしれない）。しかし、一夫一婦制をとるのは人間だけではない。５％弱の哺乳動物では生涯一夫一婦のつがいで暮らすことがわかっている。すなわちこれらの動物では、新たな生殖行動の様式として一夫一婦制を進化させてきたと考えられる。残念ながらなぜこのような一夫一婦様式のpair bondingが進化したのか答えることができないが、このpair bondingにはそれ以外の動物にはない仕組みが存在することはわかっている。

図２：プレーリーハタネズミ。（出典：Wikipedia）
一夫一婦型の動物として、最もよく研究されているのが、Prairie Vole（プレーリーハタネズミ）だ。社会性を誘導するホルモンとして有名なオキシトシンをメスの脳に注射すると、出会ったオスとの絆が強まることが知られている。一方、オスのメスに対する絆を強めるためには、オキシトシンの代わりにバソプレシンを脳内に注射する必要があることがわかっている。逆に、オキシトシンやバソプレシンの作用を阻害する分子を脳内に注射すると、pair bondingを阻害することができる。すなわち、ハタネズミは進化の過程で、オキシトシン、バソプレシン刺激に反応する神経ネットワークを、生殖本能のネットワークと連合させることで一夫一婦システムを進化させたことがわかる。
全く同じとは言えないものの、人間の一夫一婦型ペアリングにも同じ原理が残っていることが知られている。少し浮世離れした面白い研究で、初めて読んだ時私も「大笑いした（？）」３題話になっているので詳しく紹介しよう(図３)。

図３　米国アカデミー紀要に掲載されたPare bondingに関わる３編の論文。

発端は２００８年１月発行の米国アカデミー紀要に掲載されたフロリダ大学の論文だった。論文の内容は驚くべきもので、実験室で飼っているハタネズミのオスの中に、他のメスと浮気をする個体がいるので、そのバソプレシン受容体(V1aR)の脳内での発現場所を調べると、一途に添い遂げるネズミと比ベて大きな差が見られることが報告されていた。
これでも十分面白いのだが、同じ年９月にスウェーデンカロリンスカ大学から、V1aRの遺伝子多型と男の浮気心についての研究が米国アカデミー紀要に発表された。この研究では、V1aRの一塩基多型(SNP)を調べ、特定のSNPを持っている男性は離婚を含む結婚の危機を経験している確率が、そのSNPを持たない男性と比べて２倍高いことを報告している。さらに、結婚ではなく同棲している率もこのSNPを持つ男性の方が２倍多い。この結果は、人間の夫婦形態が教育、文化等の影響を受けて複雑になってはいても、本能的なところでは、ハタネズミと同じ情動が働いていることを示唆している。
これらの結果は、男性の特定の女性へのpair bondingに、ハタネズミと同じバソプレシンが関わることを示しているが、人間の進化の過程で、オスはバソプレシン、メスはオキシトシンという差を失いつつあり、男性のpair bondingにもオキシトシンが効果を持つことがドイツ・ボン大学から。２０１３年１１月にやはり米国アカデミー紀要に発表された。実に楽しい実験で、結婚前の恋愛進行中の男性を集め、恋人の写真、及び無関係の魅力ある女性の写真に対する反応を機能的MRIで調べている。写真を見せる前にオキシトシンスプレーを鼻に投与する群と、偽薬を投与する群に分けて、ステディーな恋人の写真を見た時に興奮度を高める効果がオキシトシンにあるかどうかを調べている。専門家でないので、どの程度MRIのデータを信用していいのかはわからない。ただ結果は予想通りで、オキシトシンを投与されると、今つき合っている恋人の方により強く興奮するが、偽薬だと恋人の写真と、知らない女性の写真を見たときの反応に大きな差が無くなると言う結果だ。
言語誕生を人間の社会性と一夫一婦の夫婦形態が促したと考える研究者は少なくないが、動物共通の共感本能から発展したpair bondingの進化を探るだけでも、本能に関わる脳ネットワークを基礎に、それをさらに支配するためのネットワーク間の連合が進化していることがお分かり頂けたと思う。脳というシステムの性質上、系統発生で進化した能力がそのまま個体発生で繰り返すことはないとしても、人間特有の能力のルーツを辿れば、脳の進化過程で拡大してきた本能の進化があることは間違いない。この意味で、人間の発達過程で起こる現象を整理して、系統発生的ルーツを考えることは重要だ。
言葉の発生に戻ると、育児書では言葉の発達は幼児語が始まる１歳前後から始まるが、もっぱら泣いているだけに思える３か月ぐらいからすでに、少しずつではあるが周りで起こっていることが理解され始め、泣くという行為を通して、コミュニケーションを図ろうとしている。その後。「バババ」と言った赤ちゃん言葉(babbling)を経て、ママ、パパのような意味のある言葉が発展していく。この時、お母さんから見るとどうしても言葉を話すということに注意が集中してしまうが、実際には周りの出来事についての理解、様々な方法でのコミュニケーションの試み、社会（人間関係）の認識などが脳発達とともに進行している。これまで読んだ論文の印象から言うと、この過程の詳しい記述は始まったばかりではないかと思う。その意味で、今後人間の個体発生の記録の蓄積は、まだまだ言語誕生の研究に欠かせない。特に最近の赤ちゃんは、私たちの時代とは全く異なる家庭環境に置かれている。この新しい状況が、系統発生で獲得された能力にどう影響していくのか、フロイド、ユング、ピアジェの時代の個体発生過程の記述を比べることで、予想もしない発見があるかもしれない。
次回は、これまでのまとめとして、私が言語発生の過程についてどう想像しているのか「言語発生のマイスタージンガーモデル」というタイトルでまとめてみたい。
[ 西川伸一 ]

言語誕生のマイスタージンガーモデル（前編）
2018年1月9日

これまで言語誕生について、断片的に書き留めてきたことの中間まとめを2回に分けてお届けする。脈絡なく書き留めてきた文章になんらかの筋を汲み取ってもらえればありがたい。一種の書き下ろし原稿になっているので、この文章だけで十分理解してもらえると思う。またこの原稿を通して、言語を考える時に参考になる本を紹介する。

言語誕生を促す２つの契機

互盛央さんの「言語起源論の系譜」（図１）を読むと、人間は言語を話す自分に気がついてからすぐ、自分の使っている言語はどのように生まれたのか考え続けてきたようで、この問題は少なくとも2500年の歴史がある。しかし、人間の脳との関わりで議論が始まったのはやはり２０世紀で、中でも私たちの言語能力は決して学習するものではなく、生まれつき備わっているものだとしたチョムスキーのUniversal Grammar仮説は影響力が大きく、言語の起源をめぐる議論の中心になった。

図１互盛央さんの『言語起源論の系譜』（講談社）
言語起源論の歴史を知るには面白い本で、深い知識に裏付けられている。

チョムスキーは、言語発生がコミュニケーションの延長線上にないことをことさら強調することで、universal grammarを前面に出して言語の発生が統語能力の発生であるとする論陣を張った。これに対し、言語発生には、人類特有の新しい社会関係を支えるコミュニケーション能力が必要だとする陣営は黙ってはいなかった。現状はというと、（個人的印象だが）言語誕生の背景に人類特有のコミュニケーション能力の進化があると考える人の方が今では多くなっているように思う。
この論争についてここで詳しく解説する余裕もないし、またどちらを支持するのかという議論をするつもりはない。代わりにこの原稿では、普遍文法もコミュニケーションの能力も、言語誕生に必須の独立したモデュールとして考える。すなわち、チョムスキーの普遍文法が提起した統語の問題を、行動についての表象能力の問題、ボキャブラリーの問題を作業記憶過程での連合の問題、そして言語の誕生に関わるコミュニケーションの問題を、自分を含む社会のゴールの表象の問題として捉え、これらが交わるところに言語が発生したという観点から考えてみたい。

比較進化学として言語誕生を考える
言語は人間特有の能力で、地球史におけるそのインパクトは、地球上にこれほど多様な生物をもたらせた進化を可能にした生命最初の情報DNAにも匹敵する。言語を持つ人類ののみが文明を発展させ、他の生物を圧倒する繁栄を遂げた。その結果は地球の環境も変化させる力がある。例えば、もともと地球上にO2と表現される自由酸素はほとんどなかった。しかし、生物が誕生し、その後光合成を行う生物が進化すると（おおよそ３５億年）地球上でも酸素が作られるようになり、生物の繁栄とともに１０億年前から急速に濃度が上昇した。この変化は全て、進化を可能にしたDNA情報の誕生の結果だ。
同じように、現在地球温暖化の元凶と言われる２酸化炭素の蓄積をもたらしている工業化の問題は、元をたどると言語という全く新しい情報媒体誕生まで遡ることができるだろう。言語誕生を５万年から１０万年と考えると、これほど短い期間に人類を繁栄させ、地球の生物相や大気成分までを大きく変化させる力を言語は持っていたことになる。事実、千年前は人間、家畜、ペットの哺乳動物に占める割合は１％に満たないと推定されているが、現在は何と９８％に及んでいる。これは決して人間の筋力が他の動物に比べて強いからではなく、人間だけが言語を獲得した結果に他ならない。
このように人類だけが地球上で言葉を使い、文明を発達させ、地球の大気すら変化させた。では言語はどのように現れたのか？この過程を「創発」という言葉で終わらせるのは思考の停止だ。実際には見ることができない過去に起こった言語誕生を理解するために、現存の人間特有の能力と、他の動物、特に我々に最も近い霊長類の能力を比べ、それぞれの違いを理解した上で、各能力と言語の関わりを探る研究が続けられている。
言語誕生に関わる変化のうち一番わかりやすいのが、喉頭の解剖学的構造だ。口腔から離れた下の方に喉頭がある人間と比べると、霊長類の喉頭は口腔・鼻腔直下にあるため、声帯で発生させた音を口腔内で操作することができない。結果、私たちのように多様な母音や子音を発生することはサルには不可能だ。サルが発生するほとんどの音は鼻で増幅する鼻音として発声される。このため言語に必要な複雑な音を発生することは霊長類ではできない。
ただ、発声に必要な解剖学的特徴は言語に必要なモデュールのほんの一部でしかない。もっと重要なのは、記憶とコミュニケーション能力に起こった変化で、この条件が揃わないと、オオムと同じことになる。手短に、人間特有のコミュニケーションと記憶能力について見ておこう。
目的と意図を共有する新しいコミュニケーション様式の誕生
映画「猿の惑星」でサルも進化すれば人間と同じ能力が獲得できると描かれているように、私たちの興味はともすると「サルはがどこまで人間に近づけるか」、すなわち「サルでもできる」ことに向きがちだ。例えば、膨大な努力を払って、チンパンジーやボノボに言葉を教える研究がその例だ。これまでサルが１００語以上の単語を正確に区別でき、覚えた単語を使って意思表示も可能であることなど示されている。しかし、言語誕生の条件を考える上で本当に重要なのは、間違いなく人間にはできてサルにはできないことを明らかにすることだ。実際には、できないことを証明するのは難しく、また一つの仮説の検証に、時間をかけてサルを訓練する必要があり、手間のかかる大変な実験だが、この努力のおかげで「サルにはできない」幾つかの人間特有の能力が特定されてきた。中でも、ライプツィヒのマックス・プランク進化人類学研究所（Max-Planck Institute of Evolutional Anthropology）のマイケル・トマセロ（Michael Tomasello）は、同じ課題をチンパンジーなどの類人猿と、様々な年齢の人間の児童に行わせて、人間特有の能力とは何か、またそれがいつの段階で獲得されるのかを丹念に調べている。彼が２０１４年に出版した『Natural History of Human Thinking』はこの分野に興味のある方には是非読んでいただきたい著書だ。

図２：Tomaselloが2014年に出版した人間の思考についての著作『Natural History of Human Thinking』（Harvard University Press）。多くの実験事実の裏付けられており、アカデミックな読み物。

Tomaselloをはじめ、この分野の多くの研究者が一致しているのは、人間特有のコミュニケーション様式を生み出した社会性が「一種の利他性」だという点だ。しかし、利他性なら母親が子供の面倒をみるcaringや、オスとメスがつがいを作って（pair bonding）暮らしている動物にも存在するはずだ？
たしかに、人間の持つ利他性の究極の起源にはcaringと同じ情動の仕組みがある。たとえば一見利益の反する行為も促すことができる「ご褒美回路」として知られている仕組みは、人間の利他性にも働いていることはまちがいない。しかしサルと人間を比べると、人間の協力関係だけに、「他の個体とゴールと意図を共有する」という特徴が見られ、これが動物の利他的行動には欠落していることがわかる。
Tomaselloの実験の一つを紹介しよう。お菓子を手に入れるのに協力が必要だが、得られるお菓子は一回に一人分しか出てこない機械を挟んで座った２人の子供、あるいは２匹のチンパンジーの行動を観察し、お菓子を順番に手にするために、相手が先にお菓子を手にするのを我慢できるか調べた実験を行うと、人間の子供は（3.5歳齢以上）協力して「今は僕、次は君」というように順番にお菓子を分けるのに、チンパンジーでは偶然に協力関係が成立することはあっても、自分が我慢を強いられる順番があることを受け入れられず持続的な協力が成立しないことを示している（Melis et al, Psychological Science, vol 27, issue 7, 987-996, 2016）。
集団行動という点で見れば、チンパンジーなどの霊長類も肉を求めて複数の個体が協力して小さなサルの狩りを行うことはよく知られている。しかし、一見協力して行われている狩もよく観察すると、各個体は自分が獲物にありつくという目的だけを考えており、獲物を得て分け合うという共通の目的を共有することはできない。
共通のゴールを共有する協力関係には、個体同士で指示をし合うコミュニケーション、すなわち相手の意図が理解でき、自分の意図を相手に理解させることが必要になる。このような指示関係が最初は自然発生的に成立しても、同じことを繰り返すためには、上記の論文のタイトルにあるように「今度は君、次は僕」といった取り決めを両方が確認する必要がある。先に述べたTomaselloの論文でも、協力し合う3.5歳児は、指差し（ポインティング）を用いてコミュニケーションを図っていることが記載されている。このように「君と僕」といった２人の間の比較的簡単に見えるコミュニケーションでも、人間だけにしか、しかも3.5歳児になるまで観察することができない。もっと多くの個体同士がゴールを共有して協力するとなると、さらに高次のコミュニケーションが必要になることだろう。
ではこのような意図の共有はどのように発生してきたのだろう？もちろん正解があるわけではないが、多くの研究者は共同生活するグループの人数が増え、社会構成が複雑になったことが大きな原因だとかと考えている。この根拠として最もよく引用される研究がロビン・ダンバー（Robin Ian MacDonald Dunbar）らが１９９２年に発表した論文だ（Dunbar RIM, Neocortex size as a constraint on group size in primates, Journal of Human Evolution 20, 469-493, 1992）。
この論文の要点は、霊長類から現代人までの新皮質のサイズと共同生活での集団のサイズをプロットすると両者が正比例することだ。すなわち、集団構造の複雑性と、脳のサイズが正比例することを示している。アフリカでの最初の人類誕生はおおよそ４００万年前だが、脳の新皮質の急速な増大がみとめられるのは２００万年後、Homo.Ergasserが誕生してからで、彼らのグループの人数も、それまでの５０人以下から、１００人近くに倍増していると考えられており、Dunbarの仮説を支持している(図３にDunbarの最近の著書１冊を紹介しておく)。

図３　Dunbarが2014年に出版した『Human Evolution』（Pelican）。何が我々人間の進化を後押ししたのか、言語誕生に至るまでわかりやすく書かれている。

最初の原人がアフリカに誕生したあと２００万年間、人類のハンティングは、死体や食べ残しの骨をかすめるハイエナのような狩りだったと考えられているが、H. Ergasserになると人間より大きな獲物を求める狩りが始まった。石器の進歩は１０万年前まではゆっくりだが、それでもH.Ergasserの石器には動物を殺すための進歩が見られる。いずれにせよ、１００人程度の共同生活が可能になるためには、野生のチンパンジーの狩りとは違って、獲物を分け合う集団生活が行われていたと考えられ、ゴールや意図を共有して協力する社会が形成されていた。
重要なことは、この複雑化した協力関係や利他性の背景には、必ず新しい表象と統合システムが脳内で形成されているという点だ。このシステムの要件として、

１）自分の身体や内的自己を他人から区別し自分のものとして認識する能力、
２）他人の行動の目的について表象する能力、
３）他人も自分と同じように考えていることについての理解（Theory of Mindと呼ばれている）
４）自分が相手と同じであると相手が認識していることを理解する能力
など、自己と社会との関係についてハッキリと表象が形成される必要がある。実際、類人猿から人類まで、この能力拡大に伴って新皮質が急速に発達した。加えて後に説明するように、こうして生まれた表象が成立するためには、経験が記憶されるだけではなく、抽象的な意味記憶、すなわちカテゴリーや意味の記憶を基準として、感覚を通して体験するエピソードを選択し、表象し、記憶することが必要になる。脳が大きくなったというだけでなく、新しく発達した領域と既存の領域間のネットワークが形成され、より複雑な表象の形成が可能になった。
だからと言って、H.Ergasserやその後の原人（Hominin）のコミュニケーションが言語を使っていたと考えてはならない。実際言語はH.Ergasserどころか、ネアンデルタール人も使えず、Homo Sapiensが現れて初めて使われるようになったと考える研究者が多い。
実際には、コミュニケーションの手段自体より、新しいレベルのコミュニケーションが可能になったことがまず重要で、H.Ergasserが約２００万年前に現れたとすると、その後１９０万年以上の間、５万年から１０万年前に言語が誕生するまでの原人のコミュニケーションは、ジェスチャーや、スティーヴン・ミズン（Steven Mithen）がHmmmmm(Holistic manipulative multi-modal musical and mimetic)と呼ぶ、自分の意思を伝えるための分節されてない音楽的な発声（赤ちゃんの発声の意図を周りが受け取って要望を満たすといったシーンを考えればいい）で、実用的には間に合っていたと思える（図４にMithenの著書を紹介しておく）。

図４　Mithenが2005年に出版した歌うネアンデルタール『The Singing Neanderthals』（Harvard University Press）。言語誕生に音楽が果たした役割を示す面白い考え。

しかし、意図を共有したコミュニケーションを可能にする脳構造のおかげで、集団的な狩りの成功率は上昇し、その結果タンパク質の豊富な肉の消費量は上昇し、脳の拡大は更に加速したことだろう。このように、５−１０万年前まで、集団で獲物を追いかけるHunter Gathererが目的を共有し分業により獲物をしとめる暮らしには、私たちが考えるような複雑な言語がなくても、ジェスチャーやHmmmmmで十分済ますことができたと思われるが、おそらく脳自体は大きくなり、より言語の誕生を支える可能性が高まったと思われる。
コミュニケーションを求める力動は言語発生の必須条件
では、ゴールを共有する社会性を持つことが言語発達にどのような影響を持つのだろう？進化の過程でこれを検証することは、現在はまだ難しい。しかし、人間の言語発達過程にこの社会性が重要な役割を持つことは、自己と社会との表象が変化する自閉症スペクトラム (ASD)やウイリアムズ症候群(WS)の解析を通して認められているので、短く紹介しておく。
ASDは、社会性の低下、言語発達障害、そして反復行動を主要な症状として示す発達障害を指し、症状は同じでもその原因は極めて多様であると考えられており、そのため自閉症という病名ではなく、自閉症スペクトラムと称す流ことになっている。原因はともかく、知能の発達が正常でも、社会性の低下と、言語の発達遅延が必ず合併していることから、他人とのコミュニケーションを求める力動が言語発達に必要な条件であることを示す例として考えられてきた。事実、ASDは乳児期から能動的に体験を求め外界へ働きかける行動が見られないことがわかっている。正常児では生後３−４か月までに相手の顔をじっと見つめ、動くものを目で追いかけ、音がする方向に顔を向ける動作が見られる。ところがこのような反応がASDではしばしば欠けている。このため米国疾病予防管理センターは、「もしあなたの子供が、音に反応せず、動くものを目で追いかけず、笑わず、指をしゃぶらない」なら、すぐに専門医に相談するよう勧告している。おそらく胎児発生の過程で形成される脳の回路が普通とは違っていたため、外に経験を求める力動が低下して、コミュニケーションを求める欲求が減ったため、結果としてコミュニケーションの媒体である言語発達を求めないのだろうと考えられる。
このような解釈は、都合の良い現象を集めただけの、思弁的な想像だと思われても仕方ないが、もう一つの例ウイリアムズ症候群について知ると、まんざら間違っていないように思えてくる。
ウイリアムズ症候群は1961年外科医により「大動脈弁上部狭窄症と特徴的精神症状を示す」一群の患者の存在として記載された。その後の研究で、７番染色体上の大きな欠損によりその領域にある２０種類の遺伝子が片方の染色体ごっそり抜け落ちてしまっていることがわかった遺伝疾患だ。もちろん病気の詳しい解説をするつもりはない。重要なのは、この患者さんたちが自閉症とは逆に「相手の目をじっと見つめる、愛すべき人懐っこさを持つチャーミングな性格」を持つことと、知能の発達が障害されIQは６０程度であるにもかかわらず、言葉を話す高い能力を持っている点だ。実際には、知能発達の遅れのため言葉を話し始める時期は遅れるのだが、一旦言葉を話し始めると多弁で同年齢の通常児を凌駕する。すなわち、社会性と言語能力の関係という観点から見た時、ウイリアムズ症候群の患者さんには自閉症とまるで反対の症状が併存している。このことは、「愛すべき人懐っこさと称される高い社会性」が、知能発達遅延による言語発達への影響を克服できるだけの力があることを物語っている。
これらの例は、個体の発達から見ても、コミュニケーションを求める力動、すなわち社会性が言語発達の条件になっていることを示している。この意味で、言語のコミュニケーション機能を無視する考えには賛成できない。
※「言語誕生のマイスタージンガーモデル（後編）」は2018年2月1日に公開します。
[ 西川伸一 ]

言語誕生のマイスタージンガーモデル（後編）
2018年2月1日

音節と記憶の連合（Lexicon:語彙は、連合させて記憶を高めるメモとして 始まった。）
話題をガラッと変えて、次は記憶について考えてみよう。私たちには瞬間ごとに、膨大な量の情報が感覚を通して入ってくる。これら全てを記憶することは不可能だし、ほとんどは意識にすら上ることなく通り過ぎる。意識されるのは、各人が経験で形成してきた独自の基準とその時の脳の状態に照らして選択された表象だけで、この時の選択を行う基準を、「自己」と呼んでいいと思うが、自己の表象自体も刻々変化する脳内ネットワークだ。
感覚を通して入ってくる情報 の中から特定の表象を選択して記憶しているとは言っても、物事を正確に覚えているのは難しい。我々の感覚の７割は目を通して入ってくるが、例えば初めての美術館を巡って外へ出た瞬間、目の前にもう一度イメージを思い浮かべられる絵は何枚あるだろうか。実際、覚えられないのが当然で、絵を見るとき私たちが画像をどのように脳内に表象しているかを考えれば、覚えていることの方が奇跡だ。実際には、絵の様々な場所に視線を走らせて、そうして得られた各部分の表象を、形、色など様々な要素に分解し、それを脳内の異なる部分に維持した上で、もう一度脳の中で表象へと統合し直す。すなわち、絵を見ている瞬間として認識している体験も、実際には細切れになった様々な表象を脳内各所に維持し、それを再統合したものをある瞬間に見た画像だと認識しているだけだ。この過程は、作業記憶と呼ばれているが、この複雑な過程を何回も繰り返すのが絵画の鑑賞になる。とすると、情報量が多すぎてなかなか記憶に残らないのも当然だ。しかし見た瞬間、なぜか深い感動を覚える絵は間違いなく記憶している。これは複雑な視覚の表象でも、感情という単純な表象と連合させると覚えやすいからだ。もちろん、連合相手は感情だけではない。何か単純なシンボルとうまく連合させれば記憶が容易になることは多くの人が経験していると思う。美術館で写真を撮ったという記憶があると、その絵を覚えている確率が高まるという研究があるが、これも写真を撮るという簡単な表象と連合させているからだ。
匂い、音、驚き、恐怖の経験など、感情的表象は記憶を容易にする連合相手の定番として実際使われているが、短い音節も記憶に残りやすく、連合相手として優れていのではないだろうか。私たちはすでに言語を持っており、言語に似た音節を個人的な記憶を高めるための個人的メモ代わりだけに利用している原始的状況を想像できない。しかし、私たちの記憶に、実際の事物の表象と音節を持ったシンボルとしての単語の表象の連合は大きな役割を果たしており（固有名詞と顔の表象を考えてみてほしい。言語的連合があると覚えることができる）、個人的に、特定の音節を連合させて 記憶を高めるために使うことは十分あり得るのではないかと思っている。言語が誕生する前は、この音節と事物の表象との連合は偶然結びついただけで、シンボルとして表象に固定されているわけではないし、ましてや他の個体や社会と共有しているわけではない。しかし私たちの脳内には、語彙とは全く別に様々な事物についての表象が階層的に形成されている。例えば、食べられるもの、食べられないもの、甘いもの、しょっぱいもの、といったカテゴリーだ。この表象に、音節がいったん連合されると、当然その音節は、頭の中に形成されている複雑な表象のネットワークに統合される。
もう少し具体的に見てみよう。言葉を持たない原人でも、獲物の鹿が見つかった時には思わず声が出る。この声になって出た「ディア」といった音と鹿と周りの景色を連合させたとしよう。すると、この「ディア」という音は、鹿を見つけた経験の表象と個別に連合されるが、これにより原人の頭の中にあるほとんどの表象のネットワークに組み込まれたことを意味する。例えば「ディア」という音節は鹿とその周りの景色というだけでなく、ライオンとは違うこと、食べれば美味しい、あるいはもっと大きなカテゴリー、４つ足の動物などの表象とも関連することになる。

連合による明瞭な記憶は自己自身の表象の確立に始まった。

図1　昨年出版された、Murray, Wise, Grahamの３人の共著による記憶の進化についての著書『The evolution of memory system』。進化という観点で記憶を捉えた本としては初めてではないだろうか。

上記のように、物事を明瞭に覚えるためには、関係のない表象を連合させられる能力が必要になる。異論もあると思うが、このような能力が人類だけに発達したと考える研究者は多い。中でもエリザベス・マレー（Elisabeth Murray）等によって最近出版された『The evolution of memory system』では、明瞭なexplicit memoryと呼ぶ明瞭な記憶を形成する能力は人類にしかなく、類人猿を含む動物では発達していないと主張されている（図1）。というのも、explicit memory形成には、新しい連合とそれを統合する脳の仕組みが必要で、具体的には考え行動している自己を身体認識とは切り離して表象し直し、エピソード記憶形成過程で、一旦分解された感覚からの表象を、もう一度統合する基準にすることが、人類だけで可能になったからだと主張している。一種の、主観的意識のようなものだと思うが、説得力のある主張だ。
動物にexplicit memory（顕在記憶）やsemantic memory（意味記憶）があるのかないのか、全く判断できないが、それでもこの本の指摘は言語を考えるためには重要だと思う。というのも、自分が発生した音節を、全く無関係のエピソード記憶と連合させ記憶を鮮明にする、音節をメモ代わりに使う能力は、explicit memoryを可能にする能力と完全に重なるからだ。この本では、言語であれ、新しい文明であれ、すべては人類だけが獲得した、explicit memory形成能力に起因するとまで提案している。確かに、homo sapiensが生活していた洞窟に残された動物の絵は、明瞭な記憶なしに描くことはできない。
さらに、カテゴリー化の能力や、全く無関係な表象を連合させる（例えば母親(mother)、と自然（mother nature））semantic memoryも内的自己の表象を、様々な表象を連合させる基準に据えることで可能になったと考えられる。要するに、偶然であっても、自分を中心に全く関係のない表象と表象を連合させる能力は言語発声にとって必須の条件になる。
しかし特定の音節をいくら頭の中の様々な表象と階層的に連合させられるとしても、その過程を他の個体と共有できているわけではない。言語発生には、この音節と事物の表象の関係を複数の個体が共有する必要がある。この問題については最後に議論する。

行動の表象が文法を決める
言語発生前の話をしていることを再確認しておく。したがって、ここで議論している言語は、たかだか語彙が１００にも満たない原始的なものだと考えておいてほしい。この状況を念頭に次に文法について考えてみよう。
３歳前後に、最初に自発的言葉を話すようになっても、使う単語は３−４語程度だが、例えば「水・飲みたい」とか「表・出たい」、あるいは名詞を並べて「ママ・今・部屋」などだ。重要なことは、誰が聞いても意味が十分くみとれる言葉を話している点だ。これをもって、普遍文法構造が脳内に形成されていると結論しても悪くはないが、このような幼児の言葉の統語を、私たちが何かをするときかならず頭の中に形成する行動の表象に従って単語が並べられている結果と考える可能性はないだろうか？私たちの行動は、時間的にも、空間的にも様々な制約を受けている。この行動に対する制約は、一つは意識には登らない手続き記憶とし、もう一つは意識された行動の記憶として脳内に表象されているはずで、原始的な言語ではこの表象がそのまま統語のルールとして使われている可能性がある。
実際、運動と文法の間に関連があると考えられる現象は存在する。この関係が最も明確に見えるのが、運動の中枢、小脳の障害により起こる失語だ。小脳性の失語は、有名なブローカ失語やウェルニッケ失語とは症状が異なり、Agrammatism（失文法）と呼ばれる文法の異常が見られることが多い。このことは、小脳内に統合されている行動の表象が文法としての機能を果たしている可能性を強く示唆している。
また、大脳皮質の失語に失行症が併発することもある。失行症とは、自分の行動についての表象が障害される疾患だが、この結果も行動の表象と言語が強く連合していることを示している。このように、原始的な言語に見られる普遍文法は、行動の手順についての表象と解釈できるように思う。
全ての条件が出会うところ
ここまで言語誕生に必要な条件として、１）ジェスチャーやまだ言語ではない発声を通して意図を共有しようとする新しいコミュニケーション能力の誕生（背景には、自己と社会の新しい表象能力の誕生）、２）複雑な作業記憶過程に単純な音節を連合させて記憶を固定する能力（背景にはexplicit memory形成能力）、３）行動の手順を表象し表現する能力（背景には統語能力）の３条件を見てきた。もちろん他にも条件を考えられると思うが、そろそろこれらの条件が集まって言語誕生へと向かう過程について考えてみよう。
それぞれの能力がいつ発生したのかはわからないが、言語の発生時期と考えられている１０−５万年前に急に現れた能力ではないと思う。おそらく、２足歩行のサルと言えるオーストラロピテクスから、人類として地上生活を始めたH.Ergasserが現れ、類人猿とは全く異なる社会生活が始まった頃から、人類はそれぞれの性質を備え始めていたと考えられる。実際この後、オスとメスの大きさの差がなくなり、噛みつくときに使う犬歯が退化する。すなわち、ボスが支配する集団から、争いの少ない平等社会に移行し、嚙みつく代わりに道具を使って骨を砕き、獲物を獲る狩猟生活に移ったと考えられる。しかし、もし多くの学者が信じているように、私たちホモサピエンスと数万年前まで交流があったネアンデルタール人や、デニソーワ人が言語を持たなかったとすると、条件は揃っていても、言語誕生のないまま２００万年近い狩猟生活が続いたことになる。そして、１０万年前になぜホモサピエンスがこれらの条件を現在の形の言語へと集約させることができたのか、またそのきっかけは何なのか、言語学の最も重要な問題になった。
異論もあると思うが（ネアンデルタール人も言語を持っていたと考える研究者は少ないが存在する）、条件が集まるきっかけを得ることができなかったネアンデルタール人は言語を手に入れることなく滅びてしまった。一方、我々ホモサピエンスのみが言語を手に入れることができ、地球の隅々にまで広がり支配者として君臨することになった。

ニュルンベルグのマイスタージンガー
実際きっかけについては、様々な説がすでに提案されているので成書を当たって欲しいと思う。この稿で紹介したい私の勝手な妄想は、道具（精巧な石器）作りを教える過程でこれらの条件が揃ったというものだ。そしてこのきっかけに、音楽の脳、道具の脳、そしてコミュニケーションの脳が出会いを媒介したのではないかという考えだ。これからそれについて説明するが、この可能性を考えている時、私の頭にフッと浮かんだのがニュルンベルグのマイスタージンガー第二幕のシーンだ。
オペラファンに説明する必要はないが、馴染みのない方のためにニュールンベルグのマイスタージンガー第２幕を少し説明しておこう。このオペラは、ニュルンベルグの古いマイスター社会に飛び込んできた新しい思想を持った騎士Walter von Stolzing（ワーグナー自身のことでもある）が、ニュルンベルグのマイスターからその芸術の重要性を認められるまでの「てんやわんや」を描いたオペラだ(こんな紹介は顰蹙ものかもしれないがお許しいただきたい)。孤立無援の騎士の持つ新しい芸術の可能性を最初から認め、支援するのが靴作りのマイスターHans Sachsだ。２幕ではSachsを中心に様々な場面が展開する。特に私の印象に残るのが、Walterを慕うEvaの悩みを聞いた後、Walterを貶めようと躍起になるベックメッサーが登場する前に靴を打ちながら歌うアリアだ（図2）。

図2：靴屋のマイスターハンスザックス。ニュルンベルグのマイスタージンガーの主役は騎士ウォルターではなく、間違いなくザックスだ。

ではどうして、この場面が言語誕生を想起させるのか？
もともと、オペラ、ニュルンベルグのマイスタージンガーは、様々な職人が歌を教養として身につけているという前提で成立している話だ。すなわち道具と音楽が一体化していることになる。道具と音楽が一体化していると考えても何も不思議ではない。道具を作ったり、使ったりする時はリズミックな音が出ることが多い。また、そのようなリズミックな音が、仲間同士の感情の共有に役に立っているのは、現在でも原始的な村落では見られることだ。
そして、なんといっても狩猟生活を送る人類の先祖にとって、道具作りは最も重要で、explicit memoryが要求される作業だったと思われる。さらに、それを他人に教えるとなると、explicit memoryだけでなく意図と目的の共有、利他性などそれまで人類が発展させてきた人類特有の能力が必要になる。このように道具作りは、言語誕生に必要な条件が全て揃う一つの状況になることは間違いない。
一方、音楽は現在も感情を伝え、共有するためには最も有効な手段だ。言葉を話す前の赤ちゃんは、感情のこもった発生とジェスチャーを使ってなんとか意思を伝えようとする。前出のスティーヴン・ミズン（Steven Mithen）は『Singing Neanderthal』の中で、言語が生まれるまで人類は音楽に近い発声をコミュニケーションに使っていたと考えている。この音楽の力は、例えばダビンチのモナリザを思い起こすときと、ベートーベンの運命の冒頭を思い起こす時を比べてみるとわかる。明らかに、音楽の方が思い出しやすい。これは音楽が感情と直に連合しており、 視覚表象より単純で、 脳回路の構造とフィットしているからだろう。
こう考えると、道具作りを教える時、ジェスチャーと共に、メッセージを伝えやすい音楽的発声が指示に使われたと思える。さらに、道具を作ること自体が音を発する。すなわち、explicit memoryを形成する時、連合させる単純な音が満ち満ちているのが道具作りの過程だ。当然、同じ音を、教える側、教えられる側が特定の事物の表象と連合させることができる確率は他の場合より高いと考えられる。その上、音楽を通じてより強く意図を共有する体制もできている。
言語誕生には、それまでexplicit memoryの形成のために各個体が個別に行っていた音節との連合を、偶然にしかし高い確率で他の個体と共有できる状況が必要になる。これが道具作りを教える状況に備わっていることは、以上の議論からわかっていただいただろうか。
こうして生まれた語彙が広まるのが簡単なことは、例えば有名なニカラグアの聾唖の子供達に自然発生した手話の例を見ればわかる。聾唖であることから言語世界から完全に切り離されて育った子供たちが集められて、200-400人規模で集団生活を始めることで、急速に彼らの間で通用する独自の手話が発達した。これは、一旦語彙が共有されると、それを教え合って、集団全体で共有することが可能なこと、語彙を共有する方法が確立すると、個々のコミュニケーションの現場で取り決められる語彙や文法は、瞬く間に集団で共有されることがニカラグアの手話の例から明らかになっている。このように言語は、集団で共有されることで、個人の脳内過程から解放され、集団に支えられ独自に進化することができる。要するに、１−２個の語彙の意味を共有することができれば、あとは自然に現在の形へと発展したのだろう。
なんとか言語誕生の大枠について書くことが できたので、次回からはこの大枠に基づいて 各部分の詳細を詰めていこうと思っている。
[ 西川伸一 ]

マイスタージンガーモデルに関する補足I
2018年2月15日

２回に分けて言語誕生についての私の考えを読んでいただいたので、私が言語誕生についてどう考えているのか、マイスタージンガーモデルから理解していただけたのではないだろうか。しかし細部の詳しい説明は抜けているし、結局「なんとでも言える」Just So Storyと思われてしまいそうだ。そこで今回から、このシナリオの説得力を高める為、幾つかの細部について補足したいと思っている。
このモデルでは、話し言葉中心の言語が発生する前から言語の基本能力は進化しており、サルとは異なる人類独特のコミュニケーションが可能になっていたと考えている。この点についてまず補足する。
いま現在私たちが使っている言語は、音をベースにした話し言葉と、文字をベースにした書き言葉からなっているが、文字が出来る前は話し言葉が中心だった。マイスタージンガーモデルでは話し言葉を中心とした言語が５万年前後に急速に発達したと考えており、この点についてはさらに補足する予定だが、もちろんそれ以前にもコミュニケーションのための方法は存在していた。例えばジェスチャーもそうだし、以前紹介したスティーヴン・ミズン（Steven Mithen）の言う音楽的抑揚のあるHolistic言語（http://www.brh.co.jp/communication/shinka/2017/post_000014.html）もその一つと言える。
言語の本質を考える時、話し言葉が成立する条件だけに限定すると、言語誕生に最も重要な条件を見失うことになる。この重要な条件とは、人類のみが獲得した能力で、具体的には、経験を明瞭に記憶し、記憶から呼び出した表象を、実際の対象が存在しない時に相手に伝える能力だ。

図１　シカ狩りを例に言語の条件を考える（説明は文中）

例として、複数の個体が協力して狩りをする状況を考えてみよう（図１）。何人かで狩りに出かけ獲物を探している時、目の前に鹿が現れたとしよう(設定１)。眼前の鹿の存在を皆で共有することはたやすいし、鹿を獲物にしようと全員が目的を共有することは人類でなくともたやすいだろう。人間なら、ポインティングやジェスチャーなどで標的を共有する動作が出ると思うが、ライオンのように複数で狩りをしてもほとんど個体間のコミュニケーションのない動物でも、目の前の獲物に共同して本能的に飛びかかることはできる。またその時、それぞれの頭の中に、鹿のイメージ、匂い、声などが表象され記憶されるだろう。脳科学的に言えば、このようにして生まれる鹿の表象はどの個体でも同じような脳の領域を用いて記憶されていると思う。
何回かの狩りの経験を重ねた個体では、脳に鹿の表象の記憶がだいたい同じように成立していると考えて話を進める（図中で記憶と示している）。もちろん、以前に紹介したように、人間と他の動物では前頭前皮質連合野の発達の違いでexplicit memory（鮮明な記憶：顕在記憶と邦訳されている）の程度が質的に異なっていると考えられる。しかし、ライオンでもサルでも、匂いがすれば鹿、あるいは獲物の表象を何らかの形で呼びおこしていることは間違いない。すなわち、鹿＝獲物についての視覚的表象と、音や匂いの表象が連合して記憶され、新たに音や匂いの表象を体験した時、目の前に鹿がいなくても鹿の表象に結びつけることが出来る。このように鮮明度はともかく、各個体が匂いや音といった刺激により、獲物を表象する神経過程は動物から人間まで共通に備わっている。
次にこのような記憶が成立した個体が集まって獲物を探している状況を考えよう（設定２）。この時、一人、あるいは一頭の個体が匂いを通して真っ先に獲物の気配に気づくことはあり得る。獲物はまだ見えないのに、気配に気づいたとすると、そのことを伝える必要がある。でないと獲物は逃げてしまう。この時人類なら、頭の上に指を突き出して、鹿の形態を真似て鹿が潜んでいることを伝えることができる。ほとんどコミュニケーションの手段を持たないライオンは別にしても、例えば人類に近いチンパンジーの狩りのビデオを見ると（https://www.reddit.com/r/videos/comments/6wqocb/chimpanzees_hunting_monkeys_is_both_amazing_and/）、樹上のオナガザルに気づいた個体が立ち止まって木を見上げると、他のサルも止まって見上げていることから、獲物がいることを態度で示していることがわかる。このビデオではその後、一匹のオスが獲物に近づいて木の上のサルを追いかけ、逃げ惑うサルを待ち伏せしていた他のサルが仕留める様子を映している。すなわち、気配に気づいたことが習性に従って自然に態度に表れ、その態度を感知した他の個体が、学習したパターンに従って協力して狩りを行っている。このビデオでは、ジェスチャーやポインティングは全く見られない。
もちろん人間でも場合によっては、同じように決まったパターンで行動することもあるだろう。しかし、必要ならジェスチャーやポインティングを使って自分が獲物に気づいたことを伝えることができる。一方、サルは両方の手を使うことができるものの、ジェスチャーで獲物の形態模写を行うことはおそらく未だかって観察されたことはないと思う（確かめたわけではない）。
この過程をもう一度整理してみると、

１）鹿の視覚的表象と、匂いや音の表象を連合し、記憶する（人類・動物共通）

２）匂いや音の表象から、鹿の視覚的表象を呼び起こす（人類・動物共通：表象の鮮明度は人類がすぐれている？）。

３）鹿の視覚的表象を、ジェスチャーで形態模写し、それを他の個体も理解する（人類特有）。
という一連の過程が起こっている。とすると、最後の形態模写ができる点が人類のみに備わった言語誕生の条件になる。すなわち、臭いという指標で活性化された視覚イメージが視覚野を興奮させるところまでは他の動物も同じだが、その表象を形態模写しようという着想と、実際に表象に基づいて形態模写する行動は人間特有になる。もちろん、表現にジェスチャーを用いる必要はない。コミュニケーションという目的なら、鹿の声を真似てもいいし、今匂いを感じていることを、鼻を広げて表現してもいい。要するに、頭の中に呼び出した表象が、他の個体の脳にも誘導することがポイントになる。チンパンジーを見ていると、狩りの時両手が使えると言っても、実際にジェスチャーで何かを表現することは解剖学的に難しいと思う。また、鹿の声を真似ること同じ理由で難しい。このように、新しいコミュニケーション手段が発達した背景には、もちろんこのような解剖学的な差も存在する。
この時、ツノを突き出す形態模写は実際の鹿のイメージに近く、セッティングにもよるが表象（意味）を他の個体と共有できる可能性は高い。パース流に言えば（http://www.brh.co.jp/communication/shinka/2016/post_000012.html）、イコンを用いる表現によるコミュニケーションになる。
一方、鹿の声を真似て表現するのは、鹿そのものを表現しているわけではないが、声が鹿の存在を示し、また鹿の表象を他の個体の脳に呼び起こす指標になると言える。これは、パースの言うインデックスと言えるが、話し言葉のルーツと言えるのかもしれない。
鼻をクンクンさせて、今匂いがしていることを伝え、他の個体も同じ匂いを嗅いでみて確かに鹿だと確認することもできる。この場合は鹿の匂いというインデックスを共有したいことを、「嗅いでみろ」と形態模写で伝えることで、最終的に同じインデックスを相手にも嗅がせて、鹿の表象を他の個体の脳内に形成させることになる。このように、コミュニケーションの手段は言葉がなくとも多様に存在するが、いずれの方法でも、最終的に自分の頭の中に呼び起こした鹿の表象を、他の人の頭の中に呼び起すことがゴールになる。
ではこの過程を支える人間特有の能力とはなんだろう。
すでにゴールを他の人間と共有して協力関係を樹立できるのは人間特有の能力であることを述べたが、獲物の表象を共有する過程を考えてみると、言語の背景にも同じ能力、すなわち

１）ゴールを共有する協力を可能にする人間特有の能力、

２）explicit memoryの形成能力、
が存在することがわかる。この能力の脳科学的背景として、ホモ・エルガステル(Homo.Ergasser)の誕生から始まる、前頭前皮質の連合野の急速な発達があることは間違いない。重要なことは、これらは全て学習により発生するのではなく、自然に発生する能力である点だ。explicit memoryが脳の様々な領域を連合させる前頭前皮質の発達に強く依存していることはわかるが、ゴールを他の個体と共有して協力する能力が、連合野がどの領域と結合することによるのかを特定することは現段階では難しい。
さらに言語は進化し、最終的に話し言葉（音節）をシンボルとする段階に至るが、全て上に述べた最初の言語へ向けた脳内のネットワークに起こった質的ジャンプの延長として考えることができる。鹿を求める狩りを例に、さらに進んだ内容のコミュニケーションを考えてみよう。
例えば昨日鹿を見た場所に今日も行ってみようと相談をするという設定が考えられる（設定３）。この時、実際の鹿が近くにいて気配を感じているわけではない。従って、具体的な鹿の存在にまつわるイコンやインデックスは存在しない。すなわち、この時鹿について語るためにジェスチャーや鳴き声を真似ることは、狩りをするという目的が共有されている必要がある。そしてこの場合、この目的が記憶から鹿の表象を呼び起こす刺激として働き、目的を共有する他の個体にも同じ刺激として働いている。すなわち、存在しないものを表現できている点で、我々の言語に極めて近いレベルに達している。そしてこのためには、レベルの高いexplicit memoryと目的の共有が必要で、これは人間だけが達成した能力だ。残念ながら、何か新しい分子の進化に基づく質的変化かどうかは明らかではない。
このように実際には存在しない表象を共有するための記憶が成立し、目的のような抽象的な表象が共有できる段階に達すると、ジェスチャーや鳴き声といったインデックスにより呼び起こされる表象はすでに脳内の様々な表象と連合している。例えば、狩りのプランに実際に必要なのは、肉にありつくため獲物を得ることで、目的はジェスチャーで表現した鹿の表象に限らない。以前紹介したように（http://www.brh.co.jp/communication/shinka/2017/post_000022.html）、私たちの脳内の表象は決して単独で存在するのではなく、様々な表象とカテゴリー化して連合している。鹿の表象は獲物になるほとんどの動物と連合しているだろうし、また獲物以外の危険な動物など多くの記憶とも連合している。実際、狩りで最初にイノシシに出会っても、プラン通りアタックすることになるだろう。
以上をまとめると、言語能力の条件として、

１）情報を共有したいという強い欲求、

２）レベルの高いexplicit memory（高い表象間の連合能力）

３）実物に依存しない表象の呼び起こし

４）これらをストーリーに仕上げる統語能力に必要な、身体的行動の表象能力
があり、これが揃えば話し言葉も目の前だと考えている。
確かに、最後のセッティングでは目的と言った抽象的なきっかけで異なる個体が同じ表象を共有するなど、かなり高度に見えるが、条件自体は話し言葉を持たない直立原人や、ネアンデルタール人も持っていても何の不思議はないと思っている。しかし、コミュニケーションの為のボキャブラリーを増やすには、音節をシンボルに使う、話し言葉の誕生が必須だった。
これが起こったのを、マイスタージンガーモデルでは５万年前と推定しているので、次回は、我々ホモ・サピエンスの歴史を見ながら、５万年前に現在のような話し言葉が始まったと考える根拠について補足する。
[ 西川伸一 ]

なぜ言語の発生時期を５万年前後と考えるのか？
2018年3月1日

前回述べたように、言語発生に必要な脳の条件は現生人類誕生よりずっと以前に整っていたと考えている。ただ、現在私たちが日常使っているような言語、すなわち話し言葉を基盤とする言語（ここではspeech language:S言語と表す）となると話は別だ。すでに議論したように、S言語では脳内に表象される対象と何の関連もない音節がボキャブラリーとして対応し、しかもその対応が異なる個体間で共有される。これまで述べてきたように、これが可能になることで、無限の表現力が我々に備わった。しかし、おそらく小難しい議論を必要としない狩猟採集民の生活には、ジェスチャーや、一種の赤ちゃん言葉の発声で十分間に合ってたはずなのに、S言語への指向性が生まれるにためは、より高いレベルのコミュニケーションが要求される状況があったと考えられる。
「マイスタージンガーモデル」では、複雑な道具作りを教えるという状況で生じた様々な必要性がS言語誕生を促したと考えている。今回の補足では、これが５万年前に起こったとなぜ考えているのかについてその理由を説明してみたい(断っておくが、これはあくまでも個人的な意見だとしてお読みいただきたい)。
現生人類の発生と移動
先に答えから明かそう。私が考える５万年という数字の由来は、我々の先祖ホモサピエンス（サピエンス）がアフリカで誕生した後、ヨーロッパへの進出を始めた時期から算定した数字だ。すなわち、この時期にS言語が初めてサピエンス、特にシナイ半島に住んでいたサピエンスに誕生したのではと想像している。なぜS言語の誕生とヨーローッパへの進出が重なるのか？
これまでに発見されたサピエンスと思われる最も古い骨は、ライプチヒ・マックスプランク人類進化研究所の研究者たちによりモロッコIrhoud から発見され、３１万年前の骨と特定された（Hublin et al. Nature 546:289, 2017）。この発見により約７０万年前にネアンデルタール人（以後ネアンデルタール）からアフリカで分離したサピエンスが、南、東アフリカだけでなく、モロッコの位置する地中海の西の端までアフリカ中に広く分布していたことが初めて確認された。すなわち、人口が増え、繁栄を遂げていたと思われる。
２つの出アフリカルート
こうしてアフリカの隅々に分布したサピエンスは、１５万年前にアフリカを出て、まずアジア、オセアニア方面に移動を開始する（図１）。

図１: 『Science』に掲載された総説をもとに（Science 358: DOI: 10.1126/science.aai9067, 2017）筆者が作り直したもの。サピエンスと確認できる遺跡が存在する場所とその年代をつないで移動ルートを割り出している。

図１はサピエンスがユーラシア進出にたどった２つのルートを示しているが、ホモサピエンスによる可能性が高い遺跡を古い順につないでいくと、このルートが見えてくる。中でも最初のステップ、すなわち出アフリカだけに焦点を当てると、両方のルートでそれほど時間差はない。アフリカ以外で見つかる最も古いサピエンスの骨はイスラエルで約１６万年前のもので、アラビアルートとほぼ同時期か、あるいはより古い時期のサピエンスだ。すなわち、両方のルートでサピエンスの出アフリカが１５万年前には始まっていたと考えられる。
最近『Nature』に、３０万年前ぐらいの地層から、直立原人由来とは考えられない進んだ石器が出土したことが報告された(Nature 554:97, 2018)。この石器がサピエンス由来で、ネアンデルタール人やデニソーワ人でないとする証拠はないが（人骨が発掘されていない）、明らかに著者らは、サピエンスが定住はしていなくても、インドにかなり早くからに到達していたと結論したそうに思えた。今後発掘が進むと、アラビア・インドルートは早くから完全に開いていたとする結果が出てくる可能性があるが、現在まで得られている最も確実な証拠に基づくとサピエンスのアジアへの移動は１５万年前後に起こったとするのが適切だろう。
さて、１５万年前は地球がかなり冷えていた時期でおそらく現在より６度以上温度は低かった。しかしその後急速に温暖化が進み、１３万年前にはほぼ現在と同じような気候になったと考えられる。この急速な温暖化は、１３万年前から急速にサピエンスがアジアに移住を始める一つの理由になったと思われる。その後、オーストラリアには６.５万年前に到達しており、インドを経由するサピエンスの東進を阻む他の人類はいなかったと思われる。

閉ざされたシナイ半島ルート
ところが、図１を見ていただくと地球が温暖化して出アフリカが加速した時期にも、シナイ半島からヨーロッパへのルートは５万年前まで全く閉ざされていたことがわかる。図２は、図１に示した地図状にネアンデルタール人の分布を筆者が書き加えたものだが、サピエンス進出のヨーロッパルートとネアンデルタール人の分布が一致する。異論もあるとは思うが、シナイ半島ルートが５万年まで、全く開かなかった理由は、ヨーロッパルートに分布していたネアンデルタール人が、サピエンスのシナイ半島からの北進を阻んでいたのではないかと想像できる。

図２：図１にかぶせてネアンデルタール人の分布を重ねてある。

先にも述べたが、アフリカ外で発掘された最も古いサピエンスの骨は１６万年前のイスラエルカメル山近くで発見された骨だ（Hershkovitz et al, Science 359: 2018）。すなわち、シナイ半島ルートは、アラビア・アジアルートと同じくかなり早い時期にサピエンスが進出したにもかかわらず、ネアンデルタール人の存在により１０万年以上もの間、行く手を阻まれていたと考えられる。

図３『Nature』に掲載された記事（Mellars et al.Nature 479:483, 2011）をもとに、筆者が作り直した図で、サピエンスのヨーロッパ進出の３本のルートを示している。

ではなぜ５万年前にこの均衡が破れたのか？
私自身はこの理由を、話し言葉を基盤とする言語（S言語）がシナイ半島でサピエンスだけに誕生したからと考えている。
サピエンスのヨーロッパ征服の理由
まず図３に示した、ヨーロッパへのサピエンス進出を見てみよう。これまでヨーロッパ内で発見され、ゲノム解析がほぼ完全に行われたのは、ルーマニアで発見された約４万年前のサピエンスの骨で、なんと６−９％のゲノムがネアンデルタール人由来であることがわかっている(Fu et al. Nature 524:216, 2015)。このことは、サピエンスのヨーロッパ進出が、ネアンデルタール人と常に接しながら進んだことを物語っている。さらに、4.4-4.2万年前にサピエンスがイギリスやスペインにすでに達していたということは、かなり短い期間でヨーロッパ全土の征服を成し遂げたことになる。
この背景として、１）ネアンデルタール人の生存が特異的に脅かされる自然要因、２）ネアンデルタール人との交雑によるサピエンスのヨーロッパへの適応、そして３）サピエンスに起こった文化・技術の大きなイノベーション、などが考えられる。
自然条件についてみれば、５万年以降地球は温暖と寒冷の間をめまぐるしく行き来した時期だ。また、７万年前には現インドネシア・トバ山の大噴火、また４−５万年前にはイタリア・ナポリにあった火山の大噴火があり、ヨーロッパの気候はめまぐるしく変化したと考えられる。これによる食物の減少は、ネアンデルタール人の住む北部でより大きな影響を与えたと考えられ、サピエンスの進出を促した可能性は否定できない。
ネアンデルタール人との交雑により、サピエンスが寒冷地で生存できるよう適応した可能性もある。事実、我々現代人も、ネアンデルタール人から寒冷地で生きるための様々な遺伝子を受け継いでいることが明らかになっている。ただ、サピエンスとネアンデルタール人の接点で暮らす人類にネアンデルタール人遺伝子が高い比率で流入しているとすると、なぜ１０万年以上両者の均衡が崩れなかったのか理解しがたい。おそらく、この要因はヨーロッパ征服にそれほど貢献していないのかもしれない。
こう考えてくると、結局５万年前のサピエンス優位は、文化的、技術的な要因が大きいと考えられる。要するにサピエンスがネアンデルタールには真似できないイノベーションを成し遂げた結果、それまで続いた均衡が大きく崩れたという可能性だ。またこの差が、そのままネアンデルタール人の絶滅に続いていくことになる。
ネアンデルタール人とサピエンスの差
事実、ネアンデルタール人がサピエンスより劣っていたと考えている研究者は多く、

１）サピエンスの遺跡に残された石器（オーリナシアン石器など）は、ネアンデルタール人の遺跡に残される石器（ムスティエ石器）と比べると、機能的に凌駕している。
２）この結果として、武器のイノベーションもネアンデルタール人はサピエンスに劣っていた。
３）ネアンデルタールの集団はサピエンスと比べると少人数だった。
４）ネアンデルタール人の遺跡には、絵画や装飾がなく、言語能力が発達していなかった。
５）サピエンスと比べて、より少人数の集団しか形成していなかった。
などがこれまでその理由としてあげられている。
しかし最近になって、まだサピエンスがヨーロッパ進出を果たしていなかった時期のネアンデルタール人の遺跡から、これらの根拠を否定する証拠も出土して、ネアンデルタール人は技術やイノベーションで劣っていなかったと主張する研究者も増えてきた。
確かに考えてみると、もしサピエンスの技術的優位の条件が５万年より前に整っていたとして、１０万年以上も接触しながら、この優位性を支える技術、例えば新しいタイプの武器が相手に伝わらなかったと考えるのは難しい。
事実、スペインにある進んだ石器で知られるシャテルペロン文化がネアンデルタール人由来であることが示されると、進歩した石器は自分で作れなくても、当時簡単にネアンデルタール人が手に入れることができた結果だと説明されている。したがって、技術の差がサピエンスに絶対的優位をもたらせたと単純に結論できるのか怪しくなってきた。では、何がこの均衡を破ったのか？
S言語がサピエンス優位性の源
証拠があるわけではないが、このサピエンスの優位性がS言語の獲得ではないかと私は想像している。
まず、言語は他の民族を征服するための強力な武器になることは、すでに歴史が証明している。最も大規模な移動は、現在のウクライナ付近で暮らしていたYamnaya人のヨーロッパへの移動だろう。Yamnayaとの交雑により現在のヨーロッパ人の遺伝的構築が形成されるが(Allentoft et al. Nature 522: 167, 2015)、この移動とともにインドヨーロッパ語がヨーロッパ全体に広がったことは、言語が民族の優位性を決める大きな要因であることを物語る。
さらに、石器と異なり言語は教えてもらわない限り、簡単に盗めるものではない。実際、地球上のこれほど多くのS言語がある最大の理由は、S言語が他の部族に理解できないように、伝達が規制されているからだと考える研究者は多い。このように相手にもS言語が生まれない限り、S言語獲得で生まれた優勢が崩れることはない。
S言語の誕生がサピエンスに絶対的優勢をもたらし、これによりネアンデルタール人と現代人のシナイ半島でのバランスが壊れたとすると、S言語の誕生はこのバランスが壊れた５万年前と算定できる。
[ 西川伸一 ]

なぜ言語が石器作りを教える過程で誕生したと思うのか？
2018年3月15日

Wagnerのオペラ「ニーベルングの指環」では、槍や刀がぶつかりあって壊れるという場面が何度も出てくる。例えば鍛えられた強い剣でも人間（ジーグムント）が構えたノートゥングは、神（ヴオータン）の槍にうち砕かれる。これは武器の優劣を示すことで、神の力を示そうとしていると思うが、ともすると私たちはネアンデルタール人と現生人類の間に同じような関係を想像してしまう。しかし前回も述べたが、武器や戦略の差が両者の絶対的な優劣の差の先行原因だとは思いにくい。
事実、ネアンデルタールと現生人類はシナイ半島では10万年近く隣接して暮らしながらも均衡を保っていた。シナイ半島および北上したばかりの現生人類は、使っていた石器（ProtoaurignacianやAhmarian文化とよばれている）でネアンデルタール人（Levalloi文化）から区別されている。しかし、最近の研究でシナイ半島や現生人類が北上したルートではこの区別が明確でない事もわかっている（Hublin, PNAS 109, 13471, 2012）。則ち、石器など道具が優劣の決定的要因になったとは考えにくい。
そこで前回この優劣の鍵となったのが、VerbalあるいはSpeechを媒体とする言語（S言語）であると提案した。S言語獲得により優劣がハッキリした後は、現生人類でさらに大きな文化的変化が起こり、おそらく石器自体もAhmarianやProtoaurignacianからその後急速に発展するきっかけとなったと思われる。
では、なぜわざわざ石器作りを教える過程がS言語誕生の現場となったと考えるのか？今回はこの問題を考えてみるが、せっかくの機会なのでまず石器作りについて勉強する事にしよう。
石器作りに関する本はおそらく他にも数多く出版されているとは思うが、私の知識はもっぱらジョン・シー（John J Shea）著の『Stone tools in human evolution:behavioral differentces among technological primates』 (Cambridge University Press)に頼っている（図１）。ほかの本を読んでいないので、これだけを推薦というわけには行かないが、考古学の論文を読むときにはきわめて役に立つ本だ。勿論ここで述べる事も殆どがこの本を参考にしていることを断っておく。

図１　John J Sheaの著書。
石器について人間だけでなく、サルが使用した跡についての区別の方法にいたるまで書かれている。通読すると、石器が如何に奥の深い話かわかる。
出典：Amazon co.jp
人類が石器を使い始めたのは300万年以上前のことだが、石器は人類の進歩と共に発展してきた（図２）。この歴史はまず旧石器時代と中石器時代に分けることが出来る。中石器時代は、だいたい１万年ぐらいから始まっており、既に弓矢など高度な武器が発達している。私達が問題にするのは、それ以前の旧石器時代で前期、中期、後期に分けられている（図２）。

図２　石器の発達。Sheaの著書を参考にして、筆者が作り直した。
写真の出典：Wikipedia

各時期の石器は代表的発掘場所の名前がついており、そこで発掘される骨の形状から、使用していた人類がわかっている。ただ、示している以外の人類が使っていた可能性を排除することは出来ない。
この発達の歴史はまさに石器の作り方の開発の歴史だが、殆ど二足歩行のサルと言っていいアウストラロピテクスと、常時２足歩行の直立原人の間で大きな変化が起こっているのが図２からわかる。すなわち、直立原人の登場が、様々な点で人類最初の大革命をもたらしたと考えられる。
実際、実験的に石器を作成する実験考古学によると、Oldowan文化では、拾った石を割って、そのかけらをもう一度叩いてみることぐらいしかおこなわれていない。その後、直立原人によるAcheulian文化がはじまると、急速に石器製作の工程が質量ともに増加し、複雑度が増していく。この結果、後期Acheulian文化では、１）石器に適した石の採石、２）砕石、３）破片の選択、４）破片の加工、５）加工する対象の最終的選択、６）様々な調整による形作り、などかなり複雑な過程が石器作りに使われていたことがわかる。おそらく、実際に使用した後の使い勝手についてのフィードバックも行われただろう。すなわち、デザインの構想とそのための加工技術の発達が石器の発達を支えたと言える。
このように、石器を見ていると、直立原人が既に高度な文化をもっており、石器製作に必要なExplicit memoryやゴールを共有して協力する能力、すなわち言語能力を十分備えていたことを実感する。
石器作りでもう一つ重要な点は、このような工程を、個人が個別にやっていたというより、一種の工房でまとまって行われていた点だ。このような工房で石器や他の道具を作り、後進に教えるという作業は、当然高いコミュニケーション能力が前提となる。すなわちこの能力が高さに応じて、石器の機能が発展したと想像される。
これらの点を考慮すればするほど、この工房で石器作りを教え、また習おうとする過程こそが、音節を単語として用いるS言語の発生場所に違いないと私には思えてくる。その理由をさらに説明しよう。
理由１：音はexplicit memoryに必要な連合を助ける。以前「コミュニケーションと言語」で述べたように、おそらく人類は、重要だが複雑なイメージを記憶する際、単純な表象と連合させることを自然に行っていたはずだ。この時、常にまわりで繰り返して聞こえてくる音節は、連合相手として利用価値が高い。
理由２：石器作りの現場では様々な繰り返す音で満ちている。これについては想像してみるだけで十分だろう。先にまとめた過程で石器を作ろうとすると、各過程で違った音が発生し、それも繰り返して何度も聞こえる。
理由３：石器作りの現場には表現するべき具体的対象が多く存在する。石器作りには多くの工程が必要だが、そのおかげで現場にはその工程を代表する具体的なモノ(・・)が存在しており、複数の個人で同一のモノ(・・)を対象として共有しやすい。
理由４：石器作りを教え、教えられる関係には、個人的な表象を他の個体に共有させる階層性がある。個人が、自分の頭の中で特定の音節を複雑なイメージの表象として連合させることは特に難しい話ではない。しかし、個人的な表象を、他の個体と共有するためには、表象されている具体的モノ(・・)を先ず共有することが必要で、それを共有した上で、誰かがそのモノに対応する（表象する）音節を提示し、他の個体にもモノ(・・)と音節の関係を共有してもらう必要がある。理由３に述べたように石器作りの現場にはこの具体的モノ(・・)が存在し、指差しでそれを共有できる。
その上に、教える側と、教えられる側の階層が存在することも重要だ。具体的モノ(・・)を前にしても、それぞれが勝手な音節を提案するのでは収集がつかない。しかし、教える側がはっきりしている場合は、主導権を教える側が持って、モノ(・・)と音節を関連づけ、相手に共有させることが可能になる（図３）。

図３　具体的なモノの共有、上下関係、様々な音がある現場でこそモノと音節の対応が共有される

イラストの出典：無料サイトPixabay
理由５：石器造りで発生する音は時に音楽的だ。道具を作る過程で出る音を音楽に取り入れる能力でワーグナーは天才と言えるが、道具作りも手馴れてくると、自然にリズムに合わせて工程を進めることも行われただろう。音楽が感情を表現し伝える手段だとすると、道具を作る時の音を聞きながら、音楽を思わず口ずさむこともあっただろう。
一方、音節が中心の言語が生まれるまでは、コミュニケーションにはジェスチャーとともに、スティーヴン・ミズン（Steven Mithen）のいうような音楽的フレーズも感情を伝えるために使われたと考えられている。例えば「オーケー」とか「グーーーッド」とうなづくような感じだ。とすると、この現場には声もあふれていたと思える。
もともと、石器作りを教えるためには、高いレベルのコミュニケーションが必要になる。このため、S言語発生前から、音楽的発生でのコミュニケーションを図ろうとする努力は日常的に行われていたと思える。
理由６：石器作りの現場には自然に文法が生まれる。石器作りでは、プランに基づいてどう身体を動かすかが問題になる。既に文法のルーツの一つは身体の動きの手順だと提案したが、その意味で石器作りを教える過程で音節を使った単語が生まれたとすると、それを並べる統語も自然に生まれたのではと考えられる。
以上、私が石器作りを教えていた工房こそが、S言語発声の現場だと考える理由について述べたが、全て私の妄想として聞いておいていただきたい。
大事なことは、このように音節を用いてコミュニケーションが図れることが理解されると、S言語は急速に仲間に広がることだ。これは、すでにニカラグアのろうあの子供達の手話が共有されていく過程の解析から明らかになっている。最初、２−３人の少人数の中で生まれたサインが瞬く間に集団全体に広がり、今度はあらゆる場所で新しいサインが作られ、広がっていく。
手話と比べた時、音節を用いるS言語は、表現力だけでなく、表現のスピードでも高い能力を発揮する。この便利さが一旦認識されると、石器作りの現場以外でも新しいボキャブラリーを形成する過程が進み、集団で共有するボキャブラリーは急速に拡大できると考えられる。
この結果、より複雑なコミュニケーションが可能になれば、もちろん優れた石器を開発する能力も高まるだろう。しかし石器の機能に差がないとしても、音節を単語として複雑なコミュニケーションを迅速に行える能力は強い武器として、それを持った集団と、持たない集団の間には、大きな優劣が生まれるはずだ。
もちろん、それまでのジェスチャーや単純な発声だけでは表現できない高いコミュニケーション能力を手にしたいという必要性と、ここに述べたような条件が揃えば、S言語の誕生は石器作りを教える現場である必要はない。
最後にもう一つ妄想を述べると、同じ現場では、絵を使うコミュニケーション手法も誕生しただろう。実際、多くの職人さんも、技術を伝える時、絵を使うことが多いと思う。とすると、石器作りを教える現場は、S言語とともに将来の文字誕生のきっかけになったのかもしれない。
これでようやく言語誕生について終えることができる。次から、言語と文字の統合の問題をかんがえる。
[ 西川伸一 ]

言葉の流れに対する脳の反応
2018年4月2日
言語の誕生については前回で終わり、今回から文字（Writing）について考えようと準備していたが、たまたま最近、連続的に聞こえてくる言葉の流れに対する私たちの脳の反応についての面白い研究を読んだので、予定を急遽変更し、今回はこの問題を取り上げたい。
言うまでもなく言語は私たちの脳活動から生まれた情報メディアで、個人の脳のネットワークに集め、記憶し、処理した内部・外部からの情報を、ほぼ同時的に他の個体と共有できるようにして伝達することを可能にした点で、それ以前に生物活動から生まれたDNAを含む情報メディアとは全く異なっている（言語の起源I参照）。しかしこの情報メディアは、完全に脳の活動に依存しており、言語情報は他の人間の脳回路へと集められ処理されてはじめて情報として機能する。すなわち、私たちの脳が音として流れてくる言語を聞いた時、音節で区切られた単語が集まった文章として表象された情報に注意を向け、その表象を脳内に長期記憶として持っている様々な表象と参照しながら、脳回路上の新しい表象へと転換しなおすことで、情報を理解している。従って、言語を聞いて、情報として脳内に新しく表象し直すまでの過程を知ることは、人間の脳科学に残された重要な領域だ。
言語誕生以来、私たちは言語をそれが実際に使われているのを聞いて経験する中で獲得してきた。これは学校で何かを論理だって習うというのとは違っており、単語とその時の経験を連合させる過程を繰り返しながら、単語の意味を理解し、ボキャブラリーを増やす、一種の記憶過程だ。早い遅いはあってもほとんどの子供が３歳前後でかなりの数のボキャブラリーを習得し、言語を自発的に話せるようになるのは、言語自体が人間の脳の一般的発達過程にうまく適合していることを示しているのではないだろうか。
これは、言語か各個人によって別個に習得される必要性があることから、言語自体もこの習得過程に適するように進化して来たと考えるとわかりやすい。この言語の特徴を、以前紹介した（http://www.brh.co.jp/communication/shinka/2016/post_000011.html）Deaconは、昔アップルコンピュータがアイコンを用いた画面を使って、PCオペレーションを私たちユーザーの脳に合わせるという革命を成し遂げたことにたとえている。この例えを使うと、PCが私たちの脳に合うように進化したのと同じように、私たちが経験を通して学びやすいように言語も進化しているというわけだ。
ただ、この考えが本当かどうかを判断するためには、脳が言葉の流れとして表象されている情報を、どのように処理し、脳回路を書き換えるのか理解する必要がある。現在の言語は我々の脳にフレンドリーだとしても、聴く前から情報の内容がわかることはない。順序だって並ぶ単語を一つづつ聞きながら、全体の情報の意味をどこかの時点で理解する必要がある。
この時成人の脳でどのような過程が起こっているのか想像すると、一つ一つ流れてくる単語を、作業記憶として処理しながら、意味を理解するために作業記憶を長期記憶や、意味記憶と常に参照しながら、情報をまとめ上げていると想像できる。長期記憶や意味記憶が脳内の様々な場所にバラバラに蓄積されているとすると、言葉を聞いて理解する過程は、多くの脳内領域が作業記憶と参照される脳全体の活動だとわかる。問題はこの過程に対応する脳過程をどう観測するかだ。
これまで脳の活動を記録する様々な方法が開発されているが、PETやMRIは脳の興奮に伴う血流の変化を調べる検査法であるため、実際の活動と、検査上の変化とどうしても1秒以上のズレがあり、流れてくるそれぞれの単語に対する反応をリアルタイムで調べることは難しい。このため、どうしても脳の電気活動を調べる方法に頼ることになる。研究者側から見て一番望ましい検査は、脳内に電極を電気活動を拾うことだが、おいそれとできる検査ではない。結果として、いわゆる脳波計(EEG)を用いる検査が行われるが、痒い所を「布団の上」から搔く様な話で、頭蓋の外から記録される電位変化の解釈は難しい。しかし、他に簡便な方法がない以上、EEGを出来るだけ多くの領域から記録し、得られる波形をコンピュータを用いて解析する方法が進んだ。特に、時間的に連続して生起するイベントに対するEEGの変化をEvent related potential(ERP)と呼び、小さな波形の変化を抽出して解析する方法が進んだ。
そして1980年、この分野で最も影響力の高い論文がKutaとHillyardによりScienceに発表された（Science 207:203, 1980)。この論文で示されたのは、文章を聞いている時、急に文脈に合致しない単語が紛れ込んでいると、その単語を聞いてから約400ms後にEEGの波形が明らかに変化するという現象で、N400としてこの分野で最も重要な現象として研究されている。
彼らの総説から例を挙げてみよう。「彼は毎日ヒゲと町を剃る」という文を聞いた時、文章の中の町という単語は場違いであるとだれでも思う。実際、脳の方も困惑しているのか、「町」という言葉を聞いた400ms後に電位が高まるのを観察することができる。これが、N400の発見だ。
N400はその後40年近く、文章として表象される言語に対する脳の反応を検査するための重要な指標として研究されてきた。個人的な解釈を述べるのを許してもらうなら、N400とは聴きながら作業記憶として処理する単語やその並びを、これまで脳内に形成した長期記憶と参照しながら、一つの情報へとまとめ上げる作業過程と言える様に思える。そして、文章を聴き終わるまでに、私たちは文脈を理解しており、このため逆に場違いな言葉が紛れ込むと、強く反応してしまうことになる。
考えてみると、3歳までの発達期で私たちは場違いな単語と出会うという経験を繰り返してきたはずだ。単語自体は抽象的で何の実態もない。したがって、脳内の長期記憶と対応付けられないと、全ての単語はその場に合致していないことになる。とすると、発達期に耳にする単語は全て場違いな単語で、長期記憶と連合できないという点で、意味をなさないはずだ。しかし、音と具体的な情景や物が繰り返し連合することで、単語とともに言語としての認識が、長期記憶として脳に蓄積されていく。そして、言葉を聞くたびに、外界の表象とともに、言語として蓄積した長期記憶が参照される。これが、N400として記録される過程ではないだろうか。
面白いことに、N400は例えば音楽を聴いていて不協和音や雑音を聞く時には観察されない。このことは、音楽と言語の把握が大きく異なるメカニズムで行われていることを示すとともに、N400が、言語意味が問題になるEPR過程に限定されるプロセスである過程を強く示唆している。N400という現象論が、より実際の経験や理解に転換するためには、これまでとは異なる新しい方法が必要になるだろう。しかしEEG検査は幼児期から可能な検査であることを考えると、今のままでも、発達段階で言語体験とN400を調べることで、言語についてさらに新しい発見がある予感がする。
このようにN400は奥の深い研究領域で、完全に理解されているわけではなく、これ以上説明するのはやめるが、とりあえず概要を理解してもらったところで、今日紹介したいと思っているのが、私がN400のことを知るに至ったダブリン大学からの論文で、N400をヒントに、言語理解の新しい展開を模索している。タイトルはElectrophysiological Correlates of SemanticDissimilarity Reflect the Comprehensionof Natural, Narrative Speechで雑誌Neuron 5月号に発行予定だ。
N400はたしかに言語に関わる過程の研究指標としては優れている。ただ、場違いな単語を滑り込ませるなど、これまでどうしても自然な言語からはかけ離れた人為的なセッティングで研究が行われてきた。
この研究の目的は、これまでのような人為的設定ではなく、自然な話し言葉の中で個々の単語に対するN400に相当する脳の反応を調べるための、新しい方法の開発だ。脳の記録自体は、EEGを用いる点で特に代わり映えはしない。また、脳波の小さな変化の中からN400に相当するコンポーネントを小さな波形の変化の中から取り出すこ方法も今の方法で十分だ。しかし、自然な言語に対する脳の反応を調べるためには、私たちが頭の中で行っているのに近い形で、それぞれの単語の間の関係性を評価する必要がある。例えば、机とりんごは大きく違っているが、りんごとみかんは近いといった関係だ。
このために、著者らは文章の中に出てくる単語の持つ400種類もの性質を元に４００次元空間上のベクトルとして定義し、この値を基礎に個々の単語の持つ違いを、この空間上の距離として数値化した。この方法の詳細を理解しているわけではないが、人間が恣意的に単語同士の距離を決めるのではなく、各単語の使われ方を基盤にして、単語間の違いを独立に決めたところが重要で、これにより初めて独立した言語と、人間の脳の反応の相関を数値として調べることが可能になる。４００次元と聞くと難しそうだが、おそらく自動翻訳などでAIを使って単語間の近親性を計算しているのと同じことだと思う。私たちは意味と言うと、すぐに自分の経験で考えるが、AIが発達した今は、このように多くのパラメーターを使った多次元空間での距離で定義することは普通に行われていると想像する。
様々な文章を聞かせて、EEGを記録し、文章に含まれる単語とEEGの反応の相関を調べていくと、単語自体ではないが、続いて現れる各単語間の距離と、200-500msで現れる電位とが高い相関を示すことが明らかになった。これをtemporal response function(TRF)と呼び、指標としてEEGを解釈することで、独立に定義した言語空間と脳の反応の相関が生まれる脳のメカニズムを探っている。
この論文の最も重要な発見は、ここで定義された単語同士の距離は、ランダムに単語を聞かされても、TRFを誘導しないことだ。例えばone fishと聞くときもちろん意味を理解することができるが、oneとfishの単語としての意味論的差異は大きい。驚くことに脳波、このone vs fishの違いにしっかりと反応し、fishと聞いた後300-500msでTRFの低下がみられる。すなわち、文章内の単語間の意味の違いの大きさに脳波がしっかり反応している。
しかし、同じ単語の組み合わせでも、同じ文章を逆さまに読んで聞かせた時にはTRF決して現れない。また、意味のある文章でも、周りのノイズにより理解が邪魔されると、やはりTRFは現れない。逆に、文字を見ながら文章を聞かせて理解を高めると、TRFがさらに明確になる。
これが結果の全てだが、単語間の距離という文章を構成している部分が、文章全体の文脈の中で連続的に評価されていることが大変よくわかる。この文脈を私たちが長期記憶として持っている言語空間と参照されることで形成されていく意味と捉えるとN400やTRFがこの４００msの間に起こっている過程を反映しているのは納得できる。
以前言語の2重構造について述べ、言語は個人の空間と、個人とは独立した社会が形成する言語空間をもち、それぞれは相互作用しながらも、独立して言語を進化させることを述べた（言語の2重構造参照）。私は、今回紹介した論文を読んで、この2種類の言語空間を脳科学的に扱えることを確信した。今後も是非この分野に注目して行きたい。
ちょっと脱線したが、次回からは文字について考える。
[ 西川伸一 ]

eru より:

2021年6月21日 7:34 PM

走りの部分の途中までしか読んでおりませんが、、、またそれ以降にて言及されているのかも見ておりませんが、、、
自分の子の成長を見ていると、発達と成長ではなく成長と発達なのかなといった感想を抱いております。
大人にとっての1日の概念は24時間だったり、日が昇ってまた日が昇るまでですが、
生まれたての赤子や胎児にとって時間の経過は1日の繰り返しではなくて、はじめはただただずっと続いていくものに感じます。
その時間感覚が、どこでいつどうして繰り返しの概念を取り入れることができるのか、元々組み込まれているのか疑問です。そして繰り返す、反復する、反復すると前回と今回の差異が意識されるなどの変化もみられるのではないでしょうか。
永遠と続く時間と繰り返しの時間が別個のものではなく、一つのものであると自分の中で分かっているのに別々に認識できる不思議です。

取り留めもない感想を抱いた次第です。
お目汚し大変失礼しました。

返信

コメントを残すコメントをキャンセル

<<戻る