珍しいボノボを飼育している施設が日本にも一カ所存在する。京都大学野生動物研究センターの施設で、チンパンジーやボノボが余生を送っている熊本サンクチュアリーだ。公開はされていないが、施設を見せていただいたことがある。写真(6人いるボノボの一人ヨシキ30歳;サンクチュアリーでは一頭と呼ばず一人と数えている)のように本当に近くで見て感激したが、飼育に必要なコストは常に足りないようで、これを読んだ多くの人に寄付をお願いしたい(https://www.wrc.kyoto-u.ac.jp/kumasan/ja/members/index.html)。この研究施設では多くの研究が行われており、このブログでも2016年、類人猿に Theory of Mind が存在することを示した Science の研究を紹介した(https://aasj.jp/news/watch/5895)。
今日紹介するチューリッヒ大学からの論文は、ボノボのコミュニケーションで単語の組み合わせを調べ、ボノボの構文も非自明(non-trivial)な構造が存在することを示した研究で、4月4日 Science に掲載された。タイトルは「Extensive compositionality in the vocal system of bonobos(ボノボの発生システムの幅広い構成性を持つ)」だ。
動物のコミュニケーションを記録して、そこで使われる構成性を調べる方法の一つが Formal communicative system (FoCs) で、シグナルと行動的意味を組み合わせることで、様々な形で発せられたシグナルの構成性を、人間の言語分析のように行うことができる。鯨の歌や、コウモリの超音波など様々な分野で使われている。
今日紹介するライプチヒのマックスプランク進化人類学研究所からの論文は、緑豊かなサハラ時代の人類のゲノムを調べ、この時代にもサハラ領域では大きな民族の移動はなく、それぞれの民族が形成されていたことを示した研究で、4月2日 Nature にオンライン掲載された。タイトルは「Ancient DNA from the Green Sahara reveals ancestral North African lineage(緑のサハラ時代の古代DNAは北アフリカ系統の存在を示している)」だ。
我が国のゲノムの歴史がまだまだ解明されていないのに、アフリカなどどうでもいい思われる方も多いと思う。実際、我が国の古代ゲノム研究 DNA のクリーンラボが導入されたのは2020年に入ってからで、天皇との関係で古墳研究も簡単でなく、研究者は多くのハードルを越える必要がある。そして何よりも高温多湿の日本ではゲノムの保存状態が悪いという問題があった。
この研究ではリビア南、サハラ北の Takarkori の洞窟で見つかった歯と骨からゲノムを回収しているが、本来のゲノムの存在率は0.1%−1%で、現在のところ通常のショットガンシークエンスは難しい。代わりに、ヒト DNA を精製したあと、古代 DNA の多型パネルを使って解析している。すなわち、極めて少量の DNA を調べるプラットフォームが着々とできていることがわかる。おそらく我が国の古代ゲノムもこれにより進むのではと期待できる。
我が国で細菌性の下痢の頻度は極めて低いと思うが、例えばインドを旅行していて細菌性腸炎を起こしたという話はよく聞く。もちろん今でも食品からサルモネラや病原性大腸菌に晒されることはあり、特に小児では重症化しやすい。このような病原性細菌に対しては、抗生物質だけでなく、経口ワクチンで IgA を誘導する治療や健康な細菌叢を移植して病原菌と闘わせる方法も試みられている。
今日紹介するスイス・チューリッヒ工科大学からの論文は、ワクチンと細菌叢内の細菌の競争をうまく利用することで、それぞれの効果を何倍にも高められること、そしてワクチンを介して腸内細菌叢をコントロールする可能性を示した研究で、4月4日 Science に掲載された。タイトルは「Vaccine-enhanced competition permits rational bacterial strain replacement in the gut(ワクチンによって促進される細菌間の競争が腸管での合理的な細菌の置き換えを可能にする)」だ。
おそらくこのグループは経口投与する死菌ワクチンによる腸内細菌感染制御を研究してきたのだと思う。生菌を注射するのと異なり、死菌ワクチンの経口投与は腸内での IgA を誘導することが知られていたらしい。ただ、これだけでは病原菌を完全に除去するには足りないこともわかっていた。そこで、標的の細菌と腸内で競争するバクテリアで、ワクチンには反応しない競争細菌を加えたら効果が高まるのではと着想した。すなわち、ワクチンと細菌叢移植を組み合わせる方法だ。
このため、MECP2重複症と比べて遺伝子治療は簡単でないとされてきた。しかし、今日紹介するエジンバラ大学からの論文は、導入する遺伝子の発現をセルフコントロールさせることで、モザイク組織が対象のレット症候群も遺伝子治療が可能になることを示した研究で、4月2日 Science Translational Medicine に掲載された。タイトルは「Self-regulating gene therapy ameliorates phenotypes and overcomes gene dosage sensitivity in a mouse model of Rett syndrome(自己調整的遺伝子治療はレット症候群のマウスモデルで遺伝子発現量に対する感受性の問題を克服し症状を改善する)」だ。
今日紹介するリジェネロン社からの論文は、リジェネロンで蓄積されてきた抗体作成技術の粋を利用してガンで発現する胎児抗原をはじめとする様々な分子と HLA が結合した抗原に対する抗体を作成する方法の開発と、それを用いた CAR-T 作成についての研究で、3月26日 Science Translational Medicine に掲載された。タイトルは「CAR T cells based on fully human T cell receptor–mimetic antibodies exhibit potent antitumor activity in vivo(完全に人間の T細胞受容体を擬した抗体による抗ガン活性)」だ。
ただこの研究で HLA と結合するペプチドは実際の細胞から質量分析で特定されている。もちろん将来はガン抗原が決まれば in silico で HLA との結合を特定していくことが重要になる。現在も様々な方法でペプチドと HLA の結合を予測する方法が開発されているが、今日紹介する中国南京工科大学からの論文は、少し工夫した言語モデルを用いてペプチドと HLA 、さらには TcR の結合を予測する方法の開発だ。タイトルは「A unified cross-attention model for predicting antigen binding specificity to both HLA and TCR molecules(統一的なクロスアテンションモデルでHLAとTcRへのペプチドの結合を予測する)」で、Nature Machine Intelligence3月号に掲載された。
今日紹介するイェール大学からの論文は、ダニを防ぐ免疫誘導に関わる抗原を同定するためのダニ抗原ライブラリーの開発研究で、3月26日 Science Translational Medicine に掲載された。タイトルは「Tick feeding or vaccination with tick antigens elicits immunity to the Ixodes scapularis exoproteome in guinea pigs and humans(ダニに噛まれたりダニワクチン接種にヒトやモルモットに誘導できる免疫)」だ。
今日紹介するジョンズホプキンス大学からの論文は、鳥の KEAP1 の論文を発表した同じグループが、今度は速く走る能力を持つ馬も同じような KEAP1 の変化があるのではと着想して行った研究で、3月26日 Science に掲載された。タイトルは「Running a genetic stop sign accelerates oxygen metabolism and energy production in horses(遺伝的ストップサインを走り飛ばすことで馬では酸素代謝とエネルギー生産が促進される)」という、洒落のきいたタイトルになっている。
「自閉症の科学」コーナーを最後に書いたのはもう3年前になる。結局このコーナーを続けられなかった理由は、この領域の新しい展開を示唆する論文を感じられなくなったからだ。当時を振り返ると、特にゲノム研究が進み、さらに脳画像や、新しい IT ツールなどが利用された活発な時期だったと思う。ただ、ゲノム研究も画像研究も続いてはいるが、紹介したいと思える論文が減った。
そんな時、カナダ・McGill 大学から大規模言語モデルを用いた自閉症児の診断についての論文が3月26日 Cell にオンライン発表され、自閉症研究に新しい可能性の誕生を感じさせたので紹介する。タイトルは「Large language models deconstruct the clinical intuition behind diagnosing autism(大規模言語モデルは自閉症診断の背景にある臨床的直感を解読できる)」だ。
これまで自閉症診断に AI を用いる試みは数多く存在した。これまで紹介してきたように、ゲノム研究から、自閉症は、病気の発症を強く促すレアな遺伝子変異と患者さんの性格などを反映するコモン変異が合体していることがわかっており、この遺伝的複雑性の解析に AI が用いられる例は多いが、成功には至っていない。
当然大規模言語モデルの登場になるが、ただレポートを読み込ませた新しいモデルを使うのではなく、いわゆる transfer learning が用いられている。もう少し具体的に説明すると以下のようになる。
まず、1000人の自閉症児について書かれた4000にのぼる臨床レポート(フランス語)を、フランス語の RoBERTa と呼ばれる Google の大規模言語モデルに学習させる。大規模言語モデルといっても1.5億パラメーターで GPT-2 に近い。おそらくこの小さいということが重要で、どこでも誰でも使えるだけでなく、後で学習させたセンテンスの分析が可能になる。この学習過程で、自閉症児に関するテキストを一般言語空間にベクトル化 (embedding) できればよい。
すなわちこの学習は診断ではなく、文章のコンテクストを形成させ、これを新しいモデルにトランスファーして自閉症児に接する時に最も顕著に使われるセンテンスを抜き出すことが目的で、この研究では次に、通常の multi-head attention とは異なる single head attention を用いて、どのセンテンスが自閉症児の診断に最も注目すべきかを調べている。
大きいモデルから小さいモデルへの transfer learning なのだが、わざわざ single head attention を用いることで診断根拠をわかりやすくしている。
そしてこの研究のハイライトは、症状に基づいて自閉症の診断に用いられる診断法で使われる基準を同じ空間に embedding すると、社会性診断に関わる診断基準の embedding は自閉症児を表すセンテンスとは全く離れた位置に分布することを明らかにしたことだ。この結果は、これまで自閉症児の診断のために Theory of Mind といった社会性を重視することが本当に正しいのかと疑問を投げかけている。一方、一つのことへのこだわり、反復行動、興味の対象の限定などについての診断項目は、見事に自閉症児に関わるセンテンスとオーバーラップする。
もう一つ重要なメッセージは、言語モデルもただ大規模にするのではなく、分析可能な規模で、しかも自分の目的に合わせて transfer learning を行えるほうが、日常の診療には役立つという点だ。その時、当然日本語の言語モデルは重要になる。このような利用を臨床現場で重ねることで、新しい発見があることを念頭に、我が国の AI 研究助成を進めてほしいと思う。