9月26日 うつ病を診断できる神経活動(9月20日 Nature オンライン掲載論文)
AASJホームページ > 新着情報 > 論文ウォッチ

9月26日 うつ病を診断できる神経活動(9月20日 Nature オンライン掲載論文)

2023年9月26日
SNSシェア

以前はうつ病にはセロトニン再吸収阻害剤と決まっていたが、最近ではケタミンから幻覚剤まで、結構ドラスティックな治療が行われるようになってきた。その中に、脳深部刺激治療がある。これは、脳内帯状回にリードと呼ばれる少し長めの電極を挿入し、早い周波数で刺激することで標的部位の回路を回復させる方法だ。さまざまな調整を行いながら治療部位や刺激強度を決めていくので、刺激だけでなく局所の神経活動を測定することができる。

今日紹介するジョージア工科大学からの論文は、深部刺激治療を受けて回復が見られた患者さんの神経活動を、治療開始4週間(これを病的時期)と治療後の4週間(正常化時期)に分けて調べ、うつ病を神経活動から客観的に診断する可能性を模索した研究で、9月20日 Nature にオンライン掲載された。タイトルは「Cingulate dynamics track depression recovery with deep brain stimulation(帯状回の動態で深部脳刺激によるうつ病の回復を追跡する)」だ。

まず治療目的で挿入した電極でうつ状態からの回復を捉えることができるか、治療を始めて4週間と、治療後の4週間の脳波を機械学習させたAIに予測させると、AUC0.87という割と高い確率で、病気と正常を区別することができる。

このとき記録した脳波の各周波数成分をうつ時と正常時で比べると、ベータ波を中心として活動が上昇していることがわかる。面白いことに、刺激直後はベータ波の低下が見られることから、最初はうつ状態からの離脱過程での変化で、その後正常状態が維持されると、新しい神経活動レベルに移行していることになる。

実際、うつ病の診断指標と神経活動はほぼ相関していることから、客観的指標として利用できる可能性が高い。他にも、表情からうつ病を診断する方法があるが、この表情を学習させたAI診断法との相関も明らかにしている。従来のうつ病診断法との相関だけでなく、患者さんの中で治療により正常化した後、再発したケースを調べると、神経活動の異常は、診断基準での異常が認められるより1ヶ月も前に現れることも示している。もし、この結果をMRIや脳磁図などの検査に移行させることができれば、うつ病診断をより客観的なものに変えることができる。

最後に、おそらく局所の伝導度を調べていると思うが、この異常の基本が白質異常、すなわちミエリン化の不全が背景にあることを示している。

以上が結果で、局所であっても神経活動という客観的検査データが得られることで、実際の患者さんの病態解析が進む。もちろん電極挿入は最後の手段で、一般の患者さんの診断には使えないことを考えると、この神経活動を非侵襲的な測定法に移行させることが重要だ。まだまだ現象論だが、人間の脳を直接調べるデータは貴重だ。

カテゴリ:論文ウォッチ

9月25日 血小板増殖因子受容体構造から、新しいリガンドをデザインする(9月14日号 Cell 掲載論文)

2023年9月25日
SNSシェア

医者として働いていたのはたかだか7年程度だが、血小板減少で止血がなかなか出来ないケースは今でも鮮明な記憶として残っている。赤血球を増やすエリスロポイエチンのように、血小板輸血の代わりに、血小板を増やす血小板増殖因子(TPO)のクローニングは、今か今かと待望された。当然世界中で遺伝子クローニング競争が行われたが、蓋を開けると我が国のキリンビール医薬探索研究所が一番乗りを果たしたことは、やはり鮮明な記憶として残っている。

ただ、エリスロポイエチンと違ってTPOの場合そのまま臨床応用とは行かなかった。これは、血小板上昇をコントロールしにくいこと、さらに刺激により逆に骨髄幹細胞が消耗する副作用問題を解決できなかったからだ。代わりに現在ではTPO受容体の様々なアゴニストが開発され、血小板の量をコントロールできるようになったが、骨髄幹細胞が消耗するという副作用は解決されていない。

今日紹介するスタンフォード大学からの論文は、TPOとその受容体の結合した構造をクライオ電顕で解析し、この解析に基づき変異を導入したTPOが、血小板増殖能を維持しながら骨髄幹細胞が消耗するTPOの作用を抑えることが出来ることを示した研究で、9月14日号 Cell に掲載された。筆頭著者は日本のTatsumiさんで、タイトルは「Structure of the thrombopoietin-MPL receptor complex is a blueprint for biasing hematopoiesis(トロンボポイエチン/MPL受容体複合体構造は造血を操作する青写真)」だ。

TPO受容体は同じMPLが膜上で2量体を形成することでシグナル伝達を行うが、まずこの2量体の構造をクライオ電顕で詳しく解析し、一つのTPOに二つのMPLが結合する構造基盤を明らかにしている。

MPL2量体形成はTPOが一つのMPLと強く、もう一つのMPLと弱く結合して橋渡しをすることで起こり、これにより細胞質内でいくつかのシグナルが活性化されるが、この研究では次に、弱く結合しているTPO部位で直接MPLに接している部分に変異を導入し、2量体形成の構造を変化させることで、下流のシグナルを操作できないか調べている。すなわち、最初の強いMPLとの結合の後で、もう一つのMPLがリクルートされ形成される2量体の構造、寿命などを変化させて下流シグナルが変化しないか調べている。

Yes or Noというシャープな結果ではないが、3種類の下流シグナルの内、STATシグナルやAKTシグナルが低下しているが、CREBシグナルはそのままという2種類の変異TPOリガンドを特定するのに成功している。

次に、この変異TPOによりおこる2量体形成の量や効率の変化をFRETと呼ばれる分子間相互作用を調べる方法で測定し、変異により2量体形成自体の構造には変化はないが、2量体形成、あるいは維持の割合が低下することがわかった。

最後にこうして出来た変異TPOの生物学的作用を調べ、変異TPOでも正常に血小板数を上昇させられること、しかし骨髄幹細胞過剰刺激という副作用は半分程度に抑えられていることが明らかになった。

さらに人間の骨髄を用いた刺激実験で、変異TPOは未熟な血液細胞の分化誘導を抑える一方、自己再生を維持できることも明らかになった。

異なる受容体が複合するIL-2などでは変異リガンドにより生物活性を操作できることはよくわかっているが、MPLのように2量体の形成効率や寿命を変化させるだけで、シグナルをある程度操作できるという今回の結果は、今後、他のシグナルでも応用できる可能性がある。いずれにせよ、TPOの臨床応用という面では大きな前進だ。TPOのクローニングを行ったキリンの宮崎さん達の感想も聞いてみたい。

カテゴリ:論文ウォッチ

9月24日 IDH2阻害剤はCAR-Tの効果を高める(9月20日 Nature オンライン掲載論文)

2023年9月24日
SNSシェア

患者さんのT細胞にガンが発現する抗原に対するキメラT細胞受容体を導入したあと、もう一度患者さんに戻してガンを傷害する CAR-T治療は、一般にも広く知られるようになってきている。抗原反応性からキラー活性まで、全てデザインできているように思えるし、事実高い効果も示されているのだが、体内で CAR-T の維持ができないケースが多く見られるという重大な問題がある。

これは CAR-T がガンを殺すキラーエフェクターTe を多く含み、持続に必要な記憶細胞Tm が少ないからで、このバランスをデザインできると、CAR-T治療をより確実に出来る。今日紹介するスイス・ローザンヌ大学からの論文は、CAR-T の Te と Tm のバランスを DDH阻害剤で Tm にシフトできることを示した、おそらく臨床的には重要な研究で、9月20日 Nature にオンライン掲載された。タイトルは「Reductive carboxylation epigenetically instructs T cell differentiation(還元的カルボキシレーションがエピジェネティックにT細胞の分化を指令する)」だ。

タイトルにある IDH は isocitrate dehydrogenase で、isocitrate を αKetoglutarate(αKG) へと2段階で変換する酵素で、この変異により αKG から出来る hydroxyglutarate がエピジェネティックに発ガンを誘導することは、グリオーマ研究の焦点になっている。

この研究では、Te と Tm のグルタミン代謝の方向性をアイソトープラベルしたグルタミンを用いて調べ、Te では酸化的カルボキシレーション(OC)と還元的カルボキシレーション(RC)平衡しているが、Tm では RC がほとんど起こっていないことを発見する。さらに、この差を決めているのが Te が抗原刺激されるとすぐに誘導される IDH2 の作用によることを明らかにする。すなわち、IDH2 が発現することで OC と RC のバランスが取れることが Te への分化をロックしている可能性が示唆された。

そこで、CAR-T 作成時に IDH2阻害剤で処理すると、Tm 優性の細胞へと分化し、実験モデルではあるがCAR-T の効果が一段と高まり、これまで完全除去が難しかった実験系でもガンを完全に除去することがわかった。

IDH2 を試験管内で処理するだけで CAR-T の効果をこれほど高めることが出来ることを示したのがこの研究のハイライトで、今後の CAR-T 利用を後押しする可能性が高い。

後は、IDH2阻害剤が Tm への分化を誘導するメカニズムを調べている。これまでの IDH研究から想像されるように、IDH2 はT細胞のエピジェネティック制御を Tm方へと変化させるが、これは IDH2阻害により RC抑制型の代謝に変化し、TCAサイクルの代謝物が上昇、これによりヒストン修飾が Tm型にシフトしていることを示しているが、詳細は省く。

重要なことは、IDH2 を抑制しても、TCA サイクルは正常に維持され、細胞の増殖や活性化に全く影響のないことで、代謝物の違いで分化の方向性だけが変化する点だ。

結果は以上で、代謝経路の詳細と、それぞれの代謝物とエピジェネティック制御の詳細は複雑だが、臨床的には大変重要な発見だと思う。CAR-T のみならず、キラー細胞を試験管内で調整する場合は IDH2阻害剤を使用するのがスタンダードになるような気がする。

カテゴリ:論文ウォッチ

9月23日 脊髄損傷治療Logical Thinking : ローザンヌ工科大学は脊損治療研究の一大センターになりつつある(9月22日号 Science 掲載論文)

2023年9月23日
SNSシェア

現役の頃、再生医学が脊髄損傷の救世主になり得るのではないかと期待し、再生医学プロジェクトの一つの柱と位置づけていたが、あれから10年以上たって振り返ってみると、進展があまり見られていない印象が強い。しかしこの間、ローザンヌ工科大学(EPFL)からは、まず神経記録とAIを用いて慢性脊髄損傷の患者さんをともかく歩けるようにする方法の開発を行い、それをベースにさらに進化させており、今や我が国でも報道されるようになってきた。勿論この素晴らしい経過についてはこのHPでも紹介してきたし、Youtubeでも論文紹介を行った。

この方法では完全にAIが脊髄神経を刺激して歩行させるので、最初は自分の脳を使って歩いたという感覚を得ることは難しい、車椅子と同じ位置づけだったが、神経が残っている場合は脳支配を回復することも可能だし、最近では電気的に脳シグナルをリレーする方法も開発され、回路形成を熟知した Logical Thinking が如何に重要であるかを示している。

このように工学的な方法に集中しているのかと思っていたらEPFLから脊髄再生方法開発のための、Logical Thinking にもとづいた研究が9月22日号の Science に発表された。タイトルは「Recovery of walking after paralysis by regenerating characterized neurons to their natural target region(特徴明らかな神経を再生させ標的に導くことで歩行が回復する)」だ。

この研究では脊髄の半側が傷害された場合は、人間でも時間をかけて両側の運動が回復すること、そしてこれが胸部脊髄に存在する神経が反対側にリレーする神経回路を形成出来た結果であることに着目し、この時胸部脊髄に存在して、脊髄損傷に反応して再生を始め、リレー回路を形成する神経細胞を、Single cell RNA sequencing で特定する。この細胞を特定するための脊髄損傷の入れ方など、様々な工夫がよくわかるプロの実験だが、その結果胸部脊髄だけに存在する Vsx2分子を発現した神経細胞が活性化し、新しい回路形成に関わることを明らかにする。

こうして細胞が特定できると、再生時のその振る舞いと遺伝子発現から、次は完全脊損でもこのリレー細胞を活性化し、標的に導く可能性が見えてくる。この目的のための論理的戦略として、1)リレー細胞をサイトカインカクテルを発現するウイルスベクターの局所注射で活性化する、2)少し遅れてリレー細胞の通り道をサイトカイン投与で整備する、そして3)最後に標的部位に神経増殖因子マトリックスを注射、をまず試している。

期待通り、組織学的には切断部を超えてリレー神経が再生するが、この方法では残念ながら標的の運動神経への結合が起こらず、機能は回復しない。

そこで、長期に神経投射を誘導するため、レトロウイルスベクターを用いて神経伸長因子が標的部位で長期間合成できるようにすると、今度は運動神経とつながり、処置後4週で運動が回復することを示している。

結果は以上で、実際には多くのトライアンドエラーがあったと推察するが、最終的には Logical Thinking がよくわかる研究になっている。これが人間でも可能になるのか、まだまだわからないが、EPFLの勢いを見ると期待してしまう。機械やAI、そして再生医学まで、Logical Thinkingを貫いて、EPFLは脊損研究の世界をリードしていることがよくわかる論文だ。

カテゴリ:論文ウォッチ

9月22日 Google AlphaMissense によるゲノム解析、蛋白構造、診断の統合(9月19日 Scienceオンライン掲載論文)

2023年9月22日
SNSシェア

2日前から Google AlphaFold が可能にした膨大な蛋白質構造モデルから、それぞれの蛋白質のアノテーションを行う、蛋白質の機能についての理解を深めるための、新しい領域が始まった論文を紹介したところだが、今度は AlphaFold開発の本拠からさらに便利な、アミノ酸変異から病気の可能性を教えてくれる AlphaMissense が報告された。AlhphFold、 MedPalm そして AlphaMissenseと医学領域の公開AI をGoogle が席巻する勢いだが、その一貫性のある努力に素直に頭が下がる。タイトルは「Accurate proteome-wide missense variant effect predicition with AlphaMissense(AlphaMissenseによる蛋白質全体にわたる変異の効果の正確な予測)」で、9月19日 Science にオンライン掲載された。

GWASやゲノム配列決定が進み、我々の前には膨大な数の人間の遺伝子変異リストが存在する。これをアミノ酸をコードする領域の、ミスセンス変異に限っても膨大な数で、明らかな遺伝子変異による疾患として特定されているケースを除くと、多くの変異の意義が定義できないまま置かれている。

現在わかった変異にラベルをつけて機械学習を行うことで、新しい変異を診断する方法の開発が進められているが、うまくいっていない。そこに Transformer/attention を用いる大規模言語モデル(LLM)手法が登場し、アミノ酸のアノテーションや、変異の機能的効果を調べる LLM が開発され、患者さんのゲノム情報とその診断上の意味を診療室の医師が簡単に手に入れる日は近づいてきていた。

ただ、これまでの LLM は変異と医学診断というかなりかけ離れたレベルを統合しているため、正確さの限界があった。この研究では、AlphaFold という蛋白質の構造を介在させることで、変異と病気の相関性をより高めようとする試みになる。

方法だが、これまでの変異と病気診断を直接つなぐのではなく、まずそれぞれの変異箇所をマスクしてAlphaFold にインプットしたとき、構造予測がどの程度影響されるかを調べた上で、それを病気や発生異常とリンクさせるという方法をとっている。ただ、この方法では変異の構造を調べているわけではなく、変異箇所をマスクしたときの構造予測の確率計算変化を使っている点だ。

結果はこれまで開発された変異のアノテーションモデルを凌駕していることが示され、それを公開するといううれしい話だ。

具体的に、どんな変異が発達や健康の異常につながるかを16000蛋白質の、7千万変異について計算した結果のデータベースが提供され、このうち30%は異常の原因と考えられる変異で、この中にはこれまで特定された数の3倍を超える、7000種類の影響の大きなミスセンス変異が含まれている。勿論、あまり影響のない変異であることを確認する意味でもこのデータベースは重要だ。

AlphaFold と同じで、このデータベースには人間の持つ蛋白質に起こりうる2億種類の変異について計算したリストも存在しており、それぞれの分子を研究する前の重要な出発点にもなる。

以上、またまた Google 研究所の論文を紹介することになったが、この分野で世界をリードしていることは確かだ。最初に述べたように、一般医師がゲノム情報をわかりやすく簡単に得られる時代はすぐそこに来ている。

異なるレベルの生命過程を統合することが21世紀の主要な課題と思ってきたが、生成AIがそのための重要なツールとしてまず登場した。さらに目を見張るツールが現れるのか、出来たら我が国の若い研究者から報告されるのを期待したい。

カテゴリ:論文ウォッチ

9月21日 なぜミトコンドリアは母親からしか伝わらないのか(9月18日 Nature Genetics オンライン掲載論文)

2023年9月21日
SNSシェア

ミトコンドリアは母方、すなわち卵子からだけ遺伝して、精子のミトコンドリアは子孫に伝わらないというのは誰もが知っている事実だが、なぜと問われると、よく理解していないことに気づく。ずいぶん昔、精子にミトコンドリアはあっても、ミトコンドリアDNAが欠損しているという論文が発表されているが、その後あまり追求されていない。逆に、ミトコンドリアがマイトファジーで破壊されるとか、今はやりの説明が行われているが、決定的ではない。

今日紹介する米国、トーマスジェファーソン大学からの論文は、2013年に提唱された精子ミトコンドリアにはミトコンドリアDNA(mtDNA)がないという説をメカニズムも合わせて支持する研究で、9月18日 Nature Genetics にオンライン掲載された。タイトルは「Molecular basis for maternal inheritance of human mitochondrial DNA(人間のミトコンドリアDNAが母親から遺伝しない分子メカニズム)」だ。

この研究ではまず単一精子のミトコンドリアDNAを調べて、ミトコンドリアDNAの量を調べると、バラツキはあるが、一個の精子あたり0.5−1ミトコンドリア程度で、実際には70個ほどのミトコンドリアがあることを考えると、ミトコンドリアあたり正常の14%しかDNAが存在しないことを確認している。

すなわち、精子のミトコンドリアは卵子に入っても、独自に分裂する能力が全く欠けている。実際ミトコンドリア維持に必要なDNA複製酵素や、転写のエロンゲーション因子などは全く見当たらないから、遺伝するはずがない。また、この欠損は、未熟な精母細胞から精細胞へと分化する間に誘導されていることもわかった。

この原因を調べていくと、核ゲノム(ヒトの場合10番染色体)に存在し、ミトコンドリア内での転写を調節するTFAM分子が精母細胞への分化の過程で、ミトコンドリア内に移行できなくなっていることを発見する。TFAMはミトコンドリアの核になる蛋白質なので、これがミトコンドリアにないと、ミトコンドリアの複製は望めない。

TFAMがミトコンドリアに移行できない原因をさらに探ると、転写後のRNAを短くするスプライシング過程で精子では5‘端が長いRNAができ、普通とは異なるN末端側に長い配列を持っているTFAMが精子だけで合成されていること、そしてこの長い部分のセリン配列のリン酸化により、ミトコンドリアの移行が積極的にブロックされていることを明らかにした。

この最後のメカニズムの分子基盤は完全に示されていないが、以上の結果は精子形成時にのTFAMのスプライシングを変化させてTFAMが翻訳後リン酸化されるように仕向けることで、ミトコンドリアへの移行を阻むメカニズムが進化していることがわかる。

以上が結果で、今回初めてミトコンドリアの母方遺伝の理由を納得した。勿論全ての生物がこの方法を用いているかはわからない。今後他の動物と比較していくことで、ミトコンドリア母方遺伝の始まりも理解できるようになると思う。

カテゴリ:論文ウォッチ

9月20日 生成AI(AlphaFold)により今まで見えてなかった構造が見える 2. 新しい構造をアノテーションするための戦略(9月13日 Nature オンライン掲載論文)

2023年9月20日
SNSシェア

昨日紹介した論文は、DNA配列の比較だけでは相同性がわからなかった蛋白質を構造から比較するための新しいデータ解析の開発で、構造から蛋白質同士の関係や機能がわかる例をいくつか示している。しかし、構造の相同性で分類できたとしても、機能についてアノテーション出来るわけではない。

今日紹介するスイスバーゼル大学からの論文は、アノテーションを進めるための様々な戦略を探った研究で、9月13日に Nature にオンライン掲載されている。タイトルは「Uncovering new families and folds in the natural protein universe(蛋白質世界の新しいファミリーと構造を解明する)」だ。

研究では、3億5千万の蛋白質を50%配列相同性を指標にクラスター分けを行い、また相同性を元に全てのクラスターが関係づけられた大きな蛋白質のネットワークを作成、それにこれまでわかっているアノテーションや構造の相同性などを加えたデータベースを作っている(https://uniprot3d.org/atlas/AFDB90v4)。

このネットワークの中で、これまでアノテーションが全く出来ていなかった蛋白質クラスターを、ダークマターと呼び、それにアノテーションを与える様々な方法を試している。

ダークマターとして分類されるクラスターも、ネットワークとして見ると、一部弱いアノテーションがつけられている分子を持つクラスターと系統的関係を見つけることが出来る。ここでは YfhOファミリーとアノテーションされた蛋白質を含むクラスターと近い関係にあるクラスターを、構造の類縁性で調べると、同じ機能を持ちそうな細胞膜分子としての構造の類似性が明確になり、アノテーションが可能になった例を示している。この結果は、昨日の論文と同じで、構造の類似性をもとに、新しい分類とアノテーションが可能であることを示している。

同じように、アノテーションが出来ていないとされる蛋白質も、クラスター化し、詳しく解析してみると機能が明らかになる場合がある。その例として、DeepFRI と呼ばれる構造を解析するソフトで新しいトキシン/アンチトキシンシステムとして機能を特定できたクラスターを紹介している。アノテーションが出来ると、バクテリアを用いた実験で、殺菌性、また殺菌作用をブロックする作用を確認できる。

面白いのは、最近整備されつつあるアノテーションのための生成AIにダークマタークラスターを読み込ませることも行っている。すると、ChatGPT と同じでハルシネーションと呼ばれる、ばらついたいい加減な答えが出てくる。ただ、答えの出方のバラツキ方は逆に利用できることがあり、多様な答えが返ってきたクラスターを選び、構造の相同性を調べると、最終的にプロファージ蛋白質とアノテーションがついた例を示している。

最後に、Protein databank に登録されている構造と異なっている度合いを算定するモデルを作成し、これを用いて Protein databank で全く分類できていない70万近くの AlphaFold によって決められた構造を特定している。そして、この中の最も美しい例として、βシートがねじれたばれる構造が花弁のようにつながったβフラワー構造をとるクラスターを特定し、その中の一部の構造から機能を phospholipid scramblase と特定している。

以上が結果で、構造だけに着目した昨日の論文と異なり、様々な手法を取り入れて、ダークマターに迫る方法を述べている。重要なのは、どちらの論文も、この宝の山が眠る荒野の入り口に立ったところで、今後新しい深層学習、相同性を探る新しい方法、そして AlphaFold を超える構造予測方法の開発が進むと、大きな研究領域になる予感がする。

カテゴリ:論文ウォッチ

9月19日 生成 AI(AlphaFold) により今まで見えてなかった構造が見える 1. AlphaFold による2億種類の構造解析データの解析方法の開発(9月13日 Nature オンライン掲載論文)

2023年9月19日
SNSシェア

ChatGPT が公開される前から、Transformer/attention と呼ばれる生成AIモデルの生命科学への導入が進められていた。中でも最大の成果が Google の研究室から発表された AlphaFold で、それまでの物理化学に基づく構造予測をほぼ過去の者にしてしまった。そして今や、2億種類の蛋白質構造が AlphaFoldデータベースで見られるようになっている。すなわち、実際の構造を見たこともない蛋白質の構造が提供されている。

9月13日、NatureにAlphaFold から見える新しい世界を解析する2報の論文が発表された。私にとってデータ解析分野は最も苦手な分野だが、それでもわくわくする論文なので、今日、明日と順番に紹介することにした。また、28日に予定しているジャーナルクラブでも少し振れようと思う。

今日紹介する韓国ソウル国立大学と、スイスチューリッヒ工科大学からの論文は、2億種類の蛋白質構造を解析するアプリケーションを開発し、見たこともない構造から新たに見える世界を示した研究で、タイトルは「Clustering-predicted structures at the scale of the known protein universe(予想された構造を現在知られる全ての蛋白質スケールで分類する)」だ。

繰り返すが研究で最も重要なデータ処理についてはちんぷんかんぷんで、この研究の結果見えた世界についてのみいくつか紹介する。

まず AlphaFold は、既に解析された36万種類の構造と92%の一致率があり、構造データベースとして信頼でき、公開データの利用も進んでいる。ただ、これまで40万種程度の構造から蛋白質の相同性を調べたり、機能を予測するアプリケーションを使うと、新たに予測された2億を超す構造の相同性やドメイン機能を解析するには、モンスターCPUと呼ばれる計算機でも10年以上かかるらしい。その結果、ほとんどの蛋白質はアノテーションが出来ないまま捨て置かれている。

このグループはまず50%の一致と、90%のアラインメントが取れる構造に限定してAlphaFoldデータベースから5日間で5千万の相同クラスターを特定、構造から相同性や機能を解析する Foldseek を開発した。研究のハイライトは、この開発部分で、これにより新たに見えてきたいくつかの例が示されている。

Foldseek により2億の蛋白質は、200万のクラスターに分類され、そのうち31%はこれまで構造的アノテーションは行われていない。ただ、全蛋白質からみるとアノテーションが出来ていないのは4%程度で、これまでの構造研究で多くのことが明らかになっていることもクローズアップされた。ただ、相同性の基準を高くとっているので、もう少し緩い基準で見れば新しい世界がもっと見える可能性がある。

最後にいくつかの新しい世界の例を箇条書きにしておく。

  1. 相同性が特定できることで、これまでアノテーションが出来ていない多くの蛋白質の機能が予測できるようになった。こうして新たにあのテーとされた分子はトランスポーターや膜蛋白質が多い。
  2. これまで全くアノテーション出来ていない構造の進化を調べると、系統学的に古い構造が多く見つかり、細菌、古細菌、真核生物共通の構造も見られる。一方、新しく進化した構造は少なく、ヒト特異的に進化した構造は皆無と言える。
  3. ヒトとバクテリアで構造が共通する分子には、自然免疫に関わる分子が多く、高等動物の自然免疫分子の機能は、原核生物でも必要とされていることがわかる。
  4. 中でも面白いのは、我々が外来DNAセンサーとして使っているAIMが、これまでの検索では関係がわからなかった、クロストリジウムや腸内乳酸菌の相同分子との相同性が明らかになり、原核生物のDNAセンサーがAIM分子として使い回されたことが明らかになった。
  5. もう一つの例は、やはり自然免疫の中心分子gasderminで、最近になってgasderminと相同性を持つ分子がバクテリアにあることが示され始めているが、Foldseekを用いることで、特にこれまでアノテーションが出来ていないGroup1-gasdermin構造がバクテリアのgasdermin相同分子と強い相同性を持つことがわかる。

他にも面白い例が示されているが、それも氷山の一角で、紹介は個々まででとどめる。是非論文を読んで、蛋白質の機能や進化研究にとって全く新しい景色が見えるようになる実感を得て欲しい。

カテゴリ:論文ウォッチ

9月18日 歌のレパートリーが多い鳴き鳥は問題解決能力が優れている(9月15日号 Science 掲載論文)

2023年9月18日
SNSシェア

天安門事件が起こる前の1988年に北京を訪れたことがある。あまり自由に散歩も許されなかったが、それでも朝早く北京市街を散歩すると、公園に鳥かごを持った人が集まって、おそらく鳴き声比べを楽しんでいる風景を見ることが出来た。当時は北京も高層建築はほとんどなく、胡同と呼ばれる共同住宅に人々は暮らしていた。

この時私が見た鳥の歌比べは、鳥によっては無限とも言える鳴き声を学習する種が存在するためで、行われていたのはできるだけ複雑な鳴き声を教え込む熟練の技を比べるコンテストだ。この複雑な歌を構成し発声する能力を決める神経細胞が学習とともに増えることがわかっており、Bird song learning は重要な研究対象になっている。

今日紹介するロックフェラー大学からの論文は、鳥が持つ多様な歌のレパートリーと問題解決能力が完全に比例することを示した研究で、9月15日号の Science に掲載された。タイトルは「Songbird species that display more-complex vocal learning are better problem-solvers and have larger brains(より複雑な声の学習能力を持つ鳴き鳥は問題解決能力が高く、大きな脳を持っている)」だ。

論文は現象論に終始しており、レビューアーもかなり優しいなと言うのが最初の印象だ。ただ、現象は極めて面白い。

この研究は大学の野外調査フィールドで3年間に捕獲できた鳴き鳥、およびブリーダーから購入した鳴き鳥、全部で23種類の鳴き声を記録し、鳴き声のレパートリーの数から、鳴き声の限られた種類と、限られていない種類に分けるとともに、鳴き真似能力、あるいは歌ではない呼びかける声のレパートリーを調べている。

この記録から、鳴き声の学習に制限がある鳥と、制限のない鳥に分けることが出来、制限のない鳥では鳴き声だけでも平均25種類近く、呼びかけの声を入れると100近くのレパートリーを確認できる。

次に、それぞれの鳥について、問題解決能力(例えば石をどかせて食べ物をとる)、連合学習、判断のフレキシビリティーを問う逆転学習、そして自己コントロール能について調べ、それぞれの鳥にランクをつけている。

このデータを元に、まず種レベルで歌のレパートリーと相関する能力を調べると、驚くことに歌や呼びかけのレパートリー数と、問題解決能力のランクは完全に正比例しているが、他の能力には全く相関がない。

次に種ではなく個体レベルで同じ比較を行うと、ここでも歌のレパートリー数と、問題解決能力の間でだけ、完全な比例関係が見られる。

以上のことから歌のレパートリーの学習は、問題解決の能力と同じ脳領域を用いて行われていると結論している。ただ、どの回路なのかについては全く研究が行われておらず、脳の大きさと歌のレパートリーや問題解決能力とは比例していることが示されただけで終わっている。

結果は以上で、歌の複雑さやレパートリーが、一般的学習能力ではなく、問題解決能力と完全に比例関係になるという意外な驚き以外は、ちょっと物足りない論文だ。

でも、3連休の最後、ちょっとした息抜きには良い論文だと思う。

カテゴリ:論文ウォッチ

9月17日 進む Transformer の医学利用(9月13日 Nature オンライン掲載論文)

2023年9月17日
SNSシェア

生成AIを医療に用いる方法開発についての様々な論文がトップジャーナルに掲載されるようになってきたが、ここまで来るとあまり新味を感じない。ただ、多くの人に利用できるように学習を済ませた生成AIモデルの数が増えるのと平行して、医療や医学教育が急速に変わっていくことが予想できる。

さらに今日紹介するロンドン大学からの論文が示すように、既存のAIモデルを利用して、専門分野の画像を学習させ、チューニングすることで、例えば網膜の画像から病気をかなりの精度で予測できるモデルを簡単に作れるとすると、変革の速度は想像以上になると考えられる。論文のタイトルは「A foundation model for generalizable disease detection from retinal images(網膜が像からの病気診断を一般化できる基礎モデル)」で、9月13日 Nature にオンライン掲載された。

研究自体は他の生成AI論文と変わるところはあまりない。既に、7月14日 GoogleのPaLMをベースに医学のquestion&answerを学習させ、最後に専門家がプロットを書いた内容によるIntruction fine tuningを行うことで、米国医師国家試験に85%の回答率で通過し、さらに専門家に匹敵するチャットボットが可能なMed PaLMについて紹介した。(https://aasj.jp/news/watch/22520)。

この研究は、階層化されて集められた画像の生成AI、ImageNetに、眼科で一般的に行われる網膜画像検査のカラー画像、及びOCT(Optical coherence tomography)検査のイメージを、masked autorencoding(虫食いの画像を見せて完全画像を完成させる一種のクイズ的学習方法)と呼ばれる方法で事前学習させ、後は診断のついた画像でファインチューニングすることで、糖尿病性網膜症、緑内障などはほとんど確実に診断できる生成AIモデルが出来るという話だ。

既存の画像生成AIから専門のモデルを作れるのかといぶかしく感じられるかも知れないが、既存のAIもかなりすごい。例えばユニバーサルな画像生成AI、DALLEに、糖尿病性網膜症の眼底画像とインすると、たちまちこんな画像が出てくる。

ユニバーサルの画像AIもすごいのだ。だから、これを専門的画像だけで学習させ、少ない数の答えのわかった画像でファインチューニングするだけで、実用的な画像診断モデルができあがる。

この可能性は既に、スタンフォード大学から胸部X線写真で示され、この論文が出たときアノテーションなしにレントゲンをともかく読み込ませるtransformer/attemtopmの生成AIの力に驚いた。

以上から考えると、今回の論文は当たり前の話で、わざわざNatureが取り上げるほどかとも思ってしまうが、これまで網膜画像が診断に使われなかった、心臓疾患やパーキンソン病のような他臓器の疾患まで、網膜で診断できる可能性、及び年齢や人種に影響されにくい診断へと発展できることを示した点は重要だと思う。

ここで用いられたmasked autoencodingを用いた学習と、最後の答えを教えるチューニングのコストについて、この研究ではNNIDIAの16GのGPU一つだけ備えたPCで、かなり短期間の努力で、このぐらいの精度のモデルを形成できることを示した点でも重要だと思う。

要するに、あらゆる専門分野が、一般の生成AIとリンクされる時代がそこに来ていることが実感できた。

カテゴリ:論文ウォッチ
2024年5月
« 4月  
 12345
6789101112
13141516171819
20212223242526
2728293031