過去記事一覧
AASJホームページ > 2023年 > 9月 > 20日

9月20日 生成AI(AlphaFold)により今まで見えてなかった構造が見える 2. 新しい構造をアノテーションするための戦略(9月13日 Nature オンライン掲載論文)

2023年9月20日
SNSシェア

昨日紹介した論文は、DNA配列の比較だけでは相同性がわからなかった蛋白質を構造から比較するための新しいデータ解析の開発で、構造から蛋白質同士の関係や機能がわかる例をいくつか示している。しかし、構造の相同性で分類できたとしても、機能についてアノテーション出来るわけではない。

今日紹介するスイスバーゼル大学からの論文は、アノテーションを進めるための様々な戦略を探った研究で、9月13日に Nature にオンライン掲載されている。タイトルは「Uncovering new families and folds in the natural protein universe(蛋白質世界の新しいファミリーと構造を解明する)」だ。

研究では、3億5千万の蛋白質を50%配列相同性を指標にクラスター分けを行い、また相同性を元に全てのクラスターが関係づけられた大きな蛋白質のネットワークを作成、それにこれまでわかっているアノテーションや構造の相同性などを加えたデータベースを作っている(https://uniprot3d.org/atlas/AFDB90v4)。

このネットワークの中で、これまでアノテーションが全く出来ていなかった蛋白質クラスターを、ダークマターと呼び、それにアノテーションを与える様々な方法を試している。

ダークマターとして分類されるクラスターも、ネットワークとして見ると、一部弱いアノテーションがつけられている分子を持つクラスターと系統的関係を見つけることが出来る。ここでは YfhOファミリーとアノテーションされた蛋白質を含むクラスターと近い関係にあるクラスターを、構造の類縁性で調べると、同じ機能を持ちそうな細胞膜分子としての構造の類似性が明確になり、アノテーションが可能になった例を示している。この結果は、昨日の論文と同じで、構造の類似性をもとに、新しい分類とアノテーションが可能であることを示している。

同じように、アノテーションが出来ていないとされる蛋白質も、クラスター化し、詳しく解析してみると機能が明らかになる場合がある。その例として、DeepFRI と呼ばれる構造を解析するソフトで新しいトキシン/アンチトキシンシステムとして機能を特定できたクラスターを紹介している。アノテーションが出来ると、バクテリアを用いた実験で、殺菌性、また殺菌作用をブロックする作用を確認できる。

面白いのは、最近整備されつつあるアノテーションのための生成AIにダークマタークラスターを読み込ませることも行っている。すると、ChatGPT と同じでハルシネーションと呼ばれる、ばらついたいい加減な答えが出てくる。ただ、答えの出方のバラツキ方は逆に利用できることがあり、多様な答えが返ってきたクラスターを選び、構造の相同性を調べると、最終的にプロファージ蛋白質とアノテーションがついた例を示している。

最後に、Protein databank に登録されている構造と異なっている度合いを算定するモデルを作成し、これを用いて Protein databank で全く分類できていない70万近くの AlphaFold によって決められた構造を特定している。そして、この中の最も美しい例として、βシートがねじれたばれる構造が花弁のようにつながったβフラワー構造をとるクラスターを特定し、その中の一部の構造から機能を phospholipid scramblase と特定している。

以上が結果で、構造だけに着目した昨日の論文と異なり、様々な手法を取り入れて、ダークマターに迫る方法を述べている。重要なのは、どちらの論文も、この宝の山が眠る荒野の入り口に立ったところで、今後新しい深層学習、相同性を探る新しい方法、そして AlphaFold を超える構造予測方法の開発が進むと、大きな研究領域になる予感がする。

カテゴリ:論文ウォッチ
2023年9月
 123
45678910
11121314151617
18192021222324
252627282930