AASJホームページ > 新着情報 > 論文ウォッチ > 12月8日 Baker 研からの新しいタンパクデザインAI: RFdiffusion 2(12月3日 Nature オンライン掲載論文)

12月8日 Baker 研からの新しいタンパクデザインAI: RFdiffusion 2(12月3日 Nature オンライン掲載論文)

2025年12月8日
SNSシェア

何度も紹介しているように、昨年のノーベル化学賞を受賞したワシントン大学の Baker さんは、タンパク質デザイン分野をリードしているが、これまでの研究を追跡すると、既存の方法では解決困難な課題を探し出して、それを解決するさらに新しい方法を開発しているのがよくわかる。最初デザインが比較的容易な短いペプチドを組み合わせて機能をデザインしていた Bakerさんたちは、生成AIをいち早く導入して、タンパク質構造予測の Rosettafold を開発するのと並行して、目的に合わせてタンパク質の構造をデザインする RFdiffusion、ペプチド構造からDNA配列を予測する ProteinMPNN を開発し、これの基づき全く新しい機能タンパク質を合成し報告してきており、このブログでも何回も紹介してきた。

このように Bakerさんはこの分野の巨人だが、タンパク質デザインでは様々な問題が存在し、巨人との競争に尻込みせず、これを解決するための様々な方法開発にチャレンジしている研究グループが増えてきた。この辺については YouTube で紹介しているので是非視聴してもらいたい(https://www.youtube.com/watch?v=hBFr9aVoXIQ)。 

もちろん Baker研でもこれまでのモデルの問題を解決するための開発が進められており、今日紹介する論文は、これまでの RFdiffusion を根本的に変革したタンパク質デザインモデル RFdiffusion2 の開発で、12月3日 Nature にオンライン掲載された。 タイトルは「Computational design of metallohydrolases(メタロハイドロラーゼのコンピュータデザイン)」だ。

これまでこのブログで紹介した Baker研からの論文は、タンパク質同士の相互作用についてのデザインがほとんどだと思う。これはDiffusionという画像生成法が、構造がはっきりしたタンパク質に適用しやすいからだ。ところが、今回対象にしているメタルハイドロラーゼ、即ち金属を補酵素として様々な分子を加水分解する酵素のように反応標的が小分子と金属の場合は、反応の場で多様な構造とるため、RFdiffusion ではこれまでの知識を元に、直接反応に関わる3つのヒスチジンの位置や、配向性を最初から条件として組み込んでスタートしないと設計が難しく、さらにこの条件設定をしても計算量は膨大になる結果、歩留まりが悪かった。

最近画像生成分野では Diffusion に変わる方法として Flow matching が登場しているが、Bakerさんたちは Diffusion を Flow matching に変えることでこの問題を解決できないかと着想した。全く数理苦手の素人なので、私が理解している範囲の解説だが、Diffusion は各ピクセルの数値が集まってできる一つの画像のベクトルを少しづつずらしてノイズを入れていく過程を学習させ、この学習を元に、今度は一定の条件を加えてノイズを除去する逆の過程として計算して画像を生成している。

これに対し Flow matching は条件のない乱雑な点群から画像に対応する点群へ変化するときの流れを学習させるモデルで、より自由度が高く、最初に理論的基質、金属、そして活性部位のヒ3つのスチジン配向( Theozyme と名付けている)を指定すると、自由に3つのヒスチジンを持つハイドラーゼを設計することができる。

その結果、ヒスチジンを117番目、129番目、そして133番目に持つZETA-1設計に成功している。実際には生成された96種類のタンパク質を実際に合成して酵素活性を調べており、ZETA-1には及ばないが酵素活性が存在するタンパク質を数種類生成でき、歩留まりも良い。

大事なのはこれでとどまらずに、新しく生成した酵素と基質との関係を、酵素の活性部位の量子化学的理論値評価を PLACER と呼ばれるモデルで行い、さらには金属を含む小分子の相互作用を予測できる、Alfafold3 の後継構造予測モデルを Chai-1 を用いることで、酵素側で重要な3つのヒスチジンと亜鉛とのより理想的な関係を特定している。これに基づいて Theozyme を設計し、それを元に新たに RFdiffusion2 でタンパク質を生成させると、ZETA-1より高い酵素活性を示す酵素を3種類も生成することに成功し、しかも ZETA-2はZETA-1 の Kcat/Km値で3倍酵素回転率が高い。

以上が結果で、新しい Flow matching の可能性にいち早く気づき、その性能を最も試すことができるハイドラーゼという格好の課題を見つけ、高い酵素活性を持つタンパク質を設計するとともに、RFdiffusion2 を用いて実際のタンパク質を生成、さらに新しい構造予測モデル Chai-1 を組み合わせることで、コンピュータ上でだけで歩留まりの高いタンパク質デザインが可能なことを示している。タンパク質構造に関するあらゆる進歩が感じられるさすが Bakerさんと思える論文だった。ついでに言うと、ハイドラーゼを設計することで、産業廃棄物の分解にも役立てるのは、役立つ研究を目指す Bakerさんの全てが現れた研究だと思う。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

*


reCaptcha の認証期間が終了しました。ページを再読み込みしてください。