4月12日 プライマリーケアへのGoogleの本気(4月9日 Natureオンライン掲載論文)
AASJホームページ > 2025年 > 4月 > 12日

4月12日 プライマリーケアへのGoogleの本気(4月9日 Natureオンライン掲載論文)

2025年4月12日
SNSシェア

これまでこのブログで紹介してきた医学領域の大規模言語モデル (LLM) で、Googleの研究の占める位置は大きい。もちろん基盤モデルを提供することによる貢献もあるが、MedPaLMやGoogle Missenseのような臨床現場で使えるLLMを開発し、しかもトップジャーナルに発表し続けている点が特徴的だ。同じGoogleのAlphaFoldと同じように、医療現場のスタンダードを目指している意志を強く感じる。

そのGoogleのカリフォルニアの研究所から2編の論文がNatureにオンライン掲載された。

1日違いのサブミットで、どちらも新しく作成した鑑別診断モデルArticulate Medical Intelligence Explorer(AMIE)の性能を調べたものだ。論文とは言え、半分AMIEの宣伝パンフレットと言った感じで驚く。

まずAMIEだが、MedPalmにも用いられてきたPaLM2トランスフォーマーモデルに、様々な病気に関するQuestion&Answerを学習させている。そして想定される実際の診察室でのやりとりを専門家とともにプロット化して、ファインチューニングに用いている。驚くのは、テキスト以外にレントゲン写真などを全く学習に用いない、自然言語に特化したところから始めている点だ。すなわち、患者さんと初めて出会うプライマリーケアの状況をまず開拓して、それからマルチモーダルに高めて新しい用途を開拓すればいいと割り切っている。

このように研究の目的は患者さんが症状を訴えて診察に来る状況でAMIEがどれぐらい役立つかの検証になる。このために使った問題は、医師ならほとんどの人が読んだことのあるThe New England Journal of MedicineのCPC (clinicopathological conference) シリーズで、症状から初めて最終的に正しい診断に到達するまでの考え方を学べるよう企画されている素晴らしい記事だ。この記事をAMIEの検証に使うことを想定して、NEJMのCPCは学習から排除するよう配慮している。

最初の論文は、CPCシリーズから作成した患者さんの訴えを、Lineのようなテキストチャット形式の医師と患者の会話で、可能性のある病気を考え、最終的に正しい診断に到達するプロセスを実際の医師とAMIEに行わせて、それぞれのパーフォーマンスを評価している。

結果はAMIEの圧勝で、プロンプトに従って患者の立場に立って医師とチャットした専門の俳優による患者としてのわかりやすさ、安心感など全てAMIEがベテランの開業医さんを凌駕している。

また、診断に到達するまでの過程を、専門家に評価させてた時もAMIEがほとんどの項目で勝っている。この結果から、最初の患者さんとの接点では、医師よりLLMの方が適切な対応が可能になることを示している。

2番目の論文では、同じようにテキストから正しい診断に到達するまでの過程で、AMIEを医師のアシストとして使う可能性を検証している。こちらの方は、症状を聞いて、可能性のある病気を可能性の高い順にリストし、それを鑑別するための方法を明確に構想できるかを調べている。

先の論文にあるように、AMIEと医師を比べるとAMIEが圧倒的に成績がいい。そこで、今度は医師に通常の検索、あるいはAMIEとの相談を通して鑑別診断してもらうと、AMIEを使った方が、一般の検索を加えて診断するより成績がいい。ただ驚くのは、それでもAMIE単独には負けている。おそらく、自分の最初の印象のバイアスが影響するのだろう。

これ以上の結果は割愛するが、要するにAMIEをアシスタントとして使うことも可能だという結論だ。使った医師に聞くと、検索するよりよほど親切でわかりやすいとコメントしており、実用化がすぐであることを感じさせる。また英語を用いているが、カナダとインドという状況設定までして、その実力の高さを誇示している。

以上が結果で、医師と患者の接点で使えるLLMモデルが完成に近づいている実感があるし、また研究の仕方から、この分野へのGoogleの本気度が感じられる。そしてこのままマルチモーダルな、万能LLMへと進化するのだろう。

余談になるが、最近NHKの「総合診療医 ドクター」が新しく始まったようだ。ここには様々な病院から若い医師が集まり、専門家が経験した症例について鑑別診断を進める番組で、私も各何回か見たが、出演する若い医師の知識の正確さにいつも舌を巻いた。今度は是非ここにLLMを参加させると面白いはずだ。将棋がAIにより活性化されたのと同じように、多くの学びが得られると思う。

カテゴリ:論文ウォッチ
2025年4月
« 3月  
 123456
78910111213
14151617181920
21222324252627
282930