今日紹介するイルミナ社の研究所からの論文は変異の病気へのインパクトを進化の観点から推定できないか調べた研究で,ゲノム解析をリードするイルミナならではの論文だと感じた。タイトルは「Predicting the clinical impact of human mutation with deep neural networks (人間にみらる遺伝子変異の臨床的インパクトをニューラルネットワークAIで推定する)」だ。
この研究は、稀な変異が臨床的に問題があれば、進化の過程で淘汰されているはずだが、多くの場合、完全に淘汰されるには人間が発生してからの時間は短すぎるため、淘汰されずに低い頻度で残っていると考え、人間で見られる変異がサルや場合によっては他の動物にも存在するかどうかについて調べることで、淘汰の選択圧にさらされる変異かどうかわかるのではと着想した。
まず同じ遺伝子の変異で、アミノ酸変異を伴うものと、伴わないものの比率と、その変異の頻度を調べ、アミノ酸変異を伴う比率が高いほど頻度が低い事を確認している。ところが、サルにも人にも同じ変異が存在する場合を選んで調べると、稀な変異も、稀でない変異もほとんど比率が変わらない。すなわち、進化の過程をサルから見直してみることで、淘汰される変異かどうかを判断することができる。要するに、サルにも共通する変異があれば、病気のリスクは少ないというわけだ。
あとはこの結果に基づき、機械学習法で人間の変異と同じ遺伝子のサルでの変異情報とともに、病気についての情報をインプットして機械学習を行い、特定の変異についてサルの情報を入れるだけで、病気との関わりをかなりの確度で診断できるAIを作り上げている。その上で、これまで特定されてこなかった、脳に関わる疾患のリスクになる変異を14種類リストしている。
詳細を全て飛ばして紹介したが、人だけでなくサルと比べることで長い進化過程での淘汰圧を推定できるとしたアイデアがこの研究の全てで、このようなアイデアでAIを設計できるイルミナ社がこの分野をリードするのも当然だと納得してしまう。個人的に最も興味を惹かれたのが、こうしてAIが病気のリスクファクターとしてリストされた変異のほとんどは、小頭症など大きな発達障害に関わるものが多い中で、自閉症のリスクファクターとしてTBR1遺伝子変異もリストされている点で、この分子のサルでの変異がどのような行動につながっているのか、是非知りたいと思った。