21世期に入って、病気のリスクと相関するゲノム変化を解析する研究が急速に拡大し、今や個人のゲノムを調べるサービスを受けた米国人は3千万人に迫っている。ワクチンと同じで、この分野でも我が国のスピードは遅く、おそらく自分のお金を払ってゲノム検査を受けた人は百万人には達していないのではないだろうか。
一方、ではこのようなゲノム検査を受けたとき、自分の将来のリスクについてどれほど的確に予想できるのかと問われると、答えは簡単ではない。実際生命保険と同じで、確率論で示されても、結局自分が当事者になるまで、リスクを実感するのは簡単ではない。この実感のなさの重要な原因は、ゲノム検査で明らかになる遺伝子変化(この場合多型と言ったほうがいいが)のほとんどで、病気メカニズムとの関わりが解明されていない。
今日紹介するカリフォルニア大学サンディエゴ校からの論文は、病気とゲノムとの相関を調べる研究(GWAS)から発見される多型の意味を問うことがいかに大変かをしめす研究で、しかしこの困難を乗り越えたところに新しい病気の理解があることがよくわかる。タイトルは「Interpreting type 1 diabetes risk with genetics and single-cell epigenomics(遺伝学とsingle cellレベルのエピゲノミックスを組み合わせて1型糖尿病のリスクを理解する)」だ。
この研究ではGWASについても18942人の1型糖尿病(T1D)患者さんを集めて、50万人のコントロールと比べた新たなデータを、これまで発表されているデータと組み合わせ、多型マップの精度を一段と高めている。解像度は高まっているが、結果自体はこれまでと同じで、1)明らかにT1D発生の主因子となることがわかる遺伝子に連鎖する多型が特定される、2)T1Dに連鎖する多型はリュウマチやSLEに関わる多型と相関する、などがわかるが、ほとんどの多型については、発症メカニズムと相関させることは難しい。
結局ゲノムデータをエピゲノムデータと統合することが、多型の関わりを知るためには必要になるが、ゲノムと異なり、エピゲノムは細胞によって異なっているため、解析が簡単ではない。
この研究では、膵臓という臓器レベルでATAC-seqを用いたクロマチン解析を行い、遺伝子のどの領域がオープンになっているかを調べると同時に、膵臓に存在する様々な細胞の遺伝子発現をsingle cell RNAseqを用いて調べている。
この結果、膵臓に存在する各細胞レベルの遺伝子発現パターンと、完全ではないにしてもオープンな染色体構造を特定することができるので、その上に先に明らかにしたT1Dと相関する遺伝子多型マップを重ねる作業を行なっている。書くと簡単だが、実際には高い情報処理技術の必要な大変な作業だと思う。
こうして初めて、それぞれの多型がどの細胞を通して病気に関わるかがわかる。例えば有名どころで説明すると、免疫機能を抑制するCTLA4の上流の多型はT細胞を通していることや、IL10やIRF1はマクロファージを介して、さらにサイクリン依存性キナーゼCDKN1Cはベータ細胞を介してT1Dに関わることがわかる。
T1D発症には様々な要因が重なることがわかっているが、このレベルの解析があると、個々の患者さんに集まった多型を、関与している細胞と分子のシナリオになんとかつなげることが可能になる。
最後にその例として、これまであまりT1Dリスクとして研究されてこなかった嚢胞性線維症の原因遺伝子CFTR近くの多型を具体例として、このような研究の重要性について示している。
CFTRは欠損すると嚢胞性線維症を発症するが、患者さんでは糖尿病が発症することが知られている。今回特定された多型はCFTR遺伝子の膵管細胞特異的発現に関わるプロモーターに存在し、この多型が存在することでCFTRの発現が低下することを細胞で確かめている。また、遺伝子発現とゲノム多型を相関させるeQTLとこの多型は重なっていることが示されている。
以上の結果は、T1D発症にCTFRの発現が膵管細胞で低下することにより、イオンチャンネルの異常が起こり、これが自己免疫の引き金になる、あるいは免疫によるベータ細胞障害を高める可能性を示唆している。
これまでゲノム/エピゲノムの統合というと、GWASとeQTLの対応と同義だったが、single cell RNAseqや、将来予想されるsingle cell ATACseqによる、細胞レベルの解析が可能になることで、これまでの蓄積の利用が大きく加速するように感じている。