いつも学生さんに講義するとき、21世紀の生命科学がダーウィンの進化論と20世紀シャノンやチューリングの情報科学という、非物理的因果性を追求してきた流れがゲノム研究として交わった所に生まれた大きな渦だと、私の歴史観を述べたうえで、21世紀の重要な課題は、ゲノム、エピゲノム、脳回路、言語・文字など媒体としては独立した情報の集まりを統合することだと強調している。
20世紀の後半からゲノム研究が進み、病気の多型解析などが進んだが、21世紀の最初の統合の動きは、リストされた多型の意味を探る目的で行われてきた遺伝子発現と多型解析の統合に典型的に見られていると思う。
今日紹介するカリフォルニア大学サンディエゴ校からの論文は、遺伝子発現を染色体構造情報に置き換えて多型と統合できないか模索した研究で、11月29日号のScienceに掲載された。タイトルは「Brain cell type–specific enhancer–promoter interactome maps and disease-risk association(脳の細胞特異的エンハンサーとプロモーターの相互作用地図と病気のリスク)」だ。
もともとこの大学はエピゲノムの素晴らしいデータベースで有名で、現役時代門外漢の私も論文を読みながら興味が湧いた遺伝子のエピゲノムをこのデータベースで調べていた。この研究では、人間の脳からミクログリア、ニューロン、オリゴデンドロサイト、そしてアストロサイトを分離し、その核のクロマチン構造を、ATAC-seq(クロマチンがオープンかクローズかを調べる)、とゲノム状のヒストン修飾、H3K27ac(活動しているエンハンサー)、そしてH3K4me3(活動しているプロモーター)を特定し、さらにプロモーターやエンハンサーとは2次元的には離れていても、立体的には接して存在しているゲノム領域を調べるPLACと呼ばれる方法を用いて解析している。
膨大なデータで、データベースができたという点がハイライトなので、詳細は省く。もちろん予想通り、遺伝子発現、H3K27ac、H3K4me3はほぼ一致している。さらに染色体構造を調べる方法が合わさるおかげで、それぞれのエンハンサーやプロモーターの相互作用も同時に調べることができ、例えばSALL1遺伝子領域ではミクログリアだけでスーパーエンハンサーが形成されているのが特定できる。
次に、こうして解析した染色体構造を、これまで発表されている遺伝子多型解析結果と統合させている。基本的にはどの病気の多型解析にでも使えるが、この研究ではアルツハイマー病の多型解析と比べている。
もちろんそれぞれの細胞ごとにアルツハイマー病と関連する多型を特定できるが、中でも多いのがミクログリアで、結果か原因かはともかく、アルツハイマー病にミクログリアが深く関わっていることがわかる。
さらに重要なのは、ヒストン修飾や遺伝子発現からだけではわからなかった、多型が見られる領域同士の相互作用がはっきりと見られることで、いくつかの遺伝子を例として詳しく解析しているが、詳細は割愛する。
これらのデータも、この大学のデータベースで公開されると思うので、ぜひ多くの若手研究者が利用して、宝の山を当てて欲しいと思う。これはほんの始まりだが、もっと面白い新しい発想の生命情報の統合が進んでいくことが期待される。