私たちのゲノムは48本の長いDNA鎖からできており、総延長は2mに及ぶ。これが核の中でたたまれているのだが、やみくもにたたまれるのではなく、必要な遺伝子だけが転写され、必要のない遺伝子は転写マシナリーから隔離するようたたまれる。例えれば飾り紐のようにたたまれており、さらにたたまれ方は細胞ごとに異なっている。このたたみ方を決めるのがCTCFとコヒーシンであることがこれまで明らかになっている。たたまれ方を調べる方法の一つが、隣接しているゲノム領域を調べるHi-Cと呼ばれる方法で、この方法を用いてゲノムの立体的区域化(TAD:topology associating domain)を決めることができ、多くの細胞種でTADが決められつつある。
さて現在ポストゲノムの最重要課題として進んでいるのがENCODEプロジェクトで、細胞ごとの遺伝子発現、エピゲノム、そしてTADなどをゲノムの上に重ね合わせてるプロジェクトだ。このプロジェクトによりゲノム情報が初めて細胞特異的なエピジェネティック状態と統合できると期待されている。この研究では、これに加えてCTCF結合部位に集められた遺伝子領域と、転写開始標識としてのRNAポリメラーゼと結合している遺伝子領域を高い精度で (ChiA-PET: Pair-end tag sequencingという方法を用いる)調べることで、ENCODE情報全体を構造という観点から再統合できることを示した研究だ。
詳細を全て省いてイメージを伝えるとすると、DNAという糸に付いたCTCFはコヒーシンの作用でヘアピンとコイルの2種類の基本構造が組み合わさった立体構造をとっているが、この論文に示されたデータにより、一つの細胞株についてではあるが、この折りたたみを何千箇所について具体的に描くことができるようになったと考えてもらえればいい。この折りたたみの要(かなめ)にCTCFとコヒーシンが存在するが、そこで転写が活性化されている場合はRNAポリメラーゼも存在する。 ではこのデータから何がわかるのか。まず構造と転写活性の相関がわかる。例えば、どの細胞でも発現している生命に関わる遺伝子をハウスキーピング遺伝子と呼ぶが、これらの遺伝子は要に近いところに集められている。一方、発生に必要な遺伝子のプロモーターやエンハンサーは要から離れたループの中に存在するといった具合だ。私は細胞分化を研究していたが、3年前の現役時代には全く想像もつかなかったことが明らかになっている。新しい転写研究時代が押し寄せていることを感じ、はっきり言ってこの流れについていくのは大変だったろうと思う。 もちろん発生だけではない。この研究ではCTCF結合部位が一塩基変化するだけで、転写活性が大きく変化すること、そして病気と相関する一塩基多型の中には、喘息の一塩基多型を例に、この構造と相関させて初めて明らかになるものがあることを示している。全ゲノムにわたる研究はデータは膨大で、読むのがしんどいことが多いが、この論文は読んでいくと自分の分野が思い出され、様々な想像がかきたてられた。一般の方には難しいと思うが、若い研究者はこのような時代がきていることをしっかりかみしめてほしいと思う。
ゲノム研究で遅れをとった日本は、エピゲノム研究(エピジェネティックメカニズムの研究ではなく、エピゲノムの研究)でさらに遅れをとり、ゲノムの構造の研究になるともう取り返しのきかないところに来てしまっているような気がする。実際、昨年1年論文を読んで、ゲノム構造化に関する我が国からの面白い論文に出会った記憶がない。幸い、外国の研究でもデータベースとして残されている。物を考えるとき、ゲノム構造も念頭に置いて考えることは誰でもできる。ぜひこのギャップを埋める若手が台頭してほしいと思う。
カテゴリ:論文ウォッチ