昨日はLINEトランスポゾンが、long noncoding RNA として炎症に関わる遺伝子発現を抑える論文を紹介し、ジャンク DNA も機能が持てるように我々の進化が進んでいることを紹介した。このように明確な機能が見つかることは希で、多くの場合、LINE や Alu と呼ばれる霊長類のレトロトランスポゾンは、ゲノムの多様性生成に大きな役割を果たしていると考えれている。
というのも、昨日紹介したように、同じ起源を共有する配列が、我々のゲノムに驚くほどの数で散らばっているという事実は、良く似た配列(相同)がゲノムのあちこちに存在することを意味し、何らかのh拍子で DNA が切断されると、この相同性を元に、相同組み換えが起こり、ゲノムに欠損や重複の大きな変異が生まれるきっかけになるからだ。これは、通常の相同染色体同士の組み換えと異なり、ゲノム上に存在する相同領域同士で起こるので、non-allelic 相同組み換え(NAHR)と呼ばれている。ただ、これだけ多くの繰り返し配列が存在すると、実際には変異を特定することは簡単ではない。ましてや体細胞では、細胞ごとに起こるイベントは異なっており、組み替えによる変異をシステミックに特定することは簡単ではない。
例えば、長いDNAについて配列を解読する Long read 解析を繰り返せば、欠失や重複は発見できるのだが、特定の変異が起こる頻度が少なすぎて、大変な作業になる。これに対し、今日紹介する横浜理研の Piero Carninci 研究室からの論文は、Alu や L1 配列を特異的に生成した後、それぞれの断片の配列を決定し、ゲノム配列と比べて、相同組み換えによる変異を特定する方法を開発している。勿論同じことは、long read でも可能で、新しい方法を、long read でも確認して、この方法が信頼できる方法であることを確かめている。
その結果、細胞一個あたり NAHR が1−4個存在することを明らかにしている。面白いのは、このような変異が全ての組織で平等に起こるわけではなく、例えば腎臓や肝臓では NAHR の数は4個前後あるのに、脳は1個前後で止まっている。ところが、一つの染色体内で起こる NAHR の数は脳の方が多い。しかも、脳内では比較的近くの繰り返し配列との NAHR が見られるのに、腎臓や肝臓ではほとんどない。これがゲノムの3次元構造を反映していると考えると、脳と他の臓器では異なる染色体 3D 構造があると推察される。
これを確かめるために、iPS から神経幹細胞への分化過程を調べ、分化とともに神経型の NAHR が出現することも示している。そして、クロマチンが活性化されている領域と、閉じられている領域での NAHR を算出し、iPS と神経幹細胞のエピジェネティックな状態を反映して、NAHRが起こっていることも示している。
以上のように、NAHR は細胞分化の過程で起こると考えられ、そのときの遺伝子発現を反映する。従って、様々な病気を理解するヒントになる。例えば、21番染色体で NAHR の起こりやすい場所を探すと、中心体から10Mbにホットスポットが特定されるが、これはダウン症で転座が起こる領域として知られている。また様々なガン遺伝子の近くにも、特に Alu 型 NAHR が特定されることは、Alu 配列がガンの染色体不安定性に使われるのと一致する。
最後に大サービスで、アルツハイマー病とパーキンソン病の脳で NAHR を探索し、パーキンソン病の濃飛質で NAHRの数が増えることや、アルツハイマー病では病気発症に関わるプレセニリン遺伝子の近くに NAHR が起こりやすいことも確認している。
NARH から見えてくることをいろいろ示しているが、この研究のハイライトは方法が開発できたことで、それぞれの細胞分化の過程で起こりやすい NAHR 探索を続けることで、違った視点で細胞分化やガン発生がわかるように思う。