我が国も含めて数あるバイオバンクの中で、英国バイオバンクは最も成功したバイオバンクだろう。実際私のような素人でも、毎日論文を眺めておれば、英国バイオバンクを用いた論文の数が増え続けていることは実感する。この驚きについては、2018年に2回に分けて、このバンクからの成果をまとめて紹介した(https://aasj.jp/news/watch/9080 、https://aasj.jp/news/watch/9083 )。 このバンクを見ていると、英国の科学力が当分揺るがないことはよく理解できる。
あれから3年がたったが、今日から2回、UKバイオバンクのデータを用いて、これまで困難とされてきたタイプの遺伝子変異について解析した論文を紹介することにした。最初はハーバード大学からの論文で同じ配列が繰り返すtandem repeatのなかで、タンパク質をコードするリピートについてのリピート数の変異と、形質との相関を計算できるようにした研究で、9月24日号のScienceに掲載された。タイトルは「Protein-coding repeat polymorphisms strongly shape diverse human phenotypes(タンパク質をコードしている繰り返し配列の多型は多様な人間の形質の発生に関わっている)」だ。
最初タイトルを見たとき、ハンチントン病の様な短いリピート数の変異の話かと思って読み始めたが、この研究ではそれよりは大きな遺伝子領域(実際には18bpから114bpの大きさ)がリピートする数の変異(VNTR)を特定しようと試みている。
このようなリピートの存在は、ヒトゲノム解析データからある程度推察することができるが、それが本当に遺伝する、しかもタンパク質の長さとして表現されることを確認するためには、発現遺伝子の配列から確認する必要がある。これを可能にしたのが、英国バイオバンクに集められた、全く同じ方法で解析された5万人のエクソーム解析で、まず118のVNTRを特定している。
次にVTNRの周りにある遺伝子多型と相関させることで、遺伝可能なVNTRを特定し、最後にそれぞれのVNTRのリピート数とUKバイオバンクに記載されている形質との相関を調べている。また、UKバイオバンクのSNP(一塩基多型)とリンクさせることで、UKバイオバンク50万人の多型データとの関連も調べることができる。
などと簡単に書いたが、膨大な補遺として添付されている方法を見ると、in silicoの仕事といっても、大変であることがわかる。逆に言うと、それをいとわない研究者であれば、この論文のように米国の研究者にも英国バイオバンクは開かれている。
この大変なビッグデータ処理の結果、最終的に5つのVNTRと形質との関わりを特定し、それぞれについて解析結果を紹介している。ただ、上がってきた遺伝子を見て驚くのが、すべてサルや人間で特に変化が見られてきた遺伝子で、人間の形成に深く関わっている点だ。それぞれについての結果は、以下に短くまとめておく。
リポプロテインA: 旧世界ザル以降に現れる分子で、これまでもKringle IV type 2ドメインの繰り返しが分子内に存在し、しかもこの繰り返し数に多型が見られることが知られていた。その意味で、この分子が特定されたことは、方法論の妥当性を示す。この研究ではさらに詳しくリポプロテインの血中濃度とリピート数の解析が行われ、大体10リピートが最大値で、それ以下、あるいはそれ以上の場合、リピート数が10個から離れるごとに、低下していくことを示している。
アグリカン:細胞外基質分子で、成長プレートの構造に関わる。57bpを単位とする繰り返しは13回から44回と多様で、大体1リピート増えるたびに1mm身長が伸びることがわかった。
TENT5A: PolyAポリメラーゼで、骨形成不全症に関わることが知られている。15bpの繰り返しが2回から7回と、多様性は大きくないが、5回繰り返しを持つ遺伝子で、身長が一番高く、2回繰り返しの場合と比べると0.6cm高い。
ムチン1:ガン細胞で合成が高まることが知られた、上皮により分泌され、細胞表面に結合して接着などに関わるが、その発現様式は複雑な分子といえる。割となじみがあったので、60bpの繰り返し配列が、なんと20回から125回まで大きく変化していることを知り、私も驚いた。ただ、この繰り返しとガンとの関わりはわからないが、腎臓の機能、特に血中尿素窒素や尿酸値がリピートが増加と並行して上昇する。
トリコヒアリン:ケラチンの構造維持に関わる分子で、毛の強度と関わることが知られている。18bpのリピートが5回から15回と多様性を示す。リピート数が増えると、男性型ハゲのスコアが低下する。一方、縮れ毛の程度は高まる。
以上が結果で、人間の様々な量的な形質の違いに、タンパク質をコードするリピートの数が関わることがよくわかる面白い論文だ。今後、メカニズムの解析が進むと、人間の進化や人種についての理解が大きく進展すると期待する。
遺伝子型と表現型を繋ぐ。。。
現代でも大変な仕事ですね。