9月28日 効果の特定の難しい遺伝子変異を調べる:II  3’UTRの変異と形質 (9月30日号 Cell 掲載論文)
AASJホームページ > 2021年 > 9月 > 28日

9月28日 効果の特定の難しい遺伝子変異を調べる:II 3’UTRの変異と形質 (9月30日号 Cell 掲載論文)

2021年9月28日
SNSシェア

昨日はエクソン内のコーディング領域に発生した繰り返し配列数の多様性が、私たち人間の形質をどう変化させるのかを、英国バイオバンクのエクソームデータと、ゲノム/形質の関係を調べた大規模ゲノムデータを駆使して調べる研究を紹介した。この研究から、身長や毛の強さ、あるいは血中脂肪などのレベルが、リピート数と相関し、人間の多様性を生み出すのに寄与していることが理解できたと思う。

このように、変異により遺伝子発現のレベルが少しづつ変化して、形質の多様性を発生させる可能性がある領域の中には、3‘UTRと呼ばれるmRNAのコーディング領域下流に存在する領域があり、mRNAの安定性を決めたり、マイクロRNAの標的となることで、転写後のRNA量を調節するのに関わっている。ただ、この領域の変異は機能が特定しづらく、多型と形質との関係に関する研究は進んでいなかった。

今日紹介する論文もハーバード大学からの研究で、3‘UTRの変異の効果を調べるためのシステムを構築し、英国バイオバンクを始め、様々なデータベースを駆使して、このシステムの妥当性を示そうとした研究で9月30日号のCellに掲載される。タイトルは「Genome-wide functional screen of 3’ UTR variants uncovers causal variants for human disease and evolution (全ゲノムにわたる3‘UTR変異の人間の病気と進化への関与を機能スクリーニングする)」だ。

この研究のハイライトは様々なデータベースから3‘UTRの変異を集めて、網羅的に変異の影響をレファレンス配列と比較できる実験系を開発したことだ。実際には、人間進化の過程で変異した可能性の高い3‘UTR変異をリストしたデータベースや、GWAS研究から病気の関連が指摘されている3‘UTR変異リストのデータベースなどから、約1万2千種類の3‘UTR変異を集め、これらの変異をカバーする100bpの配列を全てバーコードとともに合成、対応するレファレンス配列とともに、それぞれGFPレポーターベクターに組み込み、細胞に導入、細胞内に発現しているmRNA(バーコードからカウントする)の量を、対応するレファレンス配列と比べ、それぞれの変異効果を算定できるようにしている。

こうして、約2500種類の変異がmRNA量に影響することを明らかにしている。1万以上の変異配列を合成するだけでも大変な研究で、おそらくこれまでならリストを形成していただいてご苦労さんといった感じで論文として発表されていたのだろうと思う。ただ、現在は英国バイオバンクをはじめとする、多数のデータベースが存在し、新しい実験系で得られた変異リストが信頼できるかを確かめることができる。この研究でも、様々なデータベースやアプリケーションを用いて、この検証を丹念に行っている。

  1. 染色体ごとのRNA発現を調べたデータベースと対応させ、今回リストした変異の多くが、このデータベースで発現量に影響することがわかっている3‘UTR変異と一致した。
  2. eQTRと呼ばれる多型と遺伝子発現を調べるデータベースと比べ、この論文でリストされた3‘UTR変異の効果と、絵QTRデータベースの結果が一致した。
  3. これまでの研究で知られている3‘UTRの機能に関わる様々な特徴(例えば安定性に関わるAUrich領域やCUrich領域、あるいはマイクロRNA結合領域など)と、今回特定された変異はオーバーラップする。
  4. 英国バイオバンクなどのGWAS研究や、各人種にのゲノムデータベースと照らし合わせて、今回リストされた変異によるRNAの発現量の違いが、統合失調症、高脂血症などをはじめとする疾患や、あるいはコーヒー嗜好や、髪の毛の色などの一般形質の変化の原因となることが確認される。
  5. また新型コロナウイルスを始め、ウイルス自然免疫に関わるTRIM14の3‘UTR変異は東アジア人で選択的に増加しており、発現レベルを変化させる変異が人種形成に関わることがわかる。
  6. またこのシステムを用いると、特定の遺伝子多型について、突然変異を人為的に導入してその効果を比べることができ、データベースの結果を、実験的に確かめられる。
  7. 網羅的な機能的検証が可能になることで、3‘UTRの配列から、機能的効果をある程度推定することが可能になった。

などが示されている。これまで、データベースから少数の変異に焦点を当て、個々に機能検証していた方法に対し、より網羅的な方法論が導入した研究と位置づけられるが、今回リストされた3千弱の変異は、これから多くの研究者により、様々な角度から利用されるのを待っていると言っていいだろう。

一般の方には理解しづらい論文が続いたが、2回に分けて、21世紀生命科学がデータベースの利用なしに存在し得ないことがわかってもらえたのではと思う。データを求めて世界のデータベースをサーフィンし、面白い研究を行う若手研究者が我が国にももっともっと現れることを期待している。

カテゴリ:論文ウォッチ