一般病理学では炎症、ガン、変性というように、病理組織の共通性で分類をしている。また微生物学では、何に感染するかが病気の分類になる。一方、診療部門ではどうしても臓器別、年齢別の分類が優先される。こう考えると疾病分類は簡単でないことがよくわかる。
今日紹介するシカゴ大学からの論文は保険会社の持っているビッグデータを用いて、病気を頻度、遺伝性、環境要因の面から分析して分類できないか調べた研究でNature Geneticsのオンライン版に掲載された。タイトルは「Classification of common human disease derived from shared genetic and environmental determinants(遺伝と環境要因の共通性からみた一般的病気の分類)」だ。
Nature Geneticsに論文を送ったのは著者らの選択だと思うが、Nature Geneticsに送ってしまって、本当は読んで欲しい多くの研究者の目に止まらないのではとまず思った。
研究では医療保険会社が持っている疾患と会員のデータを使って、親子兄弟で同じ病気が起こる確率、同じ環境で暮らす夫婦で病気が起こる確率を計算し、統計学的に、疾患の頻度、家族性から計算される遺伝性、環境依存性などを計算しプロットしている。難しい病気でなければ、金を払う側の米国の保険会社の診断は性格だ。また、子供も25歳までは親と同じ保険でカバーされるので、家族内での病気の発生を正確に抽出できる。
実際には4000万人分のデータから、約13万家族と、50万単身者を抜き出し、遺伝的一致率(遺伝)、環境を共有する夫婦での一致率(環境)、環境を共有する兄弟での一致率(遺伝+環境)に基づく数理モデルを作って、149種類の一般的な病気の遺伝要因、環境要因を算出している。
膨大なデータで詳しく紹介する気は全くないが、遺伝要因では一番高いのは自閉症スペクトラムで、一番低いのが脂肪腫になり、一方環境要因が高いのは皮膚の腫瘍になる。一般的に多くの病気では遺伝的要素の方が環境要因より高い影響力があるが、例えば統合失調症のような神経系疾患では、環境要因と遺伝要因の寄与は同程度になる。 これを聞くと、統合失調症は最も遺伝性の高い病気ではなかったかと質問が来ると思うが、この研究は単純に遺伝性を調べているわけではない。個人的には、統合失調症でも脳のような複雑なシステムの病気に環境が大きく影響することは当然だと思う。
この研究の面白さは遺伝と環境要因の寄与度を指標に病気の間の関係を知ることができる点だ。例えば偏頭痛は普通脳や脳血管の病気として分類されてしまうが、この方法で分類すると腸炎のような免疫疾患と関連が高い。あるいは、1型糖尿病と高血圧がよく似ていることになる。このような意外な結果こそ、将来面白い結果につながる可能性がある。
他にも、病気の発症年齢との関係など疾病分類を考える上で面白い話が満載だが、それぞれの興味を念頭に直接読んで欲しい。はっきり言って、意外性はあっても、「なるほどビッグデータも役にたつ」程度で終わる仕事だが、今後家族関係や環境要因がスマフォなどのデータを通してリンクされてくると、さらに精緻な環境と遺伝に基づく疾患分類法の開発につながるのではと期待している。