AASJホームページ > 新着情報 > 論文ウォッチ > 1月22日 医療保険の請求書を使う遺伝学(Nature Geneticsオンライン版掲載論文)

1月22日 医療保険の請求書を使う遺伝学(Nature Geneticsオンライン版掲載論文)

2019年1月22日

昨年5月から施行された次世代医療基盤法は、デジタル化された膨大なレセプトデータを実際に行われた検査や治療と匿名化して連結させたビッグデータを、様々な研究に使えるようにしようとする法律で、我が国の医学医療にとって重要な一歩になると個人的には思っている。この作業は、最も重要な個人情報を含むため、この法律では国が認めた認定業者が行うが、認定のハードルは高く、日本医師会以外は現在のところ手を挙げている団体はないように思う(正確には把握していない)。

ただ、膨大な数のレセプトがあれば何が可能かを示す論文がハーバード大学からNature Geneticsオンライン版に掲載された。タイトルは「Repurposing large health insurance claims data to estimate genetic and environmental contributions in 560 phenotypes (膨大な健康保険の請求書データを560種類の形質について遺伝と環境要因を推定する目的に変換する)」だ。

米国の医療保険は最低限の公的保険もあるが、オバマケアでも民間保険会社と契約するのが基本で、契約者が医療を受けると、かかった費用を保険会社に請求し費用が還付される仕組みになっている。このクレームが日本でいうレセプトの役割を果たしているが、これにはコード化された病名とかかった費用の明細、および一部は検査データも添付されている。もちろん病気の詳しい解析はできないが、厳しいガイドラインで保険が運用されているため、病名や患者さんの状態についてはかなり正確にわかる。

ただ、いくらビッグでもクレームデータだけから病気の遺伝的あるいは環境的要因が本当に推定できるのか不思議に思うが、読んでみると素晴らしいアイデアだと納得する。すなわち、クレームの中から同じ日に生まれた同じ家族のメンバーで遺伝的に近い双生児を抽出し、双生児の間で有意に相関性が高い病気や状態を遺伝的要因が関与すると判断する。一方環境要因の推定は、クレームに記載されたZIPコードから同じ地域に住んでいるかどうかを判断し、同じZIPコードの人の間で高い相関を示すものを環境要因に作用されていると判断している。これ以外のことは全く調べておらず、遺伝子も調べていない。要するに、アイデアさえあれば、レセプトからも遺伝と環境という医学で最も重要な問題を研究できるわけだ。

研究では4500万のクレームデータを分析し、なんと72413人の兄弟姉妹、そして56396人の双生児(一卵生、2卵生を含む)を抜き出すことに成功している。そして、560種類の病気や状態の中から双生児の間で一致率が高い状態を遺伝性があると判断し、またZIPコードが一致した同じ地域に住む人の方が一致率の高い状態を環境要因が高いと判断している。

この結果、560のうち225種類の病気や状態は何らかの遺伝性があると判断され、最も一致率の高いのが定量的検査データの数値や認知機能に関わる形質だった。一方、ZIPコードとの相関から判断する環境要因が関わる形質は138種類存在し、その中で最も高い一致率があったのが眼科疾患と呼吸疾患だった。面白いことに、医療費も遺伝的要因が大きい。これは病気の頻度、深刻さが遺伝的に影響されることを示しているのだろう。環境要因では、ZIPコードから、平均気温、大気汚染なども調べることができるため、様々な汚染物質の疫学も将来可能になると思う。

最後に、他の双生児研究の結果と比較が行われ、クレームから判定する今回の方法も、これまでの双生児研究と同じ結果が得られることを示している。

結果は以上だが、レセプトの病名が完全なら、わが国でも新しい法律がなくとも十分今回のような研究は可能だろう。もちろん、これに様々なデータがリンクされることで、さらに詳しい状態解析が可能になると期待できる。ただ、今日紹介した論文を読んで、この匿名化してデータを加工する作業が一体どのぐらいかかるのかという点と、この研究のように公開されたデータを使って創意溢れるアイデアで、ビッグデータを解析できる研究者がどれほど我が国にいるのかも少し心配になった。


  1. Okazaki Yoshihisa より:

    双生児間で有意に相関性が高い病気や状態を遺伝的要因と判断。
    同じZIPコードの人の間で高い相関を示すものを環境要因と判断。
    これ以外のことは全く調べておらず、遺伝子も調べない。

    →機械学習が得意とする相関関係解析による推定だけで、従来の遺伝学的解析に匹敵する知見が得られるのですね。
    ideaの勝利!!

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

*