機械学習アプローチを用いた乳児期の遺伝性胆汁うっ滞性疾患の予測モデル
DOI:10.1002/jpn3.70166
アブストラクト
目的:乳児期の胆汁うっ滞は小児肝臓専門医にとって複雑な臨床的難題であり、特に遺伝性疾患については迅速な診断が求められる。本研究では、機械学習(ML)に基づく予測モデル「Jaundice Diagnosis Easy for Baby(JADE-B)」を構築し、胆汁うっ滞の遺伝的要因に罹患しやすい対象を同定することを目的とする。
方法:2006年から2018年にかけて、大学附属三次医療センターの統合医療データベースから患者データを抽出。肝疾患特異的な国際疾病分類コードを用いて胆汁うっ滞性疾患患者を同定。遺伝子疾患陽性予測のため、疾患特異的な遺伝子診断と表現型が一致する症例を定義基準とし、計47の臨床・検査パラメータを機械学習に用いた。ロジスティック回帰、XGBoost(XGB)、LightGBM(LGBM)、ランダムフォレストの4種類の分類器を用いてモデルを構築した。結果:1845例の患者プールから、胆汁うっ滞性肝疾患と診断された1歳未満の乳児1008例を解析対象とした。機械学習モデルの訓練には、関連する47の臨床・検査所見を網羅的に組み込んだ。5種類のモデル(モデル1~5)を構築し、それぞれROC曲線下面積0.869、0.884、0.855、0.852、0.836を達成した。発症時~1か月以内の20の簡便で広く利用可能な臨床パラメータを用いたJADE-Bモデルを構築し、遺伝性疾患患者の予測を行った。
結論:本機械学習モデルは、遺伝診断ツールの配分や患者紹介において胆汁うっ滞性乳児を優先的に特定するとともに、遺伝診断リソースの最適利用を実現する。
会員登録すると記事全文を読むことができるほか、「NEJM Journal Watch」や「国内論文フルテキスト」といった会員限定コンテンツを閲覧できます。
