子どもの健康に力を与える:エチオピアの5歳未満児の急性呼吸器感染症を予測するために、人口統計学と保健調査の知見を活用した機械学習の活用。
DOI:10.1186/s12879-024-09195-2
アブストラクト
背景:5歳未満児の死亡原因の大半は感染症であることが、多くの研究から明らかになっている。世界的に見ても、急性呼吸器感染症(ARI)は5歳未満児の疾病と死亡の原因として2番目に多い。エチオピアを含む開発途上国で最も大きな疾病負担となっているのは、依然としてARIである。
目的:本研究の目的は、エチオピアの5歳未満児におけるARIの程度と予測因子を、最新の機械学習アルゴリズムを用いて明らかにすることである。
方法:本研究のデータは、2016年エチオピア人口保健調査(Ethiopian Demographic and Health Survey)から得た。急性呼吸器感染症の決定因子を予測するために、10種類の機械学習アルゴリズム(ランダムフォレスト、決定木、サポートベクターマシン、ナイーブベイズ、K-ニアレストネイバーズ、ラッソ回帰、GBoost、XGboost)、1種類の古典的なロジスティック回帰モデル、および最もパフォーマンスの高いモデルのアンサンブルを含む複数の実験を行った。各機械学習モデルの予測能力は、受信者動作特性曲線、精度-再現率曲線、分類指標を用いて評価した。
結果:エチオピアの5歳未満児9501人のARI有病率は7.2%であった。SVM、GBoost、XGBoostのアンサンブルモデルの総合的な性能は、ARI症例の分類において、精度86%、感度84.6%、AUC-ROC 0.87という改善された性能を示した。最も高い性能を示した予測モデル(アンサンブルモデル)では、子どもの年齢、下痢の既往歴、富裕度指数、トイレの種類、母親の教育レベル、生活している子どもの数、母親の職業、使用している燃料の種類が、5歳未満児の急性呼吸器感染症の重要な予測因子であることが示された。
結論:5歳未満児のARIの複雑な要因が、高度な機械学習アルゴリズムを用いて特定された。子どもの年齢、下痢の既往歴、富の指数、トイレのタイプは、86%の精度を記録したアンサンブルモデルを用いて特定された上位要因のひとつであった。この研究は、低所得環境におけるARIの複雑性を解明する上で、高度なデータ駆動型方法論の可能性を示すものである。