导读 北京大学的研究人员对机器学习与疾病风险预测模型的统计方法集成进行了全面的系统综述,揭示了此类集成模型在临床诊断和筛查实践中的潜力。
北京大学的研究人员对机器学习与疾病风险预测模型的统计方法集成进行了全面的系统综述,揭示了此类集成模型在临床诊断和筛查实践中的潜力。这项研究由北京大学公共卫生学院流行病学与生物统计学系孙峰教授领导,已发表在《健康数据科学》上。
疾病风险预测对于早期诊断和有效的临床决策至关重要。然而,传统的统计模型,如逻辑回归和 Cox 比例风险回归,往往面临局限性,因为其基本假设在实践中可能并不总是成立。
与此同时,尽管机器学习方法具有灵活性,能够处理复杂和非结构化数据,但在某些情况下,其性能并未始终优于传统模型。为了应对这些挑战,将机器学习与传统统计方法相结合可能会提供更稳健、更准确的预测模型。
该系统评价分析了分类和回归模型的各种集成策略,包括多数表决、加权表决、堆叠和模型选择,这些策略基于统计方法和机器学习的预测是否不一致。研究发现,集成模型单独使用时通常优于统计和机器学习方法。例如,堆叠对于涉及 100 多个预测因子的模型特别有效,因为它允许结合不同模型的优势,同时最大限度地减少弱点。
高级研究员孙峰教授表示:“我们的研究结果表明,将机器学习融入传统统计方法可以为疾病风险预测提供更准确、更通用的模型。这种方法有可能增强临床决策并改善患者预后。”
展望未来,研究团队计划进一步验证和改进现有的整合方法,并开发全面的工具来评估这些模型在各种临床环境中的表现。最终目标是建立更高效、更通用的整合模型,以适应不同的场景,最终促进临床诊断和筛查实践。