心血管医学论文提纲

2022-11-15 版权声明 我要投稿

论文题目:基于医学大数据的心血管慢病风险精准建模

摘要:心血管病是全球死亡和致残的主要病因,而中国已成为全球心血管病死亡人数最多的国家。据国家心血管中心统计,2019年我国约有3.3亿心血管病患者,每5例死亡中就有2例死于心血管病。心血管病往往是多种危险因素协同作用的结果,早发现、早治疗是心血管病防控的关键。疾病风险评估是早期识别心血管病高危人群的一种有效手段,国内外相继发布了多个心血管病风险评估量表,但在其他人群上的适用性一直存在质疑。传统心血管病风险评估量表的建立多数是基于前瞻性研究,但其耗时耗力。随着医疗信息化建设的不断推进,积累了海量的医学数据,为挖掘潜在的危险因素提供了数据支持。大数据技术在医学和临床上的应用得到广泛关注,然而,医学数据质量和数据标准上的不足制约了医学大数据的发展及应用。因此,本文从区域卫生信息平台的历史存量数据出发,研究临床电子病历数据的处理与分析技术,以及基于电子病历数据的心血管病风险建模方法,主要研究内容如下:首先,针对临床电子病历数据存在的高噪声、数据缺失以及非结构化文本等问题,研究医学数据处理与分析技术,构建高质量的电子病历数据集,为建立高精度的心血管病风险预测模型奠定了数据基础。针对中文诊断文本存在的临床术语不规范、高噪声等问题,提出了基于相似性计算的疾病诊断自动编码方法,覆盖率达80%以上;针对医学影像检查诊断大量缺失的问题,提出了基于卷积神经网络的医学文本分类方法,二分类实验AUC值达0.998,实现了疾病种类的自动填充;针对药品名称混用和实验室检验结果不规范的问题,建立了药物字典和检验项目匹配规则,实现了16种心血管领域疾病的药物归类和5000万条检验记录的结构化。最终,建立了分别包含25万名高血压建档患者和9万名糖尿病建档患者的两个高质量电子病历数据集。其次,针对心血管病风险评估量表精度不足的问题,研究基于临床电子病历数据的疾病风险建模方法,以挖掘重要危险因素及其与心血管事件发生的复杂关系。本论文从数据完整性较高的高血压建档患者出发,选取患病人数最多的冠心病进行研究。基于历史存量电子病历数据构建了多时点趋势特征,并融合传统危险因素,建立了高血压患者三年冠心病风险预测模型,AUC值达0.943。与传统风险评估量表在独立验证集上进行了性能对比,所建模型的预测性能更好,AUC值提高了0.15。研究发现生理参数的趋势特征对模型预测性能具有显著影响,并分析了其与冠心病事件发生的非线性相关性。再次,围绕心血管病风险建模和潜在危险因素发现,本论文又选取了脑血管病中的脑卒中做进一步研究。除传统危险因素外,构造了一些具有临床意义的特征(如脉压差、血压变异性等),建立了高血压患者三年脑卒中风险预测模型,AUC值达0.922。与传统风险评估量表在独立验证集上进行了性能对比,所建模型的预测性能更好,AUC值提高了0.17。分析结果再次验证了血压趋势特征对心血管病事件的非线性效应,这将为高血压患者的科学管理提供指导。然后,针对已有的肾衰竭风险预测模型依赖于知晓率较低的慢性肾脏病预先确诊的问题,研究一般人群的肾衰竭风险预测方法。肾衰竭增加了心血管病的死亡风险,肾衰竭患者中约有50%的死亡是由心血管疾病引起的。本论文从高血压和糖尿病建档患者出发,融合实验室检验、生理监测以及临床诊疗等多模态数据,建立了三年肾衰竭风险预测模型,AUC值达0.914,将肾衰竭风险预测扩展到慢病人群。研发发现了一些肾衰竭的新生物标志物(如谷丙转氨酶、谷草转氨酶等),可以应用于更广泛的肾脏病早筛,并分析了与肾衰竭发生的非线性作用。最后,对本文工作进行了总结并明确了未来的研究方向。

关键词:医学大数据;心血管病;风险预测;机器学习

学科专业:计算机应用技术

摘要

Abstract

第1章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 心血管病风险评估

1.2.2 医学大数据在临床上的应用

1.2.3 区域卫生信息化建设

1.3 相关技术介绍

1.3.1 词嵌入

1.3.2 机器学习算法

1.3.3 性能评价指标

1.4 主要研究内容与创新点

1.4.1 主要研究内容

1.4.2 创新点

1.5 课题来源及论文结构

第2章 数据基础与预处理

2.1 实验平台搭建

2.2 数据来源及采集

2.3 数据预处理

2.3.1 数据清洗

2.3.2 中文疾病诊断自动编码

2.3.3 检查诊断文本缺失填充

2.3.4 药物记录结构化

2.3.5 检验数据结构化

2.4 数据概况

2.5 本章小结

第3章 基于电子病历的高血压患者冠心病风险预测

3.1 引言

3.2 数据描述

3.2.1 目标人群筛选

3.2.2 特征提取与处理

3.3 建模过程及结果分析

3.3.1 基本特征统计分析

3.3.2 模型性能比较

3.3.3 特征重要性分析

3.3.4 所建立模型与传统评估模型比较

3.4 讨论

3.4.1 特征变量与冠心病发病风险的非线性分析

3.4.2 特征集大小对模型性能的影响

3.4.3 研究队列规模对模型性能的影响

3.4.4 冠心病患者的持续随访时长分析

3.5 本章小结

第4章 基于电子病历的高血压患者脑卒中风险预测

4.1 引言

4.2 数据描述

4.2.1 目标人群筛选

4.2.2 特征提取

4.3 建模过程及结果分析

4.3.1 分层抽样

4.3.2 基本特征统计分析

4.3.3 模型性能比较

4.3.4 特征重要性分析

4.4 讨论

4.4.1 连续变量与脑卒中发病的非线性效应

4.4.2 模型结果与已有研究结果的对比

4.5 本章小结

第5章 基于多模态医学数据的慢病人群肾衰竭风险预测

5.1 引言

5.2 数据描述

5.2.1 研究队列确定

5.2.2 特征提取与处理

5.3 慢病人群三年肾衰竭风险建模

5.3.1 基本特征统计分析

5.3.2 模型性能对比

5.3.3 特征重要性分析

5.4 讨论

5.4.1 连续变量对肾衰竭发病的非线性影响

5.4.2 样本不均衡对模型的影响

5.4.3 模型结果与已有研究结果的对比

5.5 本章小结

第6章 总结与展望

6.1 本文主要工作

6.2 未来工作展望

参考文献

致谢

上一篇:技术溢出与国际贸易论文提纲下一篇:口腔门诊现场管理论文提纲

热门文章