电子病历与医学影像结合的心血管疾病风险预测评估系统的制作方法

专利2022-06-29  93


本发明属于医疗风险评估技术领域,尤其涉及一种电子病历与医学影像结合的心血管疾病风险预测评估系统。



背景技术:

本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。

心血管疾病严重危害人们的身心健康,损害人们的生活质量,威胁人们的家庭,经济乃至生命安全,因此心血管疾病的预防、风险评估、诊断和治疗都显得尤为重要。

目前心血管疾病的临床诊断主要依靠造影术和电子计算机断层扫描(ct)。

冠状动脉造影是诊断冠状动脉粥样硬化性心脏病(冠心病)的一种常用而且有效的方法。选择性冠状动脉造影就是利用血管造影机,通过特制定型的心导管经皮穿刺入下肢股动脉,沿降主动脉逆行至升主动脉根部,然后探寻左或右冠状动脉口插入,注入造影剂,使冠状动脉显影。这样就可清楚地将整个左或右冠状动脉的主干及其分支的血管腔显示出来,可以了解血管有无狭窄病灶存在,对病变部位、范围、严重程度、血管壁的情况等作出明确诊断,决定治疗方案(介入、手术或内科治疗),还可用来判断疗效。

ct是用x线束对人体某部一定厚度的层面进行扫描,由探测器接收透过该层面的x线,转变为可见光后,由光电转换变为电信号,再经模拟/数字转换器转为数字,输入计算机处理。从多层螺旋计算机斯层显像(msct)到双源计算机断层显像(dsct),已经可以清楚地观测到冠状动脉的血管,通过检测冠状动脉的钙化情况,预测冠状动脉是否存在狭窄以及狭窄的程度和部位。冠状动脉ct血管成像技术(cta)是在双源ct的技术基础上,在静脉注射对比剂后进行扫描,再经过计算机系统的处理重建得出心脏冠状动脉成像的一种无创性检查方法。冠状动脉ct血管成像技术是目前诊断冠心病的重要手段,它可以直接把冠状动脉血管显示出来,检测冠状动脉是否存在狭窄,有无钙化,以及狭窄的程度和部位等。

此外,血压测定、心电图检查、超声检查、核素心肌灌注等也是心血管疾病有效的辅助诊断手段,也有研究表明血脂检测,唾液检测,某些蛋白检测是心血管疾病风险评估的有效途径。

发明人发现,目前的心血管疾病风险评估仍然存在以下问题:

1)心血管疾病的诊断检查具有一定的盲目性,没有一种简单、便利的技术能帮人们做一个较为精准的疾病风险评估。

2)采用冠状动脉造影技术,属于有创检查手段,有可能产生并发症的风险,会对人的身体存在潜在威胁;而采用cta技术和冠状动脉造影,则价格昂贵。

3)现有技术的风险评估技术,并不能直接给出疾病诊断结果,这些检查结果只能作为疾病临床诊断的参考,临床医生会结合患者病情进行综合的分析,再明确诊断。这些技术的诊断结果较为复杂,即使有一定医学背景的人也无法进行精确的判断,必须对诊断结果进行再解读,如此一来,不仅大大浪费了医院的设备仪器资源,而且增加了医生,医护人员的负担。



技术实现要素:

本发明目的是为了解决现有技术的不足,提出了一种电子病历与医学影像结合的心血管疾病风险预测评估系统,利用医院以往体检者的电子病历信息和心脏彩超的医学影像信息,分别用机器学习的方法得出患病的概率,然后将两个概率融合起来,得出一个最终的预测概率;患者能够根据评估结果有针对性进行下一步的检测。

在一些实施方式中,采用如下技术方案:

一种电子病历与医学影像结合的心血管疾病风险预测评估系统,包括:

数据预处理模块,被配置为提取心脏彩超的结构化信息;

将电子病历的结构化特征字段与心脏彩超的结构化信息字段相关联,构建新的电子病历结构化数据;

同时,对心脏彩超的医学影像进行分类标记,剔除无用图像;

预测模型优化模块,被配置为对新的电子病历结构化数据进行分层抽样,将抽样的数据划分为选取训练集和测试集,对建立的电子病历预测模型进行训练优化;

对于心脏彩超的医学影像数据,关联对应电子病历训练集的pid创建医学影像的训练集,关联对应电子病历测试集的pid创建医学影像的测试集,对建立的心脏彩超预测模型进行训练优化;

预测结果融合模块,被配置为将电子病历预测模型和心脏彩超预测模型的预测结果进行融合,得到最终的心血管疾病风险预测评估结果。

在另一些实施方式中,采用如下技术方案:

一种终端设备,其包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行以下过程:

提取心脏彩超的结构化信息;

将电子病历的结构化特征字段与心脏彩超的结构化信息字段相关联,构建新的电子病历结构化数据;

同时,对心脏彩超的医学影像进行分类标记,剔除无用图像;

对新的电子病历结构化数据进行分层抽样,将抽样的数据划分为选取训练集和测试集,对建立的电子病历预测模型进行训练优化;

对于心脏彩超的医学影像数据,关联对应电子病历训练集的pid创建医学影像的训练集,关联对应电子病历测试集的pid创建医学影像的测试集,对建立的心脏彩超预测模型进行训练优化;

将电子病历预测模型和心脏彩超预测模型的预测结果进行融合,得到最终的心血管疾病风险预测评估结果。

与现有技术相比,本发明的有益效果是:

本发明将电子病历信息与心脏彩超的医学影像信息结合起来,建立了一个智能心血管疾病风险预评估系统;能够充分挖掘利用个体的电子病历信息和心脏彩超的影像信息,评估心血管疾病风险具有可信度。

利用电子病历和心脏彩超的医学影像信息进行心血管疾病的风险评估为个体提供了一个较为精准的预判,只有当个体被评估出患病概率较高时再进行专门的ct或冠状动脉造影检查,可以给个体一定的先验预判,避免盲目性。

电子病历和心脏彩超的医学影像都是体检的基本检查产生物,利用电子病历和心脏彩超的医学影像信息进行心血管疾病的风险评估便十分简单、便利、且具有实时性。

基本的体检检查并没有产生额外的费用,更加经济实惠,且相对ct和冠状动脉造影而言,更加安全可靠,几乎没有什么风险。

通过本发明系统进行风险评估,不仅避免了盲目的检查,而且减轻了医生的工作负担,能够使得医院的资源更加能够合理配置,物尽其用,人尽其才。

附图说明

图1为本发明实施例中对于心脏彩超的医学影像分类图;

图2为本发明实施例中系统整体框架示意图;

图3为本发明实施例中整体数据处理流程示意图。

具体实施方式

应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本发明使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。

实施例一

电子病历不仅指静态病历信息,还包括提供的相关服务。是以电子化方式管理的有关个人终生健康状态和医疗保健行为的信息,涉及病人信息的采集、存储、传输、处理和利用的所有过程信息。电子病历不仅特征化电子记录了人体的身体指标与健康状态,还涵盖了病史、检查、用药等多个维度的信息。挖掘其中的信息,关联抽取特征,不论对于疾病的科学研究还是辅助诊断决策都有着极其深远的意义。

心脏彩超是唯一能动态显示心腔内结构、心脏的搏动和血液流动的仪器,对人体没有任何损伤。心脏探头就像摄像机的镜头,将探头放在胸前来回移动,随着探头的转动,心脏的各个结构清晰地显示在屏幕上。它的主要作用是检查心脏的形态学有没有什么异常,以及心功能是否正常。心脏彩超也是唯一能直观显示瓣膜病变的仪器,通过彩超的测量,医生可了解瓣膜病变的程度以决定保守治疗还是手术治疗。

需要说明的是,本实施例数据涉及两类心血管疾病,一类是冠心病,包含冠状动脉粥样硬化性心脏病、心梗、缺血性心肌病、缺血性心脏病、急性冠脉综合症、无症状心肌缺血、心绞痛;另一类是心脏结构及功能疾病,包含先天性心脏病、风湿性心脏病、肺源性心脏病、心肌病(排除缺血性心肌病)、心脏瓣膜疾病(二尖瓣、三尖瓣、主动脉瓣、肺动脉瓣)、心室肥厚、心衰、高血压性心脏病、室间隔缺损、房间隔缺损。实验时仅使用了第一类心血管疾病的标签。

本实施例用于实验的数据包含电子病历信息和心脏彩超的医学影像两部分,来自深圳市南山医院,存储于华为云平台,共使用了9054个人的数据,其中检查结果有病的人群与无病的人群比例为1:1。所有电子病历数据均为个体最后一次心脏彩超检查之前的记录且数据中的个体均无心脏手术历史。

在一个或多个实施方式中,公开了一种电子病历与医学影像结合的心血管疾病风险预测评估系统,参照图2,包括:

(1)数据预处理模块,被配置为提取心脏彩超的结构化信息;

将电子病历的结构化特征字段与心脏彩超的结构化信息字段相关联,构建新的电子病历结构化数据;

同时,对心脏彩超的医学影像进行分类标记,剔除无用图像;

具体地,电子病历都为结构化数据,包含居民个人唯一标识(pid)、高血压(hitn)、糖尿病(dm)、高血脂(hlipid)、高尿酸血症(huric)、心律失常(ar)、房颤(af)、早搏(pb)、胸闷或胸痛(cpain)、头痛或头晕(hache)、冠心病标签,所有特征值要么为0(代表没有)要么为1(代表有);其中pid信息与心脏彩超的医学影像pid一致,可进行关联操作,其他特征信息都是与心血管疾病检查相关的重要指标。

心脏彩超不仅包含着医学影像这种非结构化信息,还有居民个人唯一标识(以下简称“pid”),出生日期,性别,影像编号,影像检查登记日期,影像文件名等结构化特征信息。

提取心脏彩超的结构化信息,具体为:

将出生日期和影像检查登记日期统一格式。以pid做分组,对每个pid提取影像检查登记日期的最大时间和最小时间;以2019年1月1日为基准时间,将设定的基准时间分别与出生日期和影像检查登记日期的最大时间做差,作为两个特征字段;另外用影像检查登记日期的最大时间和影像检查登记日期的最小时间做差作为第三个特征字段;然后以pid为单位,记录每个居民个人唯一标识的影像个数,作为第四个特征字段,每个pid都有这四个特征,所以每个特征都有最大值和最小值;对这四个特征字段都进行归一化处理。采用以下公式:

x=(x-x_min)/(x_max-x_min)

其中,x代表当前特征值;x_max代表此特征值的最大值;x_min代表此特征值的最小值。

最后,以pid为单位提取这4个特征字段外加性别特征字段组成新的结构化数据字段。

将电子病历的pid与新的医学影像结构化数据的pid相关联,合并组成新的电子病历结构化数据。新的结构化数据包括以下字段:pid,性别,基准时间与生日时间差值,基准时间与最大登记时间差值,检查登记时间差值,医学影像个数,高血压、糖尿病、高血脂、高尿酸血症、心律失常、房颤、早搏、胸闷或胸痛、头痛或头晕、以及冠心病标签16个特征字段。

对于心脏彩超的医学影像,首先进行5类(见图1)标记,第一类是心脏超声切面图,第二类是心脏超声切面相应的测量图;第三类是彩色多普勒血流显像图,第四类是彩色多普勒频谱图,第五类是无用图。5类影像图片各标记500张后,建立深度学习网络,让网络进行学习,输入所有影像,剔除第5类图像。然后分别抽取500个有病人群和500个无病人群,分别计算相应的影像类型比例,发现四类影像图片所占比例极其接近,所以,避免了偏差类别影像影响。

(2)预测模型优化模块,被配置为对新的电子病历结构化数据进行分层抽样,将抽样的数据划分为选取训练集和测试集,对建立的电子病历预测模型进行训练优化;

对于心脏彩超的医学影像数据,关联对应电子病历训练集的pid创建医学影像的训练集,关联对应电子病历测试集的pid创建医学影像的测试集,对建立的心脏彩超预测模型进行训练优化;

具体地,

1)对于新的电子病历结构化数据:

先对整体样本数据按冠心病标签特征进行分层抽样,将整体样本数据集分成9训练集:1测试集。其中,训练集的数据仍要以8比1的比例进行分层抽样,8份用以训练模型,1份用以充当验证集进行评估、调整。

其中,分层抽样是将整体样本数据按属性特征(冠心病标签)分成两层,一层是有病;一层是无病。然后分别在不同层中随机抽取数据,组合起来成为新的样本。新样本中有病数据和无病数据的比例与整体样本中有病数据和无病数据的比例一致。

本实施例将整体样本数据集分成9训练集:1测试集。可以看成将整个样本数据划分成2份,其中训练集样本是整体样本的十分之九,测试集样本是整体样本的十分之一,并且训练集样本和测试集样本都是采用分层抽样的方法,从整体样本数据中按冠心病标签分层抽取,所以在训练集样本和测试集样本中有病数据和无病数据的比例与整体样本中有病数据和无病数据的比例一致。同理,训练集的数据以8比1的比例分层抽样效果也一样。

接下来可以建立电子病历预测模型进行训练,本实施例使用了keras库中经典的xgboost模型进行训练,以验证集进行评估、调整,最后在测试集做最后的测试评估。

结果显示,此模型的正确率acc为0.6836,准确率precision为0.6673,召回率recall为0.7323,综合指标f1为0.6983,roc曲线下与坐标轴围成的面积auc为0.7658。

2)对于医学影像数据:

对于心脏彩超的医学影像数据,关联对应电子病历训练集的pid创建医学影像的训练集,关联对应电子病历验证集的pid创建医学影像的验证集,关联对应电子病历测试集的pid创建医学影像的测试集。

接下来可以建立心脏彩超预测模型进行训练,本实施例使用了inceptionv3模型对所有训练集所有影像图片进行训练,然后以验证集进行评估、调整。

同样地,进行微调后,最后以测试集做最后的测试评估,将测试集的影像图片以pid为单位进行测试评估,将每个pid对应的每张图片所得的预测概率值取平均作为此pid的预测概率结果。每个pid(即每个人)对应了很多影像图片,以人为单位,将此人的所有图片为输入,每张图片都会输出一个概率,最终取所有图片的平均值作为此人(pid)的医学影像预测结果。

结果显示,此模型的正确率acc为0.7358,准确率precision为0.7108,召回率recall为0.7942,综合指标f1为0.7502,roc曲线下与坐标轴围成的面积auc为0.8001。

(3)预测结果融合模块,被配置为将电子病历预测模型和心脏彩超预测模型的预测结果进行融合,得到最终的心血管疾病风险预测评估结果。

具体地,分别为电子病历预测模型的输出结果和心脏彩超预测模型的输出结果分配设定的权重,将两者的输出结果分别乘以设定的权重后求和,得到最终的心血管疾病概率预测结果。

本实施例将电子病例和医学影像结合构建一个实时的心血管疾病预评估系统,方便进行无额外成本、实时便利的心血管疾病风险预评估,根据预测结果确定是否需要进行专门的检查。

需要说明的是,本实施例中,电子病历预测模型和心脏彩超预测模型可以根据实际需要进行选择,不局限于本实施例中给出的预测模型。

实施例二

在一个或多个实施方式中,公开了一种终端设备,其包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,参照图3,所述指令适于由处理器加载并执行以下过程:

提取心脏彩超的结构化信息;

将电子病历的结构化特征字段与心脏彩超的结构化信息字段相关联,构建新的电子病历结构化数据;

同时,对心脏彩超的医学影像进行分类标记,剔除无用图像;

对新的电子病历结构化数据进行分层抽样,将抽样的数据划分为选取训练集和测试集,对建立的电子病历预测模型进行训练优化;

对于心脏彩超的医学影像数据,关联对应电子病历训练集的pid创建医学影像的训练集,关联对应电子病历测试集的pid创建医学影像的测试集,对建立的心脏彩超预测模型进行训练优化;

将电子病历预测模型和心脏彩超预测模型的预测结果进行融合,得到最终的心血管疾病风险预测评估结果。

上述过程的具体实现方式与实施例一中公开的各模块的工作过程相同,不再赘述。

上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。


技术特征:

1.一种电子病历与医学影像结合的心血管疾病风险预测评估系统,其特征在于,包括:

数据预处理模块,被配置为提取心脏彩超的结构化信息;

将电子病历的结构化特征字段与心脏彩超的结构化信息字段相关联,构建新的电子病历结构化数据;

同时,对心脏彩超的医学影像进行分类标记,剔除无用图像;

预测模型优化模块,被配置为对新的电子病历结构化数据进行分层抽样,将抽样的数据划分为选取训练集和测试集,对建立的电子病历预测模型进行训练优化;

对于心脏彩超的医学影像数据,关联对应电子病历训练集的唯一标识创建医学影像的训练集,关联对应电子病历测试集的唯一标识创建医学影像的测试集,对建立的心脏彩超预测模型进行训练优化;

预测结果融合模块,被配置为将电子病历预测模型和心脏彩超预测模型的预测结果进行融合,得到最终的心血管疾病风险预测评估结果。

2.如权利要求1所述的一种电子病历与医学影像结合的心血管疾病风险预测评估系统,其特征在于,提取心脏彩超的结构化信息,具体为:

将出生日期和影像检查登记日期统一格式;

以居民个人唯一标识做分组,对每个居民个人唯一标识提取影像检查登记日期的最大时间和最小时间;

将设定的基准时间分别与出生日期和影像检查登记日期的最大时间做差,作为两个特征字段;用影像检查登记日期的最大时间和影像检查登记日期的最小时间做差作为第三个特征字段;

以居民个人唯一标识为单位,记录每个居民个人唯一标识的影像个数,作为第四个特征字段;

对上述特征字段进行归一化处理,以居民个人唯一标识为单位,提取上述特征字段外加性别特征字段组成心脏彩超的结构化数据。

3.如权利要求1所述的一种电子病历与医学影像结合的心血管疾病风险预测评估系统,其特征在于,将电子病历的结构化特征字段与心脏彩超的结构化信息字段相关联,构建新的电子病历结构化数据;具体为:

将电子病历的居民个人唯一标识与心脏彩超结构化数据的居民个人唯一标识相关联,合并组成新的电子病历结构化数据;新的电子病历结构化数据包括:居民个人唯一标识,性别,基准时间与生日时间差值,基准时间与最大登记时间差值,检查登记时间差值,医学影像个数,高血压、糖尿病、高血脂、高尿酸血症、心律失常、房颤、早搏、胸闷或胸痛、头痛或头晕和冠心病标签特征字段。

4.如权利要求1所述的一种电子病历与医学影像结合的心血管疾病风险预测评估系统,其特征在于,对心脏彩超的医学影像进行分类标记,具体为:

对于心脏彩超的医学影像,进行分类标记,所述类别包括:心脏超声切面图、心脏超声切面相应的测量图、彩色多普勒血流显像图、彩色多普勒频谱图、以及无用图。

5.如权利要求1所述的一种电子病历与医学影像结合的心血管疾病风险预测评估系统,其特征在于,所述电子病历预测模型和心脏彩超预测模型根据实际需要选取。

6.如权利要求1所述的一种电子病历与医学影像结合的心血管疾病风险预测评估系统,其特征在于,将电子病历预测模型和心脏彩超预测模型的预测结果进行融合,具体为:

分别为电子病历预测模型的输出结果和心脏彩超预测模型的输出结果分配设定的权重,将两者的输出结果分别乘以设定的权重后求和,得到最终的心血管疾病概率预测结果。

7.一种终端设备,其包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,其特征在于,所述指令适于由处理器加载并执行以下过程:

提取心脏彩超的结构化信息;

将电子病历的结构化特征字段与心脏彩超的结构化信息字段相关联,构建新的电子病历结构化数据;

同时,对心脏彩超的医学影像进行分类标记,剔除无用图像;

对新的电子病历结构化数据进行分层抽样,将抽样的数据划分为选取训练集和测试集,对建立的电子病历预测模型进行训练优化;

对于心脏彩超的医学影像数据,关联对应电子病历训练集的pid创建医学影像的训练集,关联对应电子病历测试集的pid创建医学影像的测试集,对建立的心脏彩超预测模型进行训练优化;

将电子病历预测模型和心脏彩超预测模型的预测结果进行融合,得到最终的心血管疾病风险预测评估结果。

技术总结
本发明公开了一种电子病历与医学影像结合的心血管疾病风险预测评估系统,包括:数据预处理模块,将电子病历的结构化特征字段与心脏彩超的结构化信息字段相关联,构建新的电子病历结构化数据;预测模型优化模块,被配置为对新的电子病历结构化数据进行分层抽样,将抽样的数据划分为选取训练集和测试集,对建立的电子病历预测模型进行训练优化;预测结果融合模块,被配置为将电子病历预测模型和心脏彩超预测模型的预测结果进行融合,得到最终的心血管疾病风险预测评估结果。本发明将电子病历信息与心脏彩超的医学影像信息结合起来,能够充分挖掘利用个体的电子病历信息和心脏彩超的影像信息,评估心血管疾病风险具有可信度。

技术研发人员:胡咏梅;杨舜翔;杨博凯;左英男;蔡云鹏
受保护的技术使用者:山东大学
技术研发日:2020.01.14
技术公布日:2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-14469.html

最新回复(0)