本发明涉及心脏疾病的检测领域,特别是涉及基于人工智能模型的心脏疾病的检测方法。
背景技术:
心脏疾病是一种比较常见的循环系统疾病,包括风湿性心脏病、高血压性心脏病、心肌炎和冠心病等,是一种高死亡率的疾病,心脏病给患者家庭带来了巨大的经济负担和生活灾难。世界卫生组织指出:在最易导致人类死亡的十大疾病当中,心脏疾病居于首位。然而,如果能对心脏疾病患者进行早期确诊,针对不同患者尽早采取有效必要的治疗手段,可以避免心脏病的突发造成的灾难性后果;因此,针对性地开展待测人员多病理特征的指标数据的获取,有效地进行心脏病的早期干预和治疗,对当前心脏疾病的检测和治疗具有重要的意义。
对待测人员多病理特征的指标数据的获取上,现有技术还有以下问题亟需解决:(1)对待测人员多病理特征的指标数据信息挖掘利用上,依然难以对连续的心脏动态信号进行基于人工智能模型的处理分析;(2)在对待测人员心脏电活动的动态病理特征的分析过程中,挖掘的动态病理信息和静态病理信息过于有限,无法全面客观地反映复杂的心脏电活动过程,不利于医生后期对待测人员的心脏疾病病情进行早期干预或进一步的精准治疗。
因此,有必要提供改进的技术方案以克服现有技术中存在的技术问题。
技术实现要素:
本发明提供一种基于人工智能模型的心脏疾病的检测方法,包括构建心电向量图和心电非线性系统动态图的深度学习识别模型及构建心脏动态病理特征的量化数据、生物化学数据、人体生理信息数据和临床信息数据的机器学习分类模型等,并对不同模型识别分类所得心脏疾病结果赋以相应权重值,获得心脏疾病检测的综合判定结果。本发明提供的心脏疾病的检测方法,解决了心脏电活动连续的动态信号的模型处理方法、多病理特征量化数据的模型化分析及相同疾病在不同模型下的融合判断等方面的技术难题。本发明所述心脏疾病的检测方法提升了心脏疾病检测的准确率和检测效率,且随着扩充进数据库中不同类型病理特征的指标数据的增多,诊断效果会随之不断提升。
为了实现前述目的,本发明一方面提供一种基于人工智能模型的心脏疾病的检测方法,包括以下步骤:
步骤s1.获取特定心脏疾病多病理特征的指标数据,所述特定心脏疾病多病理特征的指标数据包括心脏动态病理特征的量化数据、心电向量图图像特征的指标数据和心电非线性系统动态数据中的一种或几种;
步骤s2.对步骤s1获取的所述特定心脏疾病多病理特征的指标数据进行机器学习,获取特定心脏疾病的机器学习判定模型。
在至少一个实施方式中,在如前所述的基于人工智能模型的心脏疾病的检测方法中,步骤s1所述心脏动态病理特征的量化数据包括:几何特征的量化指标数据、非线性动力学特征的量化指标数据、模型特征的量化指标数据、时域特征的量化指标数据和频域特征的量化指标数据中的一种或几种;优选地,步骤s1所述特定心脏疾病多病理特征的指标数据还包括辅助病理特征的量化指标数据、人体生理信息数据和临床信息数据中的一种或几种;更优选地,所述辅助病理特征的量化指标数据包括ecg形态指标的量化数据、和/或心电图图像特征的指标数据、和/或生物化学数据。
在至少一个实施方式中,在如前所述的基于人工智能模型的心脏疾病的检测方法中,步骤s2所述特定心脏疾病的机器学习判定模型包括支持向量机、卷积神经网络、循环神经网络、贝叶斯分类器、k近邻算法、k均值算法、线性回归、逻辑回归、多元非线性回归拟合方法、adaboost算法、隐马尔可夫模型、极限学习机、随机森林算法、决策树算法、聚类算法、生成式对抗网络、堆叠自动编码器、全连接网络、无监督预训练网络、深度信念网络、深度玻尔兹曼机和神经张量网络中的至少一种;
在至少一个实施方式中,在如前所述的基于人工智能模型的心脏疾病的检测方法中,步骤s2所述特定心脏疾病的机器学习判定模型包括机器学习分类模型和深度学习识别模型;输入到所述机器学习分类模型的数据包括所述心脏动态病理特征的量化数据,输入到所述深度学习识别模型的数据包括所述心电向量图图像特征的指标数据和心电非线性系统动态数据;优选地,输入到所述机器学习分类模型的数据还包括辅助病理特征的量化指标数据、人体生理信息数据和临床信息数据中的一种或几种;更优选地,所述机器学习分类模型选自支持向量机、贝叶斯分类器、k近邻算法、k均值算法、线性回归、逻辑回归、多元非线性回归拟合方法、adaboost算法、隐马尔可夫模型、极限学习机、随机森林算法、决策树算法、和聚类算法中的至少一种,所述深度学习识别模型选自卷积神经网络、循环神经网络、生成式对抗网络、堆叠自动编码器、全连接网络、无监督预训练网络、深度信念网络、深度玻尔兹曼机和神经张量网络中的至少一种。
在至少一个实施方式中,在如前所述的基于人工智能模型的心脏疾病的检测方法中,还包括步骤s3:获取待测人员的多病理特征的指标数据,输入到步骤s2所述特定心脏疾病的机器学习判定模型,得到特定心脏疾病的检测结果;其中,所述待测人员的多病理特征的指标数据包括待测人员的心脏动态病理特征的量化数据、心电向量图图像特征的指标数据和心电非线性系统动态数据中的一种或几种。
在至少一个实施方式中,在如前所述的基于人工智能模型的心脏疾病的检测方法中,步骤s3所述待测人员多病理特征的指标数据还包括待测人员的辅助病理特征的量化指标数据、人体生理信息数据和临床信息数据中一种或几种;优选地,步骤s3所述待测人员的辅助病理特征的量化指标数据包括ecg形态指标的量化数据、和/或生物化学数据;优选地,步骤s3所述特定心脏疾病的检测结果还包含使用所述待测人员多病理特征的指标数据分别进行特定心脏疾病判定,得到待测人员心脏疾病的指标判定结果;更优选地,所述心脏疾病的检测方法还包括将步骤s2所述特定心脏疾病的机器学习判定模型的输出结果和所述待测人员心脏疾病的指标判定结果赋以权重值进行心脏疾病检测,得到待测人员心脏疾病的综合判定结果;其中,所述待测人员的心脏疾病的指标判定结果包含所述待测人员的心脏动态病理特征的量化数据的特定心脏疾病的判定信息、所述待测人员的辅助病理特征的量化指标数据的特定心脏疾病的判定信息、所述待测人员的人体生理信息数据的特定心脏疾病的判定信息和所述待测人员的临床信息数据的特定心脏疾病的判定信息中的一种或几种;更优选地,步骤s2所述特定心脏疾病的机器学习判定模型的输出结果还包括机器学习分类模型的输出结果和深度学习识别模型的输出结果,且对所述机器学习分类模型的输出结果和深度学习识别模型的输出结果赋以权重值。
在至少一个实施方式中,在如前所述的基于人工智能模型的心脏疾病的检测方法中,,步骤s3所述待测人员的心脏动态病理特征的量化数据包括:待测人员的心电非线性系统动态的几何特征的量化指标数据、非线性动力学特征的量化指标数据、模型特征的量化指标数据、时域特征的量化指标数据和频域特征的量化指标数据中的一种或几种。
本发明另一方面提供一种基于人工智能模型的心脏疾病的检测方法,包括以下步骤:
步骤1.采集待测人员的多病理特征的指标数据,所述待测人员的多病理特征的指标数据包括待测人员的心脏动态病理特征的量化数据、和/或待测人员的心电向量图图像特征的指标数据、和/或待测人员的心电非线性系统动态数据、和/或待测人员的辅助病理特征的量化指标数据、和/或待测人员的人体生理信息数据、和/或待测人员的临床信息数据;
其中,所述待测人员的心脏动态病理特征的量化数据包括:待测人员的心电非线性系统动态的几何特征的量化指标数据、非线性动力学特征的量化指标数据、模型特征的量化指标数据、时域特征的量化指标数据和频域特征的量化指标数据中的一种或几种;
步骤2.将步骤1采集的待测人员的多病理特征的指标数据,输入到特定心脏疾病的机器学习判定模型;
步骤3.输出特定心脏疾病检测结果,所述特定心脏疾病检测结果包含步骤2所述特定心脏疾病的机器学习判定模型的输出结果。
在至少一个实施方式中,在如前所述的基于人工智能模型的心脏疾病的检测方法中,步骤3所述特定心脏疾病的检测结果还包含所述待测人员心脏动态病理特征的量化数据的特定心脏疾病的阈值判定信息、和/或所述待测人员的辅助病理特征的量化指标数据的特定心脏疾病的阈值判定信息、和/或所述待测人员临床信息数据的特定心脏疾病的判定信息;优选地,步骤3所述特定心脏疾病的检测结果还包含对步骤3所述特定心脏疾病的机器学习判定模型的输出结果信息、和/或所述待测人员心脏动态病理特征的量化数据的特定心脏疾病的判定信息、和/或所述待测人员的辅助病理特征的量化指标数据的特定心脏疾病的判定信息、和/或所述待测人员的人体生理信息数据的特定心脏疾病的判定信息、和/或所述待测人员的临床信息数据的特定心脏疾病的判定信息赋以适应心脏疾病的权重值。
本发明再一方面提供一种心脏疾病的检测产品,所述检测产品使用了如前所述的基于人工智能模型的心脏疾病的检测方法。
本发明再一方面提供一种如前所述的心脏疾病的检测产品在疾病检测上的应用。
本发明所述心脏疾病的检测方法,具有以下的技术效果:
1)采用机器学习的技术,可完成特征的自动提取和智能诊断,具备较高的准确性,并且随着扩充进数据库中心脏多病理特征的指标数据的增多,其诊断效果会随之不断提升。
2)考量的心电非线性系统的动态病理信息特征更加丰富,检测的准确性和检测效率等方面的性能有了明显的提高,并可对连续的动态信号进行处理,有利于医生后期对待测人员的心脏疾病病情进行早期干预和精准治疗。
3)诊断过程中无需专业医生的介入,普通用户可以简单方便地完成自我诊断、自我监测,也可以作为计算机辅助诊断系统部署在社区医院或乡镇医院等缺少专业医生的场所。
附图说明
参照附图来说明本发明的公开内容。应当了解,这些附图仅仅用于说明的目的,而并非意在对本发明的保护范围构成限制。
图1显示本发明的构建机器学习判定模型的流程图;
图2显示本发明的机器学习判定模型的辅助检测流程图。
具体实施方式
下列实施例中未注明具体条件的实验方法,通常按照国家标准测定。若没有相应的国家标准,则按照通用的国际标准、常规条件、或按照制造厂商所建议的条件进行。
在本发明中,如果没有特别的说明,本文所提到的所有实施方式以及优选实施方式可以相互组合形成新的技术方案。
在本发明中,如果没有特别的说明,本文所提到的所有技术特征以及优选特征可以相互组合形成新的技术方案。
在本发明中,如果没有特别的说明,本文所提到的心电图图像特征的指标数据包括但不限于心电图、预处理的心电图、截取的心电图、ecg形态指标的量化数据和心电数据;预处理的心电图包括但不限于压缩的心电图、改变对比度的心电图、或放大的心电图等;截取的心电图包括但不限于存在于心电图上任意大小和任意形状的一部分。心电数据是指将包括但不限于单导联心电数据、12导联心电数据或多导联心电数据。
在本发明中,如果没有特别的说明,本文所提到的心电向量图图像特征的指标数据包括但不限于心电向量图、预处理的心电向量图、截取的心电向量图和心电向量数据;预处理的心电向量图包括但不限于压缩的心电向量图、改变对比度的心电向量图、或放大的心电向量图等;截取的心电向量图包括但不限于存在于心电向量图上任意大小和任意形状的一部分。心电向量数据是指将心电数据经过转换后获得的多维心电数据集,所述转换包括但不限于将12导联或多导联心电数据转换为三维的数据、或者是12导联或多导联心电数据转换为多维的数据。
在本发明中,如果没有特别的说明,本文所提到的心电非线性系统动态数据包括但不限于心电非线性系统动态图、心电动力学图、预处理的心电动力学图、截取的心电动力学图和心电动力学数据;预处理的心电动力学图包括但不限于压缩的心电动力学图、改变对比度的心电动力学图、或放大的心电动力学图等;截取的心电动力学图包括但不限于存在于心电动力学图上任意大小和任意形状的一部分。心电动力学数据是指将心电向量数据经过波、段或间期的截取后,然后通过建模方法而获取的多维数据。
在本发明中,如果没有特别的说明,本文所提到的待测人员包括但不限于医院待测人员、体检人员和心脏疾病患者等。
在本发明中,如果没有特别的说明,本文所提到的几何特征的量化指标数据、非线性动力学特征的量化指标数据、模型特征的量化指标数据、时域特征的量化指标数据和频域特征的量化指标数据,都是用于反映心脏动态病理特征。几何特征包括但不限于趋势、斜率、方向、形状、圆形度、球状度、均匀率、离心率、变异率和角度中的一种或几种;非线性动力学特征包括但不限于熵、复杂度、关联维、李雅普诺夫指数谱、最大李雅普诺夫指数谱中的一种或几种;所述的熵优选为信息熵、小波熵、或近似熵;所述的复杂度优选为c0复杂度、kolmogorov复杂度、或lz复杂度;模型特征包括但不限于ar模型系数,或tvar模型特征;时频特征包括但不限于短时傅里叶变换特征、小波变换特征、或二者的组合;频域特征包括但不限于快速傅里叶变换特征。
在本发明中,如果没有特别的说明,本文所提到的心脏动态病理特征的量化数据的特定心脏疾病的阈值判定信息包括心电非线性系统动态的几何特征的量化指标数据的特定心脏疾病的阈值判定、非线性动力学特征的量化指标数据的特定心脏疾病的阈值判定、模型特征的量化指标数据的特定心脏疾病的阈值判定、时域特征的量化指标数据的特定心脏疾病的阈值判定和频域特征的量化指标数据的特定心脏疾病的阈值判定中的一种或几种。
在本发明中,构建机器学习判定模型的机器学习方法,采用了包括但不限于支持向量机、卷积神经网络、循环神经网络、贝叶斯分类器、k近邻算法、k均值算法、线性回归、逻辑回归、多元非线性回归拟合方法、adaboost算法、隐马尔可夫模型、极限学习机、随机森林算法、决策树算法、聚类算法、生成式对抗网络、堆叠自动编码器、全连接网络、无监督预训练网络、深度信念网络、深度玻尔兹曼机和神经张量网络等方法中的一种或几种。
在本发明中,如果没有特别的说明,本文所提到的基于人工智能模型的心脏疾病的检测方法可用在心脏疾病检测的穿戴设备等疾病检测的人工智能设备中。
以下结合具体实施例,对本发明作进一步说明。应理解,以下优选的实施例仅用于说明本发明而非用于限定本发明的范围。
实施例1.样本集构建和样本数据的预处理
1.样本集的建立
对用于机器学习判定模型的样本集数据进行了构建,具体构建方法如下:
(1)样本集的构成:纳入n个临床已知心脏健康个体(n>500)以及m个临床已知某种心脏疾病个体(m>1000)作为样本人群;采集与特定心脏疾病相关的样本人群的有关病理数据,作为样本集数据。
(2)样本标签的设定:采用心脏疾病的金标准指标的指标数据以及专家共识作为样本数据的标签。
2.样本数据的预处理
在获得前述样本集数据之后,对样本集数据进行预处理:对获得的样本数据进行滤波或批量归一化等预处理,根据不同的数据要求进行数据加工,获得符合要求的样本数据;在此处,对于心肌缺血检测的样本数据,要求采集的样本数据是10s的心电数据,10s的心电数据的时间处理需满足心电数据通用的规范性要求。心电数据的预处理是指常规滤波操作,以使随后的操作充分稳定和可靠,使用何种滤波方法并不影响本发明方法的有效性。
实施例2.特定心脏疾病有关属性的多种病理特征的量化指标数据的获取
在获得实施例1中预处理的样本集数据后,进行特定心脏疾病有关属性的多种病理特征的量化指标数据的获取。心脏疾病有关属性的多种病理特征的量化指标数据包括心脏动态病理特征的量化数据、和/或心电向量图图像特征的指标数据、和/或心电非线性系统动态数据、和/或辅助病理特征的量化指标数据、和/或人体生理信息数据、和/或临床信息数据等;具体的操作过程按照以下步骤进行:
(一)主要病理特征的量化指标数据的获取及其对应心脏疾病的阈值判定标准
主要病理特征的量化指标数据指的是心脏动态病理特征的量化数据、和/或心电向量图图像特征的指标数据、和/或心电非线性系统动态数据等。
在实施例中,心脏动态病理特征的量化数据包括但不限于几何特征的量化指标数据、和/或非线性动力学特征的量化指标数据、和/或模型特征的量化指标数据、和/或时域特征的量化指标数据、和/或频域特征的量化指标数据。
以下为具体心脏动态病理特征的量化数据的获取方法,仅用于举例说明,不限定于举例说明所述获取方法或量化数据。
对于几何特征的量化指标的一种,记为
对于心电向量图图像特征的指标数据,采集带标签的心脏电信号数据e(t),t=1,2,…t,将采集的心脏电信号数据进行预处理,然后进行转换获得心电向量图(vcg)(见korsj.a.等在1990年发表在europeanheartjournal杂志的11(12):1083的论文所述),并获得对应的心电向量数据x(t)、y(t)和z(t);根据标签将心电向量图按照特定心脏疾病的严重程度分为无、轻度、中度、重度4级量化,分别赋值0、1、2、3。
对于心电非线性系统动态数据,采集带标签的心脏电信号数据e(t),t=1,2,…t;将采集的心脏电信号数据进行滤波和基线漂移等预处理,然后将心脏电信号数据或心电向量数据采用数学运算方法获得心脏电信号数据或心电向量数据的神经网络模型,进行计算得到心电非线性系统动态数据:
(二)辅助病理特征的量化指标数据的获取及其对应心脏疾病的阈值判定标准
在本发明中,辅助病理特征的量化指标数据,是指用于辅助性地反映心脏疾病病理特征属性的量化数值。
辅助病理特征的量化指标数据,包括但不限于心电图图像特征的指标数据、和/或生物化学数据;心电图图像特征的指标数据包括ecg形态指标的量化数据,ecg形态指标的量化数据包括但不限于p波振幅值、st段抬高值、st段压低值和u波振幅值。以下是辅助病理特征量化指标数据的具体提取方法:
1.ecg形态指标的量化数据及对应心脏疾病的阈值判定标准
通过普通心电图机即可获取心电数据,根据2009年心电图标准化及解析指南(wagnergs,macfarlanep,wellensh,etal.aha/accf/hrsrecommendationsforthestandardizationandinterpretationoftheelectrocardiogram:partvi:acuteischemia/infarction:ascientificstatementfromtheamericanheartassociationelectrocardiographyandarrhythmiascommittee,councilonclinicalcardiology;theamericancollegeofcardiologyfoundation;andtheheartrhythmsociety[j].jamcollcardiol,2009,53:1003),不同疾病对应不同的指标参数判定信息。如心肌梗死伴完全性左束支传导阻滞,心肌梗死伴完全性左束支传导阻滞的诊断标准:(a)qrs波主波向上导联st段抬高≥0.1mv;(b)v1-v3导联st段压低≥0.1mv,使s波显著;上两条为st段的一致性改变。(c)qrs波主波向下导联st段抬高≥0.5mv,称为不协调的st段改变。
2.生物化学数据及对应心脏疾病的阈值判定标准
在心血管疾病中,检测采用的生物化学指标包括但不限于高敏c反应蛋白、和心肌酶等,对应的实验数据通过常规的医院体检即可获得。
a.高敏c反应蛋白:≥2mg/l有较大风险罹患心血管疾病。
b.心肌酶:急性心肌梗死时,因心肌细胞坏死会释放出心肌内多种酶,包括天门冬氨酸氨基转移酶(ast)、乳酸脱氢酶(ld或ldh)、肌酸激酶(ck)及同工酶、a-羟丁酸脱氢酶(a-hbd)等。
c.其它生化指标:包括但不限于肌红蛋白、肌酸激酶同工酶、c反应蛋白、甘三脂、高密度脂蛋白、低密度脂蛋白和乳酸脱氢酶等,也会被用于疾病检测。
3.特定心脏疾病的金标准指标及对应心脏疾病的阈值判定标准
特定心脏疾病的金标准指标,是指特定心脏疾病公认的生物化学指标、影像学指标和代谢标志物等。如在本发明中,采用心肌缺血的检测的ffr指标;心肌梗死的检测指标肌钙蛋白、肌酸激酶同工酶和影像学指标等;冠心病的检测的冠状动脉造影的指标等。
(三)人体生理信息数据及对应心脏疾病的判定标准
人体生理信息数据包括但不限于性别、年龄、体重、吸烟史、饮酒史、运动锻炼状况、民族和/或地域等;人体生理信息数据还包括但不限于与心脏活动状态有关的病理数据:动态心电检测持续时间、最快(慢)心率、平均心率、总心搏数、室早总数、p波离散度、p波(q波)时限、q波深度、qrs时限、qtc间期、qt/rr斜率、qt间期变异性、t波峰末时间、j波高度、j波离散度、房室传导阻滞情况、心肌病病史、冠心病史、心肌梗死病史、猝死家族史、心功能nyha分级、高血压病史、瓣膜病病史、先心病病史、糖尿病病史、脑血管病病史、心血管病家族史、遗传病病史、收缩压、舒张压、体重指数、是否安装起搏器、冠脉搭桥状况、冠脉支架状况、icd治疗状况、导消融状况、b受体阻滞剂使用状况、钙通道拮抗剂使用状况、acei/arb使用状况、利尿剂使用状况、抗心律失常药物使用史、洋地黄类药物使用史、降脂药使用史、非持续性室速、lowns分级、、sdnn、sdann、asdnn、rmssd、pnn50、pnn50a、td、心率减速力、fqrs、rms40、las、微伏级t波电交替、同型半胱氨酸、ldl、hdl、脑型利钠肽、nt-probnp、肌酐、左房内径、左室舒张末内径、左室后壁厚度、左室间隔厚度、左室射血分数、fs、二尖瓣反流、三尖瓣反流、主动脉反流、阶段性室壁运动异常、lm、lad、lcx、rca、timi分级和内中膜厚度等;对应心脏疾病的判定标准参考医院诊断记录和公开的医学诊断规则。
(四)临床信息数据及对应心脏疾病的判定标准:
在本实施例中,临床信息数据包括但不限于心动过缓、血压降低、心悸、咽喉痛及烧灼感、咽喉紧缩感、牙痛、倦怠乏力、眩晕、胸部闷痛和/或气短等患者的状况信息,以及患者的病历或emr(电子病历)、检测检验、影像、诊断、处方、治疗、评估表等数据。在本实施例中,对于临床信息数据,将按照无、轻度、中度、重度4级量化,分别赋值0、1、2、3;具体地,如嗜睡和口黏等也可进行二类判别,根据有无分别赋值1和0。
(五)心脏疾病有关属性的多种病理特征的量化指标数据的预处理
在获得上述特定心脏疾病有关属性的多种病理特征的量化指标数据后,进行包括但不限于缺失值和归一化等预处理的操作。上述特定心脏疾病有关属性的多种病理特征的量化指标数据,即为后续处理的输入向量x。对于上述输入向量x,x=(x1,…xn);其中,xi∈rn,n为特征向量的数目,对应于主要病理特征的量化指标数据、辅助病理特征的量化指标数据、人体生理信息数据和临床信息数据等。对于以上的输入向量x,其进行归一化处理的方法参照如下公式进行:
x*=(xi-xmin)/(xmax-xmin)
xmax为样本数据中的最小值,xmin为样本数据中的最小值;xi为第i个样本的输入向量。
实施例3.对预处理的心脏疾病病理特征量化指标数据进行机器学习模型的构建和优化
本实施例是在实施例2的基础上进行进一步的研究,本实施例主要是对特定心脏疾病的机器学习模型进行构建,然后输入实施例2中获得的预处理的心脏疾病病理特征量化指标数据,对构建的特定心脏疾病的机器学习模型进行训练和优化。
(一)构建特定心脏疾病的机器学习判定模型
如图1所示,将实施例2中得到的特定心脏疾病有关属性的多种病理特征的量化指标数据作为输入数据,进行机器学习,构建适应特定心脏疾病的机器学习模型,实现每种病理特征的量化指标数据和特定心脏疾病相关属性之间的一一对应关系;具体为:构建心电非线性系统动态数据、和/或心脏动态病理特征的量化数据、和/或心电向量图图像特征的指标数据、和/或ecg形态指标的量化数据、和/或生物化学数据、和/或人体生理信息数据、和/或临床信息数据等多种病理特征量化指标的机器学习判定模型。
机器学习判定模型分为机器学习分类模型和深度学习识别模型。机器学习分类模型选自支持向量机、贝叶斯分类器、k近邻算法、k均值算法、线性回归、逻辑回归、多元非线性回归拟合方法、adaboost算法、隐马尔可夫模型、极限学习机、随机森林算法、决策树算法、和聚类算法中的至少一种,所述深度学习识别模型选自卷积神经网络、循环神经网络、生成式对抗网络、堆叠自动编码器、全连接网络、无监督预训练网络、深度信念网络、深度玻尔兹曼机和神经张量网络中的至少一种。机器学习分类模型的输入数据包括但不限于:心电非线性系统动态数据、和/或心脏动态病理特征的量化数据、和/或心电向量图图像特征的指标数据、和/或ecg形态指标的量化数据、和/或生物化学数据、和/或人体生理信息数据、和/或临床信息数据等多种病理特征量化指标;深度学习识别模型的输入数据包括但不限于心电非线性系统动态数据、和/或心脏动态病理特征的量化数据、和/或心电向量图图像特征的指标数据、和/或ecg形态指标的量化数据。
1.构建特定心脏疾病的支持向量机分类模型
对于支持向量机模型的构建,输人向量为x=(x1,…xn),决策规则为:
2.构建特定心脏疾病的卷积神经网络和循环神经网络识别模型
人工智能卷积神经网络模型是一个模拟神经网络的多层次网络连接结构,输入信号依次通过每个隐藏层,在其中进行一系列复杂的数学处理,逐层自动地抽象出待识别物体的一些特征,然后把这些特征作为输入再传递到高一级的隐藏层进行计算,直到最后几层的全连接层重构整个信号,使用softmax函数进行逻辑回归,达到多目标的分类。对于心电非线性系统动态图(或vcg)的三维神经网络识别模型构建方法,其包括如下的步骤:
(1)心电非线性系统动态图(或vcg)三维卷积神经网络的构建
心电非线性系统动态图(或vcg)深度卷积神经网络识别模型包括以下架构:(a)输入三维卷积层:规定输入形状为28*28*28的心电非线性系统动态图,卷积层有3个,对输入的图像进行卷积,卷积核的尺寸都是3*3*3,所述池化层采用最大池化法;(b)激活层:设置激活函数为relu;(c)最大三维池化层:减少特征维度;(d)防过拟合层:在每次训练时都断开一定百分比数值的神经元用于防止数据过拟合;(e)全连接层:全连接层有1个。
心电非线性系统动态图(或vcg)的卷积神经网络模型,包括以下步骤:(1)创建元数据库:将带健康或疾病标签的三维心电非线性系统动态图(或vcg)存入元数据库中;(2)搭建以带健康或疾病标签三维心电非线性系统动态图(或vcg)为输入的深度卷积神经网络。(3)将元数据库中的心电非线性系统动态图(或vcg)带入到深度卷积神经网络中进行训练,建立三维心电非线性系统动态图(或vcg)深度卷积神经网络识别模型。在这里,所述的深度卷积神经网络识别模型,采用三维矩阵图像作为输入,最大化地保留三维心电非线性系统动态图(或vcg)的三维空间信息:在网络的输入部分使用三维卷积层、三维卷积核对三维矩阵进行空间上的特征提取,接着进行下一步操作。
(2)心电非线性系统动态图(或vcg)循环神经网络的构建
循环神经网络包括三层:输入层、隐藏层和输出层,输入层接收心电非线性系统动态图(或vcg)的卷积神经网络输出结果作为输入数据,通过激活函数更新网络隐含层节点状态,由输出层做出预测检测样本的心脏疾病信息;其中隐含层的状态存储了大量样本的心脏疾病的信息,可以挖掘出大量样本的心脏疾病的信息与当前时刻信息之间的关系,循环神经网络rnn的t时刻心脏疾病判断方法为:
根据循环神经网络结构输入对应的信息,使用前向传播算法,计算yt实现心脏疾病判断,时间步长为6,时间连续的xt-5……xt生成一次序列预测结果yt;t时刻心脏疾病状态的输出yt由时刻t-5起逐次向前传递计算得出,计算关系为:ht=σ(uxt wxt-1 b);其中,ht是t时刻rnn模型的隐藏状态,230维;xt是t时刻心脏疾病状态向量,192维;σ是tanh激活函数,b是230维线性关系偏置向量,u、w、v三矩阵是rnn的参数,u大小192*230,w大小230*230,v大小230*1,每个阶段共享。t时刻模型输出ot为:ot=vht c,c是一维偏置量;t时刻预测输出yt为:yt=θ(ot),θ是softmax激活函数。
第一次使用需要训练循环神经网络网络参数,循环神经网络的训练过程为:将参数u、w、v、线性关系偏置向量b、一维偏置量c由反向传播算法通过梯度下降法一轮轮的迭代得到。
所述反向传播算法定义损失函数
其中:yt是t时刻预测输出,
定义序列t时刻的隐藏状态的梯度为:
反向传播w、u、b的梯度计算表达式:
其中:xt是t时刻心脏疾病状态向量,ht是t时刻rnn模型的隐藏状态,序列t时刻的隐藏状态的梯度是
所述循环神经网络rnn的训练过程如下:(a)初始化各u、w、v、b、c的值为一个随机值,取值范围[0,1];(b)foriterto1to训练迭代步数(200);(c)forstart=1to数据采集数量-5;(d)利用前向传播算法计算yt;(e)计算损失函数l;(f)反向传播算法过程利用输出层结点值计算所有隐藏层结点的偏导值,更新u、w、v、b、c;最后输出判断结果。
(二)特定心脏疾病的机器学习判定模型的优化
(1)训练和优化模型:对于前述特定心脏疾病的多种病理特征的量化指标数据的机器学习判定模型,通过大量已知标签的样本数据不断进行训练,并进行大量的权重实验,获得特定心脏疾病的相关属性的各个病理特征的量化指标的最优权重分配。
(2)对模型的测试:在训练优化后的机器学习模型中,输入一批已知标签的样本数据测试训练优化后的模型。
实施例4.对特定心脏疾病的机器学习判定模型进行评价
为了综合评价机器学习模型的性能,本实施例采用心脏疾病检测的准确度、灵敏度和特异度指标来衡量实施例3中获取的训练优化后的模型,在训练优化后的机器学习模型中,输入大量已知标签的样本数据,输出相关的判定结果。根据机器学习模型输出的判定结果,来检测机器学习判定模型的准确度、灵敏度和特异度的情况;对特定心脏疾病的机器学习判定模型的应用性能和不足进行综合评判和优化,完成对特定心脏疾病的机器学习判定模型的建立。
机器学习判定模型的检测结果的准确度、灵敏度和特异度的定义具体如下:
准确度=(真阳性样本数 真阴性样本数)/(真阳性样本数 假阳性样本数 真阴性样本数 假阴性样本数);
灵敏度=真阳性样本数/(真阳性样本数 假阴性样本数);
特异度=真阴性样本数/(真阴性样本数 假阳性样本数);
其中,真阳性样本数表示实际患心脏病并被检测为患心脏病的样本数;假阳性样本数表示实际未患心脏病而被检测为患心脏病的样本数;真阴性样本数表示实际未患心脏病并被检测为未患心脏病的样本数;假阴性样本数表示实际患心脏病而被检测为未患心脏病的样本数;对于心脏病检测模型,三个指标越高,代表该模型对于心脏病能越好,模型效果越优。
通过以上方式,获得优化后的机器学习判定模型,具体为特定心脏疾病的支持向量机分类模型、心电向量图(vcg)的卷积神经网络识别模型、心电非线性系统动态图的卷积神经网络识别模型、心电向量图(vcg)的卷积神经网络和循环神经网络识别模型以及心电非线性系统动态图的卷积神经网络和循环神经网络识别模型。
发明人选用了1714个样本数据,对构建的卷积神经网络和循环神经网络识别模型进行评价,获得心电非线性系统动态图的卷积神经网络和循环神经网络识别模型评价的实验数据,具体如表1所示;实验结果表明,心电非线性系统动态图的卷积神经网络和循环神经网络识别模型的准确度为89.0%,敏感度为91.7%,特异度为81.5%;是几个模型中最优的机器学习判定模型;vcg的卷积神经网络和循环神经网络识别模型等其它模型的评价的实验数据,在此未列出。
表1.心电非线性系统动态图的卷积神经网络和循环神经网络识别模型评价
实施例5.心脏疾病的判定结果输出的权重优化
将大量已知标签的样本数据输入到实施例4中优化筛选的支持向量机判定模型、心电非线性系统动态图(和/或vcg)的卷积神经网络和循环神经网络识别模型中,获得对应的支持向量机分类模型输出结果、心电非线性系统动态图(和/或vcg)的卷积神经网络和循环神经网络识别模型的输出结果,将这些结果结合上实施例2中提取的心脏动态病理特征的量化数据、辅助病理特征的量化指标数据、人体生理信息数据或临床信息数据,并赋以适应特定心脏疾病的权重值,然后进行具有统计学意义的权重分配实验,获得不同输出结果(支持向量机分类模型输出结果、心电非线性系统动态图(和/或vcg)的卷积神经网络和循环神经网络识别模型输出结果、心脏动态病理特征的量化数据的心脏疾病的阈值判定、辅助病理特征量化信息的心脏疾病的阈值判定、人体生理信息数据和临床信息数据)的最优权重分配,并进行针对该种特定心脏疾病的不同输出结果的最优权值进行储存,获得针对特定心脏疾病的带优化权值的综合判定体系,即带权值的支持向量机分类模型输出结果、带权值的心电非线性系统动态图(和/或vcg)的卷积神经网络和循环神经网络识别模型输出结果、带权值的心脏动态病理特征的量化数据的心脏疾病的阈值判定、带权值的辅助病理特征的心脏疾病的阈值判定、带权值的人体生理信息数据和带权值的临床信息数据的综合判定体系。
实施例6.通过机器学习判定模型进行心脏疾病的辅助检测
本实施例在实施例1至5的基础上,运用实施例5构建的针对特定心脏疾病的带优化权值的综合判定体系进行特定心脏疾病的检测。本实施例主要是采集待测人员多种病理特征的量化指标数据,输入到实施例5构建的所述特定心脏疾病的带优化权值的综合判定体系中,进行不同心脏疾病的准确检测和快速识别,如图2所示。本实施例涉及的机器学习判定模型进行心脏疾病检测的具体方法,包括如下几个步骤:
步骤一、采集待测人员多种病理特征的指标数据及预处理
采集待测人员的心脏疾病相关属性的多种病理特征的指标数据,并对采集的待测人员的多种病理特征的指标数据进行相应的预处理,预处理的方法依照实施例1和实施例2的记载,使之成为适用于机器学习判定模型的规范数据;其中,对于心脏疾病相关属性的多种病理特征的指标数据的选用,需根据具体的心脏疾病来筛选确定。
步骤二、特定心脏疾病有关属性的多种病理特征的量化指标数据的获取
采用实施例2所述的方法,从步骤一处获得的预处理的多种病理特征的规范数据中,获取待测人员的心脏动态病理特征的量化数据、心电向量图图像特征的指标数据、心电非线性系统动态数据、辅助病理特征的量化指标数据、人体生理信息数据和临床信息数据。
步骤三、特定心脏疾病判定结果的输出
将步骤二中获取的特定心脏疾病有关的多种病理特征的量化指标数据输入到实施例5构建的特定心脏疾病的带优化权值的综合判定体系中,输出最终相应心脏疾病的综合判定结果,得出待测人员的心脏健康的检测信息。
实施例7.本发明提供方法与传统方法技术效果的对比
本实施例主要是对实施例6所述的检测方法进行实际应用的验证。发明人采用30名三甲医院普通心脏科室医生的诊断和实施例6中所述的检测方法,分别对三组待测人员(#1trial组、#2trial组和#3trial组)罹患心肌缺血的情况进行检测,每组待测人员的人数选用120个;三组待测人员都选用了待测人员的心脏动态病理特征的量化数据、心电向量图图像特征的量化指标数据、心电非线性系统动态图、ecg形态指标的量化数据、生物化学数据、人体生理信息数据和临床信息数据。其中,心脏动态病理特征的量化数据是李雅普诺夫指数谱的量化数据;对于ecg形态指标的量化数据的获取,是通过st段抬高值进行实施例2所述的对应处理和运算;生物化学数据,选用高敏c反应蛋白检测值进行实施例2所述的对应处理和运算;人体生理信息数据,选用了年龄、性别、吸烟史和饮酒史进行实施例2所述的对应处理和运算;临床信息数据,选用心悸、胸部闷痛和眩晕的状况进行实施例2所述的对应处理和运算。
在#1trial组中,年龄40岁以上的人数有60个,男性为30个(吸烟且饮酒的15个,不吸烟且不饮酒的15个),女性为30个(吸烟且饮酒的15个,不吸烟且不饮酒的15个);年龄40岁以下的人数有60个,男性为30个(吸烟且饮酒的15个,不吸烟且不饮酒的15个),女性为30个(吸烟且饮酒的15个,不吸烟且不饮酒的15个);同样,#2trial组和在#3trial组中的待测人员的选用要求,与#1trial组的选用要求相同。同时,对于支持向量机分类模型输出结果、vcg的卷积神经网络和循环神经网络识别模型输出结果、心电非线性系统动态图的卷积神经网络和循环神经网络识别模型输出结果、心脏动态病理特征的量化数据的心脏疾病的阈值判定、辅助病理特征量化信息的心脏疾病的阈值判定、人体生理信息数据和临床信息数据的权重值分别为0.15、0.2、0.3、0.15、0.1、0.05和0.05;其中,辅助病理特征量化信息选用了ecg形态指标的量化数据和生物化学数据,相应的权重值分别为0.3和0.7。
如表2和表3所示,在#1trial组实验中,测试了120个待测人员,通过冠脉造影和血流储备分数这两个技术手段都确定为心肌缺血个体数为90个,三甲医院普通心脏科室平均每名医生诊断出心肌缺血个体数为46个,每名医生的总计耗时平均为270min;采用实施例6中所述的方法检测出心肌缺血个体的平均数为84个,总计耗时3.2min。在#2trial组实验中,又测试了120个待测人员,通过冠脉造影和血流储备分数这两个技术手段都确定为心肌缺血个体数为80个,30名三甲医院普通心脏科室平均每名医生诊断出心肌缺血个体数为40个,每名医生的总计耗时平均为265min;采用实施例6中所述的方法检测出心肌缺血个体的平均数为74个,总计耗时3.1min。在#3trial组实验中,又测试了120个待测人员,通过冠脉造影和血流储备分数这两个技术手段都确定为心肌缺血个体数为70个,30名三甲医院普通心脏科室平均每名医生诊断出心肌缺血个体数为34个,每名医生的总计耗时平均为260min;采用实施例6中所述的方法检测出心肌缺血个体的平均数为63个,总计耗时3.1min。以上实验结果均表明,本发明所述方法在检测心肌缺血情况时,其在检测准确性和检测耗时以及对动态信息的连续处理等方面的性能有了显著性提高和明显的进步。
表2.本发明提供方法与传统方法的检测效果的对比
表3.本发明提供方法与传统方法的检测效果的对比
由此可见,本发明所述方法和现有技术相比,存在多个方面的优势:测定心脏疾病的动态病理特征信息更加丰富,检测的准确性和检测效率等有了明显的提高,并可对连续的动态信号进行处理。
发明人发现,在实际操作过程中,可部分选用或全部选用实施例2所述多种病理特征的量化指标数据,且选用和/或组合实施例2和/或实施例3中所述方法进行心脏疾病的检测,以达到心脏疾病理想的检测效果。
实施例8.一种用于心脏疾病检测的穿戴设备
本实施例描述了一种用于心脏疾病检测的穿戴设备,包括穿戴式衣服、心脏信号传感器、与所述心脏信号传感器相连的监测芯片、导电电极和电连接导线,其中,穿戴式衣服为双层结构,导电电极嵌入穿戴式衣服的夹层内,并通过电连接导线与心脏信号传感器相连;导电电极包括十个电极,其中四个为肢体电极,六个为胸部电极。监测芯片获取心脏信号传感器实时监测的心冲击信号和心电信号。监测芯片全部或部分地采用了实施例1至实施例6中所述的方法进行心电信号的分析和处理。本实施例提供的穿戴设备可应用的疾病或症状检测,包括但不限于急性冠脉综合征、心肌缺血、心肌梗塞、心源性猝死、心肌炎、心律失常、心肌梗死、心绞痛、冠心病、冠状动脉疾病和心力衰竭等。
在一些改进方案中,监测芯片可通过wifi或者蓝牙与心脏信号传感器相连,获取传感器监测的信号,蓝牙可采用hc-05串口蓝牙;
在一些改进方案中,监测芯片包括:信号监测模块(用于获取所述心脏信号传感器实时监测的待测人员的心冲击信号和心电信号)、模型处理模块(根据所述心电信号进行实施例1至实施例6中所述的方法的分析和处理)和心脏疾病识别模块(用于根据模型处理模块的结果预测待测人员的心脏疾病)。
在一些改进方案中,信号监测模块采用ad7061模数转换芯片和ad8232芯片;模型处理模块采用ad7061模数转换芯、max4472集成运算放大器、三星kmr7x0001m-b511flash存储芯片和三星的s3c2410arm9嵌入式处理器芯片。
实施例9.一种基于卷积神经网络模型的心肌缺血检测方法
本实施例主要是关于基于卷积神经网络模型的心肌缺血的检测方法,其包括以下步骤:
步骤s1.采集了心肌缺血样本人群的心电向量图;通过实施例2所述方法获得心电向量图。所述心肌缺血样本人群均为通过心电图无法诊断的心肌缺血病人。
步骤s2.构建心肌缺血检测的心电向量图的卷积神经网络模型,心肌缺血检测的心电向量图的卷积神经网络模型的设置参数与实施例3所述相同。
通过采集实施例7所述的待测人员的心电向量图进行实验,发现本实施例所述心电向量图的卷积神经网络模型的心肌缺血检测准确率和30名三甲医院普通心脏科室医生的诊断准确率相比,提高了至少10%。
发明人在以上的实验基础上,进行了进一步的论证实验,通过采集实施例7所述的待测人员的心电非线性系统动态图,输入到实施例3所述心电非线性系统动态图的卷积神经网络模型,发现心电非线性系统动态图的卷积神经网络模型的心肌缺血检测准确率和30名三甲医院普通心脏科室医生的诊断准确率相比,提高了至少12%;接着,采集了实施例7所述的待测人员的非线性动力学特征的量化指标数据,输入到实施例3所述机器学习判定模型,发现非线性动力学特征的量化指标的机器学习判定模型的检测准确率和30名三甲医院普通心脏科室医生的诊断准确率相比,提高了至少7%;接着将非线性动力学特征的量化指标的机器学习判定模型的输出结果和本实施例所述心电向量图的卷积神经网络模型的输出结果的分别赋以权重值0.5和0.5,心肌缺血检测的准确率和30名三甲医院普通心脏科室医生的诊断准确率相比,提高了至少25%;接着增加考量了待测人员的非线性动力学特征的量化指标数据的心脏疾病的判定信息,将非线性动力学特征的量化指标的机器学习判定模型的输出结果、本实施例所述心电向量图的卷积神经网络模型的输出结果和待测人员的非线性动力学特征的量化指标数据的心脏疾病的判定信息的权重值分配为0.1、0.6和0.3,心肌缺血检测的准确率和和30名三甲医院普通心脏科室医生的诊断准确率相比,提高了至少32%。最后,将非线性动力学特征的量化指标的机器学习判定模型的输出结果、本实施例所述心电向量图的卷积神经网络模型的输出结果、心电非线性系统动态图卷积神经网络模型的输出结果和待测人员的非线性动力学特征的量化指标数据的心脏疾病的判定信息的权重值分配为0.1、0.4、0.3和0.2,心肌缺血检测的准确率和和30名三甲医院普通心脏科室医生的诊断准确率相比,提高了至少39%。
步骤s2所述特定心脏疾病的机器学习判定模型还可选用机器学习中的adaboost算法、隐马尔可夫模型、极限学习机、随机森林算法、决策树算法、生成式对抗网络、堆叠自动编码器、深度信念网络、深度玻尔兹曼机和神经张量网络中的至少一种。
实施例10.基于循环神经网络的心肌梗死伴完全性左束支传导阻滞的检测方法
本实施例主要是关于基于循环神经网络的心肌梗死伴完全性左束支传导阻滞的检测方法,其包括以下步骤:
步骤s1.获取心肌梗死伴完全性左束支传导阻滞多病理特征的指标数据,所述心肌梗死伴完全性左束支传导阻滞多病理特征的指标数据为心电非线性系统动态图;
步骤s2.对步骤s1获取的心肌梗死伴完全性左束支传导阻滞多病理特征的指标数据进行机器学习,构建心肌梗死伴完全性左束支传导阻滞的循环神经网络模型,具体参数与实施例3的参数相同。
通过采集实施例7所述的待测人员的心电非线性系统动态图进行实验,发现本实施例所述心电非线性系统动态图的循环神经网络模型的心肌梗死伴完全性左束支传导阻滞的检测准确率和30名三甲医院普通心脏科室医生的诊断准确率相比,提高了至少15%。
发明人在以上的实验基础上,进行了进一步的论证实验,采集实施例7所述的待测人员的几何特征的量化指标数据,输入到实施例3所述机器学习判定模型,发现几何特征的量化指标的机器学习判定模型的检测准确率和30名三甲医院普通心脏科室医生的诊断准确率相比,提高了至少9%;在120个待测人员进行检测时,几何特征的量化指标的机器学习判定模型的检测耗时是和30名三甲医院普通心脏科室医生的平均诊断耗时的84倍;几何特征的量化指标的心肌梗死伴完全性左束支传导阻滞的判定准确率和30名三甲医院普通心脏科室医生的诊断准确率相比,没有明显的差异。
发明人在以上的实验基础上,进行了进一步的实验,发现当本实施例的检测方法融合进待测人员的辅助病理特征的量化指标数据、人体生理信息数据或临床信息数据的心肌梗死伴完全性左束支传导阻滞的判定信息,有利于获取待测人员更加丰富的心脏疾病动态病理特征信息,利于后期的精准治疗和药物干预。
在步骤s2中,可将循环神经网络模型替换为神经张量网络,通过神经张量网络层(ntn)将不同向量通过张量进行直接交互计算,实现特征表示与相似度匹配;在这里略去了发明人具体的实验数据;其中,所述心肌梗死伴完全性左束支传导阻滞多病理特征的指标数据还可为从实施例2中获取特定心脏疾病有关属性的其它多种病理特征的量化指标数据。
实施例11.基于人工智能模型的心肌梗死伴完全性左束支传导阻滞的检测方法
本实施例主要是关于基于人工智能模型的心肌梗死伴完全性左束支传导阻滞的检测方法,其包括以下步骤:
步骤s1.获取心肌梗死伴完全性左束支传导阻滞多病理特征的指标数据,所述心肌梗死伴完全性左束支传导阻滞多病理特征的指标数据为心电图的图像特征的指标数据;
步骤s2.对步骤s1获取的心肌梗死伴完全性左束支传导阻滞多病理特征的指标数据进行机器学习,构建心肌梗死伴完全性左束支传导阻滞的机器学习判定模型。
步骤s2所述特定心脏疾病的机器学习判定模型选用机器学习中的贝叶斯分类器、k近邻算法、k均值算法、线性回归、逻辑回归、多元非线性回归拟合方法、adaboost算法、隐马尔可夫模型、极限学习机、随机森林算法、决策树算法、聚类算法、生成式对抗网络、堆叠自动编码器、全连接网络、无监督预训练网络、深度信念网络、深度玻尔兹曼机和神经张量网络中的至少一种。
逻辑回归的机器学习方法,是在线性回归的机器学习方法基础上进一步研究得到的,用于解决线性回归的机器学习方法难以解决的复杂分类的问题。对于逻辑回归的机器学习方法,按照以下步骤进行:纳入n个临床已知心律失常个体(n=120)以及m个临床已知造影阻塞个体(m=120)作为测试样本人群,根据实施例2所述方法采集测试样本人群的心脏疾病有关属性的多种病理特征的量化指标数据,进行基于逻辑回归模型的训练,逻辑回归模型采用的函数是sklearn模块下的gridsearch函数。同样地,采集待诊人员的心电图,进行上述同样地处理,输入到训练所得的逻辑回归模型中,获得分类结果。发明人通过使用上述的方法构建逻辑回归模型后,进行实验验证后发现,使用逻辑回归模型训练的准确率为65%以上。类似地,此处机器学习方法还可采用多元非线性回归拟合方法或线性回归方法。
对于贝叶斯分类器的机器学习方法,包括:(1)获取患者的症状信息,所述患者的症状信息取自实施例1和实施例2的样本集提取到的症状结果;(2)将所述症状信息输入已构建的多标签贝叶斯分类器,得到所述患者所患疾病的预测集合,其中,所述多标签贝叶斯分类器是用从实施例1和实施例2的样本集提取到的症状结果训练得到的。疾病种类为n,构建具备n个标签的贝叶斯分类器,每个分类器分类结果为:{di,-di},即属于疾病di和不属于疾病di,用于训练的样本的输入为实施例1的样本集提取到的症状结果s,计算时将患者的症状输入经过多标签贝叶斯分类器即可求得该患者可能患有的疾病集合l。(3)根据所述预测集合从医疗知识图谱中确定医疗检查的推荐项组合,其中,所述医疗知识图谱包括症状实体、疾病实体、单检查实体和检查组实体,所述检查组实体是通过计算所述单检查实体的频繁项集确定的。发明人通过使用上述的方法构建贝叶斯分类器后进行实验验证,发现使用贝叶斯分类器训练的准确率为80%以上。
对于k近邻算法的机器学习方法,包括如下步骤:(一)获取样本数据集,样本数据集是240个;其中,120个样本是心律失常,120个样本是造影阻塞,每条样本都包括实施例1和实施例2采集的症状结果;(二)对步骤一中的数据集进行预处理操作以满足knn模型支持的数据格式后,预处理之后的数据进行筛选,对其做数据归一化处理,构建训练数据集和验证数据集;(三)knn模型构建:具体的模型构建方法包括以下步骤(1)计算欧式距离;(2)按照距离的递增关系进行排序;(3)选取距离最小的k个点,其中k=5~10;(4)确定前k个点所在类别的出现频率;(5)返回前k个点中出现频率最高的类别作为测试数据的预测分类。发明人通过使用上述的方法构建knn模型后,进行实验验证后发现,使用knn算法训练的准确率为81.7%以上。
在本实施例中,所述心肌梗死伴完全性左束支传导阻滞多病理特征的指标数据还可为从实施例2中获取特定心脏疾病有关属性的其它多种病理特征的量化指标数据。
同样地,本实施例还可采用k均值算法执行上述的聚类算法分析。
实施例12.一种基于adaboost分类器的心脏疾病的分类方法
在前述研究的基础上,发明人又开发了一种基于adaboost分类器的心电非线性系统动态数据的心脏疾病检测方法,该方法包括以下步骤:
样本数是240个:120个样本是心律失常患者的心电非线性系统动态数据,120个样本是造影阻塞患者的心电非线性系统动态数据。训练数据的每一个样本,并赋予其一个权重,这些权值构成权重向量d,维度等于数据集样本个数。开始时,这些权重都是相等的,首先在训练数据集上训练出一个弱分类器并计算该分类器的错误率,然后在同一数据集上再次训练弱分类器,但是在第二次训练时,将会根据分类器的错误率,对数据集中样本的各个权重进行调整,分类正确的样本的权重降低,而分类错的样本权重则上升,但这些权重的总和保持不变为1。
最终的分类器会基于这些训练的弱分类器的分类错误率,分配不同的决定系数alpha,错误率低的分类器获得更高的决定系数,从而在对数据进行预测时起关键作用。alpha的计算根据错误率得来:
alpha=0.5*ln(1-ε/max(ε,1e-16));
其中,ε=为正确分类的样本数目/样本总数,max(ε,1e-16)是为了防止错误率为而造成分母为0的情况发生。
计算出alpha之后,就可以对权重向量进行更新了,使得分类错误的样本获得更高的权重,而分类正确的样本获得更低的权重。d的计算公式如下:如果某个样本被正确分类,那么权重更新为:d(m 1,i)=d(m,i)*exp(-alpha)/sum(d);如果某个样本被错误分类,那么权重更新为:d(m 1,i)=d(m,i)*exp(alpha)/sum(d);其中,m为迭代的次数,即训练的第m个分类器,i为权重向量的第i个分量,i<=数据集样本数量。当我们更新完各个样本的权重之后,就可以进行下一次的迭代训练。adaboost算法会不断重复训练和调整权重,直至达到迭代次数,或者训练错误率为0;
通过使用上述的方法进行实验验证,发明人发现使用adaboost算法训练的准确率为100%。
在本实施例中,所述心电非线性系统动态数据还可为从实施例2中获取特定心脏疾病有关属性的其它多种病理特征的量化指标数据。
实施例13.基于生成式对抗网络的心肌梗死伴完全性左束支传导阻滞的检测方法
在本实施例中,发明人开发了基于生成式对抗网络的心肌梗死伴完全性左束支传导阻滞的检测方法,其包括以下步骤:
步骤1.获取心肌梗死伴完全性左束支传导阻滞病理特征数据,所述心肌梗死伴完全性左束支传导阻滞病理特征数据为心电非线性系统动态数据;
步骤2.采用k-means算法将心电非线性系统动态数据聚类成多个集群,每个集群中包含100条心电非线性系统动态数据,将所有心电非线性系统动态数据归一化至[0,1]区间。
步骤3.构建心电非线性系统动态数据生成模型g,具体如下:
心电非线性系统动态数据卷积神经网络包括输入层、隐藏层和输出层,用于生成虚拟目标心电非线性系统动态数据,过程如下:首先,将预处理后的心电非线性系统动态数据转化为的目标维度的数据矩阵;然后,定义卷积操作,即通过卷积核在原输入矩阵上的滑动与计算得到输出矩阵,可得到维度更小的输出矩阵,实现数据的特征提取;其中,卷积核为一个维度较小的n*n矩阵(一般取3*3),也称为权重矩阵,其矩阵元素的值可进行预设,滑动的步长可设置(一般为1),输出矩阵中每一个元素值即为卷积核与其当前覆盖的原输入矩阵的乘积;接下来,定义反卷积操作,其形式与卷积操作相似,即通过由卷积核得到的转置矩阵与输入矩阵相乘,转化得到输出矩阵,一般情况下可得到维度更大的矩阵,实现数据的扩充;最后,将目标维度心电非线性系统动态数据矩阵进行3层不同结构的卷积处理,包括不同步长的卷积与反卷积,得到n*m维的数据,并对其进行sigmoid处理,输出n*m维的输出矩阵,该n*m维的输出矩阵构成虚拟目标心电非线性系统动态数据集。
步骤4.构建心电非线性系统动态数据判别模型d,具体如下:
心电非线性系统动态数据判别模型,用于对输入的虚拟目标心电非线性系统动态数据和目标心电非线性系统动态数据真实性进行判断。
将虚拟目标心电非线性系统动态数据和目标心电非线性系统动态数据作为心电非线性系统动态数据判别模型的输入,定义最大池化层和卷积层,利用卷积层实现输入数据的扩维特征提取,卷积层的卷积核为5*5的矩阵,步长为1或2,最大池化层实现对输入数据的降维特征提取,即通过窗口对具有较大维度的输入矩阵进行数值提取与降维,得到维度较小的输出矩阵,其中,窗口取3*3,数值提取即在该窗口在原数据矩阵上对应的每一个区域内选取最大的数值,作为输出矩阵的元素。
对维度为n*m的目标心电非线性系统动态数据和虚拟目标心电非线性系统动态数据进行不同结构的卷积与池化操作,并通过全连接处理计算得到概率值,其中,该概率值的范围为[0,1],即当数据被判别为目标心电非线性系统动态数据时,概率为1,被判别为虚拟目标心电非线性系统动态数据时,概率为0。
对抗训练由所述心电非线性系统动态生成模型和所述心电非线性系统动态判别模型构成的生成对抗网络。通过交替训练的训练策略实现生成式对抗网络的对抗与优化。在训练的过程中,心电非线性系统动态判别模型d的训练目的是尽量最大化自身的判别准确率,即当概率为1时,说明该数据被判别为来自目标心电非线性系统动态数据,标注1,概率为0时,该数据被判别为来自于虚拟目标心电非线性系统动态数据,即由心电非线性系统动态生成模型g生成,标注为0。心电非线性系统动态生成模型g的训练目标是是最小化心电非线性系统动态判别模型d的判别准确率。
在本实施例中,所述心电非线性系统动态数据还可为从实施例2中获取特定心脏疾病有关属性的其它多种病理特征的量化指标数据。
实施例14.基于堆叠自动编码器的心肌梗死伴完全性左束支传导阻滞的检测方法
在本实施例中,发明人开发了基于堆叠自动编码器的心肌梗死伴完全性左束支传导阻滞的检测方法,至少包括以下步骤:
s1、将训练样本的无标签的心电向量数据和同样训练样本的实际标签的心电向量数据作为共同输入,经过多层编码解码后得到同样的输出,然后将输出中的带实际标签的心电向量数据作为目标检测结果;
s2、降噪堆叠自动编码器网络包括多层,第一层作为输入端和输出端,经过简单的编码解码而没有降噪功能,中间若干层通过多次编码解码,找到不同维度间的联系,从样本中学习从无标签的心电向量数据中恢复实际标签的心电向量数据具有的功能,得到无标签的心电向量数据的实际标签;具体实施时,s2还包括步骤:
a1、生成第一层自动编码器,将输入信息经过编码和解码后得到与原始输入一样的输出信息,将无标签的心电向量数据和同样训练样本的实际标签的心电向量数据作为共同输入f1,经过编码o1=s1(w1f1 b1)成为中间层o1,然后解码重构成f1’=s1(w2o1 b2),模型的参数应该尽可能使重构数据逼近原始向量;
a2、将第一层编码器的输出当成第二层降噪自动编码器的输入,同样最小化第二层降噪自动编码器的重构误差,使得第二层经过编码、解码后所重构的输出与第二层输入一样;
a3、生成中间若干层降噪自动编码器;
a4、堆叠各层降噪自动编码器,输入依次经过第一层编码、第二层编码…第n层编码,再依次经过第n层解码…第二层解码、第一层编码,输出与输入一样的信息;
a5、使用时,用训练样本的无标签的心电向量数据和同样训练样本的实际标签的心电向量数据作为共同输入,将同样训练样本的实际标签的心电向量数据作为噪声干扰下的丢失信息或者遮挡住的信息,经过多层的降噪自动编码器,从训练样本的无标签的心电向量数据恢复丢失的信息,在最后一层得到训练样本的无标签的心电向量数据和同样训练样本的实际标签的心电向量数据,但只取同样训练样本的实际标签的心电向量数据作为输出;
s3、降噪堆叠自动编码器网络逐层抽取特征并恢复丢失信息。通过逐层抽取特征并恢复丢失信息,可以提高所述采用降噪堆叠自动编码器网络的检测精度。
本发明通过以上实施例的设计,可以做到降噪堆叠自动编码器网络包括多层,逐层抽取特征并恢复丢失信息,可以提高检测精度。在本实施例中,所述心电向量数据还可为从实施例2中获取特定心脏疾病有关属性的其它多种病理特征的量化指标数据。
实施例15.基于深度信念网络的心肌梗死伴完全性左束支传导阻滞的检测方法
在本实施例中,发明人开发了基于深度信念网络的心肌梗死伴完全性左束支传导阻滞的检测方法,该方法包括:
步骤1、获取待检测心脏动态病理特征的量化数据、心电向量图图像特征的指标数据或心电非线性系统动态数据;根据待检测心脏动态病理特征的量化数据、心电向量图图像特征的指标数据或心电非线性系统动态数据的类别,获取与其对应的验证性心脏动态病理特征的量化数据、验证性心电向量图图像特征的指标数据或验证性心电非线性系统动态数据;根据内容验证一致性识别算法,计算待检测数据与验证性数据之间的相似度值;
步骤2、比较相似度值与预设的阈值的大小,将相似度值大于阈值的待检测心电非线性系统动态数据确定为初步可信心电非线性系统动态数据;
步骤3、提取初步可信心电非线性系统动态数据的多维度可信特征,并构建多维度可信特征向量;
步骤4、将多维度可信特征向量输入深度信念网络(dbn)判别模型中,输出表示初步可信心电非线性系统动态数据的可信性的判别结果。对于深度信念网络dbn判别模型,建立具有两层网络结构的限制玻尔兹曼机(rbm)以及一层bp神经网络的dbn,并将所述dbn中的学习率以及权衰减分别配置为所述以权重更新量为权重的5-1倍为自调整范围的学习率,以及包括梯度项、一个以权重参数的平方和的1/2乘以正则化系数的惩罚函数的权衰减,并确定误差率与迭代次数之间的关系,利用用于训练的文本数据结合所述学习率、所述权衰减、所述误差率、所述迭代次数对所述dbn进行训练。所述限制玻尔兹曼机(rbm)可以进一步拓展为深度玻尔兹曼机(rbm)运用到本实施例中。
可以理解的是,dbn判别模型是通过训练多层受限玻尔兹曼机rbm学习得到的神经网络结构,该模型是采用模拟人脑多层结构的方式,对输入数据从底层到高层渐进地进行特征提取,最终形成适合模式分类的较理想特征,从而提升分类的准确率。即将多维度可信特征向量输入深度信念网络dbn判别模型中后,该dbn判别模型能够快速准确的输出表示初步可信心电非线性系统动态数据的可信性的判别结果。
实施例16.基于随机森林算法的心肌梗死伴完全性左束支传导阻滞的检测方法
在众多的机器学习算法中,随机森林是一种利用多个分类树对数据进行判别与分类的方法,随机森林算法能够处理高维特征,同时还能给出各个变量的重要性评分,评估各个变量在分类中所起的作用且易于实现并行化。
发明人开发了基于随机森林算法的心肌梗死伴完全性左束支传导阻滞的检测方法,该方法包括以下步骤:
步骤一,数据采集:针对目标人群(120个样本是心律失常患者,120个样本是造影阻塞患者),从相关信息系统收集观察期窗口内的心脑血管疾病患者的心脏动态病理特征的量化数据、心电向量图图像特征的指标数据、心电非线性系统动态数据、ecg形态指标的量化数据、生物化学数据、人体生理信息数据和临床信息数据;所采集的数据还包括实施例2中获取特定心脏疾病有关属性的其它多种病理特征的量化指标数据;
步骤二,数据预处理:数据预处理针对数据集进行一系列的集成、清洗和缺失数据的处理,从而提高数据质量;
步骤三,构建了随机森林预测模型:
(1)从原始训练集中使用bootstraping方法随机有放回采样选出m个样本,共进行n_tree次采样,生成n_tree个训练集;
(2)对于n_tree个训练集,我们分别训练n_tree个决策树模型;
(3)对于单个决策树模型,假设训练样本特征的个数为n,那么每次分裂时根据信息增益/信息增益比/基尼指数选择最好的特征进行分裂;
(4)每棵树都一直这样分裂下去,直到该节点的所有训练样例都属于同一类;在决策树的分裂过程中不需要剪枝。将生成的多棵决策树组成随机森林。对于分类问题,按多棵树分类器投票决定最终分类结果;对于回归问题,由多棵树预测值的均值决定最终预测结果。
发明人使用上述的方法进行实验验证,发现使用上述随机森林算法训练的准确率为85%以上;在一些实施方式中,随机森林分类器可替换为决策树算法执行相似的处理;优选地,可加入极限学习机组合隐马尔可夫的模型进行分类结果的优化。
虽在本发明已提供数个实施例,但应理解所公开系统和方法可在不偏离本公开的精神或范围的情况下以许多其它特定形式体现。这些实例将视为示例性而非限制性,并且并不旨在限于本文中给出的细节。各种方法或参数范围可组合或整合于另一系统中,各种方法或参数范围可组合或整合于另一方法中,各种方法或参数范围可组合或整合于本领域或其它领域的产品,或者某些特征可省略或不实施,都属于本领域技术人员可基于本发明所可轻易拓展或实施的技术。
1.一种基于人工智能模型的心脏疾病的检测方法,其特征在于,包括以下步骤:
步骤s1.获取特定心脏疾病多病理特征的指标数据,所述特定心脏疾病多病理特征的指标数据包括心脏动态病理特征的量化数据、心电向量图图像特征的指标数据和心电非线性系统动态数据中的一种或几种;
步骤s2.对步骤s1获取的所述特定心脏疾病多病理特征的指标数据进行机器学习,获取特定心脏疾病的机器学习判定模型。
2.根据权利要求1所述心脏疾病的检测方法,其特征在于,步骤s1所述心脏动态病理特征的量化数据包括:几何特征的量化指标数据、非线性动力学特征的量化指标数据、模型特征的量化指标数据、时域特征的量化指标数据和频域特征的量化指标数据中的一种或几种;
优选地,步骤s1所述特定心脏疾病多病理特征的指标数据还包括辅助病理特征的量化指标数据、人体生理信息数据和临床信息数据中的一种或几种;
更优选地,所述辅助病理特征的量化指标数据包括ecg形态指标的量化数据、和/或心电图图像特征的指标数据、和/或生物化学数据。
3.根据权利要求1所述心脏疾病的检测方法,其特征在于,步骤s2所述特定心脏疾病的机器学习判定模型包括支持向量机、卷积神经网络、循环神经网络、贝叶斯分类器、k近邻算法、k均值算法、线性回归、逻辑回归、多元非线性回归拟合方法、adaboost算法、隐马尔可夫模型、极限学习机、随机森林算法、决策树算法、聚类算法、生成式对抗网络、堆叠自动编码器、全连接网络、无监督预训练网络、深度信念网络、深度玻尔兹曼机和神经张量网络中的至少一种;
优选地,步骤s2所述特定心脏疾病的机器学习判定模型包括机器学习分类模型和深度学习识别模型;输入到所述机器学习分类模型的数据包括所述心脏动态病理特征的量化数据,输入到所述深度学习识别模型的数据包括所述心电向量图图像特征的指标数据和心电非线性系统动态数据;优选地,输入到所述机器学习分类模型的数据还包括辅助病理特征的量化指标数据、人体生理信息数据和临床信息数据中的一种或几种;
更优选地,所述机器学习分类模型选自支持向量机、贝叶斯分类器、k近邻算法、k均值算法、线性回归、逻辑回归、多元非线性回归拟合方法、adaboost算法、隐马尔可夫模型、极限学习机、随机森林算法、决策树算法、和聚类算法中的至少一种,所述深度学习识别模型选自卷积神经网络、循环神经网络、生成式对抗网络、堆叠自动编码器、全连接网络、无监督预训练网络、深度信念网络、深度玻尔兹曼机和神经张量网络中的至少一种。
4.根据权利要求1或3所述心脏疾病的检测方法,其特征在于,还包括步骤s3:获取待测人员的多病理特征的指标数据,输入到步骤s2所述特定心脏疾病的机器学习判定模型,得到特定心脏疾病的检测结果;
其中,所述待测人员的多病理特征的指标数据包括待测人员的心脏动态病理特征的量化数据、心电向量图图像特征的指标数据和心电非线性系统动态数据中的一种或几种。
5.根据权利要求4所述心脏疾病的检测方法,其特征在于,步骤s3所述待测人员多病理特征的指标数据还包括待测人员的辅助病理特征的量化指标数据、人体生理信息数据和临床信息数据中一种或几种;
优选地,步骤s3所述待测人员的辅助病理特征的量化指标数据包括ecg形态指标的量化数据、和/或生物化学数据;
优选地,步骤s3所述特定心脏疾病的检测结果还包含使用所述待测人员多病理特征的指标数据分别进行特定心脏疾病判定,得到待测人员心脏疾病的指标判定结果;
更优选地,所述心脏疾病的检测方法还包括将步骤s2所述特定心脏疾病的机器学习判定模型的输出结果和所述待测人员心脏疾病的指标判定结果赋以权重值进行心脏疾病检测,得到待测人员心脏疾病的综合判定结果;其中,所述待测人员的心脏疾病的指标判定结果包含所述待测人员的心脏动态病理特征的量化数据的特定心脏疾病的判定信息、所述待测人员的辅助病理特征的量化指标数据的特定心脏疾病的判定信息、所述待测人员的人体生理信息数据的特定心脏疾病的判定信息和所述待测人员的临床信息数据的特定心脏疾病的判定信息中的一种或几种;
更优选地,步骤s2所述特定心脏疾病的机器学习判定模型的输出结果还包括机器学习分类模型的输出结果和深度学习识别模型的输出结果,且对所述机器学习分类模型的输出结果和深度学习识别模型的输出结果赋以权重值。
6.根据权利要求4所述心脏疾病的检测方法,其特征在于,步骤s3所述待测人员的心脏动态病理特征的量化数据包括:待测人员的心电非线性系统动态的几何特征的量化指标数据、非线性动力学特征的量化指标数据、模型特征的量化指标数据、时域特征的量化指标数据和频域特征的量化指标数据中的一种或几种。
7.一种基于人工智能模型的心脏疾病的检测方法,其特征在于,包括以下步骤:
步骤1.采集待测人员的多病理特征的指标数据,所述待测人员的多病理特征的指标数据包括待测人员的心脏动态病理特征的量化数据、和/或待测人员的心电向量图图像特征的指标数据、和/或待测人员的心电非线性系统动态数据、和/或待测人员的辅助病理特征的量化指标数据、和/或待测人员的人体生理信息数据、和/或待测人员的临床信息数据;
其中,所述待测人员的心脏动态病理特征的量化数据包括:待测人员的心电非线性系统动态的几何特征的量化指标数据、非线性动力学特征的量化指标数据、模型特征的量化指标数据、时域特征的量化指标数据和频域特征的量化指标数据中的一种或几种;
步骤2.将步骤1采集的待测人员的多病理特征的指标数据,输入到特定心脏疾病的机器学习判定模型;
步骤3.输出特定心脏疾病检测结果,所述特定心脏疾病检测结果包含步骤2所述特定心脏疾病的机器学习判定模型的输出结果。
8.根据权利要求7所述心脏疾病的检测方法,其特征在于,步骤3所述特定心脏疾病的检测结果还包含所述待测人员心脏动态病理特征的量化数据的特定心脏疾病的阈值判定信息、和/或所述待测人员的辅助病理特征的量化指标数据的特定心脏疾病的阈值判定信息、和/或所述待测人员临床信息数据的特定心脏疾病的判定信息;
优选地,步骤3所述特定心脏疾病的检测结果还包含对步骤3所述特定心脏疾病的机器学习判定模型的输出结果信息、和/或所述待测人员心脏动态病理特征的量化数据的特定心脏疾病的判定信息、和/或所述待测人员的辅助病理特征的量化指标数据的特定心脏疾病的判定信息、和/或所述待测人员的人体生理信息数据的特定心脏疾病的判定信息、和/或所述待测人员的临床信息数据的特定心脏疾病的判定信息赋以适应心脏疾病的权重值。
9.一种心脏疾病的检测产品,其特征在于,所述检测产品使用了权利要求1-8任一权项所述心脏疾病的检测方法。
10.一种根据权利要求9所述心脏疾病的检测产品在心脏疾病检测上的应用。
技术总结