一种针对普通人群的颈动脉硬化与颈动脉斑块预测模型的建立方法与流程

专利2022-06-29  72


本发明涉及医学技术领域,尤其涉及一种针对普通人群的颈动脉硬化与颈动脉斑块预测模型的建立方法。



背景技术:

颈动脉硬化与颈动脉斑块形成是一种常见的血管壁病变,表现为血管壁增厚、硬化及重构,可明显增加心肌梗死、冠心病、缺血性脑卒中的发生风险。研究发现,随着颈动脉内中膜厚度每增加0.1mm,卒中与心肌梗死的发生风险均增加10%以上。既往发现高龄、男性、肥胖、吸烟、高血压、体力活动过少、高低密度脂蛋白血症等为颈动脉斑块及颈动脉硬化的危险因素。目前国内鲜有针对普通人群的颈动脉斑块及硬化的预测模型报道,其中多数研究针对的是高危人群,且样本量相对较小,缺乏内部验证与模型校准度的评价。

如前文所述,现有的颈动脉斑块或颈动脉硬化预测模型多数基于高危人群数据而建立。一个好的预测模型需要同时具有良好的区分度与校准度,区分度指能够把发病风险高、低不同的人群正确区分开来,评价模型区分度的较为常用的指标即模型的auc,这也是既往研究主要报道的指标。相对于模型的区分度,模型的校准度则较少被报道,校准度是评价一个预测模型预测某个个体发生结局事件概率准确性的重要指标,反映了预测风险与实际风险的一致程度。

童璐莎等人利用杭州2个社区的卒中筛查数据,建立了颈动脉斑块/内膜增厚的预测模型,其最佳模型的auc为0.804,对应的灵敏度与特异度分别为0.713、0.757。上述研究所建立预测模型的auc虽然较高,但仍有提升的空间,且既往研究所报道的预测模型均未对模型的校准度进行评价(既往研究中并不关注这一评价指标,而更关注区分度auc。但发明人发现校准度这一指标同样非常重要)。



技术实现要素:

为了解决上述技术问题,本发明提供了一种针对普通人群的颈动脉硬化与颈动脉斑块预测模型的建立方法,本发明通过对大样本普通体检人群数据的分析,建立了有效的颈动脉斑块与颈动脉硬化的预测模型(auc大于0.88,准确率大于80%),方便医疗工作者与个人对颈动脉斑块与颈动脉硬化的风险进行预测与预警。

本发明的具体技术方案为:一种针对普通人群的颈动脉硬化与颈动脉斑块预测模型的建立方法,包括以下步骤:

1)建模人群选取:选取普通人群作为建模人群。

2)信息收集:收集建模人群的以下信息:

a)性别、年龄和既往病史;

b)生理测量数据:包括身高、体重和血压;

c)实验室生化检测数据:包括碱性磷酸酶、丙氨酸氨基转移酶、γ-谷氨酰转肽酶、总胆红素、直接胆红素、间接胆红素、空腹血糖、血清总胆固醇、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、甘油三酯、尿酸、体质指数和血红蛋白;

d)颈动脉内膜中层厚度imt数据;

3)建模人群分组:以两侧颈动脉imt最大值作为评价指标,将建模人群分为正常组和异常组。

4)统计建模:随机抽取一定数量的样本作为建模组,选取正常组与异常组之间差异具有统计学意义的变量,及既往研究发现的相关因素作为自变量,将其纳入多因素logistic回归模型建立预测模型,使用逐步回归法筛选出最终的变量,将建立的预测模型用剩余样本作为验证组进行验证,使用roc的auc、约登指数、灵敏度、特异度、准确率和校准度评价模型预测效能。

5)预测模型评价:根据建模组与验证组模型roc的auc评价模型的区分度,根据预测模型的校准曲线评价模型的校准度,将模型约登指数最大值对应的概率作为诊断阈值,评价预测结果的准确率。

与现有技术中将高危人群作为建模人群相比,本发明以普通的体检人群作为建模人群,优点是可以使预测模型得到更加广泛的应用(高危人群中所建立的预测模型是否能有效应用于普通人群尚未见报道)。本发明建模所使用的大样本普通体检人群可以较好地代表该地区人群,而非仅仅限定在颈动脉斑块与颈动脉硬化的高危人群。因此,本发明所建立的预测模型可以应用于普通体检人群的颈动脉斑块与颈动脉硬化疾病风险预测。本发明在变量因素的选择上更为合理,例如,在纳入是否高血压这一变量外,本模型还额外纳入了体检时的收缩压与舒张压,结合收缩压与舒张压这两个指标可以体现出个体脉压差的信息。此外相较国内既往报道的预测模型,本预测模型首次将直接胆红素水平纳入了模型。综上,本发明基于大样本普通体检人群所建立的预测模型,不仅使得模型得到了更为广泛的外推,且充分利用了健康体检的检查指标提升了模型的预测效能,同时较大的样本量也保证了预测模型的稳健性。

本发明的预测模型具有较高的预测效率,auc均达到0.88以上,且准确率均在80%以上,同时具有很高的校准度。本发明采用大样本的普通人群作为建模人群,并通过分析识别出了颈动脉硬化与颈动脉斑块形成的多个特定的高相关危险因素,联合这些因素对颈动脉硬化与颈动脉斑块形成进行预测模型建模。由于联合了多个实验室指标与个体的一般人口学信息,结合上较大的样本量,使得本模型具有较高的预测效率,同时也保证了预测模型的稳健性。

作为优选,步骤1)中,所述普通人群排除:①恶性肿瘤患者;②结缔组织系统疾病患者;③血液系统疾病患者;④自身免疫系统疾病患者;⑤骨质疏松患者;⑥肝肾损害患者;⑦精神障碍患者。

本发明排除上述人群的原因在于:本发明所建立的预测模型目的是应用于普通体检人群的颈动脉斑块及颈动脉硬化的预测。因为所采用的预测变量中包含血常规、肝功能、血脂等指标,这些指标可能会受上述疾病与相关疾病治疗的影响,因此为了提高模型的预测效能,我们排除了上述患者。

作为优选,步骤4)中,所述相关因素包括性别、年龄、血压、低密度脂蛋白胆固醇、空腹血糖、γ-谷氨酰转肽酶和胆红素。

作为优选,步骤3)中,评价指标为:正常组:imt<0.9mm;异常组:颈动脉粥样硬化0.9≤imt<1.3;动脉硬化斑块为imt≥1.3mm,或局部病灶厚度超过周围厚度50%,伴或不伴钙化管腔狭窄且未造成管腔闭塞。

作为优选,步骤4)中,建模组的数量为建模人群的70%-80%。

作为进一步优选,步骤4)中,建模组的数量为建模人群的70%。

作为优选,步骤4)中,在使用逐步回归法筛选出最终的变量时,变量进入与保留在模型的显著性水平界值均为0.05-0.10。

作为进一步优选,步骤4)中,在使用逐步回归法筛选出最终的变量时,变量进入与保留在模型的显著性水平界值均为0.10。

与现有技术对比,本发明的有益效果是:

(i)本预测模型适用于普通体检人群而非仅针对高危人群;

(ii)本预测模型具有较高的预测效率,auc均达到0.88以上,且准确率均在80%以上;

(iii)本预测模型使用了常规的实验室检查指标以及一般人口学特征作为预测变量,预测变量能较方便地获取;

(iv)本预测模型不仅均有较高的区分度,且具有良好的校准度(既往研究中并不关注这一评价指标,而更关注区分度。但发明人发现校准度这一指标同样非常重要)。

附图说明

图1为本发明颈动脉斑块预测模型;

图2为本发明颈动脉硬化预测模型;

图3中,(a)为颈动脉斑块预测模型校准曲线;(b)为颈动脉硬化预测模型校准曲线。

具体实施方式

下面结合实施例对本发明作进一步的描述。

总实施例

一种针对普通人群的颈动脉硬化与颈动脉斑块预测模型的建立方法,包括以下步骤:

1)建模人群选取:选取普通人群作为建模人群。所述普通人群排除:①恶性肿瘤患者;②结缔组织系统疾病患者;③血液系统疾病患者;④自身免疫系统疾病患者;⑤骨质疏松患者;⑥肝肾损害患者;⑦精神障碍患者。

2)信息收集:收集建模人群的以下信息:

a)性别、年龄和既往病史;

b)生理测量数据:包括身高、体重和血压;

c)实验室生化检测数据:包括碱性磷酸酶、丙氨酸氨基转移酶、γ-谷氨酰转肽酶、总胆红素、直接胆红素、间接胆红素、空腹血糖、血清总胆固醇、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、甘油三酯、尿酸、体质指数和血红蛋白;

d)颈动脉内膜中层厚度imt数据。

3)建模人群分组:以两侧颈动脉imt最大值作为评价指标,将建模人群分为正常组和异常组。,评价指标为:正常组:imt<0.9mm;异常组:颈动脉粥样硬化0.9≤imt<1.3;动脉硬化斑块为imt≥1.3mm,或局部病灶厚度超过周围厚度50%,伴或不伴钙化管腔狭窄且未造成管腔闭塞。

4)统计建模:随机抽取一定数量的样本作为建模组,选取正常组与异常组之间差异具有统计学意义的变量,及既往研究发现的相关因素(包括性别、年龄、血压、低密度脂蛋白胆固醇、空腹血糖、γ-谷氨酰转肽酶、胆红素)作为自变量,将其纳入多因素logistic回归模型建立预测模型,使用逐步回归法筛选出最终的变量,将建立的预测模型用剩余样本作为验证组进行验证,使用roc的auc、约登指数、灵敏度、特异度、准确率和校准度评价模型预测效能。

5)预测模型评价:根据建模组与验证组模型roc的auc评价模型的区分度,根据预测模型的校准曲线评价模型的校准度,将模型约登指数最大值对应的概率作为诊断阈值,评价预测结果的准确率。

步骤4)中,建模组的数量为建模人群的70-80%。在使用逐步回归法筛选出最终的变量时,变量进入与保留在模型的显著性水平界值均为0.05-0.10。

具体实施例

1)建模人群选取:选取2016年3月至2018年12月期间于杭州市五云山疗养院进行体检个体(8308例)作为研究对象。排除标准:①信息录入不全者;②恶性肿瘤;④结缔组织系统疾病;⑤血液系统疾病;⑥自身免疫系统疾病;⑦骨质疏松;⑧严重的肝肾损害;⑨精神障碍患者。

2)资料收集:包括性别、年龄、既往病史等内容。(2)生理测量数据:包括身高、体重、血压等项目。(3)实验室生化检测数据:包括碱性磷酸酶、丙氨酸氨基转移酶、γ-谷氨酰转肽酶(ggt)、总胆红素、直接胆红素、间接胆红素、空腹血糖、血清总胆固醇、高密度脂蛋白胆固醇(hdl-c)、低密度脂蛋白胆固醇(ldl-c)、甘油三酯及尿酸。(4)颈动脉内膜中层厚度数据。

3)建模人群分组:以两侧颈动脉imt最大值作为评价指标,将建模人群分为正常组和异常组。,评价指标为:正常组:imt<0.9mm;异常组:颈动脉粥样硬化0.9≤imt<1.3;动脉硬化斑块为imt≥1.3mm,或局部病灶厚度超过周围厚度50%,伴或不伴钙化管腔狭窄且未造成管腔闭塞。

4)统计建模:随机抽取70%的样本作为建模组,选取正常组与异常组之间差异具有统计学意义的变量(高血压病、2型糖尿病、体质指数、血红蛋白、γ-谷氨酰转肽酶、丙氨酸氨基转移酶、碱性磷酸酶、甘油三酯、胆固醇、尿酸),及既往研究发现的相关因素(性别、年龄、血压、空腹血糖、γ-谷氨酰转肽酶、低密度脂蛋白胆固醇、胆红素)作为自变量,将其纳入多因作为自变量,将其纳入多因素logistic回归模型建立预测模型,使用逐步回归法筛选出最终的9个变量(年龄、高血压病、收缩压、空腹血糖、γ-谷氨酰转肽酶、低密度脂蛋白胆固醇、性别、舒张压和直接胆红素),变量进入与保留在模型的显著性水平界值均为0.10,将建立的预测模型用剩余30%的样本进行验证,使用roc(受试者工作特征曲线)的auc(曲线下面积)、约登指数、灵敏度、特异度、准确率、校准度评价模型的预测效能。

预测模型为:

颈动脉斑块:

logit(p)=-9.069 0.103*age-0.260*sex 0.254*hyper 0.018*sbp-0.018*dbp 0.165*fbg 0.091*ldl 0.004*gtt-0.067*dbil

颈动脉硬化:

logit(p)=-10.710 0.128*age-0.678*sex 0.176*hyper 0.015*sbp-0.012*dbp 0.151*fbg 0.231*ldl 0.003*gtt-0.058*dbil

(p:预测疾病发生的概率;age:年龄(岁);sex:性别(女=1,男=0);hyper:高血压(是=1,否=0);sbp:收缩压(mmhg);dbp:舒张压(mmhg);fbg:空腹血糖(mmol/l);ldl:低密度脂蛋白胆固醇(mmol/l);ggt:γ-谷氨酰转肽酶(u/l))

如表2所示,颈动脉斑块预测模型最终纳入了9个自变量,其中较大的年龄、高血压病、高收缩压、高空腹血糖、高ggt、高ldl-c(p=0.0878)为颈动脉斑块的重要危险因素,女性、高舒张压和高直接胆红素为其保护因素。颈动脉硬化结果与颈动脉斑块相似(表3)。

5)预测模型评价:根据建模组与验证组模型roc的auc评价模型的区分度(discrimination),根据预测模型的校准曲线评价模型的校准度(calibration),将模型约登指数最大值对应的概率作为诊断阈值,评价预测结果的准确率。

如图1所示,颈动脉斑块预测模型建模组的auc为0.8877,验证组为0.8854。颈动脉硬化预测模型建模组的auc为0.9088,验证组为0.8973(图2)。

颈动脉斑块预测模型建模组的最大约登指数为0.61,其对应的诊断切点值为0.28,相应的灵敏度与特异度分别为0.79、0.82,模型准确率为81.1%。以建模组最大约登指数对应的切点值作为诊断截断点带入验证组,其对应的灵敏度与特异度分别为0.79、0.81,模型准确率为80.2%;颈动脉硬化预测模型建模组的最大约登指数为0.65,其对应切点值为0.27,相应的灵敏度与特异度分别为0.84、0.81,模型准确率为81.8%。将建模组最大约登指数对应的诊断切点值带入验证组,验证组的灵敏度与特异度分别为0.83、0.80,模型预测准确率为80.7%(表4)。通过绘制预测模型校准曲线,可见颈动脉斑块预测模型与颈动脉硬化预测模型的校准曲线与对角线(完全校准)均较为接近,说明模型具有良好的校准度(图3)。

综上,本发明通过对大样本普通体检人群数据的分析,建立了有效的颈动脉斑块与颈动脉硬化的预测模型,方便医疗工作者与个人对颈动脉斑块与颈动脉硬化的风险进行预测与预警。

专业术语解释:

颈动脉硬化:颈动脉硬化即颈动脉粥样硬化,是全身动脉粥样硬化在颈动脉的表现,通常在青少年时期发生,随着年龄增长而逐渐加重。目前认为与老年人缺血性脑卒中的发生密切相关。颈动脉硬化早期首先表现为内膜-中膜增厚,然后逐渐形成粥样硬化斑块,在此基础上出现斑块内出血、斑块破裂脱落、附壁血栓形成及继发血管狭窄等,引起相应的血流动力学改变,导致缺血性脑血管事件的发生。

颈动脉斑块:颈动脉斑块是颈动脉粥样硬化的表现,好发于颈总动脉分叉处,目前认为与老年人缺血性脑卒中的发生密切相关。临床上,通过对颈动脉的狭窄程度及斑块的形态学测定,来对颈动脉斑块进行评价,判断其危害性。

roc:接受者操作特性曲线(receiveroperatingcharacteristiccurve,简称roc曲线),又称为感受性曲线(sensitivitycurve)。得此名的原因在于曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,只不过是在几种不同的判定标准下所得的结果而已。接受者操作特性曲线就是以虚惊概率为横轴,击中概率为纵轴所组成的坐标图,和被试在特定刺激条件下由于采用不同的判断标准得出的不同结果画出的曲线。

auc:auc(areaundercurve)被定义为roc曲线下与坐标轴围成的面积,auc的取值范围在0.5和1之间,约接近1说明模型的预测效果越好。

区分度:一个好的疾病风险预测模型,它能够把未来发病风险高、低不同的人群正确地区分开来,预测模型通过设置一定的风险界值,高于界值判断为发病,低于界值则判断为不发病,从而正确区分个体是否会发生结局事件,这就是预测模型的区分度(discrimination)。

校准度:预测模型的校准度(calibration),是评价一个疾病风险模型预测未来某个个体发生结局事件概率准确性的重要指标,它反映了模型预测风险与实际发生风险的一致程度,所以也可以称作为一致性。校准度好,提示预测模型的准确性高,校准度差,则模型有可能高估或低估疾病的发生风险。

本发明中所用原料、设备,若无特别说明,均为本领域的常用原料、设备;本发明中所用方法,若无特别说明,均为本领域的常规方法。

以上所述,仅是本发明的较佳实施例,并非对本发明作任何限制,凡是根据本发明技术实质对以上实施例所作的任何简单修改、变更以及等效变换,均仍属于本发明技术方案的保护范围。


技术特征:

1.一种针对普通人群的颈动脉硬化与颈动脉斑块预测模型的建立方法,其特征在于包括以下步骤:

1)建模人群选取:选取普通人群作为建模人群;

2)信息收集:收集建模人群的以下信息:

a)性别、年龄和既往病史;

b)生理测量数据:包括身高、体重和血压;

c)实验室生化检测数据:包括碱性磷酸酶、丙氨酸氨基转移酶、γ-谷氨酰转肽酶、总胆红素、直接胆红素、间接胆红素、空腹血糖、血清总胆固醇、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、甘油三酯、尿酸、体质指数和血红蛋白;

d)颈动脉内膜中层厚度imt数据;

3)建模人群分组:以两侧颈动脉imt最大值作为评价指标,将建模人群分为正常组和异常组;

4)统计建模:随机抽取一定数量的样本作为建模组,选取正常组与异常组之间差异具有统计学意义的变量,及既往研究发现的相关因素作为自变量,将其纳入多因素logistic回归模型建立预测模型,使用逐步回归法筛选出最终的变量,将建立的预测模型用剩余样本作为验证组进行验证,使用roc的auc、约登指数、灵敏度、特异度、准确率和校准度评价模型预测效能;

5)预测模型评价:根据建模组与验证组模型roc的auc评价模型的区分度,根据预测模型的校准曲线评价模型的校准度,将模型约登指数最大值对应的概率作为诊断阈值,评价预测结果的准确率。

2.如权利要求1所述的方法,其特征在于,步骤1)中,所述普通人群排除:①恶性肿瘤患者;②结缔组织系统疾病患者;③血液系统疾病患者;④自身免疫系统疾病患者;⑤骨质疏松患者;⑥肝肾损害患者;⑦精神障碍患者。

3.如权利要求1所述的方法,其特征在于,步骤3)中,评价指标为:正常组:imt<0.9mm;异常组:颈动脉粥样硬化0.9≤imt<1.3;动脉硬化斑块为imt≥1.3mm,或局部病灶厚度超过周围厚度50%,伴或不伴钙化管腔狭窄且未造成管腔闭塞。

4.如权利要求1所述的方法,其特征在于,步骤4)中,建模组的数量为建模人群的70-80%。

5.如权利要求1所述的方法,其特征在于,步骤4)中,所述相关因素包括性别、年龄、血压、低密度脂蛋白胆固醇、空腹血糖、γ-谷氨酰转肽酶和胆红素。

6.如权利要求1所述的方法,其特征在于,步骤4)中,建模组的数量为建模人群的70%。

7.如权利要求1或5或6所述的方法,其特征在于,步骤4)中,在使用逐步回归法筛选出最终的变量时,变量进入与保留在模型的显著性水平界值均为0.05-0.1。

8.如权利要求7所述的方法,其特征在于,步骤4)中,在使用逐步回归法筛选出最终的变量时,变量进入与保留在模型的显著性水平界值均为0.10。

技术总结
本发明涉及医学技术领域,公开了一种针对普通人群的颈动脉硬化与颈动脉斑块预测模型的建立方法,包括:1)选取普通人群作为建模人群;2)信息收集;3)建模人群分组:以两侧颈动脉IMT最大值作为评价指标,将建模人群分为正常组和异常组;4)统计建模;5)预测模型评价。本发明预测模型适用于普通体检人群而非仅针对高危人群;该模型具有较高的预测效率,AUC均达到0.88以上,且准确率均在80%以上。

技术研发人员:余运贤;邵布勒;莫敏佳
受保护的技术使用者:浙江大学
技术研发日:2019.11.06
技术公布日:2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-34653.html

最新回复(0)