基于精神病临床高危人群脑电信号特征的风险预测方法与流程

专利2022-06-29 87

本发明属于精神病发病风险预估计算机辅助技术领域，具体涉及一种基于精神病临床高危人群脑电信号特征的风险预测方法。

背景技术：

据2016年我国疾控公布的数据显示重性精神病在中国有1600万，目前国内外对于这类重性精神障碍的诊治往往处于严重滞后的状态，平均的未治疗期在2年以上，这也是治疗一直没有实质性突破的一个重要原因，即现有的治疗策略往往侧重于应对精神分裂症发病之后的症状和功能，甚至在疾病迁延至慢性期才进行治疗。最近20年，有识之士纷纷将治疗的希望寄托在了早期或者超早期，这是精神医学进入预防医学的关键转变，也是阻断精神病发病进程的最佳时机。国际上精神分裂症早期识别标准——精神病高危综合征的概念早已成熟，相应的早期风险预测预警也越来越多地受到临床医生关注。所谓精神病高危人群指的是近期(多指定为1年内)出现精神病性症状，如幻觉、怪异的想法，但程度较轻往往具有一定的现实检验能力即自知力。例如，某人在3月前第一次出现耳闻人语，并能认为该幻听并非真实，则可认定其处于高危状态。然而，多年来的研究已充分证实：高危人群未来的2-3年时间转化为精神分裂症等精神病性障碍的比例不足三分之一。因此寻找能预测精神病发作的算法已成为各国学者们共同的目标。

但目前已有的预测产品都是基于临床评估或者认知行为特征进行预测，例如2016年cannon等利用美国napls-2(northamericanprodromelongitudinalstudy-phase2)的高危队列及其随访结局开发了一款预测模型，预测2年内发生精神病的准确率在71％左右，并将这款产品在网络上公开(http://riskcalc.org:3838/napls/)。虽然该预测器具有很好的应用潜力，但对于中国人群而言面临了两个重要的壁垒，首当其冲的是地区人群的差异性，该算法完全基于北美人群的特征进行开发，是否在中国人群中适用存疑。sharp项目组利用在中国上海从2011年至2015募集的300例随访2年的高危临床队列对该预测器的预测准度进行了验证，发现其准确性仅为63％，这就意味这可能有1/3的患者应用此预测器得到的结果是错误的，该结果已发表于美国精神病学杂志；其次，临床评估的数据主观性大，不同评估者可能就会形成不同的结果，评估人员对评估工具的了解和熟练程度、患者的配合和症状暴露程度、评估过程中双方的配合程度都会严重影响风险预测的准确性和可重复性，因此，风险预测需要更客观的指标来进一步实现。

脑电信号是反映人脑精神活动状态最直接的生物学特征标记。在疾病状态下，脑电信号在各类生物学标记中不但能反映脑功能异常状态的机制且满足大数据分析要求。但目前的脑电信号分析主要还是用于研究的组间比较，采用脑电诱发电位(erp)的方式进行记录。erp是受试者在外源刺激下对其进行认知加工时出现的电位变化，过程涉及人的注意、记忆、情绪等脑功能水平，是公认的作为精神分裂症等精神疾病的机制研究的一个重要方向。erp信号可以在一定程度上反映被试的脑功能异常状态，正如项目组前期的数据和国内外学者所报道的结果那样，基于不同范式下的erp成分，可以有效反映精神病患者的脑功能异常机制。以最早发现的erp的内源性成分p300为例，p300潜伏期、峰值改变均被证实与精神病状态下信息加工缺陷相关。项目组研究的高危人群的脑电检测结果显示，高危患者在p300、mmn等范式下，均表现出一定程度的受损，结合随访的数据可以进一步看到，在2年内发生转化(即发展为精神分裂症)的高危在基线时p300、mmn的波幅和潜伏期改变最明显，而未转化的高危患者的改变程度介于两者之间。这些数据足以支持开展基于机制服务于临床风险预测的转化。这些erp技术虽然在机制研究中有所建树，但目前并未在精神疾病的诊断领域真正有所应用。因此，单纯基于分组方法，以传统脑电成分分析方法为基础的预测模型，可能并不会在该领域带来突破性进展，特别是精神分裂症等精神病性障碍目前的机制还并不清楚，因此还需要另辟蹊径来实现风险预测的优化。在传统脑电信号的分析中对已知的数据范围中对机制解释好理解的数据进行分析，而事实上，脑电数据所包含的信息远不止于此，以毫秒为时间分辨率，以64导为空间信息，仅一个被试在5分钟内的信息量已是天文数字，这些信息在传统分析中都被过滤了。如果能有效利用，结果会如何？即使目前并不清楚这些信息所蕴含的生理学意义，但或许可以更有效地辅助进行分类预测。

技术实现要素：

有鉴于此，本发明的目的是提供一种基于精神病临床高危人群脑电信号特征的风险预测方法，以解决现有技术中的不足。

为了达到上述目的，本发明的目的是通过下述技术方案实现的：

提供一种基于精神病临床高危人群脑电信号特征的风险预测方法，其中，包括：

s1、构建机制驱动的第一模型：采集功能态的erp数据作为第一模型主要变量，通过基于经验和机制的特征遴选以减少特征数量；

s2、构建大数据驱动的第二模型：采集脑电静息态数据作为第二模型主要变量，通过采用rmt进行特征提取实现大数据分析，应用深度学习算法进行预算器的判别风险估计；

s3、通过集成学习整合第一模型和第二模型。

上述基于精神病临床高危人群脑电信号特征的风险预测方法，其中，在步骤s1中，以erp数据为基础，在第一模型建构时融入：a、oddball范式诱发的经典p300的潜伏期，p300潜伏期延长，提示被试的工作记忆网络受损导致了处理时间延长；b、novelp300范式诱发的新异p300幅值，幅值异常提示被试的脑功能突显网络的异常；c、oddball范式诱发的经典p300幅值；d、失匹配负波mmn，持续时间偏差刺激诱发的mmn成分幅值；将上述a、b、c和d四个指标整合成一个计算模型，以预估精神病发病风险，同时应用受试者工作特征曲线及其95％可信区间ci评估模型的准确性。

上述基于精神病临床高危人群脑电信号特征的风险预测方法，其中，在步骤s1中，脑电检测采用brainampdc脑电放大器采集64通道的eeg数据，eeg数据采集由brainvisionrecorder记录，采样带宽为0.05-200hz，采样率为1000hz，采集时所有导联的阻抗均降低到10kω以下；eeg数据预处理采用brainvisionanalyzer完成，eeg采集时参考导联为鼻尖，除mmn范式外，p300和听觉诱发反应任务的eeg信号将重新参考，采用双侧耳突的均值作为参考；mmn范式eeg采用鼻尖参照，以确保有效检测来源于颞叶发生源的信号。

上述基于精神病临床高危人群脑电信号特征的风险预测方法，其中，在步骤s2中，基于rmt的线性特征值统计量实现对高维数据矩阵的谱映射，建立新特征指标；通过rmt对深度神经网络误差曲面进行建模，研究hessian矩阵特征值分布；根据随机矩阵理论指导深度网络训练，通过惩罚hessian矩阵的谱范数对网络进行正则化。

上述基于精神病临床高危人群脑电信号特征的风险预测方法，其中，在步骤s3中，采用bagging集成方法，将加权投票的结果作为最终的输出。

本发明技术方案的有益效果是：

--根据脑电信号的预测模型计算出的风险度准确性在中国人群中应用显著优于现有技术，准确度从70％提高到了90％；

--基于脑电客观生物标记指标系统地探讨可预测精神病转化和疾病进展的特征，与其他全球性长期随访研究(两项)以及那些没有进行生物学标志检测的研究相比，提供的精神病相关风险模型更加可靠和客观；

--本法计算得出的风险是将机制驱动和大数据驱动结合引入精神病发病预测中，用机制驱动模型实现预测的合理性，用大数据的处理能力实现预测的准确度，进一步将各种神经相关信息标记降维，拟合复杂信号，应用深度学习和随机矩阵理论，构建预测风险的算法，使科研数据更好地服务于临床；

--在一个项目中主要针对的是精神病临床高危者这一特殊队列研究，随访临床高危者可以将精神病发作的全过程连续起来，这样在较短的时间窗口内获得对精神病全病程风险的系统观察和监控，为提供有关精神病发作过程中风险评估和干预更加实用的临床工具。

附图说明

图1为本发明方法流程示意图；

图2为本发明脑电大数据驱动预测风险的分析路径示意图；

图3为本发明脑诱发电位p300信号采集实验示意图；

图4为本发明脑诱发电位失匹配负波mmn信号采集实验示意图；

图5为本发明大数据分析示意图；

图6为本发明结果输出示意说明图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明，但不作为本发明的限定。

参看图1所示，本发明基于精神病临床高危人群脑电信号特征的风险预测方法包括：s1、构建机制驱动的第一模型：采集功能态的erp数据作为第一模型主要变量，通过基于经验和机制的特征遴选以减少特征数量；s2、构建大数据驱动的第二模型：采集脑电静息态数据作为第二模型主要变量，通过采用rmt进行特征提取实现大数据分析，应用深度学习算法进行预算器的判别风险估计；s3、通过集成学习整合第一模型和第二模型。

其中，机制驱动的第一模型主要变量来自于erp数据，即失听觉匹配负波(mmn)和听觉oddballp300(经典和新奇)。因为传统建模需要用到回归任务，采用简单的线性回归，以保证模型的可解释性，但随着特征的增多，简单线性回归往往会出现多重共线性的问题。而且随着特征的增多，多项式会变得非常臃肿，即便采用了岭回归和弹性网等方式，仍然无法有效解决高维空间的特征间复杂的非线性组合。因此，项目通过基于经验和机制的特征遴选，以减少特征的数量，使得回归分析的可解释性得到最大的保留。大数据驱动的模型主要变量来自于脑电静息态数据。大数据分析的特征提取采用的是随机矩阵理论(randommatrixtheoryrmt)的算法，rmt是基于以随机变量为元素的矩阵，通过比较随机的多维时间序列统计特性，可以体现实际数据中的相关性，以及其偏离随机分布属性的程度，并揭示实际数据中整体关联的行为特性。此前，基于rmt，在大规模脑电信号的研究中，发现以脑电波构建的随机矩阵的本征值的分布，能够很好的刻画各类精神疾病的相关性，以及能针对异常信号做出迅速响应。在预算器的判别风险估计中，应用了深度学习的算法，其本质是通过构建多隐层的模型和海量训练数据(可为无标签数据)，来学习更有用的特征，从而最终提升分类或预测的准确性，也就是说“深度模型”是手段，“特征学习”是目的。该方法与传统的渐层机器学习区别，算法强调了模型结构的深度，通常有5层以上的多层的隐层节点；而且还明确突出了特征学习的重要性，通过逐层特征变换，将样本在原空间的特征表示变换到一个新特征空间，从而使分类或预测更加容易。与人工规则构造特征的方法相比，利用大数据来学习特征，更能够刻画数据的丰富内在信息(参见图2)。

不论是机制驱动的模型还是大数据驱动的模型都可能各有优势，基于不同模型预测的危险度需要整合起来，以达到提高预测准度的效果。比如，机制驱动的模型在某些样本上预测失误，但大数据驱动的模型却可以将这些样本预测准确，但把两者结合在一起，就有望使准确率得到提升。这里就需要用到所谓的集成学习。

步骤s1中用于建立模型的数据基础来自本研究小组在2011年-2016年募集的精神病高危人群的300例，已采集的功能态的erp数据(20分钟)，所有入组对象完成纵向多节点随访2年，明确临床转归结局。

脑电检测将采用德国brainampdc(brainproducts)脑电放大器，采集64通道的eeg数据。eeg数据采集由brainvisionrecorder记录，采样带宽为0.05-200hz，采样率为1000hz。采集时所有导联的阻抗均降低到10kω以下。eeg数据预处理采用brainvisionanalyzer软件包完成。eeg采集时参考导联为鼻尖，除mmn范式外，p300和听觉诱发反应任务的eeg信号将重新参考，采用双侧耳突的均值作为参考；而mmn范式eeg仍采用鼻尖参照，以确保可以有效检测来源于颞叶发生源的信号。

用于模型建构的任务态脑电变量包括：首先采用brainvisionanalyzer软件包完成eeg数据的预处理，包括将eeg原始数据按照刺激发生前后的特定时间窗进行分段，并对其进行合适的低通滤波，gratton法去眨眼伪迹等。经典p300分析主要提取靶p300振幅(p300b)，从fz、cz和pz导联中的靶刺激诱发的事件相关电位中获得，以及两侧的颞叶导联(t3和t4)的偏侧差异特征。新颖p300分析我们主要提取的是测量早期最初的正向波峰(新奇p300a)和紧随其后的晚期最高正向波峰(新奇p300b)，其中p300a成分出现在刺激后225ms和325ms之间。这些p300特征已被证实与精神分裂症的工作记忆异常有关。失匹配负波(mmn)将提取mmn潜伏期数据，选择fz导联在刺激后100ms和300ms之间的最负峰值，mmn波幅将测量刺激后100ms和200ms之间差异波形的平均幅值。这些特征已被证实与精神分裂症患者前注意加工异常相关。

听觉oddballp300和novelp300范式(参见图3)：两个范式检测时间总计20分钟。由oddballp300范式检查经典p300成分，novelp300检测新异p300成分。oddballp300范式总刺激数为200个，其中30个为靶向刺激。isi为800-1200ms内的随机数，平均1s。novelp300范式在oddballp300范式中，增加了一类新异刺激(持续时间300ms,70dbspl)，声音刺激采用环境声音(例如狗叫声、关门声)等。

失匹配负波(mmn)(参见图4)：检测时间约为10分钟。听觉刺激分为标准刺激和偏差刺激，偏差刺激包含两类，一类为频率偏差刺激(与标准刺激采用不同频率的纯音)，一类为持续时间偏差刺激(与标准刺激采用持续时间不同的纯音)。总刺激数为825个，其中675个标准刺激、75个频率偏差刺激和75个持续时间偏差刺激。刺激间间隔(isi)为330ms。mmn为偏差刺激和标准刺激诱发的波形的差异波，出现在前额叶导联fz部位，刺激出现后100-300ms时间内的负波。mmn波幅由100-200ms窗口内的平均幅值计算。

以erp数据为基础，在模型建构时融入：(a)oddball范式诱发的经典p300的潜伏期，p300潜伏期延长，提示被试的工作记忆网络受损是导致了处理时间延长。(b)novelp300范式诱发的新异p300幅值，幅值异常提示被试的脑功能突显网络的异常。(c)oddball范式诱发的经典p300幅值。(d)失匹配负波(mmn)，持续时间偏差刺激诱发的mmn成分幅值。上述指标整合一个计算模型，来预估精神病发病风险。应用“受试者工作特征曲线(receiveroperatingcharacteristiccurve，auc)”及其95％可信区间ci来评估模型的准确性。auc可以提供评估诊断准确性的单一指标，独立于结局指标基准率。同时，该模型预测的灵敏度、特异性、阳性和阴性预测效能均将得到验证。

步骤s2中用于建立模型的数据基础来自本研究小组在2011年-2016年募集的精神病高危人群的300例，已采集的静息态的erp数据(10分钟)，所有入组对象完成纵向多节点随访2年，明确临床转归结局。

基于机器学习的大数据驱动的风险预测模型：以静息脑电数据为基础，通过一种基于随机矩阵理论的数据分析算法集，从各种不同类型的数据中引申出一种高维统计指标，通过机器学习的方法进行相关的数据分析，并将这种分析方法集中到预测模型(参见图5)，形成精神病患病风险的估计值(及可信区间)。

结合随机矩阵理论研究深度神经网络系统是本案的一个重要关键技术：将统计、物理学科中出现的先进的随机矩阵理论与在工程实践中效果卓越的神经网络结合，具有极高的学术意义与工程价值：

1.基于随机矩阵理论(rmt)的线性特征值统计量(les)是一种对高维数据矩阵的谱映射，并且可以定义任意映射函数(只要函数是光滑的)。由此可以从高维时间和空间的视角观测数据，从而建立一种新的特征指标。

2.通过随机矩阵理论对深度神经网络误差曲面进行建模非常自然：大型神经网络的误差曲面是一个拥有很多驻点(极大、极小点以及鞍点)的复杂高维空间，刻画误差曲面的关键在于研究hessian矩阵特征值的分布；

3.根据随机矩阵理论指导深度网络训练非常有效：随机矩阵理论表明大多数局部极小点是泛化能力上是等价的，而训练时，网络往往容易收敛到鞍点，这将极大影响到网络的泛化能力，根据随机矩阵模型，通过惩罚hessian矩阵的谱范数，对网络进行正则化，可以提高网络的泛化能力。

步骤s3中，机制驱动的模型和大数据驱动的模型刚好满足了集成学习中的每一个学习器尽可能的不同的要求(即差异化模型，在本案中实现差异化的方法：对于同样的数据，采用不同的算法去构建模型)。在本案中，将利用机制预测模型和大数据预测模型的分析结果，整合集成学习方法，将采用经典的bagging集成方法，即采用加权投票法，将投票的结果作为最终的输出(参见图6)。

本发明能够快速准确确定高危患者的风险度，实现风险精准识别，将前期积累的大数据转化为真正临床可用的基于脑电生物学标记的风险预测工具——脑电版精神病发病预测模型，并进一步突破napls-2预测器仅仅局限于行为学特征来预测的不足，不但引入脑电信号这一生物学标记，还将随机矩阵、深度学习等复杂大数据分析引入到预测模型中，同时将传统脑电信号分析与大数据分析结合，取长补短，依托数据却也不盲信数据，更全面地实现适用中国人群的精神病发病脑电预测模型。

以上仅为本发明较佳的实施例，并非因此限制本发明的实施方式及保护范围，对于本领域技术人员而言，应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案，均应当包含在本发明的保护范围内。

技术特征：

1.一种基于精神病临床高危人群脑电信号特征的风险预测方法，其特征在于，包括：

s1、构建机制驱动的第一模型：采集功能态的erp数据作为第一模型主要变量，通过基于经验和机制的特征遴选以减少特征数量；

s3、通过集成学习整合第一模型和第二模型。

2.如权利要求1所述基于精神病临床高危人群脑电信号特征的风险预测方法，其特征在于，在步骤s1中，以erp数据为基础，在第一模型建构时融入：a、oddball范式诱发的经典p300的潜伏期，p300潜伏期延长，提示被试的工作记忆网络受损导致了处理时间延长；b、novelp300范式诱发的新异p300幅值，幅值异常提示被试的脑功能突显网络的异常；c、oddball范式诱发的经典p300幅值；d、失匹配负波mmn，持续时间偏差刺激诱发的mmn成分幅值；将上述a、b、c和d四个指标整合成一个计算模型，以预估精神病发病风险，同时应用受试者工作特征曲线及其95％可信区间ci评估模型的准确性。

3.如权利要求2所述基于精神病临床高危人群脑电信号特征的风险预测方法，其特征在于，在步骤s1中，脑电检测采用brainampdc脑电放大器采集64通道的eeg数据，eeg数据采集由brainvisionrecorder记录，采样带宽为0.05-200hz，采样率为1000hz，采集时所有导联的阻抗均降低到10kω以下；eeg数据预处理采用brainvisionanalyzer完成，eeg采集时参考导联为鼻尖，除mmn范式外，p300和听觉诱发反应任务的eeg信号将重新参考，采用双侧耳突的均值作为参考；mmn范式eeg采用鼻尖参照，以确保有效检测来源于颞叶发生源的信号。

4.如权利要求1所述基于精神病临床高危人群脑电信号特征的风险预测方法，其特征在于，在步骤s2中，基于rmt的线性特征值统计量实现对高维数据矩阵的谱映射，建立新特征指标；通过rmt对深度神经网络误差曲面进行建模，研究hessian矩阵特征值分布；根据随机矩阵理论指导深度网络训练，通过惩罚hessian矩阵的谱范数对网络进行正则化。

5.如权利要求1所述基于精神病临床高危人群脑电信号特征的风险预测方法，其特征在于，在步骤s3中，采用bagging集成方法，将加权投票的结果作为最终的输出。

技术总结
本发明公开了一种基于精神病临床高危人群脑电信号特征的风险预测方法，包括：构建机制驱动的第一模型：采集功能态的ERP数据作为第一模型主要变量，通过基于经验和机制的特征遴选以减少特征数量；构建大数据驱动的第二模型：采集脑电静息态数据作为第二模型主要变量，通过采用RMT进行特征提取实现大数据分析，应用深度学习算法进行预算器的判别风险估计；通过集成学习整合第一模型和第二模型。本发明模型预估准确度大大提高，更加可靠和客观，使科研数据更好地服务于临床，为提供有关精神病发作过程中风险评估和干预更加实用的临床工具。

技术研发人员：王继军;张天宏;唐莺莹;唐晓晨;徐丽华;魏燕燕;崔慧茹;胡业刚;钱禛颖
受保护的技术使用者：上海市精神卫生中心(上海市心理咨询培训中心)
技术研发日：2020.01.17
技术公布日：2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-28838.html

专利

最新回复(0)