本发明属于医疗影像处理技术领域,具体涉及一种支持向量数据描述的胸部影像异常检测方法。
背景技术:
伴随着社会的进步,医疗行业有了极大的发展,人们对于医疗的需求也越来越大。然而,目前影像科医生的培养周期长速度慢,跟不上医疗需求的发展速度,因此现在的医学影像自动化判断至关重要。医疗影像的异常检测,如骨骼x光片的异常检测,胸部ct影像的异常检测,肿瘤ct影像的异常检测,腹部彩超影像的异常检测等具有重要的临床应用价值。异常检测模型可以用于降低影像科医生的工作量,提高诊断的效率,通过检测到的异常达到一个预诊断的效果,帮助临床医生给出更好的诊断方向和建议。
传统的计算机辅助诊断通过手工提取的haar-like和hog特征以及使用灰度共生矩阵计算得到纹理特征等并结合svm分类器判断是否存在异常。但是,由于传统方法往往只能提取初级特征,随着样本数量的增大以及样本多样性增强,传统的方法存在表示能力有限、学习能力不强等问题。随着计算机技术的发展,目前提出了基于深度卷积神经网络的分类模型,通过传入标记后的数据进行有监督地学习,并根据学习到的特征进行分类判断。但是这个方法也存在一定不足:胸部影像数据集属于异常数据和正常数据在数量上差别很大的不平衡数据集,因此传统的有监督学习对数据的特征提取能力不够,会丢失一部分特征信息,进而影响识别的准确率。因此,如何在数据集中获得表征能力强,泛化性能好,识别率高的异常检测模型是一个关键问题。
技术实现要素:
本发明的目的就是针对现有胸部ct影像异常检测算法中存在的问题,提供一种支持向量数据描述的胸部影像异常检测方法,能够自动地提取图像深层次抽象特征,提高特征识别能力,以提高对异常数据的检测率。
本发明方法包括训练阶段和测试阶段。
训练阶段具体方法是:
步骤(1).获取训练数据集;训练数据集由正常胸部影像数据构成,对训练数据集进行尺度规范化,并进行灰度归一化处理,将数据灰度值缩小到0到1。
步骤(2).构建和训练深度稀疏变分自编码器。
深度稀疏变分自编码器包括编码网络和解码网络;编码网络对输入数据进行特征提取,并重采样形成新特征;解码网络对编码网络生成的新特征进行解码,解码网络输出的数据和编码网络输入的数据相同。
编码网络依次由卷积模块层、全连接层、采样层模块和隐藏层构成。
卷积模块层由三个卷积模块构成,每个卷积模块依次为多个大小是3×3的卷积核,池化层为核大小是2×2的最大池化层,池化层后接激活层。第一卷积模块卷积核数量为32,第二卷积模块卷积核数量为64,第三卷积模块卷积核数量为128。所有卷积核滑动步长为2,零边缘填充为1,激活层均使用relu函数作为激活函数。
卷积模块层后连接一个全连接层,全连接层输入维数为2048,输出维数为1024。
采样模块层包括三个并联的采样层,分别用于生成隐藏层隐变量z的均值μ、对数方差σ2、对数峰值概率γ,
隐藏层用于生成隐变量z,
解码网络依次由四个反卷积层和一个激活层构成。
第一反卷积层包含128个大小是3×3的卷积核,第二反卷积层包含64个大小是3×3的卷积核,第三反卷积层包含32个大小是3×3的卷积核,该三个反卷积层卷积核滑动步长均为4;第四反卷积层包含1个大小是3×3的卷积核,卷积核滑动步长为1。
激活层函数使用sigmoid函数,用于复原输入数据。
使用钉板分布作为先验模拟zi所在空间的稀疏性。钉板分布定义在两个变量上:二元尖峰变量和连续平板变量。连续平板变量为高斯分布。尖峰变量取值为1或0,分别具有定义的概率α和1-α。训练的目标函数如下:
训练结束时获得训练数据集的隐藏层特征的均值c,
步骤(3).构建和训练深度支持向量数据描述网络。
在深度稀疏变分自编码器的基础上构建深度支持向量数据描述网络。深度支持向量数据描述网络由步骤(2)训练得到的编码网络和全连接层组成。将训练数据输入到深度支持向量数据描述网络,以训练阶段结束时得到的均值c作为超球体中心,该模型训练的目标函数为全连接层输出特征到超球体中心的欧氏距离。训练优化器采用adam优化器,采用自适应下降的学习率在训练数据集上训练迭代m_1次结束,批大小为b_2,80≤m_1≤120,
10≤b_2≤20。
测试阶段具体方法是:
步骤(ⅰ).对测试图像进行尺度规范化,并进行灰度归一化处理,将数据灰度值缩小到0到1,得到测试数据xti,
步骤(ⅱ).将测试数据xti输入到训练好的深度支持向量数据描述网络中,得到输出zti,
本发明含有一种高效实用的自编码方法,在特征提取方面,采用了变分稀疏自编码器来进行特征学习,为了增加特征的稀疏性,采用了钉板分布作为先验来模拟潜在空间的稀疏性,得到稀疏特征可以更好地学到输入数据内在的结构和特征,具有较高的特征提取能力和较强的鲁棒性,同时具有较高的检测准确性。本发明使用超球体来分离数据,通过最小化所有数据到中心的平均距离,惩罚所有数据点,将数据点紧密的映射到超球体的中心,进而达到更快的训练速度和效果。
具体实施方式
下面结合实例对本发明加以详细说明。需要特别提醒注意的是,在以下的描述中,当已知的功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
一种支持向量数据描述的胸部影像异常检测方法,该方法包括训练阶段和测试阶段。
训练阶段具体方法是:
步骤(1).获取训练数据集。训练数据集由正常胸部影像数据构成,对训练数据集进行尺度规范化,并进行灰度归一化处理,将数据灰度值从0到255等比例缩小到0到1。
步骤(2).构建和训练深度稀疏变分自编码器。
深度稀疏变分自编码器包括编码网络和解码网络;编码网络对输入数据进行特征提取,并重采样形成新特征;解码网络对编码网络生成的新特征进行解码,解码网络输出的数据和编码网络输入的数据相同。
编码网络依次由卷积模块层、全连接层、采样层模块和隐藏层构成。
卷积模块层由三个卷积模块构成,每个卷积模块依次为多个大小是3×3的卷积核,池化层为核大小是2×2的最大池化层,池化层后接激活层。第一卷积模块卷积核数量为32,第二卷积模块卷积核数量为64,第三卷积模块卷积核数量为128。所有卷积核滑动步长为2,零边缘填充为1,激活层均使用relu函数作为激活函数。
卷积模块层后连接一个全连接层,全连接层输入维数为2048,输出维数为1024。
采样模块层包括三个并联的采样层,分别用于生成隐藏层隐变量z的均值μ、对数方差σ2、对数峰值概率γ,
隐藏层用于生成隐变量z,
解码网络依次由四个反卷积层和一个激活层构成。
第一反卷积层包含128个大小是3×3的卷积核,第二反卷积层包含64个大小是3×3的卷积核,第三反卷积层包含32个大小是3×3的卷积核,该三个反卷积层卷积核滑动步长均为4;第四反卷积层包含1个大小是3×3的卷积核,卷积核滑动步长为1。
激活层函数使用sigmoid函数,用于复原输入数据。
使用钉板分布作为先验模拟zi所在空间的稀疏性。钉板分布是一个具有稀疏性的离散混合模型。钉板分布定义在两个变量上:二元尖峰变量和连续平板变量。连续平板变量为高斯分布。尖峰变量取值为1或0,分别具有定义的概率α和1-α。训练的目标函数如下:
训练结束时获得训练数据集的隐藏层特征的均值c,
步骤(3).构建和训练深度支持向量数据描述网络。
在深度稀疏变分自编码器的基础上构建深度支持向量数据描述网络。深度支持向量数据描述网络由步骤(2)训练得到的编码网络和全连接层组成。将训练数据输入到深度支持向量数据描述网络,以训练阶段结束时得到的均值c作为超球体中心,该模型训练的目标函数为全连接层输出特征到超球体中心的欧氏距离。训练优化器采用adam优化器,采用自适应下降的学习率在训练数据集上训练迭代m_1次结束,批大小为b_2,80≤m_1≤120,10≤b_2≤20。本实施例采用自适应下降的学习率训练迭代100次结束,批大小采用20。
测试阶段具体方法是:
步骤(ⅰ).对测试图像进行尺度规范化,并进行灰度归一化处理,将数据灰度值从0到255等比例缩小到0到1,得到测试数据xti,
步骤(ⅱ).将测试数据xti输入到训练好的深度支持向量数据描述网络中,得到输出zti,
1.一种支持向量数据描述的胸部影像异常检测方法,包括训练阶段和测试阶段,其特征在于:
所述的训练阶段具体方法是:
步骤(1).获取训练数据集;
所述的训练数据集由正常胸部影像数据构成,对训练数据集进行尺度规范化,并进行灰度归一化处理,将数据灰度值缩小到0到1;
步骤(2).构建和训练深度稀疏变分自编码器;
所述的深度稀疏变分自编码器包括编码网络和解码网络;编码网络对输入数据进行特征提取,并重采样形成新特征;解码网络对编码网络生成的新特征进行解码,解码网络输出的数据和编码网络输入的数据相同;
所述的编码网络依次由卷积模块层、全连接层、采样层模块和隐藏层构成;
卷积模块层由三个卷积模块构成,每个卷积模块依次为多个大小是3×3的卷积核,池化层为核大小是2×2的最大池化层,池化层后接激活层;第一卷积模块卷积核数量为32,第二卷积模块卷积核数量为64,第三卷积模块卷积核数量为128;所有卷积核滑动步长为2,零边缘填充为1,激活层均使用relu函数作为激活函数;
卷积模块层后连接一个全连接层,全连接层输入维数为2048,输出维数为1024;
采样模块层包括三个并联的采样层,分别用于生成隐藏层隐变量z的均值μ、对数方差σ2、对数峰值概率γ,
隐藏层用于生成隐变量z,
解码网络依次由四个反卷积层和一个激活层构成;
第一反卷积层包含128个大小是3×3的卷积核,第二反卷积层包含64个大小是3×3的卷积核,第三反卷积层包含32个大小是3×3的卷积核,该三个反卷积层卷积核滑动步长均为4;第四反卷积层包含1个大小是3×3的卷积核,卷积核滑动步长为1;
激活层函数使用sigmoid函数,用于复原输入数据;
使用钉板分布作为先验模拟zi所在空间的稀疏性,钉板分布定义在两个变量上:二元尖峰变量和连续平板变量;连续平板变量为高斯分布;尖峰变量取值为1或0,分别具有定义的概率α和1-α;训练的目标函数如下:
训练结束时获得训练数据集的隐藏层特征的均值c,
步骤(3).构建和训练深度支持向量数据描述网络;
在深度稀疏变分自编码器的基础上构建深度支持向量数据描述网络;深度支持向量数据描述网络由步骤(2)训练得到的编码网络和全连接层组成;将训练数据输入到深度支持向量数据描述网络,以训练阶段结束时得到的均值c作为超球体中心,该模型训练的目标函数为全连接层输出特征到超球体中心的欧氏距离;训练优化器采用adam优化器,采用自适应下降的学习率在训练数据集上训练迭代m_1次结束,批大小为b_2;
测试阶段具体方法是:
步骤(ⅰ).对测试图像进行尺度规范化,并进行灰度归一化处理,将数据灰度值缩小到0到1,得到测试数据xti,
步骤(ⅱ).将测试数据xti输入到训练好的深度支持向量数据描述网络中,得到输出zti,
2.如权利要求1所述的一种支持向量数据描述的胸部影像异常检测方法,其特征在于:所述的函数sigmoid(k)=1/(1 e-k)。
3.如权利要求1所述的一种支持向量数据描述的胸部影像异常检测方法,其特征在于:600≤n_1≤1200,10≤b_1≤20。
4.如权利要求1所述的一种支持向量数据描述的胸部影像异常检测方法,其特征在于:80≤m_1≤120,10≤b_2≤20。
技术总结