技术领域:
本发明涉及到医疗图像分类,具体来说涉及一种用于微血管瘤病历图像的超平面近邻分类方法。
背景技术:
:
糖尿病是一种高发病率疾病,现已成为人类健康较大的威胁。糖尿病晚期的治疗代价是相当昂贵的,尽早检测糖尿病可以有效减少治疗成本。糖尿病往往会导致视网膜异常,这是一种糖尿病微血管并发症,被称为糖尿病性视网膜病变。眼底图像可以监测视网膜异常,所以眼底图像分类目前已成为糖尿病非入侵性检测的有效方法。眼底图像可通过分割病变区域转化为特征向量再用机器学习的方式进行分类预测,但鉴于特征向量的维度过高或是机器学习本身的不足等原因,分类准确度和效率有待提高。
支持向量机基本上不涉及概率测度及大数定律等,因此不同于现有的统计方法。从本质上看,它避开了从归纳到演绎的传统过程,实现了高效的从训练样本到预报样本的转导推理,大大简化了通常的分类和回归等问题。少数支持向量决定了最终结果,这不但可以帮助我们抓住关键样本、“剔除”大量冗余样本,而且注定了该方法不但算法简单,而且具有较好的鲁棒性。但是在分类超平面附近支持向量机的分类准确度往往不高。knn最近邻方法对数据没有假设,准确度高,对异常点不敏感,比较适用于样本容量比较大的类域的自动分类,训练时间复杂度比支持向量机低,但是总体分类准确度比不上支持向量机。传统knn最近邻方法通常使用欧式距离,计算量巨大。谱哈希对图像特征向量的编码过程可看作是图分割问题,借助于对相似图的拉普拉斯矩阵特征值和特征向量的分析可对图分割问题提供一个松弛解,通过对特征向量进行阈值化产生二值编码。二值码之间的汉明距离计算比起传统knn最近邻方法使用的欧式距离计算量极大减少。可以将三者结合更好地应用于图像特征分类。
技术实现要素:
:
本发明的目的是提供一种分类准确、迅速的用于微血管瘤病历图像的超平面近邻分类方法,具体步骤如下:
a、首先进行糖尿病性眼底病历图像预处理,采用中值滤波法去除病历图像背景,利用图像形态学去除病历血管结构,提取出图像中的病变信息,利用线性元素对图像进行腐蚀操作,并对糖尿病性眼底病历图像进行高斯滤波,增强微血管瘤区域对比度;
b、选择糖尿病性眼底病历图像中的微血管瘤病变作为模板匹配的目标,根据微血管瘤在病历图像中的灰度与形状参数,设计函数模型来匹配目标,使微血管瘤图像灰度服从高斯分布,函数模板的匹配公式为:
其中l为灰度最低值,h为灰度高度,e为自然底数,d为点到模板圆心的距离,r为半径,s为灰度陡峭度,(x0,y0)为微微血管瘤中心点;
c、将得到的微血管瘤病历病变图像形态学特征、纹理特征及灰度特征转化为l维数据向量xi=(xi1,xi2,...,xil),i=1,2,3...;
d、将微血管瘤病历图像数据分为训练数据xtr=(x1,x2,...,xn),n=1,2,3...和测试数据xte=(x1',x2',...,xm'),m=1,2,3...;
e、对微血管瘤病历图像训练数据xtr=(x1,x2,...,xn),n=1,2,3...进行训练得到一个包括分类超平面hyper、支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...、距离阈值t谱哈希编码码长nb和最近邻居个数k的分类模型model;
f、根据分类模型model在对微血管瘤病历图像测试集数据xte=(x1',x2',...,xm'),m=1,2,3...,mte预测时先判断测试样本xi'=(xi1',xi2',...,xil'),i=1,2,...,m到分类超平面的距离disthyperi,i=1,2,k,m,是否大于距离阈值t,若测试样本xi'=(xi1',xi2',...,xil'),i=1,2,...,m到分类超平面的距离大于距离阈值t则使用支持向量机模型预测,若测试集数据到分类超平面的距离不大于距离阈值则使用结合谱哈希算法的近邻算法进行预测,最后综合得到预测结果yte=(y1',y2',...,ym'),m=1,2,3...。
本发明的进一步改进在于:所述步骤e具体为:对微血管瘤病历图像训练数据xtr=(x1,x2,...,xn),n=1,2,3...进行训练得到一个包括分类超平面hyper、支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...、距离阈值t谱哈希编码码长nb和最近邻居个数k的分类模型model;其步骤如下:
a、将微血管瘤病历图像训练数据xtr=(x1,x2,...,xn),n=1,2,3...,通过支持向量机模型训练得到支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...和分类超平面hyper:wt·x b=0,
其中w为分类超平面法向量,t为转置运算,b为偏置,x为超平面上的点;
b、计算微血管瘤病历图像训练数据xtr=(x1,x2,...,xn),n=1,2,3...到分类超平面hyper的距离矩阵disthyper=wt·xtr b;
c、通过设定的距离阈值t分别得到使用支持向量机进行预测的训练数据集xtrsvm={xi|disthyperi>t,i=1,2,...,n}和使用近邻算法进行预测的训练数据集xtrknn={xi|disthyperi≤t,i=1,2,...,n};
d、对微血管瘤病历图像训练数据集xtrsvm={xi|disthyperi>t,i=1,2,...,n},使用训练得到的支持向量机模型进行预测,求得微血管瘤病历图像预测标签集ytrsvm={yi|disthyperi>t,i=1,2,...,n};
e、对支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...,通过设定的码长nb用谱哈希方法训练出相应的参数shparam;
f、根据参数shparam将微血管瘤病历图像训练数据xtr=(x1,x2,...,xn),n=1,2,3...的支持向量集xsv=(x1”,x2”,...,xs”),s=1,2,3...和使用近邻算法进行预测的微血管瘤病历图像训练数据集xtrknn={xi|disthyperi≤t,i=1,2,...,n}通过谱哈希方法压缩为相同长度的二进制码;
g、计算微血管瘤病历图像训练数据集xtrknn={xi|disthyperi≤t,i=1,2,...,n}和支持向量集xsv=(x1”,x2”,...,xs”),s=1,2,3...压缩得到的二进制码,并计算全部二进制码对应的汉明距离存入汉明距离表dhamm_train中;
h、读取汉明距离表dhamm_train,取距离最近的前k个支持向量的标签,统计出现次数最多的标签记为微血管瘤病历图像训练数据集xtrknn={xi|disthyperi≤t,i=1,2,...,n}中对应样本的标签,得到微血管瘤病历图像训练集预测标签集ytrknn={yi|disthyperi≤t,i=1,2,...,n};
i、结合两部分预测标签集ytrsvm和ytrknn,求得微血管瘤病历图像训练集预测标签集ytr=(y1,y2,...,yn),n=1,2,3...,针对预测准确率对距离阈值t、二值码码长nb和最近邻居个数k三个参数寻优得到最优解;
j、得到包含分类超平面hyper、支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...、距离阈值t、谱哈希编码码长nb和最近邻居个数k的分类模型model。
本发明的进一步改进在于:所述步骤f具体为:根据分类模型model在对微血管瘤病历图像测试集数据xte=(x1',x2',...,xm'),m=1,2,3...预测时先判断测试样本xi'=(xi1',xi2',...,xil'),i=1,2,...,m到分类超平面的距离disthyperi,i=1,2,k,m,是否大于距离阈值t,若测试样本xi'=(xi1',xi2',...,xil'),i=1,2,...,m到分类超平面的距离大于距离阈值t则使用支持向量机模型预测,若测试集数据到分类超平面的距离不大于距离阈值则使用结合谱哈希算法的近邻算法进行预测,最后综合得到预测结果yte=(y1',y2',...,ym'),m=1,2,3...,其步骤如下:
a、计算微血管瘤病历图像测试数据xte=(x1',x2',...,xm'),m=1,2,3...到分类超平面hyper的距离矩阵disthyper=wt·xte b;
b、通过设定的距离阈值t分别得到使用支持向量机进行预测的微血管瘤病历测试数据集xtesvm={xi|disthyperi>t,i=1,2,...,m}和使用近邻算法进行预测的微血管瘤病历测试数据集xteknn={xi|disthyperi≤t,i=1,2,...,m};
c、对xtesvm={xi|disthyperi>t,i=1,2,...,m}使用训练得到的分类超平面hyper进行支持向量机模型预测得到预测标签集ytesvm={yi|disthyperi>t,i=1,2,...,m};
d、将微血管瘤病历测试数据集xteknn={xi|disthyperi≤t,i=1,2,...,m}和模型model中的支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...根据分类模型model中的谱哈希编码码长nb通过谱哈希方法压缩为相同长度的二进制码,计算全部二进制码对应的汉明距离存入汉明距离表dhamm_test中;
e、读取汉明距离表dhamm_test,取距离最近的前k个支持向量的标签,统计出现次数最多的标签记为微血管瘤病历图像测试数据集xteknn={xi|disthyperi≤t,i=1,2,...,m}中对应样本的标签得到微血管瘤病历预测标签集yteknn={yi|disthyperi≤t,i=1,2,...,m};
f、综合使用支持向量机模型进行预测得到的微血管瘤病历预测标签集ytesvm={yi|disthyperi>t,i=1,2,...,m}和使用结合谱哈希方法的最近邻算法进行预测得到的微血管瘤病历预测标签集yteknn={yi|disthyperi≤t,i=1,2,...,m},求得最终的微血管瘤病历预测结果yte=(y1',y2',...,ym'),m=1,2,3...。
本方法首先对糖尿病性眼底图像数据进行预处理和分割操作,从处理后的眼底病历图像中提取出微血管瘤病历图像的病变区域;接着将微血管瘤病变的图像区域形态学特征、纹理特征及灰度特征转化为l维数据向量xi;然后将数据分为训练数据xtr和测试数据xte,通过对训练数据xtr进行支持向量机训练得到一个包括分类超平面hyper、支持向量集合xsv、距离阈值t和谱哈希编码码长nb的高效分类模型;最后测试数据xte预测时依据测试样本到分类超平面hyper的距离与距离阈值t关系,分别采用支持向量机模型和融合谱哈希算法的近邻算法进行预测,并综合相关预测结果。
本发明与现有技术相比具有如下优点:
1、具有较好的分类准确性:本发明将近邻算法与支持向量机相结合,通过设定距离阈值t,将糖尿病性眼底图像数据分为使用支持向量进行分类的部分和使用近邻算法分类的部分,同时解决了在分类超平面附近支持向量机的分类准确度往往不高和近邻算法总体分类准确度比不上支持向量机的问题,很好地提高了分类准确性。
2、具有较好的快速性:本发明对于传统knn最近邻方法使用欧式距离计算量巨大的问题,选择将糖尿病性眼底图像数据中使用近邻算法分类的部分通过设定的谱哈希编码码长nb与糖尿病性眼底图像数据中使用支持向量进行分类的部分的支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...训练得到参数
附图说明
图1为本发明总体流程图;
图2为具体的联合分类器训练流程图;
图3为具体的联合分类器测试流程图。
具体实施方式
为了加深对本发明的理解,下面将结合实施例对本发明作进一步详述,该实施例仅用于解释本发明,并不构成对本发明保护范围的限定。
如图1-图3示出了一种用于微血管瘤病历图像的超平面近邻分类方法的具体实施方式:
具体步骤如下:
a、首先进行糖尿病性眼底病历图像预处理,采用中值滤波法去除病历图像背景,利用图像形态学去除病历血管结构,提取出图像中的病变信息,利用线性元素对图像进行腐蚀操作,并对糖尿病性眼底病历图像进行高斯滤波,增强微血管瘤区域对比度;
b、选择糖尿病性眼底病历图像中的微血管瘤病变作为模板匹配的目标,根据微血管瘤在病历图像中的灰度与形状参数,设计函数模型来匹配目标,使微血管瘤图像灰度服从高斯分布,函数模板的匹配公式为:
其中l为灰度最低值,h为灰度高度,e为自然底数,d为点到模板圆心的距离,r为半径,s为灰度陡峭度,(x0,y0)为微微血管瘤中心点;
c、将得到的微血管瘤病历病变图像形态学特征、纹理特征及灰度特征转化为l维数据向量xi=(xi1,xi2,...,xil),i=1,2,3...;
d、将微血管瘤病历图像数据分为训练数据xtr=(x1,x2,...,xn),n=1,2,3...和测试数据xte=(x1',x2',...,xm'),m=1,2,3...;
e、对微血管瘤病历图像训练数据xtr=(x1,x2,...,xn),n=1,2,3...进行训练得到一个包括分类超平面hyper、支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...、距离阈值t、最近邻居个数k和谱哈希编码码长nb的分类模型model;
具体包括以下步骤:对微血管瘤病历图像训练数据xtr=(x1,x2,...,xn),n=1,2,3...进行训练得到一个包括分类超平面hyper、支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...、距离阈值t谱哈希编码码长nb和最近邻居个数k的分类模型model;
其步骤如下:
a、将微血管瘤病历图像训练数据xtr=(x1,x2,...,xn),n=1,2,3...,通过支持向量机模型训练得到支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...和分类超平面hyper:wt·x b=0,
其中w为分类超平面法向量,t为转置运算,b为偏置,x为超平面上的点;
b、计算微血管瘤病历图像训练数据xtr=(x1,x2,...,xn),n=1,2,3...到分类超平面hyper的距离矩阵disthyper=wt·xtr b;
c、通过设定的距离阈值t分别得到使用支持向量机进行预测的训练数据集xtrsvm={xi|disthyperi>t,i=1,2,...,n}和使用近邻算法进行预测的训练数据集xtrknn={xi|disthyperi≤t,i=1,2,...,n}
d、对微血管瘤病历图像训练数据集xtrsvm={xi|disthyperi>t,i=1,2,...,n},使用训练得到的支持向量机模型进行预测,求得微血管瘤病历图像预测标签集ytrsvm={yi|disthyperi>t,i=1,2,...,n};
e、对支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...,通过设定的码长nb用谱哈希方法训练出相应的参数shparam;
f、根据参数shparam将微血管瘤病历图像训练数据xtr=(x1,x2,...,xn),n=1,2,3...的支持向量集xsv=(x1”,x2”,...,xs”),s=1,2,3...和使用近邻算法进行预测的微血管瘤病历图像训练数据集xtrknn={xi|disthyperi≤t,i=1,2,...,n}通过谱哈希方法压缩为相同长度的二进制码;
g、计算微血管瘤病历图像训练数据集xtrknn={xi|disthyperi≤t,i=1,2,...,n}和支持向量集xsv=(x1”,x2”,...,xs”),s=1,2,3...压缩得到的二进制码,并计算全部二进制码对应的汉明距离存入汉明距离表dhamm_train中;
h、读取汉明距离表dhamm_train,取距离最近的前k个支持向量的标签,统计出现次数最多的标签记为微血管瘤病历图像训练数据集xtrknn={xi|disthyperi≤t,i=1,2,...,n}中对应样本的标签,得到微血管瘤病历图像训练集预测标签集ytrknn={yi|disthyperi≤t,i=1,2,...,n};
i、结合两部分预测标签集ytrsvm和ytrknn,求得微血管瘤病历图像训练集预测标签集ytr=(y1,y2,...,yn),n=1,2,3...,针对预测准确率对距离阈值t、最近邻居个数k和谱哈希编码码长nb三个参数寻优得到最优解;
j、得到包含分类超平面hyper、支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...、距离阈值t、最近邻居个数k和谱哈希编码码长nb的分类模型model
f、根据分类模型model在对微血管瘤病历图像测试集数据xte=(x1',x2',...,xm'),m=1,2,3...,mte预测时先判断测试样本xi'=(xi1',xi2',...,xil'),i=1,2,...,m到分类超平面的距离disthyperi,i=1,2,k,m,是否大于距离阈值t,若测试样本xi'=(xi1',xi2',...,xil'),i=1,2,...,m到分类超平面的距离大于距离阈值t则使用支持向量机模型预测,若测试集数据到分类超平面的距离不大于距离阈值则使用结合谱哈希算法的近邻算法进行预测,最后综合得到预测结果yte=(y1',y2',...,ym'),m=1,2,3...;具体包括以下步骤:
根据分类模型mod在对微血管瘤病历图像测试集数据xte=(x1',x2',...,xm'),m=1,2,3...预测时先判断测试样本xi'=(xi1',xi2',...,xil'),i=1,2,...,m到分类超平面的距离disthyperi,i=1,2,k,m,是否大于距离阈值t,若测试样本xi'=(xi1',xi2',...,xil'),i=1,2,...,m到分类超平面的距离大于距离阈值t则使用支持向量机模型预测,若测试集数据到分类超平面的距离不大于距离阈值则使用结合谱哈希算法的近邻算法进行预测,最后综合得到预测结果yte=(y1',y2',...,ym'),m=1,2,3...,其步骤如下:
a、计算微血管瘤病历图像测试数据xte=(x1',x2',...,xm'),m=1,2,3...到分类超平面hyper的距离矩阵disthyper=wt·xte b;
b、通过设定的距离阈值t分别得到使用支持向量机进行预测的微血管瘤病历测试数据集xtesvm={xi|disthyperi>t,i=1,2,...,m}和使用近邻算法进行预测的微血管瘤病历测试数据集xteknn={xi|disthyperi≤t,i=1,2,...,m};
c、对xtesvm={xi|disthyperi>t,i=1,2,...,m}使用训练得到的分类超平面hyper进行支持向量机模型预测得到预测标签集ytesvm={yi|disthyperi>t,i=1,2,...,m};
d、将微血管瘤病历测试数据集xteknn={xi|disthyperi≤t,i=1,2,...,m}和模型model中的支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...根据分类模型model中的谱哈希编码码长nb通过谱哈希方法压缩为相同长度的二进制码,计算全部二进制码对应的汉明距离存入汉明距离表dhamm_test中;
e、读取汉明距离表dhamm_test,取距离最近的前k个支持向量的标签,统计出现次数最多的标签记为微血管瘤病历图像测试数据集xteknn={xi|disthyperi≤t,i=1,2,...,m}中对应样本的标签得到微血管瘤病历预测标签集yteknn={yi|disthyperi≤t,i=1,2,...,m};
f、综合使用支持向量机模型进行预测得到的微血管瘤病历预测标签集ytesvm={yi|disthyperi>t,i=1,2,...,m}和使用结合谱哈希方法的最近邻算法进行预测得到的微血管瘤病历预测标签集yteknn={yi|disthyperi≤t,i=1,2,...,m},求得最终的微血管瘤病历预测结果yte=(y1',y2',...,ym'),m=1,2,3...。
本发明具有较好的分类准确性:本发明将近邻算法与支持向量机相结合,通过设定距离阈值t,将糖尿病性眼底图像数据分为使用支持向量进行分类的部分和使用近邻算法分类的部分,同时解决了在分类超平面附近支持向量机的分类准确度往往不高和近邻算法总体分类准确度比不上支持向量机的问题,很好地提高了分类准确性。具有较好的快速性:本发明对于传统knn最近邻方法使用欧式距离计算量巨大的问题,选择将糖尿病性眼底图像数据中使用近邻算法分类的部分通过设定的谱哈希编码码长nb与糖尿病性眼底图像数据中使用支持向量进行分类的部分的支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...训练得到参数shparam_train,并根据参数shparam_train将糖尿病性眼底图像数据中使用近邻算法分类的部分xteknn={xi|disthyperi≤t,i=1,2,...,m}与支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...压缩为相同长度的二值码,然后对所得到的二值码在汉明空间中采用近邻算法进行分类预测。相较于传统knn最近邻方法计算欧式距离,汉明距离的计算极大地减少了计算时间,具有非常高的快速性。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。
因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
1.一种用于微血管瘤病历图像的超平面近邻分类方法,其特征在于:具体步骤如下:
a、首先进行糖尿病性眼底病历图像预处理,采用中值滤波法去除病历图像背景,利用图像形态学去除病历血管结构,提取出图像中的病变信息,利用线性元素对图像进行腐蚀操作,并对糖尿病性眼底病历图像进行高斯滤波,增强微血管瘤区域对比度;
b、选择糖尿病性眼底病历图像中的微血管瘤病变作为模板匹配的目标,根据微血管瘤在病历图像中的灰度与形状参数,设计函数模型来匹配目标,使微血管瘤图像灰度服从高斯分布,函数模板的匹配公式为:
其中l为灰度最低值,h为灰度高度,e为自然底数,d为点到模板圆心的距离,r为半径,s为灰度陡峭度,(x0,y0)为微微血管瘤中心点;
c、将得到的微血管瘤病历病变图像形态学特征、纹理特征及灰度特征转化为l维数据向量xi=(xi1,xi2,...,xil),i=1,2,3...;
d、将微血管瘤病历图像数据分为训练数据xtr=(x1,x2,...,xn),n=1,2,3...和测试数据xte=(x1',x2',...,xm'),m=1,2,3…;
e、对微血管瘤病历图像训练数据xtr=(x1,x2,...,xn),n=1,2,3...进行训练得到一个包括分类超平面hyper、支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...、距离阈值t、最近邻居个数k和谱哈希编码码长nb的分类模型model;
f、根据分类模型model在对微血管瘤病历图像测试集数据xte=(x1',x2',...,xm'),m=1,2,3...,nte预测时先判断测试样本xi'=(xi1',xi2',...,xil'),i=1,2,...,m到分类超平面的距离disthyperi,i=1,2,k,m,是否大于距离阈值t,若测试样本xi'=(xi1',xi2',...,xil'),i=1,2,...,m到分类超平面的距离大于距离阈值t则使用支持向量机模型预测,若测试集数据到分类超平面的距离不大于距离阈值则使用结合谱哈希算法的近邻算法进行预测,最后综合得到预测结果yte=(y1',y2',...,ym'),m=1,2,3...。
2.根据权利要求1所述一种用于微血管瘤病历图像的超平面近邻分类方法,其特征在于:所述步骤e具体为:对微血管瘤病历图像训练数据xtr=(x1,x2,...,xn),n=1,2,3...进行训练得到一个包括分类超平面hyper、支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...、距离阈值t、最近邻居个数k和谱哈希编码码长nb的分类模型model;;其步骤如下:
a、将微血管瘤病历图像训练数据xtr=(x1,x2,...,xn),n=1,2,3...,通过支持向量机模型训练得到支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...和分类超平面hyper:wt·x b=0,
其中w为分类超平面法向量,t为转置运算,b为偏置,x为超平面上的点;
b、计算微血管瘤病历图像训练数据xtr=(x1,x2,...,xn),n=1,2,3...到分类超平面hyper的距离矩阵disthyper=wt·xtr b;
c、通过设定的距离阈值t分别得到使用支持向量机进行预测的训练数据集xtrsvm={xi|disthyperi>t,i=1,2,...,n}和使用近邻算法进行预测的训练数据集
xtrknn={xi|disthyperi≤t,i=1,2,...,n};
d、对微血管瘤病历图像训练数据集xtrsvm={xi|disthyperi>t,i=1,2,...,n},使用训练得到的支持向量机模型进行预测,求得微血管瘤病历图像预测标签集ytrsvm={yi|disthyperi>t,i=1,2,...,n};
e、对支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...,通过设定的码长nb用谱哈希方法训练出相应的参数shparam;
f、根据参数shpa将微血管瘤病历图像训练数据xtr=(x1,x2,...,xn),n=1,2,3...的支持向量集xsv=(x1”,x2”,...,xs”),s=1,2,3和使用近邻算法进行预测的微血管瘤病历图像训练数据集xtrknn={xi|disthyperi≤t,i=1,2,...,n}通过谱哈希方法压缩为相同长度的二进制码;
g、计算微血管瘤病历图像训练数据集xtrknn={xi|disthyperi≤t,i=1,2,...,n}和支持向量集xsv=(x1”,x2”,...,xs”),s=1,2,3...压缩得到的二进制码,并计算全部二进制码对应的汉明距离存入汉明距离表dhamm_train中;
h、读取汉明距离表dhamm_train,取距离最近的前k个支持向量的标签,统计出现次数最多的标签记为微血管瘤病历图像训练数据集xtrknn={xi|disthyperi≤t,i=1,2,...,n}中对应样本的标签,得到微血管瘤病历图像训练集预测标签集ytrknn={yi|disthyperi≤t,i=1,2,...,n};
i、结合两部分预测标签集ytrsvm和ytrknn,求得微血管瘤病历图像训练集预测标签集ytr=(y1,y2,...,yn),n=1,2,3...,针对预测准确率对距离阈值t、最近邻居个数k和谱哈希编码码长nb三个参数寻优得到最优解;
j、得到包含分类超平面hyper、支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...、距离阈值t、最近邻居个数k和谱哈希编码码长nb的分类模型model。
3.根据权利要求1所述一种用于微血管瘤病历图像的超平面近邻分类方法,其特征在于:所述步骤f具体为:根据分类模型model在对微血管瘤病历图像测试集数据xte=(x1',x2',...,xm'),m=1,2,3...,mte预测时先判断测试样本xi'=(xi1',xi2',...,xil'),i=1,2,...,m到分类超平面的距离disthyperi,i=1,2,k,m,是否大于距离阈值t,若测试样本xi'=(xi1',xi2',...,xil'),i=1,2,...,m到分类超平面的距离大于距离阈值t则使用支持向量机模型预测,若测试集数据到分类超平面的距离不大于距离阈值则使用结合谱哈希算法的近邻算法进行预测,最后综合得到预测结果yte=(y1',y2',...,ym'),m=1,2,3...,其步骤如下:
a、计算微血管瘤病历图像测试数据xte=(x1',x2',...,xm'),m=1,2,3...到分类超平面hyper的距离矩阵disthyper=wt·xte b;
b、通过设定的距离阈值t分别得到使用支持向量机进行预测的微血管瘤病历测试数据集xtesvm={xi|disthyperi>t,i=1,2,...,m}和使用近邻算法进行预测的微血管瘤病历测试数据集xteknn={xi|disthyperi≤t,i=1,2,...,m};
c、对xtesvm={xi|disthyperi>t,i=1,2,...,m}使用训练得到的分类超平面hyper进行支持向量机模型预测得到预测标签集ytesvm={yi|disthyperi>t,i=1,2,...,m};
d、将微血管瘤病历测试数据集xteknn={xi|disthyperi≤t,i=1,2,...,m}和模型model中的支持向量集合xsv=(x1”,x2”,...,xs”),s=1,2,3...根据分类模型model中的谱哈希编码码长nb通过谱哈希方法压缩为相同长度的二进制码,计算全部二进制码对应的汉明距离存入汉明距离表dhamm_test中;
e、读取汉明距离表dhamm_test,取距离最近的前k个支持向量的标签,统计出现次数最多的标签记为微血管瘤病历图像测试数据集xteknn={xi|disthyperi≤t,i=1,2,...,m}中对应样本的标签得到微血管瘤病历预测标签集yteknn={yi|disthyperi≤t,i=1,2,...,m};
f、综合使用支持向量机模型进行预测得到的微血管瘤病历预测标签集ytesvm={yi|disthyperi>t,i=1,2,...,m}和使用结合谱哈希方法的最近邻算法进行预测得到的微血管瘤病历预测标签集yteknn={yi|disthyperi≤t,i=1,2,...,m},求得最终的微血管瘤病历预测结果yte=(y1',y2',...,ym'),m=1,2,3...。
技术总结