本发明属农作物信息提取领域,尤其涉及一种茶树叶特征信息高光谱提取方法。
背景技术:
传统的茶树叶信息获取方法主要为基于人类视觉的经验判断方法以及基于破坏性试验的化学分析方法。但是这些传统方法都具有很大的不足之处,经验判断法误差高、随机性强,而化学分析法耗时耗力、花费高昂。
技术实现要素:
为解决茶树叶信息获取方法误差高、随机性强、耗时耗力、花费高昂的问题,本发明提供了一种茶树叶特征信息高光谱提取方法。
本发明是这样实现的,本发明的茶树叶特征信息高光谱提取方法包括:
步骤一、通过图像获取单元获取茶树叶源图像,建立灰度直方图统计图像灰度分布,通过分段灰度线性变换增强图像对比度后,使用高斯滤波进行平滑处理,完成图像的预处理;
步骤二、在预处理后的茶树叶图像上选取特征区域,使用canny算子完成图像边缘特征点的提取,确定图像中的前景图像的图像边界;
步骤三、采用野外近地高光谱图像采集系统采集特征区域内茶树叶光谱信息,由图像预处理模块对光谱曲线进行预处理;
步骤四、由高光谱图像得到主成分图及特征波段的灰度图,从该特征波段的灰度图中提取纹理参数图,用纹理参数并对茶树叶指定元素含量进行预测,预测值小于设定阈值则将野外近地高光谱图像采集系统中的摄像头按照预设角度值旋转,重复步骤一至步骤三;
步骤五、特征提取模块从经步骤三预处理后的光谱信息中提取特征,对异常样本进行剔除后用特征向量代替光谱向量,对特征角余弦平均值图像进行分割;
步骤六、对不同取样样本中光谱信息中的同一提取特征进行不相似度评估,如果存在光谱信息中的某一特征的不相似度大于设定阈值,则采用野外近地高光谱图像采集系统中的摄像头按照预设角度值旋转,如果任一光谱信息中的某一特征不相似度小于设定阈值,则进入步骤七;
步骤七、利用最佳指数因子oif选择最佳的波段组合,选出oif最大的波段组合,利用多元线性回归得到茶氨酸的含量估算的线性模型。
进一步,高光谱图像提取的特征包括极大波峰位置、极小波谷位置、上升趋势点数、下降趋势点数、大于均峰值点数、小于均谷值点数、大于均谷值点数、小于均峰值点数。
进一步,步骤三中,由图像预处理模块在microsoftvisualstudio2005平台上实现多次平滑预处理,具体方法为:
将滑动窗中的值做平均运算,所得平均值作为平滑窗中点位置的值,采用奇数作为滑动窗口的大小,假设窗口尺寸k=2m 1,则对任意k点平均的方程式为:
式中,i为曲线上的点号,j为平滑窗口中的点号,yi为第i点平滑后的数值,yi为平滑前曲线上点的原数值,n为曲线上的总点数。
进一步,步骤四中每幅高光谱图像得到五个主成分图及特征波段的灰度图,从每幅灰度图中提取均值灰度图、方差灰度图、协同性灰度图、对比灰度图、相异性灰度图、信息熵灰度图、二阶矩灰度图和相关性灰度图八个纹理参数图,用获得的纹理图像的灰度平均值来代表纹理参数并建立pca-bpnn模型对茶树叶指定元素含量进行预测,预测值小于设定阈值则将野外近地高光谱图像采集系统中的摄像头按照预设角度值旋转,重复步骤一至步骤三。
进一步,步骤五中特征提取模块从经步骤三预处理后的光谱信息中提取特征,对提取特征采用以下算式,对大于设定的d阈值的异常样本进行剔除:
式中,d为设定的剔除距离,x为训练样本,
进一步,步骤五中对八邻域特征角余弦值取平均值,并将计算所得平均值作为像元的新值,生成一幅平均特征角余弦平均值图像,采用基于马尔可夫的分割方法对生成的特征角余弦平均值图像进行分割,特征角余弦为:
式中,n为特征数,a=(a1,a2,…,an)和b=(b1,b2,…,bn)分别表示两个像元的特征向量,其元素ai、bi表示在第i个特征的特征值,α为特征角。
进一步,步骤六中采用下列算法,使用基于kl散度的特征选择方法kld对不同取样样本中光谱信息中的同一提取特征进行不相似度评估:
其中,xi,xj是ω空间的两个随机变量,pi(x),pj(x)为其概率密度。加入两个随机变量相等,则其概率密度也相等,kld值为0,如果随机变量不同,则其差异性越大,kld值越大。因此,通过计算两个随机变量之间的kld值能够定量的评估其差异性。
进一步,步骤七通过下式选择最佳的波段组合:
|ri,j|<r0
其中,oif为最佳指数因子,si为波段i的标准差,ri,j为波段i和波段j之间的相关系数,r0为相关系数阈值。经过调整,设置合适的r0值使得oif值最大。这样的波段组合,既考虑了光谱信息与化学成分之间的相关性,也可以使得波段之间的波段之间的信息负载量最大,而波段之间的相关性较小。在找出最佳的波段组合之后,利用多元线性回归得到估算的多元线性回归模型。
本发明的茶树叶特征信息高光谱提取方法提高了高光谱图像分割处理效率,减少了数据冗余,充分考虑到地物光谱特征,提取的特征有曲线峰、谷的位置,曲线峰、谷的个数和曲线上每一像元在每一波段的上升或下降的趋势等,在一定程度上消除了随机影响,通过两次阈值评估有效避免了无效样本带来的误差,能够准确、便捷、经济地估算茶树叶的茶氨酸含量。
附图说明
图1是本发明实施例提供的茶树叶特征信息高光谱提取方法流程图。
具体实施方式
为能进一步了解本发明的发明内容、特点及功效,兹例举以下实施例,并配合附图详细说明如下。
下面结合附图对本发明的结构作详细的描述。
本实施例于2019年5月1日测量了绍兴市越城区鉴湖镇芳泉村茶园和龙井43的茶叶光谱。
本发明的茶树叶特征信息高光谱提取方法包括:
s101、通过图像获取单元获取茶树叶源图像,建立灰度直方图统计图像灰度分布,通过分段灰度线性变换增强图像对比度后,使用高斯滤波进行平滑处理,完成图像的预处理;
图像获取单元采用高清摄像机获取茶树叶源图像;
s102、在预处理后的茶树叶图像上选取特征区域,使用canny算子完成图像边缘特征点的提取,确定图像中的前景图像的图像边界;
s103、采用野外近地高光谱图像采集系统采集特征区域内茶树叶光谱信息,由图像预处理模块对光谱曲线进行预处理;
该高光谱图像采集系统包括了成像光谱仪(imspectorv10e)、图像采集卡(ni-pcie6430&ni-6036e)、电子控制单元及笔记本电脑;
该步骤中,由图像预处理模块在microsoftvisualstudio2005平台上实现多次平滑预处理,具体方法为:
将滑动窗中的值做平均运算,所得平均值作为平滑窗中点位置的值,采用奇数作为滑动窗口的大小,假设窗口尺寸k=2m 1,则对任意k点平均的方程式为:
式中,i为曲线上的点号,j为平滑窗口中的点号,yi为第i点平滑后的数值,yi为平滑前曲线上点的原数值,n为曲线上的总点数;
为了减少运算中的偏差,通常共不参与下一点的平滑运算。即在编程实现时,应预先定义两个数组分别存放平滑前和平滑后曲线点的数值。在具体的实验中均值滤波窗口的尺度选择非常关键,尺度过小则无法消除噪声,尺度过大则过度的消弱了波峰波谷。本实施例选用的窗口尺度为3,即m取值为1,并对曲线进行连续2次滤波,以提高平滑效果;
高光谱图像预处理分别在envi及matlab中完成;
s104、由高光谱图像得到主成分图及特征波段的灰度图,从该特征波段的灰度图中提取纹理参数图,用纹理参数并对茶树叶指定元素含量进行预测,预测值小于设定阈值则将野外近地高光谱图像采集系统中的摄像头按照预设角度值旋转,重复步骤s101至步骤s103;
该步骤中,茶树叶指定元素为氮、磷、钾,根据经验值设定阈值,如果预测值小于设定阈值,说明该样本中的茶树叶存在病害或者枯死等情况不适用于高光谱提取,需要调整摄像头重新选样;
每幅高光谱图像得到五个主成分图及特征波段的灰度图,从每幅灰度图中提取均值灰度图、方差灰度图、协同性灰度图、对比灰度图、相异性灰度图、信息熵灰度图、二阶矩灰度图和相关性灰度图八个纹理参数图,用获得的纹理图像的灰度平均值来代表纹理参数并建立pca-bpnn模型对茶树叶指定元素含量进行预测,预测值小于设定阈值则将野外近地高光谱图像采集系统中的摄像头按照预设角度值旋转,重复步骤s101至步骤s103;
s105、特征提取模块从经步骤s103预处理后的光谱信息中提取特征,对提取的特征中的异常样本进行剔除后用特征向量代替光谱向量,对特征角余弦平均值图像进行分割;
特征提取模块采用microsoftvisualstudio2005平台;
该步骤中,高光谱图像提取的特征包括极大波峰位置、极小波谷位置、上升趋势点数、下降趋势点数、大于均峰值点数、小于均谷值点数、大于均谷值点数、小于均峰值点数;
该步骤中,特征提取模块从经步骤s103预处理后的光谱信息中提取特征,对提取特征采用以下算式,对大于设定的d阈值的异常样本进行剔除:
式中,d为设定的剔除距离,x为训练样本,
该步骤中,对八邻域特征角余弦值取平均值,并将计算所得平均值作为像元的新值,生成一幅平均特征角余弦平均值图像,采用基于马尔可夫的分割方法对生成的特征角余弦平均值图像进行分割,特征角余弦为:
式中,n为特征数,a=(a1,a2,…,an)和b=(b1,b2,…,bn)分别表示两个像元的特征向量,其元素ai、bi表示在第i个特征的特征值,α为特征角;
基于邻域特征角余弦值分割算法特征角余弦值法中由向量向标量的转化方式就是将特征向量转化为特征角余弦值。根据光谱的相似性,可以利用光谱角来判定相关特征的相似程度。本实施例用特征向量代替光谱向量,用特征角余弦描述特征之间的相似性。光谱角余弦作为相似性度量可以在一定程度上消除随机影响,特征角余弦应该同样具有此种效果。
s106、对不同取样样本中光谱信息中的同一提取特征进行不相似度评估,如果存在光谱信息中的某一特征的不相似度大于设定阈值,则采用野外近地高光谱图像采集系统中的摄像头按照预设角度值旋转,如果任一光谱信息中的某一特征不相似度小于设定阈值,则进入步骤s107;
该步骤中,采用下列算法,使用基于kl散度的特征选择方法kld对不同取样样本中光谱信息中的同一提取特征进行不相似度评估:
其中,xi,xj是ω空间的两个随机变量,pi(x),pj(x)为其概率密度。加入两个随机变量相等,则其概率密度也相等,kld值为0,如果随机变量不同,则其差异性越大,kld值越大。因此,通过计算两个随机变量之间的kld值能够定量的评估其差异性;
步骤s107、利用最佳指数因子oif选择最佳的波段组合,选出oif最大的波段组合,利用多元线性回归得到茶氨酸的含量估算的线性模型。
该步骤通过下式选择最佳的波段组合:
|ri,j|<r0
其中,oif为最佳指数因子,si为波段i的标准差,ri,j为波段i和波段j之间的相关系数,r0为相关系数阈值。经过调整,设置合适的r0值使得oif值最大。这样的波段组合,既考虑了光谱信息与化学成分之间的相关性,也可以使得波段之间的波段之间的信息负载量最大,而波段之间的相关性较小。在找出最佳的波段组合之后,利用多元线性回归得到估算的多元线性回归模型。
本实施例选出oif最大的波段组合,利用多元线性回归得到茶氨酸的含量估算的线性模型,比较了茶氨酸的估算含量和实测含量之间的关系,并评估了模型的精度,模拟的茶氨酸含量和实测的茶氨酸含量之间的相关性均较好,r2为0.87。
本发明的茶树叶特征信息高光谱提取方法提高了高光谱图像分割处理效率,减少了数据冗余,充分考虑到地物光谱特征,提取的特征有曲线峰、谷的位置,曲线峰、谷的个数和曲线上每一像元在每一波段的上升或下降的趋势等,在一定程度上消除了随机影响,通过两次阈值评估有效避免了无效样本带来的误差,能够准确、便捷、经济地估算茶树叶的茶氨酸含量。
以上所述仅是对本发明的较佳实施例而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所做的任何简单修改,等同变化与修饰,均属于本发明技术方案的范围内。
1.一种茶树叶特征信息高光谱提取方法,其特征在于,包括:
步骤一、通过图像获取单元获取茶树叶源图像,建立灰度直方图统计图像灰度分布,通过分段灰度线性变换增强图像对比度后,使用高斯滤波进行平滑处理,完成图像的预处理;
步骤二、在预处理后的茶树叶图像上选取特征区域,使用canny算子完成图像边缘特征点的提取,确定图像中的前景图像的图像边界;
步骤三、采用野外近地高光谱图像采集系统采集特征区域内茶树叶光谱信息,由图像预处理模块对光谱曲线进行预处理;
步骤四、由高光谱图像得到主成分图及特征波段的灰度图,从该特征波段的灰度图中提取纹理参数图,用纹理参数并对茶树叶指定元素含量进行预测,预测值小于设定阈值则将野外近地高光谱图像采集系统中的摄像头按照预设角度值旋转,重复步骤一至步骤三;
步骤五、特征提取模块从经步骤三预处理后的光谱信息中提取特征,对异常样本进行剔除后用特征向量代替光谱向量,对特征角余弦平均值图像进行分割;
步骤六、对不同取样样本中光谱信息中的同一提取特征进行不相似度评估,如果存在光谱信息中的某一特征的不相似度大于设定阈值,则采用野外近地高光谱图像采集系统中的摄像头按照预设角度值旋转,如果任一光谱信息中的某一特征不相似度小于设定阈值,则进入步骤七;
步骤七、利用最佳指数因子oif选择最佳的波段组合,选出oif最大的波段组合,利用多元线性回归对茶氨酸的含量估算。
2.如权利要求1所述茶树叶特征信息高光谱提取方法,其特征在于,高光谱图像提取的特征包括极大波峰位置、极小波谷位置、上升趋势点数、下降趋势点数、大于均峰值点数、小于均谷值点数、大于均谷值点数、小于均峰值点数。
3.如权利要求1所述茶树叶特征信息高光谱提取方法,其特征在于,步骤三中,由图像预处理模块在microsoftvisualstudio2005平台上实现多次平滑预处理,具体方法为:
将滑动窗中的值做平均运算,所得平均值作为平滑窗中点位置的值,采用奇数作为滑动窗口的大小,假设窗口尺寸k=2m 1,则对任意k点平均的方程式为:
4.如权利要求1所述茶树叶特征信息高光谱提取方法,其特征在于,步骤四中,每幅高光谱图像得到五个主成分图及特征波段的灰度图,从每幅灰度图中提取均值灰度图、方差灰度图、协同性灰度图、对比灰度图、相异性灰度图、信息熵灰度图、二阶矩灰度图和相关性灰度图八个纹理参数图,用获得的纹理图像的灰度平均值来代表纹理参数并建立pca-bpnn模型对茶树叶指定元素含量进行预测,预测值小于设定阈值则将野外近地高光谱图像采集系统中的摄像头按照预设角度值旋转,重复步骤一至步骤三。
5.如权利要求1所述茶树叶特征信息高光谱提取方法,其特征在于,步骤五中,特征提取模块从经步骤三预处理后的光谱信息中提取特征,对提取特征采用以下算式,对大于设定的d阈值的异常样本进行剔除:
6.如权利要求1所述茶树叶特征信息高光谱提取方法,其特征在于,步骤五中,对八邻域特征角余弦值取平均值,并将计算所得平均值作为像元的新值,生成一幅平均特征角余弦平均值图像,采用基于马尔可夫的分割方法对生成的特征角余弦平均值图像进行分割,特征角余弦为:
7.如权利要求1所述茶树叶特征信息高光谱提取方法,其特征在于,步骤六中,采用下列算法,使用基于kl散度的特征选择方法kld对不同取样样本中光谱信息中的同一提取特征进行不相似度评估:
