一种基于近红外光谱技术的烟叶相似度判定方法与流程

专利2022-06-28  98


本发明属于卷烟及卷烟在制品质量检测技术领域,具体涉及一种基于近红外光谱技术的烟叶相似度判定方法。



背景技术:

在卷烟的研发和生产维护过程中,需要对库存内多地区各等级烟草的相似度和差异性有较为深入的认识。目前对于卷烟配方维护人员而言,较为普遍的是采用感官评吸的方式进行替代烟叶的选择工作,不仅对配方维护人员的感官评吸水平有较高要求,同时也使大大提高了配方维护的成本和工作量。随着计算机智能技术的发展,烟草行业已通过不同的算法提取单等级烟叶中具有共性和异性特征的烟叶和烟气成分数据,实现烟叶分级、卷烟配方维护以及烟气成分指标预测等。

红外光谱因其快速、准确和无损而被广泛应用于工业领域。近红外光谱主要是对含氢基团振动的倍频和合频吸收,其中包含了大多数类型有机化合物的组成信息,与烟叶化学成分关联的信息非常丰富。而且不同产区和部位的烟叶由于化学成分组成的差异,对应的近红外光谱图也各不相同,因此可以利用近红外光谱对烟叶产区和部位进行预测,既能快速、客观的反映不同烟叶的差异性从而实现相似烟叶的替代,也能节约大量人力成本,有效提高卷烟配方维护效率。

cn201210344034“一种基于近红外光谱信息的simca辅助卷烟配方的方法”以烟叶的近红外光谱信息为对象,采用simca的方法为目标烟叶样品寻找合适的替代样品,具体是采用主成分分析和马氏距离判定相似烟叶样品,辅助卷烟配方。cn2008100307993“一种基于烟叶近红外光谱的相似烟叶搜索方法”是利用烟叶近红外光谱数据采用主成分分析运算构建目标烟叶的数学模型,用模型识别方法来评价未知烟叶与不同目标烟叶间相似程度,得到量化的、能反映烟叶间可替代性的数据。上述两个专利在利用近红外技术进行烟叶相似性分析方面提供了较为详细和清晰的技术思路,但由于其涉及的数学方法均较为复杂且需要进行数据建模,需要的较多的烟叶样品用于数学模型的建立,且对建模人员的数学基础知识要求较高,可能不太利于在实际应用中大力推广或者。

综上,目前对于利用烟叶的近红外光谱图,通过简便方法实现快速、客观地判定不同产区和等级烟叶相似度及烟叶间相互可替代性,从而达到配方叶组中单等级烟叶准确、高效替代的方法有待进一步研究。



技术实现要素:

本发明的目的是提供一种基于近红外光谱技术的烟叶相似度判定方法,包括如下步骤:

s1:采用相同的工艺制备目标烟叶样品和未知烟叶样品;

s2:利用近红外光谱仪重复采集目标烟叶样品的近红外光谱曲线得到目标近红外光谱图组以及采集未知烟叶样品的近红外光谱曲线,并对每个近红外光谱曲线进行阶次求导得到新曲线;

其中,所述目标近红外光谱图组包括目标烟叶样品的若干近红外光谱曲线,所述近红外光谱曲线为吸光度或透光率与波数或波长的关系曲线;

所述阶次求导是将近红外光谱曲线的吸光度或透光率对波数或波长进行求导后得到的无量纲导数值与波数或波长关系曲线的过程;

s3:获取阶次求导后的目标近红外光谱图组中的上限曲线、下限曲线以及中心曲线;

其中,对阶次求导后的目标近红外光谱图组中各个波数或波长采样点处对应的无量纲导数值的最大值、最小值分别进行串接得到上限曲线、下限曲线;所述上限曲线、下限曲线和中心曲线均为无量纲导数值与波数或波长的关系曲线;

所述中心曲线上波数或波长采样点处的无量纲导数值等于上限曲线和下限曲线上同一波数或波长采样点处的无量纲导数值的均值;

s4:依据新谱图获取至少一个显著波动区间,并基于目标烟叶的中心曲线和阶次求导后未知烟叶的近红外光谱曲线在显著波动区间的曲线段计算出未知烟叶与目标烟叶的相似系数;

其中,若存在两个或两个以上的显著波动区间,未知烟叶与目标烟叶的相似系数等于每个显著波动区间对应的目标烟叶的中心曲线和未知烟叶阶次求导后近红外光谱曲线的欧式距离之和;

s5:基于目标烟叶的中心曲线与上限曲线或中心曲线与下限曲线在显著波动区间的曲线段计算出目标烟叶的特征系数;

其中,若存在两个或两个以上的显著波动区间,目标烟叶的特征系数等于每个显著波动区间对应的目标烟叶的中心曲线与上限曲线或中心曲线与下限曲线的欧式距离之和;

s6:判断未知烟叶与目标烟叶的相似系数是否小于或等于目标烟叶的特征系数,若是,未知烟叶是目标烟叶的替代烟叶;否则,未知烟叶不能作为目标烟叶的替代烟叶。

本发明基于不同产区和等级的烟叶间存在的化学特性区别而导致近红外光谱图的差异,通过对比不同烟叶样品的近红外光谱图,采用简单的数学计算方式实现了不同烟叶样品的相似度判定,提供了一种简便方法来快速、客观地判定不同产区和等级烟叶相似度及烟叶间相互可替代性。

其中,本发明是通过选取目标烟叶的上限曲线、中心曲线与下限曲线以及未知烟叶的近红外光谱曲线来计算相似系数和特征系数,再通过相似系数与特征系数的比较来得出结论;其中相似系数是依据中心曲线与未知烟叶的近红外光谱曲线来计算的,其越小,则表示未知烟叶与目标烟叶越加接近;特征系数是依据上限曲线或下限曲线与中心曲线来计算的,其表征了目标烟叶的特征,因此本发明直接寻找近红外光谱曲线的特性推导出特征系数和相似系数,提供了一种全新的思路来计算判定两种烟叶之间的相似度,且该方法相较于现有方法更加简单以及便捷,不需要进行复杂的数学建模,更便于推广。

进一步优选,s5和s6中在显著波动区间中两个曲线段之间的欧式距离计算公式如下:

式中,ρ为一个显著波动区间对应的欧式距离,λ为波数或者波长值,a、b分别为显著波动区间的波数或波长的最小值、最大值;ax(λ)、a0(λ)分别是两个曲线段上在波数或者波长为λ处的无量纲导数值。

s4的相似系数计算时,每个显著波动区间对应的欧式距离计算公式中ax(λ)、a0(λ)分别是目标烟叶的中心曲线、阶次求导后未知烟叶的近红外光谱曲线上在波数或者波长为λ处的无量纲导数值。

s5的特征系数计算时,每个显著波动区间对应的欧式距离计算公式中ax(λ)、a0(λ)分别是中心曲线与上限曲线或中心曲线与下限曲线在波数或者波长为λ处的无量纲导数值。

进一步优选,s1中目标烟叶样品和未知烟叶样品的制备过程如下:

首先,分别将目标烟叶、未知烟叶去梗、打碎,再用磨粉机打成粉末并用标准筛进行筛分;

其中,筛分后烟粉的粒径小于500μm;

然后,将筛分收集到的待测目标烟叶粉和未知烟叶粉转移至恒温恒湿环境中存放预设时长至水分达到平衡;

其中,所述恒温恒湿环境中温度范围为:22±2℃,相对湿度范围为:60±5%;存放的预设时长范围为:4-72h。

粉末的粒径小于500μm可以使每次测得的近红外光谱具有较好的重现性。

进一步优选,s2中对每个近红外光谱曲线进行阶次求导得到新曲线时,阶次范围为[1,3]。

通过研究发现,3阶以上求导的谱图的噪音会明显放大,不利用谱图的分析和比较。

进一步优选,步骤s2中采用近红外光谱仪采集目标烟叶样品或未知烟叶样品的近红外光谱曲线时,所述近红外光谱仪的光谱范围为:[12800cm-1,3600cm-1]或[780nm,2778nm];扫描速度的范围为:[1次/秒,64次/秒],扫描次数范围为:[1,128],分辨率范围为:[2cm-1,64cm-1]。

有益效果

1、本发明基于不同产区和等级的烟叶间存在的化学特性区别而导致近红外光谱图的差异,提供了一种全新方法来判定烟叶相似度。具体的,本发明通过采集目标烟叶样品和未知烟叶样品的近红外光谱图,并选取目标烟叶的上限曲线、中心曲线与下限曲线以及未知烟叶的近红外光谱曲线来计算相似系数和特征系数,进而本发明再通过相似系数与特征系数的比较来得出结论。其中相似系数是依据中心曲线与未知烟叶的近红外光谱曲线来计算的,其越小,则表示未知烟叶与目标烟叶越加接近;特征系数是依据上限曲线或下限曲线与中心曲线来计算的,其表征了目标烟叶的特征,因此本发明直接寻找近红外光谱曲线的特性推导出特征系数和相似系数,提供了一种全新的思路来计算判定两种烟叶之间的相似度,且该方法相较于现有方法更加简单以及便捷,不需要进行复杂的数学建模,更便于推广,为达到配方叶组中单等级烟叶准确、高效的替代提供支持。

2、首先对近红外光谱图进行阶次求导处理,其一方面有效排除基线漂移的干扰,另一方面,有效地放大光谱图变化特征从而以便选择出显著波动区间,提高将相似系数作和特征系数作为判定依据的可靠性。且本发明优选阶次的范围为[1,3],这是通过研究发现,3阶以上求导的谱图的噪音会明显放大,不利用谱图的分析和比较。

3、欧式距离描述曲线之间的差异性,本发明中新谱图的相似系数为在所有显著波动区间内各个新谱图到标准曲线的欧式距离之和,可以达到对谱图的差异性放大的效果。

附图说明

图1是本发明提供的一种基于近红外光谱技术的烟叶相似度判定方法的流程示意图;

图2为采集得到的目标烟叶样品的目标近红外光谱图组。

图3为目标烟叶的目标近红外光谱图组一阶求导后得到的目标烟叶的新谱图曲线组。

图4为计算得到的目标烟叶的新谱图曲线组的上限曲线、下限曲线和中心曲线。

图5为计算得到的目标烟叶的新谱图曲线组的上限曲线、下限曲线和中心曲线局部放大图。

图6为采集得到的未知烟叶的近红外光谱图。

图7为一阶求导后得到的未知烟叶的新谱图曲线。

具体实施方式

下面将结合实施例对本发明做进一步的说明。

如图1所示,本发明提供的一种基于近红外光谱技术的烟叶相似度判定方法,包括如下步骤:

s1:采用相同的工艺制备目标烟叶样品和未知烟叶样品。

在进行近红外测试前,先将目标烟叶和未知烟叶样品去梗、打碎,再用磨粉机将其打成粉末并用标准筛进行筛分,随后将收集得到的待测目标烟叶粉和未知烟叶粉转移至恒温恒湿环境中存放一定时间至水分达到平衡。本发明优选筛分后烟粉的粒径应小于500μm,恒温恒湿环境中温度为22±2℃,恒温恒湿环境中相对湿度为60±5%,存放时间为4-72h。

譬如,本实施例人工挑选9个不同产区和等级的烟叶样品,并将其中一个烟叶样品作为目标烟叶,余下8个烟叶作为未知烟叶(样品编号和产区等级信息见下表1),并按照上述工艺处理,存在48h。

表1

s2:利用近红外光谱仪重复采集目标烟叶样品的近红外光谱曲线得到目标近红外光谱图组以及采集未知烟叶样品的近红外光谱曲线,并对每个近红外光谱曲线进行阶次求导得到新曲线。

其中,近红外光谱仪的光谱范围为:[12800cm-1,3600cm-1]或[780nm,2778nm];扫描速度的范围为:[1次/秒,64次/秒],扫描次数范围为:[1,128],分辨率范围为:[2cm-1,64cm-1]。得到的近红外光谱曲线为吸光度或透光率与波数或波长的关系曲线。本实施例中,设定近红外光谱仪光谱扫描范围为9000~4000cm-1,扫描速度为4次/秒,扫描次数为64次,分辨率为8cm-1。且本实施例中得到近红外光谱图是以吸光度为纵坐标,波数为横坐标。

目标烟叶样品的目标近红外光谱图组获取过程如下:

取适量目标烟叶粉(即上述a1号烟叶粉),按上述近红外光谱仪参数设置后,每隔12h采集一次近红外光谱,共采集10次,得到10个目标烟叶的目标近红外光谱图组(如图2);将所有得到的目标烟叶近红外光谱曲线的吸光度对波数进行一阶求导,得到10个以无量纲导数值为纵坐标、波数为横坐标的目标烟叶的新谱图曲线,将上述10个目标烟叶新谱图曲线在同一坐标系中进行绘图得到目标烟叶新谱图曲线组(如图3)。

s3:获取阶次求导后的目标近红外光谱图组中的上限曲线和下限曲线,并基于上限曲线和下限曲线获取中心曲线。

其中,如图4所示,提取目标烟叶新谱图曲线组在每个波数采样点处对应的无量纲导数值的最大值和最小值,并以上述所有取得的最大值对波数作图,得到目标烟叶近红外新谱图曲线组的上限曲线,同理,以上述所有取得的最小值对波数作图,得到目标烟叶近红外新谱图曲线组的下限曲线(图5为图4的局部放大图)。再以得到的上述每个波数采样点处无量纲导数值的最大值和最小值为依据,根据公式(1)求出目标烟叶近红外新谱图曲线组在每个波数采样点处的中心值a,a1、a2是同一波数采样点处的最小值和最大值,并以上述所有取得的中心值对波数作图,得到目标烟叶近红外新谱图曲线组的中心曲线。

需要说明的是,波数采样点是根据实际需求来选取,数量越多,精度越高。

s4:依据新谱图获取至少一个显著波动区间,并基于目标烟叶的中心曲线和阶次求导后未知烟叶的近红外光谱曲线在显著波动区间的曲线段计算出未知烟叶与目标烟叶的相似系数。

通过对谱图进行分析比较选择出存在较大显著差异的区间作为显著波动区间。譬如对图3进行分析选取的显著波动区间可以是如下六个区间:7151~6800cm-1、6051~5789cm-1、5299~5180cm-1、5002~4759cm-1、4501~4331cm-1和4192~4019cm-1。也可以是如下两个区间:6100-5560cm-1,4760-4300cm-1;或者其他存在较大显著差异的区间。具体的,可以是通过人为判断选择显著波动区间,再将其输入至对应程序;其他可行的实施例中,可以通过自动化选取的方式,例如判断在一个区间内的纵坐标最大值与纵坐标最小值之间的幅度是否超过预设阈值,若是超过阈值,则将该区间选为显著波动区间。因此,选取的区间是根据用户需求设置的条件来得到的。

其中,若存在两个或两个以上的显著波动区间,未知烟叶与目标烟叶的相似系数等于每个显著波动区间对应的目标烟叶的中心曲线和未知烟叶的近红外光谱曲线的欧式距离之和;若是仅存在一个显著波动区间,未知烟叶与目标烟叶的相似系数等于该显著波动区间对应的目标烟叶的中心曲线和未知烟叶的近红外光谱曲线的欧式距离。

如图6所示为表1中上述8个未知烟叶样品的近红外光谱图,对其进行阶次求导后得到如图7所示的未知烟叶的新谱图曲线。相似系数则等于利用欧式距离的公式计算出显著波动区间内未知烟叶的新谱图曲线与目标烟叶的中心曲线之间的欧式距离。

s5:基于目标烟叶的中心曲线与上限曲线或中心曲线与下限曲线在显著波动区间的曲线段计算出目标烟叶的特征系数。

同理,若存在两个或两个以上的显著波动区间,目标烟叶的特征系数等于每个显著波动区间对应的目标烟叶的中心曲线与上限曲线或中心曲线与下限曲线的欧式距离之和;若是仅存在一个显著波动区间,目标烟叶的特征系数等于该显著波动区间对应的目标烟叶的中心曲线与上限曲线或中心曲线与下限曲线的欧式距离。

如图表2所示为表1中未知烟叶与目标烟叶之间的相似系数以及目标烟叶的特征系数。

表2

s6:判断未知烟叶与目标烟叶的相似系数是否小于或等于目标烟叶的特征系数,若是,未知烟叶是目标烟叶的替代烟叶;否则,未知烟叶不能作为目标烟叶的替代烟叶。

其中,相似系数越小,说明未知烟叶与目标烟叶的相似度越高。从上述表2可知,将上述未知烟叶与目标烟叶的相似系数按从小到大的顺序排列,并与目标烟叶的特征系数相比较,即达到烟叶相似度判定的目的。从表中可以看出,未知烟叶与目标烟叶的相似度从大到小依次为a3、a2、a7、a1、a6、a4、a5和a8,从而实现了未知烟叶与目标烟叶的相似度判定;

其中a3与目标烟叶最为相似,相似系数为0.000288309,小于目标烟叶的特征系数0.000291633,因此,说明a3烟叶与目标烟叶相当接近,可以在叶组配方中对目标烟叶进行替代使用。以上结果与上述烟叶实际的感官评价结果较为一致,根据全国不同产区烟叶的特点,相近产区的烟叶质量较为接近,且该实施例中所用烟叶的等级相近,其感官评价结果与烟叶产地的相关性较大,本发明得到的与产自贵州黔南的a0最接近的为贵州黔南a3烟叶,该结果与这两种烟叶实际的感官质量相符,进一步与贵州黔南的a0接近的是a2,其产于贵州黔西南。从这点可验证出本发明所述方法是方法能够用于烟叶相似度的判定,其具有可行性。

需要强调的是,本发明所述的实例是说明性的,而不是限定性的,因此本发明不限于具体实施方式中所述的实例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,不脱离本发明宗旨和范围的,不论是修改还是替换,同样属于本发明的保护范围。


技术特征:

1.一种基于近红外光谱技术的烟叶相似度判定方法,其特征在于:包括如下步骤:

s1:采用相同的工艺制备目标烟叶样品和未知烟叶样品;

s2:利用近红外光谱仪重复采集目标烟叶样品的近红外光谱曲线得到目标近红外光谱图组以及采集未知烟叶样品的近红外光谱曲线,并对每个近红外光谱曲线进行阶次求导得到新曲线;

其中,所述目标近红外光谱图组包括目标烟叶样品的若干近红外光谱曲线,所述近红外光谱曲线为吸光度或透光率与波数或波长的关系曲线;

所述阶次求导是将近红外光谱曲线的吸光度或透光率对波数或波长进行求导后得到的无量纲导数值与波数或波长关系曲线的过程;

s3:获取阶次求导后的目标近红外光谱图组中的上限曲线、下限曲线以及中心曲线;

其中,对阶次求导后的目标近红外光谱图组中各个波数或波长采样点处对应的无量纲导数值的最大值、最小值分别进行串接得到上限曲线、下限曲线;所述上限曲线、下限曲线和中心曲线均为无量纲导数值与波数或波长的关系曲线;

所述中心曲线上波数或波长采样点处的无量纲导数值等于上限曲线和下限曲线上同一波数或波长采样点处的无量纲导数值的均值;

s4:依据新谱图获取至少一个显著波动区间,并基于目标烟叶的中心曲线和阶次求导后未知烟叶的近红外光谱曲线在显著波动区间的曲线段计算出未知烟叶与目标烟叶的相似系数;

其中,若存在两个或两个以上的显著波动区间,未知烟叶与目标烟叶的相似系数等于每个显著波动区间对应的目标烟叶的中心曲线和未知烟叶阶次求导后近红外光谱曲线的欧式距离之和;

s5:基于目标烟叶的中心曲线与上限曲线或中心曲线与下限曲线在显著波动区间的曲线段计算出目标烟叶的特征系数;

其中,若存在两个或两个以上的显著波动区间,目标烟叶的特征系数等于每个显著波动区间对应的目标烟叶的中心曲线与上限曲线或中心曲线与下限曲线的欧式距离之和;

s6:判断未知烟叶与目标烟叶的相似系数是否小于或等于目标烟叶的特征系数,若是,未知烟叶是目标烟叶的替代烟叶;否则,未知烟叶不能作为目标烟叶的替代烟叶。

2.根据权利要求1所述的方法,其特征在于:s5和s6中在显著波动区间中两个曲线段之间的欧式距离计算公式如下:

式中,ρ为一个显著波动区间对应的欧式距离,λ为波数或者波长值,a、b分别为显著波动区间的波数或波长的最小值、最大值;ax(λ)、a0(λ)分别是两个曲线段上在波数或者波长为λ处的无量纲导数值。

3.根据权利要求1所述的方法,其特征在于:s1中目标烟叶样品和未知烟叶样品的制备过程如下:

首先,分别将目标烟叶、未知烟叶去梗、打碎,再用磨粉机将其打成粉末并用标准筛进行筛分;

其中,筛分后烟粉的粒径小于500μm;

然后,将收集到的待测目标烟叶粉和未知烟叶粉转移至恒温恒湿环境中存放预设时长至水分达到平衡;

其中,所述恒温恒湿环境中温度范围为:22±2℃,相对湿度范围为:60±5%;存放的预设时长范围为:4-72h。

4.根据权利要求1所述的方法,其特征在于:s2中对每个近红外光谱曲线进行阶次求导得到新曲线时,阶次范围为[1,3]。

5.根据权利要求1所述的方法,其特征在于:步骤s2中采用近红外光谱仪采集目标烟叶样品或未知烟叶样品的近红外光谱曲线时,所述近红外光谱仪的光谱范围为:[12800cm-1,3600cm-1]或[780nm,2778nm];扫描速度的范围为:[1次/秒,64次/秒],扫描次数范围为:[1,128],分辨率范围为:[2cm-1,64cm-1]。

技术总结
本发明公开了一种基于近红外光谱技术的烟叶相似度判定方法,其通过重复采集目标烟叶样品的近红外光谱图以及未知烟叶样品的近红外光谱图,得到该目标烟叶样品的近红外光谱图组,接着分别将上述近红外光谱图组中所有曲线阶次求导,并获取求导后的近红外光谱图组的中心值曲线、上限曲线、下限曲线,再计算目标烟叶样品与未知烟叶样品的相似系数以及目标烟叶样品的特征系数,再根据相似系数和特征系数的大小实现对未知烟叶与目标烟叶相似度的判定。本发明提供了一种简单、快捷的方式来实现两种烟叶相似度的快速比较。

技术研发人员:蔡佳校;杜欢哲;崔雨琪;孔波;李燕春;卢红兵;杨华武;谭新良
受保护的技术使用者:湖南中烟工业有限责任公司
技术研发日:2018.11.30
技术公布日:2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-9678.html

最新回复(0)