基于机器学习的沉香香型识别系统及方法与流程

专利2026-05-13 2

本发明属于模式识别领域，具体的说是基于机器学习的沉香香型识别系统及方法。

背景技术：

1、沉香作为一种珍稀的中药材和香料，具有深厚的文化底蕴和广泛的市场需求，然而，沉香的香型多种多样，品质参差不齐，给消费者选择和鉴别带来了很大的困难。传统的沉香香型识别方法主要依赖于专家的感官评估和化学分析，这些方法存在主观性强、效率低下、成本高昂的问题，难以满足大规模、快速、准确的识别需求。近年来，随着机器学习技术的快速发展，沉香香型识别在图像识别、语音识别、自然语言处理领域取得了显著的成果，机器学习技术能够从大量数据中学习规律，自动提取特征，并进行分类和预测，具有强大的自适应能力和泛化能力，因此，将机器学习技术应用于沉香香型识别领域，有望解决传统方法存在的问题，提高识别的准确性和效率。

2、目前，虽然有一些研究尝试将机器学习应用于沉香香型识别，但仍然存在一些挑战和限制，如现有的方法往往只关注单一特征或简单特征的组合，忽略了沉香香型识别的复杂性和多样性，另外，缺乏大规模的标注数据集和有效的特征提取方法也限制了机器学习在沉香香型识别中的应用。因此，有必要开发一种基于机器学习的沉香香型识别方法，实现快速、准确的沉香香型识别。

3、如公开号为cn115902085a的中国专利公开了一种沉香药材的一板十余种成分信息斑点薄层鉴别方法，用甲醇超声的上清液，作为供试品溶液与对照药材溶液，同一块薄层板，在2种不同的检视条件下检视到颜色斑点和不同的增荧光斑点共计12种成分，做到了不同检视条件下的成分斑点互补，有效提高了检测指标数，斑点清晰、直观，易于判断识别、检查、对比。1块薄层板，十余毫升展开剂，承载的信息量比其高效液相指纹图谱还多，但低微的成本、超高的效率、斑点颜色的直观性，又是高效液相指纹图谱不具备的。简便、快捷、高效，大幅度提升了沉香药材的质量可控性，具有多指标评价监督的应用前景。

4、以上现有技术均存在以下问题：1)虽然薄层色谱法能够直观地展示多种成分的颜色斑点和荧光斑点，但其所能提取的信息类型相对有限，主要依赖于化学成分在特定条件下的显色或荧光反应；2)薄层色谱法虽然能够定性分析多种成分，但在定量分析方面存在一定限制，斑点的大小、颜色深浅都会影响定量结果的准确性；3)薄层色谱法的操作过程相对复杂，包括样品的制备、点样、展开、检视多个步骤，每个步骤都可能影响最终的结果，此外，不同操作者的技能和经验也会导致结果的差异，从而影响方法的可重复性。

技术实现思路

1、针对现有技术的不足，本发明提出了基于机器学习的沉香香型识别系统及方法，通过收集并预处理沉香样本，标注香型类别，利用气相色谱-质谱联用策略与嗅觉分析提取香型特征与香气成分特征，并结合物理特性进行多模态特征融合，采用迁移学习技术初始化机器学习模型，并通过融合特征训练模型，结合自动化超参数调优与不确定性量化技术优化性能，最终，利用测试集评估模型性能，并引入集成学习与交互式学习机制进行迭代调优和在线学习，提高了沉香香型识别的准确性与效率。

2、为实现上述目的，本发明提供如下技术方案：

3、基于机器学习的沉香香型识别系统，包括：数据收集与处理模块、特征工程模块、模型训练模块、模型评估与调优模块、用户交互模块；

4、所述数据收集与处理模块，用于收集沉香样本，进行预处理，并标注香型类别；

5、所述特征工程模块，用于根据香型识别与标注单元提供的信息提取多模态特征；

6、所述模型训练模块，用于根据问题性质和数据特性，构建并训练机器学习模型；

7、所述模型评估与调优模块，用于客观评价训练后的模型性能，根据评估结果调整模型参数和结构；

8、所述用户交互模块，用于负责与用户进行交互，接收用户的输入和请求，并将系统的响应和结果反馈给用户。

9、具体地，所述数据收集与处理模块包括：样本收集单元、预处理单元、香型识别与标注单元，所述特征工程模块包括：特征提取单元、自适应融合单元；

10、所述样本收集单元，用于收集沉香样本；所述预处理单元，用于对沉香样本进行清洗、格式化、标准化处理；所述香型识别与标注单元，用于将预处理后的数据输入到训练好的模型，得到香型的识别结果，并为每个样本分配正确的香型标签；所述特征提取单元，用于提取标注后的沉香样本在不同时间或条件下的化学成分特征、香气成分特征、香型物理特征；所述自适应融合单元，用于将提取的多模态特征进行自适应融合，形成融合特征。

11、具体地，所述模型训练模块包括：模型选择单元、迁移学习单元、训练单元、超参数调优单元、不确定性量化单元，所述模型评估与调优模块包括：评估单元、集成学习单元、交互式学习单元、调优单元；

12、所述模型选择单元，用于根据问题特性和数据集特点选择机器学习模型；所述迁移学习单元，用于利用迁移学习技术初始化模型参数，加速模型收敛；所述训练单元，用于使用融合特征对模型进行训练；所述超参数调优单元，用于通过自动化超参数调优技术调整模型参数；所述不确定性量化单元，用于对模型的预测结果进行不确定性量化；所述评估单元，用于使用测试集评估模型指标；所述集成学习单元，用于集成同一问题的不同预测结果，学习不同的特征信息；所述交互式学习单元，用于通过交互式学习机制收集用户反馈信息；所述调优单元，用于根据评估结果和用户反馈对模型进行迭代调优。

13、具体地，所述数据收集与处理模块、特征工程模块、模型训练模块、模型评估与调优模块中对应各单元的具体工作流程包括：

14、通过数据收集与处理模块中的样本收集单元收集沉香样本的原始多维数据，并将收集到的原始多维数据传递给预处理单元，预处理单元对接收的原始多维数据进行清洗、格式转换、标准化操作，并将预处理后的多维数据传递给香型识别与标注单元，香型识别与标注单元对预处理后的多维数据进行初步分析，识别沉香样本的香型，并进行标注，将标注好的多维数据传递给特征工程模块；

15、特征工程模块中的特征提取单元根据领域知识和经验，从标注好的多维数据中提取不同时间和不同条件下的香型特征信息、香气成分特征信息、香型物理特征信息，并将特征信息传递给自适应融合单元，自适应融合单元根据数据的特性和任务需求，对提取的特征信息进行自适应融合，形成融合特征，并将融合特征传递给模型训练模块；

16、模型训练模块通过模型选择单元选择机器学习模型，并将选定的机器学习模型的类型传递给迁移学习单元和训练单元，迁移学习单元利用迁移学习技术将任务的知识迁移到当前任务中，并将迁移学习后的机器学习模型和机器学习模型初始化参数传递给训练单元，训练单元使用融合特征对机器学习模型进行训练，通过迭代优化机器学习模型参数，并将训练过程中的中间结果传递给超参数调优单元和不确定性量化单元，超参数调优单元根据训练过程中的中间结果，对机器学习模型的超参数进行调优，找到最佳的超参数组合，并将调优后的超参数设置回训练单元，继续训练过程，不确定性量化单元对训练好的机器学习模型进行不确定性量化，评估机器学习模型在不同情况下的预测可靠性，将不确定性量化结果传递给模型评估与调优模块；

17、模型评估与调优模块中的评估单元使用独立的验证集或测试集对训练好的机器学习模型进行评估，计算性能指标，并将评估结果传递给集成学习单元、交互式学习单元和调优单元，集成学习单元将多个模型的预测结果进行集成，并将集成后的预测结果传递给评估单元进行再次评估，交互式学习单元通过用户反馈收集新的沉香数据和标签，并将新收集的沉香数据和标签传递给数据收集与处理模块进行预处理和标注，再次进入特征工程模块和模型训练模块，调优单元根据评估单元和交互式学习单元提供的信息，调整模型结构、优化算法，并将调优后的模型设置回训练单元进行再次训练。

18、具体地，所述权利要求4中训练过程中的中间结果包括：模型权重和偏置、损失值、性能指标、梯度信息。

19、基于机器学习的沉香香型识别方法，包括：

20、步骤s1：收集沉香样本并进行预处理，对预处理后的沉香样本进行香型标注，明确每个样本所属的香型类别；

21、步骤s2：引入动态特征提取技术，使用气相色谱-质谱联用策略对标注后的沉香样本进行化学成分分析，提取香型特征信息，通过嗅觉分析对标注后的沉香样本的香气成分进行提取，提取香气成分特征信息，通过分析标注后的沉香样本的物理特性，提取香型物理特征信息，并将不同时间或条件下的香型特征信息、香气成分特征信息、香型物理特征信息进行自适应多模态特征融合，得到融合特征；

22、步骤s3：根据问题的特性选择机器学习模型，采用迁移学习技术对机器学习模型进行初始化，并利用融合特征对机器学习模型进行训练，通过自动化超参数调优技术和不确定性量化技术，调整模型参数和训练策略，优化模型性能；

23、步骤s4：使用测试集对训练好的机器学习模型进行评估，计算准确率、召回率、f1值指标，引入集成学习技术和交互式学习机制，根据评估结果对模型进行迭代调优和在线学习。

24、具体地，所述步骤s2的具体实现步骤包括：

25、s201：接收标注后的不同模态的沉香样本数据，针对每个模态的沉香样本数据，分别提取香型特征信息x1,t＝{a1,t,…,ai,t}、香气成分特征信息x2,t＝{b1,t,…,bj,t}、香型物理特征信息x3,t＝{c1,t,…,ck,t}，t表示当前时刻，ai,t表示在t时刻第i个香型特征信息，bj,t表示在t时刻第j个香气成分特征信息，ck,t表示在t时刻第k个香型物理特征信息，i表示香型特征信息的数量，j表示香气成分特征信息的数量，k表示香型物理特征信息的数量；

26、s202：对提取的x1,t、x2,t、x3,t进行标准化处理，通过时间同步进行特征对齐；

27、s203：使用自适应多模态特征融合技术将不同模态的特征信息进行融合，得到融合特征xt＝{x1,t,x2,t,x3,t}，公式为：

28、xt＝w1,t×x1,t+w2,t×x2,t+w3,t×x3,t

29、其中，w1,t表示x1,t的权重，w2,t表示x2,t的权重，w3,t表示x3,t的权重；

30、s204：评估xt＝{x1,t,x2,t,x3,t}的性能，使用聚类分析进行验证。

31、具体地，所述步骤s3的具体步骤包括：

32、s301：分析聚类结果，选择线性回归模型；

33、s302：查找预训练模型，利用迁移学习技术，将预训练模型的参数作为当前线性回归模型的初始参数，并将融合特征xt的数据集划分为训练集、验证集、测试集；

34、s303：使用训练集对线性回归模型进行训练，使用验证集对线性回归模型进行验证，并监控性能指标；

35、s304：定义超参数搜索空间，使用网格搜索策略在搜索空间中采样超参数组合，通过线性回归模型，评估每个采样的超参数组合在验证集上的性能，根据验证集上的性能指标，选择最佳的超参数组合，并根据最佳超参数组合，重新训练线性回归模型；

36、s305：使用训练好的线性回归模型对新的数据点进行基于模型参数的不确定性预测，对每个预测值，计算预测区间，将得到的预测区间的宽度作为不确定性的量化指标s，并设定不确定性的量化指标阈值为h，若s＞h，则增加训练数据；

37、s306：根据不确定性量化结果，使用正则化调整线性回归模型的复杂度，调整输出策略。

38、具体地，所述步骤s4的具体步骤包括：

39、s401：使用s302中划分的测试集对训练好的线性回归模型进行预测，根据预测结果和真实标签，计算准确率、召回率和f1值指标；

40、s402：选择bagging集成学习算法，构建和训练集成模型，并使用测试集进行评估；

41、s403：设计交互式学习接口，允许用户或专家对集成模型预测结果进行反馈，并根据反馈信息对集成模型进行在线学习或重新训练；

42、s404：根据测试集的评估结果，分析集成模型的性能瓶颈，根据性能瓶颈分析，调整模型的超参数或改进模型结构。

43、与现有技术相比，本发明的有益效果是：

44、1.本发明提出基于机器学习的沉香香型识别系统，并进行了架构、运行步骤和流程上的优化改进，系统具备流程简单，投资运行费用低廉，生产工作成本低的优点，提高了沉香香型识别的准确性与效率。

45、2.本发明提出基于机器学习的沉香香型识别方法，通过引入动态特征提取技术，精准地提取沉香的香型特征、香气成分特征以及物理特征，并将这些多模态特征信息进行自适应融合，从而充分捕捉沉香样本的复杂性和多样性，提高了特征表达的准确性和全面性；采用迁移学习技术对机器学习模型进行初始化，有效利用了先前相关领域的知识，加速了模型的收敛速度，并提高了模型的泛化能力，同时，结合自动化超参数调优技术和不确定性量化技术，自动调整模型参数和训练策略，进一步优化模型的性能，提高识别精度；通过引入集成学习技术和交互式学习机制，充分利用多个模型的优点，降低预测的不确定性，同时允许用户或专家对模型预测结果进行反馈，实现模型的迭代调优和在线学习，不仅提高了模型的鲁棒性和适应性，还使得模型能够不断学习和进步，更好地满足实际应用的需求。

46、3.本发明提出基于机器学习的沉香香型识别方法，通过大量数据的训练和优化，实现更准确的定量分析，而且，具有更高的自动化程度，可以减少人为因素的干扰，提高结果的稳定性和可重复性。

技术特征：

1.基于机器学习的沉香香型识别系统，其特征在于，包括：数据收集与处理模块、特征工程模块、模型训练模块、模型评估与调优模块、用户交互模块；

2.如权利要求1所述的基于机器学习的沉香香型识别系统，其特征在于，所述数据收集与处理模块包括：样本收集单元、预处理单元、香型识别与标注单元，所述特征工程模块包括：特征提取单元、自适应融合单元；

3.如权利要求2所述的基于机器学习的沉香香型识别系统，其特征在于，所述模型训练模块包括：模型选择单元、迁移学习单元、训练单元、超参数调优单元、不确定性量化单元，所述模型评估与调优模块包括：评估单元、集成学习单元、交互式学习单元、调优单元；

4.如权利要求3所述的基于机器学习的沉香香型识别系统，其特征在于，所述数据收集与处理模块、特征工程模块、模型训练模块、模型评估与调优模块中对应各单元的具体工作流程包括：

5.如权利要求4所述的基于机器学习的沉香香型识别系统，其特征在于，所述权利要求4中训练过程中的中间结果包括：模型权重和偏置、损失值、性能指标、梯度信息。

6.基于机器学习的沉香香型识别方法，其特征在于，包括：

7.如权利要求6所述的基于机器学习的沉香香型识别方法，其特征在于，所述步骤s2的具体实现步骤包括：

8.如权利要求7所述的基于机器学习的沉香香型识别方法，其特征在于，所述步骤s3的具体步骤包括：

9.如权利要求8所述的基于机器学习的沉香香型识别方法，其特征在于，所述步骤s4的具体步骤包括：

技术总结
本发明公开了基于机器学习的沉香香型识别系统及方法，属于模式识别领域，其具体包括：通过收集并预处理沉香样本，标注香型类别，利用气相色谱‑质谱联用策略与嗅觉分析提取香型特征与香气成分特征，并结合物理特性进行多模态特征融合，采用迁移学习技术初始化机器学习模型，并通过融合特征训练模型，结合自动化超参数调优与不确定性量化技术优化性能，最终，利用测试集评估模型性能，并引入集成学习与交互式学习机制进行迭代调优和在线学习，提高了沉香香型识别的准确性与效率。

技术研发人员：陈荻,李亚宏
受保护的技术使用者：东方沉香集团（海南）有限公司
技术研发日：
技术公布日：2024/7/25

转载请注明原文地址: https://bbs.8miu.com/read-440327.html

专利

最新回复(0)