本技术涉及人工智能,尤其涉及一种基于深度度量学习和多通道部分可观测函数型数据建模的不平衡缺陷分类方法。
背景技术:
1、在生产制造场景中,通常可以采用传感器等信号采集设备收集制造过程变量的连续信号,且这些信号可以被视为多通道函数型数据。多通道函数型数据是指在生产线上采集到的多个通道(即维度)的函数型数据。因此,基于多通道函数型数据,可以提供关于制造过程中多个方面的信息,帮助分析和理解整个制造过程。
2、然而,由于采用传感器等信号采集设备不能完全覆盖整个生产制造过程,导致收集的多通道函数型数据只有部分是可观测,无法获得完整的数据。例如,在螺纹管接箍连接制造过程中,如果螺纹管正确连接需要拧10圈,但由于预连接过程提前拧了一些圈,导致后续紧固过程采集的数据无法反映螺纹管连接的完整的多通道函数型数据。基于此,现有技术的缺陷分类方法所对应的模型在实际训练时,由于使用了标签不平衡、且只有部分观测的函数型数据进行模型构建,使得构建的模型对于实际应用中只有部分可观测的多通道函数型数据的分类准确度较低,并且影响了对制造过程中是否存在缺陷的判断效率。因此,如何提供一种能够对采集到的部分可观测的多通道函数型数据进行数据分类时,也保证较高的分类准确度的不平衡缺陷分类方法,以快速准确地识别出制造过程中是否存在缺陷,成为了亟待解决的技术问题。
技术实现思路
1、本技术实施例的主要目的在于提出了一种基于深度度量学习和多通道部分可观测函数型数据建模的不平衡缺陷分类方法,能够对采集到部分可观测的多通道函数型数据进行数据分类时,也能够保证较高的分类准确度,以快速准确地识别出制造过程中是否存在缺陷。
2、为实现上述目的,本技术实施例的第一方面提出了一种基于深度度量学习和多通道部分可观测函数型数据建模的不平衡缺陷分类方法,所述方法包括:
3、获取目标产品在当前观测区域的初始输入数据;其中,所述初始输入数据包含多个初始输入子数据,每个所述初始输入子数据是所述目标产品在观测区域中的一个通道上的观测值;
4、基于所述初始输入数据进行分布函数构建,得到分布预测函数;
5、基于所述分布预测函数对所述初始输入数据进行数据预测,得到候选输入数据,并将所述初始输入数据和所述候选输入数据进行数据组合,得到预处理后数据;其中,所述候选输入数据用于表征对所述目标产品在未观测区域预测到的数据;
6、将所述预处理后数据输入预先训练的多通道函数型数据分类模型,所述多通道函数型数据分类模型包括线性转换子模型、非线性转换子模型和分类器;
7、基于所述线性转换子模型对所述预处理后数据进行线性编码处理,得到线性编码特征;
8、基于所述非线性转换子模型对所述线性编码特征进行非线性编码处理,得到目标编码特征;
9、基于所述分类器对所述目标编码特征进行数据分类,得到目标分类标签,所述目标分类标签用于指示所述目标产品在所述当前观测区域的缺陷类别。
10、在一些实施例中,所述基于所述初始输入数据进行分布函数构建,得到分布预测函数,包括:
11、获取所述初始输入数据的数据分布属性标记;
12、基于所述数据分布属性标记确定所述初始输入数据对应的目标基函数,并基于所述目标基函数构建所述分布预测函数。
13、在一些实施例中,所述数据分布属性标记包括第一特征标记和第二特征标记,所述第一特征标记表示所述初始输入数据为符合周期性特征的数据,所述第二特征标记表示所述初始输入数据为不符合周期性特征的数据;
14、所述基于所述数据分布属性标记确定所述初始输入数据对应的目标基函数,并基于所述目标基函数构建所述分布预测函数,包括:
15、若所述数据分布属性标记为所述第一特征标记,确定所述目标基函数为周期性基函数,并基于第一数目个所述周期性基函数构建所述分布预测函数;
16、若所述数据分布属性标记为所述第二特征标记,确定所述目标基函数为多项式基函数,并基于第二数目个所述多项式基函数构建所述分布预测函数。
17、在一些实施例中,所述第一数目通过以下方式确定:
18、获取所述初始输入数据的数据检测复杂度;
19、获取所述目标产品的产品检测精度;
20、基于所述数据检测复杂度和所述产品检测精度,确定所述第一数目。
21、在一些实施例中,在所述将所述预处理后数据输入预先训练的多通道函数型数据分类模型之前,所述方法还包括:构建所述多通道函数型数据分类模型,具体包括:
22、获取样本产品的分类样本集,所述分类样本集包括多个初始训练样本,每个所述初始训练样本包括所述样本产品在样本观测区域的初始样本输入数据和所述初始样本输入数据对应的初始样本分类标签,所述初始样本分类标签用于指示所述样本产品在所述样本观测区域的缺陷类别;
23、基于所述初始样本分类标签对多个所述初始训练样本进行分层抽样,确定抽取样本组,所述抽取样本组包括多个候选训练样本和候选样本分类标签;
24、针对每个抽取样本组,基于所述候选样本分类标签对所述候选训练样本进行样本选择,确定中心训练样本、第一训练样本和第二训练样本;其中,所述中心训练样本用于表征从所述抽取样本组中随机确定的训练样本,所述第一训练样本用于表征与所述中心训练样本的样本分类标签相同的样本,所述第二训练样本用于表征与所述中心训练样本的样本分类标签不相同的样本;
25、将所述中心训练样本、所述第一训练样本和所述第二训练样本输入预设的初始分类模型,所述初始分类模型包括所述线性转换子模型、所述非线性转换子模型和所述分类器;
26、基于所述线性转换子模型分别对所述中心训练样本、所述第一训练样本和所述第二训练样本进行线性编码处理,得到所述中心训练样本对应的中心线性编码特征、所述第一训练样本对应的第一线性编码特征和所述第二训练样本对应的第二线性编码特征;
27、基于所述非线性转换子模型分别对所述中心线性编码特征、所述第一线性编码特征和所述第二线性编码特征进行非线性编码处理,得到所述中心训练样本对应的中心目标编码特征、所述第一训练样本对应的第一目标编码特征和所述第二训练样本对应的第二目标编码特征;
28、基于所述中心训练样本、所述第一训练样本、所述中心目标编码特征、所述第一目标编码特征和所述第二目标编码特征,构建对比损失函数;
29、基于所述对比损失函数对所述线性转换子模型和所述非线性转换子模型进行参数调整,并基于参数调整后的所述线性转换子模型、所述非线性转换子模型和所述分类器进行模型构建,得到所述多通道函数型数据分类模型。
30、在一些实施例中,所述基于所述中心训练样本、所述第一训练样本、所述中心目标编码特征、所述第一目标编码特征和所述第二目标编码特征,构建对比损失函数,包括:
31、获取所述第二训练样本对应的所述抽取样本组中包含的所述候选训练样本的数量,得到候选抽取样本数;
32、基于所述候选抽取样本数、所述中心目标编码特征、所述第一目标编码特征和所述第二目标编码特征进行类间样本比对计算,得到类间对比函数;
33、基于所述中心训练样本和所述第一训练样本进行类内样本比对计算,得到类内对比函数;
34、对所述类间对比函数和所述类内对比函数进行加和计算,得到所述对比损失函数。
35、在一些实施例中,所述基于所述中心训练样本和所述第一训练样本进行类内样本比对计算,得到类内对比函数,包括:
36、获取预设的平滑函数集,所述平滑函数集包括多个候选平滑函数;
37、基于每个所述候选平滑函数对所述中心训练样本进行平滑处理,得到中心平滑样本;
38、基于每个所述候选平滑函数对所述第一训练样本进行平滑处理,得到第一平滑样本;
39、基于所述线性转换子模型,分别对同一所述候选平滑函数对应的所述中心平滑样本和所述第一平滑样本进行线性编码处理,得到所述中心平滑样本对应的中心平滑线性编码特征和所述第一平滑样本对应的第一平滑线性编码特征;
40、基于所述非线性转换子模型,分别对同一所述候选平滑函数对应的所述中心平滑线性编码特征和所述第一平滑线性编码特征进行非线性编码处理,得到所述中心平滑线性编码特征对应的中心平滑目标编码特征和所述第一平滑线性编码特征对应的第一平滑目标编码特征;
41、基于所述平滑函数集中包含的所述候选平滑函数的数量、所述中心平滑目标编码特征和所述第一平滑目标编码特征进行类内平滑样本比对计算,得到所述类内对比函数。
42、为实现上述目的,本技术实施例的第二方面提出了一种基于深度度量学习和多通道部分可观测函数型数据建模的不平衡缺陷分类系统,所述系统包括:
43、获取模块,用于获取目标产品在当前观测区域的初始输入数据;其中,所述初始输入数据包含多个初始输入子数据,每个所述初始输入子数据是所述目标产品在观测区域中的一个通道上的观测值;
44、函数构建模块,用于基于所述初始输入数据进行分布函数构建,得到分布预测函数;
45、数据预测模块,用于基于所述分布预测函数对所述初始输入数据进行数据预测,得到候选输入数据,并将所述初始输入数据和所述候选输入数据进行数据组合,得到预处理后数据;其中,所述候选输入数据用于表征对所述目标产品在未观测区域预测到的数据;
46、输入模块,用于将所述预处理后数据输入预先训练的多通道函数型数据分类模型,所述多通道函数型数据分类模型包括线性转换子模型、非线性转换子模型和分类器;
47、线性编码模块,用于基于所述线性转换子模型对所述预处理后数据进行线性编码处理,得到线性编码特征;
48、非线性编码模块,用于基于所述非线性转换子模型对所述线性编码特征进行非线性编码处理,得到目标编码特征;
49、数据分类模块,用于基于所述分类器对所述目标编码特征进行数据分类,得到目标分类标签,所述目标分类标签用于指示所述目标产品在所述当前观测区域的缺陷类别。
50、为实现上述目的,本技术实施例的第三方面提出了一种计算机设备,包括:
51、至少一个存储器;
52、至少一个处理器;
53、至少一个计算机程序;
54、所述至少一个计算机程序被存储在所述至少一个存储器中,所述至少一个处理器执行所述至少一个计算机程序以实现上述第一方面所述的基于深度度量学习和多通道部分可观测函数型数据建模的不平衡缺陷分类方法。
55、为实现上述目的,本技术实施例的第四方面提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于使计算机执行上述第一方面所述的基于深度度量学习和多通道部分可观测函数型数据建模的不平衡缺陷分类方法。
56、本技术实施例提出的一种基于深度度量学习和多通道部分可观测函数型数据建模的不平衡缺陷分类方法,能够基于预先训练的多通道函数型数据分类模型,能够对采集到的只有部分可观测的多通道函数型数据进行数据分类时,也保证较高的分类准确度,也就是说,本技术不需要预先知道采集的多通道函数型数据缺陷的数据部分,就能够正确编码采集的可观测部分的数据。具体地,先获取目标产品在当前观测区域的初始输入数据,该初始输入数据包括多个初始输入子数据,则每个初始输入子数据是该目标产品在观测区域中的一个通道上的观测值。然后,在将初始输入数据输入模型之前,先基于初始输入数据进行分布函数构建,得到分布预测函数,基于分布预测函数对初始输入数据进行数据预测,得到候选输入数据,并将初始输入数据和候选输入数据进行数据组合,得到预处理后数据。其中,该候选输入数据用于表征对目标产品未观测区域预测到的数据。这时,将预处理后数据输入预先训练的多通道函数型数据分类模型,该多通道函数型数据分类模型包括线性转换子模型、非线性转换子模型和分类器。如此一来,可以基于线性转换子模型对所述预处理后数据进行线性编码处理,得到线性编码特征;基于非线性转换子模型对线性编码特征进行非线性编码处理,得到目标编码特征;并基于分类器对目标编码特征进行数据分类,得到目标分类标签,该目标分类标签用于指示目标产品在当前观测区域的缺陷类别。因此,本技术实施例基于分布预测函数对初始输入数据进行数据预测,并基于多通道函数型数据分类模型对初始输入数据和候选输入数据组合的预处理后数据进行分类,以得到更准确地目标分类标签。也就是说,本技术能够对采集到只有部分可观测的多通道函数型数据进行数据分类时,也保能够证较高的分类准确度,以快速准确地识别出制造过程中是否存在缺陷。
1.一种基于深度度量学习和多通道部分可观测函数型数据建模的不平衡缺陷分类方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述初始输入数据进行分布函数构建,得到分布预测函数,包括:
3.根据权利要求2所述的方法,其特征在于,所述数据分布属性标记包括第一特征标记和第二特征标记,所述第一特征标记表示所述初始输入数据为符合周期性特征的数据,所述第二特征标记表示所述初始输入数据为不符合周期性特征的数据;
4.根据权利要求3所述的方法,其特征在于,所述第一数目通过以下方式确定:
5.根据权利要求1所述的方法,其特征在于,在所述将所述预处理后数据输入预先训练的多通道函数型数据分类模型之前,所述方法还包括:构建所述多通道函数型数据分类模型,具体包括:
6.根据权利要求5所述的方法,其特征在于,所述基于所述中心训练样本、所述第一训练样本、所述中心目标编码特征、所述第一目标编码特征和所述第二目标编码特征,构建对比损失函数,包括:
7.根据权利要求6所述的方法,其特征在于,所述基于所述中心训练样本和所述第一训练样本进行类内样本比对计算,得到类内对比函数,包括:
8.一种基于深度度量学习和多通道部分可观测函数型数据建模的不平衡缺陷分类系统,其特征在于,所述系统包括:
9.一种计算机设备,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于使计算机执行:
