本发明涉及深度学习领域,尤其涉及的一种基于数据增强估计模型不确定度的方法及装置。
背景技术:
1、近年来,随着深度学习技术的发展,其在图像识别、自动驾驶、自然语言处理等多个领域展现了其优秀的性能与强大的应用潜力。然而,尽管深度学习模型能够提供高度精确的预测和决策支持,但其输出结果的不确定度计算仍然是一个未完全解决的关键问题。不确定度的计算不仅关乎模型的可靠性评估,还直接影响到模型在高风险应用场景中的安全性和有效性,例如自动驾驶和机器人等领域。深度学习中的针对预测结果的不确定度主要分为两大类:模型不确定度(epistemic uncertainty)和偶然不确定度(aleatoricuncertainty)。模型不确定度来源于训练数据的缺乏,即训练数据中不包含测试数据时,模型的输出结果将具有较高的模型不确定度。偶然不确定度来是由系统或环境本身的随机性造成的。这种不确定度是固有的,通常无法通过增加知识或信息来消除。因此,在机器人和自动驾驶领域,模型不确定度往往起到更为关键的作用。
2、目前,关于深度学习中模型不确定度的研究主要分为两种方法:蒙特卡罗dropout和深度集成。前者为基于贝叶斯理论的计算方法,其在网络模型中加入dropout来近似贝叶斯推理,在推理阶段计算多次推理的方差来估计网络模型的模型不确定度。后者为非贝叶斯理论的计算方法,其在模型训练阶段独立地训练多组网络,在推理阶段计算多组网络输出结果的方差来计算网络模型的不确定度。基于蒙特卡罗dropout的方法,在推理阶段需要20余次的前向传播来计算模型不确定度,极大增加了运算开销,此外对于小参数量的模型,加入dropout也会降低模型的性能。基于深度集成方法,在训练阶段需要训练多组网络,使得模型训练周期大大延长,并且其在推理阶段也需要多次的前向传播来计算模型的不确定度。
3、针对上述问题,亟需一种在不降低模型性能和无需额外训练周期的情况下,实现准确、低运算开销的模型不确定度计算的技术。
技术实现思路
1、本发明的目的在于针对现有技术的不足,提供一种基于数据增强的模型不确定度计算方法及装置,该方法能够在不降低模型性能和无需额外训练周期的情况下,实现准确、低运算开销的模型不确定度计算。
2、本发明的目的是通过以下技术方案来实现的:
3、一种基于数据增强估计模型不确定度的方法,包括以下步骤:
4、(1)使用数据增强策略来生成对应的增强数据,并将基于原始数据和增强数据的计算结果用于反向传播,更新网络模型参数;
5、(2)依次输入原始数据和经过数据增强后的数据,分别计算其对应的输出结果,网络模型推理与网络模型训练使用与步骤(1)相同的数据增强策略;
6、(3)将原始数据或增强数据对应的计算结果作为网络模型的预测输出;
7、(4)根据输入原始数据和增强数据的计算结果的偏离程度来估计网络模型的模型不确定度。
8、进一步地,所述步骤(1)中的数据增强策略,具体为:
9、(1.1)几何变换型数据增强:对输入的原始图像进行裁剪、缩放和旋转形式的变换或其组合形式变换,该变换用于网络模型的训练和推理;
10、(1.2)时序变换型数据增强:对输入的具有时序信息的数据进行正序、逆序或混合排序的变换处理,该变换用于网络模型的训练和推理;
11、(1.3)噪声型数据增强:对输入的原始图像进行模糊、亮度变化和增加噪点的处理或其组合处理,该变换用于网络模型的训练和推理;
12、(1.4)组合型数据增强;将几何变换型、时序变换型和噪声型组合式的数据增强类型。
13、进一步地,所述步骤(3)网络模型的预测输出类型包括:
14、(3.1)将原始数据对应的计算结果作为网络模型的预测输出,即;为网络模型的预测输出,为网络模型基于原始数据的输出;
15、(3.2)将增强数据对应的计算结果的平均值作为网络模型的预测输出;
16、(3.3)将原始数据和增强数据的结果平均值作为网络模型的预测输出。
17、进一步地,所述步骤(3.2)中的网络模型的预测输出的表达式为:;为网络模型基于数据增强数据的输出。
18、进一步地,所述步骤(3.3)中的网络模型的预测输出的表达式为:。
19、进一步地,所述步骤(4)中的网络模型的模型不确定度的计算方法具体为:
20、(4.1)分别计算原始数据和增强数据分别对应的网络模型的预测结果,为使用数据增强的次数;
21、(4.2)合并网络模型的两种预测结果,计算其总的中心距方差,该方差即为模型不确定度。
22、进一步地,所述步骤(4.2)中的总的中心距方差的表达式为:。
23、本发明还提供了一种基于数据增强估计模型不确定度的装置,包括以下步骤:
24、更新模型参数模块:使用数据增强的策略来生成对应的增强数据,并将基于原始数据和增强数据的计算结果用于反向传播,更新网络模型参数;
25、计算输出结果模块:依次输入原始数据和经过数据增强后的数据,分别计算其对应的输出结果,网络模型推理与网络模型训练使用更新模型参数模块相同的数据增强策略;
26、预测输出模块:将原始数据或增强数据对应的计算结果作为网络模型的预测输出;
27、估计模型不确定度模块:根据输入原始数据和增强数据的计算结果的偏离程度来估计网络模型的模型不确定度。
28、又提供了一种电子设备,包括:
29、一个或多个处理器;
30、存储器,用于存储一个或多个程序;
31、当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现所述的基于数据增强估计模型不确定度的方法。
32、以及提供了一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现所述基于数据增强估计模型不确定度的方法步骤。
33、本发明的有益效果如下:
34、本发明提出的基于数据增强的模型不确定度计算方法,实现了无需对原始的网络模型进行额外修改即可计算其模型不确定度,另外该方法也降低了运算的开销,提高了模型不确定度的计算准确性。
1.一种基于数据增强估计模型不确定度的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于数据增强估计模型不确定度的方法,其特征在于,所述步骤(1)中的数据增强策略,具体为:
3.根据权利要求1所述的一种基于数据增强估计模型不确定度的方法,其特征在于,所述步骤(3)网络模型的预测输出类型包括:
4.根据权利要求1所述的一种基于数据增强估计模型不确定度的方法,其特征在于,所述步骤(3.2)中的网络模型的预测输出的表达式为:;为网络模型基于数据增强数据的输出。
5.根据权利要求1所述的一种基于数据增强估计模型不确定度的方法,其特征在于,所述步骤(3.3)中的网络模型的预测输出的表达式为:。
6.根据权利要求1所述的一种基于数据增强估计模型不确定度的方法,其特征在于,所述步骤(4)中的网络模型的模型不确定度的计算方法具体为:
7.根据权利要求1所述的一种基于数据增强估计模型不确定度的方法,其特征在于,所述步骤(4.2)中的总的中心距方差的表达式为:。
8.一种基于数据增强估计模型不确定度的装置,其特征在于,包括以下步骤:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现如权利要求1-7中任一项所述基于数据增强估计模型不确定度的方法步骤。
