本发明涉及计算机应用、计算机视觉技术领域,涉及一种神经网络优化方法,具体涉及一种基于动态强度的物体检测神经网络混合训练方法及系统。
背景技术:
神经网络是一种处理计算机视觉问题的一种常见方法。其主要通过卷积层、池化层、全连接层、激活函数等组件以某种方式组合成一个网络,再以足量的任务相关的数据对网络进行训练。当网络得到足够的训练,能够处理训练数据以外的数据时便表示网络已经训练完成。此时得到的网络便可以作为一个黑盒函数用以解决我们的问题。
神经网络的训练方法指的是神经网络训练时所采取的训练策略,当神经网络采取不同的训练策略时可能最后会得到效果不同的模型。训练方法一般包括几个部分:数据预处理,训练用的辅助网络,损失函数。其中每一个部分的改动都会影响神经网络的训练过程及最后的结果。
本申请发明人在实施本发明的过程中,发现现有技术的方法,至少存在如下技术问题:
现有的训练方法过分依赖于原始数据集,训练难度较大。
技术实现要素:
有鉴于此,本发明提供了一种基于动态强度的物体检测神经网络混合训练方法及系统,用以解决或者至少部分解决现有技术中现有的训练方法过分依赖于原始数据集,训练难度较大的技术问题。
为了解决上述技术问题,本发明第一方面提供了一种基于动态强度的物体检测神经网络混合训练方法,包括:
s1:构建物体检测神经网络,并初始化物体检测神经网络的所有参数;
s2:获取原始训练数据,并对原始训练数据进行预处理,其中,原始训练数据包括图像数据和标签数据,标签数据包括图像内所有的标记物体的类别信息和位置信息;
s3:获取动态混合参数,从预处理后的训练数据中随机选取第一数据和第二数据,将动态混合参数作为混合强度调节参数对选取出的第一数据和第二数据进行混合,获得混合后的数据对,其中,混合后的数据对包括混合后的图像数据、第一数据对应的标签数据以及第二数据对应的标签数据;
s4:基于混合后的数据对获得扩展后的数据集;
s5:根据扩展后的数据集中的混合数据、第一数据对应的标签数据以及第二数据对应的标签数据,设置目标混合损失函数,其中,目标混合损失函数包括分类损失和位置损失;
s6:将扩展后的数据集作为训练数据,结合混合损失函数,采用随机梯度下降法对物体检测神经网络进行训练,得到训练好的物体检测神经网络。
在一种实施方式中,s1包括:
s1.1:使用卷积层、全连接层、池化层、激活层构建神经网络或者使用现有的神经网络作为物体检测神经网络;
s1.2:采用随机参数初始化方法初始化物体检测神经网络的所有参数。
在一种实施方式中,s2中对原始训练数据进行预处理,具体包括:
s2.1:对原始训练数据中的图像数据进行像素值归一化;
s2.2:进行图片裁剪;
s2.3:进行图片翻转。
在一种实施方式中,s3具体包括:
s3.1:根据公式生成动态混合参数λ,具体公式如下:
其中,
s3.2:从预处理后的训练数据中随机选取第一数据和第二数据作为混合的原数据,将两个数据按照动态混合参数λ的比例进行线性混合,具体操作为:
x=λx1 (1-λ)x2
得到的混合后的数据对为(x,y1,y2),其中,x为混合后的图像数据,y1为第一数据x1所对应的标签数据,y2为第二数据x2所对应的标签数据。
在一种实施方式中,s4包括将混合后的数据对整合为扩展后的数据集
其中,
在一种实施方式中,s5具体包括:
s5.1:将混合后的图像数据作为输入图像数据,分别与其相关的两个标签数据ypi,yqi的类别信息求损失,
losscls(θ)=λlossi(θ) (1-λ)lossj(θ)
其中
s5.2:将混合数据作为输入图像数据,分别与其相关的两个标签数据ypi,yqi的位置信息求损失,具体为:
lossloc(θ)=λlossi(θ)′ (1-λ)lossj(θ)′
其中,lossi(θ)′为第一数据的位置损失,lossj(θ)′为第二数据的位置损失,lossloc(θ)为混合位置损失函数,θ为神经网络中的所需要优化的参数,lsm为平滑l1损失函数,
s5.3:将混合分类损失函数与混合位置损失函数相结合,得到目标混合损失函数:
loss(θ)=losscls(θ) γlossloc(θ)
其中loss(θ)是目标混合损失函数,γ为分类损失与位置损失的比重参数。
在一种实施方式中,s6包括:
s6.1:从扩展后的数据集中随机选取得到一系列数据;
s6.2:将得到的一系列数据输入至物体检测神经网络得到相应的预测结果,并通过目标混合损失函数根据实际结果与预测结果的损失值;
s6.3:利用反向传播更新整个网络的参数。
基于同样的发明构思,本发明第二方面提供了一种基于动态强度的物体检测神经网络混合训练系统,包括:
神经网络构建模块,用于构建物体检测神经网络,并初始化物体检测神经网络的所有参数;
数据预处理模块,用于获取原始训练数据,并对原始训练数据进行预处理,其中,原始训练数据包括图像数据和标签数据,标签数据包括图像内所有的标记物体的类别信息和位置信息;
数据混合模块,用于获取动态混合参数,从预处理后的训练数据中随机选取第一数据和第二数据,将动态混合参数作为混合强度调节参数对选取出的第一数据和第二数据进行混合,获得混合后的数据对,其中,混合后的数据对包括混合后的图像数据、第一数据对应的标签数据以及第二数据对应的标签数据;
扩展后数据集获得模块,用于基于混合后的数据对获得扩展后的数据集;
损失函数设置模块,用于根据扩展后的数据集中的混合数据、第一数据对应的标签数据以及第二数据对应的标签数据,设置目标混合损失函数,其中,目标混合损失函数包括分类损失和位置损失;
训练模块,用于将扩展后的数据集作为训练数据,结合混合损失函数,采用随机梯度下降法对物体检测神经网络进行训练,得到训练好的物体检测神经网络。
基于同样的发明构思,本发明第三方面提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被执行时实现第一方面所述的方法。
基于同样的发明构思,本发明第四方面提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述的方法。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
本发明提供的一种基于动态强度的物体检测神经网络混合训练方法,首先构建物体检测神经网络,然后对原始训练数据进行预处理,接着获取动态混合参数,并将动态混合参数作为混合强度调节参数对选取出的第一数据和第二数据进行混合;接下来基于混合后的数据对获得扩展后的数据集;然后根据扩展后的数据集中的混合数据、第一数据对应的标签数据以及第二数据对应的标签数据,设置目标混合损失函数;最后将扩展后的数据集作为训练数据,结合混合损失函数,采用随机梯度下降法对物体检测神经网络进行训练,得到训练好的物体检测神经网络。通过将动态混合参数作为混合强度调节参数对选取出的第一数据和第二数据进行混合,可以构建混合数据对,一定程度扩充了数据集,降低了混合训练方法在检测网络上的训练难度,平滑了训练过程,从而更容易得到最优模型。相比于其他训练方法,训练出的模型具有更好的泛化性,解决了现有技术中现有的训练方法过分依赖于原始数据集,训练难度较大的技术问题。
进一步地,将选取出的两个数据按照动态混合参数λ的比例进行线性混合,即额外添加了不同类别数据间的线性关系,提升了模型的表现力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一种实施方式中基于动态强度的物体检测神经网络混合训练方法的实现流程示意图;
图2为目标混合损失函数的计算原理图;
图3为本发明实施例中基于动态强度的物体检测神经网络混合训练系统的结构框图;
图4为本发明实施例中一种计算机可读存储介质的结构框图;
图5为本发明实施例中计算机设备的结构图。
具体实施方式
本发明提供的一种新型的物体检测神经网络的训练方法,目的是改进现有的训练方法,采取动态参数调整及混合训练的方式,提高神经网络的泛化性及鲁棒性,总而提升模型在测试数据上的表现。
本发明的总体发明构思如下:
首先构建物体检测神经网络,然后对原始训练数据进行预处理,接着获取动态混合参数,并将动态混合参数作为混合强度调节参数对选取出的第一数据和第二数据进行混合;接下来基于混合后的数据对获得扩展后的数据集;然后根据扩展后的数据集中的混合数据、第一数据对应的标签数据以及第二数据对应的标签数据,设置目标混合损失函数;最后将扩展后的数据集作为训练数据,结合混合损失函数,采用随机梯度下降法对物体检测神经网络进行训练,得到训练好的物体检测神经网络。
本发明通过构建混合数据,一定程度扩充了数据集,并且额外添加了不同类别数据间的线性关系,提升了模型的表现力。而通过动态混合参数的设置,降低了混合训练方法在检测网络上的训练难度,平滑了训练过程,从而更容易得到最优模型。相比于其他训练方法,训练出的模型具有更好的泛化性。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本实施例提供了一种基于动态强度的物体检测神经网络混合训练方法,请参见图1,该方法包括:
s1:构建物体检测神经网络,并初始化物体检测神经网络的所有参数。
具体来说,可以采用神经网络的相关理论构建物体检测神经网络,或者采用已有的神经网络架构作为物体检测神经网络。
s2:获取原始训练数据,并对原始训练数据进行预处理,其中,原始训练数据包括图像数据和标签数据,标签数据包括图像内所有的标记物体的类别信息和位置信息。
具体来说,原始训练数据可以从已有的数据集中获取,例如
s3:获取动态混合参数,从预处理后的训练数据中随机选取第一数据和第二数据,将动态混合参数作为混合强度调节参数对选取出的第一数据和第二数据进行混合,获得混合后的数据对,其中,混合后的数据对包括混合后的图像数据、第一数据对应的标签数据以及第二数据对应的标签数据。
具体来说,将动态混合参数作为混合强度调节参数对选取出的第一数据和第二数据进行混合,动态混合参数的大小表示混合强度。同样地,第一数据对应的标签数据、第二数据对应的标签数据,都包含类别信息和位置信息。
s4:基于混合后的数据对获得扩展后的数据集。
s5:根据扩展后的数据集中的混合数据、第一数据对应的标签数据以及第二数据对应的标签数据,设置目标混合损失函数,其中,目标混合损失函数包括分类损失和位置损失。
具体来说,目标混合损失函数中的分类损失根据标签数据中的类别信息计算得到,位置损失根据标签数据中的位置信息计算得到。
s6:将扩展后的数据集作为训练数据,结合混合损失函数,采用随机梯度下降法对物体检测神经网络进行训练,得到训练好的物体检测神经网络。
具体来说,基于神经网络的分类及检测任务指的是使用神经网络作为工具,通过将物体检测数据输入进神经网络,其会反馈出相应的物体检测结果。在神经网络的训练阶段,使用大量检测数据作为训练数据用来训练网络,当网络能够正确检测已有的训练数据后说明网络已经基本训练完成。最后训练得到的网络用来处理我们需要处理的物体检测数据。
当得到扩展后的数据集和目标混合损失函数后,则可以利用随机梯度下降方法对s1中的物体检测神经网络进行训练,从而得到训练好的物体检测神经网络。
在一种实施方式中,s1包括:
s1.1:使用卷积层、全连接层、池化层、激活层构建神经网络或者使用现有的神经网络作为物体检测神经网络;
s1.2:采用随机参数初始化方法初始化物体检测神经网络的所有参数。
在一种实施方式中,s2中对原始训练数据进行预处理,具体包括:
s2.1:对原始训练数据中的图像数据进行像素值归一化;
s2.2:进行图片裁剪;
s2.3:进行图片翻转。
具体来说,像素值归一化的实现过程可以是:首先将所有像素值除以255,将所有像素值限制在[0,1],然后求出所有图像的像素值的平均值,并将所有像素值减去平均值,使得中心点归零,图片裁剪的过程可以是:首先将所选的图片进行边缘部分的扩充,用0值填充边缘部分,例如填充宽度为总边长的四分之一或二分之一,然后随机在填充后的图片里选择一块与原图像大小相同的区域,将其裁剪出来作为新的数据,图片翻转的实现过程可以是:在图片翻转的处理中,在一定的概率下以图像中线为基准,作水平翻转,有一定概率图像不做翻转操作。例如将翻转概率设置为0.5。
在一种实施方式中,s3具体包括:
s3.1:根据公式生成动态混合参数λ,具体公式如下:
其中,
s3.2:从预处理后的训练数据中随机选取第一数据和第二数据作为混合的原数据,将两个数据按照动态混合参数λ的比例进行线性混合,具体操作为:
x=λx1 (1-λ)x2
得到的混合后的数据对为(x,y1,y2),其中,x为混合后的图像数据,y1为第一数据x1所对应的标签数据,y2为第二数据x2所对应的标签数据。
具体来说,动态混合参数λ主要是用于调节后续图像数据的混合程度,λ值越小混合强度越小,本实施方式中采用的是线性混合操作。
在一种实施方式中,s4包括将混合后的数据对整合为扩展后的数据集
其中,
具体来说,在进行数据混合后,可以得到不同的混合数据对,将这些混合数据对合并在一起,则得到扩展后的数据集。
在一种实施方式中,s5具体包括:
s5.1:将混合后的图像数据作为输入图像数据,分别与其相关的两个标签数据ypi,yqi的类别信息求损失,
losscls(θ)=λlossi(θ) (1-λ)lossj(θ)
其中
s5.2:将混合数据作为输入图像数据,分别与其相关的两个标签数据ypi,yqi的位置信息求损失,具体为:
lossloc(θ)=λlossi(θ)′ (1-λ)lossj(θ)′
其中,lossi(θ)′为第一数据的位置损失,lossj(θ)′为第二数据的位置损失,lossloc(θ)为混合位置损失函数,θ为神经网络中的所需要优化的参数,lsm为平滑l1损失函数,
s5.3:将混合分类损失函数与混合位置损失函数相结合,得到目标混合损失函数:
loss(θ)=losscls(θ) γlossloc(θ)
其中loss(θ)是目标混合损失函数,γ为分类损失与位置损失的比重参数。
具体来说,损失函数是神经网络用来表现其预测结果与实际结果的差距的函数。混合损失函数分为两个部分:分类损失函数和位置检测损失函数。其中分类损失函数代表神经网络对于图像内容中物体类别的预测与实际图像中物体类别的差距,使用交叉熵来量化两者的差距,分类损失函数可以表示为:
其中losscls(θ)为分类损失函数,θ为神经网络中的所需要优化的参数,lce为交叉熵函数,xi为输入的图像数据,yi为xi对应的标签数据,fθ为神经网络模型,fθ(xi)为神经网络对xi的预测值。本发明采用混合分类损失函数,将混合数据x作为输入图像数据,分别与其相关的两个标签数据ypi,yqi的类别信息求损失,得到lossi(θ)和lossj(θ),然后基于动态混合参数对两个损失函数进行求和。
同理,位置损失函数代表神经网络对于图像内容中的物体位置的预测与实际图像中物体位置的差距,通常使用平滑l1损失(smoothl1loss)来量化它们(预测位置与实际位置)之间的差距。平滑损失函数可以表示为:
而混合位置损失函数与混合分类损失函数类似,即将混合数据x作为输入图像数据,分别与其相关的两个标签数据ypi,yqi的位置信w息求损失,得到lossi(θ)′和lossj(θ)′,然后基于动态混合参数对两个损失函数进行求和。
在分别得到混合分类损失函数和混合位置损失函数后,将二者相结合,得到最终的损失函数。最终损失函数的计算原理如图2所示,其中,分类损失1表示第一数据(图片1)的分类损失,分类损失2表示第二数据(图片2)的分类损失,回归损失1表示第一数据的位置损失,回归损失2表示第二数据的位置损失。
在一种实施方式中,s6包括:
s6.1:从扩展后的数据集中随机选取得到一系列数据;
s6.2:将得到的一系列数据输入至物体检测神经网络得到相应的预测结果,并通过目标混合损失函数根据实际结果与预测结果的损失值;
s6.3:利用反向传播更新整个网络的参数。
具体来说,目标就是最小化目标损失函数,对每一个超参数求偏导,可以得到当前这一轮的梯度,然后损失函数向梯度的反方向进行更新,不断这样进行迭代更新,就可以得到超参数的全局最优解,即最优的模型参数。
总体来说,本发明提出的基于动态参数的物体检测网络混合训练方法,缓解了检测网络的数据记忆问题,改善了检测网络的在测试集上的泛化性。通过构建混合数据,一定程度扩充了数据集,并且额外添加了不同类别数据间的线性关系,提升了模型的表现力。而通过动态混合参数的设置,降低了混合训练方法在检测网络上的训练难度,平滑了训练过程,从而更容易得到最优模型。相比于其他训练方法,训练出的模型具有更好的泛化性。
实施例二
基于同样的发明构思,本实施例提供了一种基于动态强度的物体检测神经网络混合训练系统,请参见图3,该系统包括:
神经网络构建模块201,用于构建物体检测神经网络,并初始化物体检测神经网络的所有参数;
数据预处理模块202,用于获取原始训练数据,并对原始训练数据进行预处理,其中,原始训练数据包括图像数据和标签数据,标签数据包括图像内所有的标记物体的类别信息和位置信息;
数据混合模块203,用于获取动态混合参数,从预处理后的训练数据中随机选取第一数据和第二数据,将动态混合参数作为混合强度调节参数对选取出的第一数据和第二数据进行混合,获得混合后的数据对,其中,混合后的数据对包括混合后的图像数据、第一数据对应的标签数据以及第二数据对应的标签数据;
扩展后数据集获得模块204,用于基于混合后的数据对获得扩展后的数据集;
损失函数设置模块205,用于根据扩展后的数据集中的混合数据、第一数据对应的标签数据以及第二数据对应的标签数据,设置目标混合损失函数,其中,目标混合损失函数包括分类损失和位置损失;
训练模块206,用于将扩展后的数据集作为训练数据,结合混合损失函数,采用随机梯度下降法对物体检测神经网络进行训练,得到训练好的物体检测神经网络。
由于本发明实施例二所介绍的系统,为实施本发明实施例一中基于动态强度的物体检测神经网络混合训练方法所采用的系统,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该系统的具体结构及变形,故而在此不再赘述。凡是本发明实施例一的方法所采用的系统都属于本发明所欲保护的范围。
实施例三
请参见图4,基于同一发明构思,本申请还提供了一种计算机可读存储介质300,其上存储有计算机程序311,该程序被执行时实现如实施例一中所述的方法。
由于本发明实施例三所介绍的计算机可读存储介质为实施本发明实施例一中基于动态强度的物体检测神经网络混合训练方法所采用的计算机可读存储介质,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该计算机可读存储介质的具体结构及变形,故而在此不再赘述。凡是本发明实施例一中方法所采用的计算机可读存储介质都属于本发明所欲保护的范围。
实施例四
基于同一发明构思,本申请还提供了一种计算机设备,请参见图5,包括存储401、处理器402及存储在存储器上并可在处理器上运行的计算机程序403,处理器402执行上述程序时实现实施例一中的方法。
由于本发明实施例四所介绍的计算机设备为实施本发明实施例一中基于动态强度的物体检测神经网络混合训练方法所采用的计算机设备,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该计算机设备的具体结构及变形,故而在此不再赘述。凡是本发明实施例一中方法所采用的计算机设备都属于本发明所欲保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
1.一种基于动态强度的物体检测神经网络混合训练方法,其特征在于,包括:
s1:构建物体检测神经网络,并初始化物体检测神经网络的所有参数;
s2:获取原始训练数据,并对原始训练数据进行预处理,其中,原始训练数据包括图像数据和标签数据,标签数据包括图像内所有的标记物体的类别信息和位置信息;
s3:获取动态混合参数,从预处理后的训练数据中随机选取第一数据和第二数据,将动态混合参数作为混合强度调节参数对选取出的第一数据和第二数据进行混合,获得混合后的数据对,其中,混合后的数据对包括混合后的图像数据、第一数据对应的标签数据以及第二数据对应的标签数据;
s4:基于混合后的数据对获得扩展后的数据集;
s5:根据扩展后的数据集中的混合数据、第一数据对应的标签数据以及第二数据对应的标签数据,设置目标混合损失函数,其中,目标混合损失函数包括分类损失和位置损失;
s6:将扩展后的数据集作为训练数据,结合混合损失函数,采用随机梯度下降法对物体检测神经网络进行训练,得到训练好的物体检测神经网络。
2.如权利要求1所述的方法,其特征在于,s1包括:
s1.1:使用卷积层、全连接层、池化层、激活层构建神经网络或者使用现有的神经网络作为物体检测神经网络;
s1.2:采用随机参数初始化方法初始化物体检测神经网络的所有参数。
3.如权利要求1所述的方法,其特征在于,s2中对原始训练数据进行预处理,具体包括:
s2.1:对原始训练数据中的图像数据进行像素值归一化;
s2.2:进行图片裁剪;
s2.3:进行图片翻转。
4.如权利要求3所述的方法,其特征在于,s3具体包括:
s3.1:根据公式生成动态混合参数λ,具体公式如下:
其中,
s3.2:从预处理后的训练数据中随机选取第一数据和第二数据作为混合的原数据,将两个数据按照动态混合参数λ的比例进行线性混合,具体操作为:
x=λx1 (1-λ)x2
得到的混合后的数据对为(x,y1,y2),其中,x为混合后的图像数据,y1为第一数据x1所对应的标签数据,y2为第二数据x2所对应的标签数据。
5.如权利要求1所述的方法,其特征在于,s4包括将混合后的数据对整合为扩展后的数据集
其中,
6.如权利要求1所述的方法,其特征在于,s5具体包括:
s5.1:将混合后的图像数据作为输入图像数据,分别与其相关的两个标签数据ypi,yqi的类别信息求损失,
losscls(θ)=λlossi(θ) (1-λ)lossj(θ)
其中
s5.2:将混合数据作为输入图像数据,分别与其相关的两个标签数据ypi,yqi的位置信息求损失,具体为:
lossloc(θ)=λlossi(θ)′ (1-λ)lossj(θ)′
其中,lossi(θ)′为第一数据的位置损失,lossj(θ)′为第二数据的位置损失,lossloc(θ)为混合位置损失函数,θ为神经网络中的所需要优化的参数,lsm为平滑l1损失函数,
s5.3:将混合分类损失函数与混合位置损失函数相结合,得到目标混合损失函数:
loss(θ)=losscls(θ) γlossloc(θ)
其中loss(θ)是目标混合损失函数,γ为分类损失与位置损失的比重参数。
7.如权利要求1所述的方法,其特征在于,s6包括:
s6.1:从扩展后的数据集中随机选取得到一系列数据;
s6.2:将得到的一系列数据输入至物体检测神经网络得到相应的预测结果,并通过目标混合损失函数根据实际结果与预测结果的损失值;
s6.3:利用反向传播更新整个网络的参数。
8.一种基于动态强度的物体检测神经网络混合训练系统,其特征在于,包括:
神经网络构建模块,用于构建物体检测神经网络,并初始化物体检测神经网络的所有参数;
数据预处理模块,用于获取原始训练数据,并对原始训练数据进行预处理,其中,原始训练数据包括图像数据和标签数据,标签数据包括图像内所有的标记物体的类别信息和位置信息;
数据混合模块,用于获取动态混合参数,从预处理后的训练数据中随机选取第一数据和第二数据,将动态混合参数作为混合强度调节参数对选取出的第一数据和第二数据进行混合,获得混合后的数据对,其中,混合后的数据对包括混合后的图像数据、第一数据对应的标签数据以及第二数据对应的标签数据;
扩展后数据集获得模块,用于基于混合后的数据对获得扩展后的数据集;
损失函数设置模块,用于根据扩展后的数据集中的混合数据、第一数据对应的标签数据以及第二数据对应的标签数据,设置目标混合损失函数,其中,目标混合损失函数包括分类损失和位置损失;
训练模块,用于将扩展后的数据集作为训练数据,结合混合损失函数,采用随机梯度下降法对物体检测神经网络进行训练,得到训练好的物体检测神经网络。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被执行时实现如权利要求1至7中任一项权利要求所述的方法。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7中任一项权利要求所述的方法。
技术总结