本公开涉及图像识别,尤其涉及一种红绿灯图像特征提取模型训练和红绿灯识别方法。
背景技术:
1、红绿灯的信息感知和预测是智能驾驶领域中非常重要的一环。现有预测红绿灯三维信息的用于多视图三维物体检测的位置嵌入变换(position embeddingtransformation for multi-view 3d object detection,petr)模型包括一个基于resnet的骨干backbone网络,一个特征金字塔网络(feature pyramid networks,fpn)中间层网络和一个基于transformer的检测头网络。基于transformer的检测头网络的基础计算单元是多头注意力模型(multi-head attention,mha)。mha需要对图像中的每一个像素计算attention特征。
2、但是由于在自动驾驶中需要感知远距离的红绿灯信息,所以一般而言无人驾驶车上的红绿灯相机是高分辨率的长焦相机,而在高分辨率图像上进行mha计算需要耗费大量的计算量。除此之外红绿灯是一种小型物体,一般而言对红绿灯进行检测只需要局部的感受野,不需要利用到全图的上下文信息,所以基于mha的特征提取方式还会引起资源的浪费。上述两个问题最终会导致利用petr预测红绿灯三维信息的计算量过大,无法应用到无人驾驶车上的硬件环境下。
技术实现思路
1、本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
2、为此,本公开的一个目的在于提出一种红绿灯图像特征提取模型训练方法。
3、本公开的第二个目的在于提出一种红绿灯图像特征提取模型训练装置。
4、本公开的第三个目的在于提出一种电子设备。
5、本公开的第四个目的在于提出一种非瞬时计算机可读存储介质。
6、本公开的第五个目的在于提出一种计算机程序产品。
7、为达上述目的,本公开第一方面实施方式提出了一种红绿灯图像特征提取模型训练方法,包括:获取训练图像和待训练的初始红绿灯图像特征提取模型,其中所述训练图像包括至少一个红绿灯框;获取所述红绿灯框的第一宽度值和第一高度值,以及获取所述训练图像的第二宽度值和第二高度值;基于所述第一宽度值、所述第一高度值、所述第二宽度值和所述第二高度值从所述训练图像中的候选像素点中确定目标像素点;基于所述目标像素点对所述初始红绿灯图像特征提取模型进行训练,以生成目标红绿灯图像特征提取模型。
8、根据本公开的一个实施方式,所述基于所述第一宽度值、所述第一高度值、所述第二宽度值和所述第二高度值从所述训练图像中的候选像素点中确定目标像素点,包括:基于所述第一宽度值、所述第一高度值、所述第二宽度值和所述第二高度值对所述红绿灯框进行调整,以生成目标红绿灯框;基于所述目标红绿灯框从所述训练图像的候选像素点中确定目标像素点。
9、根据本公开的一个实施方式,所述基于所述第一宽度值、所述第一高度值、所述第二宽度值和所述第二高度值对所述红绿灯框进行调整,以生成目标红绿灯框,包括:基于所述第一宽度值、所述第一高度值、所述第二宽度值和所述第二高度值,确定所述红绿灯框是否具备调整条件;响应于所述红绿灯框具备调整条件,基于所述第一宽度值、所述第一高度值、所述第二宽度值和所述第二高度值对所述红绿灯框进行调整,以生成所述目标红绿灯框。
10、根据本公开的一个实施方式,所述基于所述第一宽度值、所述第一高度值、所述第二宽度值和所述第二高度值,确定所述红绿灯框是否具备调整条件,包括:将所述第一宽度值和所述第二宽度值进行相除,以计算获取第一候选占比系数,以及所述第一高度值和所述第二高度值进行相除,以计算获取第二候选占比系数;选取所述第一候选占比系数和所述第二候选占比系数中的较大值作为目标占比系数,并将所述目标占比系数和占比系数阈值进行比较;响应于所述目标占比系数小于所述占比系数阈值,确定所述红绿灯框具备调整条件。
11、根据本公开的一个实施方式,所述确定所述红绿灯框具备调整条件之后,包括:将所述占比系数阈值和所述目标占比系数进行相除,以获取候选扩展倍数,并获取预设扩展倍数;选取所述候选扩展倍数和所述预设扩展倍数中的较小值作为目标扩展倍数,并将所述第一宽度值和所述第一高度值分别与所述目标扩展倍数相乘,以生成所述目标红绿灯框,其中,所述目标红绿灯框的宽度值为所述第一宽度值与所述目标扩展倍数相乘的乘积,所述目标红绿灯框的高度值为所述第一高度值与所述目标扩展倍数相乘的乘积。
12、根据本公开的一个实施方式,所述基于所述目标红绿灯框从所述训练图像的候选像素点中确定目标像素点,包括:在所述目标红绿灯框内选取第一数量的第一像素点,以及在所述目标红绿灯框外选取第二数量的第二像素点,将所述第一像素点和所述第二像素点作为所述目标像素点。
13、根据本公开的一个实施方式,所述在所述目标红绿灯框内选取第一数量的第一像素点,包括:对所述训练图像的候选像素点进行预测,以获取所述训练图像各像素点的评分;按照评分由高到低的顺序,从所述目标红绿灯框内选取第一数量的所述第一像素点。
14、根据本公开的一个实施方式,所述在所述目标红绿灯框外选取第二数量的第二像素点,包括:在所述目标红绿灯框外随机选取第二数量的第二像素点。
15、根据本公开的一个实施方式,所述基于所述目标红绿灯框确定目标像素点之后,还包括:将所述目标红绿灯框内的目标像素点设定第一标签,以及将所述目标红绿灯框外的目标像素点设定第二标签。
16、为达上述目的,本公开第二方面实施例提出了一种红绿灯识别方法,包括:获取待识别图像;将所述待识别图像输入至目标红绿灯图像特征提取模型中,以获取目标像素点,其中,所述目标红绿灯图像特征提取模型为如第一方面实施例所述的红绿灯图像特征提取模型训练方法训练得到的;将所述目标像素点输入至红绿灯识别模型中,以获取所述红绿灯识别模型输出的识别结果。
17、为达上述目的,本公开第三方面实施例提出了一种红绿灯图像特征提取模型训练装置,包括:获取模块,用于获取训练图像和待训练的初始红绿灯图像特征提取模型,其中所述训练图像包括至少一个红绿灯框;确定模块,用于获取所述红绿灯框的第一宽度值和第一高度值,以及获取所述训练图像的第二宽度值和第二高度值;筛选模块,用于基于所述第一宽度值、所述第一高度值、所述第二宽度值和所述第二高度值从所述训练图像中的候选像素点中确定目标像素点;训练模块,用于基于所述目标像素点对所述初始红绿灯图像特征提取模型进行训练,以生成目标红绿灯图像特征提取模型。
18、为达上述目的,本公开第四方面实施例提出了一种红绿灯识别装置,包括:接收模块,用于获取待识别图像;输入模块,用于将所述待识别图像输入至目标红绿灯图像特征提取模型中,以获取目标像素点,其中,所述目标红绿灯图像特征提取模型为如第一方面实施例所述的红绿灯图像特征提取模型训练方法训练得到的;识别模块,用于将所述目标像素点输入至红绿灯识别模型中,以获取所述红绿灯识别模型输出的识别结果。
19、为达上述目的,本公开第五方面实施例提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以实现如本公开第一方面实施例所述的红绿灯图像特征提取模型训练方法,或者实现如第二方面实施例所述的红绿灯识别方法。
20、为达上述目的,本公开第六方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于实现如本公开第一方面实施例所述的红绿灯图像特征提取模型训练方法,或者实现如第二方面实施例所述的红绿灯识别方法。
21、为达上述目的,本公开第七方面实施例提出了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时用于实现如本公开第一方面实施例所述的红绿灯图像特征提取模型训练方法,或者实现如第二方面实施例所述的红绿灯识别方法。
22、通过训练生成目标红绿灯图像特征提取模型,可以实现通过目标红绿灯图像特征提取模型对图像进行特征提取,以此可以降低后续进行红绿灯识别时的数据处理量,保证涵盖足够多的红绿灯的局部空间附近的像素点,可以提升后续识别的准确率和处理效率。
1.一种红绿灯图像特征提取模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一宽度值、所述第一高度值、所述第二宽度值和所述第二高度值从所述训练图像中的候选像素点中确定目标像素点,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一宽度值、所述第一高度值、所述第二宽度值和所述第二高度值对所述红绿灯框进行调整,以生成目标红绿灯框,包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述第一宽度值、所述第一高度值、所述第二宽度值和所述第二高度值,确定所述红绿灯框是否具备调整条件,包括:
5.根据权利要求4所述的方法,其特征在于,所述确定所述红绿灯框具备调整条件之后,包括:
6.根据权利要求2-5中任一项所述的方法,其特征在于,所述基于所述目标红绿灯框从所述训练图像的候选像素点中确定目标像素点,包括:
7.根据权利要求6所述的方法,其特征在于,所述在所述目标红绿灯框内选取第一数量的第一像素点,包括:
8.根据权利要求6所述的方法,其特征在于,所述在所述目标红绿灯框外选取第二数量的第二像素点,包括:
9.根据权利要求6的方法,其特征在于,基于所述目标红绿灯框确定目标像素点之后,还包括:
10.一种红绿灯识别方法,其特征在于,包括:
11.一种红绿灯图像特征提取模型训练装置,其特征在于,包括:
12.一种红绿灯识别装置,其特征在于,包括:
13.一种电子设备,其特征在于,包括存储器、处理器;
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-9中任一项所述的红绿灯图像特征提取模型训练方法,或者如权利要求10所述的红绿灯识别方法。
