行人检测方法及系统与流程

专利2022-06-29  99


本发明涉及汽车
技术领域
,特别是涉及一种行人检测方法及系统。
背景技术
:随着汽车工业的飞速发展和人们生活条件的不断改善,汽车已经成为人们出行不可或缺的交通工具之一。无人驾驶汽车是智能汽车的一种,其主要依靠车内的以计算机系统为主的智能驾驶仪来实现无人驾驶的目的。在无人驾驶技术中,行人检测是无人驾驶技术的重点,由于受行人目标外观遮挡、姿态等问题的影响,导致现有技术的行人检测方法鲁棒性较差,容易造成漏检的情况,最终会影响无人驾驶的安全性。技术实现要素:为此,本发明的一个目的在于提出一种行人检测方法,以解决现有技术容易造成漏检的问题。一种行人检测方法,包括:对采集到的视频图像中的行人候选区域进行前景优化,以获取运动目标区域;将运动目标区域作为行人候选区域,通过提取改进聚合通道特征,并采用adaboost分类器和bootstrapping训练机制进行学习训练,以生成行人人头检测器;进行在线检测时,对前景检测阶段中检测出的行人候选区域中应用人头检测器检测行人人头。根据本发明提供的行人检测方法,根据采集到的视频图像对其进行运动目标前景检测,再根据检测到的运动目标前景进行行人头部检测,通过提取改进聚合通道特征(aggregationchannelfeature,acf),并采用adaboost分类器和bootstrapping训练机制进行学习训练,以生成行人人头检测器,实现了帧间运动信息和多通道特征相结合,能够更全面的表达目标特征,克服了基于聚合多通道特征检测分类的压力问题和克服行人之间的遮挡问题,使得本发明在图像分辨率低、人群遮挡严重、姿态难以确认的实际监控场景下都具有很强的鲁棒性,避免漏检情况的发生。此外,由于去除了无用的背景信息,只在候选区域进行目标检测,能够有效提高检测精准性,召回率也能得到很大改进。另外,根据本发明上述的行人检测方法,还可以具有如下附加的技术特征:进一步地,对采集到的视频图像中的行人候选区域进行前景优化,以获取运动目标区域的步骤具体包括:执行膨胀操作和形态学开闭运算方法;在动态环境丢弃虚假小目标,以去除小目标噪声。进一步地,执行膨胀操作和形态学开闭运算方法的步骤具体包括:设a为图像的一个目标区域,结构元素f在点(x,y)处的膨胀定义为f(x,y),f的形状大小预先确定,在f的作用下,膨胀结果为:其中结构元素f设置为线型f=[se0se1se2],se0=strel(′line′,15,45),se0=strel(′line′,20,90),se1=strel(′line′,15,135);第二个元素是像素个数,第三个元素是角度。进一步地,在动态环境丢弃虚假小目标的步骤具体包括:将轮廓包含区域大于或等于预设值的设置为行人运动候选区域,小于预设值的设置为虚假目标丢弃;检测目标的最小外接矩形,再与原视频图像做异或运算,获得多个行人候选矩形框,以得到运动目标区域。进一步地,将运动目标区域作为行人候选区域的步骤中,先通过二值化与形态学处理排除背景非行人目标,然后将排除背景非行人目标后的运动目标区域作为行人候选区域。本发明的另一个目的在于提出一种行人检测系统,以解决现有技术容易造成漏检的问题。前景优化模块,用于对采集到的视频图像中的行人候选区域进行前景优化,以获取运动目标区域;学习训练模块,用于将运动目标区域作为行人候选区域,通过提取改进聚合通道特征,并采用adaboost分类器和bootstrapping训练机制进行学习训练,以生成行人人头检测器;在线检测模块,用于进行在线检测时,对前景检测阶段中检测出的行人候选区域中应用人头检测器检测行人人头。根据本发明提供的行人检测系统,根据采集到的视频图像对其进行运动目标前景检测,再根据检测到的运动目标前景进行行人头部检测,通过提取改进聚合通道特征(aggregationchannelfeature,acf),并采用adaboost分类器和bootstrapping训练机制进行学习训练,以生成行人人头检测器,实现了帧间运动信息和多通道特征相结合,能够更全面的表达目标特征,克服了基于聚合多通道特征检测分类的压力问题和克服行人之间的遮挡问题,使得本发明在图像分辨率低、人群遮挡严重、姿态难以确认的实际监控场景下都具有很强的鲁棒性。此外,由于去除了无用的背景信息,只在候选区域进行目标检测,能够有效提高检测精准性,召回率也能得到很大改进。另外,根据本发明上述的行人检测系统,还可以具有如下附加的技术特征:进一步地,前景优化模块包括:计算单元,用于执行膨胀操作和形态学开闭运算方法;丢弃单元,用于在动态环境丢弃虚假小目标,以去除小目标噪声。进一步地,计算单元具体用于:设a为图像的一个目标区域,结构元素f在点(x,y)处的膨胀定义为f(x,y),f的形状大小预先确定,在f的作用下,膨胀结果为:其中结构元素f设置为线型f=[se0se1se2],se0=strel(′line′,15,45),se0=strel(′line′,20,90),se1=strel(′line′,15,135);第二个元素是像素个数,第三个元素是角度。进一步地,丢弃单元具体用于:将轮廓包含区域大于或等于预设值的设置为行人运动候选区域,小于预设值的设置为虚假目标丢弃;检测目标的最小外接矩形,再与原视频图像做异或运算,获得多个行人候选矩形框,以得到运动目标区域。进一步地,学习训练模块具体用于先通过二值化与形态学处理排除背景非行人目标,然后将排除背景非行人目标后的运动目标区域作为行人候选区域。附图说明本发明实施例的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1是根据本发明第一实施例的行人检测方法的流程图;图2是根据本发明第二实施例的行人检测系统的结构框图。具体实施方式为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。请参阅图1,本发明第一实施例提出的行人检测方法,包括步骤s101~s103。s101,对采集到的视频图像中的行人候选区域进行前景优化,以获取运动目标区域;其中,步骤s101具体包括:执行膨胀操作和形态学开闭运算方法,具体的,设a为图像的一个目标区域,结构元素f在点(x,y)处的膨胀定义为f(x,y),f的形状大小预先确定,在f的作用下,膨胀结果为:其中结构元素f设置为线型f=[se0se1se2],se0=strel(′line′,15,45),se0=strel(′line′,20,90),se1=strel(′line′,15,135);第二个元素是像素个数,第三个元素是角度;在动态环境丢弃虚假小目标,以去除小目标噪声,具体的,将轮廓包含区域大于或等于预设值(例如500)的设置为行人运动候选区域,小于预设值的设置为虚假目标丢弃,这样就能够去除较大块虚假目标的干扰;然后再检测目标的最小外接矩形,再与原视频图像做异或运算,获得多个行人候选矩形框,以得到运动目标区域。这样,检测范围变小了,并且候选区域能够的有效的包含行人目标,从而使得算法在不损失精度的情况下,可以大大的节约搜索时间。s102,将运动目标区域作为行人候选区域,通过提取改进聚合通道特征(aggregationchannelfeature,acf),并采用adaboost分类器和bootstrapping训练机制进行学习训练,以生成行人人头检测器。其中,先通过二值化与形态学处理排除背景非行人目标,然后将排除背景非行人目标后的运动目标区域作为行人候选区域。s103,进行在线检测时,对前景检测阶段中检测出的行人候选区域中应用人头检测器检测行人人头。为了评估本发明人头检测性能,选择了hog-adaboost、hog-svm orb-adaboost、acf和vibe acf算法在测试视频序列中评估检测结果,表1是算法检测准确率、误检率和综合评价指标f值的对比表,由表1可以看出,acf算法相对与传统hog、orb等特征应用多种特征的通道信息聚合特征能够更全面的表达目标特征,在准确率和召回率上提升明显,并且由于应用前景检测算法去除了无用的背景信息,只在候选区域进行目标检测,vibe acf算法和本章算法相对于传统acf算法明显提高了检测精准性,其中acf的平均检测速度为0.115s,vibe acf方法为0.0522s,本发明算法为0.0913s,检测准确率、召回率也得到很大改进。此外本发明能大大缩减检测时间,行人检测效率也得到相应的提升。表1算法模型总行人数正确检测数总检测数准确率召回率f值hog89463015230.41370.70470.5213hog-orb89463013400.47010.70460.5639acf89476812250.62690.85900.7248vibe acf8947349560.76780.82100.7935本发明算法8948198960.91410.91610.9151为了验证本发明具有广泛的适用性和更好的鲁棒性,在室外监控场景下的pets数据集上的s1.l1.13-59的view_001序列上进行行人人流量估计实验,数据库视频图片尺寸为768x576,行人头部尺寸均在20x20像素左右,采用平均绝对误差(meanabsoluteerror,mae)和平均相对误差(meanrelativeerror,mre)来评估行人检测效果,定义如下:其中c(i)和t(i)分别是预测人数和实际人数,n是总帧数。检测结果,即便存在部分遮挡的情况下仍能比较准确地定位到单个行人,进行准确行人检测。检测误差如表2所示。表2区域maemrer01.880.16r11.40.24r20.50.094综上,根据本实施例提供的根据采集到的视频图像对其进行运动目标前景检测,再根据检测到的运动目标前景进行行人头部检测,通过提取改进聚合通道特征(aggregationchannelfeature,acf),并采用adaboost分类器和bootstrapping训练机制进行学习训练,以生成行人人头检测器,实现了帧间运动信息和多通道特征相结合,能够更全面的表达目标特征,克服了基于聚合多通道特征检测分类的压力问题和克服行人之间的遮挡问题,使得本发明在图像分辨率低、人群遮挡严重、姿态难以确认的实际监控场景下都具有很强的鲁棒性。此外,由于去除了无用的背景信息,只在候选区域进行目标检测,能够有效提高检测精准性,召回率也能得到很大改进。请参阅图2,基于同一发明构思,本发明第二实施例提出的行人检测系统,包括:前景优化模块10,用于对采集到的视频图像中的行人候选区域进行前景优化,以获取运动目标区域;学习训练模块20,用于将运动目标区域作为行人候选区域,通过提取改进聚合通道特征,并采用adaboost分类器和bootstrapping训练机制进行学习训练,以生成行人人头检测器;在线检测模块30,用于进行在线检测时,对前景检测阶段中检测出的行人候选区域中应用人头检测器检测行人人头。其中,前景优化模块10包括:计算单元11,用于执行膨胀操作和形态学开闭运算方法;丢弃单元12,用于在动态环境丢弃虚假小目标,以去除小目标噪声。其中,计算单元11具体用于:设a为图像的一个目标区域,结构元素f在点(x,y)处的膨胀定义为f(x,y),f的形状大小预先确定,在f的作用下,膨胀结果为:其中结构元素f设置为线型f=[se0se1se2],se0=strel(′line′,15,45),se0=strel(′line',20,90),se1=strel(′line′,15,135);第二个元素是像素个数,第三个元素是角度。其中,丢弃单元12具体用于:将轮廓包含区域大于或等于预设值的设置为行人运动候选区域,小于预设值的设置为虚假目标丢弃;检测目标的最小外接矩形,再与原视频图像做异或运算,获得多个行人候选矩形框,以得到运动目标区域。其中,学习训练模块20具体用于先通过二值化与形态学处理排除背景非行人目标,然后将排除背景非行人目标后的运动目标区域作为行人候选区域。根据本实施例提供的行人检测系统,根据采集到的视频图像对其进行运动目标前景检测,再根据检测到的运动目标前景进行行人头部检测,通过提取改进聚合通道特征(aggregationchannelfeature,acf),并采用adaboost分类器和bootstrapping训练机制进行学习训练,以生成行人人头检测器,实现了帧间运动信息和多通道特征相结合,能够更全面的表达目标特征,克服了基于聚合多通道特征检测分类的压力问题和克服行人之间的遮挡问题,使得本发明在图像分辨率低、人群遮挡严重、姿态难以确认的实际监控场景下都具有很强的鲁棒性。此外,由于去除了无用的背景信息,只在候选区域进行目标检测,能够有效提高检测精准性,召回率也能得到很大改进。应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具体用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。当前第1页1 2 3 
技术特征:

1.一种行人检测方法,其特征在于,包括:

对采集到的视频图像中的行人候选区域进行前景优化,以获取运动目标区域;

将运动目标区域作为行人候选区域,通过提取改进聚合通道特征,并采用adaboost分类器和bootstrapping训练机制进行学习训练,以生成行人人头检测器;

进行在线检测时,对前景检测阶段中检测出的行人候选区域中应用人头检测器检测行人人头。

2.根据权利要求1所述的行人检测方法,其特征在于,对采集到的视频图像中的行人候选区域进行前景优化,以获取运动目标区域的步骤具体包括:

执行膨胀操作和形态学开闭运算方法;

在动态环境丢弃虚假小目标,以去除小目标噪声。

3.根据权利要求2所述的行人检测方法,其特征在于,执行膨胀操作和形态学开闭运算方法的步骤具体包括:

设a为图像的一个目标区域,结构元素f在点(x,y)处的膨胀定义为f(x,y),f的形状大小预先确定,在f的作用下,膨胀结果为:其中结构元素f设置为线型f=[se0se1se2],se0=strel(′line',15,45),se0=strel(′line',20,90),se1=strel(′line′,15,135);第二个元素是像素个数,第三个元素是角度。

4.根据权利要求2所述的行人检测方法,其特征在于,在动态环境丢弃虚假小目标的步骤具体包括:

将轮廓包含区域大于或等于预设值的设置为行人运动候选区域,小于预设值的设置为虚假目标丢弃;

检测目标的最小外接矩形,再与原视频图像做异或运算,获得多个行人候选矩形框,以得到运动目标区域。

5.根据权利要求1所述的行人检测方法,其特征在于,将运动目标区域作为行人候选区域的步骤中,先通过二值化与形态学处理排除背景非行人目标,然后将排除背景非行人目标后的运动目标区域作为行人候选区域。

6.一种行人检测系统,其特征在于,包括:

前景优化模块,用于对采集到的视频图像中的行人候选区域进行前景优化,以获取运动目标区域;

学习训练模块,用于将运动目标区域作为行人候选区域,通过提取改进聚合通道特征,并采用adaboost分类器和bootstrapping训练机制进行学习训练,以生成行人人头检测器;

在线检测模块,用于进行在线检测时,对前景检测阶段中检测出的行人候选区域中应用人头检测器检测行人人头。

7.根据权利要求6所述的行人检测系统,其特征在于,前景优化模块包括:

计算单元,用于执行膨胀操作和形态学开闭运算方法;

丢弃单元,用于在动态环境丢弃虚假小目标,以去除小目标噪声。

8.根据权利要求7所述的行人检测系统,其特征在于,计算单元具体用于:

设a为图像的一个目标区域,结构元素f在点(x,y)处的膨胀定义为f(x,y),f的形状大小预先确定,在f的作用下,膨胀结果为:其中结构元素f设置为线型f=[se0se1se2],se0=strel(′line′,15,45),se0=strel(′line′,20,90),se1=strel(′line′,15,135);第二个元素是像素个数,第三个元素是角度。

9.根据权利要求7所述的行人检测系统,其特征在于,丢弃单元具体用于:

将轮廓包含区域大于或等于预设值的设置为行人运动候选区域,小于预设值的设置为虚假目标丢弃;

检测目标的最小外接矩形,再与原视频图像做异或运算,获得多个行人候选矩形框,以得到运动目标区域。

10.根据权利要求6所述的行人检测系统,其特征在于,学习训练模块具体用于先通过二值化与形态学处理排除背景非行人目标,然后将排除背景非行人目标后的运动目标区域作为行人候选区域。

技术总结
本发明公开了一种行人检测方法及系统,该方法包括:对采集到的视频图像中的行人候选区域进行前景优化,以获取运动目标区域;将运动目标区域作为行人候选区域,通过提取改进聚合通道特征,并采用Adaboost分类器和Bootstrapping训练机制进行学习训练,以生成行人人头检测器;进行在线检测时,对前景检测阶段中检测出的行人候选区域中应用人头检测器检测行人人头。本发明实现了帧间运动信息和多通道特征相结合,能够更全面的表达目标特征,使得本发明在图像分辨率低、人群遮挡严重、姿态难以确认的实际监控场景下都具有很强的鲁棒性,避免漏检情况的发生。

技术研发人员:曾体伟;李磊;黄少堂;王爱春;燕冬;顾祖飞
受保护的技术使用者:江铃汽车股份有限公司
技术研发日:2020.01.20
技术公布日:2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-53634.html

最新回复(0)