一种基于声阵列的鸣笛车辆自动识别装置及方法与流程

专利2022-06-29  75


本发明涉及交通道路信息处理领域,特别涉及一种基于声阵列的鸣笛车辆自动识别装置及方法。



背景技术:

现有的汽车鸣笛抓拍系统包括传声器阵列数据采集器和高清抓拍单元。传声器阵列主要用于采集声音信号,并结合自带的小型摄像头,精确定位鸣笛车辆。同时需要高清抓拍单元配合获取鸣笛车辆的车牌号。在整个过程中,需要经过两次图像像素坐标转换算法,一是声学云图坐标和小型摄像头图像像素坐标的转换,第二步是小型摄像头像素坐标和鸣笛抓拍像素坐标的转换。每一步的转换都会引入一定的误差。且安装过程较为复杂,第二次的图像像素坐标的转换工作需要在安装现场进行。

另外声阵列的应用对背景噪声的要求比较高,通常情况下为了更好的关注被测物体本身的声源辐射状态,大部分声源定位测试会选择在消声室或者户外较为空旷的空间等特殊的声学环境中进行。而汽车鸣笛声抓拍的实际环境却是处于嘈杂的公路上,除了汽车的鸣笛声,还有各种车辆通过甚至鸟叫等声音,测试环境比较复杂,公路环境噪声大部分为低频声。因此,在作为执法证据的保存过程中,常常会因为道路背景噪声的干扰,鸣笛音频录音信号的信噪比都不太高。

如公开号cn209086963u的实用新型公开了一种图像声阵列与三维空间噪声定位装置,包括声阵列、图像采集器、三维定位声传感器、多通道数据采集器和处理器,通过设置声阵列、图像采集器、三维定位声传感器三种采集器对数据源进行信号采集,并将三种信号收集进行综合判断及计算,实现在视频平面指出噪声源方向的同时,定位出噪声源具体位置。

以及公开号cn108682161a的发明申请公开了一种确认车辆鸣笛的方法和系统,该方法包括:根据预设摄像机获取图像;根据预设摄像机的参数确定声阵列的第二视角范围,所述参数包括预设摄像机位置参数、镜头参数以及感光部件参数;通过声阵列获取声音,所述声音包括车辆的鸣笛声;根据所述声音及所述第二视角范围确定所述声音的位置坐标;根据所述位置坐标与所述图像确定鸣笛的车辆。

现有技术对于嘈杂环境下的鸣笛声识别都存在问题,且处理过程复杂,精准度不高。



技术实现要素:

针对现有技术对于嘈杂环境下的鸣笛声识别能力较差,且处理过程复杂,精准度不高的问题,本发明提供了一种基于声阵列的鸣笛车辆自动识别装置及方法,通过特征频带滤波以及声源定位分析的方式降噪及识别,能够在嘈杂的环境中准确辨识鸣笛的车辆。

以下是本发明的技术方案。

一种基于声阵列的鸣笛车辆自动识别方法,包括以下步骤:s01:采集声音信号;s02:判断是否存在鸣笛,如是则进入下一步,如否则回到第一步;s03:记录音频和/或视频信息进行取证,通过声源定位分析以确定目标车辆并通过图像采集模块同时获取车牌等信息;s04:保存取证信息并上传至服务器。通过阵列分析以确定目标车辆,以实现信号降噪和精确识别。

作为优选,所述步骤s01中,声音信号通过环形声阵列采集,环形声阵列为若干传声器组成的一种环形结构。通过环形声阵列,该结构方式利于与图像采集模块整形成一个整体,并同时保证信号采集的可靠性和声源分析的准确性。

作为优选,所述步骤s02中,判断过程包括:对声音信号进行带通滤波,如频带内的声压级超过设定的阈值,则认为存在鸣笛。根据gb15742-2001<机动车用喇叭的性能要求及试验方法>3.1.2.3条规定:在频率为1800hz-3550hz频带内的声压级必须大于频率超过3550hz的每一分量的声压级。而公路环境噪声大部分为低频声,因此为了滤除绝大部分的公路噪声同时保留汽车喇叭的主要频带信息,在进入正式计算之前系统会对时域信号进行带通滤波,带通滤波器的频率范围为1800hz-3550hz。

作为优选,所述步骤s03中阵列分析过程包括:将声阵列的聚焦面按照一定的间隔划分网格,根据网格上的网格点及球面波理论,得到每个网格点相对于每个传声器的延时,根据传声器的信号对聚焦面的每个网格点进行延时求和,最终有最大的波束输出的位置为真正的声源位置。在作为执法证据的保存过程中,常常会因为道路背景噪声的干扰,鸣笛音频录音信号的信噪比都不太高。因此提出利用波束形成的原理,根据声源点与阵列采集点之间的不同距离,对每个通道进行一定的时延,然后再叠加平均。由于背景噪声相位是无规的,因此可以通过延时平均弱化背景噪声能量,从而提高信噪比。

作为优选,所述每个网格点相对于每个传声器的延时公式包括:

其中rs为标号s的网格点坐标,rm为标号m的传声器坐标,c为声速,上式中x、y及z均为对应的三维坐标。

作为优选,所述延时求和公式包括:

其中wm=1/m,为每个传声器通道的计权,即每个通道的计权相等,函数ym(t)表示在时间t时刻,第m个传声器采集到的信号,δm表示延时。

作为优选,波束输出计算过程包括:根据所述延时公式以及延时求和公式,得到频域表达式为:

上式中,表示网格点为角频率为ω的波束输出,ω=2πf,f为声源频率,pm(ω)是第m个传声器采集到的声信号,角频率为ω。

作为优选,第一次执行步骤s01前还包括校准,过程包括:将声学坐标和视频像素坐标进行匹配,公式包括:

上式中,(x,y)为声学定位坐标上声源的位置,(x’,y’)为声源在视频像素的坐标位置,sx表示x坐标的变换关系式,sy表示y坐标的变换关系式,矩阵计算过程表示平移和角度旋转。

一种基于声阵列的鸣笛车辆自动识别装置,包括:环形声阵列:采集声音信号;图像采集模块,记录音频和/或视频信息;信号分析模块,判断鸣笛及进行声源定位分析并通过图像采集模块同时获取车牌等信息;通信模块,保存信息并上传至服务器;所述环形声阵列与图像采集模块相对固定并设置于街边。该装置以一定的倾斜角度安装在5-6米的道路监测横杆上,正对监测道路路面。由于在实际的安装过程中,阵列面和声源面并不平行,虽然按照以阵列面中心作为空间原点,可以根据阵列的安装角度和地面监控路段推算出声源扫描面的空间坐标,为了计算简单,可以在处理过程中将聚焦面定位在阵列前方1m位置处,同时聚焦面的大小即为地面监测区域映射到阵列前方1m位置处的面积。

作为优选,所述信号分析模块执行以下步骤:判断鸣笛:对声音信号进行带通滤波,如频带内的声压级超过设定的阈值,则认为存在鸣笛;声源定位分析:将声阵列的聚焦面按照一定的间隔划分网格,根据网格上的网格点及球面波理论,得到每个网格点相对于每个传声器的延时,根据传声器的信号对聚焦面的每个网格点进行延时求和,最终有最大的波束输出的位置为真正的声源位置。

本发明将声阵列设计为镂空的环形声阵列,并利用一定的连接结构将阵列采集安装在图像采集模块上,一次实验室校准即可,这中间由于直接利用图像采集模块的视频像素坐标,所以只有一次坐标转换,减小定位误差,并且安装过程方便简单。提出利用波束形成的原理,根据声源点与阵列采集点之间的不同距离,对每个通道进行一定的时延,然后再叠加平均。由于背景噪声相位是无规的,因此可以通过延时平均弱化背景噪声能量,从而提高信噪比。因此为了滤除绝大部分的公路噪声同时保留汽车喇叭的主要频带信息。

附图说明

图1为本发明实施例的主视图;

图2为本发明实施例的侧视图;

图3为本发明实施例的波束形成示意图;

图中包括:1-环形声阵列、2-图像采集模块、3-传声器、4-信号分析模块。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。另外,为了更好的说明本发明,在下文中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本发明同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未做详细描述,以便于凸显本发明的主旨。

其中,在本申请实施例的描述中,除非另有说明,“/”表示或的意思,例如,a/b可以表示a或b;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,在本申请实施例的描述中,“多个”是指两个或多于两个。

以下,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。

实施例:

如图1以及图2所示为一种基于声阵列的鸣笛车辆自动识别装置,包括:环形声阵列1:采集声音信号,由均匀排布的24个数字传声器3组成;图像采集模块2,记录音频和/或视频信息;信号分析模块4,判断鸣笛及进行阵列分析;通信模块,保存信息并上传至服务器;环形声阵列1与图像采集模块2相对固定并设置于街边。该装置以一定的倾斜角度安装在5-6米的道路监测横杆上,正对监测道路路面。由于在实际的安装过程中,阵列面和声源面并不平行,虽然按照以阵列面中心作为空间原点,可以根据阵列的安装角度和地面监控路段推算出声源扫描面的空间坐标,为了计算简单,可以在处理过程中将聚焦面定位在阵列前方1m位置处,同时聚焦面的大小即为地面监测区域映射到阵列前方1m位置处的面积。

其中信号分析模块4执行以下步骤:判断鸣笛:对声音信号进行带通滤波,如频带内的声压级超过设定的阈值,则认为存在鸣笛;阵列分析:将声阵列的聚焦面按照一定的间隔划分网格,根据网格上的网格点及球面波理论,得到每个网格点相对于每个传声器3的延时,根据传声器3的信号对聚焦面的每个网格点进行延时求和,最终有最大的波束输出的位置为真正的声源位置。

本实施例将声阵列设计为镂空的环形声阵列1,并利用一定的连接结构将阵列采集安装在图像采集模块2上,一次实验室校准即可,这中间由于直接利用图像采集模块2的视频像素坐标,所以只有一次坐标转换,减小定位误差,并且安装过程方便简单。提出利用波束形成的原理,根据声源点与阵列采集点之间的不同距离,对每个通道进行一定的时延,然后再叠加平均。由于背景噪声相位是无规的,因此可以通过延时平均弱化背景噪声能量,从而提高信噪比。因此为了滤除绝大部分的公路噪声同时保留汽车喇叭的主要频带信息。

另外还包括一种基于声阵列的鸣笛车辆自动识别方法,包括以下步骤:

s01:采集声音信号;其中,声音信号通过环形声阵列1采集,环形声阵列1为若干传声器3组成的一种环形结构。通过环形声阵列1,与图像采集模块2整形成一个整体,并同时保证信号采集的可靠性和声源分析的准确性。

s02:判断是否存在鸣笛,如是则进入下一步,如否则回到第一步;其中,判断过程包括:对声音信号进行带通滤波,如频带内的声压级超过设定的阈值,则认为存在鸣笛。根据gb15742-2001<机动车用喇叭的性能要求及试验方法>3.1.2.3条规定:在频率为1800hz-3550hz频带内的声压级必须大于频率超过3550hz的每一分量的声压级。而公路环境噪声大部分为低频声,因此为了滤除绝大部分的公路噪声同时保留汽车喇叭的主要频带信息,在进入正式计算之前系统会对时域信号进行带通滤波,带通滤波器的频率范围为1800hz-3550hz。

s03:记录音频和/或视频信息进行取证,通过阵列分析以确定目标车辆;其中阵列分析过程包括:将声阵列的聚焦面按照一定的间隔划分网格,根据网格上的网格点及球面波理论,得到每个网格点相对于每个传声器3的延时,根据传声器3的信号对聚焦面的每个网格点进行延时求和,最终有最大的波束输出的位置为真正的声源位置。

如图3所示,聚焦面(声源面)与声阵列平面之间的距离为d,本系统中聚焦面与声阵列平面之间的距离为1m。

每个网格点相对于每个传声器3的延时公式包括:

其中rs为标号s的网格点坐标,rm为标号m的传声器3坐标,c为声速,上式中x、y及z均为对应的三维坐标。

延时求和公式包括:

其中wm=1/m,为每个传声器3通道的计权,即每个通道的计权相等,函数ym(t)表示在时间t时刻,第m个传声器3采集到的信号,δm表示延时。

波束输出计算过程包括:根据延时公式以及延时求和公式,得到频域表达式为:

上式中,表示网格点为角频率为ω的波束输出,ω=2πf,f为声源频率,pm(ω)是第m个传声器3采集到的声信号,角频率为ω。在作为执法证据的保存过程中,常常会因为道路背景噪声的干扰,鸣笛音频录音信号的信噪比都不太高。因此提出利用波束形成的原理,根据声源点与阵列采集点之间的不同距离,对每个通道进行一定的时延,然后再叠加平均。由于背景噪声相位是无规的,因此可以通过延时平均弱化背景噪声能量,从而提高信噪比。

s04:保存取证信息并上传至服务器。通过声源定位分析以确定目标车辆并通过图像采集模块同时获取车牌等信息,以实现信号降噪和精确识别。

另外,第一次执行步骤s01前需要校准一次,过程包括:将声学坐标和视频像素坐标进行匹配,公式包括:

上式中,(x,y)为声学定位坐标上声源的位置,(x’,y’)为声源在视频像素的坐标位置,sx表示x坐标的变换关系式,sy表示y坐标的变换关系式,矩阵计算过程表示平移和角度旋转。

通过以上实施方式的描述,所属领域的技术人员可以了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中可以根据需要而将上述功能分配由不同的功能模块完成,即将具体装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。

在本申请所提供的实施例中,应该理解到,所揭露的结构和方法,可以通过其它的方式实现。例如,以上所描述的关于结构的实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个结构,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,结构或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(readonlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

以上内容,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。


技术特征:

1.一种基于声阵列的鸣笛车辆自动识别方法,其特征在于,包括以下步骤:

s01:采集声音信号;

s02:判断是否存在鸣笛,如是则进入下一步,如否则回到第一步;

s03:记录音频和/或视频信息进行取证,通过声源定位分析以确定目标车辆,并通过图像采集模块获取车牌等信息;

s04:保存取证信息并上传至服务器。

2.根据权利要求1所述的一种基于声阵列的鸣笛车辆自动识别方法,其特征在于,所述步骤s01中,声音信号通过环形声阵列采集,环形声阵列为若干传声器组成的一种环形结构。

3.根据权利要求1所述的一种基于声阵列的鸣笛车辆自动识别方法,其特征在于,所述步骤s02中,判断过程包括:对声音信号进行带通滤波,如频带内的声压级超过设定的阈值,则认为存在鸣笛。

4.根据权利要求1或2或3所述的一种基于声阵列的鸣笛车辆自动识别方法,其特征在于,所述步骤s03中阵列分析过程包括:将声阵列的聚焦面按照一定的间隔划分网格,根据网格上的网格点及球面波理论,得到每个网格点相对于每个传声器的延时,根据传声器的信号对聚焦面的每个网格点进行延时求和,最终有最大的波束输出的位置为真正的声源位置。

5.根据权利要求4所述的一种基于声阵列的鸣笛车辆自动识别方法,其特征在于,所述每个网格点相对于每个传声器的延时公式包括:

其中rs为标号s的网格点坐标,rm为标号m的传声器坐标,c为声速,上式中x、y及z均为对应的三维坐标。

6.根据权利要求5所述的一种基于声阵列的鸣笛车辆自动识别方法,其特征在于,所述延时求和公式包括:

其中wm=1/m,为每个传声器通道的计权,即每个通道的计权相等,函数ym(t)表示在时间t时刻,第m个传声器采集到的信号,δm表示延时。

7.根据权利要求6所述的一种基于声阵列的鸣笛车辆自动识别方法,其特征在于,波束输出计算过程包括:根据所述延时公式以及延时求和公式,得到频域表达式为:

上式中,表示网格点为角频率为ω的波束输出,ω=2πf,f为声源频率,pm(ω)是第m个传声器采集到的声信号,角频率为ω。

8.根据权利要求1所述的一种基于声阵列的鸣笛车辆自动识别方法,其特征在于,第一次执行步骤s01前还包括校准,过程包括:将声学坐标和视频像素坐标进行匹配,公式包括:

上式中,(x,y)为声学定位坐标上声源的位置,(x’,y’)为声源在视频像素的坐标位置,sx表示x坐标的变换关系式,sy表示y坐标的变换关系式,矩阵计算过程表示平移和角度旋转。

9.一种基于声阵列的鸣笛车辆自动识别装置,其特征在于,包括:

环形声阵列:采集声音信号;

图像采集模块,记录音频和/或视频信息;

信号分析模块,判断鸣笛及进行声源定位分析并通过图像采集模块获取车牌等信息;

通信模块,保存信息并上传至服务器;

所述环形声阵列与图像采集模块相对固定并设置于街边。

10.根据权利要求9所述的一种基于声阵列的鸣笛车辆自动识别装置,其特征在于,所述信号分析模块执行以下步骤:

判断鸣笛:对声音信号进行带通滤波,如频带内的声压级超过设定的阈值,则认为存在鸣笛;

阵列分析:将声阵列的聚焦面按照一定的间隔划分网格,根据网格上的网格点及球面波理论,得到每个网格点相对于每个传声器的延时,根据传声器的信号对聚焦面的每个网格点进行延时求和,最终有最大的波束输出的位置为真正的声源位置。

技术总结
本发明公开了一种基于声阵列的鸣笛车辆自动识别装置及方法,装置包括:环形声阵列:采集声音信号;图像采集模块,记录音频和/或视频信息;信号分析模块,判断鸣笛及进行声源定位分析;通信模块,保存信息并上传至服务器。方法包括以下步骤:S01:采集声音信号;S02:判断是否存在鸣笛,如是则进入下一步,如否则回到第一步;S03:记录音频和/或视频信息进行取证,通过声源定位分析以确定目标车辆并通过图像采集模块同时获取车牌等信息;S04:保存取证信息并上传至服务器。本发明的信号分析以及声源定位计算过程简便,准确度高,通过特征信号滤波以及声源定位的方式降噪及识别,能够在嘈杂的环境中准确辨识鸣笛的车辆。

技术研发人员:袁芳;李屹超
受保护的技术使用者:杭州爱华仪器有限公司
技术研发日:2019.09.27
技术公布日:2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-47489.html

最新回复(0)