本发明涉及声音信号识别领域,更具体地涉及一种车辆声音信号特征提取方法。
背景技术:
根据车辆行进过程中采集到的声音信号来对野外车辆目标进行识别,一般分为两个步骤:首先提取声音传感器采集到的声信号的特征;其次设计分类器以得到判别结果。目前常用的声信号特征有基于小波包变换提取的特征、线性预测倒谱系数、梅尔倒谱系数(mel-frequencycepstralcoefficient,mfcc)、基于经验模态分解提取的特征等。其中,mfcc较常见,被广泛用于语种识别、说话人识别、声纹识别等领域,近年来被成功应用于车辆目标的分类识别。
由于人的听觉系统是一个非线性系统,人耳对声音信号原始频谱的感知是非线性的。随着声音信号的频率降低,人耳接收信号的能力愈发敏感。为了使人耳对声音信号的敏感程度与信号频率呈现线性关系,mfcc参数将信号频谱作映射处理,将原始频率转化为梅尔频率的公式为:
式中,m(f)为梅尔频率,f为声音信号原始频率。在梅尔频域内,人耳对声音信号的感知度是线性的。
传统的mfcc在识别纯净的声音信号时,可以得到很好的识别结果。但是mfcc对噪声的敏感度很高,当采集的实际声音信号包含噪声信息时,识别效果易受干扰,难以预测识别效果是否符合实际需求。而且,当风力等级变化时,很容易造成训练样本集与测试样本集的不匹配,所以车辆识别领域的应用场景受到限制。
技术实现要素:
本发明提供一种车辆声音信号特征提取方法,降低噪声对识别效果的干扰,减少应用场景的限制。
本发明提供的一种车辆声音信号特征提取方法,包括:
步骤s1,对车辆声音信号进行预处理,同时提取车辆声音信号的基频;
步骤s2,对预处理之后的声音信号作快速傅里叶变换,并计算出信号的能量谱;
步骤s3,将所述声音信号的基频与梅尔三角滤波器组的中心频率进行组合,得到基频自适应的三角滤波器组;
步骤s4,将所述信号能量谱通过所述基频自适应的三角滤波器组,得到基频自适应梅尔能量谱;
步骤s5,对所述基频自适应的梅尔能量谱进行倒谱分析,得到基频自适应梅尔倒谱系数;
步骤s6,对所述基频自适应梅尔倒谱系数的每一维分量进行加权,得到最终的车辆声音信号特征。
所述步骤s1中的预处理包括预加重、分帧以及加窗。
采用谱减-自相关函数法提取所述车辆声音信号的基频。
所述步骤s3中基频自适应三角滤波器组的设计方法为:将车辆声音信号的基频fb与梅尔三角滤波器组各滤波器的中心频率f=(f1,f2,…,fn)按升序排列,组合成新的向量fb=(f1,f2,…,fb,…,fn 1),fb向量的各个分量为基频自适应三角滤波器组各滤波器的中心频率;其中,n为梅尔三角滤波器组的滤波器个数。
所述基频自适应的三角滤波器组按如下公式描述:
式中,hi(k)表示滤波器参数;i=1,2,k,n,n表示梅尔三角滤波器组的滤波器个数;f(i)表示第i个滤波器的中心频率;k是滤波器组的自变量,表示频率。
所述步骤s4中基频自适应梅尔能量谱的计算方法为:将信号的能量谱与所述基频自适应三角滤波器组中的滤波器参数相乘。
所述步骤s5中的倒谱分析包括:首先对所述基频自适应梅尔能量谱取对数,得到对数能量谱;然后对所述对数能量谱进行离散余弦变换。
所述步骤s6包括:
步骤s61,计算所述基频自适应梅尔倒谱系数第n维特征分量的f比;
步骤s62,以计算出的f比为权重,对基频自适应梅尔倒谱系数的每一维特征分量进行加权。
所述基频自适应梅尔倒谱系数第n维特征分量的f比按下式进行计算:
式中,m表示车辆类别数,其中第l个类别包含nl条样本信号;n=1,2,k,n 1,n 1为基频自适应三角滤波器组的个数,即基频自适应梅尔倒谱系数的特征维数;
所述基频自适应梅尔倒谱系数的每一维特征分量进行加权的计算方法为:将f(n)和第n维的基频自适应梅尔倒谱系数相乘;其中,n=1,2,k,n 1,n 1为基频自适应三角滤波器组的个数,f(n)表示基频自适应梅尔倒谱系数第n维特征分量的f比。
本发明根据车辆目标信号的频谱特征,自适应地增加车辆基频信息在特征中的比重,然后进行f比加权,以降低同种车型声音信号特征间的区分度,增大不同车型声音信号特征之间的差别,从而提高了声音信号特征的抗噪能力以及在野外环境下的鲁棒性。
附图说明
图1(a)是轻型轮式车声音信号频谱图;图1(b)是轮式装甲车声音信号频谱图;图1(c)是履带车声音信号频谱图。
图2是按照本发明的车辆声音信号特征提取方法的流程图。
图3(a)是传统梅尔三角滤波器组的示意图,图3(b)是图2步骤s3中的基频自适应三角滤波器组的示意图。
图4为实验场景示意图。
具体实施方式
下面结合附图,给出本发明的较佳实施例,并予以详细描述。
本发明针对处于野外环境中的车辆,在传统的mfcc特征提取算法的基础上进行改进。从图1(a)-(c)中可以看出,不同车型的车辆声音信号的基频是不同的,因此将车辆声音信号的基频作为车辆目标识别的特征能够增大不同车型声音信号特征之间的差别。
基于上述原理,本发明的车辆声音信号特征提取方法,如图2所示,包括:
步骤s1,对车辆声音信号进行预处理,同时提取车辆声音信号的基频fb。
其中,预处理包括预加重、分帧以及加窗。预加重是指让声音信号通过一个高通滤波器;分帧是指对声音信号进行采样,取若干个采样点集合成一帧信号;加窗是将每一帧信号代入窗函数,以消除各个帧两端可能会造成的信号不连续性。
常用的基频提取算法包括自相关函数法、倒谱法、谱减-自相关函数法、平均幅度差函数法、简化逆滤波法等。考虑到野外环境噪声大的实际情况,本实施例采用谱减-自相关函数法提取车辆声音信号的基频fb。
步骤s2,对预处理之后的声音信号作快速傅里叶变换,并计算出每帧信号的能量谱,能量谱即为信号频谱的平方。
步骤s3,将车辆声音信号的基频fb与传统梅尔三角滤波器组的中心频率进行组合,得到基频自适应的三角滤波器组。基频自适应的三角滤波器组具体设计方法如下:
设传统梅尔三角滤波器组包含n个滤波器,其中心频率组成向量f=(f1,f2,…,fn)。在这n个滤波器中增加一个新滤波器,该新滤波器的中心频率为车辆声音信号的基频fb,将这n 1个滤波器的中心频率按升序重新排列,组合成新的向量fb=(f1,f2,…,fb,…,fn 1),将fb向量的各个分量作为各滤波器的中心频率,即得到基频自适应的三角滤波器组。基频自适应的三角滤波器组可用公式(2)来表示,如下所示:
式中,hi(k)表示滤波器参数;i=1,2,k,n,n表示传统梅尔三角滤波器组的滤波器个数;f(i)表示第i个滤波器的中心频率;k是滤波器组的自变量,表示频率。
上述公式用于描述三角滤波器组,滤波器参数指的是每个三角形形状的数据分布。传统梅尔三角滤波器组如图3(a)所示,基频自适应的三角滤波器组如图3(b)所示,从图中可以看到,第i个三角形顶点为1,除此三角形数据分布之外的点都为0,且有值部分数据呈三角形分布。基频自适应的三角滤波器组比传统的梅尔三角滤波器组增加了一个三角滤波器,该增加的滤波器的中心频率是车辆声音信号的基频,能够保证基频的权重较高。三角滤波器组和信号能量谱的自变量都是频率,所以将信号能量谱通过滤波器组滤波,可以提取有效信息。
因而,步骤s4,将步骤s2中的信号能量谱通过基频自适应的三角滤波器组,得到基频自适应的梅尔能量谱。具体计算方法是:将每一帧信号的能量谱与基频自适应三角滤波器组的滤波器参数相乘,举例说明:设每条声音信号帧数为s,快速傅里叶变换的点数(即采样点数)为512,则该条信号的能量谱是s×512的矩阵,基频自适应滤波器组是512×(n 1)的矩阵,因此相乘之后的结果是s×(n 1)的矩阵,该s×(n 1)的矩阵即为基频自适应的梅尔能量谱。
步骤s5,对基频自适应的梅尔能量谱进行倒谱分析,得到基频自适应的梅尔倒谱系数。倒谱分析包括:首先对基频自适应的梅尔能量谱取对数,得到对数能量谱;然后对对数能量谱进行离散余弦变换。
由于基频自适应梅尔倒谱系数的每一维分量对表征车辆声音信号特征的贡献率不同,因此为了增加不同车辆类别间的声音信号特征差距,使同一车辆类别的声音信号特征更为紧凑,本发明还包括步骤s6:对基频自适应梅尔倒谱系数的每一维分量进行f比加权。f比参数在fisher准则基础上提出,由类间离散度与类内离散度之比得到,可定量分析特征向量每一维分量的有效性。将基频自适应梅尔倒谱系数视为特征向量,步骤s6具体包括:
步骤s61,设数据集包含m种车辆类别的车辆声音信号,其中第l个类型包含nl条样本信号,则基频自适应梅尔倒谱系数第n维特征分量的f比具体计算公式如下:
式中,n=1,2,k,n 1,n 1为基频自适应梅尔倒谱系数特征维数,即基频自适应三角滤波器组的个数;
步骤s62,以公式(3)中计算出的f比为权重,对基频自适应梅尔倒谱系数的每一维特征分量进行加权,即将f(n)和第n维的基频自适应梅尔倒谱系数相乘,得到最终本发明的车辆声音信号特性。
通过上述f比加权计算,能够提高贡献率较高的特征分量的作用,削弱贡献率较低的特征分量的干扰,从而提取出更能体现不同车辆类别间差异的特征。
以下通过实验数据进一步说明本发明的优点。
实验采用matlabr2015b平台仿真,样本信号采用ics40720传声器设备进行采集,外场实验场景如图4所示,目标车辆从起始位置行驶到终止位置,麦克风便采集到一条完整的样本。
为验证算法有效性,共采集硬土路、砂石路、水泥路及草地四种不同路面的车辆声音信号作为样本。车辆类型分为履带车、轮式装甲车和轻型轮式车三种类型,并将样本数按照70%和30%的比例随机分为训练集和测试集,用于仿真实验。
首先提取维度为23的传统mfcc特征,然后提取维度为24的基频自适应的梅尔倒谱特征,最后对其进行f比加权,提取特征按上述步骤进行,在此不再赘述。
识别效果采用识别准确率、漏警率和虚警率三个标准进行评判,实验结果如表1所示:表格中方法一表示用传统的mfcc作特征;方法二表示用谱减-自相关法提取基频,然后用基频自适应mfcc作特征;方法三在方法二的基础上进行f比加权。提取特征后,选择在声音识别领域效果好,且计算量较小的gmm分类器进行识别。
表1野外车辆识别结果
分析表中数据可得,f比加权的基频自适应梅尔倒谱参数与传统的mfcc相比,识别准确率提高,漏警率降和虚警率均降低,有更高的鲁棒性,更加适用于野外环境中车辆的识别。
以上所述的,仅为本发明的较佳实施例,并非用以限定本发明的范围,本发明的上述实施例还可以做出各种变化。即凡是依据本发明申请的权利要求书及说明书内容所作的简单、等效变化与修饰,皆落入本发明专利的权利要求保护范围。本发明未详尽描述的均为常规技术内容。
1.一种车辆声音信号特征提取方法,其特征在于,包括:
步骤s1,对车辆声音信号进行预处理,同时提取车辆声音信号的基频;
步骤s2,对预处理之后的声音信号作快速傅里叶变换,并计算出信号的能量谱;
步骤s3,将所述声音信号的基频与梅尔三角滤波器组的中心频率进行组合,得到基频自适应的三角滤波器组;
步骤s4,将所述信号能量谱通过所述基频自适应的三角滤波器组,得到基频自适应梅尔能量谱;
步骤s5,对所述基频自适应的梅尔能量谱进行倒谱分析,得到基频自适应梅尔倒谱系数;
步骤s6,对所述基频自适应梅尔倒谱系数的每一维分量进行加权,得到最终的车辆声音信号特征。
2.根据权利要求1所述的车辆声音信号特征提取方法,其特征在于,所述步骤s1中的预处理包括预加重、分帧以及加窗。
3.根据权利要求1所述的车辆声音信号特征提取方法,其特征在于,采用谱减-自相关函数法提取所述车辆声音信号的基频。
4.根据权利要求1所述的车辆声音信号特征提取方法,其特征在于,所述步骤s3中基频自适应三角滤波器组的设计方法为:将车辆声音信号的基频fb与梅尔三角滤波器组各滤波器的中心频率f=(f1,f2,…,fn)按升序排列,组合成新的向量fb=(f1,f2,…,fb,…,fn 1),fb向量的各个分量为基频自适应三角滤波器组各滤波器的中心频率;其中,n为梅尔三角滤波器组的滤波器个数。
5.根据权利要求4所述的车辆声音信号特征提取方法,其特征在于,所述基频自适应的三角滤波器组按如下公式描述:
式中,hi(k)表示滤波器参数;i=1,2,k,n,n表示梅尔三角滤波器组的滤波器个数;f(i)表示第i个滤波器的中心频率;k是滤波器组的自变量,表示频率。
6.根据权利要求5所述的车辆声音信号特征提取方法,其特征在于,所述步骤s4中基频自适应梅尔能量谱的计算方法为:将信号的能量谱与所述基频自适应三角滤波器组中的滤波器参数相乘。
7.根据权利要求1所述的车辆声音信号特征提取方法,其特征在于,所述步骤s5中的倒谱分析包括:首先对所述基频自适应梅尔能量谱取对数,得到对数能量谱;然后对所述对数能量谱进行离散余弦变换。
8.根据权利要求1所述的车辆声音信号特征提取方法,其特征在于,所述步骤s6包括:
步骤s61,计算所述基频自适应梅尔倒谱系数第n维特征分量的f比;
步骤s62,以计算出的f比为权重,对基频自适应梅尔倒谱系数的每一维特征分量进行加权。
9.根据权利要求8所述的车辆声音信号特征提取方法,其特征在于,所述基频自适应梅尔倒谱系数第n维特征分量的f比按下式进行计算:
式中,m表示车辆类别数,其中第l个类别包含nl条样本信号;n=1,2,k,n 1,n 1为基频自适应梅尔倒谱系数的特征维数;
10.根据权利要求9所述的车辆声音信号特征提取方法,其特征在于,所述基频自适应梅尔倒谱系数的每一维特征分量进行加权的计算方法为:将f(n)和第n维的基频自适应梅尔倒谱系数相乘;其中,n=1,2,k,n 1,n 1为基频自适应三角滤波器组的个数,f(n)表示基频自适应梅尔倒谱系数第n维特征分量的f比。
技术总结