麦克风故障检测方法、装置、电子设备和存储介质与流程

专利2022-06-29 299

本发明涉及音频采集处理技术领域，尤其涉及一种麦克风故障检测方法、装置、电子设备和存储介质。

背景技术：

麦克风作为基于声音进行智能分析的前端声音采集设备，若在使用过程中受损而未能及时被发现替换，会直接影响后端智能系统的分析结果，致使智能分析的准确率下降。

当前的麦克风故障检测方法包括示波器检测、万用表检测等，通常需要将固定安装的麦克风拆卸下来进行故障检测，无法在麦克风工作状态进行实时监测，实时性差，费时费力。

技术实现要素：

本发明实施例提供一种麦克风故障检测方法、装置、电子设备和存储介质，用以解决现有的麦克风故障检测实时性差的问题。

第一方面，本发明实施例提供一种麦克风故障检测方法，包括：

确定待检测麦克风所采集的音频信号；

基于所述音频信号的时域特征，确定所述音频信号的时域分析结果；其中，所述时域特征包括声音强度信息和/或过零点信息；

和/或，基于所述音频信号的频域特征，确定所述音频信号的频域分析结果；其中，所述频域特征包括谐波位置信息；

基于所述时域分析结果和/或所述频域分析结果，确定所述待检测麦克风的故障检测结果。

优选地，所述基于所述音频信号的时域特征，确定所述音频信号的时域分析结果，具体包括：

基于所述音频信号的声音强度信息中，每一分段的声音强度最大值和声音强度最小值，确定所述音频信号的波形检测结果；

和/或，基于所述音频信号的过零点信息中，每两个相邻过零点之间的距离，确定所述音频信号的爆音检测结果；

基于所述波形检测结果和/或所述爆音检测结果，确定所述时域分析结果。

优选地，所述基于所述音频信号的声音强度信息中，每一分段的声音强度最大值和声音强度最小值，确定所述音频信号的波形检测结果，具体包括：

将所述声音强度最大值与所述声音强度最小值的差小于预设声强差阈值的分段数量，作为所述音频信号的近似直线分段数；

和/或，将所述声音强度最大值的绝对值大于所述声音强度最小值的绝对值的预设系数倍，或所述声音强度最小值的绝对值大于所述声音强度最大值的绝对值的预设系数倍的分段数量，作为所述音频信号的不对称波形分段数；

基于所述近似直线分段数以及预设直线分段阈值，和/或所述不对称波形分段数以及预设不对称分段阈值，确定所述音频信号的波形检测结果。

优选地，所述基于所述音频信号的过零点信息中，每两个相邻过零点之间的距离，确定所述音频信号的爆音检测结果，具体包括：

将距离大于第一距离阈值且中间值的绝对值大于中间值阈值的相邻过零点的组合数量，作为所述音频信号的第一相邻过零点组合数；

和/或，将距离大于第二距离阈值的相邻过零点的组合数量，作为所述音频信号的第二相邻过零点组合数；

基于所述第一相邻过零点组合数以及预设第一组合数阈值，和/或所述第二相邻过零点组合数以及预设第二组合数阈值，确定所述爆音检测结果。

优选地，所述基于所述频域特征，确定所述音频信号的频域分析结果，具体包括：

基于所述音频信号的谐波位置信息中，每一分段的一次谐波位置和二次谐波位置，确定所述二次谐波位置与所述一次谐波位置的比值等于预设比值的分段数量，作为周期信号分段数量；

基于所述周期信号分段数量与预设周期信号分段阈值，确定所述音频信号的频域分析结果。

优选地，所述基于所述时域分析结果，确定所述待检测麦克风的故障检测结果，具体包括：

若所述待检测麦克风所处声场中，每一麦克风所采集音频信号的时域分析结果均包括时域波形近似为直线，则确定所述待检测麦克风的故障检测结果不包括时域波形近似为直线。

优选地，所述基于所述时域分析结果和/或所述频域分析结果，确定所述待检测麦克风的故障检测结果，具体包括：

将所述音频信号输入至环境声音检测模型中，得到所述环境声音检测模型输出的环境声音检测结果；其中，所述环境声音检测模型是基于样本音频信号及其对应的样本环境声音检测结果训练得到的；

若所述环境声音检测结果为存在环境声音，则基于所述时域分析结果，确定所述待检测麦克风的故障检测结果；否则，基于所述时域分析结果和所述频域分析结果，确定待检测麦克风的故障检测结果。

第二方面，本发明实施例提供一种麦克风故障检测装置，包括：

音频信号确定单元，用于确定待检测麦克风所采集的音频信号；

时域分析单元，用于基于所述音频信号的时域特征，确定所述音频信号的时域分析结果；其中，所述时域特征包括声音强度信息和/或过零点信息；

和/或，频域分析单元，用于基于所述音频信号的频域特征，确定所述音频信号的频域分析结果；其中，所述频域特征包括谐波位置信息；

故障检测单元，用于基于所述时域分析结果和/或所述频域分析结果，确定所述待检测麦克风的故障检测结果。

第三方面，本发明实施例提供一种电子设备，包括处理器、通信接口、存储器和总线，其中，处理器，通信接口，存储器通过总线完成相互间的通信，处理器可以调用存储器中的逻辑命令，以执行如第一方面所提供的方法的步骤。

第四方面，本发明实施例提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。

本发明实施例提供的一种麦克风故障检测方法、装置、电子设备和存储介质，通过待检测麦克风所采集的音频信号所对应的时域分析结果和/或频域分析结果，确定故障检测结果，应用所采集音频信号的自身特性实现了麦克风的在线检测，无需加增额外的检测设备，也不会对麦克风的正常工作造成影响，有效减轻了麦克风检测的人力成本和硬件成本，提高了麦克风检测的实时性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的麦克风故障检测方法的流程示意图；

图2为本发明实施例提供的时域分析方法的流程示意图；

图3为本发明实施例提供的波形检测结果的确定方法的流程示意图；

图4为本发明实施例提供的爆音检测结果的确定方法的流程示意图；

图5为本发明实施例提供的频域分析方法的流程示意图；

图6为本发明实施例提供的故障检测结果的确定方法的流程示意图；

图7本发明另一实施例提供的麦克风故障检测方法的流程示意图；

图8为本发明实施例提供的麦克风故障检测装置的结构示意图；

图9为本发明实施例提供的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

麦克风作为基于声音进行智能分析的前端声音采集设备，若在使用过程中受损而未能及时被发现替换，会直接影响后端智能系统的分析结果，致使智能分析的准确率下降。例如在工厂，若因麦克风受损而影响分析系统未能及时发现车间内生产设备出现故障，可能会导致生产设备持续带故障运行，致使设备加速损坏，增加维修成本，降低生产效率，严重者甚至会造成人员伤亡。又例如在养殖厂，若因麦克风受损而影响分析系统未能及时发现养殖厂内的病弱牲畜，可能会导致牲畜的病情不断恶化，增加用药成本，降低生产效益，严重者甚至会感染更多的牲畜。

当前的麦克风故障检测方法包括示波器检测、万用表检测等，通常需要将固定安装的麦克风拆卸下来进行故障检测，无法在麦克风工作状态进行实时监测，实时性差，费时费力。而在麦克风工作状态下进行实时监测的方法则需要额外安装固定频率发生器，通过检测麦克风采集到的音频信号中是否存在固定频率判断麦克风是否拾音正常。但是，固定频率发生器的安装需要付出额外的人力成本的硬件成本，且固定频率发生器的运动可能会安装环境造成负面影响，例如影响车间内生产设备的正常运行，或者养殖厂内牲畜的情绪。

对此，本发明实施例提供了一种麦克风故障检测方法。图1为本发明实施例提供的麦克风故障检测方法的流程示意图，如图1所示，该方法包括：

步骤110，确定待检测麦克风所采集的音频信号。

具体地，待检测麦克风即需要进行故障检测的麦克风。音频信号可以是待检测麦克风在工作状态下实时采集得到的，音频信号的时长可以是预先设定的，例如可以设定为3分钟，当需要进行麦克风故障检测时，可以截取待检测麦克风所采集的当前时刻向前3分钟至当前时刻之间的音频信号用于故障检测。

步骤120，基于音频信号的时域特征，确定音频信号的时域分析结果；其中，时域特征包括声音强度信息和/或过零点信息。

此处，音频信号的时域特征用于表征音频信号在时域上的特征信息，其中声音强度信息用于表征音频信号在时域上各个采样点的声音强度，例如声音强度的最大值、最小值、中间值和平均值等；过零点信息用于表征音频信号在时域上的过零点的相关信息，例如过零率、每两个相邻的过零点之间的距离等。

基于音频信号的时域特征，可以从时域层面上对音频信号进行分析，并得到时域分析结果。此处，时域分析结果可以包括音频信号的时域波形是否为直线或者是否近似为直线，音频信号的时域波形的正负轴是否对称，音频信号的时域波形是否为爆音波形等。需要说明的是，时域波形为直线是指时域上各个采样点的声音强度均为零，时域波形近似为直线是指时域上各个采样点的声音强度均小于某一较低的声音强度值。

和/或，步骤130，基于音频信号的频域特征，确定音频信号的频域分析结果；其中，频域特征包括谐波位置信息；

此处，音频信号的频域特征用于表征音频信号在频域上的特征信息，其中谐波位置信息用于表征音频信号在频域上展示的各次谐波的位置。基于音频信号的频域特征，可以从频域层面上对音频信号进行分析，并得到频域分析结果。此处，频域分析结果可以包括音频信号是否为周期性信号。

需要说明的是，本发明实施例可以仅执行步骤120不执行步骤130，也可以仅执行步骤130不执行步骤120，还可以既执行步骤120也执行步骤130，且本发明实施例不对步骤120和步骤130的执行顺序做具体限定。

步骤140，基于时域分析结果和/或频域分析结果，确定待检测麦克风的故障检测结果。

具体地，故障检测结果即对待检测麦克风进行故障检测所得的结果，故障检测结果可以指示待检测麦克风是否存在故障，也可以当待检测麦克风存在故障时指示待检测麦克风具体存在的异常状态，还可以当待检测麦克风存在故障时指示待检测麦克风的故障原因等，本发明实施例对此不做具体限定。

例如，基于时域分析结果和/或频域分析结果，可以确定待检测麦克风是否存在故障，并在确定待检测麦克风存在故障时，根据时域分析结果和/或频域分析结果中表征的异常状态，以及预先设定的异常状态与故障原因之间的对应关系，确定待检测麦克风具体的故障原因，并生成故障检测结果。此处，异常状态与故障原因之间的对应关系可以是异常状态为时域波形近似直线、时域波形正负轴严重不对称或者爆音时，故障原因为麦克风自身受损，异常状态为时域波形绝对直线时，故障原因为多芯线与连接器插头处接触不良，异常状态为周期性信号时，故障原因为多芯线与声卡插头处接触不良。

本发明实施例提供的方法，通过待检测麦克风所采集的音频信号所对应的时域分析结果和/或频域分析结果，确定故障检测结果，应用所采集音频信号的自身特性实现了麦克风的在线检测，无需加增额外的检测设备，也不会对麦克风的正常工作造成影响，有效减轻了麦克风检测的人力成本和硬件成本，提高了麦克风检测的实时性。

基于上述实施例,图2为本发明实施例提供的时域分析方法的流程示意图，如图2所示，步骤120具体包括：

步骤121，基于音频信号的声音强度信息中，每一分段的声音强度最大值和声音强度最小值，确定音频信号的波形检测结果。

具体地，可以预先将音频信号划分为若干个分段，每一分段包含多个采样点，每一采样点对应一个声音强度。声音强度信息中包含有每一个分段的声音强度最大值和声音强度最小值，可以针对任一分段的声音强度最大值和声音强度最小值，对该分段的波形进行检测，进而得到该分段的波形检测检测，在此基础上，结合每一分段的波形检测结果，确定该音频信号的波形检测结果。此处，音频信号的波形检测结果可用于反映音频信号的时域波形是否存在近似直线、正负轴不对称的情况。

和/或，步骤122，基于音频信号的过零点信息中，每两个相邻过零点之间的距离，确定音频信号的爆音检测结果。

具体地，音频信号中，每一采样点均对应一个声音强度，可以通过声音强度的值确定该采样点是否为过零点，从而得到音频信号中的每一过零点。麦克风拾音正常情况下，两个相邻过零点的距离非常小，范围在几个至几十个采样点。而异常时，两个相邻过零点的距离非常大，范围在几百个至几万个采样点，即两个相邻过零点之间距离的大小反映两个相邻过零点之间是否存在爆音。通过判断每两个相邻过零点之间是否存在爆音，即可得到音频信号的爆音检测结果。此处，爆音检测结果用于反映待检测麦克风采集的音频信号的爆音状况。

需要说明的是，本发明实施例可以仅执行步骤121不执行步骤122，也可以仅执行步骤122不执行步骤121，还可以既执行步骤121也执行步骤122，且本发明实施例不对步骤121和步骤122的执行顺序做具体限定。

步骤123，基于波形检测结果和/或爆音检测结果，确定时域分析结果。

具体地，时域分析结果可以是基于波形检测结果确定的，也可以是基于爆音检测结果确定的，还可以是结合波形检测结果和爆音检测结果两者确定的，本发明实施例对此不做具体限定。

本发明实施例提供的方法，基于声音强度信息和/或过零点信息对音频信号进行时域分析，以丰富时域分析类型，提高时域分析的准确性。

基于上述任一实施例，图3为本发明实施例提供的波形检测结果的确定方法的流程示意图，如图3所示，步骤121具体包括：

步骤1211，将声音强度最大值与声音强度最小值的差小于预设声强差阈值的分段数量，作为音频信号的近似直线分段数。

具体地，预设声强差阈值即预先设定的分段时域波形近似为直线时，声音强度最大值和声音强度最小值的差的最大值。任一分段中，若声音强度最大值与声音强度最小值的差小于预设声强差阈值，则该分段的时域波形近似为直线。统计时域波形近似为直线的分段数量，作为音频信号的近似直线分段数。

和/或，步骤1212，将声音强度最大值的绝对值大于声音强度最小值的绝对值的预设系数倍，或声音强度最小值的绝对值大于声音强度最大值的绝对值的预设系数倍的分段数量，作为音频信号的不对称波形分段数。

具体地，预设系数为预先设定的分段时域波形正负轴严重不对称时，声音强度最大值和声音强度最小值之间的最小倍数阈值。任一分段中，若声音强度最大值的绝对值大于声音强度最小值的绝对值的预设系数倍，或声音强度最小值的绝对值大于声音强度最大值的绝对值的预设系数倍，则该分段的时域波形正负轴严重不对称。统计时域波形正负轴严重不对称的分段数量，作为音频信号的不对称波形分段数。

需要说明的是，本发明实施例可以仅执行步骤1211不执行步骤1212，也可以仅执行步骤1212不执行步骤1211，还可以既执行步骤1211也执行步骤1212，且本发明实施例不对步骤1211和步骤1212的执行顺序做具体限定。

步骤1213，基于近似直线分段数以及预设直线分段阈值，和/或不对称波形分段数以及预设不对称分段阈值，确定音频信号的波形检测结果。

具体地，预设直线分段阈值为预先设定的音频信号的时域波形近似为直线时，近似直线分段数的最小值。音频信号中，若近似直线分段数大于预设直线分段阈值，则确定音频信号的波形检测结果包括时域波形近似为直线。

预设不对称分段阈值为预先设定的音频信号的时域波形严重正负轴不对称时，不对称波形分段数的最小值。音频信号中，若不对称波形分段数大于预设不对称分段阈值，则确定音频信号的波形检测结果包括时域波形正负轴严重不对称。

由此得到的音频信号的波形检测结果可以反映音频信号的时域波形是否近似为直线，和/或时域波形正负轴是否对称。

此外，还可以通过判断时域波形中每一采样点对应的声音强度是否均为零，判断时域波形是否为直线。

本发明实施例提供的方法，通过确定音频信号的近似直线分段数和/或不对称波形分段数，实现针对音频信号时域波形的准确的直线波形检测和/或正负轴对称检测，进而确定波形检测结果，为判断待检测麦克风是否存在对应故障提供依据。

基于上述任一实施例，步骤1211中，音频信号的近似直线分段数可以通过如下公式确定：

式中，stmax和stmin为任一分段的声音强度最大值与声音强度最小值，stdistance即声音强度最大值与声音强度最小值的差，δ1为预设声强差阈值，例如，δ1可以取0.025。cnt1为近似直线分段数，若任一分段满足stdistance＜δ1，则对cnt1 1，从而统计近似直线分段数。

步骤1212中，音频信号的不对称波形分段数可以通过如下公式确定：

步骤1213中，基于近似直线分段数以及预设直线分段阈值确定波形检测结果可以表示为如下公式：

flag＝1000，ifcnt1＞ncut·α2

式中，ncut为分段总数，ncut·α2为预设直线分段阈值。当近似直线分段数大于预设直线分段阈值时，波形检测结果flag标记为1000，1000表示时域波形近似为直线。例如，设置ncut＝18，α2＝0.7，若cnt1≥13，则确定时域波形近似为直线。

基于不对称波形分段数以及预设不对称分段阈值确定波形检测结果可以表示为如下公式：

flag＝0100，ifcnt2＞ncut·α3

式中，ncut·α3为预设不对称分段阈值。当不对称波形分段数大于预设不对称分段阈值时，波形检测结果flag标记为0100，0100表示时域波形正负轴严重不对称。例如，设置ncut＝18，α2＝1/9，若cnt2＞2，则确定时域波形正负轴严重不对称。

基于上述任一实施例，图4为本发明实施例提供的爆音检测结果的确定方法的流程示意图，如图4所示，步骤122包括：

步骤1221，将距离大于第一距离阈值且中间值的绝对值大于中间值阈值的相邻过零点的组合数量，作为音频信号的第一相邻过零点组合数。

具体地，基于相邻过零点的距离和中间值进行爆音检测时，第一距离阈值为预先设定的存在爆音的两个相邻过零点之间距离的最小值，预设中间值阈值为预先设定的存在爆音的两个相邻过零点之间中间值的最小值。此处，相邻过零点的中间值是指两个相邻过零点之间的若干个采样点中，中间位置的采样点所对应的声音强度。

针对任意两个相邻过零点，若两个相邻过零点之间的距离大于第一距离阈值，且中间值的绝对值大于中间值阈值的相邻过零点，则确定上述两个相邻过零点之间存在爆音。将其间存在爆音的两个相邻过零点构成的组合的数量，作为第一相邻过零点组合数。此处的组合，即为两个相邻过零点。

和/或，步骤1222，将距离大于第二距离阈值的相邻过零点的组合数量，作为音频信号的第二相邻过零点组合数。

具体地，基于相邻过零点的距离进行爆音检测时，第二距离阈值为预先设定的存在爆音的两个相邻过零点之间距离的最小值。针对任意两个相邻过零点，若两个相邻过零点之间的距离大于第二距离阈值，则确定上述两个相邻过零点之间存在爆音。将其间存在爆音的两个相邻过零点构成的组合的数量，作为第二相邻过零点组合数。

需要说明的是，本发明实施例可以仅执行步骤1221不执行步骤1222，也可以仅执行步骤1222不执行步骤1221，还可以既执行步骤1221也执行步骤1222，且本发明实施例不对步骤1221和步骤1222的执行顺序做具体限定。

步骤1223，基于第一相邻过零点组合数以及预设第一组合数阈值，和/或第二相邻过零点组合数以及预设第二组合数阈值，确定爆音检测结果。

具体地，预设第一组合数阈值即基于相邻过零点的距离和中间值进行爆音检测的情况下，预先设定的音频信号存在爆音时第一相邻过零点组合数的最小值；预设第二组合数阈值即基于相邻过零点的距离进行爆音检测的情况下，预先设定的音频信号存在爆音时第二相邻过零点组合数的最小值。

若第一相邻过零点组合数大于预设第一组合数阈值，或第二相邻过零点组合数大于预设第二组合数阈值，即可确定爆音检测结果为音频信号存在爆音。

基于上述任一实施例，步骤1221中，音频信号的第一相邻过零点组合数可以通过如下公式表示：

cnt3＝cnt3 1,ifdistancezcr>β1且(stmid>γ1或stmid＜-γ1)

式中，distancezcr即相邻过零点的距离，stmid即相邻过零点的中间值，β1为第一距离阈值，γ1为中间值阈值，例如β1可以设置为500个采样点，γ1可以设置为0.015。cnt3为第一相邻过零点组合数，若distancezcr＞β1，同时stmid＞γ1或stmid＜-γ1，则对cnt3 1，从而统计第一相邻过零点组合数。

步骤1222中，音频信号的第二相邻过零点组合数可以通过如下公式表示：

cnt4＝cnt4 1，ifdistancezcr＞β2

式中，β2为第二距离阈值，例如β2可以设置为4000个采样点。cnt4为第二相邻过零点组合数，若相邻过零点的距离distancezcr＞β2，则对cnt4 1，从而统计第二相邻过零点组合数。

步骤1223中，爆音检测结果可以通过如下公式表示：

flag＝0010，ifcnt3＞β3或cnt4＞β4

式中，β3为预设第一组合数阈值，β4为预设第二组合数阈值，例如β3可以设置为30，β4可以设置为5。当第一相邻过零点组合数大于预设第一组合数阈值，或第二相邻过零点组合数大于预设第二组合数阈值时，爆音检测结果flag标记为0010，0010表示时域波形爆音。

基于上述任一实施例，图5为本发明实施例提供的频域分析方法的流程示意图，如图5所示，步骤130具体包括：

步骤131，基于音频信号的谐波位置信息中，每一分段的一次谐波位置和二次谐波位置，确定二次谐波位置与一次谐波位置的比值等于预设比值的分段数量，作为周期信号分段数量。

具体地，可以预先将音频信号划分为若干个分段，例如对音频信号分帧，每帧对应一个分段。音频信号的谐波位置信息是对音频信号的每一分段进行时频变换后得到的，此处时频变换的方式可以是快速傅里叶变换fft。

针对任一分段，该分段的谐波位置信息包括第一谐波位置和二次谐波位置，二次谐波位置与一次谐波位置的比值可以表示该分段信号是否为周期信号。预设比值即预先设定的分段为周期信号时的二次谐波位置与一次谐波位置的比值，具体可以设定为2。通过判断任一分段的二次谐波位置与一次谐波位置的比值是否等于预设比值，即可确定该分段是否为周期信号。随即，即可确定音频信号中为周期信号的分段数量，即周期信号分段数量。

步骤132，基于周期信号分段数量与预设周期信号分段阈值，确定音频信号的频域分析结果。

具体地，预设周期信号分段阈值即预先设定的音频信号为周期信号时周期信号分段数量的最小值。若周期信号分段数量大于预设周期信号分段阈值，则确定音频信号的频域分析结果为周期信号。

本发明实施例提供的方法，通过确定二次谐波位置与一次谐波位置的比值等于预设比值的分段数量，从频域层面上分析音频信号是否周期信号，为判断待检测麦克风是否存在对应故障提供依据。

基于上述任一实施例，步骤131中，周期信号分段数量可以通过如下公式确定：

式中，q为任一分段的二次谐波位置n2与一次谐波位置n1的比值，预设比值为2。cnt5为周期信号分段数量，若q＝＝2时，则将cnt5 1，从而实现周期信号分段数量的统计。

步骤132中，音频信号的频域分析结果可以通过如下公式确定：

flag＝0001，ifcnt5＞nframe·ε

式中，nframe为分段总数，本发明实施例中具体为音频信号的帧数，nframe·ε表示预设周期信号分段阈值，例如nframe＝5625，ε＝0.8。当周期信号分段数量大于预设周期信号分段阈值，频域分析结果flag标记为0001，0001表示周期信号。

在对音频信号的时域波形进行检测的过程中，仅凭借时域波形中各分段的声音强度最大值和声音强度最小值，确定时域波形近似为直线时，并不能直接确定是待检测麦克风故障所致，还存在是现场太安静的情况。对此，基于上述任一实施例，步骤140具体包括：若待检测麦克风所处声场中，每一麦克风所采集音频信号的时域分析结果均包括时域波形近似为直线，则确定待检测麦克风的故障检测结果不包括时域波形近似为直线。

具体地，当待检测麦克风处于声场当中，可以确定声场中每一麦克风所采集音频信号的时域检测结果。若声场中每一麦克风所采集音频信号的时域检测结果均包括时域波形近似为直线，则说明声场环境十分安静，时域波形为近似为直线不是待检测麦克风受损所致，故待检测麦克风的故障检测结果不包括时域波形近似为直线；反之，若待检测麦克风所采集音频信号的时域检测结果包括时域波形为近似为直线，而声场中的其余麦克风所采集音频信号的时域检测结果并不包括时域波形近似为直线，则说明待检测麦克风的时域波形近似为直线是待检测麦克风故障所致，故待检测麦克风的故障检测结果包括时域波形近似为直线，还可以包括时域波形近似为直线所对应的故障原因，即麦克风自身受损。

本发明实施例提供的方法，能够应用声场特点，区分时域波形近似为直线是否为麦克风故障所致，从而得到更为准确的故障检测结果。

基于上述任一实施例，图6为本发明实施例提供的故障检测结果的确定方法的流程示意图，如图6所示，步骤140具体包括：

步骤141，将音频信号输入至环境声音检测模型中，得到环境声音检测模型输出的环境声音检测结果；其中，环境声音检测模型是基于样本音频信号及其对应的样本环境声音检测结果训练得到的。

具体地，待检测麦克风所装设的环境中，通常存在一些持续性的环境声音，例如，养殖场中，牲畜通常会发出应激声音，例如猪群的应激声音可能是咳嗽、嚎叫、哼哼、扇耳朵等，又例如工厂中，生产设备的运行也会产生声音。若能够从待检测麦克风所采集的音频信号中检测得到上述环境声音，即可确定待检测麦克风运行正常，未见故障。

环境声音检测模型用于对输入的音频信号进行检测，从而确定音频信号中是否存在预先训练的环境声音，并输出环境声音检测结果。此处，环境声音检测结果可以表示是否检测到环境声音，还可以包含检测到环境声音的类型等，本发明实施例不对此做具体限定。

在执行步骤141之前，还可以预先训练得到环境声音检测模型，具体可以通过如下方式训练得到环境声音检测模型：首先，收集大量样本音频信号，通过人工标注得到样本音频信号的样本环境声音检测结果，其中包括是否存在环境声音，还可以包括存在的各种环境声音类型。随即，将样本音频信号及其对应的样本环境声音检测结果输入至初始模型进行训练，从而得到环境声音检测模型。

步骤142，若环境声音检测结果为存在环境声音，则基于时域分析结果，确定待检测麦克风的故障检测结果；否则，基于时域分析结果和频域分析结果，确定待检测麦克风的故障检测结果。

例如，当环境声音检测结果为存在环境声音，则可以确定待检测麦克风在时域上不存在时域波形为直线或近似为直线的问题，在频域上不存在周期信号的问题，仅需要基于时域分析结果判断音频信号的时域波形是否存在正负轴严重不对称的问题，以及是否存在爆音问题，进而确定故障检测结果；

当环境声音检测结果为不存在环境声音时，则需要基于时域分析结果和频域分析结果，确定故障检测结果。

本发明实施例提供的方法，利用环境声音检测模型对麦克风进行故障检测，能够有效提高麦克风故障检测效率。

基于上述任一实施例，步骤141具体包括如下步骤：

将音频信号分帧，得到多个音频帧。对任一音频帧进行经验模态分解emd，得到若干个imf(intrinsicmodefunction)分量，随即分别对imf分量进行hilbert变换，从而获得该音频帧的hht时频谱。本发明实施例中，hht时频谱为hilbert变换得到的前257个值，即257维特征。此外，提取该音频帧的过零率(1维特征)和能量(1维特征)，结合hht时频谱组成一个259维的声学特征。

将每一音频帧的声学特征输入到环境声音检测模型中，由环境声音检测模型对每一音频帧中所包含的环境声音进行检测，得到每一音频帧的环境声音检测结果，并在此基础上，结合每一音频帧的环境声音检测结果，确定音频信号的环境声音检测结果。此处，音频信号的环境声音检测结果可以是对每一音频帧的环境声音检测结果进行平均或者取最大值等方法得到的，本发明实施例对此不作具体限定。

基于上述任一实施例，图7本发明另一实施例提供的麦克风故障检测方法的流程示意图，如图7所示，该方法具体包括如下步骤：

首先，确定待检测麦克风所采集的音频信号。

其次，将音频信号输入至环境声音检测模型中，由环境声音检测模型对输入的音频信号进行检测，从而确定音频信号中是否存在预先训练的环境声音，并输出环境声音检测结果。

当环境声音检测结果为存在环境声音，则可以基于音频信号的时域特征，确定音频信号的时域分析结果；其中，时域分析结果包括时域波形正负轴是否严重不对称，以及是否存在爆音。在确定时域分析结果后，基于时域分析结果确定故障检测结果。当环境声音检测结果为不存在环境声音，则可以基于音频信号的时域特征，确定音频信号的时域分析结果，同时基于音频信号的频域特征，确定音频信号的频域分析结果。其中，时域分析结果包括时域波形是否为直线或者近似为直线、时域波形正负轴是否严重不对称，以及是否存在爆音，频域分析结果包括音频信号是否为周期信号。在确定时域分析结果和频域分析结果后，基于时域分析结果和频域分析结果，确定故障检测结果。

在此基础上，若故障检测结果中存在时域波形近似为直线，则判断待检测麦克风所处声场中，是否每一麦克风所采集音频信号的时域分析结果均包括时域波形近似为直线，如果是，则删除故障检测结果中的时域波形近似为直线。

基于上述任一实施例，图8为本发明实施例提供的麦克风故障检测装置的结构示意图，如图8所示，麦克风故障检测装置包括音频信号确定单元810、时域分析单元820、频域分析单元830和故障检测单元840。

其中，音频信号确定单元810用于确定待检测麦克风所采集的音频信号；

时域分析单元820用于基于所述音频信号的时域特征，确定所述音频信号的时域分析结果；其中，所述时域特征包括声音强度信息和/或过零点信息；

和/或，频域分析单元830用于基于所述音频信号的频域特征，确定所述音频信号的频域分析结果；其中，所述频域特征包括谐波位置信息；

故障检测单元840用于基于所述时域分析结果和/或所述频域分析结果，确定所述待检测麦克风的故障检测结果。

本发明实施例提供的装置，通过待检测麦克风所采集的音频信号所对应的时域分析结果和/或频域分析结果，确定故障检测结果，应用所采集音频信号的自身特性实现了麦克风的在线检测，无需加增额外的检测设备，也不会对麦克风的正常工作造成影响，有效减轻了麦克风检测的人力成本和硬件成本，提高了麦克风检测的实时性。

基于上述任一实施例，该装置中，时域分析单元820具体包括：

波形检测子单元，用于基于所述音频信号的声音强度信息中，每一分段的声音强度最大值和声音强度最小值，确定所述音频信号的波形检测结果；

和/或，爆音检测子单元，用于基于所述音频信号的过零点信息中，每两个相邻过零点之间的距离，确定所述音频信号的爆音检测结果；

时域分析子单元，用于基于所述波形检测结果和/或所述爆音检测结果，确定所述时域分析结果。

基于上述任一实施例，该装置中，波形检测子单元具体用于：

将所述声音强度最大值与所述声音强度最小值的差小于预设声强差阈值的分段数量，作为所述音频信号的近似直线分段数；

基于所述近似直线分段数以及预设直线分段阈值，和/或所述不对称波形分段数以及预设不对称分段阈值，确定所述音频信号的波形检测结果。

基于上述任一实施例，该装置中，爆音检测子单元具体用于：

将距离大于第一距离阈值且中间值的绝对值大于中间值阈值的相邻过零点的组合数量，作为所述音频信号的第一相邻过零点组合数；

和/或，将距离大于第二距离阈值的相邻过零点的组合数量，作为所述音频信号的第二相邻过零点组合数；

基于所述第一相邻过零点组合数以及预设第一组合数阈值，和/或所述第二相邻过零点组合数以及预设第二组合数阈值，确定所述爆音检测结果。

基于上述任一实施例，该装置中，频域分析单元830具体用于：

基于所述周期信号分段数量与预设周期信号分段阈值，确定所述音频信号的频域分析结果。

基于上述任一实施例，该装置中，故障检测单元840具体用于：

若环境声音检测结果为存在环境声音，则基于所述时域分析结果，确定所述待检测麦克风的故障检测结果；否则，基于所述时域分析结果和频域分析结果，确定待检测麦克风的故障检测结果。

图9为本发明实施例提供的电子设备的结构示意图，如图9所示，该电子设备可以包括：处理器(processor)910、通信接口(communicationsinterface)920、存储器(memory)930和通信总线940，其中，处理器910，通信接口920，存储器930通过通信总线940完成相互间的通信。处理器910可以调用存储器930中的逻辑命令，以执行如下方法：确定待检测麦克风所采集的音频信号；基于所述音频信号的时域特征，确定所述音频信号的时域分析结果；其中，所述时域特征包括声音强度信息和/或过零点信息；和/或，基于所述音频信号的频域特征，确定所述音频信号的频域分析结果；其中，所述频域特征包括谐波位置信息；基于所述时域分析结果和/或所述频域分析结果，确定所述待检测麦克风的故障检测结果。

此外，上述的存储器930中的逻辑命令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干命令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

本发明实施例还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各实施例提供的方法，例如包括：确定待检测麦克风所采集的音频信号；基于所述音频信号的时域特征，确定所述音频信号的时域分析结果；其中，所述时域特征包括声音强度信息和/或过零点信息；和/或，基于所述音频信号的频域特征，确定所述音频信号的频域分析结果；其中，所述频域特征包括谐波位置信息；基于所述时域分析结果和/或所述频域分析结果，确定所述待检测麦克风的故障检测结果。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如rom/ram、磁碟、光盘等，包括若干命令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术特征：

1.一种麦克风故障检测方法，其特征在于，包括：

确定待检测麦克风所采集的音频信号；

基于所述音频信号的时域特征，确定所述音频信号的时域分析结果；其中，所述时域特征包括声音强度信息和/或过零点信息；

和/或，基于所述音频信号的频域特征，确定所述音频信号的频域分析结果；其中，所述频域特征包括谐波位置信息；

基于所述时域分析结果和/或所述频域分析结果，确定所述待检测麦克风的故障检测结果。

2.根据权利要求1所述的麦克风故障检测方法，其特征在于，所述基于所述音频信号的时域特征，确定所述音频信号的时域分析结果，具体包括：

基于所述音频信号的声音强度信息中，每一分段的声音强度最大值和声音强度最小值，确定所述音频信号的波形检测结果；

和/或，基于所述音频信号的过零点信息中，每两个相邻过零点之间的距离，确定所述音频信号的爆音检测结果；

基于所述波形检测结果和/或所述爆音检测结果，确定所述时域分析结果。

3.根据权利要求2所述的麦克风故障检测方法，其特征在于，所述基于所述音频信号的声音强度信息中，每一分段的声音强度最大值和声音强度最小值，确定所述音频信号的波形检测结果，具体包括：

将所述声音强度最大值与所述声音强度最小值的差小于预设声强差阈值的分段数量，作为所述音频信号的近似直线分段数；

基于所述近似直线分段数以及预设直线分段阈值，和/或所述不对称波形分段数以及预设不对称分段阈值，确定所述音频信号的波形检测结果。

4.根据权利要求2所述的麦克风故障检测方法，其特征在于，所述基于所述音频信号的过零点信息中，每两个相邻过零点之间的距离，确定所述音频信号的爆音检测结果，具体包括：

将距离大于第一距离阈值且中间值的绝对值大于中间值阈值的相邻过零点的组合数量，作为所述音频信号的第一相邻过零点组合数；

和/或，将距离大于第二距离阈值的相邻过零点的组合数量，作为所述音频信号的第二相邻过零点组合数；

基于所述第一相邻过零点组合数以及预设第一组合数阈值，和/或所述第二相邻过零点组合数以及预设第二组合数阈值，确定所述爆音检测结果。

5.根据权利要求1所述的麦克风故障检测方法，其特征在于，所述基于所述频域特征，确定所述音频信号的频域分析结果，具体包括：

基于所述周期信号分段数量与预设周期信号分段阈值，确定所述音频信号的频域分析结果。

6.根据权利要求1至5中任一项所述的麦克风故障检测方法，其特征在于，所述基于所述时域分析结果，确定所述待检测麦克风的故障检测结果，具体包括：

7.根据权利要求1至5中任一项所述的麦克风故障检测方法，其特征在于，所述基于所述时域分析结果和/或所述频域分析结果，确定所述待检测麦克风的故障检测结果，具体包括：

8.一种麦克风故障检测装置，其特征在于，包括：

音频信号确定单元，用于确定待检测麦克风所采集的音频信号；

时域分析单元，用于基于所述音频信号的时域特征，确定所述音频信号的时域分析结果；其中，所述时域特征包括声音强度信息和/或过零点信息；

和/或，频域分析单元，用于基于所述音频信号的频域特征，确定所述音频信号的频域分析结果；其中，所述频域特征包括谐波位置信息；

故障检测单元，用于基于所述时域分析结果和/或所述频域分析结果，确定所述待检测麦克风的故障检测结果。

9.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至7中任一项所述的麦克风故障检测方法的步骤。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如权利要求1至7中任一项所述的麦克风故障检测方法的步骤。

技术总结
本发明实施例提供一种麦克风故障检测方法、装置、电子设备和存储介质，其中方法包括：确定待检测麦克风所采集的音频信号；基于音频信号的时域特征，确定音频信号的时域分析结果；其中，时域特征包括声音强度信息和/或过零点信息；和/或，基于音频信号的频域特征，确定音频信号的频域分析结果；频域特征包括谐波位置信息；基于时域分析结果和/或频域分析结果，确定待检测麦克风的故障检测结果。本发明实施例提供的方法、装置、电子设备和存储介质，应用所采集音频信号的自身特性实现了麦克风的在线检测，无需加增额外的检测设备，也不会对麦克风的正常工作造成影响，有效减轻了麦克风检测的人力成本和硬件成本，提高了麦克风检测的实时性。

技术研发人员：闫润强;时勇强;邓柯珀;李旭强;陈帅华
受保护的技术使用者：河南讯飞智元信息科技有限公司
技术研发日：2020.01.09
技术公布日：2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-15248.html

专利

最新回复(0)