一种提高声纹采集精度的方法、装置和设备与流程

专利2022-06-29 102

本申请涉及声纹采集技术领域，尤其涉及一种提高声纹采集精度的方法、装置和设备。

背景技术：

在声纹采集过程中，如果被采集声纹的说话人情绪异常、故意变调或调整嗓音等，将会影响到声纹采集的精度，因此，需要在声纹采集过程中对说话人的声纹进行分析和处理，提高声纹采集精度，以保证采集到的声纹的有效性。

技术实现要素：

本申请提供了一种提高声纹采集精度的方法、装置和设备，用于在声纹采集过程中对说话人的声纹进行分析和处理，提高声纹采集精度，以保证采集到的声纹的有效性。

有鉴于此，本申请第一方面提供了一种提高声纹采集精度的方法，包括：

在对说话人进行声纹采集时，通过所述说话人佩戴的脑波检测装置获取所述说话人的脑波；

对所述脑波进行频率分析，根据脑波频率确定所述说话人的情绪状态，在所述说话人的情绪状态满足声纹采集条件时，启动声纹采集设备，采集所述说话人的声纹数据。

可选地，所述对所述脑波进行频率分析，根据所述脑波频率确定所述说话人的情绪状态，在所述说话人的情绪状态满足声纹采集条件时，启动声纹采集设备，采集所述说话人的声纹数据，包括：

对所述脑波进行频率分析，判断所述脑波的频率是否为γ波或β波的smr频段或shortrange频段；

若所述脑波的频率为γ波或β波的smr频段或shortrange频段，则启动声纹采集设备，采集所述说话人的声纹数据；

若所述脑波的频率不是γ波或β波的smr频段或shortrange频段，则通过脑波诱导装置对所述说话人进行脑波诱导，在成功将所述说话人的脑波诱导为γ波或β波的smr频段或shortrange频段时，启动声纹采集设备，采集所述说话人的声纹数据。

可选地，还包括：

判断所述声纹数据是否有效，若是，则保存所述声纹数据。

可选地，所述通过脑波诱导装置对所述说话人进行脑波诱导，包括：

根据所述脑波调节所述脑波诱导装置中用于进行感官刺激的光信号参数，使得所述脑波趋向于目标脑波特性，所述光信号参数包括光信号波长、光信号强度和光信号相对于人眼的入射角。

可选地，还包括：

若在所述脑波诱导装置对所述说话人进行脑波诱导的过程中，所述说话人的脑波的信号参数超过安全阈值，则停止脑波诱导。

本申请第二方面提供了一种提高声纹采集精度的装置，包括：

脑波获取模块，用于在对说话人进行声纹采集时，通过所述说话人佩戴的脑波检测装置获取所述说话人的脑波；

脑波分析模块，用于对所述脑波进行频率分析，根据脑波频率确定所述说话人的情绪状态，在所述说话人的情绪状态满足声纹采集条件时，启动声纹采集设备，采集所述说话人的声纹数据。

可选地，所述脑波分析模块，具体用于：

对所述脑波进行频率分析，判断所述脑波的频率是否为γ波或β波的smr频段或shortrange频段；

若所述脑波的频率为γ波或β波的smr频段或shortrange频段，则启动声纹采集设备，采集所述说话人的声纹数据；

可选地，还包括：

声纹保存模块，用于判断所述声纹数据是否有效，若是，则保存所述声纹数据。

可选地，所述脑波分析模块，具体还用于：

根据所述脑波调节所述脑波诱导装置中用于进行感官刺激的光信号参数，使得所述脑波趋向于目标脑波特性，所述光信号参数包括光信号波长、光信号强度和光信号相对于人眼的入射角；

若在所述脑波诱导装置对所述说话人进行脑波诱导的过程中，所述说话人的脑波的信号参数超过安全阈值，则停止脑波诱导。

本申请第三方面提供了一种提高声纹采集精度的设备，所述设备包括处理器和存储器；

所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器用于根据所述程序代码中的指令执行第一方面任一种所述的提高声纹采集精度的方法。

从以上技术方案可以看出，本申请实施例具有以下优点：

本申请中提供了一种提高声纹采集精度的方法，包括：在对说话人进行声纹采集时，通过说话人佩戴的脑波检测装置获取说话人的脑波；对脑波进行频率分析，根据脑波频率确定说话人的情绪状态，在说话人的情绪状态满足声纹采集条件时，启动声纹采集设备，采集说话人的声纹数据。本申请提供的提高声纹采集精度的方法，在声纹采集时，先通过脑波检测装置获取到说话人的脑波信号数据，通过对说话人的脑波信号数据的频率进行分析，根据说话人脑波的频率确定说话人的情绪状态，在说话人的情绪状态符合声纹条件时，才启动声纹采集设备对说话人进行声纹采集，避免了被采集到的声纹数据为说话人在情绪不稳定时的声纹数据，提高了声纹采集数据的精确性，因此，本申请提供的方法在声纹采集过程中对说话人的声纹进行分析和处理，提高声纹采集精度，保证了采集到的声纹的有效性。

附图说明

图1为本申请实施例中提供的一种提高声纹采集精度的方法的一个流程示意图；

图2为本申请实施例中提供的一种提高声纹采集精度的方法的另一流程示意图；

图3为本申请实施例中提供的一种提高声纹采集精度的装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了便于理解，请参阅图1，本申请提供了一种提高声纹采集精度的方法的一个实施例，包括：

步骤101、在对说话人进行声纹采集时，通过说话人佩戴的脑波检测装置获取说话人的脑波。

需要说明的是，人的大脑在运行的过程中，主要通过两种方式在传递信号，一种是化学信号，另一种是电信号，本申请实施例中，通过大脑的电信号来进行分析。说话人的脑波信号反映着说话人的情绪状态，因此，可以通过脑波信号来确定说话人说话时的情绪是否稳定。可以用与脑波仪连接的脑波检测装置来采集说话人的脑波信号数据，说话人只需要正确戴上脑波检测装置即可。

步骤102、对脑波进行频率分析，根据脑波频率确定说话人的情绪状态，在说话人的情绪状态满足声纹采集条件时，启动声纹采集设备，采集说话人的声纹数据。

需要说明的是，说话人在不同的情绪状态下发出声音时，声纹是不同的，不同的声纹对应着不同的脑波频率，因此，可以通过对说话人的脑波频率进行分析，根据脑波频率来确定说话人的情绪状态，如果说话人的脑波频率反映的是说话人处于情绪不稳定状态，则此时不进行声纹采集，如果说话人的脑波频率反映的是说话人处于情绪稳定状态，则此时控制声纹采集设备开启，通过声纹采集设备对说话人进行声纹采集。

本申请实施例中提供的提高声纹采集精度的方法，包括：在对说话人进行声纹采集时，通过说话人佩戴的脑波检测装置获取说话人的脑波；对脑波进行频率分析，根据脑波频率确定说话人的情绪状态，在说话人的情绪状态满足声纹采集条件时，启动声纹采集设备，采集说话人的声纹数据。本申请提供的提高声纹采集精度的方法，在声纹采集时，先通过脑波检测装置获取到说话人的脑波信号数据，通过对说话人的脑波信号数据的频率进行分析，根据说话人脑波的频率确定说话人的情绪状态，在说话人的情绪状态符合声纹条件时，才启动声纹采集设备对说话人进行声纹采集，避免了被采集到的声纹数据为说话人在情绪不稳定时的声纹数据，提高了声纹采集数据的精确性，因此，本申请提供的方法在声纹采集过程中对说话人的声纹进行分析和处理，提高声纹采集精度，保证了采集到的声纹的有效性。

为了便于理解，请参阅图2，本申请中提供了一种提高声纹采集精度的方法的另一实施例，包括：

步骤201、在对说话人进行声纹采集时，通过说话人佩戴的脑波检测装置获取说话人的脑波。

需要说明的是，本申请实施例中的步骤201与上一实施例中的步骤101一致，在此不再进行赘述。

步骤202、对脑波进行频率分析，判断脑波的频率是否为γ波或β波的smr频段或shortrange频段。

步骤203、若脑波的频率为γ波或β波的smr频段或shortrange频段，则启动声纹采集设备，采集说话人的声纹数据；

若脑波的频率不是γ波或β波的smr频段或shortrange频段，则通过脑波诱导装置对说话人进行脑波诱导，在成功将说话人的脑波诱导为γ波或β波的smr频段或shortrange频段时，启动声纹采集设备，采集说话人的声纹数据。

需要说明的是，脑波是神经元细胞之间传递信息时产生的生物电信号，是大脑皮质中的锥体细胞突触活动时产生的离子交换而产生的电波信号。脑细胞只要是活动就会产生相应的生物电，也是通过这些电通过树突来跟别的脑细胞进行联接，形成思维的网络。

不同的脑波频率反映着说话人不同的情绪状态，当脑波种类为β波的smr(12～16hz)频段时，说话人处于放松但精神集中的情绪状态状态，当脑波种类为shortrange(16～20hz)频段时，说话人处于思考、处理接收到外接讯息的情绪状态，当脑波种类为γ波(30hz)以上时，说话人处于提高意识、幸福感、减轻压力、冥想的情绪状态，因此，当说话人的脑波类型为以上三种类型中的一种时，此时说话人的专注度和放松度等生理指标会比较好，有利于进行声纹采集，因此，可以启动声纹采集设备，采集说话人的声纹数据。

如果说话人的脑波类型不属于上述三种类型，则说话人的情绪状态很可能是不稳定的，比如说话人脑波类型为β波的highrange(20～30hz)时，说话人处于高度激动和焦虑的不稳定情绪状态，不利于进行声纹采集，因此，此时不启动声纹采集设备进行声纹采集。为了正常进行声纹采集工作，当说话人的脑波不满足声纹采集条件时，可以通过脑波诱导装置对说话人进行脑波诱导，根据说话人的脑波数据，调节脑波诱导装置中用于进行感官刺激的光信号参数，使得说话人的脑波趋向于目标脑波特性。光信号参数包括光信号波长、光信号强度和光信号相对于人眼的入射角中的至少一个。需要注意的是，若在脑波诱导装置对说话人进行脑波诱导的过程中，说话人的脑波的信号参数超过安全阈值，为保证说话人的安全，应停止脑波诱导。

步骤204、判断声纹数据是否有效，若是，则保存声纹数据。

需要说明的是，声纹数据的有效性也影响着声纹采集的准确性，在通过声纹采集设备采集到声纹数据之后，还需要判断声纹数据是否有效，判断声纹数据是否属于同一说话人、是否有背景音等，若声纹数据是有效的，则保存该声纹数据，形成有效的声纹信息。

为了便于理解，请参阅图3，本申请中提供了一种提高声纹采集精度的装置的实施例，包括：

脑波获取模块，用于在对说话人进行声纹采集时，通过说话人佩戴的脑波检测装置获取说话人的脑波。

脑波分析模块，用于对脑波进行频率分析，根据脑波频率确定说话人的情绪状态，在说话人的情绪状态满足声纹采集条件时，启动声纹采集设备，采集说话人的声纹数据。

进一步地，脑波分析模块，具体用于：

对脑波进行频率分析，判断脑波的频率是否为γ波或β波的smr频段或shortrange频段；

若脑波的频率为γ波或β波的smr频段或shortrange频段，则启动声纹采集设备，采集说话人的声纹数据；

进一步地，还包括：

声纹保存模块，用于判断声纹数据是否有效，若是，则保存声纹数据。

进一步地，脑波分析模块，具体还用于：

根据脑波调节脑波诱导装置中用于进行感官刺激的光信号参数，使得脑波趋向于目标脑波特性，光信号参数包括光信号波长、光信号强度和光信号相对于人眼的入射角；

若在脑波诱导装置对说话人进行脑波诱导的过程中，说话人的脑波的信号参数超过安全阈值，则停止脑波诱导。

本申请中提供了一种提高声纹采集精度的设备，设备包括处理器以及存储器：

存储器用于存储程序代码，并将程序代码传输给处理器；

处理器用于根据程序代码中的指令执行前述的提高声纹采集精度的方法实施例中的提高声纹采集精度的方法。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统和方法，可以通过其它的方式实现。例如，以上所描述的系统实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机系统(可以是个人计算机，服务器，或者网络系统等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(英文全称：read-onlymemory，英文缩写：rom)、随机存取存储器(英文全称：randomaccessmemory，英文缩写：ram)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

技术特征：

1.一种提高声纹采集精度的方法，其特征在于，包括：

在对说话人进行声纹采集时，通过所述说话人佩戴的脑波检测装置获取所述说话人的脑波；

2.根据权利要求1所述的提高声纹采集精度的方法，其特征在于，所述对所述脑波进行频率分析，根据所述脑波频率确定所述说话人的情绪状态，在所述说话人的情绪状态满足声纹采集条件时，启动声纹采集设备，采集所述说话人的声纹数据，包括：

对所述脑波进行频率分析，判断所述脑波的频率是否为γ波或β波的smr频段或shortrange频段；

若所述脑波的频率为γ波或β波的smr频段或shortrange频段，则启动声纹采集设备，采集所述说话人的声纹数据；

3.根据权利要求1所述的提高声纹采集精度的方法，其特征在于，还包括：

判断所述声纹数据是否有效，若是，则保存所述声纹数据。

4.根据权利要求2所述的提高声纹采集精度的方法，其特征在于，所述通过脑波诱导装置对所述说话人进行脑波诱导，包括：

5.根据权利要求2所述的提高声纹采集精度的方法，其特征在于，还包括：

若在所述脑波诱导装置对所述说话人进行脑波诱导的过程中，所述说话人的脑波的信号参数超过安全阈值，则停止脑波诱导。

6.一种提高声纹采集精度的装置，其特征在于，包括：

脑波获取模块，用于在对说话人进行声纹采集时，通过所述说话人佩戴的脑波检测装置获取所述说话人的脑波；

7.根据权利要求6所述的提高声纹采集精度的装置，其特征在于，所述脑波分析模块，具体用于：

对所述脑波进行频率分析，判断所述脑波的频率是否为γ波或β波的smr频段或shortrange频段；

若所述脑波的频率为γ波或β波的smr频段或shortrange频段，则启动声纹采集设备，采集所述说话人的声纹数据；

8.根据权利要求6所述的提高声纹采集精度的装置，其特征在于，还包括：

声纹保存模块，用于判断所述声纹数据是否有效，若是，则保存所述声纹数据。

9.根据权利要求7所述的提高声纹采集精度的装置，其特征在于，所述脑波分析模块，具体还用于：

若在所述脑波诱导装置对所述说话人进行脑波诱导的过程中，所述说话人的脑波的信号参数超过安全阈值，则停止脑波诱导。

10.一种提高声纹采集精度的设备，其特征在于，所述设备包括处理器以及存储器：

所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器用于根据所述程序代码中的指令执行权利要求1-5任一项所述的提高声纹采集精度的方法。

技术总结
本申请公开了一种提高声纹采集精度的方法、装置和设备，在对说话人进行声纹采集时，通过说话人佩戴的脑波检测装置获取说话人的脑波；对脑波进行频率分析，根据脑波频率确定说话人的情绪状态，在说话人的情绪状态满足声纹采集条件时，启动声纹采集设备，采集说话人的声纹数据。本申请提供的提高声纹采集精度的方法，在声纹采集时，先通过脑波检测装置获取到说话人的脑波信号数据，通过对说话人的脑波信号数据的频率进行分析，根据说话人脑波的频率确定说话人的情绪状态，在说话人的情绪状态符合声纹条件时，才启动声纹采集设备对说话人进行声纹采集，避免了被采集到的声纹数据为说话人在情绪不稳定时的声纹数据，提高了声纹采集数据的精确性。

技术研发人员：张国梁
受保护的技术使用者：广州国音智能科技有限公司
技术研发日：2020.01.16
技术公布日：2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-29262.html

专利

最新回复(0)