语音控制方法、系统及智能空调与流程

专利2022-06-29  76


本发明涉及智能家居技术领域,特别涉及语音控制方法、系统及智能空调。



背景技术:

近年来智能家居行业快速发展,家庭智能生活正走向千家万户,正逐渐改善人们的生活。随着市场需求的不断升级,加上一些传感器技术的引进,智能技术逐步从智能连接过渡到智能感知、智能识别、智能交互的层面上来。

目前,比起人体感知技术,例如,红外识别技术,声音感知要更加灵活和方便,用户通过简单的语音直聊即可控制智能空调。

但是,现有的语音控制技术,任何用户可通过输入语音指令使得智能空调执行相应的操作,无法基于不同的用户提供不同的服务,从而导致用户体验较差。



技术实现要素:

本发明实施例提供了语音控制方法、系统及智能空调,能够提高用户的使用体验。

第一方面,本发明提供了语音控制方法,应用于智能空调,包括:

当通过至少三个麦克风采集到当前用户输入的声音信息时,确定所述至少三个麦克风采集的所述声音信息中,是否存在至少一条目标声音信息,其中,所述目标声音信息中包括至少一个预设的命令词;

当所述至少三个麦克风分别采集的所述声音信息中存在至少一条目标声音信息时,分别对每一条所述目标声音信息进行降噪,得到降噪后的所述目标声音信息;

分别从每一条降噪后的所述目标声音信息中提取所述当前用户的声纹信息;

根据提取出的所述声纹信息确定所述当前用户是否具有控制所述智能空调的本体的权限;

当确定所述当前用户具有控制所述智能空调的本体的权限时,将用于向外部的云端服务器请求信息的目标请求发送给所述云端服务器,以使所述云端服务器存储所述目标请求,其中,所述目标请求中包括至少一个所述命令词;

执行与外部的云端服务器返回的操作指令相对应的操作,其中,所述操作指令为所述云端服务器根据存储的所述当前用户的历史操作和所述目标请求中的所述至少一个预设的命令词确定的指令。

优选地,

在所述分别对每一条所述目标声音信息进行降噪,得到降噪后的所述目标声音信息之前,进一步包括:

采集所述当前用户所处环境的环境噪音;

所述分别对每一条所述目标声音信息进行降噪,得到降噪后的所述目标声音信息,包括:

分别从每一条所述目标声音信息中去除所述环境噪音,得到降噪后的所述目标声音信息。

优选地,

在所述根据提取出的所述声纹信息确定所述当前用户是否具有控制所述智能空调的本体的权限之前,进一步包括:

存储至少一个用户的3d声纹模型,其中,所述3d声纹模型由用户在相对于所述智能空调的本体的不同方位发出的语音信息中的声纹组成;

所述根据提取出的所述声纹信息确定所述当前用户是否具有控制所述智能空调的本体的权限,当确定所述当前用户具有控制所述智能空调的本体的权限时,将用于向外部的云端服务器请求信息的目标请求发送给所述云端服务器,包括:

确定提取的所述声纹信息中是否存在目标声纹信息,其中,所述目标声纹信息与存储的所述3d声纹模型中的目标声纹模型的相似度大于预设的相似值;

当确定存在目标声纹信息时,执行所述将用于向外部的云端服务器请求信息的目标请求发送给所述云端服务器。

优选地,

当确定存在目标声纹信息时,

在所述执行所述将用于向外部的云端服务器请求信息的目标请求发送给所述云端服务器之前,进一步包括:

s1:确定所述至少一个预设的命令词中是否存在向外部的云端服务器请求信息的第一命令词,如果是,执行s2,否则,执行s3;

s2:执行所述将用于向外部的云端服务器请求信息的目标请求发送给所述云端服务器;

s3:按照所述至少一个预设的命令词中用于对所述智能空调的本体进行控制的第二命令词运行。

优选地,

在所述按照所述至少一个预设的命令词中用于对所述智能空调的本体进行控制的第二命令词运行之后,进一步包括:

存储所述第二命令词;

当所述目标声音信息用于唤醒所述智能空调时,确定存储的所述第二命令词中,是否存在所述当前用户设定的所述智能空调的工作模式;

当存在所述当前用户设定的所述智能空调的工作模式时,按照所述当前用户最近一次设定的所述工作模式运行。

优选地,

进一步包括:

确定每一个所述3d声纹模型对应的标识;

将所述标识发送给所述云端服务器,以使所述云端服务器存储所述标识,便于外部的智能终端对所述云端服务器存储的所述标识进行管理,并更新所述智能终端管理后的所述标识。

优选地,

进一步包括:

当接收到所述当前用户输入的联网指令时,开启蓝牙功能,以使外部的智能终端通过所述蓝牙功能为所述智能空调的本体联网;

当所述智能空调的本体联网成功时,所述智能空调的本体上用于指示所述智能空调联网成功的指示灯常亮。

优选地,

所述至少三个麦克风呈一字形设置在智能空调的本体的正面,其中,设置后的所述至少三个麦克风与大地水准面相平行。

优选地,

当所述智能空调的本体上设置有至少一个扬声器时,每一个所述扬声器与每一个所述麦克风的直线距离不小于预设的阈值。

第二方面,本发明还提供了智能空调,包括:

信息识别模块,用于当通过至少三个麦克风采集到当前用户输入的声音信息时,确定所述至少三个麦克风采集的所述声音信息中,是否存在至少一条目标声音信息,其中,所述目标声音信息中包括至少一个预设的命令词;

降噪处理模块,用于当所述至少三个麦克风分别采集的所述声音信息中存在至少一条目标声音信息时,分别对每一条所述信息识别模块确定的所述目标声音信息进行降噪,得到降噪后的所述目标声音信息;

声纹提取模块,用于分别从每一条所述降噪处理模块降噪后的所述目标声音信息中提取所述当前用户的声纹信息;

信息处理模块,用于根据所述声纹提取模块提取出的所述声纹信息确定所述当前用户是否具有控制所述智能空调的本体的权限;当确定所述当前用户具有控制所述智能空调的本体的权限时,将用于向外部的云端服务器请求信息的目标请求发送给所述云端服务器,以使所述云端服务器存储所述目标请求,其中,所述目标请求中包括至少一个所述命令词;执行与外部的云端服务器返回的操作指令相对应的操作,其中,所述操作指令为所述云端服务器根据存储的所述当前用户的历史操作和所述目标请求中的所述至少一个预设的命令词确定的指令。

第三方面,本发明还提供了语音控制系统,包括:至少一个上述任一项所述的智能空调和云端服务器;

所述云端服务器,用于针对每一个所述智能空调,存储所述智能空调对应的至少一个用户的历史操作,在接收到所述智能空调发来的目标请求时,将所述目标请求作为当前用户的历史操作进行存储,并根据所述当前用户的所述历史操作和所述目标请求确定所述智能空调执行的操作指令,并将所述操作指令发送给所述智能空调。

优选地,

进一步包括:至少一个智能终端;

所述智能终端,用于在接收到所述当前用户输入的控制指令时,向所述云端服务器发送用于请求所述智能空调对应的ui界面的控制请求,在获取到所述云端服务器返回的与所述控制请求对应的ui包时,对所述ui包进行解析获得至少一个所述ui界面,以使所述当前用户通过各个所述ui界面中的功能对所述智能空调进行控制;

所述云端服务器,用于在接收到所述控制请求时,从所述智能空调中获取所述ui包,并将所述ui包发送给所述智能终端。

本发明提供了语音控制方法、系统及智能空调,通过多个麦克风对当前用户输入的声音信息进行采集,可以避免漏采当前用户的声音信息;由于不同的麦克风在智能空调本体上设置的位置不同,所以不同的麦克风采集到的声音信息中可能存在用户输入的语音信息,也可能由于当前用户与某个麦克风的距离相对较远,使得麦克风采集的声音信息较小,不便于识别,因此,可判断采集的声音信息中是否存包括至少一个命令词的目标声音信息,避免麦克风采集的声音信息为当前用户误操作发出的声音;在确定存在目标声音信息时,可先对目标声音信息进行降噪处理,以减小噪音对识别当前用户身份的影响,然后进行当前用户声纹信息的提取,以便基于声纹信息确定当前用户的访问权限,在当前用户具有访问智能空调本体的权限时,可基于目标声音信息中的命令词向云端服务器发送目标请求,以便云端服务器基于当前用户的历史操作和此次的目标请求返回相应的操作指令,使得智能空调的本体按照此操作指令运行,为用户提供相应的服务,从而提高用户的使用体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一实施例提供的语音控制方法的流程图;

图2是本发明一实施例提供的智能空调的结构示意图;

图3是本发明一实施例提供的语音控制系统的示意图;

图4是本发明一实施例提供的语音控制系统的示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,本发明实施例提供了语音控制方法,应用于智能空调,包括:

步骤101:当通过至少三个麦克风采集到当前用户输入的声音信息时,确定所述至少三个麦克风采集的所述声音信息中,是否存在至少一条目标声音信息,其中,所述目标声音信息中包括至少一个预设的命令词;

步骤102:当所述至少三个麦克风分别采集的所述声音信息中存在至少一条目标声音信息时,分别对每一条所述目标声音信息进行降噪,得到降噪后的所述目标声音信息;

步骤103:分别从每一条降噪后的所述目标声音信息中提取所述当前用户的声纹信息;

步骤104:根据提取出的所述声纹信息确定所述当前用户是否具有控制所述智能空调的本体的权限;

步骤105:当确定所述当前用户具有控制所述智能空调的本体的权限时,将用于向外部的云端服务器请求信息的目标请求发送给所述云端服务器,以使所述云端服务器存储所述目标请求,其中,所述目标请求中包括至少一个所述命令词;

步骤106:执行与外部的云端服务器返回的操作指令相对应的操作,其中,所述操作指令为所述云端服务器根据存储的所述当前用户的历史操作和所述目标请求中的所述至少一个预设的命令词确定的指令。

在本发明实施例中,通过多个麦克风对当前用户输入的声音信息进行采集,可以避免漏采当前用户的声音信息;由于不同的麦克风在智能空调本体上设置的位置不同,所以不同的麦克风采集到的声音信息中可能存在用户输入的语音信息,也可能由于当前用户与某个麦克风的距离相对较远,使得麦克风采集的声音信息较小,不便于识别,因此,可判断采集的声音信息中是否存包括至少一个命令词的目标声音信息,避免麦克风采集的声音信息为当前用户误操作发出的声音;在确定存在目标声音信息时,可先对目标声音信息进行降噪处理,以减小噪音对识别当前用户身份的影响,然后进行当前用户声纹信息的提取,以便基于声纹信息确定当前用户的访问权限,在当前用户具有访问智能空调本体的权限时,可基于目标声音信息中的命令词向云端服务器发送目标请求,以便云端服务器基于当前用户的历史操作和此次的目标请求返回相应的操作指令,使得智能空调的本体按照此操作指令运行,为用户提供相应的服务,从而提高用户的使用体验。

为了便于识别出用户在相对于智能空调本体的不同方位发出的声音,所述至少三个麦克风呈一字形设置在智能空调的本体的正面,其中,设置后的所述至少三个麦克风与大地水准面相平行。

由于智能空调通常靠墙摆放,人声收集主要来自空调正面180度的范围内,因此,各个麦克风呈一字阵列设置在智能空调的正面。通过各个麦克风分别采集到的当前用户输入的声音信息对应的音强,判断当前用户位于相对于智能空调的本体的声源方位,以便基于用户所在的声源方位,向该声源方位输送风还是在送风时避开该声源方位。

例如,麦克风1、麦克风2和麦克风3呈一字形设置在智能空调本体上,麦克风1位于智能空调的本体的最左侧,麦克风2位于智能空调的本体的中间,麦克风3位于智能空调的本体的最右侧;当前用户在发出声音信息后,麦克风1采集到的声音信息的音强最大,麦克风2采集到的声音信息的音强小于麦克风1采集到的声音信息的音强,且大于麦克风3采集到的声音信息的音强。所以基于3个麦克风采集的声音信息的音强可以判断出,当前用户位于智能空调本体的左方位,如果此时工作模式为“输送热风”,则可向该方位输送热风,如果此时的工作模式为“输送冷风”,则在输送冷风时,避开该方位。

具体地,设置在智能空调的本体上的麦克风数量越多,其判断出声源的方位越精确、声纹样本越多,对声纹的处理结果越精确,但随之带来的成本就越高、信息处理技术越复杂。因此,综合智能空调本体的美观性及语音识别成本,麦克风的数量优选为4个,一方面可以有效分离出人声和环境噪声,满足远场语音交互的精准性,一方面可以有效鉴别出声源方位(包含左方位、中方为、右方位)。

在本发明一实施例中,当所述智能空调的本体上设置有至少一个扬声器时,每一个所述扬声器与每一个所述麦克风的直线距离不小于预设的阈值。

具体地,由于扬声器是用于播放声音的设备,所以为了避免扬声器在播放声音时,影响麦克风采集用户输入的声音信息,扬声器和麦克风之间的直线距离不小预设的阈值,例如,30cm、50cm,以保证麦克风能正常工作。

为了提高识别用户声纹信息的准确性,在本发明一实施例中,在所述分别对每一条所述目标声音信息进行降噪,得到降噪后的所述目标声音信息之前,进一步包括:

采集所述当前用户所处环境的环境噪音;

所述分别对每一条所述目标声音信息进行降噪,得到降噪后的所述目标声音信息,包括:

分别从每一条所述目标声音信息中去除所述环境噪音,得到降噪后的所述目标声音信息。

在本发明实施例中,各个麦克风可以持续采集智能空调的本体所处环境的环境噪音,也可以在采集到当前用户输入的语音信息后,对当前用户所处环境的环境噪音(即智能空调的本体所处环境的环境噪音)进行采集,然后从目标声音信息中去除环境噪音,降低环境噪音对用户声纹识别的干扰。

在本发明一实施例中,在所述根据提取出的所述声纹信息确定所述当前用户是否具有控制所述智能空调的本体的权限之前,进一步包括:

存储至少一个用户的3d声纹模型,其中,所述3d声纹模型由用户在相对于所述智能空调的本体的不同方位发出的语音信息中的声纹组成;

所述根据提取出的所述声纹信息确定所述当前用户是否具有控制所述智能空调的本体的权限,当确定所述当前用户具有控制所述智能空调的本体的权限时,将用于向外部的云端服务器请求信息的目标请求发送给所述云端服务器,包括:

确定提取的所述声纹信息中是否存在目标声纹信息,其中,所述目标声纹信息与存储的所述3d声纹模型中的目标声纹模型的相似度大于预设的相似值;

当确定存在目标声纹信息时,执行所述将用于向外部的云端服务器请求信息的目标请求发送给所述云端服务器。

在本发明实施例中,在智能空调的本体中可存储用户的3d声纹模型,3d声纹模型为用户在相对于智能空调的本体的不同方位发出的语音信息,例如,在相对于智能空调的本体的左方位、右方位、中间方位。该语音信息中可包括在进行用户的身份注册时所需的注册词,例如,“注册声纹信息”。从语音信息中可提取用户的声纹信息,组成该用户的3d声纹模型。在存储的用户的3d声纹模型中,存在与从目标声音信息中提取出的声纹信息相匹配的目标声纹信息时,可确定当前用户为合法用户,即在智能空调的本体中已进行用户声纹注册,因此,可以为当前用户提供相应的服务。

在本发明一实施例中,当确定存在目标声纹信息时,

在所述执行所述将用于向外部的云端服务器请求信息的目标请求发送给所述云端服务器之前,进一步包括:

s1:确定所述至少一个预设的命令词中是否存在向外部的云端服务器请求信息的第一命令词,如果是,执行s2,否则,执行s3;

s2:执行所述将用于向外部的云端服务器请求信息的目标请求发送给所述云端服务器;

s3:按照所述至少一个预设的命令词中用于对所述智能空调的本体进行控制的第二命令词运行。

在本发明实施例中,采集到的目标声音信息,可能用于向云端服务器请求相应的服务,也可能是用于对智能空调的本体进行控制的指令,因此,可基于声音信息中的命令词,向云端服务器发送目标请求,或者使得智能空调的本体按照目标声音信息运行。

在本发明一实施例中,在所述按照所述至少一个预设的命令词中用于对所述智能空调的本体进行控制的第二命令词运行之后,进一步包括:

存储所述第二命令词;

当所述目标声音信息用于唤醒所述智能空调时,确定存储的所述第二命令词中,是否存在所述当前用户设定的所述智能空调的工作模式;

当存在所述当前用户设定的所述智能空调的工作模式时,按照所述当前用户最近一次设定的所述工作模式运行。

在本发明实施例中,当目标声音信息是用于对智能空调的本体进行控制时,可存储目标声音信息中的第二命令词,以便在目标声音信息仅仅是唤醒智能空调的本体,为未对智能空调的本体进行其他控制时,可以基于存储的第二命令词中,确定最近一次调节的智能空调的本体的工作模式,然后按照当前用户最近一次调节的工作模式运行,以为用户提供更人性化的服务。

为了便于用户管理自己的3d声纹模型,在本发明一实施例中,进一步包括:

确定每一个所述3d声纹模型对应的标识;

将所述标识发送给所述云端服务器,以使所述云端服务器存储所述标识,便于外部的智能终端对所述云端服务器存储的所述标识进行管理,并更新所述智能终端管理后的所述标识。

在本发明实施例中,可对每个用户的3d声纹模型进行编码,例如,基于用户注册声纹的顺序编码,确定对应的标识。然后将标识上传至云端服务器,以使用户通过智能终端管理自己的3d声纹模型的标识进行更改等操作。例如,用户a的3d声纹模型的标识为“023”,用户可以通过智能手机访问云端服务器将3d声纹模型的标识为“023”更改为“刘某某”,以便云端服务器将3d声纹模型的标识由“023”更改为“刘某某”发送给智能空调的本体,以便智能空调的本体将存储的3d声纹模型的标识由“023”更改为“刘某某”,并在3d声纹模型“刘某某”对应的用户对智能空调的本体进行操控时,显示3d声纹模型“刘某某”的字样,以便增加用户互动的乐趣。

为了便于用户通过其他的智能设备操控智能空调,在本发明一实施例中,进一步包括:

当接收到所述当前用户输入的联网指令时,开启蓝牙功能,以使外部的智能终端通过所述蓝牙功能为所述智能空调的本体联网;

当所述智能空调的本体联网成功时,所述智能空调的本体上用于指示所述智能空调联网成功的指示灯常亮。

在本发明实施例中,当前用户在为智能空调配网时,可先开启智能空调的本体的蓝牙功能,以便通过智能终端(例如,智能手机、笔记本电脑、台式电脑、平板电脑等)为智能空调的本体联网,在智能空调的本体联网成功后,设备上可现实用于指示联网成功的指示灯可常亮,在断开网络连接时,指示设备联网情况的指示灯关闭,以便用户通过指示灯确定设备的联网情况。

如图2所示,本发明实施例提供了智能空调,包括:

信息识别模块201,用于当通过至少三个麦克风采集到当前用户输入的声音信息时,确定所述至少三个麦克风采集的所述声音信息中,是否存在至少一条目标声音信息,其中,所述目标声音信息中包括至少一个预设的命令词;

降噪处理模块202,用于当所述至少三个麦克风分别采集的所述声音信息中存在至少一条目标声音信息时,分别对每一条所述信息识别模块201确定的所述目标声音信息进行降噪,得到降噪后的所述目标声音信息;

声纹提取模块203,用于分别从每一条所述降噪处理模块202降噪后的所述目标声音信息中提取所述当前用户的声纹信息;

信息处理模块204,用于根据所述声纹提取模块203提取出的所述声纹信息确定所述当前用户是否具有控制所述智能空调的本体的权限;当确定所述当前用户具有控制所述智能空调的本体的权限时,将用于向外部的云端服务器请求信息的目标请求发送给所述云端服务器,以使所述云端服务器存储所述目标请求,其中,所述目标请求中包括至少一个所述命令词;执行与外部的云端服务器返回的操作指令相对应的操作,其中,所述操作指令为所述云端服务器根据存储的所述当前用户的历史操作和所述目标请求中的所述至少一个预设的命令词确定的指令。

在本发明实施例中,通过多个麦克风对当前用户输入的声音信息进行采集,可以避免漏采当前用户的声音信息;由于不同的麦克风在智能空调本体上设置的位置不同,所以不同的麦克风采集到的声音信息中可能存在用户输入的语音信息,也可能由于当前用户与某个麦克风的距离相对较远,使得麦克风采集的声音信息较小,不便于识别,因此,可判断采集的声音信息中是否存包括至少一个命令词的目标声音信息,避免麦克风采集的声音信息为当前用户误操作发出的声音;在确定存在目标声音信息时,可先对目标声音信息进行降噪处理,以减小噪音对识别当前用户身份的影响,然后进行当前用户声纹信息的提取,以便基于声纹信息确定当前用户的访问权限,在当前用户具有访问智能空调本体的权限时,可基于目标声音信息中的命令词向云端服务器发送目标请求,以便云端服务器基于当前用户的历史操作和此次的目标请求返回相应的操作指令,使得智能空调的本体按照此操作指令运行,为用户提供相应的服务,从而提高用户的使用体验。

可以理解的是,本发明实施例示意的结构并不构成对智能空调的具体限定。在本发明的另一些实施例中,智能空调可以包括比图示更多或者更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。

如图3所示,本发明实施例提供了语音控制系统,包括:至少一个上述任一实施例中所述智能空调301和云端服务器302;

所述云端服务器,用于针对每一个所述智能空调,存储所述智能空调对应的至少一个用户的历史操作,在接收到所述智能空调发来的目标请求时,将所述目标请求作为当前用户的历史操作进行存储,并根据所述当前用户的所述历史操作和所述目标请求确定所述智能空调执行的操作指令,并将所述操作指令发送给所述智能空调。

在本发明实施例中,智能空调通过多个麦克风对当前用户输入的声音信息进行采集,可以避免漏采当前用户的声音信息;由于不同的麦克风在智能空调本体上设置的位置不同,所以不同的麦克风采集到的声音信息中可能存在用户输入的语音信息,也可能由于当前用户与某个麦克风的距离相对较远,使得麦克风采集的声音信息较小,不便于识别,因此,可判断采集的声音信息中是否存包括至少一个命令词的目标声音信息,避免麦克风采集的声音信息为当前用户误操作发出的声音;在确定存在目标声音信息时,可先对目标声音信息进行降噪处理,以减小噪音对识别当前用户身份的影响,然后进行当前用户声纹信息的提取,以便基于声纹信息确定当前用户的访问权限,在当前用户具有访问智能空调本体的权限时,可基于目标声音信息中的命令词向云端服务器发送目标请求,以便云端服务器基于当前用户的历史操作和此次的目标请求返回相应的操作指令,使得智能空调的本体按照此操作指令运行,为用户提供相应的服务,从而提高用户的使用体验。

图3中示出了3个智能空调。

为了便于用户在远离智能空调的本体时,能够对智能空调的本体进行控制,在本发明一实施例中,所述的语音控制系统进一步包括:至少一个智能终端;

所述智能终端,用于在接收到所述当前用户输入的控制指令时,向所述云端服务器发送用于请求所述智能空调对应的ui界面的控制请求,在获取到所述云端服务器返回的与所述控制请求对应的ui包时,对所述ui包进行解析获得至少一个所述ui界面,以使所述当前用户通过各个所述ui界面中的功能对所述智能空调进行控制;

所述云端服务器,用于在接收到所述控制请求时,从所述智能空调中获取所述ui包,并将所述ui包发送给所述智能终端。

在本发明实施例中,用户如需通过智能终端对智能空调的本体进行操控,可通过智能终端向云端服务器请求智能空调本体相对应的ui界面,这样云端服务器即能返回智能空调本体对应的ui包,智能终端通过运行该ui包即可进入用于控制智能空调的本体的ui界面,以通过ui界面中的各个功能对设备进行控制。

如图4所示,为了更加清楚地说明本发明的技术方案及优点,下面对智能手机a401、笔记本电脑b402、智能空调c403和智能空调d404为例,本发明提供的语音控制系统进行详细说明,具体可以包括以下步骤:

云端服务器405分别与智能手机a401、笔记本电脑b402、智能空调c403和智能空调d404相连接。

具体地,云端服务器可连接一台智能终端也可以连接多台智能终端,同样地,可连接一台智能空调也可连接多台智能空调,以便用户通过不同的智能终端对不同的智能空调进行操控。

智能空调c403和智能空调d404上均设置有至少三个呈一字形的麦克风,各个麦克风均设置在智能空调c403的正面和智能空调d404的本体的正面,其中,每台设备上设置后的至少三个麦克风与大地水准面相平行。

具体地,为了保证智能空调能够采集到用户在不同的方位发出的声音信息,且智能空调的本体通常靠墙摆放,人声收集主要来自空调正面180度的范围内,因此,在智能空调的本体的正面上可设置有多个麦克风,各个麦克风呈一字形阵列。

当智能空调c403和智能空调d404上均设置有至少一个扬声器时,智能空调c403上的扬声器与智能空调c403上的麦克风的直线距离不小于预设的阈值;智能空调d404上的扬声器与智能空调d404上的麦克风的直线距离不小于预设的阈值。

具体地,为了便于通过语音与用户交互,在智能空调的本体上还可设置有扬声器,例如,喇叭。智能空调的本体上的扬声器与该设备上的麦克风之间的直线距离不小于预设的阈值,以避免扬声器在进行语音播放时对麦克风的声纹采集造成干扰。

智能空调c403,用于当接收到当前用户输入的联网指令时,开启蓝牙功能。

具体地,当前用户可以通过操作智能空调c403上的按钮或通过语音形式的联网指令,控制智能空调c403开启蓝牙功能。

智能手机a401,用于与智能空调c403的蓝牙建立连接,为智能空调c403配网,使得智能空调c403能够连接网络。

智能空调c403,用于在联网成功时,智能空调c403的本体上用于指示智能空调联网成功的指示灯常亮。存储用户“小崔”和用户“小毕”的3d声纹模型,其中,3d声纹模型由用户在相对于智能空调c403的本体的不同方位发出的语音信息中的声纹组成;确定用户“小崔”和用户“小毕”3d声纹模型分别对应的标识,并将确定的标识发送给云端服务器405。

具体地,为了便于用户通过其他智能设备对智能空调进行操控,用户在为智能空调联网时可通过具有联网功能的智能设备,例如,手机、平板电脑等,智能空调在联网成功后,会通过指示联网状态的指示灯对联网状态进行显示。为了便于为不同用户提供不同的个性化服务,用户在初始操控智能空调时,可在智能空调上注册相应的3d声纹模型,即在相对于智能空调不同的方位、不同的距离录入预设的注册词,以便智能空调从用户录入的语音信息中采集用户的声纹信息,组成立体的3d声纹模型,为3d声纹模型确定系统设置的标识,并将3d声纹模型的标识发送给云端服务器,同时,指示用户声纹信息注册成功的vip指示灯也会被点亮,以便用户明确声纹信息注册成功。

云端服务器405,用于存储智能空调c403发来的用户“小崔”的3d声纹模型对应的标识,以及用户“小崔”的3d声纹模型对应的标识,并存储用户“小崔”和用户“小毕”在智能空调c403上的历史操作。

具体地,云端服务器可对不同用户的3d声纹模型对应的标识进行存储,还可以对用户向云端服务器请求数据的操作,作为历史操作进行存储,以便用户对存储的3d声纹模型对应的标识进行更改、删除等操作,还便于用户再次请求数据时,基于该用户对应的历史操作向用户提供相应的服务,例如,用户“小崔”的历史操作中播放的90%歌曲中为80年代、90年代的歌曲,当用户再次请求播放歌曲,且未指出歌曲的具体名称时,可基于该用户的历史操作挑选80年代、90年代的歌曲作为操作指令返回给智能空调c403,以便智能空调c403播放歌曲。

智能手机,用于在接收到用户“小崔”发来的控制指令时,向云端服务器405发送用于请求智能空调对应的ui界面的控制请求,在获取到云端服务器405返回的与控制请求对应的ui包时,对ui包进行解析获得至少一个ui界面,以使用户“小崔”通过各个ui界面中的功能对智能空调c403进行控制。

云端服务器405,用于在接收到来自智能手机的控制请求时,从智能空调c403中获取ui包,并发送给智能手机。

具体地,不同的智能空调对应的ui界面可能不同,因此,用户在确定所要控制的智能空调后,云端服务器可向智能手机上返回该智能空调对应的ui界面,由于ui界面上有控制智能空调的组件,因此,用户可通过操控组组件对智能空调进行控制,实现智能空调的远程控制。

智能空调c403,用于执行:

当通过至少三个麦克风采集到当前用户输入的声音信息时,确定至少三个麦克风采集的声音信息中,是否存在至少一条目标声音信息,其中,目标声音信息中包括至少一个预设的命令词。

具体地,用户如需对智能空调进行控制,可向智能空调输入相应的命令词,这样智能空调即可采集用户的声音信息,由于多个麦克风在智能空调的本体上设置的位置不同,且用户发出声音信息时相对应智能空调的本体的方位不同,有的麦克风可能采集到声音信息,但是该声音信息中用户的声音很小,有的麦克风才可采集声音相对较大的声音信息,因此,需要从不同的麦克风采集声音信息中确定出有效地目标声音信息,即,确定采集声音信息中是否存在用于对智能空调进行操控的命令词,在确定存在目标声音信息后,可确定目标声音信息为有效地信息,因此,可对采集的目标声音信息进行降噪处理,以便提取出当前用户的声纹信息,确定当前用户的身份是否合法。

当至少三个麦克风分别采集的声音信息中存在至少一条目标声音信息时,采集当前用户所处环境的环境噪音。

具体地,在确定采集到的声音信息为有效信息时,可采集当前用户所处环境的环境噪音,以便从目标声音信息中去除环境噪音,得到当前用户的声纹信息。

采集当前用户所处环境的环境噪音,可以是在采集到用户输入的声音信息后进行,也可以是通过麦克风持续不断地采集当前用户所处的环境噪音。如果通过麦克风持续不断地采集当前用户所处的环境噪音,在采集到当前用户的声音信息后,可基于采集到声音信息前的一段时间内的环境噪音,对采集的声音信息进行降噪处理。

分别从每一条目标声音信息中去除环境噪音,得到降噪后的目标声音信息。

分别从每一条降噪后的目标声音信息中提取当前用户的声纹信息。

具体地,为了提高用户声纹识别的准确性,可对每条目标声音信息进行降噪处理,以便从不同的目标声音信息中提取出用户的声纹信息,以基于用户的多个声纹信息判别用户的身份是否合法。

确定提取的声纹信息中是否存在目标声纹信息,其中,目标声纹信息与存储的3d声纹模型中的目标声纹模型的相似度大于预设的相似值。

具体地,由于用户在不同的方位发出的声音信息可能存在微小的区别,且用户在不同的状态时发出的声纹信息也有微小的区别,因此,通过可将提取出的声纹信息中与存储的3d声纹模型进行比对,在存储的3d声纹模型中存在与提取出的任意一个目标声纹模型的相似度的达到预设的相似值的目标声纹模型时,可判断当前用户的身份合法,具有对智能空调的本体进行操控的权限。如果存储的3d声纹模型中不存在与提取的声纹模型相似度达到相似值的目标声纹模型时,可请当前用户注册声纹信息,以便对设备操控。

当确定存在目标声纹信息时,执行:

a1:确定至少一个预设的命令词中是否存在向云端服务器405请求信息的第一命令词,如果是,执行a2,否则,执行a4。

a2:将用于向云端服务器405请求信息的目标请求发送给云端服务器405,其中,目标请求中包括至少一个第一命令词。

具体地,当前用户输入的声音信息中的命令词可能用户控制智能空调的本体,例如,调高温度,降低风速等,也可能用于向云端服务器请求数据,因此,通过判断声音信息中的命令词的作用,再确定是否向云端服务器发送请求信息。

a2:执行与云端服务器405返回的操作指令相对应的操作,其中,操作指令为云端服务器405根据存储的当前用户的历史操作和目标请求中的至少一个预设的命令词确定的指令。

具体地,云端服务器在返回操作指令时,按照该操作指令运行即可,一位用户提供相应的服务。

a4:按照至少一个预设的命令词中用于对智能空调的本体进行控制的第二命令词运行,并存储第二命令词,执行a5。

具体地,如果目标声音信息不是用于向云端服务器发送请求的信息,则可按照目标声音信息中的第二命令词执行相应的操作,以便为用户提供相应的服务。

a5:当目标声音信息用于唤醒智能空调时,确定存储的第二命令词中,是否存在当前用户设定的智能空调的工作模式,执行a6。

a6:当存在当前用户设定的智能空调的工作模式时,按照当前用户最近一次设定的工作模式运行。

具体地,如果目标声音信息仅是用于唤醒智能空调,而不对智能空调进行其他控制操作时,智能空调的本体可基于历史存储的该用户对应的第二命令词,确定该用户上次调节的智能空调的运行模式,按照最近一次的运行模式为该用户提供相应的服务。

例如,用户存储的第二命令词中,存在该用户最近一次设置的运行模式“输送冷风,25°”,可按照“输送冷风,25°”运行。

上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。

另外,麦克风即可以检测出用户输入的声音信息中的声纹方位并通过指示灯状态进行显示,当用户唤醒命令词“风随声动”,则空调开启送风模式,同时风向随着声纹方位进行改变。例如:当系统判断出声纹方向为左方位时,则左方位灯点亮,同时空调摆页向左偏移;

具体地,在识别用户输入的声音信息的声纹方位,可根据不同的麦克风采集到的声音信息的大小判断,比如,在智能空调的本体,从左至右分别设置麦克风1、麦克风2和麦克风3,三个麦克风采集到的声音信息的大小依次为麦克风3、麦克风2和麦克风1,因此可以判断出用户从智能空调的本体的右方位发出的声音,基于智能空调的当前工作模式,例如,制冷模式或者制热模式,确定是向“右方位”输送风,还是避开“右方位”输送风。比如,如果是当前工作模式为“制冷模式”,由于输送出为冷风,为了避免用户吹风着凉,可以避开“右方位”向其他方位输送冷风;如果当前工作模式为“制热模式”输送出的为热风,则可向“右方位”输送热风,以为用户供暖。

本发明实施例还提供了存储介质,包括:至少一个存储器和至少一个处理器;

所述至少一个存储器,用于存储机器可读程序;

所述至少一个处理器,用于调用所述机器可读程序,执行本发明任一实施例中的语音控制方法。

本发明实施例还提供了计算机可读介质,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行本发明任一实施例中的语音控制方法。

具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机(或cpu或mpu)读出并执行存储在存储介质中的程序代码。

在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。

用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如cd-rom、cd-r、cd-rw、dvd-rom、dvd-ram、dvd-rw、dvd rw)、磁带、非易失性存储卡和rom。可选择地,可以由通信网络从服务器计算机上下载程序代码。

此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。

此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展单元上的cpu等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。

需要说明的是,上述各流程和各系统结构图中不是所有的步骤和模块都是必须的,可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的,可以根据需要进行调整。上述各实施例中描述的系统结构可以是物理结构,也可以是逻辑结构,即,有些模块可能由同一物理实体实现,或者,有些模块可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。

以上各实施例中,硬件单元可以通过机械方式或电气方式实现。例如,一个硬件单元可以包括永久性专用的电路或逻辑(如专门的处理器,fpga或asic)来完成相应操作。硬件单元还可以包括可编程逻辑或电路(如通用处理器或其它可编程处理器),可以由软件进行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。

上文通过附图和优选实施例对本发明进行了详细展示和说明,然而本发明不限于这些已揭示的实施例,基与上述多个实施例本领域技术人员可以知晓,可以组合上述不同实施例中的代码审核手段得到本发明更多的实施例,这些实施例也在本发明的保护范围之内。


技术特征:

1.语音控制方法,其特征在于,应用于智能空调,包括:

当通过至少三个麦克风采集到当前用户输入的声音信息时,确定所述至少三个麦克风采集的所述声音信息中,是否存在至少一条目标声音信息,其中,所述目标声音信息中包括至少一个预设的命令词;

当所述至少三个麦克风分别采集的所述声音信息中存在至少一条目标声音信息时,分别对每一条所述目标声音信息进行降噪,得到降噪后的所述目标声音信息;

分别从每一条降噪后的所述目标声音信息中提取所述当前用户的声纹信息;

根据提取出的所述声纹信息确定所述当前用户是否具有控制所述智能空调的本体的权限;

当确定所述当前用户具有控制所述智能空调的本体的权限时,将用于向外部的云端服务器请求信息的目标请求发送给所述云端服务器,以使所述云端服务器存储所述目标请求,其中,所述目标请求中包括至少一个所述命令词;

执行与外部的云端服务器返回的操作指令相对应的操作,其中,所述操作指令为所述云端服务器根据存储的所述当前用户的历史操作和所述目标请求中的所述至少一个预设的命令词确定的指令。

2.根据权利要求1所述的语音控制方法,其特征在于,

在所述分别对每一条所述目标声音信息进行降噪,得到降噪后的所述目标声音信息之前,进一步包括:

采集所述当前用户所处环境的环境噪音;

所述分别对每一条所述目标声音信息进行降噪,得到降噪后的所述目标声音信息,包括:

分别从每一条所述目标声音信息中去除所述环境噪音,得到降噪后的所述目标声音信息。

3.根据权利要求1所述的语音控制方法,其特征在于,

在所述根据提取出的所述声纹信息确定所述当前用户是否具有控制所述智能空调的本体的权限之前,进一步包括:

存储至少一个用户的3d声纹模型,其中,所述3d声纹模型由用户在相对于所述智能空调的本体的不同方位发出的语音信息中的声纹组成;

所述根据提取出的所述声纹信息确定所述当前用户是否具有控制所述智能空调的本体的权限,当确定所述当前用户具有控制所述智能空调的本体的权限时,将用于向外部的云端服务器请求信息的目标请求发送给所述云端服务器,包括:

确定提取的所述声纹信息中是否存在目标声纹信息,其中,所述目标声纹信息与存储的所述3d声纹模型中的目标声纹模型的相似度大于预设的相似值;

当确定存在目标声纹信息时,执行所述将用于向外部的云端服务器请求信息的目标请求发送给所述云端服务器。

4.根据权利要求3所述的语音控制方法,其特征在于,

当确定存在目标声纹信息时,

在所述执行所述将用于向外部的云端服务器请求信息的目标请求发送给所述云端服务器之前,进一步包括:

s1:确定所述至少一个预设的命令词中是否存在向外部的云端服务器请求信息的第一命令词,如果是,执行s2,否则,执行s3;

s2:执行所述将用于向外部的云端服务器请求信息的目标请求发送给所述云端服务器;

s3:按照所述至少一个预设的命令词中用于对所述智能空调的本体进行控制的第二命令词运行。

5.根据权利要求4所述的语音控制方法,其特征在于,

在所述按照所述至少一个预设的命令词中用于对所述智能空调的本体进行控制的第二命令词运行之后,进一步包括:

存储所述第二命令词;

当所述目标声音信息用于唤醒所述智能空调时,确定存储的所述第二命令词中,是否存在所述当前用户设定的所述智能空调的工作模式;

当存在所述当前用户设定的所述智能空调的工作模式时,按照所述当前用户最近一次设定的所述工作模式运行。

6.根据权利要求3所述的语音控制方法,其特征在于,进一步包括:

确定每一个所述3d声纹模型对应的标识;

将所述标识发送给所述云端服务器,以使所述云端服务器存储所述标识,便于外部的智能终端对所述云端服务器存储的所述标识进行管理,并更新所述智能终端管理后的所述标识。

7.根据权利要求1至6中任一所述的语音控制方法,其特征在于,进一步包括:

当接收到所述当前用户输入的联网指令时,开启蓝牙功能,以使外部的智能终端通过所述蓝牙功能为所述智能空调的本体联网;

当所述智能空调的本体联网成功时,所述智能空调的本体上用于指示所述智能空调联网成功的指示灯常亮;

和/或,

所述至少三个麦克风呈一字形设置在智能空调的本体的正面,其中,设置后的所述至少三个麦克风与大地水准面相平行;

和/或,

当所述智能空调的本体上设置有至少一个扬声器时,每一个所述扬声器与每一个所述麦克风的直线距离不小于预设的阈值。

8.智能空调,其特征在于,包括:

信息识别模块,用于当通过至少三个麦克风采集到当前用户输入的声音信息时,确定所述至少三个麦克风采集的所述声音信息中,是否存在至少一条目标声音信息,其中,所述目标声音信息中包括至少一个预设的命令词;

降噪处理模块,用于当所述至少三个麦克风分别采集的所述声音信息中存在至少一条目标声音信息时,分别对每一条所述信息识别模块确定的所述目标声音信息进行降噪,得到降噪后的所述目标声音信息;

声纹提取模块,用于分别从每一条所述降噪处理模块降噪后的所述目标声音信息中提取所述当前用户的声纹信息;

信息处理模块,用于根据所述声纹提取模块提取出的所述声纹信息确定所述当前用户是否具有控制所述智能空调的本体的权限;当确定所述当前用户具有控制所述智能空调的本体的权限时,将用于向外部的云端服务器请求信息的目标请求发送给所述云端服务器,以使所述云端服务器存储所述目标请求,其中,所述目标请求中包括至少一个所述命令词;执行与外部的云端服务器返回的操作指令相对应的操作,其中,所述操作指令为所述云端服务器根据存储的所述当前用户的历史操作和所述目标请求中的所述至少一个预设的命令词确定的指令。

9.语音控制系统,其特征在于,包括:至少一个权利要求8所述的智能空调和云端服务器;

所述云端服务器,用于针对每一个所述智能空调,存储所述智能空调对应的至少一个用户的历史操作,在接收到所述智能空调发来的目标请求时,将所述目标请求作为当前用户的历史操作进行存储,并根据所述当前用户的所述历史操作和所述目标请求确定所述智能空调执行的操作指令,并将所述操作指令发送给所述智能空调。

10.根据权利要求9所述的语音控制系统,其特征在于,进一步包括:至少一个智能终端;

所述智能终端,用于在接收到所述当前用户输入的控制指令时,向所述云端服务器发送用于请求所述智能空调对应的ui界面的控制请求,在获取到所述云端服务器返回的与所述控制请求对应的ui包时,对所述ui包进行解析获得至少一个所述ui界面,以使所述当前用户通过各个所述ui界面中的功能对所述智能空调进行控制;

所述云端服务器,用于在接收到所述控制请求时,从所述智能空调中获取所述ui包,并将所述ui包发送给所述智能终端。

技术总结
本发明提供了语音控制方法、系统及智能空调,包括:当通过至少三个麦克风采集到当前用户输入的声音信息时,确定采集的声音信息中是否存在至少一条包括至少一个预设的命令词的目标声音信息;当存在目标声音信息时,分别对每条目标声音信息进行降噪得到降噪后的目标声音信息;从降噪后的目标声音信息中提取当前用户的声纹信息;根据声纹信息确定当前用户是否具有控制智能空调的权限;如果是,将包括至少一个命令词的目标请求发送给云端服务器,以使云端服务器存储目标请求;执行与云端服务器返回的操作指令相对应的操作,其中,操作指令为云端服务器根据存储的当前用户的历史操作和目标请求中的命令词确定的指令。本方案能够提高用户的使用体验。

技术研发人员:袁龙刚;李明;张江鹏
受保护的技术使用者:四川虹美智能科技有限公司
技术研发日:2020.03.27
技术公布日:2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-35753.html

最新回复(0)