一种基于人工智能的语音识别垃圾分类系统的制作方法

专利2022-11-25  34


本发明涉及垃圾分类系统,具体涉及一种基于人工智能的语音识别垃圾分类系统。



背景技术:

现阶段,政府正在大力推进垃圾分类试点工作,居民在投递垃圾时需要自主完成分类。但对于普通居民,因为垃圾分类的习惯还没有养成,自行判断垃圾所属类别会比较困难,所以市面上出现了人工输入垃圾名称,自动判断垃圾所属类别的系统终端。

但是,现有的系统终端不支持语音识别功能,并且由于噪声源干扰,会出现语音识别不准确的情况。此外,现有的系统不具备自主学习的功能,通常需要人工扩展识别范围。



技术实现要素:

(一)解决的技术问题

针对现有技术所存在的上述缺点,本发明提供了一种基于人工智能的语音识别垃圾分类系统,能够有效克服现有技术所存在的不支持语音识别功能、语音识别不准确、不具备自主学习功能的缺陷。

(二)技术方案

为实现以上目的,本发明通过以下技术方案予以实现:

一种基于人工智能的语音识别垃圾分类系统,包括控制器,所述控制器与用于采集语音的语音采集模块相连,所述控制器与用于对所述语音采集模块采集语音的声源进行定位的声源定位模块相连,所述控制器与用于根据所述声源定位模块的定位信息判断声源准确位置坐标的声源方向判定模块相连;

所述控制器与用于根据所述声源方向判定模块的判定结果对所述语音采集模块采集语音进行处理的语音处理模块相连,所述语音处理模块将处理后得到的语音输入声学模型,所述控制器与用于提取来自所述声学模型处理后得到语音中关键字的关键字提取模块相连,所述控制器与存储各类垃圾包含垃圾的语音的垃圾分类数据库相连,所述控制器与用于在所述垃圾分类数据库中查询所述关键字提取模块提取关键字相对应垃圾类型的对比查询模块相连;

所述控制器通过数据传输模块将没有在所述垃圾分类数据库中查询到的关键字发送给人工客服平台,所述人工客服平台通过无线通信模块将垃圾类型发送给所述控制器,所述控制器与用于根据所述对比查询模块的查询结果、所述人工客服平台的传输数据进行语音播报的语音输出模块相连。

优选地,所述语音采集模块包括阵列分布设置的话筒,所述控制器中存储有每个话筒的位置坐标。

优选地,所述声源定位模块根据所述语音采集模块中话筒的位置坐标及声音强度计算声源位置坐标。

优选地,所述声源方向判定模块根据所述声源定位模块计算的声源位置坐标与系统终端的相对位置判定声源方向。

优选地,所述语音处理模块通过调整波束形成器的时延补偿权值对来自声源方向的语音进行增强处理,并对非声源方向的语音进行削弱处理。

优选地,所述声学模型的建立过程包括以下步骤:

s1、对于每个语种对应的语料,将提取得到的语音特征输入第一输入层;

s2、在第一输入层基于预设的第一权重矩阵计算向第一隐藏层输出的输出值;

s3、在第一隐藏层包括的多个子隐层中,接收相邻的第一输入层或前一个子隐层的输出值,使用相应的第二权重矩阵进行加权计算,并将结果输出至相邻的第一输出层或后一个子隐层;

s4、迭代调整第一权重矩阵、第二权重矩阵,得到满足预设条件的声学模型。

优选地,所述控制器接收到来自所述人工客服平台的传输数据时,所述控制器将没有在所述垃圾分类数据库中查询到的关键字及对应传输数据存储到所述垃圾分类数据库中。

优选地,所述垃圾分类数据库基于不同城市的垃圾分类规则进行设置。

(三)有益效果

与现有技术相比,本发明所提供的一种基于人工智能的语音识别垃圾分类系统,具有以下有益效果:

1、语音采集模块采集语音,声源定位模块对语音采集模块采集语音的声源进行定位,声源方向判定模块根据声源定位模块的定位信息判断声源准确位置坐标,语音处理模块通过调整波束形成器的时延补偿权值对来自声源方向的语音进行增强处理,并对非声源方向的语音进行削弱处理,语音处理模块将处理后得到的语音输入声学模型,关键字提取模块提取来自声学模型处理后得到语音中关键字,对比查询模块在垃圾分类数据库中查询关键字提取模块提取关键字相对应垃圾类型,再通过语音输出模块进行语音播报,一方面能够识别语音,通过语音识别输出对应垃圾类型的语音,方便人们使用,另一方面通过对非声源方向的语音进行削弱处理,减小噪声源的干扰,保证语音识别的准确度;

2、数据传输模块将没有在垃圾分类数据库中查询到的关键字发送给人工客服平台,人工客服平台通过无线通信模块将垃圾类型发送给控制器,控制器接收到来自人工客服平台的传输数据时,控制器将没有在垃圾分类数据库中查询到的关键字及对应传输数据存储到垃圾分类数据库中,从而能够进行自主学习,高效扩大识别范围。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明系统示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

一种基于人工智能的语音识别垃圾分类系统,如图1所示,包括控制器,控制器与用于采集语音的语音采集模块相连,控制器与用于对语音采集模块采集语音的声源进行定位的声源定位模块相连,控制器与用于根据声源定位模块的定位信息判断声源准确位置坐标的声源方向判定模块相连;

控制器与用于根据声源方向判定模块的判定结果对语音采集模块采集语音进行处理的语音处理模块相连,语音处理模块将处理后得到的语音输入声学模型,控制器与用于提取来自声学模型处理后得到语音中关键字的关键字提取模块相连,控制器与存储各类垃圾包含垃圾的语音的垃圾分类数据库相连,控制器与用于在垃圾分类数据库中查询关键字提取模块提取关键字相对应垃圾类型的对比查询模块相连;

控制器通过数据传输模块将没有在垃圾分类数据库中查询到的关键字发送给人工客服平台,人工客服平台通过无线通信模块将垃圾类型发送给控制器,控制器与用于根据对比查询模块的查询结果、人工客服平台的传输数据进行语音播报的语音输出模块相连。

语音采集模块包括阵列分布设置的话筒,控制器中存储有每个话筒的位置坐标。

声源定位模块根据语音采集模块中话筒的位置坐标及声音强度计算声源位置坐标。

声源方向判定模块根据声源定位模块计算的声源位置坐标与系统终端的相对位置判定声源方向。

语音处理模块通过调整波束形成器的时延补偿权值对来自声源方向的语音进行增强处理,并对非声源方向的语音进行削弱处理。

声学模型的建立过程包括以下步骤:

s1、对于每个语种对应的语料,将提取得到的语音特征输入第一输入层;

s2、在第一输入层基于预设的第一权重矩阵计算向第一隐藏层输出的输出值;

s3、在第一隐藏层包括的多个子隐层中,接收相邻的第一输入层或前一个子隐层的输出值,使用相应的第二权重矩阵进行加权计算,并将结果输出至相邻的第一输出层或后一个子隐层;

s4、迭代调整第一权重矩阵、第二权重矩阵,得到满足预设条件的声学模型。

控制器接收到来自人工客服平台的传输数据时,控制器将没有在垃圾分类数据库中查询到的关键字及对应传输数据存储到垃圾分类数据库中。

垃圾分类数据库基于不同城市的垃圾分类规则进行设置。

语音采集模块采集语音,声源定位模块对语音采集模块采集语音的声源进行定位,声源方向判定模块根据声源定位模块的定位信息判断声源准确位置坐标,语音处理模块通过调整波束形成器的时延补偿权值对来自声源方向的语音进行增强处理,并对非声源方向的语音进行削弱处理,语音处理模块将处理后得到的语音输入声学模型,关键字提取模块提取来自声学模型处理后得到语音中关键字,对比查询模块在垃圾分类数据库中查询关键字提取模块提取关键字相对应垃圾类型,再通过语音输出模块进行语音播报,一方面能够识别语音,通过语音识别输出对应垃圾类型的语音,方便人们使用,另一方面通过对非声源方向的语音进行削弱处理,减小噪声源的干扰,保证语音识别的准确度。

语音采集模块包括阵列分布设置的话筒,控制器中存储有每个话筒的位置坐标。

声源定位模块根据语音采集模块中话筒的位置坐标及声音强度计算声源位置坐标。

声源方向判定模块根据声源定位模块计算的声源位置坐标与系统终端的相对位置判定声源方向。

声学模型的建立过程包括以下步骤:

s1、对于每个语种对应的语料,将提取得到的语音特征输入第一输入层;

s2、在第一输入层基于预设的第一权重矩阵计算向第一隐藏层输出的输出值;

s3、在第一隐藏层包括的多个子隐层中,接收相邻的第一输入层或前一个子隐层的输出值,使用相应的第二权重矩阵进行加权计算,并将结果输出至相邻的第一输出层或后一个子隐层;

s4、迭代调整第一权重矩阵、第二权重矩阵,得到满足预设条件的声学模型。

数据传输模块将没有在垃圾分类数据库中查询到的关键字发送给人工客服平台,人工客服平台通过无线通信模块将垃圾类型发送给控制器,控制器接收到来自人工客服平台的传输数据时,控制器将没有在垃圾分类数据库中查询到的关键字及对应传输数据存储到垃圾分类数据库中,从而能够进行自主学习,高效扩大识别范围。

垃圾分类数据库基于不同城市的垃圾分类规则进行设置。

以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。


技术特征:

1.一种基于人工智能的语音识别垃圾分类系统,其特征在于:包括控制器,所述控制器与用于采集语音的语音采集模块相连,所述控制器与用于对所述语音采集模块采集语音的声源进行定位的声源定位模块相连,所述控制器与用于根据所述声源定位模块的定位信息判断声源准确位置坐标的声源方向判定模块相连;

所述控制器与用于根据所述声源方向判定模块的判定结果对所述语音采集模块采集语音进行处理的语音处理模块相连,所述语音处理模块将处理后得到的语音输入声学模型,所述控制器与用于提取来自所述声学模型处理后得到语音中关键字的关键字提取模块相连,所述控制器与存储各类垃圾包含垃圾的语音的垃圾分类数据库相连,所述控制器与用于在所述垃圾分类数据库中查询所述关键字提取模块提取关键字相对应垃圾类型的对比查询模块相连;

所述控制器通过数据传输模块将没有在所述垃圾分类数据库中查询到的关键字发送给人工客服平台,所述人工客服平台通过无线通信模块将垃圾类型发送给所述控制器,所述控制器与用于根据所述对比查询模块的查询结果、所述人工客服平台的传输数据进行语音播报的语音输出模块相连。

2.根据权利要求1所述的基于人工智能的语音识别垃圾分类系统,其特征在于:所述语音采集模块包括阵列分布设置的话筒,所述控制器中存储有每个话筒的位置坐标。

3.根据权利要求1所述的基于人工智能的语音识别垃圾分类系统,其特征在于:所述声源定位模块根据所述语音采集模块中话筒的位置坐标及声音强度计算声源位置坐标。

4.根据权利要求1所述的基于人工智能的语音识别垃圾分类系统,其特征在于:所述声源方向判定模块根据所述声源定位模块计算的声源位置坐标与系统终端的相对位置判定声源方向。

5.根据权利要求1所述的基于人工智能的语音识别垃圾分类系统,其特征在于:所述语音处理模块通过调整波束形成器的时延补偿权值对来自声源方向的语音进行增强处理,并对非声源方向的语音进行削弱处理。

6.根据权利要求1所述的基于人工智能的语音识别垃圾分类系统,其特征在于:所述声学模型的建立过程包括以下步骤:

s1、对于每个语种对应的语料,将提取得到的语音特征输入第一输入层;

s2、在第一输入层基于预设的第一权重矩阵计算向第一隐藏层输出的输出值;

s3、在第一隐藏层包括的多个子隐层中,接收相邻的第一输入层或前一个子隐层的输出值,使用相应的第二权重矩阵进行加权计算,并将结果输出至相邻的第一输出层或后一个子隐层;

s4、迭代调整第一权重矩阵、第二权重矩阵,得到满足预设条件的声学模型。

7.根据权利要求1所述的基于人工智能的语音识别垃圾分类系统,其特征在于:所述控制器接收到来自所述人工客服平台的传输数据时,所述控制器将没有在所述垃圾分类数据库中查询到的关键字及对应传输数据存储到所述垃圾分类数据库中。

8.根据权利要求7所述的基于人工智能的语音识别垃圾分类系统,其特征在于:所述垃圾分类数据库基于不同城市的垃圾分类规则进行设置。

技术总结
本发明涉及垃圾分类系统,具体涉及一种基于人工智能的语音识别垃圾分类系统,包括控制器,控制器与用于采集语音的语音采集模块相连,控制器与用于对语音采集模块采集语音的声源进行定位的声源定位模块相连,控制器与用于根据声源定位模块的定位信息判断声源准确位置坐标的声源方向判定模块相连,控制器与用于根据声源方向判定模块的判定结果对语音采集模块采集语音进行处理的语音处理模块相连,语音处理模块将处理后得到的语音输入声学模型,控制器与用于提取来自声学模型处理后得到语音中关键字的关键字提取模块相连;本发明提供的技术方案能够有效克服现有技术所存在的不支持语音识别功能、语音识别不准确、不具备自主学习功能的缺陷。

技术研发人员:任牡玲
受保护的技术使用者:安徽仁昊智能科技有限公司
技术研发日:2019.12.26
技术公布日:2020.05.19

转载请注明原文地址: https://bbs.8miu.com/read-267654.html

最新回复(0)