本申请涉及互联网技术领域,具体涉及一种实现报警的方法及装置。
背景技术:
在一些场景下用户所使用的智能终端可以用于保护用户的安全,例如儿童智能手表的一个主要作用是帮助家长保护儿童安全。在现有技术中,用户在使用智能终端的过程中,如需获得帮助,需要主动触发报警功能,例如需要触发某些按键,或者说出预设的报警关键词等才能触发智能终端进行报警操作。但是,由于某些限制用户无法进行主动操作时,则无法进行报警,例如,用户群体为儿童时,其无法准确判断是否处于危险中,并及时说出报警关键词;或者所处环境使用户无法说出报警关键词。因此,现有技术中终端的自动报警功能无法充分保护用户的安全。
技术实现要素:
有鉴于此,本申请实施例提供一种实现报警的方法及装置,以解决现有技术中无法准确、及时的触发终端的自动报警功能保护用户安全的技术问题。
为解决上述问题,本申请实施例提供的技术方案如下:
一种实现报警的方法,所述方法包括:
获取第一终端对应的环境声音;
将所述环境声音输入预先训练生成的声音分类模型,获得所述声音分类模型输出的所述环境声音的分类结果;
当所述环境声音的分类结果属于危险环境时,向所述第一终端和/或第二终端发送报警信息。
在一种可能的实现方式中,所述当所述环境声音的分类结果属于危险环境时,向所述第一终端和/或第二终端发送报警信息,包括:
当所述环境声音的分类结果属于危险环境时,获取所述分类结果对应的处理规则;
根据所述处理规则向所述第一终端和/或第二终端发送报警信息。
在一种可能的实现方式中,所述声音分类模型的训练过程包括:
获取待训练环境声音;
将所述待训练环境声音以及所述待训练环境声音对应的分类标签作为训练数据,所述分类标签包括至少一种危险环境标签或者安全环境标签;
根据所述训练数据对初始模型进行训练生成声音分类模型。
在一种可能的实现方式中,所述声音分类模型的训练过程包括:
获取待训练环境声音;
提取所述待训练环境声音的音频特征;
将所述待训练环境声音的音频特征以及所述待训练环境声音对应的分类标签作为训练数据,所述分类标签包括至少一种危险环境标签或者安全环境标签;
根据所述训练数据对初始模型进行训练生成声音分类模型。
在一种可能的实现方式中,所述初始模型为深度学习模型或者分类模型。
在一种可能的实现方式中,获取第一终端对应的环境声音后,所述方法还包括:
提取所述环境声音的音频特征;
所述将所述环境声音输入预先训练生成的声音分类模型,获得所述声音分类模型输出的所述环境声音的分类结果,包括:
将所述环境声音的音频特征输入预先训练生成的声音分类模型,获得所述声音分类模型输出的所述环境声音的分类结果。
在一种可能的实现方式中,获取第一终端对应的环境声音后,所述方法还包括:
对所述环境声音进行语音识别,获得所述环境声音的语音识别结果;
当所述语音识别结果中包括预设关键词时,向所述第一终端和/或第二终端发送报警信息。
一种实现报警的装置,所述装置包括:
获取单元,用于获取第一终端对应的环境声音;
输入单元,用于将所述环境声音输入预先训练生成的声音分类模型,获得所述声音分类模型输出的所述环境声音的分类结果;
第一发送单元,用于当所述环境声音的分类结果属于危险环境时,向所述第一终端和/或第二终端发送报警信息。
在一种可能的实现方式中,第一发送单元,包括:获取子单元,用于当所述环境声音的分类结果属于危险环境时,获取所述分类结果对应的处理规则;
发送子单元,用于根据所述处理规则向所述第一终端和/或第二终端发送报警信息。
在一种可能的实现方式中,所述声音分类模型的训练过程包括:
获取待训练环境声音;
将所述待训练环境声音以及所述待训练环境声音对应的分类标签作为训练数据,所述分类标签包括至少一种危险环境标签或者安全环境标签;
根据所述训练数据对初始模型进行训练生成声音分类模型。
在一种可能的实现方式中,所述声音分类模型的训练过程包括:
获取待训练环境声音;
提取所述待训练环境声音的音频特征;
将所述待训练环境声音的音频特征以及所述待训练环境声音对应的分类标签作为训练数据,所述分类标签包括至少一种危险环境标签或者安全环境标签;
根据所述训练数据对初始模型进行训练生成声音分类模型。
在一种可能的实现方式中,所述初始模型为深度学习模型或者分类模型。
在一种可能的实现方式中,所述装置还包括:
提取单元,用于在所述获取单元获取待训练环境声音之后,提取所述环境声音的音频特征;
所述输入单元,具体用于将所述环境声音的音频特征输入预先训练生成的声音分类模型,获得所述声音分类模型输出的所述环境声音的分类结果。
在一种可能的实现方式中,所述装置还包括:
识别单元,用于在所述获取单元获取待训练环境声音之后,对所述环境声音进行语音识别,获得所述环境声音的语音识别结果;
第二发送单元,用于当所述语音识别结果中包括预设关键词时,向所述第一终端和/或第二终端发送报警信息。
一种用于实现报警的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取第一终端对应的环境声音;
将所述环境声音输入预先训练生成的声音分类模型,获得所述声音分类模型输出的所述环境声音的分类结果;
当所述环境声音的分类结果属于危险环境时,向所述第一终端和/或第二终端发送报警信息。
一种计算机可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行上述的实现报警的方法。
由此可见,本申请实施例具有如下有益效果:
本申请实施例中首先获取用户所处环境的环境声音,并将获取的环境声音输入预先训练生成的声音分类模型,以获得该环境声音的分类结果,当该环境声音的分类结果属于危险环境时,向用户所使用的第一终端和/或与第一终端设备绑定的第二终端设备发送报警信息。也就是,当用户处于危险环境时,无需用户主动触发报警功能,而是根据用户当前所处环境的声音识别出用户处于危险环境,自动向第一终端和/或第二终端发送报警信息,从而实现智能告警,提醒用户注意安全和/或通知用户亲属的目的,进而实现充分保护用户的安全。
附图说明
图1为本申请实施例提供的场景示例框架图;
图2为本申请实施例提供的一种生成声音分类模型方法的流程图;
图3为本申请实施例提供的另一种生成声音分类模型方法的流程图;
图4为本申请实施例提供的一种实现报警的方法流程图;
图5为本申请实施例提供的一种实现报警的装置结构图;
图6为本申请实施例提供的另一种实现报警的装置结构图;
图7为本申请实施例提供的一种服务器设备结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请实施例作进一步详细的说明。
发明人在对传统的智能终端研究中发现,用户在使用传统的智能终端进行告警时,需要主动通过一些操作,才能实现通知家长需要帮助的目的;或者需要用户说出预设的关键词,例如:报警。然而,当用户为儿童时,其无法准确判断自身所处的环境是否为危险环境,并及时说出告警词,无法充分保护用户的安全。
基于此,本申请实施例提供了一种实现报警的方法及装置,由于当用户遇到紧急情况时,其周围的声音往往发生较大的变化,例如,周围人的喊声、哭声、骂声、重物碰撞等声音,其可以体现当时环境的危险信息。因此,可以首先获取用户当前所述环境的声音,然后将环境声音输入预先训练生成的声音分类模型,该声音分类模型可以对当前环境声音进行分类,当该环境声音的分类结果为危险环境时,向用户所使用的第一终端和/或与第一终端绑定的第二终端发送报警信息,从而实现智能告警,提醒用户注意安全和/或通知用户亲属的目的,进而实现充分保护用户的安全。
参见图1,该图为本申请实施例提供的示例性应用场景的框架示意图。其中,本申请实施例提供的实现报警的方法可以应用于服务器20中。
实际应用时,服务器20获取第一终端10当前所处环境声音,并将获取的声音输入声音分类模型,获得该环境声音对应的分类结果,当分类结果为危险环境时,向第一终端10和/或第二终端30发送报警信息。
本领域技术人员可以理解,图1所示的框架示意图仅是本申请的实施方式可以在其中得以实现的一个示例。本申请实施方式的适用范围不受到该框架任何方面的限制。
需要注意的是,第一终端10和第二终端30可以是现有的、正在研发的或将来研发的、能够通过任何形式的有线和/或无线连接(例如,wi-fi、lan、蜂窝、同轴电缆等)相互交互的任何用户设备,包括但不限于:现有的、正在研发的或将来研发的智能可穿戴设备、智能手机、非智能手机、平板电脑、膝上型个人计算机、桌面型个人计算机、小型计算机、中型计算机、大型计算机等。本申请的实施方式在此方面不受任何限制。还需要注意的是,本申请实施例中服务器20可以是现有的、正在研发的或将来研发的、能够向用户提供信息推荐的应用服务的设备的一个示例。本申请的实施方式在此方面不受任何限制。
本申请实施例中提供的实现报警的方法,利用了预先训练生成的声音分类模型,为了便于后续实施例的理解,首先对声音分类模型的生成进行说明。
本申请实施例提供了两种训练生成声音分类模型的方法,一种是利用待训练环境声音以及该待训练环境声音对应的分类标签进行训练;另一种是利用待训练环境声音的音频特征以及该待训练环境声音对应的分类标签进行训练,为便于理解本申请提供的技术方案,下面将结合附图对训练生成声音分类模型进行说明。
参见图2,该图为本申请实施例提供的一种生成声音分类模型的方法流程图,该方法可以包括:
s201:获取待训练环境声音。
本实施例中,为训练生成声音分类模型,可以在不同的环境下获取该环境下的待训练环境声音。其中,不同的环境可以为争吵环境、哭闹环境、车辆较多环境、安全环境等等。
在具体实现时,尽可能地获取各种不同环境下的待训练环境声音,以便训练生成的声音分类模型可以根据环境声音识别出用户当前所处的环境。为使得训练生成的声音分类模型可以准确地对输入的环境声音进行分类,在获取待训练环境声音时,针对任意一种环境,可以获取该环境下多组待训练环境声音,利用多组待训练环境声音进行训练。
s202:将待训练环境声音以及待训练环境声音对应的分类标签作为训练数据。
本实施例中,由于在获取待训练环境声音的环境类型是已知的,因此可以为获取的待训练环境声音添加对应的分类标签,然后将待训练环境声音以及该待训练环境声音对应的分类标签作为训练数据。
在本实施例中,分类标签可以包括至少一种危险环境标签或者安全环境标签。在具体实现时,可以将分类标签分为两类:危险环境标签和安全环境标签。当获取待训练环境声音时,可以手动添加该待训练环境声音对应的分类标签。
在实际应用中,危险环境可以包括多种类型,例如争吵环境、哭闹环境、打架环境等等,因此,危险环境标签又可以进一步包括争吵环境标签、哭闹环境标签、车辆较多环境标签等体现环境危险的标签。当获取待训练环境声音时,为该待训练环境声音添加对应的危险环境标签。
可以理解的是,由于用户所处的环境复杂多变,其所处的环境可能既不属于危险环境,也不属于安全环境,可能为比较陌生的环境。为实现对环境进行全面的识别,可以设置其他环境标签。在实际应用中,为最大程度保护用户的安全,可以将其他环境标签归属于危险环境标签中。
需要说明的是,当环境比较复杂时,获取待训练环境声音中可能包括多种声音类型,为充分利用获取的待训练环境声音,可以为该待训练环境声音添加不同的分类标签。针对待训练环境声音对应多个分类标签时,将该待训练环境声音与该待训练环境声音对应的每个一个分类标签作为一条训练数据。例如,获取的待训练环境声音1中既包括哭闹声音,也包括争吵声音,则将待训练环境声音1与对应的哭闹环境标签作为一条训练数据;将待训练环境声音1与对应的争吵环境标签作为另一条训练数据。
在实际应用时,为保证训练生成的声音分类模型能够准确识别用户当前所述环境类型,可以获取大量的各种类型的待训练环境声音,为获取的每一条待训练环境声音添加对应的分类标签,将每一条待训练环境声音以及该待训练环境声音对应的分类标签作为一条训练数据,从而获得大量的训练数据。
s203:根据训练数据对初始模型进行训练生成声音分类模型。
本实施例中,可以将大量的待训练环境声音以及该待训练环境声音对应的分类标签作为训练数据输入至初始模型中,从而实现对初始模型训练,生成声音分类模型。
其中,初始模型可以为分类模型或深度学习模型。常见的分类模型有随机森林(randomforest)模型、朴素贝叶斯(
由上述实施例可以看出,本申请实施例首先获取待训练环境声音,将该待训练环境声音以及该待训练环境声音对应的分类标签作为训练数据训练初始模型,以获得声音分类模型。可见,本申请实施例在训练生成声音分类模型时,以环境中所产生的声音为依据进行训练。在实际应用时,可以通过获取用户当前所处环境的声音,通过声音分类模型对当前环境声音进行分类。当分类结果为危险环境时,可以向用户所携带的第一终端和/或与第一终端绑定的第二终端发送报警信息,实现智能报警,充分保护用户的安全。
参见图3,该图为本申请实施例提供的另一种生成声音分类模型方法的流程图,该方法可以包括:
s301:获取待训练环境声音。
本实施例中,s301与s201具有相同或相似的实现方案,具体可以参见s201,在此不再赘述。
s302:提取待训练环境声音的音频特征。
本实施例中,当获取待训练环境声音时,针对获取的每一段待训练环境声音,提取该段待训练环境声音的音频特征,该音频特征可以表征该段待训练环境声音的整体特征,区别于其他类型待训练环境声音。
其中,音频特征可以包括帧率、过零率、短时能量等特征。帧率是指单位时间内声音帧的个数,一帧可能包含多个声音样本;过零率是指每帧信号内信号过零的次数,体现的是音频的频率特征;短时能量是指信号在不同时刻的强弱程度。
在具体实现时,可以针对获取的每段待训练环境声音,可以提取一种音频特征,利用该一种音频特征进行训练;也可以提取多种音频特征,利用多种音频特征进行训练。
s303:将待训练环境声音的音频特征以及待训练环境声音对应的分类标签作为训练数据。
本实施例中,由于在获取待训练环境声音的环境类型是已知的,因此可以为获取的待训练环境声音添加对应的分类标签,然后将待训练环境声音的音频特征以及该待训练环境声音对应的分类标签作为训练数据。其中,分类标签包括至少一种危险环境标签或者安全环境标签。
需要说明的是,关于分类标签的相关内容可以参见图2所述方法实施例,本实施例在此不再赘述。
s304:根据训练数据对初始模型进行训练生成声音分类模型。
本实施例中,可以将大量的待训练环境声音的音频特征以及该待训练环境声音对应的分类标签作为训练数据输入至初始模型中,从而实现对初始模型训练,生成声音分类模型。其中,初始模型可以为分类模型或深度学习模型。
由上述实施例可以看出,本申请实施例首先获取待训练环境声音,并提取该待训练环境声音的音频特征,将该待训练环境声音的音频特征以及该待训练环境声音对应的分类标签作为训练数据训练初始模型,以获得声音分类模型。可见,本申请实施例在训练生成声音分类模型时,以环境中所产生的声音为依据进行训练。在实际应用时,可以通过获取用户当前所处环境的声音,提取环境声音的音频特征,通过声音分类模型对当前环境声音进行分类。当分类结果为危险环境时,可以向用户所携带的第一终端和/或与第一终端绑定的第二终端发送报警信息,实现智能报警,充分保护用户的安全。
图2和图3分别说明了两种生成声音分类模型的方法,从而可以生成可以识别环境类型的声音分类模型。下面将结合附图对利用声音分类模型对用户当前所处环境进行识别。
参见图4,该图为本申请实施例提供的一种实现报警的方法流程图,该方法可以包括:
s401:获取第一终端对应的环境声音。
本实施例中,第一终端可以采集其所处环境的声音,并将采集的环境声音发送给服务器,以便服务器可以根据采集到的环境声音识别当前环境类型。
在实际应用中,为保护用户隐私安全,可以先通过第一终端设置采集环境声音的权限。当用户设置为允许获取当前第一终端的环境声音时,才可以进行采集。
s402:将环境声音输入预先训练生成的声音分类模型,获得声音分类模型输出的环境声音的分类结果。
本实施例中,将获取的环境声音输入预先训练生成的声音分类模型,通过该声音分类模型对该环境声音进行分类,得到分类结果。
在具体实现时,当该声音分类模型为通过图2所述方法训练生成时,可以将获取的环境声音直接输入至声音分类模型中,以获得该环境声音的分类结果;当该声音分类模型为通过图3所述方法训练生成时,在输入声音分类模型之前,还需提取该环境声音的音频特征,然后将提取的音频特征输入该声音分类模型中,根据音频特征对该环境声音进行分类,以获得分类结果。
需要说明的是,当利用图3所述方法生成的声音分类模型进行环境声音分类时,提取环境声音的音频特征的类型数量需要与训练生成的声音分类模型的类型数量相同。当训练生成声音分类模型时,提取一种音频特征,则在提取环境声音的音频特征时,也只提取一种音频特征,且与训练时的音频特征类型相同;当训练生成声音分类模型时,提取多种音频特征,则在提取环境声音的音频特征时,也需提取多种音频特征,且提取的音频特征类型与训练时提取的相同,从而保证可以利用训练生成的声音分类模型获得该环境声音的分类结果。
s403:当环境声音的分类结果属于危险环境时,向第一终端和/或第二终端发送报警信息。
本实例中,当利用声音分类模型获得第一终端对应的环境声音的分类结果为危险环境时,可以向第一终端和/或第二终端发送报警信息,以提示用户注意安全,和/或通知用户的亲属当前用户所处环境较为危险,也就是通知预设的其他终端的用户。
在实际应用中,客户端可以根据具体的分类结果采取不同的处理方法,当环境声音的分类结果属于危险环境中车辆较多环境时,可以仅向第一终端发送报警信息,以提示用户注意来往车辆;当环境声音的分类结果属于危险环境中哭闹环境时,可以向第二终端发送报警信息,在提示第二终端用户当前第一终端用户可能处于危险环境中;当环境声音的分类结果属于危险环境中争吵环境时,可以同时向第一终端和第二终端发送报警信息,以提示用户离开当前环境,同时提示第二终端用户当前第一终端用户可能处于危险环境。
需要说明的是,针对不同的环境类别,可以对应不同的策略。其中,关于每种环境类别对应的策略,可以是第一终端出厂时,由厂商进行设置;也可以由第一终端用户根据自身需求进行设置,本实施例在此不做限定。
在一种可能的实现方式中,为准确识别用户当前所处环境的具体状况,还可以对环境声音进行语音识别,获得环境声音的语音识别结果;当语音识别结果中包括预设关键词时,向第一终端和/或第二终端发送报警信息。其中,预设关键词可以包括触发报警关键词和/或表征危险环境关键词。
在实际应用中,当获取第一终端对应的环境声音时,可以将获取的环境声音输入至预先训练生成的声音分类模型,同时对获取的环境声音进行语音识别,以获得该环境声音的语音识别结果。可以理解的是,为充分保护用户的安全,当语音识别结果中包括预设关键词时和/或环境声音的分类结果属于危险环境时,向第一终端和/或第二终端发送报警信息,也就是当满足任意一种报警条件时,则触发自动报警。
其中,预设关键词可以包括触发报警关键词,例如,“赶紧报警”等关键词;还可以包括表征危险环境关键词,例如,“抢劫”、“不许动”、“救命”等可以表征用户所处环境为危险环境的关键词。可以理解的是,语音识别结果中所包括关键词,可以是由第一终端所对应的用户发出,也可以是由第一终端用户所处环境周围人发出,只要获得的环境声音的语音识别结果中包括预设关键词,即可向第一终端和/或第二终端发送报警信息。
可以理解的是,第二终端用户可以为第一终端用户的亲属,也可为维护社会治安的一些安全机构,例如派出所。在实际应用中,为避免对社会公共资源的浪费,通常情况下第二终端用户为第一终端用户的亲属。
通过上述描述,本申请实施例中首先获取用户所处环境的环境声音,并将获取的环境声音输入预先训练生成的声音分类模型,以获得该环境声音的分类结果,当该环境声音的分类结果属于危险环境时,向用户所使用的第一终端和/或与第一终端设备绑定的第二终端设备发送报警信息。也就是,当用户处于危险环境时,无需用户主动触发报警功能,而是根据用户当前所处环境的声音识别出用户处于危险环境,自动向第一终端和/或第二终端发送报警信息,从而实现智能告警,提醒用户注意安全和/或通知用户亲属的目的,进而实现充分保护用户的安全。
基于上述方法实施例,本申请实施例还提供了一种实现报警的装置,下面将结合附图对该装置进行说明。
参见图5,该图为本申请实施例提供的一种实现报警的装置结构图,该装置可以包括:
获取单元501,用于获取第一终端对应的环境声音;
输入单元502,用于将所述环境声音输入预先训练生成的声音分类模型,获得所述声音分类模型输出的所述环境声音的分类结果;
第一发送单元503,用于当所述环境声音的分类结果属于危险环境时,向所述第一终端和/或第二终端发送报警信息。
在一种可能的实现方式中,第一发送单元,包括:获取子单元,用于当所述环境声音的分类结果属于危险环境时,获取所述分类结果对应的处理规则;
发送子单元,用于根据所述处理规则向所述第一终端和/或第二终端发送报警信息。
在一种可能的实现方式中,所述声音分类模型的训练过程包括:
获取待训练环境声音;
将所述待训练环境声音以及所述待训练环境声音对应的分类标签作为训练数据,所述分类标签包括至少一种危险环境标签或者安全环境标签;
根据所述训练数据对初始模型进行训练生成声音分类模型。
在一种可能的实现方式中,所述声音分类模型的训练过程包括:
获取待训练环境声音;
提取所述待训练环境声音的音频特征;
将所述待训练环境声音的音频特征以及所述待训练环境声音对应的分类标签作为训练数据,所述分类标签包括至少一种危险环境标签或者安全环境标签;
根据所述训练数据对初始模型进行训练生成声音分类模型。
在一种可能的实现方式中,所述初始模型为深度学习模型或者分类模型。
在一种可能的实现方式中,所述装置还包括:
提取单元,用于在所述获取单元获取待训练环境声音之后,提取所述环境声音的音频特征;
所述输入单元,具体用于将所述环境声音的音频特征输入预先训练生成的声音分类模型,获得所述声音分类模型输出的所述环境声音的分类结果。
在一种可能的实现方式中,所述装置还包括:
识别单元,用于在所述获取单元获取待训练环境声音之后,对所述环境声音进行语音识别,获得所述环境声音的语音识别结果;
第二发送单元,用于当所述语音识别结果中包括预设关键词时,向所述第一终端和/或第二终端发送报警信息。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图6示出了一种生成视频装置600的框图。例如,装置600可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图6,装置600可以包括以下一个或多个组件:处理组件602,存储器604,电源组件606,多媒体组件608,音频组件610,输入/输出(i/o)的接口612,传感器组件614,以及通信组件616。
处理组件602通常控制装置600的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件602可以包括一个或多个处理器620来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件602可以包括一个或多个模块,便于处理组件602和其他组件之间的交互。例如,处理部件602可以包括多媒体模块,以方便多媒体组件608和处理组件602之间的交互。
存储器604被配置为存储各种类型的数据以支持在设备600的操作。这些数据的示例包括用于在装置600上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器604可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
电源组件606为装置600的各种组件提供电力。电源组件606可以包括电源管理系统,一个或多个电源,及其他与为装置600生成、管理和分配电力相关联的组件。
多媒体组件608包括在所述装置600和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件608包括一个前置摄像头和/或后置摄像头。当设备600处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件610被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(mic),当装置600处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器604或经由通信组件616发送。在一些实施例中,音频组件610还包括一个扬声器,用于输出音频信号。
i/o接口612为处理组件602和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件614包括一个或多个传感器,用于为装置600提供各个方面的状态评估。例如,传感器组件614可以检测到设备600的打开/关闭状态,组件的相对定位,例如所述组件为装置600的显示器和小键盘,传感器组件614还可以检测装置600或装置600一个组件的位置改变,用户与装置600接触的存在或不存在,装置600方位或加速/减速和装置600的温度变化。传感器组件614可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件614还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件614还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件8616被配置为便于装置600和其他设备之间有线或无线方式的通信。装置600可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信部件616经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件616还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。
在示例性实施例中,装置600可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行下述方法:
获取第一终端对应的环境声音;
将所述环境声音输入预先训练生成的声音分类模型,获得所述声音分类模型输出的所述环境声音的分类结果;
当所述环境声音的分类结果属于危险环境时,向所述第一终端和/或第二终端发送报警信息。
可选的,所述当所述环境声音的分类结果属于危险环境时,向所述第一终端和/或第二终端发送报警信息,包括:
当所述环境声音的分类结果属于危险环境时,获取所述分类结果对应的处理规则;
根据所述处理规则向所述第一终端和/或第二终端发送报警信息。
可选的,所述声音分类模型的训练过程包括:
获取待训练环境声音;
将所述待训练环境声音以及所述待训练环境声音对应的分类标签作为训练数据,所述分类标签包括至少一种危险环境标签或者安全环境标签;
根据所述训练数据对初始模型进行训练生成声音分类模型。
可选的,所述声音分类模型的训练过程包括:
获取待训练环境声音;
提取所述待训练环境声音的音频特征;
将所述待训练环境声音的音频特征以及所述待训练环境声音对应的分类标签作为训练数据,所述分类标签包括至少一种危险环境标签或者安全环境标签;
根据所述训练数据对初始模型进行训练生成声音分类模型。
可选的,所述初始模型为深度学习模型或者分类模型。
可选的,获取第一终端对应的环境声音后,所述方法还包括:
提取所述环境声音的音频特征;
所述将所述环境声音输入预先训练生成的声音分类模型,获得所述声音分类模型输出的所述环境声音的分类结果,包括:
将所述环境声音的音频特征输入预先训练生成的声音分类模型,获得所述声音分类模型输出的所述环境声音的分类结果。
可选的,获取第一终端对应的环境声音后,所述方法还包括:
对所述环境声音进行语音识别,获得所述环境声音的语音识别结果;
当所述语音识别结果中包括预设关键词时,向所述第一终端和/或第二终端发送报警信息。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器604,上述指令可由装置600的处理器620执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种输入方法,所述方法包括:
获取第一终端对应的环境声音;
将所述环境声音输入预先训练生成的声音分类模型,获得所述声音分类模型输出的所述环境声音的分类结果;
当所述环境声音的分类结果属于危险环境时,向所述第一终端和/或第二终端发送报警信息。
可选的,所述当所述环境声音的分类结果属于危险环境时,向所述第一终端和/或第二终端发送报警信息,包括:
当所述环境声音的分类结果属于危险环境时,获取所述分类结果对应的处理规则;
根据所述处理规则向所述第一终端和/或第二终端发送报警信息。
可选的,所述声音分类模型的训练过程包括:
获取待训练环境声音;
将所述待训练环境声音以及所述待训练环境声音对应的分类标签作为训练数据,所述分类标签包括至少一种危险环境标签或者安全环境标签;
根据所述训练数据对初始模型进行训练生成声音分类模型。
可选的,所述声音分类模型的训练过程包括:
获取待训练环境声音;
提取所述待训练环境声音的音频特征;
将所述待训练环境声音的音频特征以及所述待训练环境声音对应的分类标签作为训练数据,所述分类标签包括至少一种危险环境标签或者安全环境标签;
根据所述训练数据对初始模型进行训练生成声音分类模型。
可选的,所述初始模型为深度学习模型或者分类模型。
可选的,获取第一终端对应的环境声音后,所述方法还包括:
提取所述环境声音的音频特征;
所述将所述环境声音输入预先训练生成的声音分类模型,获得所述声音分类模型输出的所述环境声音的分类结果,包括:
将所述环境声音的音频特征输入预先训练生成的声音分类模型,获得所述声音分类模型输出的所述环境声音的分类结果。
可选的,获取第一终端对应的环境声音后,所述方法还包括:
对所述环境声音进行语音识别,获得所述环境声音的语音识别结果;
当所述语音识别结果中包括预设关键词时,向所述第一终端和/或第二终端发送报警信息。
图7是本发明实施例中服务器的结构示意图。该服务器700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessingunits,cpu)722(例如,一个或一个以上处理器)和存储器732,一个或一个以上存储应用程序742或数据744的存储介质730(例如一个或一个以上海量存储设备)。其中,存储器732和存储介质730可以是短暂存储或持久存储。存储在存储介质730的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器722可以设置为与存储介质730通信,在服务器700上执行存储介质730中的一系列指令操作。
终端700还可以包括一个或一个以上电源726,一个或一个以上有线或无线网络接口750,一个或一个以上输入输出接口758,一个或一个以上键盘756,和/或,一个或一个以上操作系统741,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm等等。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统或装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:只存在a,只存在b以及同时存在a和b三种情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
1.一种实现报警的方法,其特征在于,所述方法包括:
获取第一终端对应的环境声音;
将所述环境声音输入预先训练生成的声音分类模型,获得所述声音分类模型输出的所述环境声音的分类结果;
当所述环境声音的分类结果属于危险环境时,向所述第一终端和/或第二终端发送报警信息。
2.根据权利要求1所述的方法,其特征在于,所述当所述环境声音的分类结果属于危险环境时,向所述第一终端和/或第二终端发送报警信息,包括:
当所述环境声音的分类结果属于危险环境时,获取所述分类结果对应的处理规则;
根据所述处理规则向所述第一终端和/或第二终端发送报警信息。
3.根据权利要求1所述的方法,其特征在于,所述声音分类模型的训练过程包括:
获取待训练环境声音;
将所述待训练环境声音以及所述待训练环境声音对应的分类标签作为训练数据,所述分类标签包括至少一种危险环境标签或者安全环境标签;
根据所述训练数据对初始模型进行训练生成声音分类模型。
4.根据权利要求1所述的方法,其特征在于,所述声音分类模型的训练过程包括:
获取待训练环境声音;
提取所述待训练环境声音的音频特征;
将所述待训练环境声音的音频特征以及所述待训练环境声音对应的分类标签作为训练数据,所述分类标签包括至少一种危险环境标签或者安全环境标签;
根据所述训练数据对初始模型进行训练生成声音分类模型。
5.根据权利要求3或4所述的方法,其特征在于,所述初始模型为深度学习模型或者分类模型。
6.根据权利要求4所述的方法,其特征在于,获取第一终端对应的环境声音后,所述方法还包括:
提取所述环境声音的音频特征;
所述将所述环境声音输入预先训练生成的声音分类模型,获得所述声音分类模型输出的所述环境声音的分类结果,包括:
将所述环境声音的音频特征输入预先训练生成的声音分类模型,获得所述声音分类模型输出的所述环境声音的分类结果。
7.根据权利要求1所述的方法,其特征在于,获取第一终端对应的环境声音后,所述方法还包括:
对所述环境声音进行语音识别,获得所述环境声音的语音识别结果;
当所述语音识别结果中包括预设关键词时,向所述第一终端和/或第二终端发送报警信息。
8.一种实现报警的装置,其特征在于,所述装置包括:
获取单元,用于获取第一终端对应的环境声音;
输入单元,用于将所述环境声音输入预先训练生成的声音分类模型,获得所述声音分类模型输出的所述环境声音的分类结果;
第一发送单元,用于当所述环境声音的分类结果属于危险环境时,向所述第一终端和/或第二终端发送报警信息。
9.一种用于实现报警的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取第一终端对应的环境声音;
将所述环境声音输入预先训练生成的声音分类模型,获得所述声音分类模型输出的所述环境声音的分类结果;
当所述环境声音的分类结果属于危险环境时,向所述第一终端和/或第二终端发送报警信息。
10.一种计算机可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至7中一个或多个所述的实现报警的方法。
技术总结