一种信息识别方法、装置及设备与流程

专利2022-06-29  73


本申请属于信息处理领域,尤其涉及一种信息识别方法、装置及设备。



背景技术:

随着移动互联网的发展,人与人的沟通也变得越来越方便,除了传统的面对面交流外,可以方便的使用智能设备发送文字、图片、语音或者视频等内容,使得人们在进行沟通时可以不受距离的限制。

由于通信技术的发展,使得智能移动终端也变得十分普及,越来越多的老年人也开始使用移动智能终端,比如智能手机或智能平板等。由于老年人对于风险的防患意识不强,不法分子可能会向老年人所使用的智能移动终端发送欺诈信息,使得老年人由于轻信欺诈信息内容,造成精神损害,财产操作,甚至对身体和全命造成损害。如果仅用诈骗关键字对信息进行识别,则可能无法对诈骗信息进行全局有效的识别。



技术实现要素:

有鉴于此,本申请实施例提供了一种信息识别方法、装置及设备,以解决现有技术中无法对诈骗信息进行全局有效的识别的问题。

本申请实施例的第一方面提供了一种信息识别方法,所述信息识别方法包括:

通过预设的过滤特征,对接收的信息进行过滤;

获取过滤后的信息的场景数据,将所述场景数据代入预先训练的神经网络模型,输出所述信息的标签;

根据过滤结果和/或神经网络模型输出的信息的标签,生成提醒信息。

结合第一方面,在第一方面的第一种可能实现方式中,所述通过预设的过滤特征,对接收的信息进行过滤的步骤包括以下一种或者多种:

如果检测到信息的发送号码为预先设定的号码黑名单中的号码,则过滤掉该信息;

如果检测到信息中包括预先设定的网址黑名单中的网址,则过滤掉该信息;

计算信息中的文本内容与预先设定的虚假信息库中的信息的相似度,如果相似度大于预定的阈值,则过滤掉该信息;

识别信息中的图片或视频中包括的文字内容,计算文本内容与预先设定的虚假信息库中的信息的相似度,如果相似度大于预定的阈值,则过滤掉该信息;

将信息中的图片,或者信息中的视频的图像帧中的图像与预先设定的有害图像特征进行匹配,如果检测图片或者视频中包括有害图像特征,则过滤掉该信息;

获取信息中包括的图片或者视频的统一资源定位符uri,如果所述统一资源定位符uri属于预先设定的网址黑名单中的网址,则过滤掉该信息。

结合第一方面,在第一方面的第二种可能实现方式中,所述获取过滤后的信息的场景数据的步骤包括:

获取所述过滤后的信息的发送者与用户的对话场景内容;

如果所述对话场景内容中包括语音、图片或视频,则将所述语音、图片或视频转换为文字;

根据信息中的文字内容、转换后的文字,根据时间顺序生成文字序列。

结合第一方面,在第一方面的第三种可能实现方式中,所述将所述场景数据代入预先训练的神经网络模型,输出所述信息的标签的步骤包括:

通过文本分词方法去除场景数据中的文字内容中的停用词,将文本特征向量化;

将向量化的所述文本特征输入预先通过正负样本训练后的神经网络模型,输出所述信息的标签识别结果。

结合第一方面,在第一方面的第四种可能实现方式中,在获取过滤后的信息的场景数据,将所述场景数据代入预先训练的神经网络模型,输出所述信息的标签的步骤之前,所述方法还包括:

判断当前是否触发敏感特征,所述敏感特征包括调用金融类应用程序,和/或调用支付安全的进程。

结合第一方面,在第一方面的第五种可能实现方式中,所述根据过滤结果和/或神经网络模型输出的信息的标签,生成提醒信息的步骤包括:

当通过预设的过滤特征过滤掉信息时,则输出第一层级的告警信息;

当通过神经网络模型输出虚假信息的标签时,则输出第二层级的告警信息,所述第二层级的告警信息的严重程度高于第一层级的告警信息的严重程度。

结合第一方面,在第一方面的第六种可能实现方式中,所述根据过滤结果和/或神经网络模型输出的信息的标签,生成提醒信息的步骤包括::

当通过神经网络模型输出虚假信息的标签时,则锁定屏幕当前的告警信息,并将当前的场景数据发送至绑定的子女移动终端。

本申请实施例的第二方面提供了一种信息识别装置,所述信息识别装置包括:

过滤单元,用于通过预设的过滤特征,对接收的信息进行过滤;

神经网络模型识别单元,用于获取过滤后的信息的场景数据,将所述场景数据代入预先训练的神经网络模型,输出所述信息的标签;

提醒单元,用于根据过滤结果和/或神经网络模型输出的信息的标签,生成提醒信息。

本申请实施例的第三方面提供了一种信息识别设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面任一项所述信息识别方法的步骤。

本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如第一方面任一项所述信息识别方法的步骤。

本申请实施例与现有技术相比存在的有益效果是:通过预设的过滤特征对信息过滤后,进一步获取过滤的信息的场景数据,并将场景数据代入预先训练的神经网络模型进行计算,输出信息的识别结果的标签,根据过滤和/或识别结果的标签生成提醒信息,从而能够对诈骗信息进行全局有效的识别,提高诈骗信息的识别的准确度。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种信息识别方法的实现流程示意图;

图2是本申请实施例提供的一种对接收的信息进行过滤的实现示意图;

图3是本申请实施例提供的一种输出信息的标签的实现流程示意图;

图4是本申请实施例提供的一种提醒信息界面示意图;

图5是本申请实施例提供的一种信息识别装置的示意图;

图6是本申请实施例提供的信息识别设备的示意图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。

为了说明本申请所述的技术方案,下面通过具体实施例来进行说明。

图1为本申请实施例提供的一种信息识别方法的实现流程示意图,详述如下:

在步骤s101中,通过预设的过滤特征,对接收的信息进行过滤;

具体的,所述过滤特征可以包括一种或者多种,根据信息的不同,可以匹配不同类型的过滤特征。如果信息的来源是手机号码,则可以根据信息的来源选号码黑名单作为过滤特征;如果信息中包括网址,则可以根据网址数据库作为过滤特征;如果信息为文字信息,则可以选择虚假信息库中的信息作为过滤特征;如果信息中包括语音、图片或者视频,则可以提取语音、图片或者视频中的文字,采用虚假信息库中的信息作为过滤特征,或者也可以通过图像特征直接与图片或者视频中的图像直接进行比对;或者如果图片或者视频对应有统一资源定位符url,则也可以采用网址数据库作为过滤特征。

因此,通过预设的过滤特征,对接收的信息进行过滤的步骤可以如图2所示,包括以下过滤方式中的一种或者几种:

201,如果检测到信息的发送号码为预先设定的号码黑名单中的号码,则过滤掉该信息;

其中,所述号码黑名单用于记录用于诈骗的号码,可以根据用户的举报信息,不断的对所述号码黑名单进行完善。所述信息的发送号码,可以为发送手机短信息的手机号码,也可以为发送即时通信信息的账号等。通过设定号码黑名单的方式,将信息的发送号码与号码黑名单中的号码进行比较,确定当前信息是否合法。

202,如果检测到信息中包括预先设定的网址黑名单中的网址,则过滤掉该信息;

在部分信息中可能会包括网址,比如购买商品后,会将商品的服务信息发送给用户,而发送给用户的服务信息中可能包括网址。而部分诈骗信息中也会包括钓鱼网址。因此,为了有效的识别诈骗信息,可以预先设定网址黑名单,通过网址黑名单对信息中包括的网址进行过滤,从而有效的筛选出有害信息。

203,计算信息中的文本内容与预先设定的虚假信息库中的信息的相似度,如果相似度大于预定的阈值,则过滤掉该信息;

对于文本信息,可以将文本信息与虚假信息库中的信息进行相似度的计算,从而确定信息是否为虚假信息。

互联网上的谣言虽冗杂,但大部分有根源,多是已有谣言更改几个字(如更改时间、地点等)而来。根据谣言的这个特点,可以通过判断文本相似度的tf-idf(词频-逆文本频率指数)方法,通过该方法计算文本中每一个词项的tf-idf值,然后再利用这些值为每一个文本建立向量模型,通过计算向量间的余弦相似度来确定移动终端显示的文本与虚假信息库,比如可以为服务器端的“中文谣言库”(由清华大学自然语言处理与社会人文计算实验室收集整理的谣言数据库,目标是收集中文社交媒体平台中广泛传播的谣言案例)之间的相似性。一旦判断文本内容含有谣言信息,则可以唤醒提醒求助模块。

204,识别信息中的图片或视频中包括的文字内容,计算文本内容与预先设定的虚假信息库中的信息的相似度,如果相似度大于预定的阈值,则过滤掉该信息;

如果信息中包括多媒体信息,比如信息中包括图片、视频,可以通过ocr(光学字符识别)的方式提取图片或视频中的文字内容,对提取的文本内容进行检测时,可以基于203所述的文本内容检测方法,判断图片或视频中的内容是否包括谣言。

205,将信息中的图片,或者信息中的视频的图像帧中的图像与预先设定的有害图像特征进行匹配,如果检测图片或者视频中包括有害图像特征,则过滤掉该信息;

或者,当信息中的图片、视频中不包括文本内容,或者图片、视频中包括的文本内容不是谣言或诈骗内容时,还可以进一步对图片或视频进行图像特征检测,确定图片或者视频中是否包括有害图像特征。

其中,所述有害图像特征可以预先设定,并且可以根据确定的诈骗信息中学习和完善有害图像特征。其中,视频中的图像,可以随机截取视频画面的方式,来获取视频中的图像。

206,获取信息中包括的图片或者视频的统一资源定位符uri,如果所述统一资源定位符uri属于预先设定的网址黑名单中的网址,则过滤掉该信息。

当信息中包括多媒体资源的统一资源定位符url时,则可以根据预先设定的网址黑名单,对信息中的多媒体资源的url进行检测,确定信息中的多媒体的来源是否合法。

在步骤s102中,获取过滤后的信息的场景数据,将所述场景数据代入预先训练的神经网络模型,输出所述信息的标签;

通过步骤s101对信息进行初步的拦截或过滤后,可以对信息中包括较为明显的欺诈或者虚假信息过滤,但是,如果欺诈者冒充熟人进行诈骗时,则需要通过步骤s102进一步对信息进行识别。

作为本申请优选的一种实施方式中,在步骤s102之前,还可以检测当前是否满足步骤s102的触发条件,其中,所述触发条件可以为支付类的应用程序的调用,比如信息收发应用对金融类应用(银行app)或支付类应用(微信支付、支付宝支付)的调用,还可以包括支付所调用的关键进程,比如指纹识别传感器或者保密键盘输入密码等进程,当检测到调用预先设定的支付调用的关键进程时,则触发步骤s102,对信息进行进一步检测。

在本步骤中,可以根据过滤后的信息获取场景数据,并可将场景数据代入训练后的神经网络模型,输出信息所在的场景数据的标签,所述标签可以为正面标签或负面标签,或者表示为正常信息标签或非正常信息的标签。具体可以如图3所示,包括:

在步骤s301中,获取所述过滤后的信息的发送者与用户的对话场景内容;

可以实时的记录用户所接收到的信息,或者用户接收到和发送的信息。当用户接收的信息过滤后,或者进一步符合触发条件时,可以提取过滤后的信息所对应的场景数据。

所述场景数据包括用户与信息发送方的沟通内容,信息的收发时间。一般的,可以将用户与一个信息发送方的信息收发内容作为场景数据。当信息内容中包括第三方的名称、号码时,则可以将第三方的沟通内容合并为一个场景数据。

在步骤s302中,如果所述对话场景内容中包括语音、图片或视频,则将所述语音、图片或视频转换为文字;

获取到场景数据后,可以对场景数据中的图片、语音和视频进行转换,可以通过asr(语音识别技术)将语音转换为文字,通过ocr(光学字符识别)将图片或视频转换为文字.

在步骤s303中,根据信息中的文字内容、转换后的文字,根据时间顺序生成文字序列。

将场景数据中的多媒体转换为文字后,可以将信息中本来的文字、转换后的文字,按照时间顺序生成文字序列,或者,当场景数据中不包括多媒体信息时,也可以直接将场景数据中的这也按照时间顺序生成文字序列,从而完成对场景数据的提取和预处理操作。

在步骤s304中,通过文本分词方法去除场景数据中的文字内容中的停用词,将文本特征向量化;

在提取到场景数据后,可以对场景数据的文字进一步进行特征提取,比如可以使用文本分词技术生成词曲,对文本去停用词,对提取到的文本向量化处理。

在步骤s305中,将向量化的所述文本特征输入预先通过正负样本训练后的神经网络模型,输出所述信息的标签识别结果。

比如,所述循环神经网络模型的结构可以采用双向lstm长短期记忆网络,可以共设置两层,每层的单元大小可以设为128,模型将前一时刻的输出和前一时刻的隐层向量作拼接,当作后一时刻的输入。模型可以构建embedding层来进行文本预处理,使用文本分词技术生成词典,对文本去停用词,通过文本特征提取技术得到embedding矩阵,根据embedding矩阵和词典将输入数据文本向量化;然后模型对提取的每一时刻隐层向量作attention注意力集中机制,attention注意力集中机制是一个相似性度量,从而确保有用的细节信息得以保留;最后模型可以使用softmax进行分类,输出1或0的正负样本。

在步骤s103中,根据过滤结果和/或神经网络模型输出的信息的标签,生成提醒信息。

在本申请中,可以只根据神经网络模型的输入信息生成告警信息,也可以根据神经网络模型和过滤结果生成告警信息,比如可以:

当通过预设的过滤特征过滤掉信息时,则输出第一层级的告警信息;

当通过神经网络模型输出虚假信息的标签时,则输出第二层级的告警信息,所述第二层级的告警信息的严重程度高于第一层级的告警信息的严重程度。

如图4所示,当采用第一层级的告警信息时,可以为左图中的弹窗提醒,弹窗仅告知用户浏览的信息存在谣言内容,弹窗设置“我已了解”和“一键求助”两个按钮,用户点击“我已了解”即可关闭弹窗并继续正常使用移动终端;对于第二层级的告警信息,可以采用醒目弹窗警告,醒目弹窗会占据整个屏幕,弹窗设置“拨打电话”和“一键求助”两个按钮,并且锁定屏屏幕所显示的内容,用户不得关闭,移动终端仅保留拨打电话功能(包含通讯录和最近联系人)。

在第二层级告警信息下,用户可以点击“一键求助”按钮,将当前与告警事件有关的内容(聊天对话等)打包发送给预设的子女移动终端,子女可以查看事件过程并劝导父母,也可远程为父母解锁。从而能够及时有效的发现欺诈信息,阻止欺诈行为。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。

图5为本申请实施例提供的一种信息识别装置的结构示意图,所述信息识别装置包括:

过滤单元501,用于通过预设的过滤特征,对接收的信息进行过滤;

神经网络模型识别单元502,用于获取过滤后的信息的场景数据,将所述场景数据代入预先训练的神经网络模型,输出所述信息的标签;

提醒单元503,用于根据过滤结果和/或神经网络模型输出的信息的标签,生成提醒信息。

上述信息识别装置,与图1中的信息识别方法对应。

图6是本申请一实施例提供的信息识别设备的示意图。如图6所示,该实施例的信息识别设备6包括:处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机程序62,例如信息识别程序。所述处理器60执行所述计算机程序62时实现上述各个信息识别方法实施例中的步骤,例如图1所示的步骤101至103。或者,所述处理器60执行所述计算机程序62时实现上述各装置实施例中各模块/单元的功能,例如图5所示模块501至503的功能。

示例性的,所述计算机程序62可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器61中,并由所述处理器60执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序62在所述信息识别设备6中的执行过程。例如,所述计算机程序62可以被分割成过滤单元、神经网络模型识别单元和提醒单元,各单元具体功能如下:

过滤单元,用于通过预设的过滤特征,对接收的信息进行过滤;

神经网络模型识别单元,用于获取过滤后的信息的场景数据,将所述场景数据代入预先训练的神经网络模型,输出所述信息的标签;

提醒单元,用于根据过滤结果和/或神经网络模型输出的信息的标签,生成提醒信息。

所述信息识别设备6可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述信息识别设备可包括,但不仅限于,处理器60、存储器61。本领域技术人员可以理解,图6仅仅是信息识别设备6的示例,并不构成对信息识别设备6的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述信息识别设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器60可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器61可以是所述信息识别设备6的内部存储单元,例如信息识别设备6的硬盘或内存。所述存储器61也可以是所述信息识别设备6的外部存储设备,例如所述信息识别设备6上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,所述存储器61还可以既包括所述信息识别设备6的内部存储单元也包括外部存储设备。所述存储器61用于存储所述计算机程序以及所述信息识别设备所需的其他程序和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。

以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。


技术特征:

1.一种信息识别方法,其特征在于,所述信息识别方法包括:

通过预设的过滤特征,对接收的信息进行过滤;

获取过滤后的信息的场景数据,将所述场景数据代入预先训练的神经网络模型,输出所述信息的标签;

根据过滤结果和/或神经网络模型输出的信息的标签,生成提醒信息。

2.根据权利要求1所述的信息识别方法,其特征在于,所述通过预设的过滤特征,对接收的信息进行过滤的步骤包括以下一种或者多种:

如果检测到信息的发送号码为预先设定的号码黑名单中的号码,则过滤掉该信息;

如果检测到信息中包括预先设定的网址黑名单中的网址,则过滤掉该信息;

计算信息中的文本内容与预先设定的虚假信息库中的信息的相似度,如果相似度大于预定的阈值,则过滤掉该信息;

识别信息中的图片或视频中包括的文字内容,计算文本内容与预先设定的虚假信息库中的信息的相似度,如果相似度大于预定的阈值,则过滤掉该信息;

将信息中的图片,或者信息中的视频的图像帧中的图像与预先设定的有害图像特征进行匹配,如果检测图片或者视频中包括有害图像特征,则过滤掉该信息;

获取信息中包括的图片或者视频的统一资源定位符uri,如果所述统一资源定位符uri属于预先设定的网址黑名单中的网址,则过滤掉该信息。

3.根据权利要求1所述的信息识别方法,其特征在于,所述获取过滤后的信息的场景数据的步骤包括:

获取所述过滤后的信息的发送者与用户的对话场景内容;

如果所述对话场景内容中包括语音、图片或视频,则将所述语音、图片或视频转换为文字;

根据信息中的文字内容、转换后的文字,根据时间顺序生成文字序列。

4.根据权利要求1或3所述的信息识别方法,其特征在于,所述将所述场景数据代入预先训练的神经网络模型,输出所述信息的标签的步骤包括:

通过文本分词方法去除场景数据中的文字内容中的停用词,将文本特征向量化;

将向量化的所述文本特征输入预先通过正负样本训练后的神经网络模型,输出所述信息的标签识别结果。

5.根据权利要求1所述的信息识别方法,其特征在于,在获取过滤后的信息的场景数据,将所述场景数据代入预先训练的神经网络模型,输出所述信息的标签的步骤之前,所述方法还包括:

判断当前是否触发敏感特征,所述敏感特征包括调用金融类应用程序,和/或调用支付安全的进程。

6.根据权利要求1所述的信息识别方法,其特征在于,所述根据过滤结果和/或神经网络模型输出的信息的标签,生成提醒信息的步骤包括:

当通过预设的过滤特征过滤掉信息时,则输出第一层级的告警信息;

当通过神经网络模型输出虚假信息的标签时,则输出第二层级的告警信息,所述第二层级的告警信息的严重程度高于第一层级的告警信息的严重程度。

7.根据权利要求6所述的信息识别方法,其特征在于,所述根据过滤结果和/或神经网络模型输出的信息的标签,生成提醒信息的步骤包括::

当通过神经网络模型输出虚假信息的标签时,则锁定屏幕当前的告警信息,并将当前的场景数据发送至绑定的子女移动终端。

8.一种信息识别装置,其特征在于,所述信息识别装置包括:

过滤单元,用于通过预设的过滤特征,对接收的信息进行过滤;

神经网络模型识别单元,用于获取过滤后的信息的场景数据,将所述场景数据代入预先训练的神经网络模型,输出所述信息的标签;

提醒单元,用于根据过滤结果和/或神经网络模型输出的信息的标签,生成提醒信息。

9.一种信息识别设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述信息识别方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述信息识别方法的步骤。

技术总结
一种信息识别方法包括:通过预设的过滤特征,对接收的信息进行过滤;获取过滤后的信息的场景数据,将所述场景数据代入预先训练的神经网络模型,输出所述信息的标签;根据过滤结果和/或神经网络模型输出的信息的标签,生成提醒信息。能够对诈骗信息进行全局有效的识别,提高诈骗信息的识别的准确度。

技术研发人员:陈笠鸥;赵向军
受保护的技术使用者:TCL集团股份有限公司
技术研发日:2018.12.03
技术公布日:2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-23835.html

最新回复(0)