本发明涉及图像识别技术领域,具体涉及一种图文转换的方法及系统。
背景技术:
随着互联网技术的发展,各种社交软件也不断被推出。用户在使用社交软件的过程中,通常会使用图片上传功能。
用户在上传图片后,大多需要为上传的图片添加合适的描述语句,但是用户可能由于各种原因,无法准确找到符合上传的图片的描述语句。
技术实现要素:
有鉴于此,本发明实施例提供一种图文转换的方法及系统,以解决用户无法准确找到符合上传的图片的描述语句的问题。
为实现上述目的,本发明实施例提供如下技术方案:
本发明实施例第一方面公开一种图文转换的方法,所述方法包括:
获取待转换图片;
基于图像识别工具,获取所述待转换图片对应的关键词;
将所述关键词录入搜索引擎,获取所述关键词与预设的语料库中每一语句的相关度;
将相关度达到阈值的所述语句显示给用户。
优选的,所述基于图像识别工具,获取所述待转换图片对应的关键词,包括:
基于图像识别工具,识别所述待转换图片,得到构成所述待转换图片的元素;
根据每一所述元素的特征信息,获取每一所述元素对应的关键词。
优选的,构建所述语料库的过程包括:
获取多条语句;
将每一所述语句进行分词处理,得到每一所述语句的分词结果和权重;
将每一所述语句对应的分词结果和权重存储至搜索引擎对应的语料库中。
优选的,所述将相关度达到阈值的所述语句显示给用户,包括:
按照相关度由高至低的顺序,将相关度达到阈值的所述语句进行排序;
将排序后的相关度达到阈值的所述语句显示给用户。
优选的,所述将相关度达到阈值的所述语句显示给用户,包括:
利用每一所述语句的权重,对相关度达到阈值的所述语句进行打分,得到相关度达到阈值的所述语句的分数;
按照分数由高至低的顺序,将相关度达到阈值的所述语句进行排序;
将排序后的相关度达到阈值的所述语句显示给用户。
优选的,所述获取所述关键词与预设的语料库中每一语句的相关度之前,还包括:
若所述关键词为英文,将所述关键词翻译成中文。
本发明实施例第二方面公开一种图文转换的系统,所述系统包括:
第一获取单元,用于获取待转换图片;
第二获取单元,用于基于图像识别工具,获取所述待转换图片对应的关键词;
第三获取单元,用于将所述关键词录入搜索引擎,获取所述关键词与预设的语料库中每一语句的相关度;
显示单元,用于将相关度达到阈值的所述语句显示给用户。
优选的,所述第二获取单元包括:
识别模块,用于基于图像识别工具,识别所述待转换图片,得到构成所述待转换图片的元素;
获取模块,用于根据每一所述元素的特征信息,获取每一所述元素对应的关键词。
优选的,所述第三获取单元包括:
获取模块,用于获取多条语句;
分词模块,用于将每一所述语句进行分词处理,得到每一所述语句的分词结果和权重;
存储模块,用于将每一所述语句对应的分词结果和权重存储至搜索引擎对应的语料库中。
优选的,所述显示单元包括:
处理模块,用于按照相关度由高至低的顺序,将相关度达到阈值的所述语句进行排序;
显示模块,用于将排序后的相关度达到阈值的所述语句显示给用户。
基于上述本发明实施例提供的一种图文转换的方法及系统,该方法包括:获取待转换图片;基于图像识别工具,获取待转换图片对应的关键词;将关键词录入搜索引擎,获取关键词与预设的语料库中每一语句的相关度;将相关度达到阈值的语句显示给用户。本方案中,利用图像识别工具获取待转换图片对应的关键词,并通过搜索引擎获取关键词与语料库中每一语句的相关度。将相关度达到阈值的语句显示给用户,以供用户选择符合待转换图片的描述语句,从而避免用户上传图片后无法找到合适的描述语句。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种图文转换的方法的流程图;
图2为本发明实施例提供的构建语料库的流程图;
图3为本发明实施例提供的将相关度达到阈值的语句显示给用户的流程图;
图4为本发明实施例提供的一种图文转换的系统的结构框图;
图5为本发明实施例提供的另一种图文转换的系统的结构框图;
图6为本发明实施例提供的又一种图文转换的系统的结构框图;
图7为本发明实施例提供的又一种图文转换的系统的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
由背景技术可知,目前用户在上传图片后,通常需要为图片添加合适的描述语句,但是可能由于各种原因,用户不能准确找到符合上传的图片的描述语句。
因此,本发明实施例提供一种图文转换的方法及系统,利用图像识别工具获取待转换图片对应的关键词,并通过搜索引擎获取关键词与语料库中每一语句的相关度。将相关度达到阈值的语句显示给用户,从而避免用户上传图片后无法找到合适的描述语句。
需要说明的是,本发明实施例中所涉及的图文转换的方法及系统,不仅仅适用于社交领域,还可以适用于广告、公关和海报等文创领域。也就是说,在文创领域,用户在上传图片后,也可采用本发明实施例所涉及的图文转换的方法,为所上传的图片匹配相应的语句并显示给用户,以供用户选择。
参见图1,示出了本发明实施例提供的一种图文转换的方法的流程图,该方法包括以下步骤:
步骤s101:获取待转换图片。
可以理解的是,所获取的待转换图片为用户上传的图片,用户上传待转换图片的方式为:用户可以从设备终端中的相册选择并上传图片,用户也可以利用设备终端进行拍照并将照片上传。
需要说明的是,用户也可通过其它方式获取并上传待转换图片,并不仅限于从相册选择待转换图片和拍照获得待转换图片这两种方式,对于其它方式就不一一举例赘述。
步骤s102:基于图像识别工具,获取待转换图片对应的关键词。
在具体实现步骤s102的过程中,基于图像识别工具,识别待转换图片,得到构成待转换图片的元素,根据每一元素的特征信息,获取每一元素对应的关键词。
可以理解的是,图像识别工具为具有图像识别功能的工具,例如googlecloudvisionapi。
需要说明的是,googlecloudvisionapi搭载智能机器学习系统“tensorflow”,能将图片分到数千种类别中,并且能够侦测图片中人脸的相关情绪,以及侦测图片上的文字和元素等信息。
在识别待转换图片的过程中,利用图像识别工具,识别构成待转换图片的主题、色彩和特征等元素,并根据每个元素的特性信息获取该元素的关键词。例如:假设用户上传的待转换图片为天空的照片,利用图像识别工具,识别构成该待转换图片的元素为云朵、天空、蓝色和晴天等,也就是说,识别待转换图片所得到的关键词为“云朵”、“天空”、“蓝色”和“晴天”。
可以理解的是,上述关于识别待转换图片的示例仅用于举例说明,当待转换图片中包含人脸信息和文字信息等其它类型的信息,利用图像识别工具也可识别出人脸信息中的情绪和识别出文字信息中的文字,并获取识别得到的情绪和文字对应的关键词。例如:假设待转换图片中包含的元素之一为开怀大笑的人脸信息,利用图像识别工具可识别出待转换图片中对应的关键词为“开心”。
需要说明的是,不同国家对应的图像识别工具的使用语言可能不同,也就是说,利用图像识别工具所获取的待转换图片对应的关键词不一定符合用户当前所使用的语种。比如:用户当前所使用的语种为中文,图像识别工具所获取的待转换图片对应的关键词为英文,则将关键词翻译成中文。
又例如:用户当前所使用的语种为法语,图像识别工具所获取的待转换图片对应的关键词为中文,则将关键词翻译成法语。
可以理解的是,若图像识别工具所获取的待转换图片对应的关键词符合用户当前所使用的语种,则不需要对关键词进行翻译。
需要说明的是,若需要对关键词进行翻译,可利用开源翻译词库,将关键词翻译成相应的语种。
步骤s103:将关键词录入搜索引擎,获取关键词与预设的语料库中每一语句的相关度。
需要说明的是,预先收集大量的语句,利用所收集的大量语句构建语料库。
可以理解的是,针对不同的应用领域,收集各应用领域所对应的语句,例如对于社交领域,用户在上传图片时通常需要使用有意境且优美的语句描述自己所上传的图片。在构建语料库时,需要预先收集大量的优美语句,利用大量的优美语句构建相应的语料库。
又例如对于海报领域,用户在上传图片时需要使用合适的语句描述海报的主题。在构建语料库时,需要预先收集大量的海报用语,利用大量的海报用语构建相应的语料库。
在具体实现步骤s103的过程中,将上述步骤所获取的关键词输入搜索引擎,使搜索引擎从预先构建好的语料库中进行搜索,获取关键词与语料库中每一语句的相关度(也可称为相关性)。
需要说明的是,获取关键词和语句的相关度的指标为词频和密度,在通常情况下,关键词的密度和该关键词在语句中出现的次数成正相关,出现的次数越多说明密度越多,该关键词与语句的相关度越高。
进一步需要说明的是,上述所涉及的搜索引擎的类型包括但不仅限于elasticsearch,对于其它与elasticsearch功能相似的搜索引擎也同样适用于本发明实施例所涉及的方案。
在利用搜索引擎的过程中,将所有的关键词输入搜索引擎,搜索引擎检索语料库中的语句,按照与关键词的相关度对语句进行倒排。
步骤s104:将相关度达到阈值的语句显示给用户。
在具体实现步骤s104的过程中,按照相关度由高至低的顺序,将相关度达到阈值的语句进行排序,将排序后的相关度达到阈值的语句显示给用户,以供用户进行选择。
可以理解的是,上述排序顺序也可以为相关度由低至高的顺序,在此不做限定。
也就是说,将与关键词相关度最高的n条语句显示给用户,使用户根据自身需求选择相应的语句,n为大于0的整数。
在本发明实施例中,利用图像识别工具获取待转换图片对应的关键词,并通过搜索引擎获取关键词与语料库中每一语句的相关度。将相关度达到阈值的语句显示给用户,以供用户选择符合待转换图片的描述语句,从而避免用户上传图片后无法找到合适的描述语句。
上述本发明实施例图1步骤s103中涉及的构建语料库的过程,参见图2,示出了本发明实施例提供的构建语料库的流程图,包括以下步骤:
步骤s201:获取多条语句。
在具体实现步骤s201的过程中,针对不同的应用领域,收集各应用领域所对应的语句,具体内容可参见上述本发明实施例图1步骤s103中的内容,在此不再进行赘述。
获取多条语句后,将所获取的多条语句提交至搜索引擎,对所获取的多条语句进行相应处理。
步骤s202:将每一语句进行分词处理,得到每一语句的分词结果和权重。
在具体实现步骤s202的过程中,将多条语句提交至搜索引擎后,利用分词控制器将每一语句进行分词,得到每一语句对应的分词结果和权重。
步骤s203:将每一语句对应的分词结果和权重存储至搜索引擎对应的语料库中。
在具体实现步骤s203的过程中,在对每一语句进行分词后,将得到的每一语句对应的分词结果和权重存储至搜索引擎对应的语料库中。
在本发明实施例中,将所获取的多条语句提交至搜索引擎中进行分词处理,并将得到的每条语句的分词结果和权重存储至搜索引擎的语料库中。识别成待转换图片中的关键词后,利用搜索引擎对关键词进行检索,将与关键词的相关度达到阈值的语句显示给用户,以供用户选择符合待转换图片的描述语句,从而避免用户上传图片后无法找到合适的描述语句。
上述本发明实施例图1步骤s104中涉及的将相关度达到阈值的语句显示给用户的过程,结合图2的内容,参见图3,示出了本发明实施例提供的将相关度达到阈值的语句显示给用户的流程图,包括以下步骤:
步骤s301:利用每一语句的权重,对相关度达到阈值的语句进行打分,得到相关度达到阈值的语句的分数。
根据上述图2中的内容,对所获取的每条语句进行分词处理后得到相应的分词结果和权重。在具体实现步骤s301的过程中,对于相关度达到阈值的语句,利用该语句对应的权重进行打分,得到相关度达到阈值的语句的分数。
步骤s302:按照分数由高至低的顺序,将相关度达到阈值的语句进行排序。
在具体实现步骤s302的过程中,对相关度达到阈值的语句进行打分后,按照分数的高低顺序,对相关度达到阈值的语句进行排序。
可以理解的是,排序的方式也可以是由低至高的顺序,在此不做具体限定。
步骤s303:将排序后的相关度达到阈值的语句显示给用户。
在具体实现步骤s303的过程中,对相关度达到阈值的语句进行排序后,将排序后的相关度达到阈值的语句显示给用户,以供用户根据自身需求选择。
在本发明实施例中,利用每条语句的权重,对相关度达到阈值的语句进行打分。按照分数的高低顺序将相关度达到阈值的语句进行排序,并将排序结果显示给用户,以供用户选择符合待转换图片的描述语句,从而避免用户上传图片后无法找到合适的描述语句。
与上述本发明实施例提供的一种图文转换的方法相对应,参见图4,本发明实施例还提供了一种图文转换的系统的结构框图,该系统包括:第一获取单元401、第二获取单元402、第三获取单元403和显示单元404;
第一获取单元401,用于获取待转换图片。
第二获取单元402,用于基于图像识别工具,获取待转换图片对应的关键词。
优选的,第二获取单元402还用于:若关键词为英文,将关键词翻译成中文。
第三获取单元403,用于将关键词录入搜索引擎,获取关键词与预设的语料库中每一语句的相关度。
显示单元404,用于将相关度达到阈值的语句显示给用户。
优选的,结合图4,参见图5,示出了本发明实施例提供的一种图文转换的系统的结构框图,第二获取单元402包括:
识别模块4021,用于基于图像识别工具,识别待转换图片,得到构成待转换图片的元素。
获取模块4022,用于根据每一元素的特征信息,获取每一元素对应的关键词。
在本发明实施例中,利用图像识别工具获取待转换图片对应的关键词,并通过搜索引擎获取关键词与语料库中每一语句的相关度。将相关度达到阈值的语句显示给用户,以供用户选择符合待转换图片的描述语句,从而避免用户上传图片后无法找到合适的描述语句。
优选的,结合图4,参见图6,示出了本发明实施例提供的一种图文转换的系统的结构框图,第三获取单元403:获取模块4031、分词模块4032和存储模块4033;
获取模块4031,用于获取多条语句。
分词模块4032,用于将每一语句进行分词处理,得到每一语句的分词结果和权重。
存储模块4033,用于将每一语句对应的分词结果和权重存储至搜索引擎对应的语料库中。
在本发明实施例中,将所获取的多条语句提交至搜索引擎中进行分词处理,并将得到的每条语句的分词结果和权重存储至搜索引擎的语料库中。识别成待转换图片中的关键词后,利用搜索引擎对关键词进行检索,将与关键词的相关度达到阈值的语句显示给用户,以供用户选择符合待转换图片的描述语句,从而避免用户上传图片后无法找到合适的描述语句。
优选的,结合图4,参见图7,示出了本发明实施例提供的一种图文转换的系统的结构框图,显示单元404包括:
处理模块4041,用于按照相关度由高至低的顺序,将相关度达到阈值的所述语句进行排序。
显示模块4042,用于将排序后的相关度达到阈值的语句显示给用户。
优选的,结合图7中示出的内容,在另一具体实现中,处理模块4041,用于利用每一语句的权重,对相关度达到阈值的语句进行打分,得到相关度达到阈值的语句的分数,按照分数由高至低的顺序,将相关度达到阈值的语句进行排序。
显示模块4042,用于将排序后的相关度达到阈值的语句显示给用户。
在本发明实施例中,利用每条语句的权重,对相关度达到阈值的语句进行打分。按照分数的高低顺序将相关度达到阈值的语句进行排序,并将排序结果显示给用户,以供用户选择符合待转换图片的描述语句,从而避免用户上传图片后无法找到合适的描述语句。
综上所述,本发明实施例提供一种图文转换的方法及系统,该方法包括:获取待转换图片;基于图像识别工具,获取待转换图片对应的关键词;将关键词录入搜索引擎,获取关键词与预设的语料库中每一语句的相关度;将相关度达到阈值的语句显示给用户。本方案中,利用图像识别工具获取待转换图片对应的关键词,并通过搜索引擎获取关键词与语料库中每一语句的相关度。将相关度达到阈值的语句显示给用户,以供用户选择符合待转换图片的描述语句,从而避免用户上传图片后无法找到合适的描述语句。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
1.一种图文转换的方法,其特征在于,所述方法包括:
获取待转换图片;
基于图像识别工具,获取所述待转换图片对应的关键词;
将所述关键词录入搜索引擎,获取所述关键词与预设的语料库中每一语句的相关度;
将相关度达到阈值的所述语句显示给用户。
2.根据权利要求1所述的方法,其特征在于,所述基于图像识别工具,获取所述待转换图片对应的关键词,包括:
基于图像识别工具,识别所述待转换图片,得到构成所述待转换图片的元素;
根据每一所述元素的特征信息,获取每一所述元素对应的关键词。
3.根据权利要求1所述的方法,其特征在于,构建所述语料库的过程包括:
获取多条语句;
将每一所述语句进行分词处理,得到每一所述语句的分词结果和权重;
将每一所述语句对应的分词结果和权重存储至搜索引擎对应的语料库中。
4.根据权利要求1所述的方法,其特征在于,所述将相关度达到阈值的所述语句显示给用户,包括:
按照相关度由高至低的顺序,将相关度达到阈值的所述语句进行排序;
将排序后的相关度达到阈值的所述语句显示给用户。
5.根据权利要求3所述的方法,其特征在于,所述将相关度达到阈值的所述语句显示给用户,包括:
利用每一所述语句的权重,对相关度达到阈值的所述语句进行打分,得到相关度达到阈值的所述语句的分数;
按照分数由高至低的顺序,将相关度达到阈值的所述语句进行排序;
将排序后的相关度达到阈值的所述语句显示给用户。
6.根据权利要求1所述的方法,其特征在于,所述获取所述关键词与预设的语料库中每一语句的相关度之前,还包括:
若所述关键词为英文,将所述关键词翻译成中文。
7.一种图文转换的系统,其特征在于,所述系统包括:
第一获取单元,用于获取待转换图片;
第二获取单元,用于基于图像识别工具,获取所述待转换图片对应的关键词;
第三获取单元,用于将所述关键词录入搜索引擎,获取所述关键词与预设的语料库中每一语句的相关度;
显示单元,用于将相关度达到阈值的所述语句显示给用户。
8.根据权利要求7所述的系统,其特征在于,所述第二获取单元包括:
识别模块,用于基于图像识别工具,识别所述待转换图片,得到构成所述待转换图片的元素;
获取模块,用于根据每一所述元素的特征信息,获取每一所述元素对应的关键词。
9.根据权利要求7所述的系统,其特征在于,所述第三获取单元包括:
获取模块,用于获取多条语句;
分词模块,用于将每一所述语句进行分词处理,得到每一所述语句的分词结果和权重;
存储模块,用于将每一所述语句对应的分词结果和权重存储至搜索引擎对应的语料库中。
10.根据权利要求7所述的系统,其特征在于,所述显示单元包括:
处理模块,用于按照相关度由高至低的顺序,将相关度达到阈值的所述语句进行排序;
显示模块,用于将排序后的相关度达到阈值的所述语句显示给用户。
技术总结