本公开涉及互联网技术领域,尤其涉及一种视频类别划分方法、装置、电子设备及存储介质。
背景技术:
直播是当前互联网非常常见的一种产品形态,常见的直播有:游戏直播、咨讯直播、娱乐直播等。
以游戏直播为例,游戏直播是其中非常大的一个垂类内容,游戏分类的准确性,对于用户发现游戏直播以及平台推荐,具有非常重要的意义。
然而,发明人发现经常会有主播选错分类的情况发生,因而需要对游戏直播进行分类,目前视频类别划分的方式比较简单,容易导致将用户选对的类型识别错误或者没有准确修正选错的类别。
综上,目前对视频直播时视频类别的划分准确率较低。
技术实现要素:
本公开提供一种视频类别划分方法、装置、电子设备及存储介质,以至少解决相关技术中对视频直播时视频类别的划分准确率较低的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种视频类别划分方法,包括:
从直播的目标视频中截取至少一帧视频图像;
根据截取的视频图像确定所述目标视频与各预设类别的相似度;
若根据所述相似度确定所述目标视频与对象选择的预设类别不同,则根据识别各预设类别的准确率,从其他预设类别中确定所述目标视频的视频类别。
在一种可选的实施方式中,所述根据截取的视频图像确定所述目标视频与各预设类别的相似度,包括:
将截取的视频图像输入已训练好的分类模型,得到所述分类模型输出的所述视频图像与各预设类别的相似度,其中所述分类模型是通过对样本图像训练得到的,所述样本图像中标注有所述样本图像与各预设类别的相似度;
将所述视频图像与各预设类别的相似度作为所述目标视频与相应预设类别的相似度。
在一种可选的实施方式中,所述根据识别各预设类别的准确率,从其他预设类别中确定所述目标视频的视频类别,包括:
根据所述相似度从其他预设类别中选择目标类别;
若所述目标视频与所述目标类别的相似度不小于识别所述目标类别的准确率,则确定所述目标视频的视频类别为所述目标类别。
在一种可选的实施方式中,所述根据所述相似度从其他预设类别中选择目标类别,包括:
从其他预设类别中选择与所述目标视频的相似度最高的预设类别作为所述目标类别。
在一种可选的实施方式中,所述根据所述目标视频与预设类别的相似度确定所述目标视频不是预设类别,包括:
若所述目标视频与所述对象选择的预设类别的相似度小于第一阈值,则确定所述目标视频与所述对象选择的预设类别不同;或
若所述目标视频与所述对象选择的预设类别的相似度以及容错值之和小于第二阈值,则确定所述目标视频与所述对象选择的预设类别不同。
根据本公开实施例的第二方面,提供一种视频类别划分装置,包括:
获取单元,被配置为执行从直播的目标视频中截取至少一帧视频图像;
识别单元,被配置为执行根据截取的视频图像确定所述目标视频与各预设类别的相似度;
划分单元,被配置为执行若根据所述相似度确定所述目标视频与对象选择的预设类别不同,则根据识别各预设类别的准确率,从其他预设类别中确定所述目标视频的视频类别。
在一种可选的实施方式中,所述识别单元具体被配置为执行:
将截取的视频图像输入已训练好的分类模型,得到所述分类模型输出的所述视频图像与各预设类别的相似度,其中所述分类模型是通过对样本图像训练得到的,所述样本图像中标注有所述样本图像与各预设类别的相似度;
将所述视频图像与各预设类别的相似度作为所述目标视频与相应预设类别的相似度。
在一种可选的实施方式中,所述划分单元具体被配置为执行:
根据所述相似度从其他预设类别中选择目标类别;
若所述目标视频与所述目标类别的相似度不小于识别所述目标类别的准确率,则确定所述目标视频的视频类别为所述目标类别。
在一种可选的实施方式中,所述划分单元具体被配置为执行:
从其他预设类别中选择与所述目标视频的相似度最高的预设类别作为所述目标类别。
在一种可选的实施方式中,所述划分单元具体被配置为执行:
若所述目标视频与所述对象选择的预设类别的相似度小于第一阈值,则确定所述目标视频与所述对象选择的预设类别不同;或
若所述目标视频与所述对象选择的预设类别的相似度以及容错值之和小于第二阈值,则确定所述目标视频与所述对象选择的预设类别不同。
根据本公开实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现本公开实施例第一方面中任一项所述的视频类别划分方法。
根据本公开实施例的第四方面,提供一种非易失性可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行本公开实施例第一方面中任一项所述的视频类别划分方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,当所述计算机程序产品在电子设备上运行时,使得所述电子设备执行实现本公开实施例上述第一方面以及第一方面任一可能涉及的方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
由于本公开实施例在对直播的进行视频类别分类时,考虑到相似度会出现不准确的情况,因而不能完全信赖相似度,不再是仅根据目标视频与各预设类别的相似度来确定目标视频的类别,而是在此基础上引入了对象对视频类别选定的因素,将识别得到的相似度与对象选择的视频类别相结合,在目标视频与对象选择的预设类别不同时,再进一步根据识别各预设类别的准确率,从其他预设类型中确定目标视频的视频类别,以防止因误识别导致得到的相似度较低时直接修正而带来的误差,提高了视频类别划分的准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种应用场景的示意图;
图2是根据一示例性实施例示出的一种视频类别划分方法的流程图;
图3是根据一示例性实施例示出的一种分类模型的示意图;
图4a是根据一示例性实施例示出的一种类别标签的示意图;
图4b是根据一示例性实施例示出的一种通过分类模型进行视频类别划分的示意图;
图5是根据一示例性实施例示出的一种视频类别划分的完整方法的流程图;
图6是根据一示例性实施例示出的一种视频类别划分装置的框图;
图7是根据一示例性实施例示出的一种电子设备的框图;
图8是根据一示例性实施例示出的一种终端设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
下面对文中出现的一些词语进行解释:
1、本公开实施例中术语“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
2、本公开实施例中术语“终端设备”指计算机、手机、平板、电脑、个人数字助理等移动通信设备。
3、本公开实施例中术语“游戏直播”为游戏账号在网络展示自己玩游戏的实时网络节目。
4、本公开实施例中术语“游戏类别”通常用于分类电子游戏,是一种分辨游戏之间区别的方法。在实现游戏直播的分类时,一般是根据游戏的大致类型或者游戏名称来分类。例如根据游戏的大致类型可以划分为:动作、冒险、模拟、角色扮演、休闲等;也可直接根据游戏名称对游戏进行划分时,例如游戏名称为a、b、c的游戏,则游戏类别分别为a游戏、b游戏、c游戏等,在本公开实施例中不对游戏类别的划分指标做具体限定。
本公开实施例描述的应用场景是为了更加清楚的说明本公开实施例的技术方案,并不构成对于本公开实施例提供的技术方案的限定,本领域普通技术人员可知,随着新应用场景的出现,本公开实施例提供的技术方案对于类似的技术问题,同样适用。其中,在本公开的描述中,除非另有说明,“多个”的含义。
随着互联网技术的迅猛发展,网络直播作为一个新的技术领域进入大众视野。通过网络直播可以同一时间透过网络系统在不同的交流平台观看不同直播媒体数据等,在相关的一种网络直播应用中,不同直播媒体数据是由主播用户上传获得,为了方便区分不同主播用户,为每一个主播用户创建一个直播间,观看用户通过观看客户端可以请求进入某一个直播间,以观看该直播间对应的主播用户上传的直播媒体数据。
目前,用户在通过直播间进行直播或观看直播时,终端设备可根据直播数据对视频直播进行分类。然而,相关的分类方式比较简单,对视频直播时视频类别的识别准确率较低。
本公开实施例提供了一种视频类别划分方法、装置、电子设备和存储介质,该方法可应用于能够进行直播的终端设备,本公开实施例中的视频类别划分方法,引入了对象对游戏类别选定的因素,将识别得到的相似度与对象选择的游戏类别相结合,提高游戏类别划分的准确率。
参阅图1所示,为本公开实施例提供的一种应用场景图,该应用场景图中包括两个终端设备110和一个服务器130,可通过终端设备110登录直播界面120观看直播或这是进行直播。终端设备110与服务器130之间可以通过通信网络进行通信。
在一种可选的实施方式中,通信网络是有线网络或无线网络。
在本申请实施例中,终端设备110为用户使用的电子设备,该电子设备可以是个人计算机、手机、平板电脑、笔记本、电子书阅读器等具有一定计算能力并且运行有即时通讯类软件及网站或者社交类软件及网站的计算机设备。各终端设备110通过无线网络与服务器130连接,服务器130是一台服务器或若干台服务器组成的服务器集群或云计算中心,或者是一个虚拟化平台。
可选地,服务器130还可以具有直播数据库,该直播数据库可以存储大量上传到服务器的直播视频等。
参阅图2所示,是本公开实施例示出的一种视频类别划分方法的流程图,可应用于图2所示的终端设备110或是服务器130,具体包括以下步骤。
在s21中,从直播的目标视频中截取至少一帧视频图像;
在s22中,根据截取的视频图像确定目标视频与各预设类别的相似度;
在本公开实施例中,各预设类别指在直播平台中预先配置的类别标签。以游戏直播为例,则各预设类别指游戏直播平台中预先配置的一些游戏类别,例如针对游戏直播预先设立的一个集合,集合中包含多个游戏类别相对应的类别标签,如a游戏、b游戏等,在对象进行直播时,则可根据集合中的类别标签选择一个游戏类别作为本次要直播的游戏的游戏类别。
在s23中,若根据相似度确定目标视频与对象选择的预设类别不同,则根据识别各预设类别的准确率,从其他预设类别中确定目标视频的视频类别。
通过上述方案,在对直播的进行视频类别分类时,考虑到相似度会出现不准确的情况,因而不能完全信赖相似度,不再是仅根据目标视频与各预设类别的相似度来确定目标视频的类别,而是在此基础上引入了对象对视频类别选定的因素,将识别得到的相似度与对象选择的视频类别相结合,在目标视频与对象选择的预设类别不同时,再进一步根据识别各预设类别的准确率,从其他预设类型中确定目标视频的视频类别,以防止因误识别导致得到的相似度较低时直接修正而带来的误差,提高了视频类别划分的准确率。
在一种可选的实施方式中,截取至少一帧视频图像时,可仅截取一帧视频图像,并根据这一帧视频图像,识别得到目标视频与各预设类别的相似度;也可截取多帧视频图像,并根据多帧视频图像识别得到目标视频与各预设类别的相似度。
可选的,在截取多帧视频图像时,可截取连续多帧视频图像,也可截取不连续的多帧视频图像。
例如,采用周期截取的方式。在主播的直播过程中,每隔10s(秒)截一帧视频图像,并不断进行相似度识别,在次不做具体限定。
上述实施方式,可以有效减少截取到的视频帧为无效视频帧时对识别相似度的准确性的影响,以提高识别得到的相似度的准确性。
例如在游戏直播过程中,除了所直播的游戏视频内容外,还包含一些与当前直播的游戏无关的视频内容,即无效视频帧。此时通过周期截取的方式,可尽量减少截取到无效视频帧的数量在截取到的总视频数量中的比例,有效减少无效视频帧对识别相似度时准确性的影响。提高相似度识别的效率。
在本公开实施例中,网络直播指可以同一时间透过网络系统在不同的交流平台观看影片的一种新兴的网络社交方式,网络直播平台也成为了一种崭新的社交媒体。常见的网络直播主要包括游戏直播、体育直播、电商直播、财经直播、社交直播等。
下面主要以游戏直播为例进行介绍,直播的目标视频为游戏视频,视频类别指游戏类别。
在一种可选的实施方式中,根据截取的视频图像,确定目标视频与各预设类别的相似度时,可通过已训练的分类模型来识别。
其中,分类模型在训练过程中所使用的训练样本上标注有该训练样本与各预设类别的相似度。在训练过程中,将训练样本输入未训练的分类模型,得到分类模型输出的相似度,并不断调整分类模型中的网络参数,直至通过分类模型识别得到的相似度与标注的相似度的误差在指定范围内时,则可停止训练,得到已训练的分类模型。
可选的,已训练的模型可以是多分类模型,比如多分类器;也可以是单分类模型,例如二分类器。
第一、若所述已训练的模型为多分类模型,具体识别方式为:
将截取的视频图像输入已训练好的分类模型,得到分类模型输出的视频图像与各预设类别的相似度,其中分类模型是通过对样本图像训练得到的,样本图像中标注有样本图像与各预设类别的相似度;将视频图像与各预设类别的相似度作为目标视频与相应预设类别的相似度。
如图3所示,为本公开实施例示出的一种通过多分类模型进行图像识别的示意图。其中,多分类模型,该模型可识别的预设类别为a、b、c、d。通过直播截帧的方式,将截取到的至少一帧目标视频的视频图像输入多分类模型,通过多分类模型进行图像识别处理,则可得到目标视频与预设类别a的相似度s1,目标视频与预设类别b的相似度s2,目标视频与预设类别c的相似度s3,以及目标视频与预设类别d的相似度s4,即图4a中所示的a游戏相似度~d游戏相似度。
在上述实施方式中,可以通过一个模型得到目标视频与各预设类别的相似度,识别效率较高。
第二、若所述已训练的模型为单分类模型,则针对每一种预设类别,都有与该预设类别对应的单分类模型,该模型主要用于检测输入的视频图像是否为相应的预设类别,输出视频图像与预设类别的相似度。
例如,针对预设类别a,则对应有单分类模型a,该模型是通过样本图像训练得到的,样本图像中标注有该样本图像为预设类别a的相似度;同理,针对预设类别b,则对应有单分类模型b,该模型是通过样本图像训练得到的,样本图像中标注有该样本图像为预设类别b的相似度,以此类推。
具体识别方式为:将截取的视频图像分别输入各预设类别对应的已训练好的分类模型,得到各预设类别对应的分类模型输出的视频图像与各预设类别的相似度;将视频图像与各预设类别的相似度作为目标视频与相应预设类别的相似度。
例如,将截取的视频图像分别输入已训练好的单分类模型a、单分类模型b、单分类模型c,根据单分类模型a的输出得到目标视频与预设类别a的相似度s1’,同理根据单分类模型b的输出得到目标视频与预设类别b的相似度s2’,根据单分类模型c的输出得到目标视频与预设类别c的相似度s3’,根据单分类模型d的输出得到目标视频与预设类别d的相似度s4’。
在上述实施方式中,单分类模型更加准确,因而可以提高识别得到的相似度的准确性。
在本公开实施例中,分类模型可以是神经网络模型,例如cnn(convolutionalneuralnetwork,卷积神经网络)、卷积深度信念网络模型、深度波尔兹曼机模型等,当通过分类模型获取目标视频与各预设类别的相似度时,识别各预设类别的准确率则是指分类模型的识别准确率。
例如,单分类模型b识别10个实际类别为预设类别b的样本图像,得到10个相似度。假设识别得到的相似度大于一定阈值为识别正确,反之识别错误。其中,识别正确的为8个,识别错误的为2个,则识别准确率为80%。
此外,若目标视频与各预设类别的相似度不是通过分类模型得到的,而是通过一些分类算法,例如knn(k-nearestneighbor,k最邻近分类算法)、svm(supportvectormachine、支持向量机)等时,则可通过统计等方式,确定该算法应用于本公开实施例的场景下时识别各预设类别的准确率。
在一种可选的实施方式中,根据目标视频与各预设类别的相似度,确定目标视频与对象选择的预设类别是否相同时,可采用以下两种判断方式:
判断方式一、根据相似度以及第一阈值判断。
若目标视频与对象选择的预设类别的相似度小于第一阈值,则确定目标视频不是对象选择的预设类别;否则,则确定目标视频为对象选择的预设类别。
例如图4a所示,其中共包含4个游戏类别的标签,主播在进行直播之前,可从这4个标签中选取一个标签,作为对象选择的预设类别,对象即进行游戏直播的主播。假设主播从游戏类别集合中选择了标签为a,即该主播直播的游戏名称为a游戏,预设类别为游戏类别a。
假设该游戏类别对应的相似度s1’为70%,小于第一阈值为80%,此时可确定目标视频与主播选择的预设类别不同,也就是该目标视频为非游戏类别a,即不是游戏类别a。
若游戏类别a对应的相似度s1’为90%,大于第一阈值80%,此时可确定目标视频与主播选择的预设类别相同,即目标视频的视频类别为游戏类别a。
判断方式二、根据相似度、容错值以及第二阈值判断。
若目标视频与对象选择的预设类别的相似度以及容错值之和小于第二阈值,则确定目标视频不是对象选择的预设类别;否则,则确定目标视频为对象选择的预设类别。
仍以主播选择的预设类别仍为游戏类别a,该游戏类别对应的相似度s1’为70%,第一阈值为80%。假设容错值为10%,此时目标视频与对象选择的预设类别的相似度以及容错值之和为80%,不小于第二阈值,因而可确定目标视频与对象选择的预设类别相同,即目标视频的视频类别为游戏类别a。
若容错值为5%,则目标视频与对象选择的预设类别的相似度以及容错值之和为75%,小于第二阈值,因而可确定目标视频与对象选择的预设类别不同,也就是说目标视频的视频类别是非游戏类别a。
在上述实施方式中,由于考虑了容错值,因而对识别各预设类别时的识别结果具有一定的容忍度。以通过分类模型识别得到相似度的方式为例,则在分类模型识别准确率较低时,通过容错值弥补分别模型识别准确率的影响,以减小因分类模型误识别准确率对识别结果带来的误差,提高视频类别判断的准确率。
在一种可选的实施方式中,第一阈值和第二阈值可以相同,也可以不同。
可选的,第一阈值与第二阈值相同,都为对象选择的预设类别对应的识别准确率。以分类模型识别得到相似度的方式为例,则第一阈值和第二阈值也就是通过分类模型对样本图像的实际游戏类别进行识别得到的。
上述实施方式中,基于分类模型的识别准确率来判断目标视频与对象选择的预设类别是否相同,以提高判断的准确度。
在一种可选的实施方式中,根据目标视频与目标类别的相似度,确定目标视频为目标类别时,具体过程如下:
根据相似度从其他预设类别中选择目标类别;若目标视频与目标类别的相似度不小于识别目标类别的准确率,则确定目标视频的视频类别为目标类别。
可选的,目标类别为与目标视频的相似度最高的预设类别。
以目标类别为相似度最高的预设类别为例,假设通过单分类模型得到目标视频与预设类别a、b、c、d的相似度s1’、s2’、s3’、s4’,其中s2’>s1’>s3’>s4’,则其中相似度最高的为预设类别b,所以目标类别为预设类别b。
其中,在根据目标类别对应的识别准确率进行判断时,若目标视频与目标类别的相似度不小于目标类别对应的识别准确率,则确定目标视频的游戏类别为目标类别。若目标视频与目标类别的相似度小于目标类别对应的识别准确率,则确定目标视频的游戏类别为非目标类别且非对象选择的预设类别。
假设,目标视频与目标类别的相似度s2’=80%,且目标类别对应的识别准确率为80%,也就是说目标视频与目标类别的相似度不小于识别目标类别的准确率,因而可以确定目标视频为目标类别,也就是主播直播的游戏为b游戏。
假设,目标类别对应的识别准确率为90%,此时目标视频与目标类别的相似度小于识别目标类别的准确率,因而可以确定目标视频为非目标类别且非对象选择的预设类别,也就是主播直播的游戏既不是a游戏,也不是b游戏。
可选的,也可根据图4b所示的方式,当通过多分类模型识别得到目标视频与各预设类别的相似度后,选取相似度最高的预设类别,即目标类别,且通过相似度可知目标视频与对象选择的预设类别不同,即识别与用户选择分类不一致时,可判断多分类模型识别目标类似的准确率是否大于第三阈值,如果是,则确定目标视频为目标类别;否则,确定目标视频为非目标类别。
例如,判断目标类别的识别准确率是否大于90%,如果是,则可确定目标视频的视频类别为目标类别。
需要说明的是,该方式下,目标类别与对象选择的预设类别不同。在本公开实施例中,将识别得到的相似度与对象选择的游戏类别相结合,不仅是根据识别得到的相似度来确定是否调整直播的游戏类别,而是在对象选择的游戏类别与相似度最高的游戏类别不同,且根据对象选择的游戏类别的相似度确定目标视频不是对象选择的游戏类别时,再进一步调整对象选择的游戏类别,以防止因误识别导致得到的相似度较低时直接调整而带来的误差,提高了游戏类别划分的准确率。
在本公开实施例中,若对象选择的预设类别与目标类别相同,例如假设s1’>s2’>s3’>s4’,则其中相似度最高的为预设类别a,所以目标类别为预设类别a。
此时,则可直接根据上述实施例中所列举的两种判断方式来确定目标对象的视频类别为对象选择的预设类别,还是非对象选择的预设类别,重复之处不再赘述。
下面以具体游戏直播场景为例,对上述实施过程中可能的几种情况进行详细的举例说明:
假设游戏直播设置有三个预设类别,分别为:a游戏、b游戏、c游戏。
在主播开播时,从三个预设类别选择了a游戏,即对象选择的预设类别为a游戏,但是主播直播时实际播放的可能是a游戏、b游戏、c游戏三个预设类别中的任意一种。在截取直播视频图像后,通过分类模型识别可以得到该直播与a游戏的相似度为80%,b游戏为70%,c游戏为60%。
此外针对这三个预设类别,分类模型本身都有相应的识别准确率。其中,a游戏对应的识别准确率为90%(例如识别10个实际类别为a游戏的样本图像,结果有9个识别正确,1个识别错误),b游戏对应的准确率为90%,c游戏对应的识别准确率为85%。
第一种情况:根据识别得到的相似度可知,相似度最高的为a游戏,即目标类别为a游戏,而其他两个预设类别的相似度较低。目标类别与对象选择的预设类别相同。
此时,针对a游戏这一预设类别,比较相似度与分类模型的识别准确率,其中,相似度80%低于识别准确率90%。假设可以容忍一定的容错值,例如10%,则相似度80%加上容错值10%等于识别准确率90%,则可确定主播选择的是正确的,直播的实际类别是a游戏。
第二种情况:若即使a游戏这一预设类别的相似度最高,但是容错值为5%,此时相似度80%加上容错值5%还是低于识别准确率90%,此时则确定直播的实际类别不是a游戏。
或者,容错值为10%,但是a游戏相似度为70%,c游戏相似度为60%,c游戏相似度为50%,此时相似度70%加上容错值10%还是低于识别准确率90%,此时则确定直播的实际类别不是a游戏。
第三种情况:针对上述三种预设类别,分类模型识别得到的相似度分别为:80%、70%、90%。其中,相似度最高的为c游戏,不是主播选择的a游戏。也就是目标类别为c游戏与对象选择的预设类别不同,此时,a游戏相似度80%加上容忍度5%小于模型的识别准确率,且c游戏相似度90%大于模型的识别准确率85%,则可确定直播的实际类别为c游戏。
若a游戏相似度80%加上容忍度10%不小于模型的识别准确率,则可确定直播的实际类别为a游戏。
在游戏直播中主播通过一边玩游戏一边讲解游戏的玩法,吸引大量的用户观看,如对于角色类游戏,游戏中会有众多的游戏角色可供选择,主播可以通过选择一个游戏角色,并对游戏角色在游戏中的操作进行讲解,以让用户能进行学习和交流该游戏角色的相关内容。因而,在通过游戏名称对游戏进行分类后,还可进一步根据游戏角色对同一游戏名称类别的游戏再一次进行分类。
具体的,在确定目标视频的游戏类别之后,还可通过hook(钩子)脚本注入、图像识别等方式获取目标视频中的目标游戏对象后,根据目标游戏对象确定目标视频的子游戏类别,其中子游戏类别用于区分主播直播时所操作的角色,因而可根据目标游戏对象对同一游戏类别的目标视频再一次进行分类。针对同一游戏类别的直播,也不再需要用户一个一个的点击查看,直接根据子游戏类别确定即可,有助于用户更加方便的选择合适的直播间观看。
例如,目标视频1至目标视频5都为a游戏的直播,但是其中目标视频1的主播所操作的游戏角色为角色1,目标视频2的主播所操作的游戏角色为角色2,目标视频3的主播所操作的游戏角色为角色3,目标视频4的主播所操作的游戏角色为角色4,目标视频5的主播所操作的游戏角色为角色5。若用户想要观看角色4对应的直播时,则可在游戏类别搜索的基础上,进一步通过子游戏类别搜索即可,无需再对目标视频1至目标视频5一一进行点击查看。
图5是根据一示例性实施例示出的一种游戏直播分类的完整方法流程图,具体包括以下步骤:
s51:获取对象从选择的游戏类别,并将对象选择的游戏类别作为候选类别;
s52:获取对象直播间直播中的目标游戏视频,从目标游戏视频中截取至少一帧视频图像;
s53:将截取的视频图像输入已训练的分类模型,根据分类模型的输出确定目标游戏视频与各候选类别的相似度;
s54:根据目标游戏视频与各候选类别的相似度,从选择与目标游戏视频的相似度最高的作为目标类别;
s55:判断候选类别与目标类别是否相同,如果是,则执行s56,否则,执行s59;
s56:判断目标游戏视频与候选类别的相似度与容错值之和是否小于识别候选类别的识别准确率,如果是,则执行s57,否则,执行s58;
s57:确定目标游戏视频为非候选类别;
s58:确定目标游戏视频为候选类别;
s59:判断目标游戏视频与目标类别的相似度是否大于分类模型识别目标类别的识别准确率,如果是,则执行s510,否则,执行s511;
s510:确定目标游戏视频为目标类别,将对象选择的游戏类别调整为目标类别。
s511:确定目标游戏视频为非目标类别;
其中,候选类别即对象从集合中选择的游戏类别。
图6是根据一示例性实施例示出的一种游戏直播分类装置的框图。参照图6,该游戏直播分类装置600包括获取单元600,识别单元601和划分单元602。
获取单元601,被配置为执行从直播的目标视频中截取至少一帧视频图像;
识别单元602,被配置为执行根据截取的视频图像确定该目标视频与各预设类别的相似度;
划分单元603,被配置为执行若根据该相似度确定该目标视频与对象选择的预设类别不同,则根据识别各预设类别的准确率,从其他预设类别中确定该目标视频的视频类别;
其中,该预设类别为该对象从该选择的游戏类别,该目标类别为根据该目标视频与各预设类别的相似度从该选择的。
在一种可选的实施方式中,该识别单元602具体被配置为执行:
将截取的视频图像输入已训练好的分类模型,得到该分类模型输出的该视频图像与各预设类别的相似度,其中该分类模型是通过对样本图像训练得到的,该样本图像中标注有该样本图像与各预设类别的相似度;
将该视频图像与各预设类别的相似度作为该目标视频与相应预设类别的相似度。
在一种可选的实施方式中,该划分单元603具体被配置为执行:
若该目标视频与该目标类别的相似度不小于该目标类别对应的识别准确率,则确定该目标视频的游戏类别为该目标类别。
在一种可选的实施方式中,该划分单元603具体被配置为执行:
从其他预设类别中选择与该目标视频的相似度最高的预设类别作为该目标类别。
在一种可选的实施方式中,该划分单元603具体被配置为执行:
若该目标视频与预设类别的相似度小于第一阈值,则确定该目标视频不是预设类别;或
若该目标视频与预设类别的相似度以及容错值之和小于第二阈值,则确定该目标视频不是预设类别。
关于上述实施例中的装置,其中各个单元执行请求的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图7是根据一示例性实施例示出的一种电子设备700的框图,该装置包括:
处理器710;
用于存储所述处理器710可执行指令的存储器720;
其中,所述处理器710被配置为执行所述指令,以实现本公开实施例中任意一种游戏直播分类的方法。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器720,上述指令可由电子设备700的处理器710执行以完成上述方法。可选地,存储介质可以不是临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
在本公开实施例中还提供一种终端设备,其结构如图8所示,本公开实施例给出一种游戏直播分类的终端800,包括:射频(radiofrequency,rf)电路810、电源820、处理器830、存储器840、输入单元850、显示单元860、摄像头870、通信接口880、以及无线保真(wirelessfidelity,wi-fi)模块890等部件。本领域技术人员可以理解,图8中示出的终端的结构并不构成对终端的限定,本公开实施例提供的终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图8对所述终端800的各个构成部件进行具体的介绍:
所述rf电路810可用于通信或通话过程中,数据的接收和发送。特别地,所述rf电路810在接收到基站的下行数据后,发送给所述处理器830处理;另外,将待发送的上行数据发送给基站。通常,所述rf电路810包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(lownoiseamplifier,lna)、双工器等。
此外,rf电路810还可以通过无线通信与网络和其他终端通信。所述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(globalsystemofmobilecommunication,gsm)、通用分组无线服务(generalpacketradioservice,gprs)、码分多址(codedivisionmultipleaccess,cdma)、宽带码分多址(widebandcodedivisionmultipleaccess,wcdma)、长期演进(longtermevolution,lte)、电子邮件、短消息服务(shortmessagingservice,sms)等。
wi-fi技术属于短距离无线传输技术,所述终端800通过wi-fi模块890可以连接接入点(accesspoint,ap),从而实现数据网络的访问。所述wi-fi模块890可用于通信过程中,数据的接收和发送。
所述终端800可以通过所述通信接口880与其他终端实现物理连接。可选的,所述通信接口880与所述其他终端的通信接口通过电缆连接,实现所述终端800和其他终端之间的数据传输。
由于在本公开实施例中,所述终端800能够实现通信业务,向其他联系人发送信息,因此所述终端800需要具有数据传输功能,即所述终端800内部需要包含通信模块。虽然图8示出了所述rf电路810、所述wi-fi模块890、和所述通信接口880等通信模块,但是可以理解的是,所述终端800中存在上述部件中的至少一个或者其他用于实现通信的通信模块(如蓝牙模块),以进行数据传输。
例如,当所述终端800为手机时,所述终端800可以包含所述rf电路810,还可以包含所述wi-fi模块890;当所述终端800为计算机时,所述终端800可以包含所述通信接口880,还可以包含所述wi-fi模块890;当所述终端800为平板电脑时,所述终端800可以包含所述wi-fi模块。
所述存储器840可用于存储软件程序以及模块。所述处理器830通过运行存储在所述存储器840的软件程序以及模块,从而执行所述终端800的各种功能应用以及数据处理,并且当处理器830执行存储器840中的程序代码后,可以实现本公开实施例图2中的部分或全部过程。
可选的,所述存储器840可以主要包括存储程序区和存储数据区。其中,存储程序区可存储操作系统、各种应用程序(比如通信应用)以及人脸识别模块等;存储数据区可存储根据所述终端的使用所创建的数据(比如各种图片、视频文件等多媒体文件,以及人脸信息模板)等。
此外,所述存储器840可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述输入单元850可用于接收用户输入的数字或字符信息,以及产生与所述终端800的用户设置以及功能控制有关的键信号输入。
可选的,输入单元850可包括触控面板851以及其他输入终端852。
其中,所述触控面板851,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在所述触控面板851上或在所述触控面板851附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,所述触控面板851可以包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给所述处理器830,并能接收所述处理器830发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现所述触控面板851。
可选的,所述其他输入终端852可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
所述显示单元860可用于显示由用户输入的信息或提供给用户的信息以及所述终端800的各种菜单。所述显示单元860即为所述终端800的显示系统,用于呈现界面,实现人机交互。
所述显示单元860可以包括显示面板861。可选的,所述显示面板861可以采用液晶显示屏(liquidcrystaldisplay,lcd)、有机发光二极管(organiclight-emittingdiode,oled)等形式来配置。
进一步的,所述触控面板851可覆盖所述显示面板861,当所述触控面板851检测到在其上或附近的触摸操作后,传送给所述处理器830以确定触摸事件的类型,随后所述处理器830根据触摸事件的类型在所述显示面板861上提供相应的视觉输出。
虽然在图8中,所述触控面板851与所述显示面板861是作为两个独立的部件来实现所述终端800的输入和输入功能,但是在某些实施例中,可以将所述触控面板851与所述显示面板861集成而实现所述终端800的输入和输出功能。
所述处理器830是所述终端800的控制中心,利用各种接口和线路连接各个部件,通过运行或执行存储在所述存储器840内的软件程序和/或模块,以及调用存储在所述存储器840内的数据,执行所述终端800的各种功能和处理数据,从而实现基于所述终端的多种业务。
可选的,所述处理器830可包括一个或多个处理单元。可选的,所述处理器830可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到所述处理器830中。
所述摄像头870,用于实现所述终端800的拍摄功能,拍摄图片或视频。所述摄像头870还可以用于实现终端800的扫描功能,对扫描对象(二维码/条形码)进行扫描。
所述终端800还包括用于给各个部件供电的电源820(比如电池)。可选的,所述电源820可以通过电源管理系统与所述处理器830逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗等功能。
需要说明的是,本公开实施例处理器830可以执行图7中处理器710的功能,存储器840存储存储器720中的内容。
本公开实施例还提供一种计算机程序产品,当所述计算机程序产品在电子设备上运行时,使得所述电子设备执行实现本公开实施例上述任意一项视频类别划分方法或任意一项视频类别划分方法任一可能涉及的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
1.一种视频类别划分方法,其特征在于,包括:
从直播的目标视频中截取至少一帧视频图像;
根据截取的视频图像确定所述目标视频与各预设类别的相似度;
若根据所述相似度确定所述目标视频与对象选择的预设类别不同,则根据识别各预设类别的准确率,从其他预设类别中确定所述目标视频的视频类别。
2.如权利要求1所述的方法,其特征在于,所述根据截取的视频图像确定所述目标视频与各预设类别的相似度,包括:
将截取的视频图像输入已训练好的分类模型,得到所述分类模型输出的所述视频图像与各预设类别的相似度,其中所述分类模型是通过对样本图像训练得到的,所述样本图像中标注有所述样本图像与各预设类别的相似度;
将所述视频图像与各预设类别的相似度作为所述目标视频与相应预设类别的相似度。
3.如权利要求1所述的方法,其特征在于,所述根据识别各预设类别的准确率,从其他预设类别中确定所述目标视频的视频类别,包括:
根据所述相似度从其他预设类别中选择目标类别;
若所述目标视频与所述目标类别的相似度不小于识别所述目标类别的准确率,则确定所述目标视频的视频类别为所述目标类别。
4.如权利要求3所述的方法,其特征在于,所述根据所述相似度从其他预设类别中选择目标类别,包括:
从其他预设类别中选择与所述目标视频的相似度最高的预设类别作为所述目标类别。
5.如权利要求1~4任一所述的方法,其特征在于,所述根据所述相似度确定所述目标视频与对象选择的预设类别不同,包括:
若所述目标视频与所述对象选择的预设类别的相似度小于第一阈值,则确定所述目标视频与所述对象选择的预设类别不同;或
若所述目标视频与所述对象选择的预设类别的相似度以及容错值之和小于第二阈值,则确定所述目标视频与所述对象选择的预设类别不同。
6.一种视频类别划分装置,其特征在于,包括:
获取单元,被配置为执行从直播的目标视频中截取至少一帧视频图像;
识别单元,被配置为执行根据截取的视频图像确定所述目标视频与各预设类别的相似度;
划分单元,被配置为执行若根据所述相似度确定所述目标视频与对象选择的预设类别不同,则根据识别各预设类别的准确率,从其他预设类别中确定所述目标视频的视频类别。
7.根据权利要求6所述的装置,其特征在于,所述识别单元具体被配置为执行:
将截取的视频图像输入已训练好的分类模型,得到所述分类模型输出的所述视频图像与各预设类别的相似度,其中所述分类模型是通过对样本图像训练得到的,所述样本图像中标注有所述样本图像与各预设类别的相似度;
将所述视频图像与各预设类别的相似度作为所述目标视频与相应预设类别的相似度。
8.如权利要求6所述的装置,其特征在于,所述划分单元具体被配置为执行:
根据所述相似度从其他预设类别中选择目标类别;
若所述目标视频与所述目标类别的相似度不小于识别所述目标类别的准确率,则确定所述目标视频的视频类别为所述目标类别。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至权利要求5中任一项所述的视频类别划分方法。
10.一种存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至权利要求5中任一项所述的视频类别划分方法。
技术总结