一种犬只的识别方法,识别装置,机器可读介质以及系统与流程

专利2022-06-29  143


本发明涉及图像识别领域,特别地公开了一种犬只的识别方法,识别装置,机器可读介质以及系统。



背景技术:

当下城市管理中,对犬只的管理越来越规范。而同时居民养宠物狗的数量越来越多。养狗就要遛,但是遛狗会带来一些安全上的风险。同时遗弃的流浪狗也有安全上的风险,需要进行监管。

不同狗的品种,其攻击性也是不同的。有些品种的狗在一些城市限制购养,为了方便管理需要系统能够对犬只品种进行分类,发现特定名单上的品种后要提示报警。

品种分类较难,同时很多时候细分狗的品种比较困难。实操上更多直接判断是小型犬,中型犬还是大型犬,实操性更强。



技术实现要素:

本申请提供了一种犬只的识别方法,包括:

获取视频序列,从视频序列的视频帧中筛选出包含犬只的视频帧作为对象帧;

对于筛选出的每个对象帧,获取对象帧中包含的犬只的位置信息和特征信息,其中位置信息用于表征犬只的位置,特征信息用于表征犬只的特征;

利用位置信息和特征信息,确定不同的对象帧之间的犬只的位置偏差和特征相似度,将位置偏差小于预定偏差阈值并且特征相似度高于预定相似度阈值的不同对象帧中包含的犬只确定为同一犬只。

可选地,该方法还包括:

从对象帧中选取包含行人的对象帧,

计算行人与犬只的长宽比,根据长宽比的数值范围,划分犬只的体型。

可选地,该方法还包括:

将被确定为包含同一犬只的对象帧输入识别模型,以根据犬只的特征信息和/或体型,得到犬只的品种。

可选地,

行人的至少一部分与犬只的至少一部分位于同一高度范围。

可选地,该方法还包括:

从对象帧中选取包含行人的对象帧时,通过年龄分类器,将行人年龄为儿童的过滤掉。

可选地,该方法还包括:

在犬只的品种属于预设的品种范围或者不属于预设的品种范围的情况下,提示告警信息。

本申请还提供了一种犬只的识别装置,包括:

筛选模块,筛选模块用于获取视频序列,从视频序列的视频帧中筛选出包含犬只的视频帧作为对象帧;

获取模块,获取模块用于对于筛选出的每个对象帧,获取对象帧中包含的犬只的位置信息和特征信息,其中位置信息用于表征犬只的位置,特征信息用于表征犬只的特征;

识别模块,识别模块用于利用位置信息和特征信息,确定不同的对象帧之间的犬只的位置偏差和特征相似度,将位置偏差小于预定偏差阈值并且特征相似度高于预定相似度阈值的不同对象帧中包含的犬只确定为同一犬只。

可选地,

识别模块还用于从对象帧中选取包含行人的对象帧,计算行人与犬只的长宽比,根据长宽比的数值范围,划分犬只的体型。

可选地,

识别模块还用于将被确定为包含同一犬只的对象帧输入识别模型,以根据犬只的特征信息和/或体型,得到犬只的品种。

可选地,

识别模块还用于确定行人的至少一部分与犬只的至少一部分位于同一高度范围。

可选地,

识别模块还用于从对象帧中选取包含行人的对象帧时,通过年龄分类器,将行人年龄为儿童的过滤掉。

可选地,还包括:

告警模块,告警模块用于在犬只的品种属于预设的品种范围或者不属于预设的品种范围的情况下,提示告警信息。

本申请还提供了一种机器可读介质,机器可读介质上存储有指令,该指令在机器上执行时使机器执行上述的犬只识别方法。

本申请还提供了一种系统,包括:

存储器,用于存储由系统的一个或多个处理器执行的指令,以及

处理器,是系统的处理器之一,用于执行上述的犬只识别方法。

本发明提供了一种能够对犬只品种体型进行分类,发现特定名单上的品种后能够提示报警的方法。

附图说明

图1根据本申请的一些实施例,示出了一种犬只的识别方法的流程示意图。

图2根据本申请的一些实施例,示出了一种犬只的识别方法的场景示意图。

图3根据本申请的一些实施例,示出了一种犬只的识别方法的场景示意图。

图4根据本申请的一些实施例,示出了一种犬只的识别方法的场景示意图。

图5根据本申请的一些实施例,示出了一种犬只的识别方法的场景示意图。

图6根据本申请的一些实施例,示出了一种犬只的识别装置的结构示意图。

图7根据本申请的一些实施例,示出了一种系统的框图。

图8根据本申请一些实施例,示出了一种片上系统(soc)的框图。

具体实施方式

可以理解,如本文所使用的,术语“模块””可以指代或者包括专用集成电路(asic)、电子电路、执行一个或多个软件或固件程序的处理器(共享、专用、或群组)和/或存储器、组合逻辑电路、和/或提供所描述的功能的其他适当硬件组件,或者可以作为这些硬件组件的一部分。

可以理解,在本申请各实施例中,处理器可以是微处理器、数字信号处理器、微控制器等,和/或其任何组合。根据另一个方面,处理器可以是单核处理器,多核处理器等,和/或其任何组合。

下面将结合附图对本申请的实施例作进一步地详细描述。

根据本申请的实施例公开了以及一种犬只识别方法、犬只识别装置、机器可读介质以及系统。

首先参考图1,图1示出了根据本发明的一个实施例的犬只识别方法。

本申请实施例提供了一种犬只的识别方法,包括:

101获取视频序列,从视频序列的视频帧中筛选出包含犬只的视频帧作为对象帧;102对于筛选出的每个对象帧,获取对象帧中包含的犬只的位置信息和特征信息,其中位置信息用于表征犬只的位置,特征信息用于表征犬只的特征。

具体地,遍历视频,将视频解帧后,获取该视频的每一个视频帧,视频帧是连续的,每一视频帧包括前一视频帧或者后一视频帧,或者两者都有。这里为视频帧是静止的图像,快速连续地显示视频帧便形成了视频。其中,于视频帧内筛选出包含犬只的视频帧作为对象帧。其中,对一段固定时长的视频解帧后,将不包括的犬只的视频帧过滤去除后,包含犬只的对象帧的数量会小于等于解帧后的视频帧。例如,对于一段1分钟时长的视频,其中,在第10秒至第15秒,以及第30秒至35秒的两个时间段内有包含犬只,那对该视频进行解帧筛选后,获得第10秒至第15秒以及第30秒至35秒的视频帧作为对象帧。接着,对于包含犬只的第10秒至第15秒以及第30秒至35秒的对象帧,由于该对象帧是从视频中筛选出的,每一个对象帧本身也具有时间属性,例如,第10秒至第15秒中的对象帧数量为20帧,那这20帧对象帧是按时间顺序排列的。

根据本申请的一些实施例,可以通过预先训练的犬只的识别模型,从而得到视频帧中是否存在犬只的识别结果,可以利用机器学习方法和训练样本对现有的机器学习模型(例如各种人工神经网络cnn,ssd,fasterrcnn,yolo中的一种模型)进行识别训练得到识别模型。

接着,根据该识别模型,可以计算出待识别图像(视频帧)中的物体和犬只的特征信息之间的相似度,并基于所计算出的相似度,判断该待识别图像(视频帧)中是否包含有犬只。通常,相似度设置有一个阈值,当相似度超过该阈值,则待识别图像(视频帧)中包含有犬只的可能性越大,则该待识别图像(视频帧)将被筛选为一个对象帧。例如,若待识别图像(视频帧和对应关系表中的犬只的图像区域的图像和犬只的特征信息的相似度小于预设阈值(例如相似度为0.01,阈值为0.1),则待识别图像(视频帧)中不存在犬只。

具体地,对于筛选出的每个对象帧,获取对象帧中犬只的位置信息和特征信息,可以对对象帧进行图像显著性检验,以获取对象帧的感兴趣区域。其中,感兴趣区域可以是包括犬只的最小矩形区域的位置,即可以作为犬只区域在对象帧中的位置。实践中,对象帧中的犬只区域与背景区域具有不同的特征,且特征差距较大,因此通过图像显著性检验可以快速地确定出犬只区域。

根据本申请的一些实施例,可以通过矩形框标定的方式从对象帧中框取出犬只区域。具体地,可以利用预设大小的矩形框从对象帧的预设位置开始,按照预设方向和预设移动距离在对象帧中进行移动,得到矩形框所标定的多个局部图像区域。其中,与犬只区域重叠度最高的局部区域的位置即为犬只在对象帧中的位置,基于该位置获取位置信息。

同时,通过一个上述识别模型,对对象帧中的犬只的区域进行特征提取,得到待识别犬只的特征信息。

103利用位置信息和特征信息,确定不同对象帧之间的犬只的位置偏差和特征相似度,将位置偏差小于预定偏差阈值并且特征相似度高于预定相似度阈值的不同对象帧中包含的犬只确定为同一犬只。

具体地,如图2所示,不同的对象帧中获取的犬只的特征信息的特征相似度的比较算法,包括但不限于特征信息对应的特征向量的相似度的比较,当多个对象帧包含的犬只的特征信息的特征相似度均高于一个相似度阈值时,可以认定该多个对象帧包含的犬只相似。特征向量相似度的计算,可以使用欧几里得距离,皮尔逊相关系数等常见的相似度算法,这里不再一一赘述。可以采用犬类识别属性包括犬只面部属性包括犬只耳朵以及眼睛的位置属性,犬只鼻纹属性,来计算多个犬只之间的相似度,根据犬类识别属性对对象帧和参考图像进行比对;根据犬类识别属性将待识别对象帧在犬只数据底库中进行搜索。其中,犬只鼻纹类似人类指纹,不会因为时间的推移而影响纹路的形状,能成为犬只的唯一识别标识。可以采用犬只鼻纹进行犬只比对和/或犬只识别有利于进一步提高犬只身份验证的精度。例如,当相似度阈值为1时,犬只1和犬只2的特征信息的特征相似度为1.1和1.2,那犬只1和犬只2之间相似度较高。同时,视频中的犬只可以是移动或者不移动的,因此不同的对象帧中获取的犬只的位置信息可以是相同或者不同的,将多个对象帧之间的犬只的位置信息之间的偏差与一个预设的偏差阈值相比较,当偏差小于该偏差阈值同时,该多个对象帧之间的犬只的特征信息的特征相似度较高时,可以认定该多个对象帧之间包含的犬只为同一只犬只,例如,多个对象帧之间的犬只的位置信息之间的偏差都小于偏差阈值0.2,那么可以认为这多个对象帧包含的犬只为同一只犬只。

接着,将被确定为包含同一犬只的对象帧输入识别模型,以根据犬只的特征信息和/或体型,得到犬只的品种。

具体地,通过一个上述的识别模型,输入犬只的特征信息和/或体型进行特征提取,得到犬只的品种。这里用到的识别方法可以是现有技术,对此不再一一赘述。

在犬只的品种属于预设的品种范围的情况下,提示告警信息,这里的预设的品种范围是预先判断危险度较高的犬类,例如烈性犬。亦或者在犬只的品种不属于预设的品种范围的情况下,提示告警信息,这里的预设的品种范围是预先判断危险度较低的犬类。

具体地,预先存储有预设的每种犬只的品种和是否需要提示告警的对应关系表,在对象帧中识别出的犬只的品种存在于该对应关系表中时,则会发出一提示告警的信息,例如,当识别出有烈性犬时,发出提示注意安全的信息。

从对象帧中选取包含行人的对象帧,计算行人与犬只的长宽比,根据长宽比的数值范围,划分犬只的体型。行人的至少一部分与犬只的至少一部分位于同一高度范围。同时从对象帧中选取包含行人的对象帧时,通过年龄分类器,将行人年龄为儿童的过滤掉。

具体地,如图3所示,基于对象帧中犬只的区域,在对象帧中,使用行人检测算法,找到所有的行人。将犬只的位置信息配置为平面坐标的原点,获取与犬只处于同一水平线x轴附近的行人,当对象帧中有行人1,行人2时,选择相较于该x轴的距离最近的行人,也就是说行人与犬只的一部分位于同一高度范围内,比较适合作为参照物,如图所示选择行人1,则计算行行人的长宽比,记做p1,计算待识别犬只的长宽比,记做p2,计算q=p1/p2。根据q所在区间范围,判断待识别犬只对应的犬只体型。例如q=2~3为小型犬,0~2为大型犬。

根据本申请的一些实施例,如图4所示,将犬只的位置信息配置为平面坐标的原点后,获取与犬只处于同一水平线x轴附近的行人,当对象帧中有两个或者两个以上的行人时,且行人位于犬只的两侧,则先判断相较于该x轴的距离最近的行人,当行人所在的区域位于水平线x轴的两侧时,选择与待识别犬只距离最近的行人,如图所示选择行人1后,则计算行人和犬只的长宽比,判断犬只的犬只体型。

根据本申请的一些实施例,如图5所示,将犬只的位置信息配置为平面坐标的原点后,获取与犬只处于同一水平线x轴附近的行人,当对象帧中有两个或者两个以上的行人时,且这两个行人位于犬只的两侧且位于水平线x的两侧,则先判断相较于该x轴的距离最近的行人后,选择与待识别犬只距离最近的行人,如图所示选择行人1后,则计算行人和犬只的长宽比,判断犬只的犬只体型。

同时,通过年龄分类算法或者行为分析算法,将属于儿童的行人的过滤掉,其中,可以基于儿童的行为姿态进行识别,例如,行走,爬行,跑动,攀爬,等等。这里的儿童可以是年龄1-4岁的儿童,为了避免在犬只识别过程中与大型犬只造成混淆。这里的行人检测算法和年龄分类算法属于现有技术,行人检测算法,是利用背景建模算法提取出运动的前景目标,然后利用分类器对运动目标进行分类,判断是否包含行人。常用的背景建模算法有:高斯混合模型,mixtureofgaussianmodel,vibe算法,帧差分算法,sacon,样本一致性建模算法,pbas算法等。

这里的年龄分类器,是使用深度卷积神经网络,通过设计一系列的卷积、池化、全连接和归一化层,对人脸的年龄进行了有效地分类,可以基于vgg16网络,预先在imagenet上进行分类训练,然后在指定的数据集上进行微调后获得的模型。主要是通过模型将人分类成各个类别的年龄段,得到预测的年龄,这里不再一一赘述。

基于上面的描述,下面具体介绍犬只识别装置中各设备的主要工作流程。

根据本申请的一些实施例,结合上述犬只识别方法的描述,对于犬只识别装置的工作流程,上述犬只识别方法中描述的技术细节在此流程中依然适用,为了避免重复,有些在此次不再赘述。如图6所示,具体地,包括:

本申请还提供了一种犬只的识别装置,包括:

筛选模块,筛选模块用于获取视频序列,从视频序列的视频帧中筛选出包含犬只的视频帧作为对象帧。

获取模块,获取模块用于对于筛选出的每个对象帧,获取对象帧中包含的犬只的位置信息和特征信息,其中位置信息用于表征犬只的位置,特征信息用于表征犬只的特征。

识别模块,识别模块用于利用位置信息和特征信息,确定不同对象帧之间的犬只的位置偏差和特征相似度,将位置偏差小于预定偏差阈值并且特征相似度高于预定相似度阈值的不同对象帧中包含的犬只确定为同一犬只。

识别模块还用于从对象帧中选取包含行人的对象帧,计算行人与犬只的长宽比,根据长宽比的数值范围,划分犬只的体型。

识别模块还用于将被确定为包含同一犬只的对象帧输入识别模型,以根据犬只的特征信息和/或体型,得到犬只的品种。

具体地,筛选模块,首先遍历视频将视频解帧后,于视频帧内筛选出包含犬只的视频帧作为对象帧。识别模块通过预先训练的犬只的识别模型,从而得到视频帧中是否存在犬只的识别结果,对于筛选出的每个对象帧,获取对象帧中犬只的位置信息和特征信息。通过上述识别模型,对对象帧中的犬只的区域进行特征提取,得到待识别犬只的特征信息。当多个犬只的特征信息的特征相似度均高于一个相似度阈值时,识别模块可以认定该多个犬只相似,可以采用犬类识别属性包括犬只面部属性包括犬只耳朵以及眼睛的位置属性,犬只鼻纹属性,来计算多个犬只之间的相似度。将多个对象帧之间的犬只的位置信息之间的偏差与一个预设的偏差阈值相比较,当偏差小于该偏差阈值同时,该多个对象帧之间的犬只的特征信息的特征相似度较高时,可以认定该多个对象帧之间包含的犬只为同一只犬只。识别模块通过上述识别模型,输入犬只的特征信息和/或体型进行特征提取,得到犬只的品种。这里用到的识别方法可以是现有技术。

告警模块,告警模块用于在犬只的品种属于预设的品种范围的情况下,提示告警信息。

具体地,告警模块预先存储有预设的每种犬只的品种和是否需要提示告警的对应关系表,在对象帧中识别出的犬只的品种存在于该对应关系表中时,则会发出一提示告警的信息。这里的预设的品种范围是预先判断危险度较高的犬类,例如烈性犬。亦或者在犬只的品种不属于预设的品种范围的情况下,提示告警信息,这里的预设的品种范围是预先判断危险度较低的犬类。

识别模块还用于确定行人的至少一部分与犬只的至少一部分位于同一高度范围。

识别模块还用于从对象帧中选取包含行人的对象帧时,通过年龄分类器或者行为分析算法,将行人年龄为儿童的过滤掉。

具体地,识别模块从对象帧中选取包含行人的对象帧,计算行人与犬只的长宽比,根据长宽比的数值范围,划分犬只的体型。行人的至少一部分与犬只的至少一部分位于同一高度范围。同时从对象帧中选取包含行人的对象帧时,通过年龄分类器或者行为分析算法,将行人年龄为儿童的过滤掉,例如年龄1-4岁的儿童。

本申请还提供了一种机器可读介质,机器可读介质上存储有指令,该指令在机器上执行时使机器执行上述的犬只识别方法。

本申请还提供了一种系统,包括:

存储器,用于存储由系统的一个或多个处理器执行的指令,以及处理器,是系统的处理器之一,用于执行上述的犬只识别方法。

现在参考图7,所示为根据本申请的一个实施例的系统700的框图。图7示意性地示出了根据多个实施例的示例系统700。在一个实施例中,系统700可以包括一个或多个处理器704,与处理器704中的至少一个连接的系统控制逻辑708,与系统控制逻辑708连接的系统内存712,与系统控制逻辑708连接的非易失性存储器(nvm)716,以及与系统控制逻辑708连接的网络接口720。

在一些实施例中,处理器704可以包括一个或多个单核或多核处理器。在一些实施例中,处理器704可以包括通用处理器和专用处理器(例如,图形处理器,应用处理器,基带处理器等)的任意组合。在系统700采用enb(evolvednodeb,增强型基站)101或ran(radioaccessnetwork,无线接入网)控制器102的实施例中,处理器704可以被配置为执行各种符合的实施例,例如,如图1所示的多个实施例中的一个或多个。

在一些实施例中,系统控制逻辑708可以包括任意合适的接口控制器,以向处理器704中的至少一个和/或与系统控制逻辑708通信的任意合适的设备或组件提供任意合适的接口。

在一些实施例中,系统控制逻辑708可以包括一个或多个存储器控制器,以提供连接到系统内存712的接口。系统内存712可以用于加载以及存储数据和/或指令。在一些实施例中系统700的内存712可以包括任意合适的易失性存储器,例如合适的动态随机存取存储器(dram)。

nvm/存储器716可以包括用于存储数据和/或指令的一个或多个有形的、非暂时性的计算机可读介质。在一些实施例中,nvm/存储器716可以包括闪存等任意合适的非易失性存储器和/或任意合适的非易失性存储设备,例如hdd(harddiskdrive,硬盘驱动器),cd(compactdisc,光盘)驱动器,dvd(digitalversatiledisc,数字通用光盘)驱动器中的至少一个。

nvm/存储器716可以包括安装系统700的装置上的一部分存储资源,或者它可以由设备访问,但不一定是设备的一部分。例如,可以经由网络接口720通过网络访问nvm/存储716。

特别地,系统内存712和nvm/存储器716可以分别包括:指令724的暂时副本和永久副本。指令724可以包括:由处理器704中的至少一个执行时导致系统700实施如图1所示的方法的指令。在一些实施例中,指令724、硬件、固件和/或其软件组件可另外地/替代地置于系统控制逻辑708,网络接口720和/或处理器704中。

网络接口720可以包括收发器,用于为系统700提供无线电接口,进而通过一个或多个网络与任意其他合适的设备(如前端模块,天线等)进行通信。在一些实施例中,网络接口720可以集成于系统700的其他组件。例如,网络接口720可以集成于处理器704的,系统内存712,nvm/存储器716,和具有指令的固件设备(未示出)中的至少一种,当处理器704中的至少一个执行所述指令时,系统700实现如图1所示的方法(请注意修改)。

网络接口720可以进一步包括任意合适的硬件和/或固件,以提供多输入多输出无线电接口。例如,网络接口720可以是网络适配器,无线网络适配器,电话调制解调器和/或无线调制解调器。

在一个实施例中,处理器704中的至少一个可以与用于系统控制逻辑708的一个或多个控制器的逻辑封装在一起,以形成系统封装(sip)。在一个实施例中,处理器704中的至少一个可以与用于系统控制逻辑708的一个或多个控制器的逻辑集成在同一管芯上,以形成片上系统(soc)。

系统700可以进一步包括:输入/输出(i/o)设备732。i/o设备732可以包括用户界面,使得用户能够与系统700进行交互;外围组件接口的设计使得外围组件也能够与系统700交互。在一些实施例中,系统700还包括传感器,用于确定与系统700相关的环境条件和位置信息的至少一种。

在一些实施例中,用户界面可包括但不限于显示器(例如,液晶显示器,触摸屏显示器等),扬声器,麦克风,一个或多个相机(例如,静止图像照相机和/或摄像机),手电筒(例如,发光二极管闪光灯)和键盘。

在一些实施例中,外围组件接口可以包括但不限于非易失性存储器端口、音频插孔和电源接口。

在一些实施例中,传感器可包括但不限于陀螺仪传感器,加速度计,近程传感器,环境光线传感器和定位单元。定位单元还可以是网络接口720的一部分或与网络接口720交互,以与定位网络的组件(例如,全球定位系统(gps)卫星)进行通信。

根据本申请的实施例,图8示出了一种soc(systemonchip,片上系统)800的框图。在图8中,相似的部件具有同样的附图标记。另外,虚线框是更先进的soc的可选特征。在图8中,soc800包括:互连单元850,其被耦合至应用处理器815;系统代理单元870;总线控制器单元880;集成存储器控制器单元840;一组或一个或多个协处理器820,其可包括集成图形逻辑、图像处理器、音频处理器和视频处理器;静态随机存取存储器(sram)单元830;直接存储器存取(dma)单元860。在一个实施例中,协处理器820包括专用处理器,诸如例如网络或通信处理器、压缩引擎、gpgpu、高吞吐量mic处理器、或嵌入式处理器等等。

本申请公开的机制的各实施例可以被实现在硬件、软件、固件或这些实现方法的组合中。本申请的实施例可实现为在可编程系统上执行的计算机程序或程序代码,该可编程系统包括至少一个处理器、存储系统(包括易失性和非易失性存储器和/或存储元件)、至少一个输入设备以及至少一个输出设备。

可将程序代码应用于输入指令,以执行本申请描述的各功能并生成输出信息。可以按已知方式将输出信息应用于一个或多个输出设备。为了本申请的目的,处理系统包括具有诸如例如数字信号处理器(dsp)、微控制器、专用集成电路(asic)或微处理器之类的处理器的任何系统。

程序代码可以用高级程序化语言或面向对象的编程语言来实现,以便与处理系统通信。在需要时,也可用汇编语言或机器语言来实现程序代码。事实上,本申请中描述的机制不限于任何特定编程语言的范围。在任一情形下,该语言可以是编译语言或解释语言。

在一些情况下,所公开的实施例可以以硬件、固件、软件或其任何组合来实现。所公开的实施例还可以被实现为由一个或多个暂时或非暂时性机器可读(例如,计算机可读)存储介质承载或存储在其上的指令,其可以由一个或多个处理器读取和执行。例如,指令可以通过网络或通过其他计算机可读介质分发。因此,机器可读介质可以包括用于以机器(例如,计算机)可读的形式存储或传输信息的任何机制,包括但不限于,软盘、光盘、光碟、只读存储器(cd-roms)、磁光盘、只读存储器(rom)、随机存取存储器(ram)、可擦除可编程只读存储器(eprom)、电可擦除可编程只读存储器(eeprom)、磁卡或光卡、闪存、或用于利用因特网以电、光、声或其他形式的传播信号来传输信息(例如,载波、红外信号数字信号等)的有形的机器可读存储器。因此,机器可读介质包括适合于以机器(例如,计算机)可读的形式存储或传输电子指令或信息的任何类型的机器可读介质。

在附图中,可以以特定布置和/或顺序示出一些结构或方法特征。然而,应该理解,可能不需要这样的特定布置和/或排序。而是,在一些实施例中,这些特征可以以不同于说明性附图中所示的方式和/或顺序来布置。另外,在特定图中包括结构或方法特征并不意味着暗示在所有实施例中都需要这样的特征,并且在一些实施例中,可以不包括这些特征或者可以与其他特征组合。

需要说明的是,本申请各设备实施例中提到的各单元/模块都是逻辑单元/模块,在物理上,一个逻辑单元/模块可以是一个物理单元/模块,也可以是一个物理单元/模块的一部分,还可以以多个物理单元/模块的组合实现,这些逻辑单元/模块本身的物理实现方式并不是最重要的,这些逻辑单元/模块所实现的功能的组合才是解决本申请所提出的技术问题的关键。此外,为了突出本申请的创新部分,本申请上述各设备实施例并没有将与解决本申请所提出的技术问题关系不太密切的单元/模块引入,这并不表明上述设备实施例并不存在其它的单元/模块。

需要说明的是,在本专利的示例和说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

虽然通过参照本申请的某些优选实施例,已经对本申请进行了图示和描述,但本领域的普通技术人员应该明白,可以在形式上和细节上对其作各种改变,而不偏离本申请的精神和范围。


技术特征:

1.一种犬只的识别方法,其特征在于,包括:

获取视频序列,从所述视频序列的视频帧中筛选出包含犬只的视频帧作为对象帧;

对于筛选出的每个对象帧,获取所述对象帧中包含的所述犬只的位置信息和特征信息,其中所述位置信息用于表征所述犬只的位置,所述特征信息用于表征所述犬只的特征;

利用所述位置信息和所述特征信息,确定不同的所述对象帧之间的犬只的位置偏差和特征相似度,将所述位置偏差小于预定偏差阈值并且所述特征相似度高于预定相似度阈值的不同对象帧中包含的犬只确定为同一犬只。

2.根据权利要求1所述的识别方法,其特征在于,还包括:

从所述对象帧中选取包含行人的对象帧,计算所述行人与所述犬只的长宽比,根据所述长宽比的数值范围,划分所述犬只的体型。

3.根据权利要求1或2所述的识别方法,其特征在于,还包括:

将被确定为包含同一犬只的所述对象帧输入识别模型,以根据所述犬只的特征信息和/或体型,得到所述犬只的品种。

4.根据权利要求2所述的识别方法,其特征在于,还包括:

所述行人的至少一部分与所述犬只的至少一部分位于同一高度范围。

5.根据权利要求2所述的识别方法,其特征在于,还包括:

从所述对象帧中选取包含行人的对象帧时,通过年龄分类器,将行人年龄为儿童的过滤掉。

6.根据权利要求3所述的识别方法,其特征在于,还包括:

在所述犬只的所述品种属于预设的品种范围或者不属于预设的品种范围的情况下,提示告警信息。

7.一种犬只的识别装置,其特征在于,包括:

筛选模块,所述筛选模块用于获取视频序列,从所述视频序列的视频帧中筛选出包含犬只的视频帧作为对象帧;

获取模块,所述获取模块用于对于筛选出的每个对象帧,获取所述对象帧中包含的所述犬只的位置信息和特征信息,其中所述位置信息用于表征所述犬只的位置,所述特征信息用于表征所述犬只的特征;

识别模块,所述识别模块用于利用所述位置信息和所述特征信息,确定不同的所述对象帧之间的犬只的位置偏差和特征相似度,将所述位置偏差小于预定偏差阈值并且所述特征相似度高于预定相似度阈值的不同对象帧中包含的犬只确定为同一犬只。

8.一种机器可读介质,其特征在于,所述机器可读介质上存储有指令,该指令在机器上执行时使机器执行权利要求1至6中任一项所述的犬只识别方法。

9.一种系统,包括:

存储器,用于存储由系统的一个或多个处理器执行的指令,以及

处理器,是系统的处理器之一,用于执行权利要求1至6中任一项所述的犬只识别方法。

技术总结
本发明涉及图像识别领域,特别地公开了一种犬只的识别方法,识别装置,机器可读介质以及系统。犬只的识别方法,包括:获取视频序列,从视频序列的视频帧中筛选出包含犬只的视频帧作为对象帧;对于筛选出的每个对象帧,获取对象帧中包含的犬只的位置信息和特征信息,其中位置信息用于表征犬只的位置,特征信息用于表征犬只的特征;利用位置信息和特征信息,确定不同的对象帧之间的犬只的位置偏差和特征相似度,将位置偏差小于预定偏差阈值并且特征相似度高于预定相似度阈值的不同对象帧中包含的犬只确定为同一犬只。本发明提供的方法一种能够对犬只品种体型进行分类,发现特定名单上的品种后能够提示报警。

技术研发人员:黄杰;魏子昆;杨忠程;张至先
受保护的技术使用者:上海依图网络科技有限公司
技术研发日:2020.01.20
技术公布日:2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-17891.html

最新回复(0)