一种基于图像的小型动物识别方法与流程

专利2022-06-29  91


本发明涉及图像识别领域,特别是涉及一种基于图像的小型动物识别方法。



背景技术:

随着经济全球化进程的加快,越来越多的人开始饲养宠物,尤其是小型动物,国内常见的例如猫、狗,国外常见的例如蜥蜴、蛇等。但是很多非饲养小型动物的人不了解且不熟悉相应小型动物的生活习性导致与其嬉戏打闹时被其误伤,所以识别并了解与自己相处的小型动物的习性是非常重要的。小型动物图像的识别常用卷积神经网络,但是训练一般的卷积神经网络模型需要大量的样本数据,费时费力,故一种少样本的卷积神经网络模型能够带来极大的便利,省时省力。



技术实现要素:

常用卷积神经网络模型训练需要大量的样本数据,样本数据数量不够则会产生过拟合的问题从而导致动物识别率降低,本发明提供了一种基于图像的小型动物识别方法,能够优化少样本产生过拟合导致的模型精度降低问题,提高识别的准确度。

为了解决上述技术问题,本发明提供如下的技术方案:

一种基于图像的小型动物识别方法,包括以下步骤:

步骤1:将图像缩小为32×32的图像;

步骤2:输入层输入图片的长度,宽度和深度。长和宽代表图像大小,本发明输入的为步骤1中缩小后的32×32大小的图像,其长度为32,宽度为32;深度代表图像的彩色通道,输入的为rgb三色通道,故彩色图像深度为3,即输入的图像为32×32×3;

步骤3:构建卷积神经网络结构,过程如下:

步骤3-1:卷积层c1对输入层输入的图像矩阵进行卷积操作,提取特征,经过激励函数的作用得到特征图,卷积层特征图公式如式(1)所示。

式(1)中,代表第l层第j个神经元,f为激励函数,mj代表前一层输出特征图集合,代表第l-1层上第i个神经元,*代表卷积运算,代表l-1层第i个神经元到l层第j个神经元的卷积核矩阵,代表l层第j个神经元的偏置;

激励函数为relu函数,relu函数如式(2)所示。

relu(x)=max(0,x)(2)

在样本数小于参数个数的情况下,样本矩阵很可能是不可逆的,而引入正则化项则会解决这个问题;正则化项的引入平衡了偏差与方差、拟合能力与泛化能力、经验风险与结构风险,使用l2正则化方法如式(3)所示。

c0代表原始的代价参数,w为共享权重,λ为给定的正则项系数,n代表神经元个数,则化项的系数为1×10-4

卷积层c1通过32个5×5的卷积核同时对权重进行l2正则化,得到32个28×28×3的特征图;

步骤3-2:亚采样层s1根据图像的局部相关原理,对卷积层输出的特征图在相邻的小区域内进行聚合取样,在减少特征和参数的同时,保留图像的有用信息,使用stochastic-pooling方法,对像素点按照数值大小赋予概率,再按照概率进行亚采样;

亚采样层s1在2×2的区域内对步骤3-1中的卷积层c1产生的特征图进行亚采样,步长为1,得到32个14×14×3的特征图;

步骤3-3:卷积层c2同步骤3-1中的卷积层c1提取特征图的方式一样,唯一区别为卷积层c2的卷积核为3×3,其卷积层特征图公式如式(1)所示,使用的激励函数如式(2)所示,使用的l2正则化方法如式(3)所示;

卷积层c2通过32个3×3的卷积核同时对权重进行l2正则化,得到1024个12×12×3的特征图;

步骤3-4:亚采样层s2与步骤3-2中的亚采样层s1方法相同,亚采样层s2在2×2的区域内对卷积层c2产生的特征图进行亚采样,步长为1,得到1024个6×6×3的特征图;

步骤3-5:对步骤3-4中的特征图采取flatten操作,产生一维特征向量输入全链接层,全链接层有三层分别是:

全链接层f1的大小为256;

全链接层f2的大小为128,然后采用dropout方法对某一层的神经元按照一定概率激活,dropout的概率参数为0.5,全链接层f2的激励函数使用relu函数,具体表达式如式(2)所示;

全链接层f3的大小为64,然后采用dropout方法对某一层的神经元按照一定概率激活,dropout的概率参数为0.5,全链接层f3的激励函数使用relu函数,具体表达式如式(2)所示;

步骤4:输出层为分类器,作用为输出属于各个类别的概率,并且所有类别的概率值之和为1,使用的分类器函数为soft-max函数,soft-max函数公式见式(4):

式(4)中,h(x(i))表示样本i属于第k类的概率,总类别数为k。

本发明的技术构思为:考虑到训练模型的耗时耗力以及需要的样本数量庞大等问题,在卷积层引入l2正则化项,使用relu函数以及在全链接层加入dropout方法可以有效优化过拟合导致的模型精度降低问题。

本发明的有益效果如下:本方法在样本数小于参数个数的情况下,样本矩阵很可能是不可逆的,而在卷积层引入正则化项则会解决这个问题。正则化项的引入平衡了偏差与方差、拟合能力与泛化能力、经验风险与结构风险,故能够提高识别的准确度。使用relu函数作为激励函数会使一部分神经元的输出为0,这样就造成了网络的稀疏性,减少了参数的相互依存关系,也能够缓解过拟合问题的发生,提高识别准确度。

附图说明

图1为本方法的整体流程图。

图2为cnn网络流程图。

图3为cnn网络结构图。

具体实施方式

下面结合附图对本发明做进一步说明。

参照图1~图3,一种基于图像的小型动物识别方法,整个过程如图1所示,分为四个步骤,其中比较关键的步骤为第三步。

如图2所示,将图像输入卷积神经网络后,输入层将图像缩小成32×32大小,再输入rgb三色通道,即输入图像为32×32×3。

然后将32×32×3的图像输入到加入l2正则化的卷积层c1,卷积层c1的卷积核为32个5×5的卷积核,卷积层c1对输入层输入的图像矩阵进行卷积操作,提取特征,经过激励函数的作用,然后得到32个28×28×3的特征图。卷积层c1的激励函数为relu函数,公式如下:

relu(x)=max(0,x)

卷积层特征图公式具体如下:

在样本数小于参数个数的情况下,样本矩阵很可能是不可逆的,而引入正则化项则会解决这个问题,正则化项的引入平衡了偏差与方差、拟合能力与泛化能力、经验风险与结构风险,使用的l2正则化方法公式具体如下:

然后将32个28×28×3的特征图输入亚采样层s1,亚采样层s1使用stochastic-pooling的方法在2×2的区域内对卷积层c1产生的特征图进行亚采样,步长为1,得到32个14×14×3的特征图;

然后将32个14×14×3的特征图输入到加入l2正则化的卷积层c2,卷积层c1的卷积核为32个3×3的卷积核,卷积层c1对输入层输入的图像矩阵进行卷积操作,提取特征,经过激励函数的作用,然后得到1024个12×12×3的特征图。卷积层c1的激励函数为relu函数,公式如下:

relu(x)=max(0,x)

卷积层特征图公式如下:

使用的l2正则化方公式法如下:

然后将1024个12×12×3的特征图输入亚采样层s2,亚采样层s2使用stochastic-pooling的方法在2×2的区域内对卷积层c2产生的特征图进行亚采样,步长为1,得到1024个6×6×3的特征图。

然后将1024个6×6×3的特征图采取flatten操作,产生一维特征向量。

然后将产生的一维向量输入全链接层f1,全链接层f1大小为256。

然后将全链接层f1产生的结果输入全链接层f2,全链接层f2大小为128,再用dropout方法对某一层的神经元按照一定概率激活。dropout方法的概率参数为0.5。

然后将全链接层f2产生的结果输入全链接层f3,全链接层f3大小为64,再用dropout方法对某一层的神经元按照一定概率激活。dropout方法的概率参数为0.5。

最后将结果分类输出。

如上所述为本发明一种基于图像的小型动物识别方法的实施例介绍,本发明引入的卷积神经网络含一个输入层,两个加入l2正则化的卷积层,两个亚采样层,三个加入dropout方法的全链接层以及一个输出层,通过该卷积神经网络,能够达到增强小型动物识别率的要求。

这里需要指出的是,本发明中的具体实施只是列举了本发明的个别实例,使用本发明的设计思想及其等效变化实现的方案,均应属于本发明的保护范围。


技术特征:

1.一种基于图像的小型动物识别方法,其特征在于,所述方法包括以下步骤:

步骤1:将图像缩小为32×32的图像;

步骤2:输入层输入图片的长度,宽度和深度,长和宽代表图像大小,本发明输入的为步骤1中缩小后的32×32大小的图像,其长度为32,宽度为32;深度代表图像的彩色通道,输入的为rgb三色通道,故彩色图像深度为3,即输入的图像为32×32×3;

步骤3:构建卷积神经网络结构,过程如下:

步骤3-1:卷积层c1对输入层输入的图像矩阵进行卷积操作,提取特征,经过激励函数的作用得到特征图,卷积层特征图公式如式(1)所示:

式(1)中,代表第1层第j个神经元,f为激励函数,mj代表前一层输出特征图集合,代表第l-1层上第i个神经元,*代表卷积运算,代表l-1层第i个神经元到l层第j个神经元的卷积核矩阵,代表1层第j个神经元的偏置;

激励函数为relu函数,relu函数如式(2)所示:

relu(x)=max(0,x)(2)

在样本数小于参数个数的情况下,样本矩阵很可能是不可逆的,而引入正则化项则会解决这个问题;正则化项的引入平衡了偏差与方差、拟合能力与泛化能力、经验风险与结构风险,使用l2正则化方法如式(3)所示:

c0代表原始的代价参数,w为共享权重,λ为给定的正则顶系数,n代表神经元个数,则化项的系数为1×10-4

卷积层c1通过32个5×5的卷积核同时对权重进行l2正则化,得到32个28×28×3的特征图;

步骤3-2:亚采样层s1根据图像的局部相关原理,对卷积层输出的特征图在相邻的小区域内进行聚合取样,在减少特征和参数的同时,保留图像的有用信息,使用stochastic-pooling方法,对像素点按照数值大小赋予概率,再按照概率进行亚采样;

亚采样层s1在2×2的区域内对步骤3-1中的卷积层c1产生的特征图进行亚采样,步长为1,得到32个14×14×3的特征图;

步骤3-3:卷积层c2同步骤3-1中的卷积层c1提取特征图的方式一样,唯一区别为卷积层c2的卷积核为3×3,其卷积层特征图公式如式(1)所示,使用的激励函数如式(2)所示,使用的l2正则化方法如式(3)所示;

卷积层c2通过32个3×3的卷积核同时对权重进行l2正则化,得到1024个12×12×3的特征图;

步骤3-4:亚采样层s2与步骤3-2中的亚采样层s1方法相同,亚采样层s2在2×2的区域内对卷积层c2产生的特征图进行亚采样,步长为1,得到1024个6×6×3的特征图;

步骤3-5:对步骤3-4中的特征图采取flatten操作,产生一维特征向量输入全链接层,全链接层有三层分别是:

全链接层f1的大小为256;

全链接层f2的大小为128,然后采用dropout方法对某一层的神经元按照一定概率激活,dropout的概率参数为0.5,全链接层f2的激励函数使用relu函数,具体表达式如式(2)所示;

全链接层f3的大小为64,然后采用dropout方法对某一层的神经元按照一定概率激活,dropout的概率参数为0.5,全链接层f3的激励函数使用relu函数,具体表达式如式(2)所示;

步骤4:输出层为分类器,作用为输出属于各个类别的概率,并且所有类别的概率值之和为1,使用的分类器函数为soft-max函数,soft-max函数公式见式(4):

式(4)中,h(x(i))表示样本i属于第k类的概率,总类别数为k。

技术总结
一种基于图像的小型动物识别方法,包括以下步骤:步骤1:将图像缩小为32×32;步骤2:将32×32的图像输入到RBG三色通道;步骤3:将32×32×3的图像输入到卷积神经网络模型,识别分类;步骤4:将识别的结果输出,在卷积神经网络的卷积层中加入的L2正则化项,正则化项的引入平衡了偏差与方差、拟合能力与泛化能力、经验风险与结构风险;卷积层使用的激励函数为Relu函数,Relu函数会使一部分神经元的输出为0;全链接层加入了dropout方法,dropout方法能够在训练中随机删除神经元以及它们之间所属关系。本发明提高泛化能力,增强识别度。

技术研发人员:孟利民;盛锡鸣;应颂翔;蒋维;林梦嫚
受保护的技术使用者:浙江工业大学
技术研发日:2020.01.13
技术公布日:2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-52976.html

最新回复(0)