本申请涉及数字图像处理领域,尤其涉及一种图像处理方法及装置。
背景技术:
现有技术中,有对于白天火灾视频,检测满足颜色特点的区域,检测视频中的持续运动区域,求出既满足火焰颜色特征又满足火焰持续运动特征的区域,作为潜在火焰区域;对于所有的潜在火焰区域进行轮廓合并,得到火焰前景区域,对疑似火焰区域进行特征提取,并建立和训练建立支持向量机(supportvectormachine,svm)分类器。但存在的问题是:处理繁琐,鲁棒性不好,人工提取的特征基向量生成的向量空间不能覆盖火焰的真实特征空间,支持向量机的误报率和漏报率偏高。
技术实现要素:
本申请实施例提供了一种机器人示教器的按键布局方法及装置,用以提高火焰区域的检出率,降低误报率。
本申请实施例提供的一种图像处理方法,包括:
采集图像,并对采集到的图像进行高动态范围曝光合成,生成待检测图像;
对所述待检测图像进行火焰区域检测,当确定存在火焰区域时,发送报警信息。
通过该方法,采集图像,并对采集到的图像进行高动态范围曝光合成,生成待检测图像;对所述待检测图像进行火焰区域检测,当确定存在火焰区域时,发送报警信息,从而提高火焰区域的检出率,降低误报率。
可选地,对采集到的图像进行高动态范围曝光合成,生成待检测图像,具体包括:
对采集到的图像进行稳像处理和高动态范围曝光合成,生成待检测图像。
可选地,对采集到的图像进行高动态范围曝光合成,具体包括:将采集到的多张曝光度不同的图像合成一张图像。
可选地,对所述待检测图像进行火焰区域检测,具体包括:
采用128个滤波器对所述待检测图像进行火焰区域检测。
可选地,所述128个滤波器中有64个滤波器是预设的用于检测图像中的火焰边缘的边缘检测滤波器。
相应地,在装置侧,本申请实施例提供的一种图像处理装置,该装置包括:
第一单元,用于采集图像,并对采集到的图像进行高动态范围曝光合成,生成待检测图像;
第二单元,用于对所述待检测图像进行火焰区域检测,当确定存在火焰区域时,发送报警信息。
可选地,所述第一单元具体用于:
对采集到的图像进行稳像处理和高动态范围曝光合成,生成待检测图像。
可选地,所述第二单元具体用于:
采用128个滤波器对所述待检测图像进行火焰区域检测。
本申请实施例还提供的一种图像处理装置,该装置包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行上述本申请实施例提供的任一种所述的方法。
本申请另一实施例提供了一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令,所述计算机可执行指令用于使所述计算机执行上述任一种方法。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种图像方法示意图;
图2为本申请实施例提供的一种基于改进的faster-rcnn多类型火焰检测方法的处理流程示意图;
图3为本申请实施例提供的一种图像处理装置示意图;
图4为本申请实施例还提供的图像处理装置示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,并不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供了一种图像处理方法及装置,提高火焰区域的检出率,降低误报率。
下面结合说明书附图对本申请各个实施例进行详细描述。需要说明的是,本申请实施例的展示顺序仅代表实施例的先后顺序,并不代表实施例所提供的技术方案的优劣。
本申请实施例涉及一种机器人辨识及处理居家火焰的方法,扫地机器人(即本申请实施例提供的装置)在清扫的过程中,通过拍摄前方路面的图像,并基于改进的faster-rcnn算法标定所拍摄的当前图像中的火焰区域。这种基于深度学习的检测方法,可以准确检测出地面上的区域是否存在火焰。此外,在标定火焰区域之后,通过手机app向户主发送报警信息,避免火灾发生,提高了机器人的实用性。
参见图1,为本申请实施例提供的一种图像处理方法,包括:
s101、采集图像,并对采集到的图像进行高动态范围曝光合成,生成待检测图像;
高动态范围曝光指根据不同曝光时间的低动态范围图像,利用每个曝光时间相对应最佳细节的低动态范围图像来合成最终高动态范围图像,能更好的反映人真实环境中的视觉效果。
s102、对所述待检测图像进行火焰区域检测,当确定存在火焰区域时,发送报警信息。
例如,可以检测出直径为10cm~200cm的火焰区域。火焰直径的测量可采用如下方法:将一张报纸点燃,将所测量的报纸的直径作为火焰直径。
可选地,对采集到的图像进行高动态范围曝光合成,生成待检测图像,具体包括:
对采集到的图像进行稳像处理和高动态范围曝光合成,生成待检测图像。
可选地,对采集到的图像进行高动态范围曝光合成,具体包括:将采集到的多张曝光度不同的图像合成一张图像。
对采集到的图像进行高动态范围合成,确保用于检测的图像接近于目视效果,从而提高了检出率,降低了误报率,例如,本申请实施例的检出率大于95%,误报率小于0.1%。而且,对灯光干扰适应性也更强。
可选地,对所述待检测图像进行火焰区域检测,具体包括:
采用128个滤波器对所述待检测图像进行火焰区域检测。
faster-rcnn检测器中使用vgg16卷积神经网络作为基础网络,将vgg16卷积神经网络的第一个卷积层使用的64个滤波器增加到128个,通过这128个滤波器对待检测图像进行火焰区域检测。在faster-rcnn检测器对数据进行训练时,caffe(卷积神经网络框架,convolutionalarchitectureforfastfeatureembedding)会自动随机生成滤波器算子填充滤波器,本申请为了突出图像中的边缘特征的权重,增加64个滤波器,对这64个滤波器中填充预先确定好的滤波器算子。
卷积层的功能是对输入数据进行特征提取,卷积层的内部包含多个卷积核。卷积核指图像处理时,给定输入图像,在输出图像中每一个像素是输入图像中一个小区域中像素的加权平均,其中权值由一个函数定义,这个函数称为卷积核。例如,sobel边缘检测算子等一系列滤波算子被称为卷积核。
可选地,所述128个滤波器中有64个滤波器是预设的用于检测图像中的火焰边缘的边缘检测滤波器。
所述128个滤波器中有64个滤波器是经过人工干预的,从而更加适应火焰形状的变化。首先通过边缘检测算子(例如,sobel边缘检测算子、拉普拉斯算子)对训练数据进行图像边缘提取,将64个提取效果好的边缘检测算子送入caffe,把公版的caffe做修正。caffe是一种常用的深度学习框架,主要应用在视频、图像处理方面的应用上。
在数字图像中,图像最基本的特征是边缘,边缘是指图像局部变化最显著的部分,边缘主要存在于目标与目标,目标与背景之间。
参见图2,为本申请实施例提供的一种基于改进的faster-rcnn多类型火焰检测方法的处理流程图,主要步骤包括:
步骤一,基于摄像头,扫地机器人在运动过程中拍摄前方地面的图像;
通过扫地机器人的前置摄像头,采集室内空间的图像,并将采集到的图像进行稳像处理,高动态范围曝光(high-dynamicrange,hdr)合成,产生输入faster-rcnn检测器的待检测图像,其中,对图像进行hdr合成,具体包括:将多张(例如,3张)曝光度不同的图像融合为1张图像,确保图像中没有过曝部分及过暗部分,使图像接近于目视效果。
步骤二,应用改进的faster-rcnn算法对图像进行检测,并判断是否框选出火焰区域;
本申请实施例中faster-rcnn检测器使用vgg16卷积神经网络作为基础网络,并将vgg16卷积神经网络的第一个卷积层中使用的64个滤波器增加到128个,从而增强对小目标的检测精度。
对第一个卷积层中新增加的64个滤波器填充预设的边缘检测算子,边缘检测算子例如为sobel边缘检测算子或拉普拉斯算子。也就是说,先通过边缘检测算子对训练数据进行图像边缘提取,将提取效果比较好的64个算子作为预设的边缘检测算子。通过新增加的边缘检测算子,使faster-rcnn检测器在确定是否为火焰区域,以及回归计算火焰的外包矩形区(bbox)的偏移时(即在bbox的中心、宽和高的回归过程中),可以提高火焰形态特征所占权重。
步骤三,如果框选出火焰区域,机器人通过手机app向户主发送报警信息,如果没有框选出火焰区域,机器人继续拍摄前方地面的图像。
下面是本申请的一个具体实施例:
通过扫地机器人的前置摄像头采集居家环境地板上的火焰图像4万张,其中3万张作为训练集,1万张作为验证集。图像的解析度(分辨率)为1280*720,有rgb(红、绿、蓝)三个通道。
火焰图像包括以下一些情况:
居家环境光线包括:早上、中午、晚上;
火焰直径包括:10cm、20cm……200cm;
火焰形态包括:单尖角、多尖角、无规则;
地板颜色包括:白色、橙黄色;
地板材质包括:大理石、人工大理石、木质、瓷砖;
以上条件构建的张量空间,可以确保样本图像的多样性,提供泛化能力,同时降低采样及标定的工作量。
将图像中的火焰区域进行拉框标定,生成标定文件label.xml,标定文件中包含训练集和验证集。
将标定文件和原始图像输入改进后的faster-rcnn系统中进行交替训练,并生成fire_detection_vgg16.caffemodel文件,该文件是训练完成后,生成的网络参数文件,也就是网路链接的权重。
将fire_detection_vgg16.caffemodel文件及检测用fire.prototxt文件加载到芯片中(也就是说,对火焰图像数据训练和验证结束后,将相关的数据和文件加载到芯片中)。fire.prototxt文件是用来描述网络结构的文本文件,进行检测时,caffe需要输入该文件,重构网络。
将芯片植入扫地机器人,从而使扫地机器人在作业过程中,可以检测火焰,并通过手机app向户主发送报警信息。
本申请实施例也可以通过更换训练数据集来检测其他各种危险情况,例如,检测落在地上的刀具、钉子等可能伤害人体的物品。
相应地,在装置侧,参见图3,为本申请实施例提供的一种图像处理装置,包括:
第一单元11,用于采集图像,并对采集到的图像进行高动态范围曝光合成,生成待检测图像;
第二单元12,用于对所述待检测图像进行火焰区域检测,当确定存在火焰区域时,发送报警信息。
可选地,所述第一单元11具体用于:
对采集到的图像进行稳像处理和高动态范围曝光合成,生成待检测图像。
可选地,所述第二单元12具体用于:
采用128个滤波器对所述待检测图像进行火焰区域检测。
参见图4,为本申请实施例还提供的一种图像处理装置,包括:
处理器600,用于读取存储器610中的程序,执行下列过程:
采集图像,并对采集到的图像进行高动态范围曝光合成,生成待检测图像;
对所述待检测图像进行火焰区域检测,当确定存在火焰区域时,发送报警信息。
通过该装置,采集图像,并对采集到的图像进行高动态范围曝光合成,生成待检测图像;对所述待检测图像进行火焰区域检测,当确定存在火焰区域时,发送报警信息,从而提高火焰区域的检出率,降低误报率。
可选地,对采集到的图像进行高动态范围曝光合成,生成待检测图像,具体包括:
对采集到的图像进行稳像处理和高动态范围曝光合成,生成待检测图像。
可选地,对采集到的图像进行高动态范围曝光合成,具体包括:将采集到的多张曝光度不同的图像合成一张图像。
可选地,对所述待检测图像进行火焰区域检测,具体包括:
采用128个滤波器对所述待检测图像进行火焰区域检测。
可选地,所述128个滤波器中有64个滤波器是预设的用于检测图像中的火焰边缘的边缘检测滤波器。
其中,在图4中,总线架构可以包括任意数量的互联的总线和桥,具体由处理器600代表的一个或多个处理器和存储器610代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口提供接口。
本申请实施例还提供了一种计算设备,具体可以为桌面计算机、便携式计算机、智能手机、平板电脑、个人数字助理(personaldigitalassistant,pda)等。该显示终端可以包括中央处理器(centerprocessingunit,cpu)、存储器、输入/输出设备等,输入设备可以包括键盘、鼠标、触摸屏等,输出设备可以包括显示设备,如液晶显示器(liquidcrystaldisplay,lcd)、阴极射线管(cathoderaytube,crt)等。
针对不同的用户设备,可选地,用户接口620可以是能够外接内接需要设备的接口,连接的设备包括但不限于小键盘、显示器、扬声器、麦克风、操纵杆等。
处理器600负责管理总线架构和通常的处理,存储器610可以存储处理器600在执行操作时所使用的数据。
可选地,处理器600可以是cpu(中央处埋器)、asic(applicationspecificintegratedcircuit,专用集成电路)、fpga(field-programmablegatearray,现场可编程门阵列)或cpld(complexprogrammablelogicdevice,复杂可编程逻辑器件)。
存储器610可以包括只读存储器(rom)和随机存取存储器(ram),并向处理器提供存储器中存储的程序指令和数据。在本申请实施例中,存储器可以用于存储本申请实施例提供的任一所述方法的程序。
处理器通过调用存储器存储的程序指令,处理器用于按照获得的程序指令执行本申请实施例提供的任一所述方法。
本申请实施例提供了一种计算机存储介质,用于储存为上述本申请实施例提供的装置所用的计算机程序指令,其包含用于执行上述本申请实施例提供的任一方法的程序。
所述计算机存储介质可以是计算机能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(mo)等)、光学存储器(例如cd、dvd、bd、hvd等)、以及半导体存储器(例如rom、eprom、eeprom、非易失性存储器(nandflash)、固态硬盘(ssd))等。
综上所述,本申请实施例提供了一种图像处理方法及装置,对灯光干扰适应性以及对火焰形状的变化适应性更强,并且提高了火焰区域的检出率,降低误报率。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
1.一种图像处理方法,其特征在于,该方法包括:
采集图像,并对采集到的图像进行高动态范围曝光合成,生成待检测图像;
对所述待检测图像进行火焰区域检测,当确定存在火焰区域时,发送报警信息。
2.根据权利要求1所述的方法,其特征在于,对采集到的图像进行高动态范围曝光合成,生成待检测图像,具体包括:
对采集到的图像进行稳像处理和高动态范围曝光合成,生成待检测图像。
3.根据权利要求1所述的方法,其特征在于,对采集到的图像进行高动态范围曝光合成,具体包括:将采集到的多张曝光度不同的图像合成一张图像。
4.根据权利要求1所述的方法,其特征在于,对所述待检测图像进行火焰区域检测,具体包括:
采用128个滤波器对所述待检测图像进行火焰区域检测。
5.根据权利要求4所述的方法,其特征在于,所述128个滤波器中有64个滤波器是预设的用于检测图像中的火焰边缘的边缘检测滤波器。
6.一种图像处理装置,其特征在于,该方法包括:
第一单元,用于采集图像,并对采集到的图像进行高动态范围曝光合成,生成待检测图像;
第二单元,用于对所述待检测图像进行火焰区域检测,当确定存在火焰区域时,发送报警信息。
7.根据权利要求6所述的装置,其特征在于,所述第一单元具体用于:
对采集到的图像进行稳像处理和高动态范围曝光合成,生成待检测图像。
8.根据权利要求6所述的装置,其特征在于,所述第二单元具体用于:
采用128个滤波器对所述待检测图像进行火焰区域检测。
9.一种计算设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行权利要求1~5任一项所述的方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机可执行指令,所述计算机可执行指令用于使所述计算机执行权利要求1至5任一项所述的方法。
技术总结