本申请涉及图像处理技术领域,尤其涉及一种图像倾斜校正的方法、装置、电子设备和存储介质。
背景技术:
用户在进行企业认领、购买产品等业务场景中,常需要提交企业、组织或个人身份证明材料进行身份认证。这些身份证明材料一般包括具有法律效益或社会公认机构颁发的各种从业证书的图像,即资质图像,如营业执照、组织机构代码证书、社会团体法人证书、事业单位法人证书、民办非企业证书、食品经营许可证、人力资源服务许可证、律师事务所执业许可证等证书图像。认证服务器通过对用户上传的资质图像中的关键信息的提取,且将资质图像中的信息和官方数据进行比对,以进行身份认证。资质图像由用户拍照上传,可能会存在0-360度的倾斜,而图像的倾斜会对提取的图像中的信息的准确率产生较大干扰。
现有技术中,认证服务器通常基于图像上的全部像素块进行整体轮廓提取,以生成轮廓的外接矩形,并根据外接矩形的倾斜角度对图像进行倾斜校正。
但该种方法只能基于外接矩形进行正负45度以内的倾斜校正,不支持90度倍数的倾斜矫正,造成校正后的图像中的文字垂直于水平方向,导致倾斜校正失败。
技术实现要素:
本申请提供一种图像倾斜校正的方法、装置、电子设备和存储介质,能够实现对图像进行90度倍数的倾斜矫正,使得校正后的图像的文字方向正立。
本申请第一方面提供一种图像倾斜校正的方法,包括:根据待处理图像中的文本行的外接矩形,对所述待处理图像进行旋转处理,得到所述待处理图像的初始校正图像,所述初始校正图像中的文本行的外接矩形与水平方向垂直或平行;若所述初始校正图像中的文本行中的文字方向非正立,则对所述初始校正图像进行旋转处理,得到所述待处理图像的校正图像,所述校正图像中的文本行的文字方向为正立。
本实施例中能够在根据待处理图像中的文本行的外接矩形对图像进行旋转后,还可以根据旋转后的图像中的文字方向进一步对图像进行大角度的旋转,使得转转后的图像中的文字方向正立。
在一种可能的设计中,所述待处理图像中的文本行的外接矩形为多个,所述根据待处理图像中的文本行的外接矩形,对所述待处理图像进行旋转处理,得到所述待处理图像的初始校正图像,包括:获取所述待处理图像中的每个文本行的外接矩形与水平方向和竖直方向的夹角中的最小角度;将数量最多的最小角度作为第一旋转角度;将所述对所述待处理图像旋转所述第一旋转角度,得到所述初始校正图像。
在一种可能的设计中,所述获取每个所述待处理图像中的文本行的外接矩形与水平方向和竖直方向的夹角中的最小角度之前,还包括:对所述待处理图像的二值化图像进行轮廓检测,获取文本行的目标轮廓,所述目标轮廓的面积在预设面积范围内,且所述目标轮廓的长宽比在预设比例范围内;生成所述目标轮廓的外接矩形,所述目标轮廓的外接矩形为所述待处理图像中的文本行的外接矩形。
在该设计中,设置预设面积范围以及预设比例范围的可以过滤非文本行的前景区域,进而使得获取的目标轮廓均为文本行的轮廓。
在一种可能的设计中,所述对所述待处理图像的二值化图像进行轮廓检测之前,包括:将所述待处理图像压缩至预设尺寸;对压缩后的图像进行二值化处理,获取二值化图像;按照预设膨胀腐蚀因子,对所述二值化图像中的前景区域进行腐蚀膨胀处理,以获取所述待处理图像的二值化图像。
在该设计中,鉴于二值化图像的尺寸与膨胀腐蚀因子关联,将待处理图像压缩至预设尺寸可以避免对不同尺寸的二值化图像,需要选择合适的膨胀腐蚀因子的复杂操作,且该预设的膨胀腐蚀因子是适合于该尺寸的二值化图像的,可以达到很好的区分前景区域和背景区域的效果。
在一种可能的设计中,所述生成所述目标轮廓的外接矩形之后,还包括:确定所述待处理图像的中心位置;过滤距离所述待处理图像的中心位置的距离大于第一预设距离的外接矩形。
该设计中,可以过滤非重要的文本行(远离待处理图像的中心位置的文本行),采用该距离所述待处理图像的中心位置的距离小于第一预设距离的外接矩形进行处理,可以提高图像倾斜校正的准确性。
在一种可能的设计中,所述若所述初始校正图像中的文本行中的文字方向非正立,则对所述初始校正图像进行旋转处理,得到所述待处理图像的校正图像,包括:将距离所述初始校正图像的中心位置的第二预设距离范围内的文本行的外接矩形作为目标外接矩形;获取所述目标外接矩形中的文本行的文字方向与水平方向的夹角;将数量最多的夹角作为第二旋转角度;将所述初始校正图像旋转所述第二旋转角度,得到所述校正图像。
在该设计中,可以根据旋转后的图像中的文字方向进一步对图像进行大角度的旋转,使得转转后的图像中的文字方向正立。
在一种可能的设计中,所述将距离初始校正图像的中心位置的第二预设距离范围内的文本行的外接矩形作为目标外接矩形之前,还包括:根据所述外接矩形的横坐标、纵坐标,确定所述待处理图像的中心位置。
在一种可能的设计中,所述根据待处理图像中的文本行的外接矩形,对所述待处理图像进行旋转处理之前,包括:接收用户输入的所述待处理图像。
在一种可能的设计中,所述待处理图像为资质图像,所述得到所述待处理图像的校正图像之后,还包括:识别所述校正图像中的资质信息;对所述校正图像中的资质信息进行认证,输出资质认证结果。
在该设计中,鉴于本申请可以对待处理图像进行90度倍数的倾斜校正,因此可以提高本实施例中资质信息的识别准确性,进一步能够提高资质认证结果的准确性。
本申请的第二方面提供一种图像倾斜校正的装置,包括:
处理模块,用于根据待处理图像中的文本行的外接矩形,对所述待处理图像进行旋转处理,得到所述待处理图像的初始校正图像,所述初始校正图像中的文本行的外接矩形与水平方向垂直或平行,且若所述初始校正图像中的文本行中的文字方向非正立,则对所述初始校正图像进行旋转处理,得到所述待处理图像的校正图像,所述校正图像中的文本行的文字方向为正立。
可选的,所述待处理图像中的文本行的外接矩形为多个。
对应的,所述处理模块,具体用于获取所述待处理图像中的每个文本行的外接矩形与水平方向和竖直方向的夹角中的最小角度;将数量最多的最小角度作为第一旋转角度;将所述对所述待处理图像旋转所述第一旋转角度,得到所述初始校正图像。
可选的,所述处理模块,还用于对所述待处理图像的二值化图像进行轮廓检测,获取文本行的目标轮廓,所述目标轮廓的面积在预设面积范围内,且所述目标轮廓的长宽比在预设比例范围内;生成所述目标轮廓的外接矩形,所述目标轮廓的外接矩形为所述待处理图像中的文本行的外接矩形。
可选的,所述处理模块,还用于将所述待处理图像压缩至预设尺寸;对压缩后的图像进行二值化处理,获取二值化图像;按照预设膨胀腐蚀因子,对所述二值化图像中的前景区域进行腐蚀膨胀处理,以获取所述待处理图像的二值化图像。
可选的,所述处理模块,还用于确定所述待处理图像的中心位置;过滤距离所述待处理图像的中心位置的距离大于第一预设距离的外接矩形。
可选的,所述处理模块,具体用于将距离所述初始校正图像的中心位置的第二预设距离范围内的文本行的外接矩形作为目标外接矩形;获取所述目标外接矩形中的文本行的文字方向与水平方向的夹角;将数量最多的夹角作为第二旋转角度;将所述初始校正图像旋转所述第二旋转角度,得到所述校正图像。
可选的,所述处理模块,具体用于根据所述外接矩形的横坐标、纵坐标,确定所述待处理图像的中心位置。
收发模块,用于接收用户输入的所述待处理图像。
可选的,所述处理模块,还用于识别所述校正图像中的资质信息;对所述校正图像中的资质信息进行认证,输出资质认证结果。
上述第二方面以及各可能的设计提供的图像倾斜校正的装置,其有益效果可以参见上述第一方面以及各可能的设计所带来的有益效果,在此不加赘述。
本申请的第三方面提供一种电子设备,包括:至少一个处理器和存储器;所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述电子设备执行上述第一方面的图像倾斜校正的方法。
本申请的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机执行指令,当所述计算机执行指令被处理器执行时,实现上述第一方面的图像倾斜校正的方法。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为现有技术中的资质图像的变化示意图一;
图2为现有技术中的资质图像的变化示意图二;
图3为现有技术中的资质图像的变化示意图三;
图4为本申请提供的图像倾斜校正的方法的实施例一的流程示意图;
图5为本申请提供的校正图像的示意图;
图6为本申请提供的获取初始校正图像的流程示意图;
图7为本申请提供的获取校正图像的流程示意图;
图8为本申请提供的图像倾斜校正的方法的实施例二的流程示意图;
图9为本申请提供的图像倾斜校正的装置的界面变化示意图;
图10为本申请提供的图像倾斜校正的装置的结构示意图;
图11为本申请提供的电子设备的结构示意图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
在资质图像上传、认证的过程中,鉴于资质图像是由用户拍照上传的,上传的资质图像可能存在倾斜。鉴于图像倾斜会对识别资质图像中的信息有影响,因此需要对资质图像进行倾斜校正。
图1为现有技术中的资质图像的变化示意图一。如图1中的(a)所示,该资质图像与水平方向呈60度的倾斜,与竖直方向对应的呈30度的倾斜。现有技术中,基于图像上的全部像素块进行整体轮廓提取,生成轮廓的外接矩形,并根据外接矩形的倾斜角度对图像进行倾斜校正。示例性的,如将资质图像整体或部分作为一个轮廓,图1中的虚线为轮廓的外接矩形。对应的,可以根据该外接矩形与水平方向或竖直方向的夹角,确定资质图像的旋转角度,以对资质图像进行倾斜校正。示例性的,可以确定外接矩形与水平方向的夹角为60度,与竖直方向的夹角为30度,则可以将资质图像朝竖直方向旋转30度,以使得资质图像与竖直方向平行。进而使得旋转后的资质图像中的文字正立(即文本行与水平方向平行,且不倒置),如图1中的(b)所示。应理解,资质图像的旋转角度为与水平方向或与竖直方向的夹角中较小的角度,以使得对图像的旋转处理对原始的资质图像的影响尽可能小。
如上图1中可以使得旋转后的资质图像中的文字正立,能够提高信息识别准确性。图2为现有技术中的资质图像的变化示意图二。如图2中的(a)所示,如确定外接矩形与水平方向的夹角为30度,与竖直方向的夹角为60度,则可以将资质图像朝水平方向旋转30度,以使得资质图像与水平方向平行。对应的,可以使得资质图像中的文字非正立,与水平方向向垂直,如图1中的(b)所示。此时旋转后的资质图像中的文字为非正立,进而影响资质图像中信息的识别。
或者,图3为现有技术中的资质图像的变化示意图三。如图3中的(a)所示,资质图像虽与水平方向呈60度的倾斜,与竖直方向对应的呈30度的倾斜。且对应的,外接矩形与水平方向的夹角为60度,与竖直方向的夹角为30度,则可以将资质图像朝竖直方向旋转30度,以使得资质图像与竖直方向平行。但旋转后的资质图像中的文本行虽然与水平方向平行,但文字方向是倒置的,非正立的,如图3中的(b)所示,此时旋转后的资质图像也会影响资质图像中信息的识别。
如上图1至图3所示,现有技术中只能进行正负45度以内的倾斜校正,不支持90度倍数的倾斜矫正,进而可能会造成如上图2和图3中的校正后的图像中的文字非正立,导致倾斜校正失败,进一步影响信息的识别。
现有技术中影响信息的识别的原因是倾斜校正后的图像中的文字倒立或垂直于水平方向。为了使得倾斜校正后的图像中的文字正立,以便于信息的识别,本申请中提供了一种基于文字方向对上述倾斜校正后的图像进行进一步旋转处理的方案,使得旋转后的图像中的文字正立,且实现了对图像的90度倍数的倾斜矫正的目的。
应理解,本申请中提供的图像倾斜校正的方法不仅适用于对资质图像的倾斜校正,还可以适用于对包含有文字的图像的倾斜校正。可选的,本实施例中的对待处理图像的倾斜校正方法可以适用“用户需求对拍摄的图像进行倾斜校正”的场景中,或还可以使用在对“用户上传的图像先进行倾斜校正,后进行进一步处理”的场景中,其中,“进一步处理”可以为对图像中的信息进行识别,或将图像进行扫描版本、pdf版本转化等。
下述结合具体的实施例对本申请提供的图像倾斜校正的方法进行说明。图4为本申请提供的图像倾斜校正的方法的实施例一的流程示意图。图4所示方法流程的执行主体可以为图像倾斜校正的装置,该图像倾斜校正的装置可由任意的软件和/或硬件实现。如图4所示,本实施例提供的图像倾斜校正的方法可以包括:
s401,根据待处理图像中的文本行的外接矩形,对待处理图像进行旋转处理,得到待处理图像的初始校正图像,初始校正图像中的文本行的外接矩形与水平方向垂直或平行。
应理解,本实施例中的待处理图像中的文本行的外接矩形,可以为待处理图像中的文本行的最小外接矩形。可选的,确定待处理图像中的文本行的最小外接矩形的方式可以为:对待处理图像进行二值化处理,进而能够获取待处理图像的前景区域和背景区域,进而对前景区域进行轮廓提取,生成轮廓的外接矩形,即为待处理图像中的文本行的外接矩形。
本实施例中可以根据待处理图像中的文本行的外接矩形与水平方向和竖直方向的夹角,对待处理图像进行旋转,以得到待处理图像的初始校正图像。其中,初始校正图像中的文本行的外接矩形与水平方向垂直或平行。
可选的,为了减小旋转处理对待处理图像的影响,本实施例中可以确定待处理图像中的文本行的外接矩形与水平方向和竖直方向的夹角中的较小的角度,以对待处理图像进行旋转。示例性的,待处理图像中的文本行的外接矩形与水平方向的夹角为20度,以及与竖直方向的夹角为80度,则可以对待处理图像旋转20度,得到初始校正图像,初始校正图像中的文本行的外接矩形与水平方向平行。
示例性的,如图1-图3中的(b)所示,本实施例中的初始校正图像中的文本行的外接矩形与水平方向垂直或平行。
s402,若初始校正图像中的文本行中的文字方向非正立,则对初始校正图像进行旋转处理,得到待处理图像的校正图像,校正图像中的文本行的文字方向为正立。
本实施例中,可以通过识别初始校正图像中的文本行中的文字方向,若初始校正图像中的文本行中的文字方向非正立,则对初始校正图像进行旋转处理。可选的,可以通过光学字符识别(opticalcharacterrecognition,ocr)技术识别初始校正图像中的文本行中的文字方向。
其中,应理解,本实施例中不直接使用ocr技术识别待处理图像中的文本行中的文字方向,而是对初始校正图像中的文本行中的文字方向进行识别,在初始校正图像的基础上进行进一步旋转,是因为ocr技术对0度、90度、180度、270度的文字方向的识别准确率要高于普通的角度(如1度-89度、91度-179度等)的文字方向的识别准确率。
本实施例中,在确定初始校正图像中的文本行中的文字方向非正立,则可以对初始校正图像进行旋转处理,得到待处理图像的校正图像。其中,旋转得到的校正图像中的文本行的文字方向为正立。
示例性的,如上述图1中的(b)所示,采用ocr技术可以确定初始校正图像中的文本行中的文字方向为正立,而上述图2和图3中的(b)中的文本行中的文字方向为非正立,则对图2和图3中的(b)(即初始校正图像)进行旋转,得到校正图像。图5为本申请提供的校正图像的示意图。如图5所示,图2和图3中的(b)旋转后的图像中的文本行的文字方向为正立。
本实施例提供的图像倾斜校正的方法包括:根据待处理图像中的文本行的外接矩形,对待处理图像进行旋转处理,得到待处理图像的初始校正图像,初始校正图像中的文本行的外接矩形与水平方向垂直或平行;若初始校正图像中的文本行中的文字方向非正立,则对初始校正图像进行旋转处理,得到待处理图像的校正图像,校正图像中的文本行的文字方向为正立。该方法中能够在根据待处理图像中的文本行的外接矩形对图像进行旋转后,还可以根据旋转后的图像中的文字方向进一步对图像进行大角度的旋转,使得转转后的图像中的文字方向正立。
在上述实施例的基础上,下面对如何获取待处理图像的初始校正图像和校正图像的过程进行说明。
图6为本申请提供的获取初始校正图像的流程示意图。如图6所示,上述s401可以包括:
s4011,获取待处理图像中的每个文本行的外接矩形与水平方向和竖直方向的夹角中的最小角度。
本实施例中的待处理图像中的文本行的外接矩形为多个,获取每个文本行的外接矩形与水平方向和竖直方向的夹角中的最小角度。其中,本实施例中可以是每个文本行的外接矩形与水平方向的夹角,以及每个文本行的外接矩形与竖直方向的夹角,进一步的,可以确定每个文本行的外接矩形与水平方向和竖直方向的夹角中的最小角度。
示例性的,以一个文本行的外接矩形为例,获取该文本行的外接矩形与水平方向的夹角,以及与竖直方向的夹角分别为30度和60度,则确定该文本行的外接矩形与水平方向和竖直方向的夹角中的最小角度为30度。
s4012,将数量最多的最小角度作为第一旋转角度。
据上,可以获取每个文本行的外接矩形与水平方向和竖直方向的夹角中的最小角度,本实施例中以数量最多的最小角度作为第一旋转角度。
示例性的,如最小角度为30度的数量有10个,而最小角度为20度的数量有1个,则可以将30度作为第一旋转角度。
s4013,将对待处理图像旋转第一旋转角度,得到初始校正图像。
本实施例中确定第一旋转角度后,可以将对待处理图像旋转第一旋转角度,得到初始校正图像。
示例性的,与水平方向的夹角为30度为第一旋转角度,则可以将待处理图像超水平方向旋转30度,得到文本行的外接矩形与水平方向平行的初始校正图像。
可选的,在s4011之前还可以包括;
s4014,对待处理图像的二值化图像进行轮廓检测,获取文本行的目标轮廓,目标轮廓的面积在预设面积范围内,且目标轮廓的长宽比在预设比例范围内。
本实施例中,可以将待处理图像压缩至预设尺寸,然后对压缩后的图像进行二值化处理,获取二值化图像。其中,对待处理图像压缩至预设尺寸的目的是为了采用预设的膨胀腐蚀因子对二值化图像进行处理。因为对二值化图像的膨胀腐蚀,采用合适的膨胀腐蚀因子才能有效区分前景区域和背景区域。为了避免对不同尺寸的二值化图像,需要选择合适的膨胀腐蚀因子的复杂操作,本实施例中将待处理图像压缩至预设尺寸,形成二值化图像后,可以采用预设的一个膨胀腐蚀因子对二值化图像进行处理,既能够避免选择合适的膨胀腐蚀因子的操作,且该预设的膨胀腐蚀因子是适合于该尺寸的二值化图像的,可以达到很好的区分前景区域和背景区域的效果。
进一步的,可以对待处理图像的二值化图像进行轮廓检测,获取文本行的目标轮廓。值得注意的是,在对待处理图像的二值化图像进行轮廓检测时,可能会获取多个文本行的轮廓,本实施例中获取每个文本行的轮廓的面积和长宽比,将面积在预设面积范围内,且长宽比在预设比例范围内的文本行的轮廓作为目标轮廓。
其中,本实施例中设置预设面积范围以及预设比例范围的目的就是为了过滤非文本行的前景区域。示例性的,资质图像中可能包含有用户头像、边框等图像,而这些对象不是文本检测的对象,采用ocr技术也无法确定这些对象的方向,因此本实施例中将这些干扰对象进行过滤。如,边框的长宽比较大,用户头像的面积较大,采用上述设置可以过滤非文本行的前景区域。
s4015,生成目标轮廓的外接矩形,目标轮廓的外接矩形为待处理图像中的文本行的外接矩形。
可选的,本实施例中还可以进一步在外接矩形中过滤非重要的文本行,保留重要文本行的外接矩形。其中,可以确定待处理图像的中心位置,进而过滤距离待处理图像的中心位置的距离大于第一预设距离的外接矩形。应理解,距离待处理图像的中心位置的距离大于第一预设距离的外接矩形为非重要的文本行。本实施例中的目标轮廓的外接矩形距离待处理图像的中心位置的距离小于第一预设距离。
本实施例中,确定待处理图像的中心位置的方式具体可以采用如下公式一和公式二:
其中,x为待处理图像的中心位置的横坐标,y为待处理图像的中心位置的纵坐标,n为文本行的外接矩形的个数,i大于等于0且小于等于n,xi为任意一个文本行的外接矩形的横坐标的均值,yi为任意一个文本行的外接矩形的纵坐标的均值。
其中,可以根据如下公式三获取每个文本行的外接矩形距离待处理图像的中心位置的距离:
其中,di为任意一个文本行的外接矩形距离待处理图像的中心位置的距离。
应理解,本实施例中的目标轮廓的外接矩形即为上述实施例中的待处理图像中的文本行的外接矩形。
可选的,图7为本申请提供的获取校正图像的流程示意图。如图7所示,上述s402可以包括:
s4021,将距离初始校正图像的中心位置的第二预设距离范围内的文本行的外接矩形作为目标外接矩形。
本实施例中,可以根据外接矩形的横坐标、纵坐标,确定待处理图像的中心位置。可选的,本实施例中可以根据上述公式一和公式二中相同的方式,获取待处理图像的中心位置。
进一步的,可以根据上述公式三获取文本行的外接矩形距离初始校正图像的中心位置的距离,本实施例中可以将距离初始校正图像的中心位置的第二预设距离范围内的文本行的外接矩形作为目标外接矩形。
s4022,获取目标外接矩形中的文本行的文字方向与水平方向的夹角。
本实施例中可以采用ocr技术获取目标外接矩形中的文本行的文字方向与水平方向的夹角。该夹角可以为90度、180度、270度。
s4023,将数量最多的夹角作为第二旋转角度。
本实施例中将数量最多的夹角作为第二旋转角度。示例性的,夹角为90度的数量有1个,夹角为180度的数量有10个,则将180度作为第二旋转角度。
s4024,将初始校正图像旋转第二旋转角度,得到校正图像。
本实施例中将初始校正图像旋转第二旋转角度,得到文字方向为正立的校正图像。
下面结合图8对本申请提供的图像倾斜校正的方法进行进一步详细说明。图8为本申请提供的图像倾斜校正的方法的实施例二的流程示意图。如图8所示,本实施例提供的图像倾斜校正的方法可以包括:
s801,接收用户输入的待处理图像。
本实施例中的图像可以为资质图像。在用户需求对资质图像验证时,可以向图像倾斜校正的装置上传该待处理图像。对应的。图像倾斜校正的装置可以接收到该待处理图像。
图9为本申请提供的图像倾斜校正的装置的界面变化示意图。如图9中的901所示,示例性的,该界面上显示有上传控件。用户通过点击或其他操作方式选择该上传控件,可以上传该待处理图像。应理解,图9中以图像倾斜校正的装置为智能手机为例进行示例说明。
s802,根据待处理图像中的文本行的外接矩形,对待处理图像进行旋转处理,得到待处理图像的初始校正图像,初始校正图像中的文本行的外接矩形与水平方向垂直或平行。
s803,若初始校正图像中的文本行中的文字方向非正立,则对初始校正图像进行旋转处理,得到待处理图像的校正图像,校正图像中的文本行的文字方向为正立。
应理解,本实施例中的s802-s803中的实施方式可以具体参照上述实施例中的s401-s402的相关描述,在此不做赘述。
s804,识别校正图像中的资质信息,对校正图像中的资质信息进行认证,输出资质认证结果。
本实施例中可以对倾斜校正后的图像,即校正图像进行识别,以识别校正图像中的资质信息。其中资质信息可以为该校正图像中表征的用户或企业的数据,如用户姓名、身份证号码、居住地址、企业名称、企业统一社会信用代码等信息。其中,本实施例中对识别校正图像中的资质信息的不做赘述,具体可以参照现有技术中的识别方法的相关描述。
其中,对校正图像中的资质信息进行认证,即为将校正图像中的资质信息与官方存储的数据的比对。在比对完成后可以输出资质认证结果。其中,若校正图像中的资质信息与官方存储的数据一致,则该资质认证结果为认证成功,若校正图像中的资质信息与官方存储的数据不一致,则该资质认证结果为认证失败。
示例性的,若资质认证结果为认证成功,则上述界面901可以跳转至界面902,该界面902上显示有“认证成功”的文字提醒信息。可选的,该界面902之前还可以显示有上传的待处理图像,如界面903所示。
本实施例中,可以对用户输入的待处理图像进行倾斜校正后,对其中的资质信息进行认证,鉴于本实施例中可以对待处理图像进行90度倍数的倾斜校正,因此可以提高本实施例中资质信息的识别准确性,进一步能够提高资质认证结果的准确性。
图10为本申请提供的图像倾斜校正的装置的结构示意图。如图10所示,该图像倾斜校正的1000包括:处理模块1001和收发模块1002。
处理模块1001,用于根据待处理图像中的文本行的外接矩形,对待处理图像进行旋转处理,得到待处理图像的初始校正图像,初始校正图像中的文本行的外接矩形与水平方向垂直或平行,且若初始校正图像中的文本行中的文字方向非正立,则对初始校正图像进行旋转处理,得到待处理图像的校正图像,校正图像中的文本行的文字方向为正立。
可选的,待处理图像中的文本行的外接矩形为多个。
对应的,处理模块1001,具体用于获取待处理图像中的每个文本行的外接矩形与水平方向和竖直方向的夹角中的最小角度;将数量最多的最小角度作为第一旋转角度;将对待处理图像旋转第一旋转角度,得到初始校正图像。
可选的,处理模块1001,还用于对待处理图像的二值化图像进行轮廓检测,获取文本行的目标轮廓,目标轮廓的面积在预设面积范围内,且目标轮廓的长宽比在预设比例范围内;生成目标轮廓的外接矩形,目标轮廓的外接矩形为待处理图像中的文本行的外接矩形。
可选的,处理模块1001,还用于将待处理图像压缩至预设尺寸;对压缩后的图像进行二值化处理,获取二值化图像;按照预设膨胀腐蚀因子,对二值化图像中的前景区域进行腐蚀膨胀处理,以获取待处理图像的二值化图像。
可选的,处理模块1001,还用于确定待处理图像的中心位置;过滤距离待处理图像的中心位置的距离大于第一预设距离的外接矩形。
可选的,处理模块1001,具体用于将距离初始校正图像的中心位置的第二预设距离范围内的文本行的外接矩形作为目标外接矩形;获取目标外接矩形中的文本行的文字方向与水平方向的夹角;将数量最多的夹角作为第二旋转角度;将初始校正图像旋转第二旋转角度,得到校正图像。
可选的,处理模块1001,具体用于根据外接矩形的横坐标、纵坐标,确定待处理图像的中心位置。
收发模块1001,用于接收用户输入的待处理图像。
可选的,处理模块1001,还用于识别校正图像中的资质信息;对校正图像中的资质信息进行认证,输出资质认证结果。
本实施例提供的图像倾斜校正的装置与上述图像倾斜校正的方法实现的原理和技术效果类似,在此不作赘述。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
图11为本申请提供的电子设备的结构示意图。如图11所示,是根据本申请实施例的图像倾斜校正的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图11所示,该电子设备包括:一个或多个处理器1101、存储器1102,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示gui的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图11中以一个处理器1101为例。
存储器1102即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的图像倾斜校正的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的图像倾斜校正的方法。
存储器1102作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的图像倾斜校正的方法对应的程序指令/模块。处理器1101通过运行存储在存储器1102中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的图像倾斜校正的方法。
存储器1102可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据用于执行图像倾斜校正的方法的电子设备的使用所创建的数据等。此外,存储器1102可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器1102可选包括相对于处理器1101远程设置的存储器,这些远程存储器可以通过网络连接至用于执行图像倾斜校正的方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
图像倾斜校正的方法的电子设备还可以包括:输入装置1103和输出装置1104。处理器1101、存储器1102、输入装置1103和输出装置1104可以通过总线或者其他方式连接,图11中以通过总线连接为例。
输入装置1103可接收输入的数字或字符信息,以及产生与用于执行图像倾斜校正的方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置1104可以包括显示设备、辅助照明装置(例如,led)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(lcd)、发光二极管(led)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用asic(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(pld)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
1.一种图像倾斜校正的方法,其特征在于,包括:
根据待处理图像中的文本行的外接矩形,对所述待处理图像进行旋转处理,得到所述待处理图像的初始校正图像,所述初始校正图像中的文本行的外接矩形与水平方向垂直或平行;
若所述初始校正图像中的文本行中的文字方向非正立,则对所述初始校正图像进行旋转处理,得到所述待处理图像的校正图像,所述校正图像中的文本行的文字方向为正立。
2.根据权利要求1所述的方法,其特征在于,所述待处理图像中的文本行为多个,所述根据待处理图像中的文本行的外接矩形,对所述待处理图像进行旋转处理,得到所述待处理图像的初始校正图像,包括:
获取所述待处理图像中的每个文本行的外接矩形与水平方向和竖直方向的夹角中的最小角度;
将数量最多的最小角度作为第一旋转角度;
将所述对所述待处理图像旋转所述第一旋转角度,得到所述初始校正图像。
3.根据权利要求2所述的方法,其特征在于,所述获取每个所述待处理图像中的文本行的外接矩形与水平方向和竖直方向的夹角中的最小角度之前,还包括:
对所述待处理图像的二值化图像进行轮廓检测,获取文本行的目标轮廓,所述目标轮廓的面积在预设面积范围内,且所述目标轮廓的长宽比在预设比例范围内;
生成所述目标轮廓的外接矩形,所述目标轮廓的外接矩形为所述待处理图像中的文本行的外接矩形。
4.根据权利要求3所述的方法,其特征在于,所述对所述待处理图像的二值化图像进行轮廓检测之前,包括:
将所述待处理图像压缩至预设尺寸;
对压缩后的图像进行二值化处理,获取二值化图像;
按照预设膨胀腐蚀因子,对所述二值化图像中的前景区域进行腐蚀膨胀处理,以获取所述待处理图像的二值化图像。
5.根据权利要求3所述的方法,其特征在于,所述生成所述目标轮廓的外接矩形之后,还包括:
确定所述待处理图像的中心位置;
过滤距离所述待处理图像的中心位置的距离大于第一预设距离的外接矩形。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述若所述初始校正图像中的文本行中的文字方向非正立,则对所述初始校正图像进行旋转处理,得到所述待处理图像的校正图像,包括:
将距离所述初始校正图像的中心位置的第二预设距离范围内的文本行的外接矩形作为目标外接矩形;
获取所述目标外接矩形中的文本行的文字方向与水平方向的夹角;
将数量最多的夹角作为第二旋转角度;
将所述初始校正图像旋转所述第二旋转角度,得到所述校正图像。
7.根据权利要求6所述的方法,其特征在于,所述将距离初始校正图像的中心位置的第二预设距离范围内的文本行的外接矩形作为目标外接矩形之前,还包括:
根据所述外接矩形的横坐标、纵坐标,确定所述待处理图像的中心位置。
8.根据权利要求1所述的方法,其特征在于,其特征在于,所述根据待处理图像中的文本行的外接矩形,对所述待处理图像进行旋转处理之前,包括:
接收用户输入的所述待处理图像。
9.根据权利要求1所述的方法,其特征在于,所述待处理图像为资质图像,所述得到所述待处理图像的校正图像之后,还包括:
识别所述校正图像中的资质信息;
对所述校正图像中的资质信息进行认证,输出资质认证结果。
10.一种图像倾斜校正的装置,其特征在于,包括:
处理模块,用于根据待处理图像中的文本行的外接矩形,对所述待处理图像进行旋转处理,得到所述待处理图像的初始校正图像,且若所述初始校正图像中的文本行中的文字方向非正立,则对所述初始校正图像进行旋转处理,得到所述待处理图像的校正图像,所述初始校正图像中的文本行的外接矩形与水平方向垂直或平行,所述校正图像中的文本行的文字方向为正立。
11.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述的方法。
技术总结