本发明涉及数字图像处理、机器视觉的技术领域,具体是一种基于离散余弦变换(discretecosinetransform)和聚焦评价的多聚焦图像融合方法。
背景技术:
随着网络媒体的发展,为达到高质量的大量存储和快速传输图像,而采用合适的方法对图像进行压缩和编码。在无线视觉传感器网络(wvsn)中,数据在传输到其他节点之前都会被压缩,其中采用离散余弦变换(dct)的标准(如jpeg(jointphotographyexpertgroup)图像编码标准、motion-jpeg和mpeg视频编码标准等)得到的数据,因其占用空间小和图像质量高而被广泛利用,因此输出信息的处理涉及到图像处理和机器视觉等学科。
由于光学镜头对焦深度的限制,只有对场景中特定深度的目标区域才能对焦,对焦平面前后的物体会模糊。在无线视觉传感器网络(wvsn)中,可以使用多个传感器摄像头拍摄同一场景的图像,来扩展焦点的深度,但通常包含大量冗余信息。多聚焦图像融合可将多张源图像采用合适的融合策略对像中信息特征进行融合,最终合并成一幅图像,其中包含比任何单幅源图像具有更丰富准确的场景描述。图像融合的目标除了减少网络传输中的数据量外,还在于创建新的图像,这些图像提供的信息更丰富,更适合视觉感知和进一步的计算机处理。目前,图像融合技术在计算机视觉、医学成像和军事指挥等领域中发挥着重要的作用。
技术实现要素:
本发明旨在解决以上现有技术的问题。提出了一种节约成本、提高融合效果,降低时间复杂度的基于dct和聚焦评价的多聚焦图像融合方法。
为了实现上述目的本发明采用的技术方案如下:基于dct(discretecosinetransform)和聚焦评价的多聚焦图像融合方法,包括以下步骤:
1)读取多幅源图像比特流,再对其进行解码和去量化,获得每个图像块的dct系数。
2)分别对每个图像块的dct系数进行归一化,并计算其低阶dct系数。
3)以高阶dct系数的能量与低阶dct系数的能量的比值作为聚焦评价函数,比较多幅源图像对应块的聚焦评价值,依据最大值判定初始决策图。
4)为避免在融合过程中产生伪影,对初始决策图进行一致性验证,再依据最终决策图融合图像。
5)利用量化表量化图像,再进行熵编码得到融合图像的位流进行存储和传输。
进一步的,所述步骤1)中根据dct变换,得到图像中每个块对应的dct系数,i1(i,j)和i2(i,j)表示源图像对应位置的图像块对。具体包括:
dct变换矩阵公式如下:
二维逆dct(idct)为:
其中,x,u=0,1,...,m-1;y,v=0,1,...,n-1,u和v是指基函数频率域中的坐标,x和y是指基函数空间域中的坐标;c(u)和c(v)可以认为是补偿系数,m和n表示为原始信号的点数;f(x,y)是空间域二维向量的阵列元素,表示原始图像信号;f(u,v)表示dct变换后的变换系数阵列元素。
公式(6)和公式(7)中的dct正变换和逆变换可以用矩阵表示如下:
f(u,v)=a*f(x,y)*at(9)
f(x,y)=at*f(u,v)*a(10)
其中,一个典型的8×8dct变换矩阵a为:
其中,c(i)可以认为是补偿系数,i和j的取值从0到8。
通过dct正变换,大部分能量集中在左上角的几个低阶系数上,反映了图像的主要内容。
进一步的,所述步骤2)分别对每个图像块的dct系数进行归一化的步骤为:u表示dct系数阵列的横坐标位置,v表示dct系数阵列纵坐标位置,m表示图像块的宽,n表示图像块的高。对于图像块f(u,v),u≤m,v≤n,其归一化定义为:
进一步的,所述步骤3)中以高阶与低阶变换系数的能量的比值作为聚焦评价函数,比较多幅源图像对应块的聚焦评价值,依据最大值判定初始决策图的步骤包括:
高阶变换系数与低阶变换系数的定义为:
其中,m n-2≥p≥0,p=3,h(f,p)和l(f,p)满足以下关系:
根据高阶变换系数与低阶变换系数的关系,以及帕斯瓦尔定理(parseval'stheorem),聚焦评价函数定义为:
由公式(16),可将公式(17)聚焦评价函数简化为:
由公式(17)表明,仅利用几个低阶dct系数便能计算出聚焦评价值,大大降低了计算复杂度。每个块(包括两幅源图像对应位置的图像块)的聚焦评价值由式(17)计算,分别表示为mt(i1(i,j))和mt(i2(i,j))。然后比较两个对应块的聚焦评价值,得到初始决策图。
其中,ε是一个阈值,在发明中设置为0.001。
进一步的,所述步骤4)采用3×3众数滤波器wx,y(majorityfilter)对初始决策图进行一致性验证,再依据决策图融合图像。采用众数滤波器获得最终的决策图di,j。
i,j表示初始决策图的坐标位置。
最后根据最终决策图di,j进行融合,融合图像的dct系数fi,j通过以下方法得到:
其中,i1(i,j),i2(i,j)分别表示两幅源图像对应位置的图像块。
利用量化表量化图像fi,j,再进行熵编码得到融合图像的位流进行存储和传输。
本发明的优点及有益效果如下:
本发明针对在网络传输经过dct标准压缩图像的多聚焦图像融合,所提出的一种基于discretecosinetransform和聚焦评价的多聚焦图像融合方法,直接读取图像的dct系数进行聚焦评价值的计算,达到快速融合图像的目的。另外,本发明提出的图像块的聚焦评价方法仅需计算几个dct低阶系数,进一步减少了多聚焦图像融合过程的时间。同时,通过分析图像高低频信息与dct系数的相关性,建立起dct系数与图像聚焦程度之间的联系,是dct在图像处理领域应用的创新和突破。结果表明,相较于常见的图像梯度能量、拉普拉斯能量与改进拉普拉斯能量和等聚焦评价指标,本发明提出的方法对图像聚焦程度的评价更加准确,在多聚焦图像融合中取得理想的效果,并在噪声环境下也表现出很好的鲁棒性。
在实际应用中,本发明在步骤1中,直接读取图像的dct系数,而不用读取图像的全部信息,减少时间消耗。在步骤2中,仅需计算dct的低阶系数,为步骤3奠定计算基础。在步骤3中,根据低阶系数和高阶系数的关系提出的聚焦评价函数,直接通过步骤2所得的低阶系数得到聚焦评价值,为多聚焦图像融合过程大大降低了时间消耗。同时,图像块的dct低频系数与高频系数相关性低,因此在噪声环境下表现出良好的鲁棒性。在步骤4中,对初始决策图进行一致性验证,能够进一步提高融合效果。相较于传统的聚焦评价函数,本发明提出的基于discretecosinetransform系数的图像聚焦评价方法对图像聚焦程度的评价更加准确,能够较好的区分聚焦程度表现,将本发明方法应用于多聚焦图像融合中可以达到较好的融合效果。
附图说明
图1是本发明提供优选实施例融合方案的流程图;
图2是第一组源图像;
图3是第一组源图像的融合图像;
图4是第二组源图像;
图5是第二组源图像的融合图像;
图6是m=n=2,核函数ψ2,2(x,y)图像;
图7是m=n=10,核函数ψ10,10(x,y)图像。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
本发明解决上述技术问题的技术方案是:
图1:本发明的技术方案进行详细说明,一种基于discretecosinetransform和聚焦评价的多聚焦图像融合方法,包括如下步骤:
第一步:首先直接从多幅源图像读取比特流,再对其进行解码和去量化,以获得每个图像块的dct系数;
第二步:分别对每个图像块的dct系数按照公式(12)进行归一化,并计算其低阶dct系数,其中i j≤p,p=3的变换系数为低阶变换系数,其余为高阶变换系数;
第三步:以高阶与低阶dct系数的能量的比值作为聚焦评价函数,根据公式(11)计算图像的聚焦评价值,然后比较多幅源图像对应块的mt值大小,并依据最大值判定初始决策图;
第四步:为避免在融合过程中产生伪影,对决策图进行一致性验证,再依据最终决策图融合图像;
第五步:利用量化表量化图像,再进行熵编码得到融合图像的位流进行存储和传输。
为了验证本发明的效果,进行了如下实验:
本次实验室,在matlabr2017a平台中实现,并在一台inteli5-45903.30ghzcpu,16.0gbram的计算机上运行。
实验方法:
在本实验过程中,将柯达图像数据库中的图像作为实验数据,待融合的两幅图像分别为同一场景下不同目标聚焦的图像。通过本发明提出的基于discretecosinetransform和聚焦评价的多聚焦图像融合方法,对两幅多聚焦图像进行融合,得到全景都清晰的融合图像。
图2是第一组源图像(左图:右侧鹦鹉聚焦,左侧鹦鹉散焦;右图:左半部分鹦鹉聚焦,右半部分鹦鹉散焦);
图3是第一组源图像的融合图像;
图4是第二组源图像(左图:右侧热气球聚焦,左侧热气球散焦;右图:左半部分热气球聚焦,右半部分热气球散焦);
图5是第二组源图像的融合图像;
图6、7:m=n=2核函数ψ2,2(x,y)图像,以及m=n=10核函数ψ10,10(x,y)图像,展示了图像聚焦程度mt与dct系数之间的关系。详细说明:
对于图像块大小为m×n,其(m n)阶dct变换矩阵公式如下:
相关分析表示信号之间的相似性度量。定义两个信号的相关度为:
如果s1=f(x,y),
在式(23)中,可以认为是与dct核函数之间的相关系数,表示图像与一定阶dct核函数之间的相关关系。下面是其在m=n=2时和m=n=10的图像:图6为m=n=2,核函数ψ2,2(x,y)图像;图7为m=n=10,核函数ψ10,10(x,y)图像。
从图6中能够看出,低阶dct变换核函数ψ2,2(x,y)的值变化平缓,而高阶dct变换核函数ψ10,10(x,y)的值变化剧烈,可以得出dct核函数的值随着阶数的增加,其值变化更加剧烈。因此,可以得出结论,低阶dct系数描述了图像的平滑信息,而高阶系数代表了图像的细节。
以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。
1.基于dct和聚焦评价的多聚焦图像融合方法,其特征在于,包括以下步骤:
读取多幅源图像比特流,再对其进行解码和去量化,获得每个图像块的dct系数;
分别对每个图像块的dct系数进行归一化,并计算其低阶dct系数;
以高阶dct系数的能量与低阶dct系数的能量的比值作为聚焦评价函数,比较多幅源图像对应块的聚焦评价值,依据最大值判定初始决策图;
对初始决策图进行一致性验证,再依据最终决策图融合图像;
利用量化表进行量化图像,然后进行熵编码,得到融合图像的位流进行存储和传输。
2.根据权利要求1所述基于dct和聚焦评价的多聚焦图像融合方法,其特征在于:所述对每个图像块的dct系数进行归一化的步骤为:u表示dct系数阵列的横坐标位置,v表示dct系数阵列纵坐标位置,m表示图像块的宽,n表示图像块的高,
对于图像块f(u,v),u≤m,v≤n,其归一化定义为:
3.根据权利要求1所述基于dct和聚焦评价的多聚焦图像融合方法,其特征在于:所述聚焦评价函数为:
h(f,p),l(f,p)分别表示高阶dct系数和低阶dct系数,||·||2表示向量模的平方,等于系数绝对值的平方之和。
4.根据权利要求3所述基于dct和聚焦评价的多聚焦图像融合方法,其特征在于:所述低阶dct系数
5.根据权利要求1所述基于dct和聚焦评价的多聚焦图像融合方法,其特征在于:根据dct变换,得到图像中每个块对应的dct系数,i1(i,j)和i2(i,j)表示两幅源图像对应位置的图像块,每个块的聚焦评价值分别表示为mt(i1(i,j))和mt(i2(i,j)),将图像块对的聚焦评价值一一进行比较,得到初始决策图;
其中,ε是一个阈值。
6.根据权利要求1所述基于dct和聚焦评价的多聚焦图像融合方法,其特征在于:所述融合图像包括以下步骤:采用3×3众数滤波器wx,y对初始决策图进行一致性验证,获得最终的决策图di,j,再依据最终决策图融合图像,采用众数滤波器:
最后根据最终决策图di,j进行融合,融合图像的dct系数fi,j通过以下方法得到:
