一种融合swin-transformer和通道注意力的视网膜血管分割方法

专利2026-05-05 13

本发明属于计算机视觉，具体的说是涉及一种融合swin-transformer和通道注意力的视网膜血管分割方法。

背景技术：

1、近年来，随着计算机视觉技术的发展，研究人员不断使用新的图像处理算法对各类图像进行处理以满足人们的各种图像需求。在医学图像领域，如何采用图像分割手段，将视网膜眼底图像中的血管分割出来成为了当前研究的热点。分割出来的视网膜血管图片，可以辅助医生做出更准确的判断，找出患者可能存在的健康问题。因为眼底血管结构复杂，人工分割会耗费医生大量精力。因此，利用计算机图像分割技术来辅助医生进行血管分割可以提高医生的诊断效率，具有广泛的应用前景。

2、目前血管分割的主要方法有传统方法和基于深度学习方法。传统方法主要有：形态学操作、匹配滤波、血管跟踪等方法。传统的血管分割技术根据血管的结构特征进行特征设计，这类方法缺乏自主特征提取的能力，依赖于特征设计，泛化性不足，对于图像中的微小血管，分割效果不好。随着深度学习技术的发展，基于深度学习的图像分类、目标检测、图像分割技术逐渐兴起，在医学图像处理领域发展迅速。基于深度学习的图像处理模型主要有：cnn网络、fcn网络、u-net网络等等，其中u-net网络经常用于医学图像分割领域，该网络是一个具有编码结构和解码结构的u形网络，将深层特征与浅层特征进行融合，在医学图像分割领域效果较好。但是由于卷积神经网络感受野受限，难以捕获图像中个像素点的全局依赖关系。随着transformer在自然语言处理(nlp)领域的发展，其变体swin-transformer在计算机视觉任务的的研究也越来越多，该模型可以捕获图像特征之间的全局依赖关系，解决了卷积神经网络对于感受野受限的问题。现有研究表明，该模型在各种分割任务中均有不错的分割效果。对于分割错综复杂的视网膜血管任务来说，该模型可以更好的理解血管与背景和病灶之间的关系，从而取得不错的效果。但是，该模型中的多头注意力模块针对同一输入做多头注意力计算会造成计算冗余。

技术实现思路

1、为了解决上述技术问题，本发明对swin-transformer模块的多头注意力进行改造，将多头注意力的输入分成多块，再分别进行自注意力的计算，以解决冗余计算问题；另外，本发明还引入了通道注意力模块和特征融合模块，进一步增加模型的分割精度。

2、为了达到上述目的，本发明是通过以下技术方案实现的：

3、本发明是一种融合swin-transformer和通道注意力的视网膜血管分割方法，包括如下步骤：

4、步骤1、对原始数据集中的视网膜眼底图像进行数据划分和预处理操作：将视网膜眼底图像划为训练集、验证集和测试集，预处理操作包括灰度化、归一化，自适应直方图均衡化和自适应伽马校正，将预处理后的训练集图像输入编码器。

5、步骤2、构建神经网络模型：所述神经网络模型包括编码器和解码器，所述编码器由改进的swin-transformer构成，视网膜眼底图像经过编码器进行深度特征提取，之后进入所述解码器，在所述解码器中引入通道注意力模块与特征融合模块；

6、步骤3、将训练集中的视网膜眼底图像输入步骤2构建的神经网络模型进行训练；

7、步骤4、用所述验证集对所述步骤3训练的所述神经网络模型进行验证，进行模型参数的调整和重新训练，并确定最终的神经网络模型；

8、步骤5、用所述原始测试集对步骤4最终的所述神经网络模型进行测试，并统计评价指标。

9、本发明的进一步改进在于：所述步骤1具体包括以下步骤：

10、步骤1.1、对数据集进行随机划分：将原始数据集随机划分为训练集、验证集和测试集，所述训练集、验证集和测试集的比例分别为70％、15％、15％；

11、步骤1.2、对原始数据集进行灰度化处理，将图像的三通道数据转化为单通道，将彩色图像转化为灰度图像；减少计算复杂度，提高处理速度

12、步骤1.3、对原始数据集进行归一化处理，将图像的像素值缩放到0到1之间提高模型的收敛速度，归一化公式为：其中i为原始像素值，inorm为归一化后的像素值；

13、步骤1.4、对原始数据集进行直方图均衡化处理，改善图像的对比度：将图像分割成称为“tiles”的小块(通常8x8)，然后对每个小块应用直方图均衡化，最后使用双线性插值合并块边界；

14、步骤1.5、对数据集进行伽马校正处理，调整图像的整体亮度，igamma＝inormγ，igamma代表经过伽马校正后的像素值，γ是伽马值；根据图像的亮度进行调整，通常在0.5到2.0之间。

15、本发明的进一步改进在于：所述步骤2具体包括以下步骤：

16、步骤2.1、编码阶段，基于改进的swin-transformer模型进行改进，将原始swin-transformer结构中的多头自注意力改为级联多头自注意力；在减少计算量的同时，更好的捕获全局的空间依赖关系；

17、步骤2.2、构建通道注意力机制模块，自适应的为不同的特征通道分配不同的权重，抑制无关的干扰信息，减少对噪声的敏感度；

18、步骤2.3、构建特征融合模块，将上采样后的特征图与编码器中对应stage的特征图进行融合，利用深层特征指导浅层特征，增强模型的表达能力。

19、本发明的进一步改进在于：在所述步骤2.1中，改进的swin-transformer模型将w-msa模块中的多头注意力改为级联多头注意力，具体为：

20、步骤2.1.1、改进的w-msa模块首先将输入进来的视网膜眼底图像特征图进行分割：将窗口中的特征信息按照通道进行split，将同一窗口的特征分成n块，公式为:

21、split(xi)＝[xi1，xi2，......xin]

22、其中，i表示第i个窗口，n表示注意力头的个数；

23、步骤2.1.2、将n块不同的视网膜眼底图像特征信息送进分别送进n个不同的自注意力头，分别获取每一块特征图的上下文信息，分解头部之间注意力的计算，有效解决注意头之间高度相似性带来的计算冗余问题。公式为：

24、

25、其中，xij表示自注意头的输入为第i个窗口的第j块，是映射输入特征分割到不同子空间的投影层；

26、步骤2.1.3、将各个自注意头的输出进行拼接，之后送进一个自注意模块进行训练，表示为：

27、xcon＝xi1、+xi2、+……+xin、；

28、xput＝attention(xconwq，xconwk，xconwv)wp

29、其中，xcon表示对各个注意头的输出进行拼接，xput表示对拼接后的特征图再进行一次自注意力计算，wp表示将输出特征维度变回与输入维度一致的线性层，wq，wk，wv是映射输入特征分割到不同子空间的投影层。

30、本发明的进一步改进在于：所述步骤2.2构建通道注意力模块具体为：首先将特征图中每个通道进行全局平均池化，然后将得到的一维向量送进两个全连接层，经过sigmod函数后，得到了不同通道所占权重，再与初始特征进行相乘，增强有效特征，抑制无效特征。

31、本发明的进一步改进在于：步骤2.3构建特征融合模块具体为：通过对图像特征进行二倍上采样，并与对应的编码阶段的特征图做一次跳跃连接，进行特征复用，保留原始特征，防止梯度消失。

32、本发明的进一步改进在于：所述步骤3具体包括以下步骤：

33、步骤3.1、初始化参数神经网络模型：神经网络模型的权重和偏置需要被初始化；通常，权重随机初始化，偏置可以初始化为0或一个小的随机数。这一步骤是为了打破对称性，帮助梯度下降算法更有效地工作。

34、步骤3.2前向传播：在训练过程中，每个视网膜眼底图像通过神经网络进行前向传播，计算每一层的输出直到最后一层；

35、步骤3.3计算损失：使用损失函数计算预测值和真实值之间的差距：交叉熵损失函数为：

36、

37、其中表示为标签被预测为l的概率，n表示训练数据集中数据点的个数，其中第i个数据由文本和指示符组成，如果文本的标签为l，则指示符为1，否则置为0。

38、本发明的进一步改进在于：步骤5中的所述评价指标包括准确率、召回率。

39、本发明的有益效果是：本发明的融合swin-transformer和注意力机制的视网膜眼底图像血管分割方法，采用级联多头注意力，减少冗余计算的同时，有效捕获特征之间的长距离依赖关系；

40、本发明增加通道注意力模块，为不同的通道分配相应权重，从而抑制背景特征，增强目标特征，在特征融合模块，融合将深层特征与浅层特征进行融合，可以对原始特征进行复用；

41、本发明增强模型的数据理解能力，可以有效维系血管像素进行识别。

42、本发明可以有效提高视网膜眼底图像血管分割效果。

技术特征：

1.一种融合swin-transformer和通道注意力的视网膜血管分割方法，其特征在于：所述视网膜血管分割方法具体包括如下步骤：

2.根据权利要求1所述的一种融合swin-transformer和通道注意力的视网膜血管分割方法，其特征在于：所述步骤1具体包括以下步骤：

3.根据权利要求1所述的一种融合swin-transformer和通道注意力的视网膜血管分割方法，其特征在于：所述步骤2具体包括以下步骤：

4.根据权利要求1或3所述的一种融合swin-transformer和通道注意力的视网膜血管分割方法，其特征在于：在所述步骤2.1中，改进的swin-transformer模型将w-msa模块中的多头注意力改为级联多头注意力，具体为：

5.根据权利要求3所述的一种融合swin-transformer和通道注意力的视网膜血管分割方法，其特征在于：所述步骤2.2构建通道注意力模块具体为：首先将特征图中每个通道进行全局平均池化，然后将得到的一维向量送进两个全连接层，经过sigmod函数后，得到了不同通道所占权重，再与初始特征进行相乘。

6.根据权利要求3所述的一种融合swin-transformer和通道注意力的视网膜血管分割方法，其特征在于：步骤2.3构建特征融合模块具体为：通过对图像特征进行二倍上采样，并与对应的编码阶段的特征图做一次跳跃连接，进行特征复用，保留原始特征，防止梯度消失。

7.根据权利要求1所述的一种融合swin-transformer和通道注意力的视网膜血管分割方法，其特征在于：所述步骤3具体包括以下步骤：

8.根据权利要求1所述的一种融合swin-transformer和通道注意力的视网膜血管分割方法，其特征在于：步骤5中的所述评价指标包括准确率、召回率。

技术总结
本发明属于计算机视觉技术领域，公开了一种融合swin‑transformer和通道注意力的视网膜血管分割方法，本发明在编码器部分将Swin‑transforme中的多头自注意力改为级联多头自注意力，减少计算冗余，在解码器中引入通道注意力模块，抑制无关特征，本发明增加特征融合模块，将深浅层特征进行融合，充分利用特征信息，增加分割精准。本发明可以提高血管分割精度，可以准确的分割出视网膜眼底图像的血管脉络，为医生进行疾病诊断提供重要辅助信息。

技术研发人员：刘尚东,费远,季一木,蒋林岑,尤帅,姚小良,汤晓宇,林时俊
受保护的技术使用者：南京邮电大学
技术研发日：
技术公布日：2024/7/25

转载请注明原文地址: https://bbs.8miu.com/read-439952.html

专利

最新回复(0)