一种近视图像深度学习识别模型训练方法及系统与流程

专利2022-06-29 109

本发明涉及医学图像处理技术领域，更具体地，涉及一种近视图像深度学习识别模型训练方法及系统。

背景技术：

屈光功能是眼球的重要功能之一，影响眼球的感光功能发育和全眼的视功能。屈光功能损害是世界重大公共卫生问题，严重威胁青少年健康。根据who最新的报道，全球大约1.3千万的儿童和青少年由于未矫正的近视而存在视力障碍。然而，目前大多数近视患儿，在视功能严重缺失引起斜视等改变之前，外观特征不明显，难以被人观测到。另外，患儿一般不会感知并告知父母自己的视力障碍，特别是当只有一只眼睛存在视力障碍的时候。传统的近视筛查方法主要通过一年一度的学校视力检查，筛选出有视力异常的儿童，转诊至医院进行验光。需要专业的验光设备和验光师评估，才能发现和确定近视的程度，并有机会进行矫正，但耗时耗力，现有的医疗资源根本无法覆盖近视爆发的青少年人群的需求，耽误宝贵的治疗窗口。同时，由于青少年的快速发育，需要动态跟踪提醒屈光不正的患儿的变化情况，及时调整矫正眼镜度数，以促使视功能的良好发育。这些都是现有的医疗资源和技术共同面临的难题。

屈光功能受眼球眼轴及屈光介质的解剖状态所决定，如角膜的直径大小、厚度、前后表面的曲率、前房深度、瞳孔大小、晶状体的厚度等。由于环境等因素，在屈光功能正视化后，眼球的解剖结构继续变化，导致了近视的出现。除了屈光介质的结构特征的改变，近视往往也会导致一些面部结构特征的变化，如异常头位、斜视、眼轴较长、上睑退缩、眼球突出度较为明显、角膜曲率较陡、鼻梁挺拔度较挺等。然而，这些特征往往在近视度数较深时可在临床观察到。医疗人工智能的发展，很多原有的医疗难题迎刃而解，可以学习和观察到一些人类医生观察不到的变化，并总结出事物的内在联系。基于深度学习的人脸识别技术，有潜力只通过拍摄人外观照，在存在且人肉眼观察不明显的特征中找到规律，并进行诊断，如先天性疾病、性取向判别等。因此，借助深度学习技术，通过人眼外观图像检测眼球的结构图像中屈光介质和眼外观的特征，从而诊断和预测眼球的屈光功能，具有巨大的潜力和优势。

技术实现要素：

本发明旨在克服上述现有技术的至少一种缺陷，提供一种近视图像深度学习识别模型训练方法及系统，用于辅助使用者快速、准确地判断青少年近视情况。

本发明采取的技术方案是，

一种近视图像深度学习识别模型训练方法，包括以下步骤：

采集眼外观图像；

对所述眼外观图像进行预处理；

以人脸识别大数据库vgg-face中的人脸图像作为第一训练数据，对vgg-16网络模型进行预训练；

以预处理后的所述眼外观图像作为第二训练数据，对预训练后的所述vgg-16网络模型进行训练，得到用于近视图像识别的深度学习模型。

本发明一种近视图像深度学习识别模型训练方法，首先通过采集一系列青少年眼外观图像作为原始数据样本；其次对眼外观图像数据样本进行批量预处理，并将样本分为训练集及测试集；通过人脸识别大数据库vgg-face人脸图像数据作为第一训练数据对vgg-16神经网络模型进行预训练，生成稳定的人脸识别参数作为近视图像深度学习识别模型的初始化参数；采用预处理后的眼外观图像训练集作为第二训练数据，继续训练预训练处理后的vgg-16神经网络模型，并调整参数至稳定，最终得到近视图像深度学习识别模型。

本发明通过近视图像深度学习识别模型的建立，相对于传统近视筛查依靠场视力表、电脑验光仪、检查场地以及培训人员，极大程度减轻广泛体检筛查的压力，辅助系统使用者摆脱传统近视筛查仪器的限制，快速、准确地判断青少年近视情况。

进一步地，采集眼外观图像，具体包括：

在距离被采集者预设采集距离时，采集被采集者每只眼睛的三个角度的所述眼外观图像，所述三个角度分别为正侧面、斜45度和正面。

要求采集人员在预设的采集距离内目视无限远处某一点，采集每只眼睛三个角度的三张照片，三个角度依次为正侧面、斜45度和正面。采用此设定条件能够保证采集的眼外观图像统一化、全面化，作为近视图像深度学习识别模型训练的样本具有实质性的价值。

进一步地，所述预设采集距离为1m。

进一步地，所述采集眼外观图像的采集环境为室内照明环境。

室内照明环境保证采集者的采集照片清晰且不受其他外界因素干扰，采集到的眼外观图像对近视图像深度学习识别模型具有意义。

进一步地，对眼外观图像进行预处理，具体包括：

将三个角度的所述眼外观图像进行归一化处理整合为一张眼外观图像，并设定为固定分辨率。

由于近视图像数据样本的采集可能来自不同的照相设备，图像的分辨率以及图像的质量有较大的差异性，因此需要将眼外观的三张照片进行归一化预处理，去掉额头到鼻梁、双颞侧以外的区域后，整合为一张眼外观图像，并将左右眼图像镜面对称以去除左右眼无关的信息，在实际处理中设定所有图像以224*224作为分辨率，确保图像分辨率与大小尺寸相同。

进一步地，以人脸识别大数据vgg-face中的人脸图像作为第一训练数据，对vgg-16网络模型进行预训练，具体包括：

采用keras模型训练框架，以人脸识别大数据库vgg-face中的人脸图像作为第一训练数据，对vgg-16网络模型进行预训练，生成模型参数。

keras是一个开源人工神经网络库，可以作为tensorflow、microsoft-cntk和theano的高阶应用程序接口，进行深度学习模型的设计、调试、评估、应用和可视化，keras包括前馈结构和递归结构的神经网络，也可以通过封装参与构建统计学习模型。vgg-face是一个大规模的人脸识别数据，vgg-face数据集包括覆盖范围广的大量人脸图像且处理图像的噪声最少。本发明中，采用具有tensorflow终端的keras模型作为模型训练框架，将vgg-16神经网络模型在拥有至少2.6百万人脸图像的vgg-face数据集上进行训练，提升人眼外观特征识别能力，将训练得到的参数调至稳定，并作为近视图像深度学习识别模型的初始化参数，生成模型参数。

进一步地，以预处理后的所述眼外观图像作为第二训练数据，对预训练后的所述vgg-16网络模型进行训练，具体包括：

以预处理后的所述眼外观图像作为第二训练数据，将预训练所生成的所述模型参数作为初始模型参数，对所述vgg-16网络模型进行训练。

通过在keras模型训练框架下，对vgg-16神经网络模型采用vgg-face数据集预训练后生成的模型参数作为初始化模型参数，采用预处理后的眼外观图像训练集样本继续对vgg-16神经网络模型进行训练。

进一步地，采集眼外观图像，具体包括：

采集具有验光数据的眼外观图像。

进一步地，以预处理后的所述眼外观图像作为第二训练数据，对预训练后的所述vgg-16网络模型进行训练，具体包括：

将所述验光数据作为图像标签，按照等效球面镜度数是否小于-0.50d作为是否近视的分类标准，以预处理后的所述眼外观图像作为第二训练数据，对预训练所生成的所述模型参数作为初始模型参数，对所述vgg-16网络模型进行二分类神经网络的训练。

本发明中采用具有验光数据的眼外观图像作为图像处理的分类标签，具体分类标准为：按照等效球面度数是否大于-0.50d作为是否近视的分类标准，即常说的近视度数是否大于50度。基于眼外观图像，将等效球面度数大于-0.50d和小于-0.50d的眼外观图像预处理后作为第二训练数据，并将预训练生成的模型参数作为初始化模型参数，继续对vgg-16神经网络模型进行二分类神经网络的训练。

一种近视图像深度学习识别模型训练系统，包括：

采集模块，用于采集眼外观图像；

预处理模块，用于对所述眼外观图像进行预处理；

预训练模块，用于以人脸识别大数据库vgg-face中的人脸图像作为第一训练数据，对vgg-16网络模型进行预训练；

训练模块，用于以预处理后的所述眼外观图像作为第二训练数据，对预训练后的所述vgg-16网络模型进行训练，得到用于近视图像识别的深度学习模型。

本发明一种近视图像深度学习识别模型训练系统，首先通过采集模块采集一系列青少年眼外观图像作为原始数据样本；其次通过预处理模块对眼外观图像数据样本进行批量预处理，并将样本分为训练集及测试集；在预训练模块中，人脸识别大数据库vgg-face人脸图像数据作为第一训练数据对vgg-16神经网络模型进行预训练，生成稳定的人脸识别参数作为近视图像深度学习识别模型的初始化参数；在训练模块中采用预处理后的眼外观图像训练集作为第二训练数据，继续训练预训练处理后的vgg-16神经网络模型，并调整参数至稳定，最终得到用于近视图像深度学习识别模型。

与现有技术相比，本发明的有益效果为：

(1)本发明通过采用近视图像深度学习识别模型训练方法对近视图像进行模型训练，得到的近视图像深度学习识别模型可进行近视识别，相对于传统近视识别依靠场视力表、电脑验光仪、检查场地以及培训人员，可以极大程度地减轻目前广泛体检视力筛查的压力，使检查者在家拍照就可以反复进行屈光不正检查，快速、便携地辅助系统使用者检查青少年屈光状态。

(2)相比于已有的拍照初筛工具如spotvisionscreener视力筛查仪通过得到瞳孔的红外图像判断是否近视，本发明近视图像深度学习识别模型训练方法不依赖于特定的硬件进行近视筛查，只要有拍照条件都可进行近视筛查，节约所需经济成本。

附图说明

图1为本发明实施例的方法流程图。

图2为本发明实施例的系统结构图。

具体实施方式

本发明附图仅用于示例性说明，不能理解为对本发明的限制。为了更好说明以下实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；对于本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。

本发明实施例通过在统一的规定条件下使用多种镜头进行眼外观图像采集，具体可采用以下多种镜头对眼外观图像进行采集：eva-al00，canoneos6d，iphone6，iphone7plus，lex620等。

本发明实施例采用vggnet神经网络模型，经典的cnn卷积神经网络(convolutionalneuralnetworks)模型有lenet模型、alexnet模型、vggnet模型、googleinceptionnet模型、resnet模型、zfnet模型等。在深度较大的神经网络中，vggnet结构非常简洁，整个网络都使用了同样大小的卷积核尺寸，小的卷积层比大的有更多的非线性变换，使得cnn对特征不明显的图像的学习能力更强。因此，模型优选用vggnet模型，具体地，本实施例采用vgg-16网络神经模型。

实施例1

如图1所示，一种近视图像深度学习识别模型训练方法，包括以下步骤：

s1、采集具有验光数据的眼外观图像；

s2、对所述眼外观图像进行预处理；

s3、以人脸识别大数据库vgg-face中的人脸图像作为第一训练数据，对vgg-16网络模型进行预训练；

s4、以预处理后的所述眼外观图像作为第二训练数据，对预训练后的所述vgg-16网络模型进行训练，得到用于近视图像识别的深度学习模型。

优选地，本发明实施例中采集眼外观图像，具体包括：

预设采集距离为1m，要求采集环境为室内照明环境，被采集者位于1m采集距离处，要求被采集者目视前方无限远处某一点，从距离被采集者1m处，采集每只眼睛的三个角度的所述眼外观图像，所述三个角度分别为正侧面、斜45度和正面，具体地，本实施例中采集7050张照片。

优选地，本发明实施例中对眼外观图像进行预处理，具体包括：

将三个角度的所述眼外观图像进行归一化处理整合为一张眼外观图像，并设定为固定分辨率。

具体地，由于该眼外观的数据采集来自不同的照相机镜头，图像的分辨率以及图像质量有较大的差异，因此需要将统一采集到的三张眼外观照片进行归一化处理，去掉额头到鼻梁，双颞侧以外的区域，整合为一张眼外观图像，最终7050张照片生成2350张眼外观图像，同时将左右眼图像镜面对称以去掉左右眼等无关信息，并设定所有的眼外观图像以224*224作为分辨率，确保图像分辨率与大小尺寸相同，最后将采集的眼外观图像按照75％和25％的比例分为训练集与验证集。

进一步地，构建神经网络模型。

优选地，对vgg-16网络模型进行预训练：

本发明实施例中以人脸识别大数据vgg-face中的人脸图像作为第一训练数据，对vgg-16网络模型进行预训练，具体包括：

采用具有tensorflow终端的keras模型训练框架，以人脸识别大数据库vgg-face中的人脸图像作为第一训练数据，对vgg-16网络模型进行预训练，生成模型参数。

优选地，对vgg-16网络模型进行深度训练：

本发明实施例中以预处理后的所述眼外观图像训练集作为第二训练数据，对预训练后的所述vgg-16网络模型进行训练，具体包括：

将所述验光数据作为图像标签，按照等效球面镜度数是否小于-0.50d(近视度数大于50度)作为是否近视的分类标准，将大于-0.50d作为没有近视标签，用“0”表示，将小于或等于-0.50d作为近视标签，用“1”表示，对vgg-16网络模型进行二分类神经网络的训练。

基于预处理后的眼外观图像作为第二训练数据，将预训练所生成的所述模型参数作为初始模型参数，对预训练后的模型进行训练，以下为具体训练过程设置的参数值：设置dropout率为0.5，迭代次数为250，初始学习率为0.000001，初始动量1为0.9，初始动量2为0.999，设置最小衰减并在依次迭代过程中收敛模型。

本发明实施例首先将眼外观图像按照75％和25％的比例分为训练集与验证集。利用训练集对神经网络模型进行深度学习训练，利用验证集对深度学习训练后的神经网络模型进行检测，具体检测过程如下：

在训练模型过程中，将眼外观图像按照是否存在近视进行分类得到预先分类结果即验证集，具体分类标准为按照是否大于-0.5d作为是否近视，然后对深度学习识别模型进行初始化，提取眼外观图像的特征，根据特征进行分类得到样本分类结果，判断通过该模型处理后的分类结果是否与验证集结果吻合，根据判断结果不断修正深度学习识别模型，重复多次直到分类结果的准确率趋于稳定，最终形成近视深度识别模型。通过绘制显著图和可视化激活热力图来评估性能可信程度。

通过本发明实施例一种近视图像深度学习识别模型训练方法，训练所得的最终模型具体包括13个卷积层、13个池化层和2个全连接层，卷积层有64个(3,3)的卷积核，池化层为(2,2)的小矩阵。

与现有技术相比，本发明的有益效果为：

(2)相比于已有的拍照初筛工具如spotvisionscreener视力筛查仪通过得到瞳孔的红外图像判断是否近视，本发明实施例近视图像深度学习识别模型训练方法不依赖于特定的硬件进行近视筛查，只要有拍照条件都可进行近视筛查，节约所需经济成本。

实施例2

如图2所示，本发明实施例一种近视图像深度学习识别模型训练系统，包括：

采集模块，用于采集眼外观图像；

预处理模块，用于对所述眼外观图像进行预处理；

预训练模块，用于以人脸识别大数据库vgg-face中的人脸图像作为第一训练数据，对vgg-16网络模型进行预训练；

训练模块，用于以预处理后的所述眼外观图像作为第二训练数据，对预训练后的所述vgg-16网络模型进行训练，得到用于近视图像识别的深度学习模型。

优选地，本发明实施例中采集模块，具体实施过程为：

预设采集距离为1m，要求采集环境为室内照明环境，被采集者位于1m采集距离处，要求被采集者目视前方无限远处某一点，从距离被采集者1m处，采集每只眼睛的三个角度的所述眼外观图像，所述三个角度分别为正侧面、斜45度和正面，具体地，本发明实施例中采集7050张照片。

优选地，本发明实施例中预处理模块，具体实施过程包括：

将三个角度的所述眼外观图像进行归一化处理整合为一张眼外观图像，并设定为固定分辨率。具体地，由于该眼外观的数据采集来自不同的照相机镜头，图像的分辨率以及图像质量有较大的差异，因此需要将统一采集到的三张眼外观照片进行归一化处理，去掉额头到鼻梁，双颞侧以外的区域，整合为一张眼外观图像，最终7050张照片生成2350张眼外观图像，同时将左右眼图像镜面对称以去掉左右眼等无关信息，并设定所有的眼外观图像以224*224作为分辨率，确保图像分辨率与大小尺寸相同，最后将采集的眼外观图像按照75％和25％的比例分为训练集与验证集。

进一步地，通过预训练模块和训练模块构建神经网络模型。

优选地，采用预训练模块对vgg-16网络模型进行预训练，具体实施过程包括：

本发明实施例中以人脸识别大数据vgg-face中的人脸图像作为第一训练数据，对vgg-16网络模型进行预训练，具体包括：采用具有tensorflow终端的keras模型训练框架，以人脸识别大数据库vgg-face中的人脸图像作为第一训练数据，对vgg-16网络模型进行预训练，生成模型参数。

优选地，采用训练模块对vgg-16网络模型进行深度训练，具体实施过程包括：

本发明实施例中以预处理后的所述眼外观图像训练集作为第二训练数据，对预训练后的所述vgg-16网络模型进行训练，具体包括：将所述验光数据作为图像标签，按照等效球面镜度数是否小于-0.50d(近视度数大于50度)作为是否近视的分类标准，将大于-0.50d作为没有近视标签，用“0”表示，将小于或等于-0.50d作为近视标签，用“1”表示，对vgg-16网络模型进行二分类神经网络的训练。

基于预处理后的眼外观图像训练集作为第二训练数据，将预训练所生成的所述模型参数作为初始模型参数，通过训练模块对预训练后的模型进行训练，以下为训练模块具体实施过程中设置的参数值：设置dropout率为0.5，迭代次数为250，初始学习率为0.000001，初始动量1为0.9，初始动量2为0.999，设置最小衰减并在依次迭代过程中收敛模型。

通过本发明实施例一种近视图像深度学习识别模型训练系统，训练所得的最终模型具体包括13个卷积层、13个池化层和2个全连接层，卷积层有64个(3,3)的卷积核，池化层为(2,2)的小矩阵。

与现有技术相比，本发明实施例的有益效果为：

(1)本发明通过采用近视图像深度学习识别模型训练系统对近视图像进行模型训练，得到的近视图像深度学习识别模型可进行近视识别，相对于传统近视识别依靠场视力表、电脑验光仪、检查场地以及培训人员，可以极大程度地减轻目前广泛体检视力筛查的压力，使检查者在家拍照就可以反复进行屈光不正检查，快速、便携地辅助系统使用者检查青少年屈光状态。

(2)相比于已有的拍照初筛工具如spotvisionscreener视力筛查仪通过得到瞳孔的红外图像判断是否近视，本发明实施例近视图像深度学习识别模型训练系统不依赖于特定的硬件进行近视筛查，只要有拍照条件都可进行近视筛查，节约所需经济成本。

显然，本发明的上述实施例仅仅是为清楚地说明本发明技术方案所作的举例，而并非是对本发明的具体实施方式的限定。凡在本发明权利要求书的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

技术特征：

1.一种近视图像深度学习识别模型训练方法，其特征在于，包括以下步骤：

采集眼外观图像；

对所述眼外观图像进行预处理；

以人脸识别大数据库vgg-face中的人脸图像作为第一训练数据，对vgg-16网络模型进行预训练；

以预处理后的所述眼外观图像作为第二训练数据，对预训练后的所述vgg-16网络模型进行训练，得到用于近视图像识别的深度学习模型。

2.根据权利要求1所述的一种近视图像深度学习识别模型训练方法，其特征在于，采集眼外观图像，具体包括：

在距离被采集者预设采集距离时，采集被采集者每只眼睛的三个角度的所述眼外观图像，所述三个角度分别为正侧面、斜45度和正面。

3.根据权利要求2所述的一种近视图像深度学习识别模型训练方法，其特征在于，所述预设采集距离为1m。

4.根据权利要求1至3任一项所述的一种近视图像深度学习识别模型训练方法，其特征在于，所述采集眼外观图像的采集环境为室内照明环境。

5.根据权利要求2至3所述的一种近视图像深度学习识别模型训练方法，其特征在于，对眼外观图像进行预处理，具体包括：

将三个角度的所述眼外观图像进行归一化处理整合为一张眼外观图像，并设定为固定分辨率。

6.根据权利要求1所述的一种近视图像深度学习识别模型训练方法，其特征在于，以人脸识别大数据vgg-face中的人脸图像作为第一训练数据，对vgg-16网络模型进行预训练，具体包括：

采用keras模型训练框架，以人脸识别大数据库vgg-face中的人脸图像作为第一训练数据，对vgg-16网络模型进行预训练，生成模型参数。

7.根据权利要求6所述的一种近视图像深度学习识别模型训练方法，其特征在于，以预处理后的所述眼外观图像作为第二训练数据，对预训练后的所述vgg-16网络模型进行训练，具体包括：

以预处理后的所述眼外观图像作为第二训练数据，将预训练所生成的所述模型参数作为初始模型参数，对所述vgg-16网络模型进行训练。

8.根据权利要求1所述的一种近视图像深度学习识别模型训练方法，其特征在于，采集眼外观图像，具体包括：

采集具有验光数据的眼外观图像。

9.根据权利要求8所述的一种近视图像深度学习识别模型训练方法，其特征在于，以预处理后的所述眼外观图像作为第二训练数据，对预训练后的所述vgg-16网络模型进行训练，具体包括：

10.一种近视图像深度学习识别模型训练系统，其特征在于，包括：

采集模块，用于采集眼外观图像；

预处理模块，用于对所述眼外观图像进行预处理；

预训练模块，用于以人脸识别大数据库vgg-face中的人脸图像作为第一训练数据，对vgg-16网络模型进行预训练；

训练模块，用于以预处理后的所述眼外观图像作为第二训练数据，对预训练后的所述vgg-16网络模型进行训练，得到用于近视图像识别的深度学习模型。

技术总结
本发明涉及医学图像处理技术领域，更具体地涉及一种近视图像深度学习识别模型训练方法，包括以下步骤：采集眼外观图像；对所述眼外观图像进行预处理；以人脸识别大数据库VGG‑Face中的人脸图像作为第一训练数据，对VGG‑16网络模型进行预训练；以预处理后的所述眼外观图像作为第二训练数据，对预训练后的所述VGG‑16网络模型进行训练，得到用于近视图像识别的深度学习模型。本发明提供一种近视图像深度学习识别模型训练方法，用于辅助使用者快速、准确地判断青少年近视情况。

技术研发人员：林浩添;杨雅涵;李睿扬;郭翀
受保护的技术使用者：中山大学中山眼科中心
技术研发日：2020.01.09
技术公布日：2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-18791.html

专利

最新回复(0)