本发明属于深度学习和医学显微镜图像自动检测及计数技术领域,特别涉及一种基于卷积神经网络的脑脊液细胞和病原体的自动检测计数方法及系统。
背景技术:
正常人脑脊液细胞计数的正常值为0~5个/mm3,淋巴细胞和单核细胞的比例为4:6或3:7。脑脊液中的异常细胞包括:各种激活淋巴细胞和浆细胞、各种激活性单核细胞、多形核粒细胞、肿瘤细胞和各种特异性细胞成分。对于某些中枢性系统感染而言,可用抗酸染色、墨汁染色等方法对病原体进行染色,特异性的得出病原体感染类型。
目前,脑脊液细胞和病原体的检测报告是基于人工完成。首先通过对脑脊液离心沉降涂片并进行对应的染色处理,然后通过人工在光学显微镜下观察染色样片上细胞和病原体的染色情况和形态进行细胞分类统计和病原体的检测。这需要检验人员具有较多的专业知识和丰富的实践经验,以保证检验结果的客观性和准确性。在实际工作中,随着送检样本的增多,检测人员的工作强度剧增,大大降低了结果判断的准确性;检测周期较长,从样本接收到出具报告需要两天的时间。
综上,亟需一种基于操作自动化和计算机智能进行细胞和病原体检测计数方法及系统。
技术实现要素:
本发明的目的在于提供一种基于卷积神经网络的脑脊液细胞和病原体的自动检测计数方法及系统,以解决上述存在的一个或多个技术问题。本发明的方法可提高判断的准确率,同时能够提高出具报告的效率。
为达到上述目的,本发明采用以下技术方案:
本发明的一种基于卷积神经网络的脑脊液细胞和病原体的自动检测计数方法,包括以下步骤:
步骤1,对预制备的脑脊液样本样片进行图片采集,获得原始图像数据集合;
步骤2,对步骤1获得的原始图像数据集合的每张图片中的每个脑脊液细胞和病原体进行标定,获得标定好的原始图像数据集合;
步骤3,将步骤2获得的标定好的原始图像数据集合分为训练集和测试集;
步骤4,将步骤3获得的训练集输入预构建的卷积神经网络模型进行训练,直到在测试集上验证检测准确率达到预设要求,获得脑脊液细胞和病原体的检测模型;
步骤5,将待检测的未标定的脑脊液样片图片输入到步骤4获得的检测模型,输出所识别的脑脊液细胞和病原体的类别及各种类别所占的百分比。
本发明的进一步改进在于,步骤1中,制备脑脊液样本样片的步骤具体包括:制备脑脊液样本的样片,样片进行染色固定处理和不染色固定处理。
本发明的进一步改进在于,步骤1中,图片采集的步骤具体包括:利用全自动图像采集平台对制备的脑脊液样本样片进行显微图像采集。
本发明的进一步改进在于,步骤2中,所述脑脊液细胞包括红细胞、单核细胞、淋巴细胞、中性粒细胞、嗜碱性粒细胞、嗜酸性粒细胞、巨细胞、吞噬细胞、浆细胞、幼稚细胞和肿瘤细胞;所述病原体包括细菌、真菌、病毒和寄生虫。
本发明的进一步改进在于,步骤2进行标定的步骤包括:
使用标定工具以边界框的形式将步骤1采集到的每张图像中的每个脑脊液细胞和病原体标定出来;
在每个标定框旁边标注其类别,将每张图像的所有标定信息以.xml文件的形式保存。
本发明的进一步改进在于,步骤4的训练过程中,根据损失函数,利用反向传播算法对检测模型的参数进行调整。
本发明的进一步改进在于,步骤4具体包括:
基于tensorflow的目标检测图像神经网络构建卷积神经网络模型,使用迁移学习,导入预训练结果,赋予卷积神经网络模型初始权重,获得初始化的卷积神经网络模型;
初始化得到的卷积神经网络模型在步骤3获得的训练集上进行训练,此过程为一次前向传播;
采用监督学习的方法,在经过一次前向传播后,使用softmax损失函数计算损失函数误差;选用随机梯度下降的方法进行迭代,使卷积神经网络模型的参数值向着损失函数下降的方向更新,此过程为一次反向传播;
使用训练集对使用预训练权重的卷积神经网络模型进行微调,经过多次前向传播和反向传播,更新卷积神经网络模型的参数,当达到设置的最大更新迭代数且深层卷积神经网络模型收敛时,结束训练,得到训练好的卷积神经网络模型。
本发明的进一步改进在于,步骤4还包括:将测试集输入训练好的卷积神经网络模型,输出结果与人工标定结果比对,验证卷积神经网络模型的识别准确率在90%以上。
本发明的一种基于卷积神经网络的脑脊液细胞和病原体的自动检测计数系统,包括:
图像采集模块,用于对预制备的脑脊液样本样片进行图片采集,获得原始图像数据集合;
数据处理模块,用于对图像采集模块获得的原始图像数据集合的每张图片中的每个脑脊液细胞和病原体进行标定,获得标定好的原始图像数据集合;用于将标定好的原始图像数据集合分为训练集和测试集;用于将训练集输入预构建的卷积神经网络模型进行训练,直到在测试集上验证检测准确率达到预设要求,获得脑脊液细胞和病原体的检测模型;
输入输出模块,用于将待检测的未标定的脑脊液样片图片输入检测模型,输出所识别的脑脊液细胞和病原体的类别及各种类别所占的百分比。
与现有技术相比,本发明具有以下有益效果:
本发明的方法,首先将脑脊液样本制备样片,再使用图像采集平台对染色样片或未染色样片采集图片,接下来将图片输入卷积神经网络模型,完成脑脊液细胞和病原体的自动检测及计数,最后输出一份涵盖细胞和病原体类型及所占百分比的报告。本发明将脑脊液样片制备、图片采集平台和卷积神经网络模型三者很好地结合,实现了自动化进行脑脊液中细胞和病原体的自动检测及计数。另外,本发明对样片所有信息都进行拍照存档,便于信息的收集和再研究,不再需要存储实物样片,对脑脊液标本的研究具有非常高的价值。
本发明方法具有分辨率高、抗干扰能力强、智能化程度高、操作方便等优点。相比较于传统的脑脊液细胞和病原体的检测和计数方法,极大地解放了人力,可实现在1个小时内出具报告,细胞识别准确率达90%以上,相当于具有10年工作经验的职业医生的识别率。
本发明中,将脑脊液样片的显微镜图片输入卷积神经网络进行特征提取,针对每个脑脊液细胞得到一组包含类别的边界框,每个边界框有不同的置信度,设置置信度阈值,仅采用置信度大于阈值的边界框,得到一个边界框组,同时结合边界框组中每个边界框的类别和位置信息,采取最大值抑制操作,得到位置和类别的置信度最高的边界框作为该细胞的输出信息,至此所有基于单个细胞的输出信息共同构成细胞和病原体的检测结果,对上述输出信息中不同类别的细胞进行个数统计,即为其计数结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面对实施例或现有技术描述中所需要使用的附图做简单的介绍;显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的一种基于卷积神经网络的脑脊液细胞和病原体的自动检测计数方法的流程示意图;
图2是本发明实施例中,在100x物镜下采集的mgg染色样片的显微镜图片;
图3是本发明实施例中,构建脑脊液细胞和病原体的检测和计数的卷积神经网络模型的示意图;
图4是本发明实施例中,通过统计不同类型的mgg染色样片上的细胞数,绘制的每种病人需要的细胞数量的趋势图;
图5是本发明实施例中,根据迭代次数绘制的损失值。
具体实施方式
为使本发明实施例的目的、技术效果及技术方案更加清楚,下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述;显然,所描述的实施例是本发明一部分实施例。基于本发明公开的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的其它实施例,都应属于本发明保护的范围。
请参阅图1,本发明实施例的一种基于卷积神经网络的脑脊液细胞和病原体的自动检测计数方法,包括以下步骤:
步骤1:制备脑脊液样本的样片;
步骤2:使用全自动移动、聚焦、采集图片平台,对步骤1制备的样片进行图片采集;
步骤3:对步骤2采集到的每张图片中的每个细胞和病原体都由训练有素的技术人员进行标定,得到标定好的原始图片数据集合;
步骤4:将步骤3中的数据集按适当的比例随机分为训练集和测试集两部分;
步骤5:使用步骤4中的训练集输入卷积神经网络进行训练,对网络中的参数进行调整,随后测试该网络模型在测试集中对样片图片中细胞和病原体类型的检测效果,并调整步骤5优化算法参数,继续训练,直到在测试集上验证检测准确率稳定,得到最终的脑脊液细胞和病原体的检测模型;
步骤6:将步骤2采集到的未标定的脑脊液样片显微镜图片输入到步骤5得到的检测模型,输出所检测的每个患者脑脊液中细胞和病原体类别,以及其所占的百分比。
优选的,步骤1包括:使用玻片离心沉淀器制备脑脊液样片,对脑脊液样片进行染色固定处理和不染色固定处理,其中染色方法包括但不限于迈-格-姬染色法、墨汁染色法、阿利新兰染色法、改良抗酸染色和吖啶橙荧光染色法等。
优选的,步骤2包括:利用全自动图片采集平台对样片进行显微图片采集,图片采集技术手段包括但不限于光学显微镜、红外显微镜、紫外显微镜、荧光显微镜、偏光显微镜等显微技术。
优选的,步骤3的具体实现过程包括:
步骤3-1:由训练有素的技术人员使用标定工具以边界框的形式将步骤2采集到的每张显微镜图片中的所有物质标定出来;
步骤3-2:在每个标定框旁边标注细胞和病原体的英文类别;
步骤3-3:将每张图片的所有标签以(.xml)文件的形式保存;
步骤3-4:将已完成的显微镜图片的初步标定结果,由专业医生进行交叉检查,确定显微镜图片中全部细胞和病原体的最终标定结果。
优选的,步骤4中,将经步骤3构成的脑脊液显微镜图片数据集随机地按7:3分成训练集和测试集。
优选的,步骤5具体实现过程包括:
步骤5-1:基于tensorflow的目标检测图像神经网络构建卷积神经网络模型。使用迁移学习,导入在coco数据集上的预训练结果,赋予卷积神经网络模型合理的初始权重;
步骤5-2:使用步骤4中运用迁移学习进行初始化得到的卷积神经网络模型在训练集上进行训练,此过程即为一次前向传播;
步骤5-3:采用监督学习的方法,在经过一次前向传播后,使用softmax损失函数计算损失函数误差,然后选用随机梯度下降的方法进行迭代,使卷积神经网络模型的参数值向着损失函数下降的方向更新,此过程为一次完整的反向传播过程;
步骤5-4:使用训练集对使用预训练权重的卷积神经网络模型进行微调,经过多次步骤5-2的前向传播和步骤5-3的反向传播,更新卷积神经网络模型的参数,当达到设置的最大更新迭代数且深层卷积神经网络模型收敛时,结束训练,得到最终的脑脊液细胞和病原体的自动检测及计数的神经网络模型;
步骤5-5:将测试集输入步骤5-4训练好地卷积神经网络模型,输出结果与步骤3人工标定地结果比对,验证神经网络模型的识别准确率在90%以上。
步骤6:将步骤2采集到的无标签图片自动输入步骤5得到的最终的脑脊液细胞和病原体自动检测及计数的神经网络模型,针对每个患者的脑脊液样片,输出一份包含脑脊液中所含细胞和病原体类型及其所占百分比的细胞学报告。
本发明实施例中,步骤1中所述的脑脊液样片进行染色固定处理和不染色固定处理,其中染色方法包括但不限于迈-格-姬染色法、墨汁染色法、阿利新兰染色法、改良抗酸染色和吖啶橙荧光染色法等。
本发明实施例中,脑脊液细胞包括但不限于红细胞、单核细胞、淋巴细胞、中性粒细胞、嗜碱性粒细胞、嗜酸性粒细胞、巨细胞、吞噬细胞、浆细胞、幼稚细胞、肿瘤细胞等,病原体包括但不限于细菌、真菌、病毒、寄生虫。
本发明实施例中,利用全自动图像采集平台对样片进行显微图像采集,图像采集技术手段包括但不限于光学显微镜、红外显微镜、紫外显微镜、荧光显微镜、偏光显微镜、电子显微镜等显微技术。
本发明实施例中,步骤5中所述的构建最终的脑脊液细胞和病原体检测和计数的神经网络模型包括:根据损失函数,利用反向传播算法对网络的参数进行调整。
本发明实施例中,所述的检测和计数步骤具体包括:
将脑脊液样片的显微镜图片输入卷积神经网络进行特征提取,针对每个脑脊液细胞得到一组包含类别的边界框,每个边界框有不同的置信度,设置置信度阈值,仅采用置信度大于阈值的边界框,得到一个边界框组,同时结合边界框组中每个边界框的类别和位置信息,采取最大值抑制操作,得到位置和类别的置信度最高的边界框作为该细胞的输出信息,至此所有基于单个细胞的输出信息共同构成细胞和病原体的检测结果,对上述输出信息中不同类别的细胞进行个数统计,即为其计数结果。
具体实施例1
本发明实施例的一种基于神经网络的脑脊液细胞和病原体的检测计数方法,包括以下步骤:
步骤1,将20μl充分混匀后的脑脊液滴在细胞计数板上,在光学显微镜的40x物镜下进行细胞计数;
步骤2,将病理级载玻片和专用滤纸固定在细胞图片离心沉淀器(td2)上;
步骤3,根据细胞计数结果,在细胞沉淀器中滴加适量(0.1ml-0.5ml)脑脊液;
步骤4,将固定有细胞沉降器的载玻片放入离心机中进行细胞离心沉降处理,离心时间为2-5分钟,离心转速为800r/min;
步骤5,离心结束后将固定有细胞沉降器的载玻片取出后,卸掉细胞沉降器;
步骤6,在载玻片上的脑脊液细胞沉降区域滴加8-9滴mgg染液,2分钟后滴加4滴缓冲液,使其与mgg染液混匀,再放置8分钟后,用蒸馏水将多余染料冲洗干净并在室温下晾干。
步骤7:根据白细胞的计数结果,将制备的mgg染色样片分为三种类型:1)低初始细胞计数(w=0-4);2)中等初始细胞计数(w=5-50);3)高初始细胞计数(w≥50)。
步骤8:每种类型选择一个样片,每次可在全自动移动、聚焦、采集图像平台的卡槽内放入5张样片;
步骤9:点击自动采片,设备通过沿x,y轴自动移动载物台,将样片中央移动至光学显微镜20x的物镜下;
步骤10:设备通过沿z轴移动载物台,对物镜下的样片进行自动聚焦;
步骤11:对样片进行图片采集,采集60张图片,保存至设备连接的电脑相应文件夹;
步骤12:重复步骤9、10、11,对样片依次采集图片;
步骤13:由训练有素的技术人员使用标记工具labellmg以边界框的形式将采集到的每张显微镜图片中的每个细胞标定出来,并在旁边标定细胞的名称,所有图片中细胞的标定结果保存为(.xml)文件,细胞标定名称有:红细胞、淋巴细胞、单核细胞、嗜中性粒细胞;
步骤14:对于每一张mgg染色样片,根据(.xml)文件中单元格的位置和数据,分别统计采集到的每张图片上不同种类细胞所占百分比,在统计过程中逐渐增加用于统计的图片数量。如图4所示,可以看出,在统计一定数量的细胞后,白细胞类型所占的比例饱和,从而决定了一个成功和准确的细胞学报告所需的细胞数量为315个;
步骤15:按照步骤14所确定不同类型样片需要采集的图片张数,使用全自动移动、聚焦、采集图像平台重复步骤9、10,在100x物镜下,对w≥5的mgg染色样片进行图片采集;
步骤16:,将步骤15采集到1300张图片,大概30000个细胞,由训练有素的技术人员使用标定工具labellmg以边界框的形式将步骤16采集到的每张显微镜图片中的每个细胞标定出来,并同时在每个标定框旁边标注细胞的名称,将标定结果保存为(.xml)文件,细胞标签名称有:红细胞、淋巴细胞、单核细胞、嗜中性粒细胞;
步骤17:将已完成的每张图片中的每个细胞的初步标定结果,由专业医生进行交叉检查,确定全部细胞的最终标定结果。
步骤18:将完成最终标定的显微镜图片和(.xml)文件上传服务器,处理后得到原始数据集;
步骤19:将经步骤18构成的1300张脑脊液显微镜图片上的30000个细胞的数据集按7:随机分成训练集和测试集。
步骤20:基于tensorflow的目标检测图像神经网络构建卷积神经网络模型。使用迁移学习,导入在coco数据集上的预训练结果,赋予卷积神经网络模型合理的初始权重;
步骤21:使用步骤20中运用迁移学习进行初始化得到的卷积神经网络模型在训练集上进行训练,此过程即为一次前向传播;
步骤22:采用监督学习的方法,在经过一次前向传播后,使用softmax损失函数计算损失函数误差,然后选用随机梯度下降的方法进行迭代,使卷积神经网络模型的参数值向着损失函数下降的方向更新,此过程为一次完整的反向传播过程;
步骤23:使用训练集对使用预训练权重的卷积神经网络模型进行微调,经过多次步骤21的前向传播和步骤22的反向传播,更新卷积神经网络模型的参数。为了验证培训过程的有效性,图5显示了根据迭代次数绘制的损失值。损失函数值降低的过程,就是神经网络模型训练更加充分的过程,达到0的绝对极限,说明模型训练得很完美。然而,一般来说,为了使网络模型具有通用性,在训练的过程中,可以通过增加数据量、使用dropout、在损失函数中添加正则项的方式使过拟合现象得到缓解或克服。这个最终用于脑脊液细胞和病原体自动检测及计数的神经网络模型的训练过程经过20,000次迭代,约5-10小时。
步骤24:将测试集输入步骤23训练好地卷积神经网络模型,输出结果与步骤17人工标定地结果比对,验证神经网络模型的识别准确率在90%以上。
步骤25:将步骤15采集到的未标定图片自动输入步骤22得到的最终的脑脊液细胞检测和计数的神经网络模型,针对每个患者的mgg染色样片,检测时间大约需7s,可输出一份包含脑脊液中所含细胞和病原体类型及各类细胞和病原体所占百分比的报告。
具体实施例2
本发明实施例的一种基于神经网络的脑脊液细胞和病原体的检测计数方法,包括以下步骤:
步骤1,将20μl充分混匀后的脑脊液滴在细胞计数板上,在光学显微镜的40x物镜下进行细胞计数;
步骤2,将病理级载玻片和专用滤纸固定在细胞图片离心沉淀器(td2)上;
步骤3,根据细胞计数结果,在细胞沉淀器中滴加适量(0.1ml-0.5ml)脑脊液;
步骤4,将固定有细胞沉降器的载玻片放入离心机中进行细胞离心沉降处理,离心时间为2-5分钟,离心转速为800r/min;
步骤5,离心结束后将固定有细胞沉降器的载玻片取出后,卸掉细胞沉降器;
步骤6,在载玻片上的脑脊液细胞沉降区域滴加8-9滴mgg染液,2分钟后滴加4滴缓冲液,使其与mgg染液混匀,再放置8分钟后,用蒸馏水将多余染料冲洗干净并在室温下晾干。
步骤7:根据白细胞的计数结果,将制备的mgg染色样片分为三种类型:1)低初始细胞计数(w=0-4);2)中等初始细胞计数(w=5-50);3)高初始细胞计数(w≥50)。
步骤8:每种类型选择一个样片,每次可在全自动移动、聚焦、采集图像平台的卡槽内放入5张样片;
步骤9:点击自动采片,设备通过沿x,y轴自动移动载物台,将样片中央移动至光学显微镜20x的物镜下;
步骤10:设备通过沿z轴移动载物台,对物镜下的样片进行自动聚焦;
步骤11:对样片进行图像采集,采集60张图片,保存至设备连接的电脑相应文件夹;
步骤12:重复步骤9、10、11,依次采集3张样片;
步骤13:由训练有素的技术人员使用标记工具labellmg以边界框的形式将采集到的每张显微镜图像中的所有细胞标定出来,并在旁边标定细胞的名称,所有每张图像中细胞的标定结果保存为(.xml)文件,细胞标记名称有:红细胞、淋巴细胞、单核细胞、嗜中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞;
步骤14:对于每一张mgg染色样片,根据(.xml)文件中单元格的位置和数据,分别统计采集到的每张图片上不同种类细胞所占百分比,在统计过程中逐渐增加用于统计的图片数量。如图4所示,可以看出,在统计一定数量的细胞后,每种白细胞类型所占的比例饱和,从而决定了一个成功和准确的细胞学报告所需的细胞数量为315个。最终得到对于获得一份准确的细胞学报告,不同种类样片在20x物镜下,所需要采集的图片张数分别为:1)低初始细胞计数(w=0-4),需要采集60张显微镜图像;2)中等初始细胞计数(w=5-50),需要采集5张显微镜图片;3)高初始细胞计数(w≥50),需要采集5张显微镜图片;
步骤15:按照步骤14所确定不同类型样片需要采集的图片张数,使用全自动移动、聚焦、采集图像平台重复步骤9、10,在20x物镜下,对w≥5的mgg染色样片进行图片采集;
步骤16:,将步骤15采集到50个患者mgg染色样片的184张图片,大概15000个细胞,由训练有素的技术人员使用标定工具labellmg以边界框的形式将步骤15采集到的每张显微镜图片中的每个细胞标定出来,并同时在每个标定框旁边标注细胞的名称,将标定结果保存为(.xml)文件,细胞标签名称有:红细胞、淋巴细胞、单核细胞、嗜中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞;
步骤17:将已完成的每张图片中的每个细胞的初步标定结果,由专业医生进行交叉检查,确定全部细胞的最终标定结果。
步骤18:将完成最终标定的显微镜图片和对应的(.xml)文件上传服务器,处理后得到原始数据集;
步骤19:将经步骤18构成的184张脑脊液显微镜图片上的15000个细胞的数据集按7:3随机地分成训练集和测试集。
步骤20:基于tensorflow的目标检测图像神经网络构建卷积神经网络模型。使用迁移学习,导入在coco数据集上的预训练结果,赋予卷积神经网络模型合理的初始权重;
步骤21:使用步骤20中运用迁移学习进行初始化得到的卷积神经网络模型在训练集上进行训练,此过程即为一次前向传播;
步骤22:采用监督学习的方法,在经过一次前向传播后,使用softmax损失函数计算损失函数误差,然后选用随机梯度下降的方法进行迭代,使卷积神经网络模型的参数值向着损失函数下降的方向更新,此过程为一次完整的反向传播过程;
步骤23:使用训练集对使用预训练权重的卷积神经网络模型进行微调,经过多次步骤21的前向传播和步骤22的反向传播,更新卷积神经网络模型的参数。为了验证培训过程的有效性,图5显示了根据迭代次数绘制的损失值。损失函数值降低的过程,就是神经网络模型训练更加充分的过程,达到0的绝对极限,说明模型训练得很完美。然而,一般来说,为了使网络模型具有通用性,在训练的过程中,可以通过增加数据量、使用dropout、在损失函数中添加正则项的方式使过拟合现象得到缓解或克服。这个最终用于脑脊液细胞和病原体自动检测及计数的神经网络模型的训练过程经过20,000次迭代,约5-10小时。
步骤24:将测试集输入步骤23训练好地卷积神经网络模型,输出结果与步骤17人工标定地结果比对,验证神经网络模型的识别准确率在90%以上。
步骤25:将步骤15采集到的未标定图片自动输入步骤23得到的最终的脑脊液细胞检测和计数的神经网络模型,针对每个患者的mgg染色样片,检测时间大约需7s,可输出一份包含脑脊液中所含细胞和病原体类型及各类细胞和病原体所占百分比的报告。
具体实施例3
本发明实施例的一种基于神经网络的脑脊液细胞和病原体的检测计数方法,包括以下步骤:
步骤1,将20μl充分混匀后的脑脊液滴在细胞计数板上,在光学显微镜的40x物镜下进行细胞计数;
步骤2,将病理级载玻片和专用滤纸固定在细胞图片离心沉淀器(td2)上;
步骤3,根据细胞计数结果,在细胞沉淀器中滴加适量(0.1ml-0.5ml)脑脊液;
步骤4,将固定有细胞沉降器的载玻片放入离心机中进行细胞离心沉降处理,离心时间为2-5分钟,离心转速为800r/min;
步骤5,离心结束后将固定有细胞沉降器的载玻片取出后,卸掉细胞沉降器;
步骤6,在载玻片上的脑脊液细胞沉降区域滴加8-9滴mgg染液,2分钟后滴加4滴缓冲液,使其与mgg染液混匀,再放置8分钟后,用蒸馏水将多余染料冲洗干净并在室温下晾干。
步骤7:每次在全自动移动、聚焦、采集图片平台的卡槽内放入5张样片;
步骤8:点击自动采片,设备通过沿x,y轴自动移动载物台,将样片中央移动至光学显微镜100x的物镜下;
步骤9:设备通过沿z轴移动载物台,对物镜下的样片进行自动聚焦;
步骤10:在100x物镜下,对肿瘤患者和血液病患者脑脊液的mgg染色样片进行图片采集,每张样片采集所含的全部肿瘤细胞的显微镜图片,保存至设备连接的电脑相应文件夹;
步骤11:,将步骤10采集到图片中的特殊类型的细胞,由训练有素的技术人员使用标定工具labellmg以边界框的形式将步骤10采集到的每张显微镜图片中的每个细胞框出来,并同时在每个标定框旁边标定细胞的名称,将标定结果保存为(.xml)文件,细胞标签名称有:肿瘤细胞,幼稚细胞;
步骤12:将已完成的每张图片中的每个细胞的初步标定结果,由专业医生进行交叉检查,确定全部细胞的最终标定结果。
步骤13:将完成最终标定的显微镜图片和对应的(.xml)文件上传服务器,处理后得到原始数据集;
步骤14:将经步骤13构成的脑脊液显微镜图片上特殊类型细胞的数据集按7:3随机地分成训练集和测试集。
步骤15:基于tensorflow的目标检测图像神经网络构建卷积神经网络模型。使用迁移学习,导入在coco数据集上的预训练结果,赋予卷积神经网络模型合理的初始权重;
步骤16:使用步骤15中运用迁移学习进行初始化得到的卷积神经网络模型在训练集上进行训练,此过程即为一次前向传播;
步骤17:采用监督学习的方法,在经过一次前向传播后,使用softmax损失函数计算损失函数误差,然后选用随机梯度下降的方法进行迭代,使卷积神经网络模型的参数值向着损失函数下降的方向更新,此过程为一次完整的反向传播过程;
步骤18:使用训练集对使用预训练权重的卷积神经网络模型进行微调,经过多次步骤16的前向传播和步骤17的反向传播,更新卷积神经网络模型的参数。为了验证培训过程的有效性,根据迭代次数绘制损失值。损失函数值降低的过程,就是神经网络模型训练更加充分的过程,达到0的绝对极限,说明模型训练得很完美。然而,一般来说,为了使网络模型具有通用性,在训练的过程中,可以通过增加数据量、使用dropout、在损失函数中添加正则项的方式使过拟合现象得到缓解或克服。这个最终用于脑脊液细胞和病原体自动检测及计数的神经网络模型的训练过程经过20,000次迭代,约5-10小时。
步骤19:将测试集输入步骤18训练好地卷积神经网络模型,输出结果与步骤12人工标定地结果比对,验证神经网络模型的识别准确率在90%以上。
步骤20:重复步骤8、9,在20x物镜下采集肿瘤患者和血液病患者的mgg染色样片,每张mgg染色样片全部采集,有300张图片,需5-8分钟;
步骤21:将步骤20采集到的未标定图片自动输入步骤19得到的最终的脑脊液细胞检测和计数的神经网络模型,针对每个患者的mgg染色样片,检测时间大约需7s,可输出一份包含脑脊液中所含特殊细胞类型及各类细胞所占百分比的报告。
综上,本发明公开了一种基于卷积神经网络的脑脊液细胞和病原体的自动检测计数方法,属于使用深度学习对医学显微图像进行检测,包含如下步骤:脑脊液样片制备;全自动显微成像装置进行样片的移动、聚焦和图片采集;对采集到的图片中所包含的细胞和病原体类型进行人工标定,将样片图像以及标签构成数据集;将数据集分为训练集和测试集两部分;使用标定的脑脊液图片样本对卷积神经网络进行训练;将测试集输入训练好的的卷积神经网络,输出检测和计数的结果。本发明将样片制备、全自动图片采集平台和一种脑脊液细胞和病原体自动检测及计数的神经网络模型三者很好的结合,首先将脑脊液样本制备样片、再使用全自动图像采集平台对样片采集图片,接下来将图片输入到已完成用于脑脊液细胞和病原体的自动检测及计数的卷积神经网络模型,最后输出一份涵盖细胞和病原体类型和所占百分比的报告。每一环节相连接,构成了一种基于神经网络的脑脊液细胞和病原体的自动检测及计数方法。本发明可进行准确、快速、自动地运行和显微镜图片中细胞和病原体类型的检测和计数,从而完成对脑脊液样片的显微镜图片中细胞和病原体的检测和计数。本发明有效减少医生阅片的劳动强度并提高诊断的准确度,将脑脊液细胞病理学检测的时间缩短了80%以上。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员依然可以对本发明的具体实施方式进行修改或者等同替换,这些未脱离本发明精神和范围的任何修改或者等同替换,均在申请待批的本发明的权利要求保护范围之内。
1.一种基于卷积神经网络的脑脊液细胞和病原体的自动检测计数方法,其特征在于,包括以下步骤:
步骤1,对预制备的脑脊液样本样片进行图片采集,获得原始图像数据集合;
步骤2,对步骤1获得的原始图像数据集合的每张图片中的每个脑脊液细胞和病原体进行标定,获得标定好的原始图像数据集合;
步骤3,将步骤2获得的标定好的原始图像数据集合分为训练集和测试集;
步骤4,将步骤3获得的训练集输入预构建的卷积神经网络模型进行训练,直到在测试集上验证检测准确率达到预设要求,获得脑脊液细胞和病原体的检测模型;
步骤5,将待检测的未标定的脑脊液样片图片输入到步骤4获得的检测模型,输出所识别的脑脊液细胞和病原体的类别及各种类别所占的百分比。
2.根据权利要求1所述的一种基于卷积神经网络的脑脊液细胞和病原体的自动检测计数方法,其特征在于,步骤1中,制备脑脊液样本样片的步骤具体包括:制备脑脊液样本的样片,样片进行染色固定处理和不染色固定处理。
3.根据权利要求1所述的一种基于卷积神经网络的脑脊液细胞和病原体的自动检测计数方法,其特征在于,步骤1中,图片采集的步骤具体包括:利用全自动图像采集平台对制备的脑脊液样本样片进行显微图像采集。
4.根据权利要求1所述的一种基于卷积神经网络的脑脊液细胞和病原体的自动检测计数方法,其特征在于,步骤2中,所述脑脊液细胞包括红细胞、单核细胞、淋巴细胞、中性粒细胞、嗜碱性粒细胞、嗜酸性粒细胞、巨细胞、吞噬细胞、浆细胞、幼稚细胞和肿瘤细胞;
所述病原体包括细菌、真菌、病毒和寄生虫。
5.根据权利要求1所述的一种基于卷积神经网络的脑脊液细胞和病原体的自动检测计数方法,其特征在于,步骤2进行标定的步骤包括:
使用标定工具以边界框的形式将步骤1采集到的每张图像中的每个脑脊液细胞和病原体标定出来;
在每个标定框旁边标注其类别,将每张图像的所有标定信息以.xml文件的形式保存。
6.根据权利要求1所述的一种基于卷积神经网络的脑脊液细胞和病原体的自动检测计数方法,其特征在于,步骤4的训练过程中,根据损失函数,利用反向传播算法对检测模型的参数进行调整。
7.根据权利要求1所述的一种基于卷积神经网络的脑脊液细胞和病原体的自动检测计数方法,其特征在于,步骤4具体包括:
基于tensorflow的目标检测图像神经网络构建卷积神经网络模型,使用迁移学习,导入预训练结果,赋予卷积神经网络模型初始权重,获得初始化的卷积神经网络模型;
初始化得到的卷积神经网络模型在步骤3获得的训练集上进行训练,此过程为一次前向传播;
采用监督学习的方法,在经过一次前向传播后,使用softmax损失函数计算损失函数误差;选用随机梯度下降的方法进行迭代,使卷积神经网络模型的参数值向着损失函数下降的方向更新,此过程为一次反向传播;
使用训练集对使用预训练权重的卷积神经网络模型进行微调,经过多次前向传播和反向传播,更新卷积神经网络模型的参数,当达到设置的最大更新迭代数且深层卷积神经网络模型收敛时,结束训练,得到训练好的卷积神经网络模型。
8.根据权利要求7所述的一种基于卷积神经网络的脑脊液细胞和病原体的自动检测计数方法,其特征在于,步骤4还包括:
将测试集输入训练好的卷积神经网络模型,输出结果与人工标定结果比对,验证卷积神经网络模型的识别准确率在90%以上。
9.一种基于卷积神经网络的脑脊液细胞和病原体的自动检测计数系统,其特征在于,包括:
图像采集模块,用于对预制备的脑脊液样本样片进行图片采集,获得原始图像数据集合;
数据处理模块,用于对图像采集模块获得的原始图像数据集合的每张图片中的每个脑脊液细胞和病原体进行标定,获得标定好的原始图像数据集合;用于将标定好的原始图像数据集合分为训练集和测试集;用于将训练集输入预构建的卷积神经网络模型进行训练,直到在测试集上验证检测准确率达到预设要求,获得脑脊液细胞和病原体的检测模型;
输入输出模块,用于将待检测的未标定的脑脊液样片图片输入检测模型,输出所识别的脑脊液细胞和病原体的类别及各种类别所占的百分比。
技术总结