模型训练方法及设备、图像处理方法及设备以及介质与流程

专利2022-06-28 128

本公开涉及计算机技术领域，具体涉及一种模型训练方法和设备图像处理方法和设备以及存储介质。

背景技术：

正电子发射计算机断层扫描(positronemissiontomography，pet)是一种核医学临床检查的成像技术。pet技术是当前唯一利用解剖形态方式进行功能、代谢和受体显像的技术，具有无创伤的特点并能提供全身三维和功能运转的图像，可简称为pet图像。

长期以来，对于pet图像中所包含的信息利用率不高，人眼无法从pet图像中获取和量化有效的信息。并且，在手术前仅通过图像分析的方式，来对肿瘤的病理组织信息做出分类判断一直是一个困难的问题。仅仅依靠人们的经验来进行判断，往往结果因人而异，甚至同一个人在不同时间对相同的图像做出的分类结果也不同。因此，需要一个行之有效的方法来提高分类性能，使得分类的结果可靠。

技术实现要素：

根据本公开实施例，提出了一种模型训练方法和设备、图像处理方法和设备以及存储介质，利用训练得到的目标模型能够实现针对基因型未知的三维pet图像的有效基因型预测。

在本公开的一个方面，提供了一种模型训练方法，包括：获取多个样本图像，其中，多个样本图像中的任一样本图像包括：基因型已知的关于指定肿瘤的三维pet图像。获取任一样本图像的基因型信息。然后，确定任一样本图像的特征集。基于上述所获取的多个样本图像各自的基因型信息和特征集，对初始模型进行训练，以得到目标模型，该目标模型用于确定：基因型未知的关于指定肿瘤的三维pet图像的基因型信息。

根据本公开实施例，上述确定任一样本图像的特征集包括：获取任一样本图像中包含指定肿瘤的感兴趣区域，并将该感兴趣区域的任一像素值转换为标准摄取值，以获得针对该感兴趣区域的第一矩阵。然后，基于第一矩阵，确定该任一样本图像的第一特征集合。

根据本公开实施例，上述基于第一矩阵，确定任一样本图像的第一特征集合包括：从第一矩阵中提取第一指定特征，第一指定特征中的任一第一指定特征包括如下至少一项：几何特征、一阶统计特征和纹理特征。对所述第一矩阵进行小波变换，以得到第二矩阵，并从第二矩阵中提取第二指定特征，第二指定特征包括如下至少一项：一阶统计特征和纹理特征。由所提取出的第一指定特征和/或第二指定特征构成第一特征集合。

根据本公开实施例，上述确定任一样本图像的特征集还包括：计算第一特征集合中的任一特征与基因型信息之间的第一相关性。然后，从第一特征集合中选取第一相关性符合第一预定条件的特征，以组成第二特征集合。

根据本公开实施例，上述确定任一样本图像的特征集还包括：计算第二特征集合中任意两个特征之间的第二相关性。然后，对第二特征集合中第二相关性特征符合第二预定条件的特征进行去冗余处理，以得到第三特征集合。

根据本公开实施例，上述确定任一样本图像的特征集还包括：对第三特征集合进行多因素特征选择，以得到特征集。

根据本公开实施例，上述几何特征包括如下至少一项：指定肿瘤的体积、指定肿瘤的表面积、和指定肿瘤的球形度。并且/或者，上述一阶统计特征包括如下至少一项：最大值、最小值、峰度、和偏度。并且/或者，上述纹理特征包括：基于灰度共生矩阵算法得到的纹理特征，和/或，基于灰度游程矩阵得到的纹理特征。

根据本公开实施例，上述指定肿瘤包括脑胶质瘤。

根据本公开的另一方面，提供了一种图像处理方法，包括：获取基于如上任一实施例所述的模型训练方法训练得到的目标模型。获取待处理图像，待处理图像包括：基因型未知的关于指定肿瘤的三维pet图像。然后，确定待处理图像的特征集。再将待处理图像的特征集输入至目标模型，以使目标模型输出关于待处理图像的基因型信息的分类结果。

根据本公开的另一方面，提供了一种模型训练设备，包括：存储器和处理器。其中，存储器配置为存储指令和数据。处理器配置为执行所述指令，以便：获取多个样本图像，其中，多个样本图像中的任一样本图像包括：基因型已知的关于指定肿瘤的三维pet图像。获取任一样本图像的基因型信息。然后，确定任一样本图像的特征集。基于上述所获取的多个样本图像各自的基因型信息和特征集，对初始模型进行训练，以得到目标模型，该目标模型用于确定：基因型未知的关于指定肿瘤的三维pet图像的基因型信息。

根据本公开的另一方面，提供了一种图像处理设备，包括：存储器和处理器。其中，存储器配置为存储指令和数据。处理器配置为执行所述指令，以便：获取基于如上任一实施例所述的模型训练方法训练得到的目标模型。获取待处理图像，待处理图像包括：基因型未知的关于指定肿瘤的三维pet图像。然后，确定待处理图像的特征集。再将待处理图像的特征集输入至目标模型，以使目标模型输出关于待处理图像的基因型信息的分类结果。

根据本公开上述实施例的方案，利用已知基因型的关于指定肿瘤的pet图像生成样本集，样本集包括多个带有标签的特征集，每个特征集表征一个pet图像的图像特征，每个特征集的标签表征一个pet图像的基因型信息。利用样本集对初始模型进行训练，以得到针对关于指定肿瘤的pet图像具有基因型分类预测能力的目标模型。后续可将该目标模型用于医学研究或临床诊断、治疗过程中，对指定肿瘤的病理组织信息做出关于基因型的、更为高效、更为准确的分类判断，这对于进行肿瘤的研究和抗癌药物的开发具有深远意义。

附图说明

为了更好地理解本公开实施例，将根据以下附图对本公开实施例进行详细描述：

图1示意性示出了根据本公开实施例的模型训练方法和设备、图像处理方法和设备以及存储介质的应用场景；

图2示意性示出了根据本公开实施例的模型训练方法的流程图；

图3示意性示出了根据本公开实施例的图像处理方法的流程图；

图4示意性示出了根据本公开实施例的基于机器学习方式的pet图像处理过程的流程图；

图5示意性示出了根据本公开实施例对第一矩阵进行量化分析的示例示意图；以及

图6示意性示出了根据本公开实施例的用于实现上文所描述的方法的电子设备的框图。

具体实施方式

下面将详细描述本公开实的具体实施例，应当注意，这里描述的实施例只用于举例说明，并不用于限制本公开实施例。在以下描述中，为了提供对本公开实施例的透彻理解，阐述了大量特定细节。然而，对于本领域普通技术人员显而易见的是：不必采用这些特定细节来实行本公开实施例。在其他实例中，为了避免混淆本公开实施例，未具体描述公知的结构、材料或方法。

在整个说明书中，对“一个实施例”、“实施例”、“一个示例”或“示例”的提及意味着：结合该实施例或示例描述的特定特征、结构或特性被包含在本公开至少一个实施例中。因此，在整个说明书的各个地方出现的短语“在一个实施例中”、“在实施例中”、“一个示例”或“示例”不一定都指同一实施例或示例。此外，可以以任何适当的组合和/或子组合将特定的特征、结构或特性组合在一个或多个实施例或示例中。此外，本领域普通技术人员应当理解，这里使用的术语“和/或”包括一个或多个相关列出的项目的任何和所有组合。

本公开的实施例提出了一种模型训练方法和设备、图像处理方法和设备以及存储介质。其中，模型训练方法可以包括样本获取过程、特征确定过程和训练过程。在样本获取过程，获取多个样本图像，并且获取任一样本图像的基因型信息。其中，多个样本图像中的任一样本图像包括：基因型已知的关于指定肿瘤的三维pet图像。然后进行特征确定过程，确定任一样本图像的特征集。基于上述所获取的多个样本图像各自的基因型信息和特征集，对初始模型进行训练，以得到目标模型，该目标模型用于确定：基因型未知的关于指定肿瘤的三维pet图像的基因型信息。

正电子发射计算机断层扫描是一种核医学临床检查的成像技术。pet技术是当前唯一利用解剖形态方式进行功能、代谢和受体显像的技术，具有无创伤的特点并能提供全身三维和功能运转的图像。pet图像不同于基于结构成像的计算机断层扫描(computedtomography，ct)图像和磁共振(magneticresonance，mr)图像，pet图像能够提供肿瘤代谢方面的分子信息。由于肿瘤细胞的代谢活跃，摄取显影剂的能力强，因此在pet图像上往往以高代谢的形式呈现。

图1示意性示出了根据本公开实施例的模型训练方法和设备、图像处理方法和设备以及存储介质的应用场景。需要注意的是，图1所示仅为可以应用本公开实施例的场景的示例，以帮助本领域技术人员理解本公开的技术内容，但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。

如图1所示，该应用场景示例性地展示了正电子发射计算机断层扫描仪(下文简称为“pet设备”)100的结构示意图。根据本实施例的pet设备100可以包括探测器10、数据采集装置20以及数据处理装置30。pet设备100对被检查对象40进行pet扫描和数据处理，以获取针对该被检查对象40的pet图像。示例性地，根据本公开实施例的模型训练方法和设备中的样本图像可以由此过程获得，根据本公开实施例的图像处理方法和设备中的待处理图像也可以由此过程获得。

探测器10例如包括闪烁晶体和光电倍增管(pmt)。示例性地，探测器10采用块状探测结构，由多个块状探测结构组成一个环，再由多个环构成整个封闭多环形探测器。其中每个块状探测结构由多个闪烁晶体构成，每个闪烁晶体后又带有多个光电倍增管。闪烁晶体用于将高能光子转换为可见光，光电倍增管用于将光信号转换为电信号。数据采集装置20例如包括数据采集电路，数据采集电路可以包括读出电路、采集触发电路及数据传输电路等。数据处理装置30例如包括安装有控制程序和数据处理程序的计算机设备，负责完成图像重建(imagereconstruction)，还负责完成pet设备运行过程的控制，包括机械平移、机械转动、电气控制等，还可以训练模型，并且利用训练得到的目标模型对pet图像进行预测分类等。以上仅为示例，不对本公开造成限制。

示例性地，pet设备100的基本工作过程如下：进行扫描前，将已被标记的化学示踪剂(造影剂)注射至被检查对象40体内，这些示踪剂通过血液的流动被运载到器官或病变区域参与被检查对象40的生理或代谢过程。当被检查对象40体内的放射性同位素经历正电子放射衰变时，如图1所示，释放的正电子遇到细胞的电子会发生电子对湮灭(annihilation)，产生一对方向相反的伽马(γ)射线。经探测器10和数据采集装置20探测并采集后，以列表模式(1ist-mode)或正弦直方图(sino-gram)的数据形式传输至数据处理装置30。数据处理装置30对接收到的数据进行二维图像重建或三维图像重建，以得到相应的pet图像。

需要说明的是，本公开实施例所提供的模型训练方法一般可以由数据处理装置30执行。本公开实施例所提供的模型训练方法也可以由不同于数据处理装置30且能够与数据处理装置30通信的服务器或服务器集群执行。本公开实施例所提供的图像处理方法一般可以由数据处理装置30执行。本公开实施例所提供的图像处理方法也可以由不同于数据处理装置30且能够与数据处理装置30通信的服务器或服务器集群执行。本公开实施例所提供的模型训练方法和图像处理方法可以在相同设备中执行，也可以在不同设备中执行，在此不做限制。

鉴于一些指定肿瘤的pet图像的图像特征与指定肿瘤所属的基因型有着一定的相关性，本公开实施例提供了基于图像机器学习对关于指定肿瘤的pet图像进行分析和处理，以推断指定肿瘤属于不同基因类别的概率，进而辅助医学研究和临床治疗的开展和进步。

根据本公开实施例，提供了一种模型训练方法，下面通过图例对该方法进行说明。应注意，以下方法中各个操作的序号仅作为该操作的表示以便描述，而不应被看作表示该各个操作的执行顺序。除非明确指出，否则该方法不需要完全按照所示顺序来执行。

图2示意性示出了根据本公开实施例的模型训练方法的流程图。

如图2所示，该方法可以包括以下操作s201～s204。

在操作s201，获取多个样本图像。

其中，多个样本图像中的任一样本图像可以为基因型已知的关于指定肿瘤的三维pet图像，指定肿瘤的pet图像特征与该指定肿瘤所属的基因型信息具有关联关系。例如，获取多名已确诊患者各自的关于指定肿瘤的三维pet图像作为多个样本图像。对于其中的任一三维pet图像，由于已确诊，其相应的基因型信息已确定。

然后，在操作s202，获取任一样本图像的基因型信息。

然后，在操作s203，确定任一样本图像的特征集。

在开始训练之前，上述操作s201～s203先获取多个样本图像，对于每个样本图像，获取该样本图像的基因型信息和特征集，将基因型信息作为特征集的标签。由与多个样本图像对应的多个带有标签的特征集构成模型训练过程的样本集。

接着，在操作s204，基于上述所获取的多个样本图像各自的基因型信息和特征集，对初始模型进行训练，以得到目标模型。

示例性地，可以利用上述得到的样本集对初始模型进行有监督训练，进行多次迭代优化，直至目标函数达到收敛，从而得到目标模型。该目标模型用于确定：基因型未知的关于指定肿瘤的三维pet图像的基因型信息。也就是说，目标模型可以根据尚未确诊的某个指定肿瘤的三维pet图像的图像特征来预测该指定肿瘤所属的基因型信息。初始模型可以是各种分类模型，例如可以是随机森林(randomforest)、决策树(decisiontree)等基础机器学习模型，也可以是各种神经网络模型，在此不做限制。

本领域技术人员可以理解，根据本公开实施例的模型训练方法利用已知基因型的关于指定肿瘤的pet图像生成样本集，样本集包括多个带有标签的特征集，每个特征集表征一个pet图像的图像特征，每个特征集的标签表征一个pet图像的基因型信息。利用样本集对初始模型进行训练，以得到针对关于指定肿瘤的pet图像具有基因型分类预测能力的目标模型。后续可将该目标模型用于医学研究或临床诊断、治疗过程中，对指定肿瘤的病理组织信息做出关于基因型的、更为高效、更为准确的分类判断，这对于进行肿瘤的研究和抗癌药物的开发具有深远意义。

根据本公开实施例，为保证训练过程的有效性，避免无关因素的干扰，样本图像的特征集重点用于反映样本图像中所包含的肿瘤的特征，因此需尽量去除其他无关背景的干扰。上述确定任一样本图像的特征集的过程可以包括：获取任一样本图像中包含指定肿瘤的感兴趣区域(regionofinterest，roi)，并将该感兴趣区域的任一像素值转换为标准摄取值(standarduptakevalue，suv)，以获得针对该感兴趣区域的第一矩阵(suvmap)。然后，基于第一矩阵，确定该任一样本图像的第一特征集合。在具体的例子中，可以将该第一特征集合直接作为该任一样本图像的特征集，也可以对该第一特征集合进行继续处理。

示例性地，为使所确定的特征集更加明确地反映肿瘤的各方面特性，如几何特性、纹理特性等，根据本公开实施例，上述基于第一矩阵，确定任一样本图像的第一特征集合的过程可以包括：从第一矩阵中提取第一指定特征，第一指定特征中的任一第一指定特征包括如下至少一项：几何特征、一阶统计特征和纹理特征。对第一矩阵进行小波变换，以得到第二矩阵，并从第二矩阵中提取第二指定特征，第二指定特征包括如下至少一项：一阶统计特征和纹理特征。接着，由所提取出的第一指定特征和/或第二指定特征构成第一特征集合。

例如，上述几何特征用于反映指定肿瘤的形状大小信息，例如可以包括如下至少一项：指定肿瘤的体积、指定肿瘤的表面积、和指定肿瘤的球形度。备选地或附加地，上述一阶统计特征用于反映指定肿瘤组织suv值分布的一阶统计特征，例如可以包括如下至少一项：最大值、最小值、峰度、和偏度，。备选地或附加地，上述纹理特征用于反映指定肿瘤组织内部的纹理信息，例如可以是基于灰度共生矩阵(gray-levelco-occurrencematrix，glcm)算法得到的纹理特征，也可以是基于灰度游程矩阵(gray-levelrun-lengthmatrix，glrlm)得到的纹理特征。

进一步地，为提高模型训练效率，还可以去除上述第一特征集合中与基因型信息无关的特征。根据本公开实施例，上述确定任一样本图像的特征集的过程还可以包括：计算第一特征集合中的任一特征与基因型信息之间的第一相关性。然后，从第一特征集合中选取第一相关性符合第一预定条件的特征，以组成第二特征集合。可以理解，通过本实施例的筛选过程，筛选出与指定肿瘤可能所属的基因型显著相关的特征。在具体的例子中，可以将所得到的第二特征集合直接作为该任一样本图像的特征集，也可以对该第二特征集合进行继续处理。

例如，利用皮尔森相关系数(pearsoncorrelationcoefficient)计算第一特征集合中的每个特征(每个特征可以通过特征向量的形式表示)与基因型集合之间的第一相关性，其中基因型集合包括与指定肿瘤可能相关的多个基因型信息。当第一相关性低于第一预定阈值时，确定不符合第一预定条件，说明该特征对于基因型的判断贡献很小，故可以将该特征删除。当第一相关性不低于第一预定阈值时，确定符合第一预定条件，保留该特征以组成第二特征集合。在其他例子中，还可以利用其他衡量相关程度的算法计算特征与基因型信息之间的第一相关性，例如欧式距离、余弦相似性等，在此不做限制。

为进一步提高模型训练效率，还可以对于上述第二特征集合中分布状况相近的特征进行去冗余处理。根据本公开实施例，上述确定任一样本图像的特征集的过程还可以包括：计算第二特征集合中任意两个特征之间的第二相关性。然后，对第二特征集合中第二相关性特征符合第二预定条件的特征进行去冗余处理，以得到第三特征集合。去冗余处理是指：当存在多个符合第二预定条件的特征时，仅保留其中的一个特征。可以理解，通过本实施例的去冗余过程，对相似或相同的特征进行去重，以在不影响训练效果的前提下减少数据量，提高数据处理速度。在具体的例子中，可以将所得到的第三特征集合直接作为该任一样本图像的特征集，也可以对该第三特征集合进行继续处理。

例如，可以利用互信息(mutualinformation，mi)的方式来计算第二特征集合中任意两个特征(每个特征可以通过特征向量的形式表示)之间的第二相关性。当第二相关性低于第二预定阈值时，确定不符合第二预定条件，说明该两个特征之间不相似。当第二相关性不低于第二预定阈值时，确定符合第二预定条件，需要对该两个特征进行去冗余，去除其中一个，保留另一个。在其他例子中，还可以利用其他衡量相关程度的算法计算特征之间的第二相关性，例如欧式距离、余弦相似性等，在此不做限制。

为进一步提高模型训练效率，根据本公开实施例，还可以对第三特征集合进行多因素特征选择(featureselection)，以使第三特征集合进一步降维，以得到该任一样本图像的特征集。可以理解，通过本实施例的特征选择过程，可以减少特征集中的特征数量，使模型泛化能力更强，减少过拟合情况的发生。

将基于上述各实施例得到的多个已知基因型信息的特征集构成样本集，利用样本集对初始模型进行训练，可以更为快速、有效地得到目标模型。

根据本公开实施例，还提供了一种利用上文各实施例得到的目标模型对关于指定肿瘤的pet图像进行处理的图像处理方法，以预测关于指定肿瘤的pet图像的基因型信息。该图像处理方法与上文中的模型训练方法可以在同一设备中实施，也可以在不同设备中实施。下面通过图例对该方法进行说明。应注意，以下方法中各个操作的序号仅作为该操作的表示以便描述，而不应被看作表示该各个操作的执行顺序。除非明确指出，否则该方法不需要完全按照所示顺序来执行。

图3示意性示出了根据本公开实施例的图像处理方法的流程图。

如图3所示，该方法可以包括以下操作s301～s304。

在操作s301，获取目标模型。

其中，所获取的目标模型可以是基于如上任一实施例所述的模型训练方法训练得到的。

然后，在操作s302，获取待处理图像。

其中，待处理图像例如可以是：基因型未知的关于指定肿瘤的三维pet图像。

然后，在操作s303，确定待处理图像的特征集。

其中，确定待处理图像的特征集的过程与上文中确定样本图像的特征集的过程具有相同的原理，上文中已详细说明，在此不再赘述。

接着，在操作s304，将待处理图像的特征集输入至目标模型，以使目标模型输出关于待处理图像的基因型信息的分类结果。

本领域技术人员可以理解，根据本公开实施例的图像处理方法利用上文训练得到的目标模型对未知基因型的关于指定肿瘤的pet图像进行处理，由于该目标模型是基于多个带有标签的特征集训练得到，每个特征集表征一个pet图像的图像特征，每个特征集的标签表征一个pet图像的基因型信息，使得该目标模型具有针对关于指定肿瘤的pet图像的基因型分类预测能力。根据本公开实施例的图像处理方法可用于医学研究或临床诊断、治疗过程中，对指定肿瘤的病理组织信息做出关于基因型的、更为高效、更为准确的分类判断，这对于进行肿瘤的研究和抗癌药物的开发具有深远意义。

下面参考图4～图5，结合具体例子对根据本公开实施例的模型训练方法以及图像处理方法进行示例性说明。本例中，鉴于脑胶质瘤pet图像的图像特征与肿瘤的基因型有着一定的相关性，设置上述指定肿瘤为脑胶质瘤，并且设置初始模型为随机森林模型。本例所获取的样本图像来自于通过常规的fdg(氟脱氧葡萄糖)-pet成像方法采集脑胶质瘤的原始医学图像，并对采集的原始医学图像的医疗数位影像传输协定(digitalimagingandcommunicationsinmedicine，dicom)进行数据的去隐私化处理，获得脑胶质瘤医学样本图像。化学示踪剂为¹⁸f-fdg，其中的氟为属于正电子发射型放射性同位素的氟-18。

图4示意性示出了根据本公开实施例的基于机器学习方式的pet图像处理过程的流程图，以对上述模型训练过程和图像处理过程进行示例性说明。

如图4所示，该方法可以包括以下操作s401～s409。

在操作s401，获取多个样本图像。

示例性地，对所有数据库中的pet图像数据进行筛选，导出符合预定标准的脑胶质瘤患者的pet图像，以作为样本图像。预定标准可以包括：确诊为脑胶质瘤的患者的pet图像，pet图像清晰、没有因运动造成的伪影，患者所用的图像造影剂为¹⁸f-fdg，pet图像中的脑胶质瘤组织的基因型已知，将每个pet图像的已知基因型标注为该pet图像的基因型标签。

然后，在操作s402，确定每个样本图像的感兴趣区域。

示例性地，对于每个样本图像，采用itk-snap公开软件对患者的三维pet图像在轴状位上进行逐层分割，各个层的子感兴趣区域构成样本图像整体的感兴趣区域，该感兴趣区域为样本图像中的脑胶质瘤肿瘤组织的三维图像。

接着，在操作s403，确定每个样本图像的第一矩阵。

示例性地，进一步根据pet图像的dicom文件中包含的相关信息，将感兴趣区域的各个像素值均归一化转换为各自对应的suv值，以构成第一矩阵suvmap。其中归一化的方法可以如公式(1)所示。

其中，petpixel表示脑胶质瘤pet图像的感兴趣区域中的任一像素的原始像素值，rescaleslope表示pet图像中的调节率参数，rescaleintercept表示pet图像中像素值的调节截距，timeinterval表示采集相应pet图像时造影剂注射时间与扫描pet图像时间之间的间隔，radionuclidetotaldose表示采集相应pet图像时注入患者造影剂的量，patientweight表示相应脑胶质瘤患者的体重，radionuclidehalflife表示造影剂中同位素的半衰期。上述参数均记录于相应pet图像的dicom文件中。经过上述转换，可以将整个肿瘤组织对应的像素全部转化为对应的suv值。

接着，继续参考图4，在操作s404，对每个样本图像的第一矩阵进行量化分析。

示例性地，将上述得到的肿瘤组织的suvmap进行量化分析，获取定量的图像特征来反映肿瘤组织的代谢情况，请参阅图4。

图5示意性示出了根据本公开实施例对第一矩阵进行量化分析的示例示意图。

如图5所示，基于肿瘤组织的第一矩阵500，可以提取出四个类型的特征，不同类型的特征从不同的角度反映了肿瘤组织的信息。第一类，反映了肿瘤的形状大小特征510，也可称为几何特征，包含了肿瘤组织体积、表面积、球形度等。例如可以根据感兴趣区域所对应的三维图像中各个像素的尺度以及层之间的距离来确定上述各个几何特征。第二类，反映了肿瘤组织suv值分布的一阶统计特征520，例如，最大值、最小值、峰度、偏度等信息。第三类，反映了肿瘤组织内部的纹理信息，可称为纹理特征530，如灰度共生矩阵、灰度游程矩阵反映出的纹理信息。以上三类特征即为上文中的第一指定特征。第四类，是经过不同的小波变换后的高阶特征信息，可称为小波特征540，即上文中的第二指定特征，例如对suvmap经过小波变换后得到第二矩阵，再提取第二矩阵的一阶统计特征和纹理特征。其中每一类型特征均可包括一个或多个特征值。上述四个类型特征可构成反映肿瘤组织代谢信息的特征集合550，也就是上文所述的第一特征集合。

接着，继续参考图4，在操作s405，对量化分析得到的第一特征集合进行特征筛选。

示例性地，对上述获取到的第一特征集合进行特征筛选，如根据第一特征集合中的特征与脑胶质瘤患者基因型的相关性筛选出显著相关的特征。例如，计算每个特征与基因型间的皮尔森相关系数，如公式(2)所示。

其中，x是由所有pet图像的某个特征组成的特征向量，y是由所有患者对应的基因型标签组成的基因型集合，cov(x，y)是二者之间的协方差(covariance)，σx和σy分别为二者各自的标准差(standarddeviation)。从而筛选出第一相关性高于第一预定阈值的特征，经过该筛选过程，可以得到上述第二特征集合。

接着，继续参考图4，在操作s406，对筛选得到的第二特征集合进行去冗余处理。

示例性地，可以利用互信息的方式对筛选得到的第二特征集合进行特征之间的去冗余处理。例如，计算特征x和特征y之间的第二相关性i(x；y)，如公式(3)所示。

其中，p(x，y)(x，y)是特征x和特征y的联合概率分布函数，px(x)是特征x的边缘概率函数，py(y)是特征y的边缘概率函数。然后将第二相关性高于第二预定阈值的特征进行去冗余处理，经过该去冗余处理过程，可以得到上文中的第三特征集合。

接着，继续参考图4，在操作s407，通过多因素特征选择的方式对上述第三特征集合进行降维，以降低模型的复杂度并防止训练模型时出现过拟合现象，从而确定最终的特征集。

接着，在操作s408，基于上述特征集，采用随机森林模型的方式对脑胶质瘤患者的基因类型进行分类训练，采用交叉验证性能最优作为确定参数的方式，确定最终的目标模型。该目标模型具有基于患者的关于脑胶质瘤的pet图像预测患者基因型的性能。如图4中虚线所示，后续每隔预定时间，还可以利用更新的已知基因型的关于脑胶质瘤的pet图像重复上述训练过程，以保证目标模型的优良性能。

接着，在操作s409，将待测试数据输入目标模型，以使目标模型输出针对患者基因型的分类结果。

其中，待测试数据为待处理图像的特征集，待处理图像为基因型未知的关于脑胶质瘤的pet图像，从待处理图像中提取特征集的方式与从样本图像中提取特征集的方式同理，上文已有详细说明，在此不再赘述。

图6示意性示出了根据本公开实施例的用于实现上文所描述的方法的电子设备的框图。图6示出的设备仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图6所示，根据本公开实施例的设备600包括处理器601，其可以根据存储在只读存储器(rom)602中的程序或者从存储部分608加载到随机访问存储器(ram)603中的程序而执行各种适当的动作和处理。处理器601例如可以包括通用微处理器(例如cpu)、指令集处理器和/或相关芯片组和/或专用微处理器(例如，专用集成电路(asic))，等等。处理器601还可以包括用于缓存用途的板载存储器。处理器601可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。

在ram603中，存储有设备600操作所需的各种程序和数据。处理器601、rom602以及ram603通过总线604彼此相连。处理器601通过执行rom602和/或ram603中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意，所述程序也可以存储在除rom602和ram603以外的一个或多个存储器中。处理器601也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。

根据本公开的实施例，设备600还可以包括输入/输出(i/o)接口605，输入/输出(i/o)接口605也连接至总线604。设备600还可以包括连接至i/o接口605的以下部件中的一项或多项：包括键盘、鼠标等的输入部分606；包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分607；包括硬盘等的存储部分608；以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至i/o接口605。可拆卸介质611，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器610上，以便于从其上读出的计算机程序根据需要被安装入存储部分608。

根据本公开的实施例，根据本公开实施例的方法流程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读存储介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分609从网络上被下载和安装，和/或从可拆卸介质611被安装。在该计算机程序被处理器601执行时，执行本公开实施例的系统中限定的上述功能。根据本公开的实施例，上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。

根据本公开实施例，设备600可以作为模型训练设备，包括：存储器和处理器。其中，存储器配置为存储指令和数据。处理器配置为执行所述指令，以便：获取多个样本图像，其中，多个样本图像中的任一样本图像包括：基因型已知的关于指定肿瘤的三维pet图像。获取任一样本图像的基因型信息。然后，确定任一样本图像的特征集。基于上述所获取的多个样本图像各自的基因型信息和特征集，对初始模型进行训练，以得到目标模型，该目标模型用于确定：基因型未知的关于指定肿瘤的三维pet图像的基因型信息。

根据本公开实施例，设备600也可以作为图像处理设备，包括：存储器和处理器。其中，存储器配置为存储指令和数据。处理器配置为执行所述指令，以便：获取基于如上任一实施例所述的模型训练方法训练得到的目标模型。获取待处理图像，待处理图像包括：基因型未知的关于指定肿瘤的三维pet图像。然后，确定待处理图像的特征集。再将待处理图像的特征集输入至目标模型，以使目标模型输出关于待处理图像的基因型信息的分类结果。

本公开还提供了一种计算机可读存储介质，该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的；也可以是单独存在，而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序，当上述一个或者多个程序被执行时，实现根据本公开实施例的方法。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

本领域技术人员可以理解，尽管已经参照本公开的特定示例性实施例示出并描述了本公开，但是本领域技术人员应该理解，在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下，可以对本公开进行形式和细节上的多种改变。因此，本公开的范围不应该限于上述实施例，而是应该不仅由所附权利要求来进行确定，还由所附权利要求的等同物来进行限定。

技术特征：

1.一种模型训练方法，包括：

获取多个样本图像，所述多个样本图像中的任一样本图像包括：基因型已知的关于指定肿瘤的三维pet图像；

获取所述任一样本图像的基因型信息；

确定所述任一样本图像的特征集；以及

基于所述多个样本图像各自的基因型信息和特征集，对初始模型进行训练，以得到目标模型，所述目标模型用于确定：基因型未知的关于指定肿瘤的三维pet图像的基因型信息。

2.根据权利要求1所述的方法，其中，所述确定所述任一样本图像的特征集包括：

获取所述任一样本图像中包含所述指定肿瘤的感兴趣区域；

将所述感兴趣区域的任一像素值转换为标准摄取值，以获得针对所述感兴趣区域的第一矩阵；以及

基于所述第一矩阵，确定所述任一样本图像的第一特征集合。

3.根据权利要求2所述的方法，其中，所述基于所述第一矩阵，确定所述任一样本图像的第一特征集合包括：

从所述第一矩阵中提取第一指定特征，所述第一指定特征中的任一第一指定特征包括如下至少一项：几何特征、一阶统计特征和纹理特征；

对所述第一矩阵进行小波变换，以得到第二矩阵；

从所述第二矩阵中提取第二指定特征，所述第二指定特征包括如下至少一项：一阶统计特征和纹理特征；以及

由所述第一指定特征和/或所述第二指定特征构成所述第一特征集合。

4.根据权利要求3所述的方法，其中，所述确定所述任一样本图像的特征集还包括：

计算所述第一特征集合中的任一特征与所述基因型信息之间的第一相关性；

从所述第一特征集合中选取所述第一相关性符合第一预定条件的特征，以组成第二特征集合。

5.根据权利要求4所述的方法，其中，所述确定所述任一样本图像的特征集还包括：

计算所述第二特征集合中任意两个特征之间的第二相关性；以及

对所述第二特征集合中所述第二相关性特征符合第二预定条件的特征进行去冗余处理，以得到第三特征集合。

6.根据权利要求5所述的方法，其中，所述确定所述任一样本图像的特征集还包括：

对所述第三特征集合进行多因素特征选择，以得到所述特征集。

7.根据权利要求3所述的方法，其中，

所述几何特征包括如下至少一项：所述指定肿瘤的体积、所述指定肿瘤的表面积、和所述指定肿瘤的球形度；并且/或者

所述一阶统计特征包括如下至少一项：最大值、最小值、峰度、和偏度；并且/或者

所述纹理特征包括：基于灰度共生矩阵算法得到的纹理特征，和/或，基于灰度游程矩阵得到的纹理特征。

8.根据权利要求1所述的方法，其中，所述指定肿瘤包括脑胶质瘤。

9.一种图像处理方法，包括：

获取基于如权利要求1～8中任一项所述的模型训练方法训练得到的目标模型；

获取待处理图像，所述待处理图像包括：基因型未知的关于指定肿瘤的三维pet图像；

确定所述待处理图像的特征集；以及

将所述待处理图像的特征集输入至所述目标模型，以使所述目标模型输出关于所述待处理图像的基因型信息的分类结果。

10.一种模型训练设备，包括：

存储器，配置为存储指令和数据；以及

处理器，配置为执行所述指令，以便：

获取多个样本图像，所述多个样本图像中的任一样本图像包括：基因型已知的关于指定肿瘤的三维pet图像；

获取所述任一样本图像的基因型信息；

确定所述任一样本图像的特征集；以及

11.一种图像处理设备，包括：

存储器，配置为存储指令和数据；以及

处理器，配置为执行所述指令，以便：

获取基于如权利要求1～8中任一项所述的模型训练方法训练得到的目标模型；

获取待处理图像，所述待处理图像包括：基因型未知的关于指定肿瘤的三维pet图像；

确定所述待处理图像的特征集；以及

将所述待处理图像的特征集输入至所述目标模型，以使所述目标模型输出关于所述待处理图像的基因型信息的分类结果。

12.一种计算机可读存储介质，其中存储有计算机指令，当所述指令被处理器执行时实现如权利要求1～9中任一项所述的方法。

技术总结
本公开提供了一种模型训练方法，包括：获取多个样本图像，其中，多个样本图像中的任一样本图像包括：基因型已知的关于指定肿瘤的三维PET图像。获取任一样本图像的基因型信息。然后，确定任一样本图像的特征集。基于上述所获取的多个样本图像各自的基因型信息和特征集，对初始模型进行训练，以得到目标模型，该目标模型用于确定：基因型未知的关于指定肿瘤的三维PET图像的基因型信息。本公开还提供了一种模型训练设备、图像处理方法和设备以及存储介质。

技术研发人员：林予松;李龙飞;尚冲;刘振宇;赵国桦;刘琦
受保护的技术使用者：郑州大学
技术研发日：2020.01.19
技术公布日：2020.06.09

转载请注明原文地址: https://bbs.8miu.com/read-10451.html

专利

最新回复(0)