此公开的主题涉及用于确定受试者中的疾病进展的系统。更具体地,所公开的主题涉及将机器学习技术应用于数字健康工具以协助做出临床决策并且加快新颖治疗法(therapeutics)的临床开发。
背景技术:
数字健康技术及它们在临床环境中的实现是越来越引起关注的问题。这些技术正变得更加强大和复杂。特别地,机器学习作为对临床医生和其他健康护理专业人员的协助在他们努力为患者提供更好的治疗和护理方面提供了巨大的希望。
由于增加数量的可用的诊断测试以及对区分具有非特异性或重叠症状的病症(disorder)的需要两者,在个体患者的护理过程中可能为个体患者收集大量数据。这些数据中的一些可能是冗余的,或者它对于患者的结果可能是至关重要的。如果所施用的测试仅是使得能够实现指向期望结果的适当决策所必需的那些测试,则一般对于患者以及对于健康护理系统来说将是有利的。
数字技术也可用在研究环境中,特别是解决挑战性的研究问题,例如,更高效地将新颖的疾病改善药物(dmd)投放市场。管理和报销要求正变得更加严格,并且尽管诸如食品和药品管理局(fda)的管理机构已经实现了用来尝试和加快药物开发的程序(诸如快车道(fasttrack)程序),但是在潜在候选的临床开发期间制药公司(pharma)所面临的挑战仍然是显著的和巨大的财政任务。
将治疗法引入市场是昂贵的,并且要求大量和漫长的临床试验。增加复杂性的是由招募错误的受试者引起的高损耗率。与使药物候选通过临床测试相关联的财政风险仍然是高的。需要减少这种情况以允许药物候选更高效地移动通过流水线,增加成功的可能性,并通过使其它候选能够进入临床测试来维持流水线。
使用痴呆症以及特别是阿尔茨海默病(ad)作为示例,没有当前可用的dmd。已经测试了许多潜在的药物,但是迄今为止没有一种已经显示出任何显著的功效。这部分是因为试验集中于处于疾病的中度阶段而不是疾病的更早期阶段的受试者。为了纠正这种情况,现在研究旨在招募具有轻度认知障碍(mci)的受试者,并标识在试验过程期间可能转化成ad的那些受试者,因为他们将最可能显示药物效果。为了招募处于这个阶段的受试者,要求更灵敏的筛选和分级工具。
换句话说,由于疾病的异质性和需要大量且漫长的临床试验,将dmd引入阿尔茨海默病的市场是极其复杂的。dmd的功效的主要混杂因素(confounder)是选择合适的受试者。要求更灵敏的筛选和分级工具来标识适合于给定队列(cohort)和终点的受试者。
借助于淀粉样蛋白正电子发射断层扫描(pet)成像,在选择ad试验的患者方面的改进是可能的。例如,vizamyltm(flutemetamolf-18注射剂,gehealthcare)是一种放射性诊断剂,其被指示用于脑的(pet)成像以估计具有认知障碍的成人患者中的β-淀粉样蛋白(aβ)神经炎性斑密度,所述成人患者正在针对ad或认知下降的其它原因而被评估。参见vizamyltm(flutemetamolf-18注射剂)的gehealthcare处方信息。其它已知的试剂包括neuraceqtm(florbetabenf18注射剂,piramalimaging)和amyvidtm(florbetapir,elilillyandcompany)。阴性的aβ扫描指示稀疏的神经炎性斑到无神经炎性斑,并且在图像获取时与ad的神经病理学诊断不一致;阴性扫描结果降低了患者的认知障碍归因于ad的可能性。阳性的aβ扫描指示中度至频繁的淀粉样蛋白神经炎性斑;神经病理学检查已经显示,这种量的神经炎性斑存在于有ad的患者中,但也可存在于有其它类型神经病症的患者以及具有正常认知的老年人中。
aβpet成像可被认为是其它诊断评估的辅助。阳性的aβ扫描本身不一定建立ad或其它认知病症的诊断。虽然可准许淀粉样蛋白pet阳性的受试者进入淀粉样蛋白调节疗法的临床试验,但是该测试是不足够的,因为不是所有淀粉样蛋白阳性的受试者都进展到ad或在将与临床试验相关的时间范围内进展到ad。以ad为例,这将意味着标识更可能具有阳性淀粉样蛋白扫描的受试者。
作为另一个示例,帕金森病(pd)的诊断在具有异常症状或显示对药物缺少响应的患者中仍然是挑战。pd是包括进行性核上性麻痹(pnp)和多系统萎缩(msa)的标记为帕金森综合征(ps)的具有共同特征的一组疾病的一部分。对多巴胺转运蛋白(dat)进行成像可用于致力于通过确定多巴胺能活性的损失来获得准确的诊断。已知多种放射性标记的苯基托烷类似物用于多巴胺转运蛋白的显像,包括供单光子发射断层扫描(spect)成像中使用的批准的产品datscantm(gehealthcare)a123-i标记试剂。
此外,利用放射性药剂的体内(invivo)成像技术(诸如pet和spect)是相对昂贵且资源密集的诊断过程。在进行这种体内成像技术之前能够标识可能具有暗示疾病状态的结果的受试者将是有利的。因此,例如,对于pd,在进行分子成像之前标识更可能具有多巴胺能缺陷的受试者将是有利的,并且对于ad,在进行分子成像之前标识更可能具有淀粉样蛋白斑的受试者将是有利的。
提供基于临床和成像生物标志物的最佳组合的预测模型在改进选择过程方面具有强的潜力。在临床试验中收集的常见预测性生物标志物可以包括从用于预测脑萎缩的mr成像获得的海马体积和用于估算淀粉样蛋白病理的pet成像。虽然这些生物标志物比单独利用典型的纳入标准表现更好,但是它们不能完全捕获疾病的复杂性。
最近的研究已经示出了将自动化结合到beta-淀粉样蛋白suvr和脑体积的量化中的能力,以及将这些测量用作图像的人类视觉读取的代替(standin)的能力。参见例如thurfjelll等,automatedquantificationof18f-flutemetamolpetactivityforcategorizingscansasnegativeorpositiveforbrainamyloid:concordancewithvisualimagereads.journalofnuclearmedicine,55,1623-1628(2014)。
已经尝试了将临床数据与ad相关的尝试。例如,授予ithapu等人的标题为“medicalimagingsystemprovidingdiseaseprognosis”的美国专利no.9,687,199公开了用于分析临床数据的人工智能系统。该系统利用多个等级的机器学习模块,其各自处理临床数据的单独部分以解决数据的高维度和低样本大小。然而,在该’199专利中公开的系统缺少用于标识处于在限定的时间范围内发展成ad的风险的受试者的任何手段。
因此,需要创新以帮助解决当前方法中的缺陷。
技术实现要素:
以下呈现了一个或多个实施例的简化概述,以便提供对当前公开的主题的基本理解。此概述不是所有预想实施例的广泛综述,且不旨在标识所有实施例的关键或重要元素,也不旨在描绘任何或所有实施例的范围。其唯一目的是以简化形式呈现一个或多个实施例的一些概念,作为稍后呈现的更详细描述的序言。
根据一个方面,公开有一种用于预测具有不确定认知状态的受试者的疾病病理或疾病状态的医疗系统,所述系统包括:计算机系统,所述计算机系统被布置成接收受试者的第一医疗数据并且至少部分地被配置为在第二医疗数据上训练的经训练的学习机,所述计算机系统适于使用经训练的学习机来提供疾病病理的预测;以及显示器,所述显示器用于显示预测的指示,其中第一医疗数据不包括从对受试者的分子成像过程获得的数据,并且第二医疗数据不包括从一个或多个分子成像过程获得的数据。所述疾病病理可以是受试者的脑中的淀粉样蛋白beta(aβ)阳性。第一医疗数据可以包括受试者的认知测试的结果、受试者的认知测试的结果、受试者的年龄、受试者的教育水平或这些数据的某种组合。
根据另一方面,公开有一种用于预测具有不确定认知状态的受试者的临床结果的医疗系统,所述系统包括:计算机系统,所述计算机系统被布置成接收受试者的第一医疗数据并且至少部分地被配置为在第二医疗数据上训练的第一经训练的学习机和在第三医疗数据上训练的第二学习机,所述计算机系统适于使用第一经训练的学习机和第二学习机来提供疾病病理的预测;显示器,所述显示器用于显示预测的指示,其中第一医疗数据可以包括从对受试者的分子成像过程获得的数据,并且已经至少部分地用从一个或多个分子成像过程获得的数据训练了第一经训练的学习机。
根据另一方面,公开有一种预测具有不确定认知状态的受试者的疾病病理的方法,所述方法包括以下步骤:针对具有疾病的已知结果的受试者的第一集合将队列医疗数据收集到电子存储器中,使用计算机系统,所述计算机系统被布置成接收受试者的受试者医疗数据并且包括在队列医疗数据上训练的经训练的学习机,所述计算机系统适于使用经训练的学习机至少部分地基于受试者医疗数据来提供疾病病理的预测,以提供疾病病理的预测;以及使用显示器来指示预测。
根据另一方面,公开有一种预测具有不确定认知状态的受试者的临床结果的方法,所述方法包括以下步骤:针对具有疾病的已知结果的受试者的第一集合,将第一队列医疗数据收集到电子存储器中,针对具有疾病的已知结果的受试者的第二集合,将第二队列医疗数据收集到电子存储器中,使用计算机系统,所述计算机系统被布置成接收受试者的受试者医疗数据并且包括在第一队列医疗数据上训练的第一经训练的学习机和在第二队列医疗数据上训练的第二经训练的学习机,所述计算机系统适于使用第一和第二经训练的学习机至少部分地基于受试者医疗数据来提供疾病病理的预测,以及显示预测的指示。第一队列医疗数据可以包括与第二队列医疗数据中的数据类型不同的数据类型。第一队列医疗数据可以包括与第二队列医疗数据中的数据类型至少部分相同的数据类型。
上述医疗系统可以供预测具有不确定认知状态的受试者的临床结果和/或预测具有不确定认知状态的受试者的疾病病理中使用。在没有分子成像作为预筛选工具的情况下预测特定疾病病理的能力允许丰富继续进行分子成像过程的受试者的队列。在健康经济和减少受试者暴露于辐射方面也存在实际益处。对来自预筛选的所选择的受试者进行分子成像允许关于疾病进展速度的分级。
根据另一方面,公开有一种用于标识处于发展成阿尔茨海默病(ad)的风险的受试者的医疗系统,所述系统包括计算机系统,所述计算机系统被布置成接收具有ad的未知结果的一个或多个受试者的医疗数据,并且至少部分地被配置为提供第一指示的第一经训练的学习机和提供第二指示的第二经训练的学习机,并且将第一和第二指示组合以提供哪些具有ad的未知结果的受试者处于在限定的时间范围内发展成ad的风险的标识;以及显示器,所述显示器用于显示标识。第一指示可以包括受试者为aβ阳性的概率。第二指示可以包括受试者的轻度认知障碍正在快速进展的概率。第一经训练的学习机和第二经训练的学习机可在相同物理硬件上实现。医疗系统可以包括用于存储医疗数据并被布置成将医疗数据提供给计算机系统的电子存储器。医疗数据可以包括体内图像数据、认知和功能记忆数据以及遗传数据。体内图像数据可以包括标准化摄取值比(suvr)或t1加权磁共振(mr)体积测量(volumetrics)。医疗数据可以包括人口统计学数据和/或每个受试者的电子医疗记录。受试者可以是轻度认知障碍的患者,并且限定的时间范围可以是3年或更少或者2年或更少。第一指示可以是受试者为aβ阳性的概率,第二指示可以是受试者的轻度认知障碍正在快速进展的概率,并且计算机系统可以被配置成使用第一概率和第二概率来标识处于在限定的时间范围内发展成ad的风险的受试者。
根据另一方面,公开有一种用于标识处于发展成阿尔茨海默病(ad)的风险的受试者的方法,所述方法包括以下步骤:针对具有疾病的已知结果的受试者的第一集合,将医疗数据收集到存储的电子存储器中,使用第一经训练的学习机和第二经训练的学习机来标识处于在限定的时间范围内发展成ad的风险的受试者,以及选择处于在限定的时间范围内发展成ad的风险的受试者以用于对ad的研究。医疗数据可以包括体内图像数据、认知和功能记忆数据以及遗传数据。体内图像数据可以包括标准化摄取值比(suvr)或t1加权磁共振(mr)体积测量。医疗数据可以包括人口统计学数据和/或每个受试者的电子医疗记录。受试者可以是轻度认知障碍的患者,并且限定的时间范围可以是3年或更少或者几年或更少。
根据另一方面,公开有一种确定有阿尔茨海默病(ad)的患者的预后的方法,所述方法包括以下步骤:向需要施用淀粉样蛋白造影剂的患者施用淀粉样蛋白造影剂,对患者中的淀粉样蛋白沉积物进行成像,以及将患者中的所述淀粉样蛋白沉积物的成像连同其它变量与具有已知ad预后的患者的训练集相关。
根据另一方面,公开有一种治疗阿尔茨海默病(ad)的患者的方法,所述方法包括以下步骤:在计算机中,将从患者获得的成像数据和其它数据与包括已知ad预后的患者的成像数据和其它数据的训练集进行比较,以便将患者分类在疾病队列中,标识已知改善疾病队列内ad的患者结果的药物疗法,以及用有效量的所标识的药物疗法来治疗患者。
根据另一方面,公开有一种具有阿尔茨海默病(ad)的未知结果的一个或多个受试者的医疗数据用于确定受试者中的哪些处于发展成ad的风险的用途,所述用途包括将医疗数据供应给计算机系统,所述计算机系统至少部分地被配置为提供第一指示的第一经训练的学习机和提供第二指示的第二经训练的学习机,并且将第一和第二指示组合以提供哪些具有ad的未知结果的受试者处于在限定的时间范围内发展成ad的风险中的标识。
根据另一方面,公开有一种用于将受试者分类为具有轻度认知障碍(mci)或阿尔茨海默病(ad)的医疗系统,所述系统包括:计算机系统,所述计算机系统被布置成接收具有mci或ad的未知分类的一个或多个受试者的医疗数据,并且至少部分地被配置为提供第一指示的第一经训练的学习机和提供第二指示的第二经训练的学习机,并且将第一和第二指示组合以提供哪些受试者具有mci以及哪些受试者具有ad的标识;显示器,所述显示器用于显示分类。计算机系统可以被布置成对分类为mci的受试者提供mci是早期mci还是晚期mci的进一步分类。
根据另一方面,公开有一种用于将受试者分类为阿尔茨海默病(ad)或某种其它形式的痴呆的医疗系统,所述系统包括:计算机系统,所述计算机系统被布置成接收具有mci或ad的未知分类的一个或多个受试者的医疗数据,并且至少部分地被配置为提供第一指示的第一经训练的学习机和提供第二指示的第二经训练的学习机,并且将第一和第二指示组合以提供哪些受试者具有ad以及哪些受试者具有另一形式的痴呆的标识;以及显示器,所述显示器用于显示分类。
根据另一方面,公开有一种用于标识药物的附加指示的医疗系统,所述系统包括:计算机系统,所述计算机系统被布置成接收服用药物的一个或多个受试者的医疗数据,并且至少部分地被配置为提供第一指示的第一经训练的学习机和提供第二指示的第二经训练的学习机,并且将第一和第二指示组合以确定是否可以向药物分配除了现有指示之外的指示;以及显示器,所述显示器用于显示附加指示。
下面参照附图详细描述本发明的另外的特征和优点以及本发明的各种实施例的结构和操作。注意,本发明不限于本文中描述的特定实施例。在本文中呈现此类实施例仅用于说明性目的。基于本文中含有的教导,另外的实施例对(一个或多个)相关领域的技术人员将是显而易见的。
附图说明
并入本文中并形成说明书的一部分的附图示出了本主题,并且与文字描述一起进一步用于解释本主题的原理,并使(一个或多个)相关领域的技术人员能够制造和使用本主题。
图1是诸如可以用于实现本文中的教导的计算机系统的框图。
图2是描绘根据一个实施例的用于为研究选择受试者的过程的流程图。
图3是描绘根据另一实施例的用于为研究选择受试者的过程的流程图。
图4是本文中的教导的基于web的实现的框图。
具体实施方式
现在参考附图描述各个实施例,其中在通篇中类似的参考标号用于指代类似的元素。在以下描述中,出于解释的目的,阐述了许多具体细节以便促进对一个或多个实施例的透彻理解。然而,在一些或所有实例中,可以显而易见的是在不采用以下描述的具体设计细节的情况下能够实践以下描述的任何实施例。在其它实例中,以框图形式示出公知的结构和装置以便促进一个或一个实施例的描述。以下呈现了一个或多个实施例的简化概述,以便提供对实施例的基本理解。此概述不是所有预想实施例的广泛综述,且不旨在标识所有实施例的关键或重要元素,也不旨在描绘任何或所有实施例的范围。
所描述的(一个或多个)实施例以及说明书中对“一个实施例”、“实施例”、“示例实施例”等的引用指示所描述的(一个或多个)实施例可包括特定特征、结构或特性,但每个实施例可不一定包括该特定特征、结构或特性。此外,此类短语不一定是指相同的实施例。此外,当结合实施例描述特定特征、结构或特性时,理解的是,无论是否明确描述,结合其它实施例实现此特征、结构或特性在本领域技术人员的知识内。
本发明的实施例可以以硬件、固件、软件或其任何组合来实现。本发明的实施例也可以实现为存储在机器可读介质上的指令,其可以由一个或多个处理器读取并执行。机器可读介质可以包括用于以由机器(例如,计算装置)可读的形式存储或传送信息的任何机构。例如,机器可读介质可以包括只读存储器(rom);随机存取存储器(ram);磁盘存储介质;光存储介质;闪速存储器装置;电、光、声或其它形式的非暂时性机器可读介质。此外,固件、软件、例程、指令在本文中可以被描述为执行某些动作。然而,应当理解,这样的描述仅仅是为了方便,并且这样的动作实际上是由执行固件、软件、例程、指令等的计算装置、处理器、控制器或其它装置产生的。
为了更清楚和简明地描述和指出所要求保护的发明的主题,在下文中提供了对本说明书和权利要求书通篇使用的特定术语的定义。本文中的特定术语的任何范例应被认为是非限制性示例。
术语“不确定的认知状态”在本文中用于应用于呈现暗示与认知下降相关联的疾病或病症的症状的受试者。症状可包括错乱、运动协调性差、身份错乱、受损的判断力、主观记忆损失、缺少专注或集中力以及无法表达。与认知下降相关联的已知疾病和病症的非限制性示例包括ad、pd、mci、tbi(创伤性脑损伤)和慢性创伤性脑病(cte)。
术语“疾病病理”在本文中用于指通常与同认知下降相关联的疾病或病症相关联的病理特征。由本发明预想的疾病病理的非限制性示例包括淀粉样蛋白beta阳性(即淀粉样蛋白的异常存在)、多巴胺能缺陷和神经原纤维缠结(nft)(tau缠结)的存在。
术语“受试者”在本文中用于指任何人类或动物受试者。在实施例的一个方面,本发明的受试者是哺乳动物。在实施例的另一个方面,受试者是体内完整的哺乳动物身体。在实施例的另一个方面,受试者是人类。受试者可以是主观记忆抱怨者(smc)或正在遭受轻度认知障碍(mci),并且正在针对阿尔茨海默病(ad)的可能发作而被调查。
“经训练的学习机”是这样的计算系统,该计算系统已经在一组训练数据上使用机器学习来被训练以向该计算系统提供例如在给定新数据时提供预测、结论和分类的能力。计算系统自己学习而不用数据与预测、结论和分类之间的关系来被明确地编程。
“显示器”可意指能够以字母数字或图片形式显示信息的任何装置,并且通常包括屏幕、电路、外壳和电源。显示器的非限制性示例包括计算机监视器、平板电脑屏幕和智能电话屏幕。显示器可以是本地的,即直接连接到托管系统的本地计算机,或者是远程的,即托管系统的计算机通过网络或例如因特网与其通信的用户系统的一部分,其中系统服务被提供为基于云的实用程序。
如本文中所用的术语“预测的指示”旨在指代以字母数字或图片形式显示在显示器上的信息。指示的非限制性示例包括图、表格、条形图。
本文中所用的术语“分子成像过程”是指能够使受试者中的细胞功能或分子过程可视化(即产生分子图像)的体内成像过程。“体内成像程序”是非侵入性地产生受试者的内部方面中的全部或部分的图像的技术。由本发明预想的分子成像过程的非限制性示例包括淀粉样蛋白beta成像、多巴胺转运蛋白成像和tau成像。
术语“淀粉样蛋白beta(aβ)阳性”指示中度至频繁的淀粉样蛋白神经炎性斑,例如,如在借助于aβ分子成像剂获得的aβ分子图像上观察到的。可通过本发明的方面,使用不包括分子成像数据的数据来实现淀粉样蛋白阳性的可能性的预测。此类数据的非限制性示例包括日常生活活动(adl)基线、向后数字跨度(digitspanbackwards)、逻辑记忆ii故事后30分钟基线、连线部分a-时间(秒)、教育、男性性别、左尾状体体积、右杏仁核体积和右尾状体体积。在一个实施例中,此类数据包括年龄、性别、简易智力评分(mmse)、临床痴呆评级(cdr)、临床痴呆评级盒总和(cdr-sb)、apoe遗传测试状态、区域性左右脑海马体积、海马旁回、杏仁核、内嗅皮质、内颞叶、直回、脑室和角回。
术语“认知测试”是指对受试者进行的协助确定认知状态的测试。典型的测试是本领域技术人员公知的。测试的非限制性示例包括各种形式的iq测试、记忆、注意力、吸引专注和集中力。通常对非人动物受试者进行的测试的非限制性示例包括镜像测试和t迷宫测试。
如本文中所用的术语“队列医疗数据”被采用来意指来自所定义的受试者队列(例如被认为潜在地具有特定疾病或病症的那些受试者和/或考虑纳入临床研究中的受试者)的数据集合。
术语“轻度认知障碍”(mci)用于指涉及包括记忆、语言、思考和判断的认知功能的问题的病症,其通常大于正常的年龄相关的变化。
术语“快速进展”是指从受试者显示疾病或病症的初始症状到被诊断为有该疾病或病症的相对转变。非限制性示例是受试者在相对短的时间范围中(例如在约三年内)从mci向痴呆的进展。一些数据在快速进展的预测中可以是有用的。此类数据的非限制性示例包括adl基线、简易精神状态检查(mmse)基线、类别流畅度测试-动物类别、复合淀粉样蛋白标准化摄取值比(suvr)(脑桥(pons))和海马体积。
本发明可被制药公司在临床试验工作流程中的各个点使用,以帮助减少将新颖药物引入市场的时间和成本。更具体地,通过丰富纳入标准(筛选和分级工具)或标识最可能对治疗起反应的适当队列(市场准入工具)。
例如,在初始诊断检查(work-up)之后,可以通过针对纳入标准估算适用性来考虑用于试验的患者。这通常经由筛选过程发生,该筛选过程可涉及使用若干廉价的诊断测试,并且有时还涉及更昂贵的诊断测试,例如正电子发射断层扫描(pet)成像。3期试验招收几百个受试者。对于其中有很低筛选效率的试验,筛选的受试者比进入试验的受试者多得多。因此,传统的筛选方法在与一些测试相关联的较高成本方面是制药公司的经济负担的来源;并且大量受试者通过该过程的这个阶段。本发明使用经由较便宜的测试收集的临床数据来预测较昂贵的测试的结果。这样,通过筛选过程对患者进行分类。在需要的情况下,工具的附加功能性将基于疾病进展的速度或最有可能对疗法起反应的那些受试者来进一步对受试者进行分级。这样,存在经由对结果的预测的纳入标准的增强。
一旦试验成功,市场准入团队要求数据作为药物功效的证据以确保支付者将报销药物。此处,本发明可帮助标识哪些患者将从该药物中受益最大,分析来自多个来源的现有真实世界证据,并开发支付者和服务管理者要求采用的结果数据。
将本发明应用于来自招募阶段的数据可减少显示药物功效所需要的患者的数量。此外,这些技术可预测最可能显示药物效果的那些受试者,并因此改进实现统计学相关的效果大小所要求的受试者的数量和适用性。这些效率通过缩短招募阶段和降低与筛选试验相关联的总成本而影响试验的总成本。这仅仅是其中可以有益地应用本公开的教导的上下文的一个示例。
图1中示出了通用计算机系统100。图1的系统100包括连接到总线120的处理器110。还连接到总线的是存储器(诸如固件、ram或rom)130、硬盘驱动器140、网络接口150和输入/输出(i/o)接口160。网络接口150与网络170通过接口连接。i/o接口160可以与一个或多个输入/输出装置(诸如输入装置180和显示器190)通过接口连接。系统100可以具有附加的组件,诸如端口、打印机、cd/dvdrom读取器和写入器等。
诸如图1中所示的通用计算机系统的通用计算机系统100可被配置用于机器学习,即,能够在没有特定编程的情况下执行某些任务。其一个方面是为计算机系统100提供一组训练数据(“特征”),计算机系统100可在该组训练数据(“特征”)上学习进行预测。然后计算机系统可基于新数据进行预测。
所公开的主题的一个方面涉及基于机器学习的分析方法的使用,所述基于机器学习的分析方法促进基于受试者的特定成像、遗传、心理测量和人口统计学数据来标识适当的受试者,以确定具有轻度认知障碍(mci)的临床试验受试者的最佳分级。该方法包括按顺序或单独地应用机器学习模型以排除缺少适当生物标志物、进展速度或两者的患者。
具体地,在图2中示出用于选择研究的受试者的过程。在步骤s20中,使用标准试验筛选通过心理测试、受试者人口统计学特征的收集和mri的获取来标识具有轻度认知障碍(mci)的受试者。在步骤s30中,机器学习模型被用于预测所标识的受试者为beta-淀粉样蛋白(aβ)阳性的概率。在步骤s40中,针对其为aβ阳性的概率高于某一阈值的受试者获取淀粉样蛋白pet图像。在步骤s50中,机器学习模型被用于预测在临床试验的时间范围中受试者转化为ad的概率。在步骤s60中,选择其转化的概率高于某一阈值的受试者以便纳入研究中。
图2示出了一种过程,其中两个经训练的模型,即,机器学习模型(一个用于预测aβ阳性以一个及用于预测转化概率)被按顺序(即,一个接一个)使用,以选择受试者。这些模型本文中也被称为经训练的学习机,并且将理解,这些经训练的学习机可以在单独的硬件上实现或者可以在相同的硬件上实现。备选地,每个模型可被独立地使用,以根据需要定制选择过程。这样,在调查中将不受益于dmd的受试者不必经受不必要的测试,可显著减少临床试验费用,且可提高总试验效率。另一种可能性是并行使用模型,其中每个模型的结果被用作受试者选择的输入。这在图3中被示出,其中步骤s20再次是使用标准试验筛选通过心理测试、受试者人口统计学特征的收集和mri的获取来标识具有轻度认知障碍的受试者的步骤。在步骤s70中,收集aβ阳性标记。在步骤s80中,机器学习模型被用于预测所标识的受试者为aβ阳性的概率。该概率被用作步骤s90中的受试者选择的输入。在步骤s100中,收集实际进展mci的阳性标记。在步骤110中,机器学习模型用于预测所标识受试者具有实际进展的mci的概率。该概率被用作步骤s90中的受试者选择的另一输入。
作为示例,预测aβ状态的模型和预测快速进展mci受试者的模型对包含232个mci受试者(其中87个aβ阳性受试者和在基线成像测验之后36个月内已经转化为ad的81个受试者)的iii期临床试验数据集进行学习,其中快速进展受试者被定义为在36个月的时间范围内转化为可能ad(pad)状态的那些受试者。该iii期临床试验的主要目的是比较具有正常和异常[18f]flutemetamol摄取的mci受试者的pad转化。受试者向pad的转化状态的纵向跟踪使得这成为用于模型学习目的的良好数据集。
淀粉样蛋白阳性模型的目标是在承担使潜在的试验参与者经受pet扫描的花费和不便之前选择可能具有淀粉样蛋白阳性pet成像扫描的受试者。从训练集中移除缺少淀粉样蛋白pet扫描的iii期试验受试者,留下227个受试者和38%的淀粉样蛋白阳性率。快速进展mci模型的目标是选择在三年临床试验的范围内可能转化为pad的受试者。从训练集中排除缺少转化标记的iii期试验受试者或具有在少于3年的时间中“未转化”的转化标记的受试者,留下182个受试者和45%的转化率。
使用可从iii期研究得到的特征来实现模型生成。使用自动量化软件来量化成像数据,该自动量化软件从t1mr图像产生量化的脑体积,并且从淀粉样蛋白pet图像产生相对于脑桥参考区域的suvr值。然后,使用特征选择算法来向下选择与收集的人口统计学数据、神经心理数据和遗传数据结合的这些量化区域以供模型中使用。利用中值插补(medianimputation)来解决缺失除了目标标记之外的数据的受试者。图2用图形方式示出使用模型的通用过程。
aβ阳性模型显示了将选择aβ阳性受试者的试验效率提高43%的潜力,其中模型准确度为79%并且特异性为85%,其中试验效率的提高被测量为与aβ阳性受试者的最初纳入相比的模型的阳性预测值(ppv)。快速进展mci模型显示了选择快速进展mci受试者提高了24%,其中准确度为86%并且特异性为92%,其中试验效率的提高被测量为与仅通过淀粉样蛋白pet成像标识为aβ阳性的受试者相比的模型的ppv。
虽然报告通过交叉验证产生的模型性能度量是用于呈现机器学习结果的有效方法,但是重要的是知道这些可应用于独立数据集并且不仅特定于学习数据集。
为了评估这种能力,使用iii期数据集和澳大利亚老年成像、生物标志物和生活方式旗舰研究(aibl)数据集两者共同的特征来重建aβ阳性模型。其中n=551的对于aβ阳性的aibl验证产生了75%的准确度评分与87%的特异性,由于纳入aibl数据集中的健康和ad受试者而证明了对其他群体和疾病状态的外推。
在临床试验中将机器学习用于受试者的筛选和分级可增加显示药物功效的成功概率和有效dmd疗法变得可用的速度。所证明的模型性能表明纳入效率可提高50%或更多。此外,用aibl数据集验证aβ阳性模型证明了将在一个群体上学习的模型扩展到不同群体的可行性以及将仅在mci受试者上学习的阳性风险评分扩展到健康和ad受试者两者的能力。
现在将描述根据本发明一个方面的用于构建模型的过程。该过程可被认为涉及两个主要阶段。第一个是准备,即“清理”数据。第二个是一旦已经准备好数据就评估数据。
要纳入考虑的特征可以从诸如心理测量学、人口统计学、遗传学、aβpet和t1mri的任何一个或多个类别中取得。对于心理测量学,特征可以包括来自cdr、cdr-sb、adl、mmse、类别流畅度测试-动物、类别流畅度测试-蔬菜、adas-cog、向后数字跨度、向前数字跨度、数字符号替代测试、逻辑记忆ii-故事后30分钟、逻辑记忆ii-故事后立即、连线部分a和/或连线部分b的数据。人口统计学特征可以包括教育和/或年龄和/或性别。遗传特征可包括apoe。aβpet特征可以包括额叶前部aβsuvr-脑桥、前扣带回aβsuvr-脑桥、楔前叶后扣带回aβsuvr-脑桥、顶叶aβsuvr-脑桥、颞外侧aβsuvr-脑桥、颞内侧aβsuvr-脑桥、枕叶aβsuvr-脑桥、感觉运动aβsuvr-脑桥和/或复合aβsuvr-脑桥。t1mr可以包括海马体积、丘脑体积、杏仁核体积、壳核体积、尾状体体积、海马旁回体积、内嗅皮质体积、内颞叶体积、脑室体积、直回体积、角回体积、全灰质和/或全白质。通常,将使用这些特征的子集,诸如adl、mmse、分类流畅度测试-动物、复合aβsuvr-脑桥和海马体积。
关于准备数据,也可将其认为是过程的集合,例如特征选择(从潜在特征的第一集合缩窄到潜在特征的子集)和特征工程、受试者选择和缺失特征的插补。特征选择和特征工程涉及基于关于这些特征的先验知识来选取要在第一实例中移除的特征的子集。例如,一些特征可以是试验纳入标准的一部分,并且因此不能提供足够的可变性供模型构建中使用。已知一些特征与其它特征强烈相关,并且因此将其移除以防止高度相关的特征使模型偏移。最后,通过实验,一些特征可能被证明不适合用作模型中的特征。
模型构建的实验阶段还可以涉及在模型构建阶段之前利用递归特征消除、随机森林特征选择或本领域技术人员已知的其它类似方法。这样,可以移除具有低重要性的特征以便简化模型。该过程在构建下述快速进展mci模型中是有用的。在实验阶段之后,可以在模型中设置模型特征,而不执行进一步的特征选择。例如,可以使用从在scikit-learn.org上可得到的sciikit-learn机器学习库中可得到的工具来执行特征选择。
进一步的特征工程可以涉及对来自不同大脑半球的mr扫描的特征进行平均。该过程在构建下述快速进展mci模型中也是有用的。例如,右海马体积和左海马体积可以被平均以创建海马体积特征,或者左脑室和右脑室可以被求和以创建脑室体积特征。
在利用多个数据集的情况下,则有用的是,使用跨特征集的交集以便仅利用所有数据集共同的特征。
关于受试者选择,对于快速进展mci模型,在3年时间点之前具有“否”转化状态的受试者被排除在模型构建阶段之外。由于一个原因或另一个原因,没有追踪这些受试者经过整个研究,并且因此他们的转化状态是不可靠的。对于淀粉样蛋白阳性模型,相对于0.62阈值基于受试者的复合suvr来给予受试者阴性(淀粉样蛋白阴性)或阳性(淀粉样蛋白阳性)的状态。从模型构建群体中移除缺少转化标记或允许生成转化标记的pet扫描的受试者,因为他们的真实状态是未知的。
关于对缺失特征的插补,为了考虑缺少模型中使用的特征的值的受试者,可以执行中值插补,或者可以移除受试者。备选地,可以将受试者分配到该特征的最常见的值。例如,在apoe状态是特征的情况下,可以给予缺少apoe状态的受试者模式状态,即最常见的等位基因组合,而不是执行对数据的中值的插补。备选地,如果特征缺失,则不填充变量,并且在没有特定特征的情况下应用模型。基于对重要特征的了解,如果某些特征对于个别受试者或受试者队列不可用,则期望建模软件向用户突出显示。在一些情况下,如果已知可提高预测的准确度,则这可以允许执行此类测试(例如,确定apoe状态)并且添加对应的值。
一旦准备好数据,就对其进行评估。为了构建快速进展mci模型,可以使用分级的k折(5折)。如果淀粉样蛋白阳性和转化标记两者都存在于用于模型构建的数据集中,则可以以这样的方式将群体分级以便具有淀粉样蛋白阳性转化者、淀粉样蛋白阳性非转化者、淀粉样蛋白阴性转化者和淀粉样蛋白阴性非转化者的均匀分布。这样,可以对折进行分级以更类似地匹配受试者的实际群体,而不是纯粹基于转化状态进行分级。scikit-learn的分级k折实现可以用于该目的。
逻辑回归也可用于构建快速进展mci模型。例如,逻辑回归的scikit-learn实现可以用于模型构建,使用scikit-learn的网格搜索cv实现来确定最佳超参数。可以针对每个折重建模型以便确定平均统计数据,并且然后可以使用所有可用数据重建所使用的最终模型。
用于构建快速进展mci模型的模型统计数据可以针对每个折来计算,并且然后针对报告的统计数据进行平均,并以95%置信区间显示。计算的统计数据可包括准确度、f1评分、特异性、召回率(recall)、pr-auc、npv和精度。
为了构建淀粉样蛋白阳性模型,可以再次使用分级的k折(5折)。如果淀粉样蛋白阳性和转化标记两者都存在于用于模型构建的数据集中,则可以以这样的方式将群体分级以便具有淀粉样蛋白阳性转化者、淀粉样蛋白阳性非转化者、淀粉样蛋白阴性转化者和淀粉样蛋白阴性非转化者的均匀分布。这样,可以对折进行分级以更类似地匹配受试者的实际群体,而不是纯粹基于淀粉样蛋白阳性进行分级。如果在用于构建的数据集中缺少转化标记,则可以单独使用淀粉样蛋白阳性来对受试者进行分级,以确保每个折具有与数据集的真实群体中相同的淀粉样蛋白阳性和淀粉样蛋白阴性受试者的分布。scikit-learn的分级k折实现可以用于该目的。
顺序前馈特征选择也可以用在构建淀粉样蛋白阳性模型中。在实验阶段期间,可以在每个折内实现前馈特征选择,以确定每个折的最佳特征。在为每个折确定最佳特征之后,可以选择在3个或多于3个折中已经选择的特征供模型构建阶段中使用。在实验阶段之后,可以从处理步骤中移除前馈特征选择,并且不是每次按照算法选择所使用的特征。mlxtend(机器学习扩展)python库可以用于前馈特征选择的实现。
高斯朴素贝叶斯分类器也可以用在构建淀粉样蛋白阳性模型中。高斯朴素贝叶斯的scikit-learn实现可用于该目的,其中保持默认选项。可以针对每个折重建模型以便确定平均统计数据,并且然后可以使用所有可用数据重建所使用的最终模型。
模型统计数据可以针对每个折来被计算,并且然后针对报告的统计数据进行平均,并以95%置信区间显示。计算的统计数据可包括准确度、f1评分、特异性、召回率、pr-auc、npv和精度。
出于标识和分级用于临床试验的理想受试者的目的而开发的机器学习模型显著地提高了自动化过程辅助临床试验的能力,使受试者和支持该试验的机构两者受益。淀粉样蛋白阳性模型已经证明提高试验效率多达43%的能力,而快速进展mci模型已经证明以这样的方式对受试者进行分级使得将三年的转化效率增加17%的能力。
这些模型允许微调以满足临床试验的特定需要的能力;可重建模型以对各种统计测量进行优先级排序,诸如敏感性、f1或准确度,并且可以以这样的方式修改受试者风险阈值,使得目标受试者针对特定试验呈现理想病理。此外,可以单独地或按顺序使用模型,以用逐步的方法呈现临床试验,从而在将资源花费在不适合试验的受试者上之前将受试者纳入试验中。例如,淀粉样蛋白阳性模型可以用于向下选择接受淀粉样蛋白pet扫描的受试者,并且然后快速进展mci模型可以在将受试者纳入漫长且昂贵的方案中之前确定受试者是否可能在试验的长度内以理想的速度进展。虽然模型具有以这种方式组合的能力,但是它们也可以被单独地采用而不以任何方式牺牲模型性能。
在模型构建阶段中可以包括更多的数据集。另外,利用原始mr和pet成像数据的模型构建可以用作本文中描述的自动量化算法的辅助或用来替代本文中描述的自动量化算法。术语“原始数据”旨在包括直接像素或体素数据。
本公开的教导可以被实现为基于web的应用。这在图4中被示出。包括web浏览器或专用应用405的客户端计算机400通过诸如因特网的分布式内容信息系统420与虚拟私有云410通信。虚拟私有云410可包括应用层430以提供到执行框架440的接口。执行框架440使用来自模型存储450的经训练的模型来对通过应用层430供应并存储在数据库460中的数据进行操作,以提供例如与通过web浏览器400提供给应用层430的信息相关的患者将发展成ad的概率。
前述示例是在使用系统来基于受试者的预后为临床研究选择受试者的方面的,但其也可用在其它应用上。作为另一个示例,该系统可用于预测具有不确定认知状态的受试者的疾病病理,其中计算机系统适于使用经训练的学习机来提供疾病病理的预测,并且使用显示器以用于显示预测的指示,其中不使用从对受试者的分子成像过程获得的数据。该疾病病理可以是受试者的脑中的淀粉样蛋白beta(aβ)阳性。第一医疗数据可以包括受试者的认知测试的结果、受试者的认知测试的结果、受试者的年龄、受试者的教育水平或这些数据的一些组合。
作为另一个示例,该医疗系统可以用于预测具有不确定认知状态的受试者的临床结果。该系统将包括计算机系统,该计算机系统被布置成接收受试者的第一医疗数据并且至少部分地被配置为在第二医疗数据上训练的第一经训练的学习机和在第三医疗数据上训练的第二学习机,该计算机系统适于使用第一经训练的学习机和第二学习机来提供疾病病理的预测。第一医疗数据可以包括从对受试者的分子成像过程获得的数据,并且已经至少部分地用从一个或多个分子成像过程获得的数据训练了第一经训练的学习机。
例如,如上所记述的,帕金森病(pd)的诊断在具有异常症状或显示对药物缺少响应的患者中可以是挑战性的。利用datscantm的成像可用于致力于通过确定多巴胺能活性的损失来获得准确的诊断。此外,利用放射性药剂的体内成像技术(诸如pet和单光子发射断层扫描(spect))是相对昂贵和资源密集的诊断过程。将体内成像扫描结果用作特征技术之一的如上所述的经训练的学习的使用将增强标识可能具有暗示疾病状态的结果的受试者的能力。对于pd,在进行分子成像之前标识更可能具有多巴胺能缺陷的受试者将是有利的。
作为另一示例,本文中的教导可以用于实现一种预测具有不确定认知状态的受试者的疾病病理的方法,其中针对具有疾病的已知结果的受试者的第一集合,收集队列医疗数据并将其存储在电子存储器中,并且计算机系统被布置成接收受试者的受试者医疗数据并且包括在队列医疗数据上训练的经训练的学习机,所述计算机系统适于使用经训练的学习机至少部分基于受试者医疗数据来提供疾病病理的预测,以提供疾病病理的预测。
作为另一示例,本文中的教导可以用于实现一种预测具有不确定认知状态的受试者的临床结果的方法,其中针对具有疾病的已知结果的受试者的第一集合,收集第一队列医疗数据并且将其存储在电子存储器中,并且针对具有疾病的已知结果的受试者的第二集合,收集第二队列医疗数据并且将其存储在电子存储器中,并且所述计算机系统使用受试者的受试者医疗数据并且包括在第一队列医疗数据上训练的第一经训练的学习机和在第二队列医疗数据上训练的第二经训练的学习机。计算机系统使用第一和第二经训练的学习机来至少部分地基于受试者医疗数据提供疾病病理的预测,并显示预测的指示。第一队列医疗数据可以包括与第二队列医疗数据中的数据类型不同的数据类型。第一队列医疗数据可以包括与第二队列医疗数据中的数据类型至少部分相同的数据类型。
作为另一个示例,本文中的教导可以用于预测具有不确定认知状态的受试者的临床结果和/或用于预测具有不确定认知状态的受试者的疾病病理。
本公开的教导还可以应用于确定有ad的患者的预后。可向患者施用淀粉样蛋白造影剂,并且然后可对患者中的淀粉样蛋白沉积物进行成像以获得图像数据。图像数据可与其它数据一起与来自具有已知ad预后的患者的训练集的数据相关。
本公开的教导还可以应用于治疗ad的患者。计算机可以用于将从患者获得的成像数据和其它数据与包括已知ad预后的患者的成像数据和其它数据的训练集进行比较,以便将患者分类在疾病队列中。比较的结果可用于标识已知改善疾病队列内的ad的患者结果的药物疗法,并且然后可以用有效量的标识的药物疗法治疗患者。
本公开的教导还可应用于具有ad的未知结果的一个或多个受试者的医疗数据用于确定受试者中的哪些处于发展成ad的风险的用途。将医疗数据供应给计算机系统,该计算机系统至少部分地被配置为提供第一指示的第一经训练的学习机和提供第二指示的第二经训练的学习机。将指示组合以提供哪些具有ad的未知结果的受试者处于在限定的时间范围内发展成ad的风险的标识。
本公开的教导还可应用于将受试者分类为具有轻度认知障碍(mci)或阿尔茨海默病(ad)。计算机可以被布置成接收具有mci或ad的未知分类的一个或多个受试者的医疗数据,并且至少部分地被配置为提供第一指示的第一经训练的学习机和提供第二指示的第二经训练的学习机,并且将第一和第二指示组合以提供哪些受试者具有mci以及哪些受试者具有ad的标识。计算机系统可以进一步被布置成对被分类为mci的受试者提供该mci是早期mci还是晚期mci的进一步分类。
本公开的教导还可应用于一种用于将受试者分类为具有阿尔茨海默病(ad)或某种其它形式的痴呆的医疗系统,其中计算机系统被布置成接收具有mci或ad的未知分类的一个或多个受试者的医疗数据并且至少部分地被配置为提供第一指示的第一经训练的学习机和提供第二指示的第二经训练的学习机,并且将第一和第二指示组合以提供哪些受试者具有ad以及哪些受试者具有某种其它形式的痴呆的标识。
本公开的教导还可应用于一种用于标识药物的附加指示的医疗系统,其中计算机系统被布置成接收服用药物的一个或多个受试者的医疗数据并且至少部分地被配置为提供第一指示的第一经训练的学习机和提供第二指示的第二经训练的学习机,并且将第一和第二指示组合以确定是否可以向药物分配除了现有指示之外的指示。
本书面描述使用示例来公开本发明,包括最佳模式,并且使任何本领域技术人员能够实践本发明,包括制造和使用任何装置或系统以及执行任何并入的方法。本发明的可专利范围由权利要求限定,并且可以包括本领域技术人员想到的其它示例。如果此类其它示例具有与权利要求的字面语言没有不同的结构元件,或者如果它们包括与权利要求的字面语言无实质差异的等同结构元件,则此类其它示例旨在处于权利要求的范围内。文本中提及的所有专利和专利申请通过引用以其整体并入于此,如同它们被单独地并入。
1.一种用于预测具有不确定认知状态的受试者的疾病病理的医疗系统,所述系统包括:
计算机系统,所述计算机系统被布置成接收所述受试者的第一医疗数据并且至少部分地被配置为在第二医疗数据上训练的经训练的学习机,所述计算机系统适于使用所述经训练的学习机来提供所述疾病病理的预测;以及
显示器,所述显示器用于显示所述预测的指示,
其中所述第一医疗数据不包括从对所述受试者的分子成像过程获得的数据,并且所述第二医疗数据不包括从一个或多个分子成像过程获得的数据。
2.如权利要求1所述的医疗系统,其中所述疾病病理与同认知下降相关联的疾病或病症有关。
3.如权利要求1所述的医疗系统,其中所述疾病病理是产生多巴胺的脑细胞的损失。
4.如权利要求1所述的医疗系统,其中所述疾病病理是所述受试者的脑中的淀粉样蛋白beta(aβ)阳性。
5.如权利要求4所述的医疗系统,其中所述第一医疗数据包括日常生活活动(adl)基线、向后数字跨度、逻辑记忆ii故事后30分钟基线、连线部分a-时间(秒)、教育、男性性别、左尾状体体积、右杏仁核体积和右尾状体体积。
6.如权利要求4所述的医疗系统,其中所述第一医疗数据包括年龄、性别、简易智力评分(mmse)、临床痴呆评级(cdr)、临床痴呆评级盒总和(cdr-sb)、apoe遗传测试状态、区域性左右脑海马体积、海马旁回、杏仁核、内嗅皮质、内颞叶、直回、脑室和角回。
7.如权利要求1所述的医疗系统,其中所述临床结果是mci的快速进展。
8.如权利要求7所述的医疗系统,其中所述第一医疗数据包括adl基线、简易精神状态检查(mmse)基线、类别流畅度测试-动物类别、复合淀粉样蛋白标准化摄取值比(suvr)(脑桥)和海马体积。
9.如权利要求1所述的医疗系统,其中所述第一医疗数据包括所述受试者的认知测试的结果。
10.如权利要求1所述的医疗系统,其中所述第一医疗数据包括所述受试者的年龄。
11.如权利要求1所述的医疗系统,其中所述第一医疗数据包括所述受试者的教育的年数。
12.如权利要求1所述的医疗系统,其中所述第一医疗数据包括apoe遗传测试的结果。
13.如权利要求1所述的医疗系统,供用来预测具有不确定认知状态的受试者的疾病病理的方法中使用。
14.如权利要求1所述的医疗系统,供用来预测具有不确定认知状态的受试者的临床结果的方法中使用。
15.如权利要求1所述的医疗系统,其中所述受试者是主观记忆抱怨者(smc)或正在遭受轻度认知障碍(mci),并且正在针对阿尔茨海默病(ad)的可能发作而被调查。
16.如权利要求1所述的医疗系统,其中所述受试者是认知正常的。
17.一种用于预测具有不确定认知状态的受试者的临床结果的医疗系统,所述系统包括:
计算机系统,所述计算机系统被布置成接收所述受试者的第一医疗数据并且至少部分地被配置为在第二医疗数据上训练的第一经训练的学习机和在第三医疗数据上训练的第二学习机,所述计算机系统适于使用所述第一经训练的学习机和所述第二学习机来提供所述疾病病理的预测;以及
显示器,所述显示器用于显示所述预测的指示,
其中所述第一医疗数据包括从对所述受试者的分子成像过程获得的数据,并且已经至少部分地用从一个或多个分子成像过程获得的数据训练了所述第一经训练的学习机。
18.如权利要求17所述的医疗系统,其中所述受试者是主观记忆抱怨者(smc)或正在遭受轻度认知障碍(mci),并且正在针对阿尔茨海默病(ad)的可能发作而被调查。
19.如权利要求17所述的医疗系统,其中所述预测是所述受试者向阿尔茨海默病的转化。
20.如权利要求17所述的医疗系统,供用来预测具有不确定认知状态的受试者的疾病病理的方法中使用。
21.如权利要求17所述的医疗系统,供用来预测具有不确定认知状态的受试者的临床结果的方法中使用。
22.一种预测具有不确定认知状态的受试者的疾病病理的方法,所述方法包括以下步骤:
针对具有所述疾病的已知结果的受试者的第一集合,将队列医疗数据收集到电子存储器中;
使用计算机系统,所述计算机系统被布置成接收所述受试者的受试者医疗数据并且包括在所述队列医疗数据上训练的经训练的学习机,所述计算机系统适于使用所述经训练的学习机至少部分地基于所述受试者医疗数据来提供所述疾病病理的预测,以提供所述疾病病理的预测;以及
使用显示器来指示所述预测。
23.一种预测具有不确定认知状态的受试者的临床结果的方法,所述方法包括以下步骤:
针对具有所述疾病的已知结果的受试者的第一集合,将第一队列医疗数据收集到电子存储器中;
针对具有所述疾病的已知结果的受试者的第二集合,将第二队列医疗数据收集到所述电子存储器中;
使用计算机系统,所述计算机系统被布置成接收所述受试者的受试者医疗数据并且包括在所述第一队列医疗数据上训练的第一经训练的学习机和在所述第二队列医疗数据上训练的第二经训练的学习机,所述计算机系统适于使用所述第一和第二经训练的学习机至少部分地基于所述受试者医疗数据来提供所述临床结果的预测;以及
使用显示器来指示所述预测。
24.如权利要求23所述的方法,其中所述第一队列医疗数据包括与所述第二队列医疗数据中的数据类型不同的数据类型。
25.如权利要求23所述的方法,其中所述第一队列医疗数据包括与所述第二队列医疗数据中的数据类型至少部分相同的数据类型。
26.一种用于标识处于发展成阿尔茨海默病(ad)的风险的受试者的医疗系统,所述系统包括:
计算机系统,所述计算机系统被布置成接收具有ad的未知结果的一个或多个受试者的医疗数据并且至少部分地被配置为提供第一指示的第一经训练的学习机和提供第二指示的第二经训练的学习机,并且将所述第一和第二指示组合以提供哪些具有ad的未知结果的受试者处于在限定的时间范围内发展成ad的风险的标识;以及
显示器,所述显示器用于显示所述标识。
27.如权利要求26所述的医疗系统,其中所述第一指示包括受试者为aβ阳性的概率。
28.如权利要求26所述的医疗系统,其中所述第二指示包括受试者的轻度认知障碍正在快速进展的概率。
29.如权利要求26所述的医疗系统,其中所述第一经训练的学习机和所述第二经训练的学习机在相同的物理硬件上实现。
30.如权利要求26所述的医疗系统,进一步包括用于存储所述医疗数据并被布置成将所述医疗数据提供给所述计算机系统的电子存储器。
31.如权利要求26所述的医疗系统,其中所述医疗数据包括体内图像数据、认知和功能记忆数据以及遗传数据。
32.如权利要求31所述的医疗系统,其中所述体内图像数据包括淀粉样蛋白beta阳性状态、标准化摄取值比(suvr)或t1加权磁共振(mr)体积测量。
33.如权利要求26所述的医疗系统,其中所述医疗数据包括人口统计学数据和/或每个受试者的电子医疗记录。
34.如权利要求26所述的医疗系统,其中所述受试者是轻度认知障碍的患者,并且所述限定的时间范围是3年或更少。
35.如权利要求34所述的医疗系统,其中所述限定的时间范围是2年或更少。
36.如权利要求26所述的医疗系统,其中所述受试者是健康对照、轻度认知障碍和阿尔茨海默病。
37.如权利要求26所述的医疗系统,其中所述第一指示是受试者为aβ阳性的概率,所述第二指示是受试者的轻度认知障碍正在快速进展的概率,并且所述计算机系统被配置成使用所述第一概率和所述第二概率来标识处于在限定的时间范围内发展成ad的风险的受试者。
38.一种用于标识处于发展成阿尔茨海默病(ad)的风险的受试者的方法,所述方法包括以下步骤:
针对具有所述疾病的已知结果的受试者的第一集合,将医疗数据收集到存储的电子存储器中;
使用第一经训练的学习机和第二经训练的学习机来标识处于在限定的时间范围内发展成所述ad的风险的受试者;以及
选择处于在限定的时间范围内发展成所述ad的风险的受试者以用于对ad的研究。
39.如权利要求38所述的方法,其中所述医疗数据包括体内图像数据、认知和功能记忆数据以及遗传数据。
40.如权利要求39所述的方法,其中所述体内图像数据包括淀粉样蛋白阳性状态、标准化摄取值比(suvr)或t1加权磁共振(mr)体积测量。
41.如权利要求38所述的方法,其中所述医疗数据包括人口统计学数据和/或每个受试者的电子医疗记录。
42.如权利要求38所述的方法,其中所述受试者是轻度认知障碍的患者,并且所述限定的时间范围是3年或更少。
43.如权利要求42所述的方法,其中所述限定的时间范围是2年或更少。
44.如权利要求38所述的方法,其中所述受试者是健康对照、轻度认知障碍和阿尔茨海默病。
45.一种确定有阿尔茨海默病(ad)的患者的预后的方法,所述方法包括以下步骤:
向需要施用淀粉样蛋白造影剂的患者施用淀粉样蛋白造影剂;
对所述患者的脑中的淀粉样蛋白沉积物进行成像;以及
使用机器学习模型将所述患者中的所述淀粉样蛋白沉积物的成像与其它变量相关,用关于具有已知ad预后的患者的数据的训练集训练所述机器学习模型。
46.一种治疗阿尔茨海默病(ad)的患者的方法,所述方法包括以下步骤:
在计算机中,将从所述患者获得的成像数据和其它数据与包括已知ad预后的患者的成像数据和其它数据的训练集进行比较,以便将所述患者分类到疾病队列中;
标识已知改善所述疾病队列内ad的患者结果的药物疗法;以及
用所标识的药物疗法治疗所述患者。
47.一种具有阿尔茨海默病(ad)的未知结果的一个或多个受试者的医疗数据用于确定所述受试者中的哪些处于发展成ad的风险的用途,所述用途包括将所述医疗数据供应给计算机系统,所述计算机系统至少部分地被配置为提供第一指示的第一经训练的学习机和提供第二指示的第二经训练的学习机,并且将所述第一和第二指示组合以提供哪些具有ad的未知结果的受试者处于在限定的时间范围内发展成ad的风险的标识。
48.一种用于将受试者分类为具有轻度认知障碍(mci)或阿尔茨海默病(ad)的医疗系统,所述系统包括:
计算机系统,所述计算机系统被布置成接收具有mci或ad的未知分类的一个或多个受试者的医疗数据并且至少部分地被配置为提供第一指示的第一经训练的学习机和提供第二指示的第二经训练的学习机,并且将所述第一和第二指示组合以提供哪些受试者具有mci以及哪些受试者具有ad的标识;以及
显示器,所述显示器用于显示所述分类。
49.如权利要求48所述的医疗系统,其中所述计算机系统被布置成对分类为mci的受试者提供所述mci是早期mci还是晚期mci的进一步分类。
50.一种用于将受试者分类为阿尔茨海默病(ad)或某种其它形式的痴呆的医疗系统,所述系统包括:
计算机系统,所述计算机系统被布置成接收具有mci或ad的未知分类的一个或多个受试者的医疗数据并且至少部分地被配置为提供第一指示的第一经训练的学习机和提供第二指示的第二经训练的学习机,并且将所述第一和第二指示组合以提供哪些受试者具有ad以及哪些受试者具有另一形式的痴呆的标识;以及
显示器,所述显示器用于显示所述标识。
51.一种用于标识药物的附加指示的医疗系统,所述系统包括:
计算机系统,所述计算机系统被布置成接收服用所述药物的一个或多个受试者的医疗数据并且至少部分地被配置为提供第一指示的第一经训练的学习机和提供第二指示的第二经训练的学习机,并且将所述第一和第二指示组合以确定是否可以向所述药物分配除了现有指示之外的指示;以及
显示器,所述显示器用于显示所述附加指示。
技术总结