本发明涉及用于测量分离装置的物质流中的离子种类的质量的系统和方法,具体地说,根据质谱仪所测量的质量迹线来测定离子种类的质量。
背景技术:
质谱(ms)技术的使用在需要对不同化学样品和通常生物学样品进行详细分析的许多领域中已经变得非常宝贵。此类质谱分析是用于鉴别给定样品的化学组成。
在质谱仪中进行的直接分析典型地涉及使化学样品生成离子。然后通过质谱仪测量这些离子的质荷比(m/z)和丰度以产生质谱。此类质谱中处于特定m/z值的强度峰(或质心)提供指示相应离子的相对丰度和质量的标志。这个标志能够鉴别出初始化学样品中所包括的一种(或多种)化合物。
对于包括多种不同化合物的样品(例如生物样品)来说,通常将ms技术与分离技术组合。分离技术典型地涉及样品的分溶(或分离),例如用溶剂洗涤结合到固定相的样品,使得样品的多种组分依据给定的一种(或多种)分离参数(例如保留时间)从样品中发射。常见分离技术包含色谱技术,例如液相色谱(lc)或气相色谱(gc)。在色谱和质谱技术组合(例如lc/ms)的情况下,色谱技术使得不同化合物(或分析物)从样品中以不同时间(称为保留时间)洗脱或更典型地在保留时间的期间洗脱。使用质谱仪分析按照给定的保留时间洗脱的化合物以产生针对那种保留时间的质谱。因此,典型的色谱/质谱分析在给定的保留时间期间产生许多个别质谱。这些质谱随保留时间而变,表明在相同时间内从样品中洗脱的化合物不同。
分析这些质谱与洗脱参数的关系不仅能够鉴别出个别洗脱的化合物,而且能够鉴别或表征整个样品。洗脱参数在上文所论述的实例中典型地是保留时间,但是还可以是离子迁移率、ph、离子大小和/或其它物理化学特性。这类物理化学特性通常与保留时间成比例。典型地,通过根据所关注的m/z值产生质量迹线(例如所提取离子的色谱图xic)进行此分析。所关注的m/z值自身通常基于质谱来确定。举例来说,强度降低到某一阈值以上的任何强度峰(在频谱中)的m/z值可以被认为是所关注的m/z值。所给定质量迹线由质谱中的处于(或大约)给定m/z值的峰强度形成。然后,将这些强度相对于洗脱参数作图。具有最大值(并且任选地满足某些其它准则,例如最小丰度和或符合预期信号模型)的质量迹线被视为事件(或特征),并且此类特征能够用于鉴别特定洗脱化合物。
此类质量迹线通常使用单一m/z值报告,针对洗脱化合物的离子种类组分测量或估计。单个洗脱事件可以产生多条质量迹线,所述多条质量迹线对应于洗脱化合物的不同离子种类组分。这些质量迹线的最大强度连同相应的m/z报告值能够成为鉴别洗脱化合物的关键。因此,对于给定的质量迹线来说,期望获得准确的m/z报告值。典型地,m/z报告值是按照构成质量迹线的强度峰的m/z值的平均值(或加权平均值)计算。较强峰的m/z值可以赋予较高的权重,原因是假定其经历的测量误差较小。具体地说,强度小(与质量分析仪中的小离子浓度有关)时,m/z测量值典型地具有大的测量误差。这是归因于少数离子的离子统计数据的影响。强度较高(与较高离子浓度有关)时,因离子统计数据的影响而引起的测量误差大大减小。本领域中假定构成质量迹线的强度峰的m/z值在1或2ppm内是精确的。因而,类似的精度水平归于m/z报告值。
已注意到,在强度峰(其可以用质心表示)处于给定的m/z值的第一化合物洗脱期间,如果在极类似m/z值具有另一优选强度峰的第二化合物也洗脱,那么一个或两个峰的m/z测量值在高离子浓度(或高强度)下可能会失真。本领域集中各种努力来减少方法上的这种失真(称为并合),以避免相邻强度峰的质量差异小的情形,从而有望避免m/z值发生任何此类偏转。这未必总是切实可行的。
并合的论述可以见于:
·gorshkov,m.v.,fornelli,l.和tsybin,y.o.(2012),“轨道离子阱傅里叶变换质谱法观察离子并合(observationofioncoalescenceinorbitrapfouriertransformmassspectrometry)”《质谱学快报(rapidcommun.massspectrom.)》,26:1711-1717.doi:10.1002/rcm.6289;
·a.j.peurrung和r.t.kouzes(1995),“回旋加速器共振质谱中的空间电荷效应作为耦联回旋器现象的分析(analysisofspace-chargeeffectsincyclotronresonancemassspectrometryascoupledgyratorphenomena)”《国际质谱和离子过程杂志(internationaljournalofmassspectrometryandionprocesses)》145:139-153;以及
·tarasova,i.a.,surin,a.k.,fornelli,l.,pridatchenko,m.l.,suvorina,m.y.和gorshkov,m.v.(2015).“傅里叶变换质谱中的离子并合:在鸟枪法蛋白质组学中,我们应该为此感到担忧吗?(ioncoalescenceinfouriertransformmassspectrometry:shouldweworryaboutthisinshotgunproteomics?)”《欧洲质谱杂志(europeanjournalofmassspectrometry)》,21(3),459-470.https://doi.org/10.1255/ejms.1356。
技术实现要素:
本发明的一个目标是提供改进的方法和系统,其利用分离质谱分析所测得的质量迹线来测定离子种类的质量。具体地说,在质量迹线可能存在因并合而引起的显著质量偏转的情形中。
如上所概述,此类偏转能够引起现有技术方法所生成的质量迹线的m/z值出现误差。具体地说,偏转可以使得质量迹线中的一些m/z强度峰偏转可能多达30ppm或更多。这能够使得质量迹线的m/z报告值处于容限类似的误差内。这在下文参考图1d更详细地描述。另外,现在已观察到m/z值偏转的增加典型地与质量分析仪中的离子数目(或离子浓度)有关。检测质量迹线时,离子浓度可以用离子信号(典型地是信噪比(s/n值)表示。另外,或替代地,当离子浓度和强度相关时,离子浓度可以由m/z强度峰的强度表示。在一些质量分析仪中,仅注入少数可用离子,但多数离子由分离装置和/或离子源提供。在高离子强度下,质量分析仪中的离子浓度不再与所提供离子的离子强度相关。
在本发明中,提出了用于测定(或测量)离子种类的质量的新方法和系统。本发明提供了一种利用质量迹线测量离子种类的质量的方法,这是通过将质量迹线中的所测质量外推至零离子浓度,从而补偿质量迹线的离子偏转效应。
在第一方面中,提供了一种用于测量(或测定或以其它方式估计)物质流中的离子种类的质量的方法(例如计算机实施的方法)。所述物质流是从分离装置中发射的物质流,其与分离参数有关。应了解,分离装置可以是能够引起分析物从样品中分离的任何装置。举例来说,分离装置可以是以下中的任一个:液相(或气相)色谱仪(或色谱柱);成像装置,例如基质辅助激光解吸电离(maldi),或次级离子质谱(sims)成像装置等。
在这个方面中,方法包括获得分析物的离子种类的质量迹线。离子电离可以在分离装置中或在分离装置下游的电离源中发生。质量迹线包含强度峰集合,各强度峰具有相应的实测质量和相应的信号。应了解,物质流的实测质量和信号是通过质谱仪(或质量分析仪)测量。在一些实施例中,获得质量迹线的步骤包含操作质谱仪。在其它实施例中,质谱仪的操作已经预先进行并且获得步骤可以包含从存储装置中获取(或以其它方式接收)质量迹线。
所述方法继续如下进行:通过将质量迹线的强度峰集合的实测质量向信号零(相当于或表示理论离子浓度为零或基本上为零)外推来确定离子种类的质量。所述测定可以包括将回归函数与强度峰拟合,其中回归函数使实测质量与强度关联。典型地,回归函数可以是以下中的任一种:线性函数;n阶多项式,其中n是大于1的整数,优选2与5之间的整数。在一个优选实施例中,回归函数是二次函数(2阶多项式)或三次函数(3阶多项式)。使用线性函数作为回归函数特别有利于在质量测定值精度与减少拟合所需强度峰数目之间提供最佳的平衡。此外,在这种情况下,计算回归函数的成果最优。所述测定可以作为鉴别出质量迹线偏转的响应来执行。
这个方面在强度峰的质量因质谱仪中存在类似质量的离子而偏转时有利地对所得实测质量进行补偿。
在将回归函数与强度峰拟合的实施例中,应了解,回归函数可以使用任何适合的拟合算法(或方案)与强度峰拟合。实例包含以下中的任一种:最小二乘拟合;最小绝对偏差算法;最大似然型评估等。
在一些实施例中,集合中的强度峰对应于分离事件,所述分离事件具有分离参数的起始值、分离参数的最终值和分离参数的最高(或中心)值。
在一些实施例中,作为鉴别质量迹线偏转的响应,执行测定离子种类的质量的步骤。
在一些实施例中,所述方法进一步包括将强度峰集合分成至少两个强度峰子集。所述方法然后继续如下进行:通过将第一子集的实测质量向信号零外推来确定离子种类的质量的第一估计值并且通过将第二子集的实测质量向信号零外推来确定离子种类的质量的第二估计值。然后可以基于第一估计值和第二估计值的比较情况来接受(或丢弃)离子种类的实测质量。
第一子集可以包括分离参数值在起始值与中心值之间的情况下所测得的强度峰,并且第二子集可以包括分离参数值在中心值与最终值之间的情况下所测得的强度峰。在其它实施例中,强度超出分离事件的最大强度的预定阈值的强度峰从强度峰集合中排除。
在一些实施例中,所述获得步骤包括通过应用事件检测算法而从质量迹线的多个强度峰中鉴别出强度峰集合。
在分离装置包括色谱仪的实施例中,分离参数典型地是保留时间。然而,应了解,保留时间可以用作其它物理化学特性(例如以下中的任一种:离子迁移率;ph;离子大小;碰撞横截面;极化率等)的替代量度。
另外或替代地,分离参数可以包括任一种或多种物理化学特性,例如:离子迁移率;ph;离子大小;碰撞横截面;极化率等。
在分离装置包括质谱成像装置的一个实施例中,分离参数典型地表示向质谱成像装置提供样品的表面位置。
在一个实施例中,所述方法进一步包括基于离子种类的质量测定值来生成离子种类的校正质量迹线。可以基于离子种类的质量测定值和/或拟合的回归函数来生成校正的质量迹线,作为测定离子种类质量的步骤的一部分。
在一个实施例中,获得质量迹线的步骤进一步包括接收质谱数据。包括多个质谱的质谱数据各自按照分离参数的相应值获得。
获得质量迹线的步骤继续如下进行:从多个质谱中鉴别出根据分离参数排序的三个或更多个强度峰的序列。所述鉴别三个或更多个强度峰的序列包括按照初始实测质量选择初始强度峰,以及对于强度峰序列中的每个其它强度峰,则至少基于强度峰序列中的相邻强度峰的实测质量来选择所述强度峰。
利用经鉴别的强度峰序列提供物质流中的给定发射化合物的质量迹线。典型地,质量迹线至少由经鉴别的强度峰形成。
鉴别三个或更多个强度峰的序列的步骤可替代地如下进行:按照初始实测质量和分离参数的初始值选择初始强度峰以形成质量迹线的一部分,并且按照分离参数的其它值重复选择其它强度峰,至少基于预先选择的处于分离参数的相邻值的一个或多个强度峰的实测质量来形成质量迹线的一部分。
这个实施例有利地允许提供较完整的质量迹线用于所述方法的进一步分析,在质谱数据(例如上述那些)存在m/z偏转的情况下具有较大的可靠性。这是因为所述方法有效地使质量迹线沿其路径行进并且因此能够在m/z方向上追踪平滑偏转。
本发明还提供了对应于上述方法的设备,所述设备包括被布置成实施上述方法的元件、模块或组件,例如一个或多个合适配置的各种计算装置,例如前述那些计算装置。
具体地说,本发明因此提供一种用于测量(或测定)物质流中的离子种类的质量的系统(或设备)。所述系统包含质量迹线接收器模块,所述质量迹线接收器模块经配置以获得离子种类的质量迹线。
所述系统进一步包括外推模块,所述外推模块被布置成通过将质量迹线的强度峰集合的实测质量向信号零外推来测定离子种类的质量。
所述系统还可以包括输出模块布置,以提供离子种类的质量测定值作为输出。
本发明还提供了适于一个或多个处理器执行的一种或多种计算机程序,此类计算机程序被布置成实施上文概述和本文所述的方法。本发明还提供了一种或多种计算机可读媒体和/或通过网络载送的数据信号,所述计算机可读媒体和/或网络包括(或其上存储)此类一种或多种计算机程序。
附图说明
现将参照附图仅通过举例描述本发明的实施例,在附图中:
图1a示意性地示出了一个实例系统,用于对样品进行耦联的分离/质谱分析;
图1b展示了质谱的实例图示;
图1c展示了如可由图1a中的系统生成的两个实例质量迹线;
图1d展示了如可由图1a中的系统生成的另外两个实例质量迹线;
图2示意性地示出了可以在本发明中使用的计算机系统的实例;
图3a示意性地示出了实例分析系统的一种逻辑布置,例如可以在图1a的系统中使用的逻辑布置;
图3b示意性地示出了一种利用质谱数据获得质量迹线的方法,所述方法可以由图3a的分析系统执行(或实施);
图4是流程图,其示意性地示出了图3b中所示的方法中使用的质量迹线生成步骤的实例实施方案;
图5是流程图,其示意性地示出了图4中所阐述的质量迹线生成步骤的实例实施方案的变化形式;
图6a示意性地示出了实例分析系统的一种逻辑布置,例如可以在图1a的系统中使用的逻辑布置;
图6b示意性地示出了一种获得质量迹线(例如通过图3b-5中的方法所生成的质量迹线)的m/z值或质量中心的方法;
图7示意性地示出了用于确定质量中心的置信度测量结果的步骤,所述步骤可以结合图6中的方法使用。
图8示意性地示出了用于确定m/z值期望方差或质量再现性的方法800,所述方法可以作为图6b中所述的方法的一部分执行;
图9a展示了实验质量迹线的实测强度峰的m/z值相对于保留时间的曲线图,以及所述强度峰的信噪比相对于保留时间的曲线图。
图9b展示了图9a的lc/ms实验的质量迹线的强度峰的实验图;
图9c展示了如图9b所示的质量迹线a1的强度峰的m/z值对信噪比曲线图,如根据(使用)图6b中的方法所处理;
图9d展示了图9b中所示的实验质量迹线a1的强度峰的m/z值对信噪比曲线图,如使用图7中的方法所处理。
具体实施方式
在以下的说明中并且在图中,描述本发明的某些实施例。然而,应了解本发明不限于所述实施例并且一些实施例可以不包含下文描述的所有特征。然而,显而易见的是,可以在本文中进行各种修改和变更,而这些修改和变更不偏离如所附权利要求书中阐述的本发明的较广泛精神和范围。
图1a示意性地示出了实例系统100,用于对样品101进行耦联的分离/质谱分析。所示系统100包括分离装置110、质谱仪130、质量迹线分析系统150、质量校正模块160,和进一步处理模块170。
分离装置110经配置以将所引入的样品101分离成其多种组分(或分析物)。具体地说,分离装置110通常被配置成依据分离参数(或尺度)促使所引入的样品101的组分(或分析物)1121、1122、…112n从分离装置110中洗脱(或发射或以其它方式放出)。分离参数(或多个参数)还可以认为是洗脱参数,尤其在分离装置包括色谱仪或色谱柱的情况下。分析物典型地作为物质流(或离子流)通过分离装置110发射,然后可以引入(或注入)如下文即将描述的质谱仪130中。应了解,这种物质流可以是各种分析物的连续流,或者其可以脉动,这视分析物从样品101中分离的速率而定。
举例来说,分离装置110可以是本领域中通常已知类型的液相(或气相)色谱仪。在此实例中,洗脱参数是保留时间。换句话说,组分传送通过色谱仪需要持续的时间(例如样品注入装置中与组分提供到质谱仪130之间的时间)。因为液相(和气相)色谱仪在本领域中是众所周知的,所以它们在本文中将不进一步描述。
在另一实例中,分离装置110可以是质谱成像(如基质辅助激光解吸电离(maldi),或次级离子质谱分析(sims)成像)中所用类型的成像装置。在这些实例中,样品101包括通常被电离束(如离子束或激光)扫描的表面。典型地,电离束促使组分(或者多种组分)112从波束所聚焦的样品101表面上的位置发出(或发射)。随着波束扫描样品101,组分112依据扫描路径发射。以此方式,应了解分离参数可以是样品101表面上的坐标,或指示波束的扫描次序的参数(例如光栅扫描中的像素)。因为质谱成像在本领域中是众所周知的,所以在本文中将不进一步描述。
除色谱和成像的许多变化形式以外,许多其它分离装置和方法在本领域中已知,包含离子迁移率和差分离子迁移率分离、电泳、通过结合到结合剂的阵列(的元件)进行分离。
分离装置110与质谱仪130耦接。具体地说,分离装置110经配置以向质谱仪130提供所发射的组分。这些组分112典型地通过注射引入质谱仪130中。质谱仪130可以布置成将所注入的组分112电离(且任选地片断化)。替代地,通过分离装置110提供的组分112可以已经是电离的。举例来说,在分离装置110是离子迁移率分离器或成像装置(例如在maldi装置中)的情况下,组分112通常被分离装置110电离。以此方式,应了解,分离装置110可以是质谱仪130的离子源。
质谱仪130经布置以生成电离片段(或组分112)的相对丰度(或强度)相对于质荷比(即,m/z值)的质谱132。质谱132在下文即将进一步详细描述。已知质谱132的生成可能涉及根据电离组分的m/z值分离或选择所述电离组分,随后测量由这些分开的离子和/或电离片段组所产生的一个或多个信号。电离组分的分离或选择能够发生的原因在于特定m/z值的离子具有供这些离子振荡的特定轨迹。由于此振荡,因此能够检测到离子的特征信号,所述特征信号具有频率ω并且利用所述频率能够赋予特定m/z值。质谱仪的操作在本领域中是众所周知的并且在本文中不进一步描述。技术人员将了解质谱仪130可以是任何类型的。举例来说,质谱仪可以是以下中的任一种:包括离子阱的质谱仪(例如线性离子阱光谱仪)、飞行时间(tof)质谱仪、傅立叶变换离子回旋共振质谱仪(ft-icrms)、静电离子阱质谱仪(其实例是orbitraptm质谱仪)。
质谱仪130典型地依据分离参数接收组分112。以此方式,应了解,质谱仪130同时(或基本上同时)接收按照洗脱参数的相同值(或在相同值范围内)发射的组分112。因此,质谱仪130经布置以依据分离参数生成质谱132。换句话说,每个质谱132是按照洗脱参数的相应值生成。更具体地说,每个质谱132可以认为是(或表示)按照洗脱参数的相应值发射的组分112的质谱132。在整个m/z范围内,在完整强度对m/z曲线图的意义上,每个质谱132不必是完整质谱。举例来说,如本文中所提到,质谱132可以包括一个或多个m/z对强度数据点。质谱132可以局限于所关注的特定m/z范围。在极端情况下,质谱132可以在所关注的特定m/z范围内仅包括质心。
因此,应理解,质谱132至少利用强度(或丰度)、m/z(或质量)和洗脱参数的尺度来形成数据集。因此,质谱仪130经布置以产生质谱数据(或耦联的分离/质谱数据)131。质谱数据131包括多个质谱132,所述多个质谱各自按照分离参数的相应值获得。
实际上,一些装置(例如一些飞行时间质谱仪)可以不提供质谱数据131,所述质谱数据是相对于分离参数绘制的质谱132的有序集。相反,质谱数据可以是一连串的m/z-强度值对,和分离参数的相关值。
举例来说,阿达马变换(hadamardtransform)飞行时间仪器或类似操作装置可以提供物质到达时间的序列,其需要进行解卷积以便确定分离尺度的参数。
应理解,仍然可以称此类质谱数据包括质谱132,原因在于如上所述,质谱132可以简单地认为是在分离参数的给定值(或值范围)下具有强度(或丰度)、m/z(或质量)的尺度的数据集。
应了解,在分离参数p的一定范围内,给定的组分112可以从分离装置110中发射。典型地,在这个范围内,组分112的丰度可以升高到峰值,然后降低。然而,在一些情况下,例如质谱成像,组分的丰度可能存在明显中断。这种情况可以是例如所述组分仅存在于被波束扫描的样品101表面的界限分明的区域中。
因此,应了解,在质谱数据131的每个质谱132(或质谱数据集132)中,将存在多个m/z强度峰(典型地用质心表示),即,单个质谱132中的强度值相对于m/z的局部最大值。然而,对于具有其特定m/z值的特定组分来说,质谱数据131中将存在多个分离参数强度峰,即,强度相对于分离参数的局部最大值。
两种或更多种组分据以发射的分离参数的范围可以重叠。举例来说,在色谱仪中,给定组分可以在保留时间的期间内洗脱。在以下说明中,为易于讨论,典型地将参考涉及使用色谱图的情形来给定实例。然而,应了解论述不限于这些实例并且涉及洗脱和洗脱参数的论述同等地适用于较通用的分离装置,其中可以改用术语排放和分离参数(或上文阐述的它们的其它替代术语)。
举例来说,如图1a中所示,就洗脱参数来说,第一组分1121首先洗脱。在第一组分1121就洗脱参数来说结束洗脱之前,第二组分1122开始洗脱。因此,在洗脱参数范围内,第一组分1121和第二组分1122同时洗脱,并且因此同时注入质谱仪130中。此范围内的洗脱参数p2的值所生成的质谱132p2将包含第一组分1121和第二组分1122的m/z强度峰。
反之,如图1a中所示,就洗脱参数来说,第三组分1123第三洗脱,并且确实如此,同时另外无其它组分112洗脱。因此,洗脱参数p3在第三组分1123洗脱的范围内的值所生成的第二质谱132p3将包含正好第三组分1123的m/z强度峰。
分析系统150经布置以接收质谱仪130生成的质谱数据131。分析系统150可以是(或包括)一个以上计算机系统,例如即将参考图2更详细描述的计算机系统200。分析系统150经布置以基于所接收的质谱数据中的质谱132来生成一个或多个质量迹线152。
质量迹线152(例如图1c中示出的实例质量迹线152a)典型地包括从样品101中洗脱的组分112的特定离子片断的m/z强度(或相对丰度)峰(或质心)集合,所述强度峰是洗脱参数的函数。因为每个质谱132典型地对应于洗脱参数的相应不同值,所以质量迹线152中的每个质心来自相应的不同质谱132。
在分离装置110是色谱仪的情况下,质量迹线152的一个特定实例是本领域中众所周知的提取离子色谱图。
质量校正模块160经布置以接收所生成的质量迹线152。质量校正模块160经布置以根据所生成的质量迹线152计算(或者测定或以其它方式生成)质量601。所述质量可以理解为特定质量迹线152的离子片断(或种类)的经校正(或真实)质量(或质荷比m/z)。计算出的(或测定)的质量可以作为经校正的质量迹线652的一部分通过质量校正模块160输出。质量校正模块160可以通过(或使用)一个以上计算机系统(例如计算机系统200)建构。质量校正模块160可以作为分析系统150的一部分建构。
应了解,离子种类的经校正(或真实)的质荷比是(或接近)离子种类的物理质荷比m/z。如果m/z空间未发生偏转,则能够观察到此类真实质荷比。举例来说,如果离子种类已经被过滤(例如在质谱仪中被四极过滤器过滤),则此能够达到,因此它是质量分析仪中所分析的唯一种类,以便测量质荷比。
进一步处理模块170经布置以接收所生成的质量迹线152和/或经校正的质量迹线652和/或所测定的质量601。进一步处理模块170然后经布置以对所生成的质量迹线152和/或经校正的质量迹线652和/或所测定的质量601执行进一步处理技术,以便鉴别特定的洗脱化合物112和/或关于样品101的结构和组成的资讯。
质量迹线通常适用于如下过程:重新检查数据以检测此前未知的分析物;突显潜在的异构体、解析怀疑共洗脱的物质;和提供所关注化合物的清晰色谱图。
本领域中已知多种依赖于精确质量迹线152的此类处理技术,包含赛默科技(thermoscientific)的compounddiscoverer和proteomediscoverer软件产品。在proteome和compounddiscoverer产品中,质量迹线152可以用作事件(或峰)检测算法的输入,所述检测算法测定(或鉴别)数据中的相关事件。这些事件然后可以用于多种不同方法,包含:色谱比对、比较在不同色谱操作中的类似事件(例如测定不同样品中的某些蛋白质的相对量和/或存在或不存在),以及测定医药产品在生物体中在不同条件下形成的代谢物的相对量。
应了解,改进的质量迹线典型地使得色谱峰的识别更正确。这继而可以使得肽的鉴别和定量更正确。这在许多情形中具有重要作用,例如差异表达实验,其中能够获得更佳的相对蛋白质定量。确定哪种蛋白质的丰度在不同情况下变化最终有助于鉴别蛋白质与疾病状态或对治疗的响应的相关性。因此,其结果是,通过改进质量迹线的测定,可以改进患者的健康状态的诊断。实际上,在质量迹线测定不精确的情况下,对治疗有价值的信号可能在数据评估过程的早期不可挽回地丢失,如cappadona等人在《氨基酸(aminoacids)》(2012)43:1087-1108中的“用于基于质谱的定量蛋白质组学的软件解决方案的当前挑战(currentchallengesinsoftwaresolutionsformassspectrometry-basedquantitativeproteomics)”中所阐述。
质量迹线152的另一种用途展示于biller,j.e.和biemann,k.(1974)“重构的质谱:利用气相色谱-质谱仪数据的新颖方案(reconstructedmassspectra,anovelapproachfortheutilizationofgaschromatograph-massspectrometerdata)”,《分析通讯(analyticalletters)》7:7,515-528。在此使用质量迹线将片段离子与它们在gc-ms中的相应亲本分子相关联。一种类似方法论述于美国专利9,312,110中,其中在完整ms谱中分别获取亲本离子并且在ms2谱中获取片段离子,所述频谱可以通过用于离子解离的多种已知方法生成。
在质谱成像的情况下,可以处理质量迹线152以鉴别样品表面上的各别区域。可以对质量迹线使用得自视觉成像的已知方法(例如分水岭方法)将所述区域分开。另外,可以基于外部信息(其可以来源于例如对相同样品进行的光学或电子显微术)引导区域分离。
图1b展示了质谱132的实例图示。
质谱132包括一个或多个m/z测量值(或质荷比)132-1i(其中i仅仅是从1到n)的下标。每个m/z测量值对应于相应的离子种类并且可以等于相应离子种类的分子量除以相应离子种类的绝对元素电荷。质谱132包括一个或多个强度值132-2i,每个强度值132-2i按照相应的m/z测量值132-1i呈现。每个强度值132-2i与离子种类的相对丰度相关联,所述相对丰度对应于相应的m/z测量值132-1i。每个强度值132-2i可以与对应于相应m/z测量值的离子种类的相对丰度成比例。
实验质谱(例如质谱132)可以连续光谱图(用虚线指示)和质心图(用竖直实线指示)的形式绘制(或表示)。用虚线指示的峰宽度表示质量分辨能力的极限,它能够区分m/z比率接近的两种不同离子种类。
然而,应了解质谱132不需要以曲线图的形式绘制(或储存)。实际上,质谱132可以任何合适形式表示。举例来说,质谱132可以用包括一个或多个强度值132-2i和一个或多个m/z测量值132-1i的清单表示。在一些情况下,质谱132可以简单地用质心(或局部最大值)清单表示,每个质心用m/z测量值和强度值对表示。
因为本领域中存在利用质谱数据获得此类质心的许多常用技术,因此这些在本文中将不进一步论述。然而,应了解,本文中所述的技术可以针对形成质谱132的质心列表,或针对其中利用合适技术鉴别强度最大值(或质心)的原始质谱132进行。
图1c展示了如可由系统100生成的两个实例质量迹线152a;152b。
图1c中展示了利用质谱132绘制质心(或强度峰)的图197,其根据每个质心的m/z测量值相对于质谱132的洗脱参数值作图。形成每个质心强度的一部分的所述质心用环绕容易目测的点的圆的直径指示。正如能够看见的那样,图197中存在两个明显的质心序列,其分别以约m/z值a和b为中心。这些代表两种化合物的洗脱:一个具有标志m/z值a,而另一个具有标志m/z值b。正如能够看见的那样,就洗脱参数来说的m/z测量值存在微小的偏差,这典型地由质谱仪的固有精度引起。此精度就存在于质谱仪中的离子数目来说可以变化,其本身在给定化合物洗脱期间倾向于升高和降低。
对于所关注m/z值a的质量迹线152a和所关注m/z值b的质量迹线152b来说,相应的质量迹线152a、152b是围绕所关注的相应m/z值的质心的强度相对于那些质心的洗脱参数的值的曲线图。在分离技术是色谱技术的情况下,洗脱参数是保留时间并且质量迹线是所关注m/z值的提取离子色谱图。
考虑到m/z测量值存在微小偏差,现有技术的质量迹线提取技术典型地通过在所关注m/z值的任一侧包含m/z值在某一范围δ内的所有质心来形成质量迹线,如图1c所示。此范围(典型地为2δ)通常被称为质量窗口(或质量窗口宽度)并且预先界定,常常由用户或软件架构师指定,或利用其它信息以编程方式确定。具体地说,质量窗口可以基于质谱仪类型和/或分辨率设定来生成。换句话说,考虑到以下实情才使用质量窗口:质谱仪报告的m/z测量值存在有限的精度,其导致一个质谱与下一个质谱的m/z测量值出现偏差。
然而,现在已经观察到,同一频谱中的两个邻近质心的m/z测量值可以偏转。典型地,质心向彼此偏转(或在一些情况下,一个质心(典型地为强度较小的质心)向另一质心偏转)。然而,因为偏转可以归因于质量分析仪内的离子相互作用的一般效应,所以在一些情况下,质心可以偏转而远离彼此。在任一情况下,这能够引起一些质心偏转超出围绕所关注m/z值的质量窗口δ的范围,如在图197中相对于所关注m/z值b的质心能够看见。然而事实是,对于与质量窗口内的质心相同的洗脱化合物来说,那些质心仍然与所关注的m/z值b有关。
这导致生成了错误的质量迹线,例如质量迹线152b'和152b"。在此,由于缺失的质心超出质量窗口的范围,因此生成两个各别的质量迹线。这两个质量迹线中的每一个就洗脱参数来说具有关联的相应强度峰(或事件)。在此实例中,第一峰位于洗脱参数的与真实质量轨迹152b的峰相同的值处。然而,第一峰的形状不同于真实峰的形状。此形状差异与错误的第二峰的组合可能阻碍了鉴别引起此质量迹线的洗脱化合物。在一些情况下,由于两个错误峰的形状出现罕见的截断,因此它们可能简单地被分析系统舍弃,阻碍了洗脱化合物的鉴别。替代地,两个错误峰可能导致洗脱化合物的误分类,例如进一步分析可能认为两个错误峰是两种分别洗脱的化合物的结果。
即使在如上文所述的附近质心偏转不足以使质心超出现有技术质量迹线提取技术的质量窗口a的范围的情况下,偏转仍然会导致所生成的质量迹线不精确。
举例来说,图1d中示意性地展示了图197-1。这个图与图1c中所示的图197相同,但有以下例外。图197-1中存在两个明显的质心序列,其分别以约m/z值c和d为中心。这些代表特定化合物洗脱的两种不同离子组分(或片段)c和d:一种具有m/z值c,而另一种具有m/z值d。正如能够看见的那样,在质心以约m/z值d为中心的情况下,就洗脱参数来说的m/z测量值存在微小的偏差,这典型地由质谱仪的固有精度引起。
如能够在图197-1中所见,与m/z值c有关的质心向与m/z值d有关的质心偏转。此原因与上文关于图1c所述的偏转相同。在本发明的图1d情形中,偏转归因于相同洗脱化合物的其它离子片段(例如在特定的同位素分子中),其可以称为自动并合,也就是说,相同洗脱化合物的离子片段在质谱仪中并合,由此引起片段离子中的一种或两种的m/z测量值发生位移。类似地,上文关于图1c所述的情形可以称为异并合,也就是说,洗脱时间重叠的不同洗脱化合物的离子(或离子片段)在质谱仪中并合,由此引起离子(或离子片段)中的一种或两种的m/z测量值发生位移。
图1d还示意性地展示了所关注m/z值c的质量迹线152c,和所关注m/z值d的质量迹线152d。相应的质量迹线152c、152d(前述)是围绕所关注的相应m/z值的质心相对于那些质心的洗脱参数值的强度图。
然而,在现有技术的方法中,质量迹线152c的组分的m/z值如下计算:
·质量迹线的最大强度质心的m/z测量值与c的m/z值有关;或
·质量迹线的质心的m/z测量值的平均值(例如均值)与c的m/z值有关。
正如现在了解的那样,与m/z值c有关的质心偏转将误差引入了通过现有技术的此类方法计算出的m/z值。具体地说,在现有技术中,期望将质心的m/z测量值校正在1-2ppm内。正如下文即将展示,质心的m/z测量值的所述偏转可以多达30ppm。因此,这能够导致现有技术计算的m/z值出现影响质量迹线的显著误差。
图2示意性地示出了计算机系统200的一个实例。系统200包括电脑202。电脑202包括:存储介质204、存储器206、处理器208、接口210、用户输出接口212、用户输入接口214和网络接口216,所有这些通过一个或多个通信总线218连接在一起。
存储介质204可以是任何形式的非易失性数据存储装置,例如硬盘驱动器、磁盘、光学光盘、rom等中的一种或多种。存储介质204可以存储可由处理器208执行的操作系统。处理器208执行操作系统可以是计算机202运行所必需的。存储介质204还可以存储一个或多个计算机程序(或软件或指令或代码)。
存储器206可以是适于存储数据和/或计算机程序(或软件或指令或代码)的任何随机存取存储器(存储单元或易失性存储介质)。
处理器208可以是适于执行一个或多个计算机程序(例如存储介质204和/或存储器206中存储的那些计算机程序)的任何数据处理单元,其中一些计算机程序可以是根据本发明实施例的计算机程序或当由处理器208执行时促使处理器208执行根据本发明实施例的方法并且将系统200配置为根据本发明实施例的系统的计算机程序。处理器208可以包括单一数据处理单元或并联、分开或彼此协同操作的多个数据处理单元。处理器208在执行本发明实施例的数据处理操作时可以将数据存储到存储介质204和/或存储器206中和/或从中读取数据。
接口210可以是向计算机202外部的或可从计算机202拆卸的装置222提供接口的任何单元。装置222可以是数据存储装置,例如光学光盘、磁盘、固态存储装置等中的一种或多种。装置222可以具有处理能力,例如所述装置可以是智能卡。因此,接口210可以根据其从处理器208接收到的一个或多个命令,访问装置222中的数据,或将数据提供给装置222,或与装置222介接。
用户输入接口214经布置以接收系统200的用户或操作员的输入。用户可以通过与用户输入接口214连接或通信的系统200的一个或多个输入装置提供此输入,例如鼠标(或其它指向装置)226和/或键盘224。然而,应了解,用户可以通过一个或多个额外或替代的输入装置(例如触摸屏)向计算机202提供输入。计算机202可以将通过用户输入接口214从输入装置接收的输入存储在存储器206中供处理器208随后访问和处理,或者可以将其直接传送到处理器208,以便处理器208能够相应地对用户输入作出响应。
用户输出接口212经布置以向系统200的用户或操作员提供图形/视觉输出。因此,处理器208可以布置成指示用户输出接口212形成代表所期望图形输出的图像/视频信号,并且将此信号提供给与用户输出接口212连接的系统200的监视器(或显示屏或显示单元)220。
最后,网络接口216向计算机202提供从一个或多个数据通信网络下载数据和/或将数据上传到一个或多个数据通信网络的功能。
应了解,图2中示出和上文所述的系统200的架构仅具示例性并且本发明的实施例中可以使用具有不同架构(例如组件少于图2中所示,或相较于图2中所示,具有额外和/或替代的组件)的其它计算机系统200。举例来说,计算机系统200可以包括以下中的一种或多种:个人计算机;服务器计算机;膝上型计算机;移动电话;平板电脑;其它移动装置或消费型电子装置;云计算资源;网络连接装置等。
图3a示意性地示出了实例分析系统150的一种逻辑布置,例如可以在系统100中使用的逻辑布置;分析系统150包括接收器模块310、质量迹线生成(或提取)模块320,和质量迹线处理模块330。
接收器模块310经布置以接收质谱数据131。典型地,接收器模块310经布置以接收来自与分析系统150耦接(或连接)的质谱仪的质谱数据。然而,应了解,接收器模块310可以布置成接收来自任何合适来源的质谱数据131,包含数据存储装置、云计算服务、测试数据生成程序等。如此前阐述的,质谱数据131包括质谱仪130根据洗脱参数(例如保留时间)生成的多个(或系列)质谱132。
质量迹线生成模块320经布置以基于接收到的质谱130提取(或获得)一个或多个质量迹线152。具体地说,质量迹线生成模块320经布置以根据接收到的质谱数据131的质谱来鉴别三个或更多个强度峰的序列(根据洗脱参数排序)。作为鉴别序列的一部分,质量迹线生成模块320通常被布置成从质谱132中选择初始强度峰。初始强度峰可以基于所关注的m/z值(或范围)而选择。应了解,所关注的此类m/z值(或范围)可以基于样品101的已知特性等,利用多种不同方式说明,例如通过用户、通过对质谱数据131进行的其它分析。正如下文即将阐述,初始强度峰可以基于质谱数据131的取样来选择。从初始强度峰开始,质量迹线生成模块320经布置以依据洗脱参数、通过跟踪(或追踪)质量迹线来选择序列中的其它强度峰。换句话说,对于强度峰序列中的每个其它强度峰,质量迹线生成模块320经布置以基于所述序列中已选择的相邻强度峰来选择所述其它强度峰。
质量迹线处理模块330经布置以提供提取到的一个或多个质量迹线152。通常,质量迹线处理模块330经布置以将质心序列的强度作为洗脱参数的函数作图。应了解,此图不限于图形表示并且可以包含以下中的任一种:坐标(或标绘点)的清单;表示强度峰序列的强度(作为洗脱参数的函数)的一个或多个参数化曲线等。
图3b示意性地示出了一种利用质谱数据131获得质量迹线152的方法350,所述方法可以由分析系统150执行(或实施);
步骤360包括接收器模块320接收包括多个质谱132的质谱数据131,所述多个质谱各自按照洗脱参数的相应值获得。
步骤370包括质量迹线生成模块320基于接收到的质谱132提取质量迹线152。步骤370包括质量迹线生成模块320利用多个质谱132鉴别三个或更多个强度峰的序列,所述强度峰序列根据洗脱参数排序。具体地说,处于初始m/z测量值的初始强度峰选自质谱132。对于强度峰序列中的每个其它强度波峰来说,所述强度波峰是基于强度峰序列中的相邻强度峰的m/z测量值来选择。步骤380包括质量迹线处理模块330提供经提取的质量迹线152。所述提供步骤可以包括以下中的任一种或多种:质量迹线152的显示;质量迹线152的存储;质量迹线152的传输(例如传输至下游系统或处理方法)等等。
应了解,可以对相同质谱数据131重复执行步骤370和380,例如按照所关注的不同m/z值提取多个质量迹线152。还应了解,可以重复执行步骤370以便提取多个质量迹线152并且可以针对经提取的质量迹线152执行步骤380一次。
典型地,对多个质谱中的具有强度峰的第一(或初始,就洗脱参数来说)质谱132中的每个强度峰执行步骤370。换句话说,质量迹线152始于此类第一质谱132中的每个强度峰。然后通常循序地考虑质谱且新的质量迹线始于未形成现有已提取质量迹线一部分的任一其它强度峰,也就是说,对不是现有质量迹线152一部分的后续质谱中的每个强度峰还执行步骤370。以此方式能够保证尽可能多地提取质量迹线152,并且考虑将质谱中的每个强度峰纳入质量迹线中。
图4是流程图,其示意性地示出了图3b中所示的方法中使用的质量迹线生成步骤370的实例实施方案。
步骤410包括按照初始m/z测量值选择质谱132的初始强度峰。通常,如上阐述,对相同质谱数据131执行步骤370多次。具体地说,对于给定的质谱132,可以努力提取质谱132中的每个强度峰(或质心)的质量迹线152。因此,可以这种方式简单地选择初始强度峰。另外,或替代地,一个或多个所关注的m/z值可以由用户指定。初始强度峰可以基于一个或多个所关注的m/z值来选择。举例来说,可以选择m/z测量值与所关注的m/z值最接近的强度峰。另外,在步骤410,基于初始强度峰的m/z测量值来设定m/z期望值。典型地,m/z期望值设定成等于初始强度峰的m/z测量值。
应了解,已知有多种方式来选择初始峰用于生成质量迹线的目的。典型地,使用预定的强度阈值并且选择超过阈值的强度峰。有利地,可以利用峰相位进行峰选取,并且阈值是动态地相对于频谱中的噪声背景来确定,并且保留背景信息。此类方法阐述在美国专利7,962,301中,所述专利以全文引用的方式并入本文中。另外,或替代地,可以利用质量分析仪的特性来减小假阴性率,例如如美国专利7,987,060中针对ft/ms仪器所示,所述专利全文并入本文中。
步骤420包括在下一个质谱132中选择一个或多个强度峰,所述强度峰的m/z测量值是在m/z期望值的m/z范围(或质量容限)内。典型地,步骤420包括确定(或鉴别)下一个质谱132中的一个或多个强度峰的m/z测量值是否在m/z期望值的预定义范围内。此m/z范围可以是(或包括)如前所述的质量窗口。以此方式,应了解,预定义范围在步骤370可以是恒定的。替代地,预定义范围在步骤370可以变化,如下文即将阐述。在步骤420鉴别出超过一个强度峰的情况下,步骤420可以包括选择所有强度峰。替代地,步骤420可以包括选择一个强度峰纳入强度峰的序列中。此类选择可以包括选择m/z测量值最接近所关注的m/z期望值的强度峰。替代地,选择可以基于一个或多个相邻质量迹线152的所关注的m/z期望值(或多个值)。举例来说,可以舍弃m/z测量值比当前质量迹线152的m/z期望值更接近相邻质量迹线152的m/z期望值的强度峰。然后,可以从剩余的已鉴别强度峰中选择m/z测量值最接近所关注的m/z期望值的强度峰。在所有已鉴别强度峰都已经以此方式舍弃的情况下,控制流移动到“否”分支,这即将在下文描述。
如果对下一个质谱132中的m/z测量值在m/z期望值的预定义范围内的一个或多个强度峰进行选择,则控制流移动到步骤430。
步骤430包括将步骤420所选的强度峰纳入强度峰的序列中。在利用步骤420选择超过一个强度峰的情况下,基于所选强度峰的平均强度峰可以纳入强度峰的序列中。另外,或替代地,所有选定的峰可以纳入质量迹线中。
步骤440包括至少基于步骤430中纳入强度峰序列中的强度峰的m/z测量值来更新m/z期望值。在一些情况下,m/z期望值可以设定成步骤430中纳入强度峰序列中的强度峰的m/z值。典型地,m/z期望值是基于序列中的前述强度峰的m/z测量值的平均值来更新(或更新为所述平均值或与所述平均值成比例)。平均值可以是窗口平均值,其中仅包含预定义数目个前述强度峰的m/z测量值。另外地或可替代地,平均值可以是加权平均值,例如强度加权平均值。
步骤440之后,控制流然后移回到步骤420。因此,应了解,步骤420中所鉴别的强度峰至少是基于强度峰序列中的相邻强度峰的m/z测量值来鉴别。
如果在步骤420之后,步骤420尚未选出强度峰,则控制流移到步骤450。
步骤450包括确定质量迹线152是否应当终止。典型地,如果对于预定义数目个连续质谱来说,步骤420尚未选出强度峰,则质量迹线152将终止。典型地,这表示与质量迹线相关的化合物洗脱已完成。应了解,可以使用其它终止准则。终止准则可以包含分离尺度方面的预定义和/或动态确定准则。终止准则可以包含:当总迹线(分离尺度)长度超过平均峰宽期望值(分离尺度)的倍数时。在这种情况下,应了解,开启新迹线可以是有利的,其中使用最新的强度峰作为新迹线的初始强度峰。在成像情形中,应了解可以成行进行扫描。在此,行末端可以终止迹线。终止准则可以取决于已选作序列一部分的强度峰数目,例如质量迹线越长,则预定义数目可能越大。以此方式,应了解,较长质量迹线对间隙或缺失强度峰的容忍性可以大于较短质量迹线。
如果步骤450确定质量迹线不应终止,则移动控制流,对序列中的下一个质谱执行步骤420。应了解,如果终止准则需要一旦在步骤420未选出强度峰时就终止质量迹线,则步骤450可以省略。在这种情况下,一旦步骤420未选出强度峰,就直接终止步骤370。
图5是流程图,其示意性地示出了图4中所阐述的质量迹线生成步骤370的实例实施方案的变化形式。除以下方面之外,图4的以上论述适用于图5。
步骤545包括更新m/z范围(或质量窗口)。m/z范围可以基于以下中的任一种(或任何组合)来更新(或与其成比例,或为其函数):质谱仪分辨能力;m/z期望值;序列中的此前选择的强度峰的强度;信噪比等。典型地,m/z范围就m/z期望值来说不更新到低于0.1ppm。应了解,在一些实例中,m/z范围可以依赖于(或取决于)相同质谱中的相邻(或邻近)峰(即,m/z尺度上邻近的峰)。举例来说,如果相邻峰在m/z尺度上足够接近m/z期望值而产生朝向相邻峰的“吸引力”,则可以调节质量窗口以考虑到所述预测到的“吸引力”。此类调节可以包含拓宽窗口和/或使窗口向相邻峰偏移。通过追踪所有质量迹线的质量偏差,可以基于自动观察到的倾向来调节质量窗口。举例来说,质量窗口在功能上可能依赖于质量和/或强度。具体地说,应了解,质谱仪在较低信噪比情况下检测到的较低离子将由于噪声的影响而展示较高的质量可变性。因此,可以使m/z范围与信噪比逆相关。
应了解,步骤410可以包括以类似于上述步骤545的方式、基于初始强度峰的m/z测量值来设定m/z范围。
在图5中所示的方法的实例实施方案中,可以使用以下准则和参数。
·步骤410和440中的m/z期望值集等于avg_mz,这是序列中的四个此前选定的强度峰的平均m/z测量值。在此前已经选择的序列中的强度峰少于四个的情况下,使用序列中的所有此前选择的强度峰。
·质量容限是tol_amu=最小值(2avg_mz/res*2/3,1.5*avg_mz/1e6)。典型地可以将1.5的系数代入0.1与100之间的数值。接近于0.1的值最适于超高分辨率ftms,而约100的数值最适于飞行时间质谱。res设定成等于强度峰的m/z测量值相对于半高全宽(fwhm)值的比率,即res=m/z/fwhm。
·用于确定是否终止质量迹线的预定义数目(或最大间隙长度)是maxgaplen=最大值(len/3,10),其中len是当应用测试时,序列中的强度峰数目。应了解,最大值maxgaplen(在此设定为10)可以动态方式确定。具体地说,可基于以下中的任一种来动态地确定最大值maxgaplen:仪器类型、信噪比、观察到(或预设)的色谱峰宽等。典型地,合理的范围是在3到10之间的某个数或分离方法中所用的平均峰宽。
实例方法通过下文给定的伪代码示出:
从在某时提取单个质量迹线的角度来看,上文参考图3b、4和5描述的方法是以逻辑方式描述,以便容易理解。根据质量迹线类型,这可以认为是质量迹线。然而,应了解本发明不限于此实施方案。替代地,上述方法可以根据质心类型、作为质心实施。换句话说,可并行地提取质量迹线150的两个或更多个(或所有)。
在根据质心类型的此类质心的一个实例中,可以按分离参数的顺序考虑质谱132。对于给定质谱132来说,可以针对有效质量迹线152(尚未终止的质量迹线152)中的每一个,按照步骤420测试质谱132中的每个质心。如果针对给定的质量迹线选择质心,则将质心添加到那个质量迹线152(按照步骤430)和m/z预期值中,并且任选地更新那个质量迹线152的m/z范围。如果任何有效质量迹线152不选择质心,则可以使用所述质心作为初始强度峰来起始新的质量迹线152。一旦已经考虑质谱132的所有质心,则对尚未添加新质心的有效质量迹线152应用终止准则。满足终止准则的任何质量迹线不予以进一步考虑并且可以提供给质量迹线处理模块330。然后对下一个质谱(按分离参数的顺序)中的质心重复执行所述方法。
应了解,前述讨论不限于在分离参数的任何特定方向(或意义)上选择强度峰。尽管很容易目测到位于分离参数的一个点值处的初始强度峰和位于分离参数的后续值处的后续选定强度峰,但是可以选择分离参数值高的初始强度峰并且就分离参数来说向后选择其它峰。还应了解,通过在任何方向上从分离参数值向外移动能够选择其它峰。举例来说,在质谱成像时,可以沿着样品表面上的对角线追踪质量迹线。
另外,或替代地,就分离参数来说,可以从给定的初始强度峰向前和向后追踪质量迹线。实际上,一旦平均质量(或质量中心)已经确定,则向后再追踪质量迹线可为有利的。这可以有利地改进初始强度峰的选择并且可以纳入原本已不考虑为质量迹线一部分的之前峰的质量迹线中。还应了解,虽然色谱峰在时间上不倾向于对称,但是其当在时间上向前移动时,仍然可以适合于使用相同选择和终止准则。
图6a示意性地示出了实例质量校正模块160的逻辑布置,例如可以用于系统100的逻辑布置。质量校正模块160包括质量迹线接收器模块602、外推模块604和输出模块608。应了解,质量校正模块160可以建构于计算机系统或例如计算机系统200的系统上或作为其一部分建构。
质量迹线接收器模块602经布置以获得(或接收)物质流中的给定离子种类的质量迹线152。典型地,质量迹线接收器模块602经布置以接收得自分析系统150的质量迹线152。然而,应了解,接收器模块602可以经布置以接收来自任何适合来源的质量迹线152,所述适合来源包含数据存储装置、云计算服务、测试资料生成程序等。
外推模块经布置以根据质量迹线152测定(或计算或以其它方式估计)质量(或经校正的质量)601。这可以理解为根据质量迹线152观察离子种类的质量。如即将在下文中更详细地描述,通过将质量迹线152中的强度峰集合的m/z测量值向信号零外推来确定质量601。
应了解,上文所论述的强度数量典型地是向质谱仪提供的物质流中的离子种类的相对丰度(离子数目)的量度。在一些情况下,这种强度与质谱仪的质量分析仪组件所生成的信号成比例。在此类情况下,强度与质量分析仪中的具有给定强度峰的m/z测量值的离子数目成比例。
然而,在一些情况下(例如静电阱型质量分析仪),控制(例如通过自动增益控制)注入质量分析仪中的物质流的离子数目,以便物质流中最多有最大数目个离子注入用于给定的扫描。这可以通过例如改变注射进行的时间段来实现。在此类情况下,强度仅与质量分析仪中的具有给定强度峰的m/z测量值的离子数目成比例,其中物质流中的离子总数低于所注入离子的最大数目。
然而,在两种情况下,质量分析仪所生成的信号(典型地是如下文即将描述的信噪比)与质量分析仪中的具有给定强度峰的m/z测量值的离子数目成比例。
以此方式,应理解,强度峰集合中的强度峰各自提供所述强度峰的信号。这可以通过包括信号的强度峰来实现。另外或替代地,强度峰可以包括能够基于强度测定信号的其它数据,例如注射进行的时间段和优选噪音强度。
输出模块608经布置以提供测定的质量601作为输出。输出模块608可以经布置以提供离子种类的经校正的质量迹线652,所述质量迹线基于质量601生成,如下文即将更详细描述。
图6b示意性地示出了用于确定质量迹线152的质量中心的方法600,所述方法可以通过质量校正模块160执行(或实施)。
步骤610包括质量迹线接收器模块602,从而获得物质流中的给定离子种类的质量迹线152。质量迹线152如此前关于图3到5所论述,并且包括强度峰集合,每个强度峰具有相应的m/z测量值和相应强度。强度峰集合通常作为根据分离(或洗脱)参数排序的强度峰序列形成并且对应于给定分离事件的强度峰,如下文即将论述。质量迹线152可以从质量迹线生成系统150获得(或接收),例如上文关于图3a、3b、4和5所述的任一种实例质量迹线生成系统150。另外或替代地,质量迹线152中的一些或全部可以获自存储介质,例如存储介质204。质量迹线152中的一些或全部可以从远程系统接收,例如云计算系统、网络存储装置等等。应了解,质量迹线152的生成与方法600的一个或多个步骤之间经历显著的时间。
分离事件通常是分离装置110中的特定化合物的洗脱。举例来说,在质量迹线152是提取离子色谱图的情况下,分离事件是色谱事件,即,特定化合物在特定保留时间时的洗脱与化合物的m/z值(就此类事件来说)相关联。可以通过事件检测算法、根据质量迹线中的与分离参数有关的强度峰(即(典型地为局部)最大值)来鉴别事件。此最大值出现时的分离参数值可以称为分离参数中心。另外或替代地,分离参数中心可以设定为峰面积给定平均分配时的分离参数值。在较高尺度上,这可以相当于几何中心。应了解,此类方法可以特别适用于与某一预定义模型或峰形不拟合的峰。在成像质谱学中,情况通常可以如此。
强度峰集合通常包括给定分离事件的分离参数的起始值与分离事件的分离参数的最终值之间存在的强度峰。此外,在质量迹线152是提取离子色谱图的实例中,强度峰集合可以包括洗脱开始时的保留时间与洗脱完成时的保留时间之间的强度峰。对应于强度最大值的保留时间的值是分离参数(在这种情况下,是保留时间)中心。
步骤610可以包括通过应用事件检测算法而从质量迹线152的多个强度峰中鉴别强度峰集合。如从以上论述中将了解,事件可以根据质量迹线中的强度峰鉴别。替代地,可以使用事件检测算法,在峰根据事件分类之前,所述算法需要此类质量迹线强度峰满足其它条件。举例来说,事件检测算法可能需要峰具有以下中的任一种或多种:最小面积、与模型峰和或统计学期望变化的符合性最小,以及与分离参数值相同(或基本上相同)的一或多个峰共洗脱。
本领域技术人员应了解,存在许多已知用于检测峰和/或事件的方法。在一个实例中,使用适合的拟合算法(例如最小二乘拟合)将形式
峰拟合的概述提供于《科学和技术(scienceandtechnology)》;第8章和第11章;第21卷,(1998);《色谱法中的数据分析和信号处理(dataanalysisandsignalprocessinginchromatography)》,attilafelinger编辑,所述文献以全文引用的方式并入本文中。事件或峰的分离(或洗脱)参数中心(例如上文所述)可以作为事件的一部分或根据峰检测算法确定。举例来说,《bmc生物信息学(bmcbioinformatics)》(2010年11月12日)中的yu和peng的“利用双高斯混合模型和统计学模型选择对不对称lc-ms峰进行定量和解卷积(quantificationanddeconvolutionofasymmetriclc-mspeaksusingthebi-gaussianmixturemodelandstatisticalmodelselection)”(所述文献以全文引用的方式并入本文中)提出了峰检测和随后通过将双高斯模型与xic拟合来确定峰中心(例如洗脱参数中心)。此类方法也是可以用于检测可以存在于相同质量迹线(或xic)中的多个峰的一个实例。鉴于此类事件检测算法在本领域中是众所周知的,所以本文中对它们将不进一步详细论述。
步骤620包括外推模块604,从而确定(或计算或以其它方式估计)质量迹线152的质量中心601。通过将质量迹线中的强度峰集合的m/z测量值向信号零(或零数目个离子)外推来测定质量601。以此方式,所测定的质量可以理解为将强度峰集合的实测质量向信号零(或零数目个离子)外推。质量601表示离子种类的m/z值,由其质谱生成质量迹线。因此,应了解,质量迹线152的所测定质量601有效地是质量迹线中检测到的组分离子(或片断组分离子)的m/z(或质量)值。用此方法测定的质量的正确性已通过对照实验证实,所述对照实验包括用质量过滤器过滤组分离子和用质量分析仪分析已分离组分离子的m/z值。
为了外推m/z测量值,步骤620可以包括对强度峰集合的m/z测量值和相应信号值进行回归分析(例如线性回归)。这可以通过将回归函数(或曲线)与强度峰的实测质量和信号值对拟合来进行。此类回归函数使m/z测量值与信号值关联。通过改变回归函数的一个或多个参数,可以将此回归函数与强度峰集合所提供的m/z测量值和相应信号值拟合。典型地,线性(或一阶多项式)函数可以用作回归函数。此类回归函数将采取以下形式:
m(s)=as b
其中m(s)是随信号s而变的m/z测量值,其中a和b是参数。然而应了解,任何适合的n次多顶式函数可以用作回归函数。可以使用的回归计算领域中存在许多众所周知的拟合技术,例如以下中的任一种:最小二乘拟合算法;最小绝对偏差算法;最大似然型估计等。由于回归分析(具体地说,线性回归)已众所周知,因此我们在本文中对其不进一步论述。
如将了解,上文所述的拟合必需的强度峰的最小数目依赖于回归函数。举例来说,可以将线性回归函数与两个或更多个强度峰拟合,将二阶多项式与三个或更多个强度峰拟合等等。在线性回归函数的情况下,已观察到5个或更多个(优选7个或更多个强度峰)提供特别可靠的结果。
以此方式,回归函数在信号零时的数值提供质量迹线已观察到的离子种类的质量测定值601。这可以称为回归函数(或曲线)的截距。信号零是与所观察到的离子种类的零价离子对应的信号值,所述离子种类是通过质谱仪130中的质量迹线观察。如应理解,质量分析仪所生成的信号值典型地是信噪比。然而,应了解,信号值可以其它方式表示,例如以下中的任一者:绝对信号值与背景噪声之间的差异、绝对信号与实测背景噪声对等。替代地,信号可以包括绝对强度和相应的背景噪声期望测量值(或估计值)。同样,应了解,信号零的数值可以取决于信号性质。举例来说,信号零的数值可以对应于质谱仪130的背景噪声期望值。替代地,信号零的数值可以(或基本上)等于零,等等。如下文将变得显而易见,所得经拟合的回归函数还可以作为步骤620的一部分提供。
如上文所论述,在一些情况下,强度本身与信号成比例。在此类情况下,强度值本身在外推时可以替代信号值使用。替代地,如上文所论述,在一些布置中,强度与信号始终不成比例。举例来说,在高离子强度下使用一些静电离子阱光谱仪时,只可以将特定的最大量的离子注入质量分析仪中。在高离子强度下,这典型地通过缩短注射时间来实现。因此,在高离子强度下,所得质量迹线中的强度峰是在离子数目恒定(或基本上恒定)的情况下产生,且因此报告这些强度峰的恒定(或基本上恒定)信噪比。
应了解,在一些实施例中,在此类情况下,强度峰集合可以只包括强度与信号成比例的那些强度峰。如果情况如此,则外推时,可以使用强度值替代信号值。
任选存在的步骤630可以包括利用外推模块604测定(或计算或以其它方式估计)所测定的质量601的置信度测量值。置信度测量值可以是(或包括)所测定质量的置信区间。置信度测量值可以是(或包括或基于)步骤620的回归分析的拟合优度量度。举例来说,置信度量度可以是回归函数在零强度时的数值的置信区间。
另外或替代地,任选存在的步骤630可以包括执行一项或多项品质测试,表明步骤620所测定的质量601是否能接受。品质测试可以基于m/z期望值方差(或再现性)来执行。应了解,对于未发生任何偏转的质量迹线152来说,期望质量迹线152的强度峰存在m/z测量值方差。此类方差可以归因于质谱仪的测量误差,所述测量误差起因于质谱仪130得到的m/z测量值的精度有限。m/z期望值方差可以基于理论估计值、基于质谱仪130的精度和/或质谱仪的质量扫描中所用的参数来确定。m/z期望值方差可能与测量信号和测量条件相关。m/z期望值方差可以基于与所关注的质量迹线152相同的分离质谱学实验中所产生的其它质量迹线152来计算。下文即将提供计算m/z期望值方差的实例方法。
另一种品质测试可以基于对所研究的质量迹线的离子种类的质量的两个或更多个各别估计值进行的比较。各别估计值可以基于强度峰的相应子集。下文即将描述此类测试的实例。另一种品质测试是对通过线性回归所获得的标准差与所测定的质量相对于所测量的质量的观察偏差进行比较。如果观察偏差不高于线性回归的标准差的至少2倍(优选3倍),则对所测定的质量不赋予置信度。
一项或多项品质测试的结果可以作为一个或多个相应置信度值(或指示)通过步骤630输出。置信度值可以表明相应品质测试是否合格。因此,根据相应测试,每个置信度值可以表明质量601是否能接受。
任选存在的步骤635包括输出模块608生成经校正的质量迹线652。在任选存在的步骤630存在的情况下,经校正的质量迹线652可以独立于一项或多项品质测试来生成,表明质量601能接受。所述生成可以基于步骤620所提供的所得拟合回归函数来执行。具体地说,作为所述生成的一部分,质量迹线152中的强度峰的m/z值发生位移,以便补偿上文所论述的质量偏转。具体地说,质量迹线152中的强度峰的m/z值可以设定成等于m/z测定值601。
替代地,所述生成可以包括使质量迹线152中的每个强度峰的m/z值根据经拟合的回归函数在所述强度峰的相应信号值时的数值进行位移。以此方式,可以理解回归函数与质量601的差异有效地从质量迹线152的峰(或强度峰的质量值)中扣除。
在存在超过一项品质测试的情况下,为了让生成的质量迹线152生成,所有测试或预定数目个测试或测试子集必需合格。
应了解,此类校正有利之处在于,其典型地使得所给定的质量迹线中的大部分(若非全部)偏转影响去除,同时仍然保持强度峰的m/z测量值的偏差,所述偏差起因于其它现象,例如仪器精度、环境影响等这意味着可以利用此类偏差的其它分析仍然可以执行,同时减少偏转并合效应所引入的任何误差。
在质量迹线152与单一质量中心测量值一起提供的实例中(例如在现有技术的质量迹线测量技术的情况下),单一质量中心测量步骤635可以包括仅校正单一质量中心测量值。这可以通过用步骤620测定的质量601置换质量中心测量值来实现。替代地,单一质量中心测量值可以基于信号零的拟合回归函数的质量值发生位移。
步骤640包括通过输出模块608提供所测定的质量601作为质量迹线152的m/z值。在任选存在的步骤630存在的情况下,所测定的质量601可以独立于置信度值提供,这表明质量601能接受。步骤640可以包括提供如果置信度测量和/或步骤630的品质测试指出步骤620所测定的质量不能接受则质量601不能接受(或不可靠)的指示。步骤640可以包括提供所测定的质量601的置信区间。步骤640可以包括提供经校正的质量迹线652作为输出。举例来说,可以向进一步处理模块170提供经校正的质量迹线652和/或所测定的质量601。
在以上论述中,使用图3a和3b中所论述的实例分析系统150生成质量迹线152。然而应了解,质量迹线152可以是通过已知的现有技术方法所鉴别的质量迹线152,如本文中此前所述。举例来说,分析系统150可以使用上文关于图1c所述的技术鉴别质量迹线。此类现有技术方法通常针对给定的分离事件提供强度相对于分离参数的质量迹线图。然而,应了解,利用此类质量迹线图能够从多个质谱132中鉴别出对应的强度峰集合,并且由此获得包括强度峰集合的质量迹线152。以此方式,方法600可以结合获得质量迹线的现有技术方法使用。
类似地,还应了解,上述方法600可以由分析系统150执行。举例来说,质量校正模块160可以是分析系统150的模块。
如将了解,上文关于图6a和6b阐述的系统和方法允许针对强度峰的实测质量因自动并合而引起的偏转(如关于图1d所述),对所得质量测定值进行补偿。这是相同洗脱化合物的离子片段在质谱仪中并合之处,由此引起片段离子中的一或两种的m/z测量值发生位移。上述系统和方法还适用于异质并合的形式,再次允许针对强度峰的实测质量的偏转,对所得质量测定值进行补偿。具体地说,在基本上同时洗脱的两种不同洗脱化合物的离子(或离子片段)在质谱仪中并合、由此引起离子(或离子片段)中的一种或两种的m/z测量值发生位移的情况下,所述系统和方法是适用的。
应了解,作为方法600的一部分,可以分析(或以其它方式检查)质量迹线152,以鉴别质量迹线152中是否存在质量偏转(例如并合)。如将了解,有许多方式可以鉴别此类偏转。举例来说,沿着质量迹线152的质量变化超过预定阈值可以鉴别出质量偏转。另外或替代地,质量迹线152中的质量的标准差超过预定阈值可以鉴别出质量偏转。典型地,标准差比量测结果可期望的值大(或多)三倍表明存在质量偏差;优选地,标准差比量测结果可期望的值大(或多)两倍表明存在质量偏差。在某些情况下,步骤620可以响应于质量迹线的质量偏转的鉴别来执行。举例来说,在未鉴别出质量偏转的情况下,所述方法可以在步骤620之前终止。
当然,应理解,可以在不分析的情况下对质量迹线执行方法600以鉴别质量迹线是否存在质量偏转。
图7示意性地示出了用于确定质量中心的置信度测量结果的不同步骤630,所述步骤可以结合方法600使用。
步骤710包括将强度峰集合分成强度峰的两个或更多个子集。步骤710中的分配可以基于对应于强度峰的分离事件。举例来说,强度峰集合可以基于事件的分离参数中心来分配。因此,强度峰的第一子集可以包括分离参数值小于(或小于或等于)分离参数中心的强度峰中的一些或全部(或由其形成)。类似地,强度峰的第二子集可以包括分离参数值大于(或大于或等于)分离参数中心的强度峰中的一些或全部(或由其形成)。
换句话说,集合中的强度峰可以对应于具有分离参数的起始值、分离参数的最终值和分离参数中心(或顶点)值的分离事件。第一子集然后可以包括分离参数值在起始值与分离参数中心值之间的情况下所测量的强度峰。第二子集可以包括分离参数值在分离参数中心值与最终值之间的情况下所测量的强度峰。
步骤720包括通过将第一子集的实测质量向信号零外推来确定离子种类的质量的第一估计值。
类似地,步骤730包括通过将第二子集的实测质量向信号零外推来确定离子种类的质量中心的第二估计值。
步骤720与步骤730均可以按照与步骤620相同的方式执行。以此方式,应了解,以上步骤620的论述类似地应用于步骤720,其中用离子种类的质量的第一估计值替代质量,且用强度峰第一子集中的强度峰集合替代强度峰集合。类似地,以上步骤620的论述类似地应用于步骤730,其中用离子种类的质量的第二估计值替代质量,且用强度峰第二子集中的强度峰集合替代强度峰集合。
步骤740包括基于质量的第一估计值与质量的第二估计值的比较来确定所测定的质量601的置信度值。如果质量的第一估计值与质量的第二估计值一致(或相同或在某一偏差范围内),则可以获得指示质量601能接受的置信度值。质量的第一估计值和质量的第二估计值如果它们彼此在预定阈值内(或如果它们的绝对差低于阈值),则可以确定为一致。阈值可以依赖于用于确定质量的第一估计值和/或质量的第二估计值的回归分析。阈值可以基于质量的第一估计值的标准差或另一种置信度量度,如通过相应的回归分析所确定。另外,或替代地,阈值可以基于质量的第二估计值的标准差(或另一种置信度量度),如通过相应的回归分析所确定。
另外或替代地,置信度值可以基于步骤720所得的质量的第一估计值的拟合回归函数(下文称为第一拟合回归函数)与步骤730所得的质量的第二估计值的拟合回归函数(下文称为第二拟合回归函数)的相似性来确定。置信度值可以基于第一拟合回归函数与第二拟合回归函数之间的差异的均方根值。举例来说,如果第一拟合回归函数与第二拟合回归函数之间的差异低于预定阈值,则可以获得指示质量601能接受的置信度值。类似地,如果第一拟合回归函数与第二拟合回归函数之间的差异高于预定阈值,则可以获得指示质量中心601不可接受的置信度值。应了解,两种函数之间的差异可以任何数目个不同适合方式计算,这些方式可以包含分开或组合的以下准则:偏差绝对值的均值、均方根偏差;中值偏差;预定信号值(例如信号零)时的差异;函数之间在斜率方面的差异;等等。典型地,标准差小于5ppm表示能接受的质量601。
在一个实例中,可以利用以下方案确定置信度值:
·第一拟合回归函数的范围rangeleft如下构建:rangeleft·=·[massleft·-·stdevl巳ft,·massleft· ·stdevleft],其中massleft是质量的第一估计值并且stdevleft是第一拟合回归函数与用于拟合的强度峰的第一子集中的强度峰的m/z测量值之间的标准差。
·第二拟合回归函数的范围rangeright如下构建:rangeright=·[massright-stdevright,massright stdevright],其中massright是质量中心的第二估计值并且stdevright是第二拟合回归函数与用于拟合的强度峰的第二子集中的强度峰的m/z值之间的标准差。
·如果rangeleft与rangeright重叠,则获得指示质量中心能接受的置信度值。否则,获得指示质量中心不能接受的置信度值。
应了解,基于第一与第二拟合回归函数的相似性计算置信度值受到特别的关注,其中事件是色谱峰,并且强度峰的偏转起因于与得自相同洗脱的具有不同m/z值的其它离子种类的相互作用。在此,存在一种强烈的期望,即偏转围绕保留时间中心是对称的。
在上文关于图6b所述的方法600的变化形式中,步骤620可以包括基于如上文关于步骤710所述的事件的分离参数中心分配强度峰集合。具体地说,可以将峰分配成强度峰的两个子集。强度峰的第一子集包括分离参数值小于(或小于或等于)分离参数中心的强度峰(或由其形成)。类似地,强度峰的第二子集包括分离参数值大于(或大于或等于)分离参数中心的强度峰(或由其形成)。以此方式,应理解,质量的测定可能涉及将一个子集的强度峰的m/z测量值向信号零外推。
当一个子集的强度峰是另一种化合物在所关注化合物洗脱之后或之前立即洗脱而引起的异并合的对象时,这可能特别有利。以此方式,外推可以利用强度峰的其它子集。这可以是有利的,原因在于就可能存在的自动并合来说,其允许补偿而不需要说明因其它化合物洗脱而引起的异并合。
可以基于质量迹线152的分离事件与其它化合物的分离事件的比较情况来选择外推所依据的子集。具体地说,典型地选择与其它化合物的分离事件具有最小重叠的子集。
替代地,可以对第一子集和第二子集进行相应的外推,产生相应的质量,可以步骤720和730的方式进行相应的外推。然后可以选择标准差最低的相应质量作为离子种类的质量。替代地,离子种类的质量可以选自包含以下的质量组:由强度峰的第一子集测定的相应质量和由强度峰的第二子集测定的相应质量和由包含两个子集的强度峰集合测定的质量。然后可以再次选择标准差最低的质量作为离子种类的质量。
图8示意性地示出了用于测定m/z期望值方差(或质量再现性)的方法800,例如可以作为图6b的步骤630的一部分执行的方法。
步骤810包括从质谱仪产生的质谱132获得模型质量迹线152,作为给定样品101的分离/质谱学分析的一部分。模型质量迹线152典型地是包括超过预定阈值的多个强度峰且/或具有超过预定阈值的信号(或强度)的质量迹线152。典型地,在超过一个质量迹线152满足这些准则的情况下,选择具有大部分强度峰的质量迹线152作为模型质量迹线152。在一个实例中,作为模型质量迹线152,可以选择具有最大数目个强度峰、还具有大于20的中值(或绝对)信号(作为信噪比)的模型质量迹线152。在这个实例中,如果没有质量迹线152满足中值信号准则,则可以选择具有最高信号的质量迹线作为模型质量迹线。具体地说,可以选择具有最高信号的质量迹线作为模型质量迹线。
步骤820包括过滤模型质量迹线152以去除m/z值超出预定范围的强度峰。典型地,预定范围是以模型质量迹线152中的强度峰的平均m/z值为中心。范围宽度可以基于模型质量迹线152。举例来说,可以去除m/z测量值超过两个标准差而远离模型质量迹线152的平均m/z值的强度峰。
应了解,在基于模型质量迹线152确定范围的情况下,为了考虑到范围内的所引起变化,步骤820可以在强度峰去除时进行迭代。在此情况下,可存在迭代终止准则。可以重复执行步骤820,直至模型质量迹线中剩余的峰数目达到某一阈值为止。另外,或替代地,步骤820可以进行迭代,直至最后一次迭代去除的峰数目小于阈值为止。在任一或两种情况下,阈值可以基于模型质量迹线152的初始长度。
在一个特定实例中,步骤820可以进行迭代直至:
·模型质量迹线152中的强度峰的数目小于模型质量迹线152中最初存在的强度峰数目的一半;或
·步骤820的最近迭代中从模型质量迹线152去除的强度峰数目小于模型质量迹线152中最初存在的强度峰数目的5%。
步骤830包括计算经过滤的模型质量迹线152中的强度峰的m/z值的方差。
图9a展示了图1090,其包括实验质量迹线(a1)的强度峰的m/z测量值相对于保留时间(rt)的曲线图1092,和相同强度峰的信噪比相对于保留时间的曲线图1094。这些强度峰来源于使用qexactivetmhflc-ms/ms系统的实验,其中研究肽的电荷状态z=5的离子。此肽已通过消化蛋白质牛血清白蛋白来产生。图1090明显地展示了m/z测量值偏转与上文所论述的信噪比的相关性。
图9b展示了相同lc-ms/ms实验的强度峰的另一实验图900。实验图900是实验中的给定质量扫描的强度峰曲线图,其针对实测质量(经标记的准确质量)相对于保留时间绘制。每个强度峰在曲线图900上绘制为圆,圆的阴影与强度峰的强度成比例,圆颜色越深,则相应峰的强度越大。因此,正如能够见到的那样,强度峰的强度在约52.75的保留时间时逐渐趋向于最大值且随后逐渐地减弱。实验图900是根据上文所论述的图1d中的图197,并且图197的论述同样适用于实验图900(在此同样适用)。
图9b中还展示了此实验中在保留时间52.77生成的质谱132的质谱曲线图950。质谱曲线图950是根据上文所论述的图1b的质谱曲线图,且质谱曲线图的论述同样适用于在此同样适用的连续曲线图950论述。在连续曲线图950中,强度作为相对丰度展示。
连续曲线图900展示五个质量迹线a0;a1;a2;a3;a4。每个质量迹线包括强度峰集合。质量迹线a0;a1;a2;a3;a4在图上展示为对应质量迹线a0;a1;a2;a3;a4的相应加点边界线内部的强度峰集合。质量迹线a0;a1;a2;a3;a4已经使用上文关于图3到5所述的方法加以鉴别。标记为a1的峰对应于图9a的图1090中所绘制的强度峰。
正如能够见到的那样,质量迹线a0;a1;a2;a3;a4中的每一个对应于得自相同洗脱事件的相应离子。洗脱事件的保留时间中心是约52.75秒。质量迹线a2未展现实测质量的任何偏转。其它质量迹线a0;a1;a3;a4皆展示了实测质量向质量迹线a2的实测质量偏转。具体地说,从图900能够看出,实测质量的偏转随着所偏转强度峰的强度增加而增加。
图9c展示了图9b所示的质量迹线a1的强度峰的m/z值对强度曲线图970。图970中还展示了拟合回归函数975。拟合回归函数975已使用上文参照图6b所述的方法600生成。在此实例中,所用回归函数包括一阶多顶式。拟合回归函数975是通过使用最小二乘拟合算法获得,如上文关于方法600的步骤620所阐述。拟合回归函数975是:m(s)=-0.00002s 742.72409。在这种情况下,对应于零价离子的信号零是s=0。质量迹线a1的经校正的m/z值因此作为742.72409获得。
以此方式能够看出,质量迹线a1的最强强度峰的m/z值相对于使用本发明方法所获得的经校正的m/z值偏转约0.022μ,误差为30ppm。这超过现有技术中所采用的1-2ppm误差。因此,应了解,方法600使所报告的质量迹线a1的m/z值得到显著校正。
图9d展示了图9b和9c中所示的质量迹线a1的强度峰的m/z值对强度曲线图970。
在此,图9d中的强度峰已经根据上文关于图7所论述的方法处理。具体地说,图9d展示了强度峰已被分成第一子集(其中强度峰用点表示)和第二子集(其中强度峰用十字形表示)。在此实例中,第一子集包括和事件开始与事件的保留时间中心之间的保留时间对应的强度峰。第二子集包括和事件的保留时间中心与事件的终止之间的保留时间对应的强度峰。
图9d中还展示了与第一和第二子集分别拟合的第一拟合回归函数1072和第二拟合回归函数1074。两种回归函数都包括一阶多项式。第一拟合回归函数1072由m(i)=0.00002i 742.72409给定。第二拟合回归函数由m(i)=0.00002i 742.72416给定。正如能够见到的那样,m/z值的相应第一与第二估计值分别是742.72409和742.72416。这些值的一致性在0.07μ(或0.095ppm)内。
在以上描述中,已在m/z比率和强度和/或信号(具体地说,信噪比)方面论述质谱。然而应了解,质谱能够用多种不同方式表示,例如在质量和相对丰度、质量和强度、m/z比率和相对丰度等方面。以上论述同样适用于本领域中已知的表示质谱的任何其它方式。因此,技术人员将了解,本文中提及术语m/z的论述同样可以适用于术语质量,且反之亦然。
应了解,如上所述的分离装置110可以包括连接在一起的若干不同分离装置110。举例来说,然后可以将maldi装置所产生的物质流引入色谱仪中以便进一步分离,所得物质流提供到质谱仪130。
如上文阐述的,事件检测常常利用模型峰。虽然上文已基于分析模型对此加以描述,例如特定的峰形式(例如高斯分布),但是应了解此模型峰还可以用一系列样本表示。当质量迹线不符合某一简单模型、但是除按比例调整(且引起位移)之外“自相似”时,这可以是尤为方便的。当从质谱数据中收集模型峰信息时,这可以是尤为方便的。然后可以将平均峰形与已知模型的集合比较,适当时从中选择一个并且参数化。当发现系统形状不符合集合中的任一模型时,观察到的平均峰可以用一组样本表示。品质因数(例如测量点相对于正确按比例调整的取样模型峰的方差)的拟合方法和测定无显著差异。根据样本密度的偏差进行调整可能需要对取样的模型峰进行线性或更高阶的内插。
应了解,所述方法已展示为按特定次序执行的个别步骤。然而,技术人员将了解,这些步骤可以不同次序组合或执行,同时仍然获得所期望的结果。
将了解,可以使用多种不同处理系统来建构本发明的实施例。具体地说,尽管图和其论述提供了示例性的计算系统和方法,但这些仅为了在论述本发明的多个方面时提供有用参考而呈现。本发明的实施例可以在任何合适的数据处理装置(例如个人计算机、膝上型计算机、服务器计算机等)上执行。当然,出于论述的目的,对系统和方法的描述已经简化,且它们仅仅是可用于本发明实施例的许多不同类型的系统和方法之一。应了解,逻辑块之间的界限仅具说明性并且替代实施例可以合并逻辑块或元件,或可以将功能的替代分解应用于各种逻辑块或元件上。
应了解,上述功能可以作为硬件和/或软件、作为一个或多个对应模块建构。举例来说,上述功能可以作为由系统的处理器执行的一个或多个软件组件建构。替代地,上述功能可以作为硬件建构,例如一个或多个现场可编程栅极阵列(fpga),和/或一个或多个特殊应用集成电路(asic),和/或一个或多个数字信号处理器(dsp),和/或其它硬件布置。按照本文所含的流程图实施的或如上所述的方法步骤可以各自由对应的相应模块建构;按照本文所含的流程图实施的或如上所述的多个方法步骤可以通过单一模块建构在一起。
应了解,只要本发明的实施例由计算机程序建构,那么携载计算机程序的存储介质和传输介质形成本发明的方面。所述计算机程序可以具有一个或多个程序指令或程序代码,其当由计算机执行时执行本发明的实施例。如本文所用的术语“程序”可以是被设计成在计算机系统上执行的指令序列,并且可以包含子程序、功能、程序、模块、目标方法、目标实施方案、可执行应用程序、小程序、服务器小程序、源代码、目标代码、共享库、动态链接库,和/或被设计成在计算机系统上执行的其它指令序列。存储介质可以是磁盘(例如硬盘驱动器或软盘)、光学光盘(例如cd-rom、dvd-rom或蓝光盘),或存储器(例如rom、ram、eeprom、eprom、闪存或便携式/可拆卸存储装置)等。传输介质可以是通信信号、数据广播、两个或更多个计算机之间的通信链路等。
1.一种测量物质流中的离子种类的质量的方法,其中所述物质流是从分离装置中发射的随分离参数变化而变化的物质流,所述方法包括:
获得所述离子种类的质量迹线,其中所述质量迹线包含强度峰集合,每个强度峰提供由质谱仪测得的相应实测质量和相应信号;以及
将所述离子种类的所述质量作为所述质量迹线的所述强度峰集合的所述实测质量向信号零的外推来测定。
2.根据权利要求1所述的方法,其中所述测定步骤包括将回归函数对所述强度峰拟合,其中所述回归函数使实测质量与信号关联。
3.根据权利要求2所述的方法,其中所述回归函数是以下中的任一种:
线性函数;或
n阶多项式,其中n是大于1的整数。
4.根据权利要求2或权利要求3所述的方法,其中使用以下中的任一种,将所述回归函数对所述强度峰拟合:
最小二乘拟合;
最小绝对偏差算法;或
最大似然型估计。
5.根据前述权利要求中任一项所述的方法,其进一步包括:
将所述强度峰集合分成至少两个强度峰子集;
将所述离子种类的所述质量的第一估计值作为所述第一子集的所述实测质量向信号零的外推确定估计值;
将所述离子种类的所述质量的第二估计值作为所述第二子集的所述实测质量向信号零的外推确定;以及
基于所述第一估计值与所述第二估计值的比较,接受所述离子种类的所测定质量。
6.根据前述权利要求中任一项所述的方法,其中所述集合中的所述强度峰对应于具有分离参数的起始值、所述分离参数的最终值和所述分离参数的中心值的分离事件。
7.根据从属于权利要求5时的权利要求6所述的方法,其中所述第一子集包含在所述起始值与所述中心值之间的所述分离参数的值处测得的强度峰,并且所述第二子集包含在所述中心值与所述最终值之间的所述分离参数的值处测得的强度峰。
8.根据前述权利要求中任一项所述的方法,其中测定所述离子种类的所述质量的所述步骤是响应于鉴别所述质量迹线的偏转来执行。
9.根据前述权利要求中任一项所述的方法,其中所述获得步骤包含通过应用事件检测算法而从所述质量迹线的多个强度峰中鉴别出所述质量迹线的所述强度峰集合。
10.根据前述权利要求中任一项所述的方法,其中所述分离装置包含色谱仪并且所述分离参数是保留时间。
11.根据权利要求1到9中任一项所述的方法,其中所述分离装置包含质谱成像装置并且所述分离参数表示向所述质谱成像装置提供的样品的表面位置。
12.根据前述权利要求中任一项所述的方法,其进一步包括基于所述离子种类的所测定质量,生成所述离子种类的经校正的质量迹线。
13.根据前述权利要求中任一项所述的方法,其中获得质量迹线的所述步骤进一步包括:
接收通过分析质谱仪中的所述物质流而生成的质谱数据,其中所述质谱数据包含多个针对所述分离参数的相应值各自获得的质谱;
从所述多个质谱中鉴别根据所述分离参数排序的三个或更多个强度峰的序列,其中所述鉴别三个或更多个强度峰的所述序列包括:
按照初始实测质量并且针对所述强度峰序列的每一个其它强度峰来选择初始强度峰,
基于所述强度峰序列中的相邻强度峰的至少实测质量来选择所述强度峰。
14.根据前述权利要求中任一项所述的方法,其中通过运行所述质谱仪来获得所述离子种类的所述质量迹线。
15.装置,其布置成实施根据权利要求1到14中任一项所述的方法。
16.计算机可读介质,存储指令,所述指令由处理器执行时,促使所述处理器实施根据权利要求1到14中任一项所述的方法。
技术总结