本发明涉及生物医药领域,具体涉及一种对梭杆菌进行分子检测或对其菌种水平分类鉴定的方法。
背景技术:
梭杆菌属(fusobacterium)是一类严格厌氧的革兰阴性细菌,是人类共生菌,通常定植在口腔。一些梭杆菌菌种为条件致病菌,在某些情况下可引起牙周炎等口腔疾病。梭杆菌也可引起身体其他部位的感染。近期研究表明,梭杆菌还与结直肠癌的发生发展相关。16srrna基因测序表明,结直肠患者粪便中梭杆菌的丰度较正常人显著升高;而细胞和小鼠实验亦表明,梭杆菌的代表性菌种具核梭杆菌,可促进结直肠癌的发生发展,并诱发化疗耐药。因此对梭杆菌的检测具有十分重要的临床价值。
梭杆菌已知有18个菌种,其中具核梭杆菌又分为4个亚种,而目前常用的检测方法对微生态标本(例如粪便)中梭杆菌的检测尚难以精确到菌种水平。16srrna基因测序仅能达到“属”水平的分辨率;宏基因组虽然能够测得更为完整的序列信息,但其成本高昂,数据分析复杂,亦无法完全确保菌种水平的分类鉴定。以结直肠癌为例,目前结直肠癌患者肠道菌群中梭杆菌的菌种组成结构尚不清晰,虽然研究证实代表性菌种具核梭杆菌可促进结直肠癌的发生发展,但当前研究都依赖于口腔来源的标准株,而非肿瘤原位分离的梭杆菌分离株,其代表性尚有待于验证。尽管有研究建立了具核梭杆菌的qpcr定量方法,并基于此证实具核梭杆菌与结直肠癌密切相关,但所用引物并非对具核梭杆菌特异,仍对其他种的梭杆菌有非特异性扩增,无法排除其他菌种的干扰。因此目前尚缺乏有效的微生态样本中梭杆菌的分子检测及其菌种水平分类鉴定方法。
技术实现要素:
本发明为了克服现有技术的缺陷,提供一种对梭杆菌进行分子检测或对其菌种水平分类鉴定的方法,该方法主要适用于不同类型的微生态样本,此外也适用于单一菌株样本,可对样本中梭杆菌菌群的组成进行种水平,甚至亚种水平的分类鉴定。
为实现上述目的,本发明采用如下技术方案:
本发明提供了一种对梭杆菌进行分子检测或对其菌种水平分类鉴定的方法,以rpob基因作为梭杆菌的检测和分类鉴定靶标,其包括如下步骤:
步骤一,对样本的基因进行扩增;
步骤二,对扩增子进行高通量测序和比对分析序列,所得数据按100%一致性建立操作分类单元(otu);
步骤三,将步骤二所得otu序列与梭杆菌全基因组中的特征序列片段所对应的序列比对,剔除无相似性的非特异otu序列后,共同建立进化树,按进化关系注释各otu对应的菌种,实现样本中梭杆菌群体的分类鉴定,以及不同菌种的丰度定量。
进一步地,步骤一中的扩增引物序列如下所示:
fuso-rsub-f2:gcctcattttytdgarttycaatt(seqidno.4);
fuso-rsub-r2:acdactctttchgchccattkat(seqidno.5)。
进一步地,步骤三中的特征序列为rpob基因多序列比对结果中的长度在300bp-500bp之间、两端均为15bp-50bp的保守序列、中间为可变区的片段。
进一步地,步骤三中的特征序列如seqidno.3所示。
进一步地,丰度定量是根据梭杆菌属整体在样本中的定量和不同梭杆菌菌种在梭杆菌属中的定量计算得到的,即梭杆菌属丰度在菌群中所占百分比乘以某梭杆菌菌种在梭杆菌属中所占百分比。梭杆菌属丰度在菌群中所占百分比可通过其他常用方式测定,如定量pcr、16srrna基因扩增子测序或宏基因组测序。
与现有技术相比,本发明采用上述技术方案具有以下有益效果:
本发明采用的扩增引物对梭杆菌具有特异性,非目标特异性扩增少;扩增产物片段小,在300bp-500bp之间,满足扩增子测序需求;扩增片段为rpob基因的可变区,序列具有菌种特异性,可用于菌种分类鉴定。
本发明提供的一种对梭杆菌进行分子检测或对其菌种水平分类鉴定的方法,结合高通量测序技术,对特异性引物扩增后所得的扩增子序列进行测定,通过构建进化树的方法对样本中的梭杆菌菌种甚至亚种进行鉴别,有助于揭示微生态样本中梭杆菌属的菌种水平结构组成。
附图说明
图1为本发明一实施例基于rpob全长序列和rpob_subregion_3所对应序列所建立的进化树;
图2为本发明一实施例中梭杆菌单一分离株和临床样本基于本发明提供的引物的扩增结果图;
图3为本发明一实施例中梭杆菌阳性样本中的梭杆菌菌种/亚种结构的柱状图;其中,“subsp”标识的为具核梭杆菌的亚种,“sp”标识的为尚未命名的梭杆菌菌种。
具体实施方式
本发明提供了一种对梭杆菌进行分子检测或对其菌种水平分类鉴定的方法,以rpob基因作为梭杆菌的检测和分类鉴定靶标,其包括如下步骤:
步骤一,对样本的基因进行扩增;
步骤二,对扩增子进行高通量测序和比对分析序列,所得数据按100%一致性建立操作分类单元(otu);
步骤三,将步骤二所得otu序列与上述梭杆菌全基因组中的特征序列片段所对应的序列比对,剔除无相似性的非特异otu序列后,共同建立进化树,按进化关系注释各otu对应的菌种,实现样本中梭杆菌群体的分类鉴定,以及不同菌种的丰度定量。
在一优选的实施方式中,步骤一中的扩增引物序列如下所示:
fuso-rsub-f2:gcctcattttytdgarttycaatt(seqidno.4);
fuso-rsub-r2:acdactctttchgchccattkat(seqidno.5)。
进一步地,步骤三中的特征序列为rpob基因多序列比对结果中的长度在300bp-500bp之间、两端均为15bp-50bp的保守序列、中间为可变区的片段。
进一步地,步骤三中的特征序列如seqidno.3所示。
上述“以rpob基因作为梭杆菌的检测和分类鉴定靶标”的确定过程为:从ncbi基因组数据库下载梭杆菌属菌株的全基因组测序数据,采用jspecies软件计算各基因组之间的anib值(即averagenucleotideidentityusingblast,基于blast的平均核苷酸序列一致性)。anib值是一种评价菌株亲缘性的指标,一般认为≥95即同属一种(species)。然后根据anib值校正数据库中种名标识错误的菌株,统一种水平分类标准,最终确定各基因组在种水平的分类。其中,具核梭杆菌为亚种水平分类;fusobacteriumnaviforme与其它梭杆菌亲缘关系均较远,本发明未予以考虑;不满足refseq标准的基因组本发明未纳入分析。进而,从各基因组中提取rpob基因完整序列,经muscle软件多序列比对后用mega软件建立进化树,确定rpob基因适用于梭杆菌菌种/亚种分类。
上述扩增引物和特征序列的确定过程如下:
(1)在rpob基因多序列比对结果中查找长度在300bp-500bp之间、两端均为15bp-50bp的保守序列、中间为可变区的片段,共发现3段符合要求的片段,其在fusobacteriumnucleatumsubsp.nucleatumatcc23726菌株中对应的序列为(因序列存在多态性,无法穷举,这里只列出代表性参照序列):
>rpob_subregion_1
gattctcactatggaagaatctgtccaatagaaacaccagaaggaccaaacattgggcttattgggtcgcttgctacttatgctaagattaataaatatggatttattgaaactccttatgtaaaagtagaaaatggagtagcattagtagatgatgttcgttatcttgctgctgatgaagaagatggattgtttatagcccaagcagatactaaacttgataaaaataataagttacaaggtttagtagtttgtagatatggtcatgaaattgttgaaatagaacctgaaagagtaaactatatggatgtttctcctaaacaagttgtatctgtatcagcaggacttatcccattcttagaacatgatgatgccaacagagcattaatgggatcaaacatgcaaagacaagc(seqidno.1);
>rpob_subregion_2
atgggatcaaacatgcaaagacaagctgtacctttattaaagtcagaagctcctttcataggaacagggcttgaaagaaaagttgcagtagactcaggtgcagtagtaactacaaaagtatcaggaaaagttacttatgtagatggtaaaaaaataataattgaagataaagataaaaaagaacatatatacagacttttaaactatgaaagatctaaccaatcaatgtgtttacatcaaacacctttggtagatttaggagataaagtaaaaactggagatataattgcagatggacctgctacaaagctaggagatttatcattaggaagaaatattcttatgggatttatgccttgggaaggatataactatga(seqidno.2);
>rpob_subregion_3
atgcctcattttcttgaattccaattaaattcttatgaagattttttacaaactaatatgtcacctaacaaaagggaagaaaagggatttgaattagcattcaaagagatattcccaatagaatcttcaaatggagatgtaaggctagaatatataggatatgaattacatgaagcagaagcaccattgaatgatgagcttgaatgtaaaaaaagaggaaaaacgtattctaattcattgaaagttagattaagacttataaacaaaaaaatgggaaatgaaatccaagaatctttggtatattttggagaagtccctaaaatgactgatagagcaacatttataataaatggagctgaaagagttgt(seqidno.3)。
(2)经mega建树分析,梭杆菌菌株中上述3个片段对应的区域均可反映种间进化差异,与全长rpob的进化树类似。之后,将3个片段在ncbi数据库中比对发现rpob_subregion_3所对应的区域对梭杆菌更具有特异性,适用于梭杆菌检测。rpob_subregion_1和rpob_subregion_2所对应序列虽未用于梭杆菌检测,但仍可用于梭杆菌分类鉴定。
(3)最终,基于rpob_subregion_3片段设计通用引物,具体地,引物是基于rpob_subregion_3片段所对应序列的两端保守区域设计。
此外,若样本为单一菌体,除采用上述测序方法外,还可通过一代测序方法获得扩增子序列,并依据上述方法进行菌种鉴定。
下面通过具体实施例对本发明进行详细和具体的介绍,以使更好的理解本发明,但是下述实施例并不限制本发明范围。
实施例一
本实施例提供上述对梭杆菌进行分子检测或对其菌种水平分类鉴定的方法在已测序基因组中的应用。
从ncbi基因组数据库下载梭杆菌属菌株的全基因组测序数据,并根据全基因组之间的anib值校正数据库中种名标识错误的菌株。其中,具核梭杆菌为亚种水平分类;fusobacteriumnaviforme和不满足refseq标准的基因组未纳入分析。进而,从各基因组中提取rpob基因完整序列和rpob_subregion_3所对应片段,分别经muscle软件多序列比对后用mega软件建立进化树。
如图1所示,说明rpob_subregion_3所对应片段可在种水平对梭杆菌进行区分,分类效果与rpob全长序列类似。
实施例二
本实施例检测如seqidno.4~seqidno.5所示的引物在梭杆菌单一分离株和临床样本中的扩增特异性。
由于本发明提供的引物序列存在兼并碱基,需对同属中不同梭杆菌种都存在有效扩增,因此采用不同梭杆菌菌株检测其通用性。同时也检测了从结直肠癌患者粪便标本中提取的dna是否有阳性扩增。
如图2所示,本发明提供的引物在不同梭杆菌单一分离株中均得到特异的、片段长度均一的明亮条带,充分验证了引物良好的通用性。而在粪便标本中,也可扩获得特异的、片段长度均一的条带,且在以人血dna为模板的负控制中为阴性扩增,说明引物特异性较好。
实施例三
本实施例提供上述方法在在20例结直肠癌患者粪便中的应用,以验证方法的可靠性。
收集了20例原发结直肠癌患者的术前粪便,按本发明的方法进行扩增子测序,并分析数据。
如图3所示,共在12例样本中检测出了梭杆菌的存在,在这些标本中,扩增测序所得96%的read(测序片段)为梭杆菌属特异性的目标序列,仅有4%的read为非特异性序列。所得序列可合并为18个otu,分属16个梭杆菌种/亚种,其中8个为已知,8个为未知。分析各样本中梭杆菌组成发现,这些患者粪便中梭杆菌群体中通常由某一特定菌种占优。因此本发明提供的方法可更加精细地观察微生态样本中梭杆菌群体的结构组成。
以上对本发明的具体实施例进行了详细描述,但其只作为范例,本发明并不限制于以上描述的具体实施例。对于本领域技术人员而言,任何对本发明进行的等同修改和替代也都在本发明的范畴之中。因此,在不脱离本发明的精神和范围下所作的均等变换和修改,都应涵盖在本发明的范围内。
序列表
<110>上海市第十人民医院
<120>一种对梭杆菌进行分子检测或对其菌种水平分类鉴定的方法
<160>5
<170>siposequencelisting1.0
<210>1
<211>413
<212>dna
<213>artificialsequence
<400>1
gattctcactatggaagaatctgtccaatagaaacaccagaaggaccaaacattgggctt60
attgggtcgcttgctacttatgctaagattaataaatatggatttattgaaactccttat120
gtaaaagtagaaaatggagtagcattagtagatgatgttcgttatcttgctgctgatgaa180
gaagatggattgtttatagcccaagcagatactaaacttgataaaaataataagttacaa240
ggtttagtagtttgtagatatggtcatgaaattgttgaaatagaacctgaaagagtaaac300
tatatggatgtttctcctaaacaagttgtatctgtatcagcaggacttatcccattctta360
gaacatgatgatgccaacagagcattaatgggatcaaacatgcaaagacaagc413
<210>2
<211>377
<212>dna
<213>artificialsequence
<400>2
atgggatcaaacatgcaaagacaagctgtacctttattaaagtcagaagctcctttcata60
ggaacagggcttgaaagaaaagttgcagtagactcaggtgcagtagtaactacaaaagta120
tcaggaaaagttacttatgtagatggtaaaaaaataataattgaagataaagataaaaaa180
gaacatatatacagacttttaaactatgaaagatctaaccaatcaatgtgtttacatcaa240
acacctttggtagatttaggagataaagtaaaaactggagatataattgcagatggacct300
gctacaaagctaggagatttatcattaggaagaaatattcttatgggatttatgccttgg360
gaaggatataactatga377
<210>3
<211>368
<212>dna
<213>artificialsequence
<400>3
atgcctcattttcttgaattccaattaaattcttatgaagattttttacaaactaatatg60
tcacctaacaaaagggaagaaaagggatttgaattagcattcaaagagatattcccaata120
gaatcttcaaatggagatgtaaggctagaatatataggatatgaattacatgaagcagaa180
gcaccattgaatgatgagcttgaatgtaaaaaaagaggaaaaacgtattctaattcattg240
aaagttagattaagacttataaacaaaaaaatgggaaatgaaatccaagaatctttggta300
tattttggagaagtccctaaaatgactgatagagcaacatttataataaatggagctgaa360
agagttgt368
<210>4
<211>24
<212>dna
<213>artificialsequence
<400>4
gcctcattttytdgarttycaatt24
<210>5
<211>23
<212>dna
<213>artificialsequence
<400>5
acdactctttchgchccattkat23
1.一种对梭杆菌进行分子检测或对其菌种水平分类鉴定的方法,其特征在于,以rpob基因作为梭杆菌的检测和分类鉴定靶标,其包括如下步骤:
步骤一,对样本的基因进行扩增;
步骤二,对扩增子进行高通量测序和比对分析序列,所得数据按100%一致性建立otu;
步骤三,将步骤二所述otu序列与梭杆菌全基因组中的特征序列片段所对应的序列比对,剔除无相似性的非特异otu序列后,共同建立进化树,按进化关系注释各otu对应的菌种,实现样本中梭杆菌群体的分类鉴定,以及不同菌种的丰度定量。
2.根据权利要求1所述的对梭杆菌进行分子检测或对其菌种水平分类鉴定的方法,其特征在于,步骤一中所述扩增引物序列如seqidno.4~seqidno.5所示。
3.根据权利要求1所述的对梭杆菌进行分子检测或对其菌种水平分类鉴定的方法,其特征在于,步骤三中所述特征序列为rpob基因多序列比对结果中的长度在300bp-500bp之间、两端均为15bp-50bp的保守序列、中间为可变区的片段。
4.根据权利要求3所述的对梭杆菌进行分子检测或对其菌种水平分类鉴定的方法,其特征在于,步骤三中所述特征序列如seqidno.3所示。
5.根据权利要求1所述的对梭杆菌进行分子检测或对其菌种水平分类鉴定的方法,其特征在于,所述丰度定量是根据梭杆菌属整体在样本中的定量和不同梭杆菌菌种在梭杆菌属中的定量计算得到的。
技术总结