本发明涉及生物技术领域和基因工程技术领域,具体为通过crispr系统对整合目的蛋白基因产生突变文库,筛选目标蛋白的方法。
背景技术:
分子的定向进化技术通过突变、重组和筛选编码基因,模拟加快自然界缓慢的进化过程从而优化或者创造全新功能的蛋白质,促进了蛋白质工程的快速发展,在工业酶、药物蛋白的活性、稳定性、代谢途径等优化方面有着广泛应用。分子进化的策略主要有定点突变(site-directedmutagenesis)、易错pcr(error-pcr)、dna改组(dnashuffling)、随机引导重组(randompriminginvitrorecombination,rpr)和交错延伸(staggeredextensionprocess,step)等,结合高通量的定向筛选方法如细胞表面展示、流式分选等,快速灵敏的将理想的蛋白筛选出来。但是这些方法仍然存在局限并且过程繁琐,成本高、周期较长,从而开发新的定向进化技术意义重大。
crispr系统作为功能强大的基因编辑器,自发现后,快速发展,并得到应用广泛。通过sgrna的靶向作用,将cas9核酸酶带向特定位点,并对核酸序列进行剪切,利用机体的修复途径,在目标序列上删除、插入、替换碱基,或者利用失去核酸酶功能的cas9(dcas9)结合其他功能蛋白在靶向位点发挥作用,从而达到编辑、修饰、调节目的基因的目的。crispr技术已经在人类、老鼠、斑马鱼、植物、酵母、线虫、细菌等众多生物体中得到应用,并在疾病诊断与治疗方面有着巨大潜力。
本领域公知,通过不同方法建立多样性的蛋白序列文库是分子进化的基础和关键所在。
技术实现要素:
本发明旨在通过crispr系统对整合目的蛋白基因产生多样性突变文库,用于理想蛋白的筛选的方法。
本发明利用crispr系统的靶向以及切割的功能,或者结合其他核酸修饰功能蛋白如胞嘧啶脱氨酶、腺苷脱氨酶等,对目标序列进行切割、修饰,再通过细胞体内内源性或者改造过的dna修复功能途径,自发产生多样化突变,可循环地形成文库,用于筛选。本发明在此基础上完成。
本发明提供了一种基于crispr系统产生蛋白序列多样性筛选文库的方法,括以下步骤:
构建crispr系统质粒和含目的蛋白基因表达元件的质粒;
目的蛋白基因表达元件整合细胞基因组,得到表达目的蛋白基因的细胞株;
转化crispr系统质粒,诱变产生蛋白序列多样性筛选文库;
定向筛选目标蛋白。
其中,crispr系统质粒是表达cas9或dcas9蛋白以及sgrna系统的质粒,例如,是与胞嘧啶脱氨酶或者腺苷脱氨酶的联合系统。
本发明的crispr系统是包括除能识别pam序列“ngg”以外,具有更好兼容性的crispr系统。
本发明中,所述的含目的蛋白基因表达元件的质粒是具有完整的蛋白表达元件并且可以用于外源基因整合基因组的质粒。
所述的目的蛋白基因表达元件整合细胞基因组,是指利用含目的蛋白基因表达元件的质粒,通过合适的整合方法将外源基因整合到相应细胞基因组上。
所述的表达目的蛋白基因的细胞株,是成功表达外源基因的阳性细胞株。
所述的crispr系统质粒的转化是指将靶向基因序列的crispr系统质粒导入所述的表达目的蛋白基因的细胞株。
所述的诱变产生多样性突变文库,是指通过crispr系统质粒的导入与crispr系统的表达,靶向切割或者修饰整合基因序列,细胞通过不同的修复途径修复基因序列从而产生不同突变,形成蛋白序列多样性筛选文库。
所述的目标基因的定向筛选,是通过细胞表面展示及磁珠富集或者流式分选技术,从所得文库中筛选富集出目标蛋白的细胞。
本发明中,可以循环性诱导并筛选蛋白序列多样性文库,直至目标蛋白的产生。所述的循环性诱变新突变文库的产生是指通过新一轮crispr系统质粒的转化继续新蛋白序列多样性筛选文库的产生。
在本发明的一个实施例中,上述基于crispr系统产生蛋白序列多样性筛选文库的方法是通过下述步骤实现的:
1、crispr系统质粒的构建与含目的蛋白基因表达元件的质粒构建:
1)本发明所述的crispr系统质粒是指可以表达cas9或dcas9蛋白以及sgrna系统的质粒,包括与其它核酸修饰蛋白如胞嘧啶脱氨酶、腺苷脱氨酶等的联合系统;crispr系统质粒可以是除能识别pam序列“ngg”外,具有识别更宽pam序列兼容性的crispr系统;crispr系统质粒可以根据基因序列设计多个靶向sgrna;
2)本发明所述的目的蛋白基因表达元件的质粒是指具有完整的基因蛋白表达元件,并且可以用于外源基因整合基因组的质粒;
2、目的蛋白基因表达元件整合细胞基因组,得到含有并可以表达目的蛋白基因的细胞株:
1)本发明所述的含目的蛋白基因表达元件的质粒是指具有完整的蛋白表达元件,并且可以用于外源基因整合基因组的质粒;
2)本发明所述的目的蛋白基因表达元件整合细胞基因组是指利用上述中所表述的含目的蛋白基因表达元件的质粒,通过合适的整合方法将外源基因整合到相应细胞基因组上;
3)本发明所述的得到含有并可以表达目的蛋白基因的细胞株只是通过合适的筛选方法筛选得到成功整合外源目的基因的阳性细胞株;
3、crispr系统质粒的转化,诱变多样性突变文库的产生:
1)本发明所述的crispr系统质粒的转化是指将靶向基因序列的crispr系统质粒导入上述中所表述的含表达目的蛋白基因的细胞株;
2)诱变产生多样性突变文库是指通过crispr系统质粒的导入与crispr系统的表达,靶向切割或者修饰整合蛋白基因序列,细胞通过不同的修复途径修复基因序列从而产生不同突变,形成蛋白序列多样性筛选文库;
4、目标基因的定向筛选:
本发明所述的目标基因的定向筛选是指通过合适的筛选方法,如细胞表面展示及磁珠富集或者流式分选等,对多样化突变文库进行筛选,富集出目标蛋白的细胞;
5、循环性诱变新基因突变文库的产生:
本发明所述的循环性诱变新基因突变文库产生是指通过转化新一轮的crispr系统质粒,诱变产生新蛋白序列多样性筛选文库,循环筛选。
本发明提供一种简便灵活的方法对整合的外源蛋白基因序列定向编辑产生多样性文库,用于目标蛋白的后续筛选。本发明利用crispr系统的靶向以及切割的功能,或者结合其他核酸修饰功能蛋白如胞嘧啶脱氨酶、腺苷脱氨酶等,对目标序列进行切割、修饰,再通过细胞体内内源性或者改造过的dna修复功能途径,自发产生多样化突变,可循环地形成文库,用于筛选,具有操作灵活简单、周期短、成本低的特点。
附图说明
图1.实验流程图。其中,图1a是总流程图,图1b是在无压力选择培养基中cas9表达水平的westernblot检测。
图2.细胞分选设置和结果图。其中,(a)初始抗体p2g12(parent)、阴性对照(pml107)及t1s1分选前细胞群(pre-sortingt1s1)的流式分析及设门。
(b)t2s4分选后细胞群的流式分析。
图3.序列鉴定与亲和力的检测图。其中,图3a:抗体cdr3区序列鉴定;b:流式检验两个抗体整合酵母菌株的pd1抗原结合能力;c:elisa测定两个抗体亲和力;d:bli测定抗体kd值。
图4:两次诱导文库的分析检测图。pre-sortedt1s1指第一次突变第一次分选前文库ngs不同突变克隆数;pre-sortedt2s1第一次突变第一次分选前文库的不同突变克隆数。
图5是crispr质粒及抗体展示质粒信息图。
图6是含基因表达元件的质粒图谱。
图7是质粒puc-homo-xi-2-p2g12其完整结构图示。
具体实施方式
下面的实例是对本发明利用cripsr系统对整合的目的蛋白基因产生序列多样性筛选文库,用于理想蛋白筛选的进一步举例说明。
方法与步骤:
利用cripsr系统对整合的抗体产生多样性突变文库,用于高亲和力目标抗体的筛选:
(一)本实例所采用的crispr质粒及抗体展示质粒信息如下:
1)本实例采用的crispr质粒为plm107(addgene#67639),用于酵母系统,其为leu筛选标记,组成型表达表达cas9和sgrna,将靶向sgrna序列插入酶切位点swai和bcli之间,其谱图如图5:
2)本实例采用的含基因表达元件的质粒,为抗体表面展示质粒pyd-scfv-p2g12:
a)初始质粒载体为pyd1,用于酵母展示系统,trp筛选标记,gal1启动子启动下游抗体基因的表达,c端表达标签c-myc以及aga2基因,用于表面展示,具体图谱如图6:
b)本实例采用的是单链抗体(scfv)形式的抗体基因,由轻链可变区(vl)以及重链可变区(vh)以及(gly4ser)3(连接肽gs)连接组成。具体抗体基因为人程序死亡受体-1(pd1)的特异性抗体序列,其重链可变区(vh)相关信息如下:
vh区碱基序列:高亮部分为cdrh3区(seqidno1):
gaggtgcagctggtgcagtctgggggaggcttggtacagcctggggggtccctgagactctcctgtgcagcctctggattcaccttcagtagctatagcatgaactgggtccgccaggctccagggaaggggctggagtgggtctcagctattagtggtagtggtggtagcacatactacgcagactccgtgaagggccgattcaccatctccagagacaattccaagaacacgctgtatctgcaaatgaacagcctgagagccgaggacacggctgtgtattactgtgcgagagatccctatggttcggggagttattatagaggggatgcttttgatatctggggccaagggacaatggtcaccgtctcctca
c)本实例针对人程序死亡受体-1(pd1)特异性抗体重链cdrh3可变区序列设计的sgrna靶向序列,并克隆进pml107质粒中,sgrna靶向序列(seqidno2)信息如下(5’-3’):高亮区为pam(ngg)
tactgtgcgagagatccctatgg
tgcgagagatccctatggttcgg
gcgagagatccctatggttcggg
cgagagatccctatggttcgggg
ccctatggttcggggagttatta
cctatggttcggggagttattat
ggttcggggagttattatagagg
gttcggggagttattatagaggg
ttcggggagttattatagagggg
gaggggatgcttttgatatctgg
aggggatgcttttgatatctggg
(二)本实例所采用的细胞菌株以及相关试剂如下:
1)酵母菌株eby100,其基因型为mataaga1::gal1-aga1::ura3ura3-52trp1leu2-delta200his3-delta200pep4::his3prb11.6rcan1gal
2)相关培养基:
ypad完全培养基
sd/-trp选择培养基
sd/-leu选择培养基
ypg诱导培养基
(三)本实例利用酵母细胞的同源重组将抗体基因表达元件scfvp2g12整合酵母细胞eby100基因组,得到菌株eby100-scfv-p2g12,过程如下:
1)将pml107质粒的leu筛选标记替换为trp1的筛选标记,并将基因组整合位点xi-2的sgrna靶向序列(5’-ctctcgaagtggtcacgtgc-3’,seqidno3)插入相应酶切位点,得到pml107-trp-xi-2质粒;
2)从eby100的基因组中用pcr方法扩增xi-2整合位点的上下游500bp同源臂序列。并从质粒pyd-scfv-p2-g12中将含有gal1启动子,c-myc标签蛋白、终止子等完整p2g12scfv抗体表达元件扩增后,再插入到上述上下游同源臂中,连接入puc19质粒后得到donor质粒puc-homo-xi-2-p2g12其完整结构图示如图7:
3)将1ug质粒pml107-trp-xi-2以及1ug扩增于puc-homo-xi-2-p2g12的pcrdonor产物,转化酵母细胞eby100,用sd/-trp选择培养基筛选得到阳性克隆,即为含有表达展示抗体元件的细胞株eby100-p2-g12,用于后续实验。
(四)本实例中crispr系统质粒的转化,诱变多样性突变文库的产生过程如下:
1)将针对抗体p2g12scfvcdrh3区的各pml107sgrna质粒分别转化酵母细胞株eby100-p2-g12,在sd/-leu平板上30℃培养直至克隆长出;
2)将所得所有克隆收集混合后即为新p2g12scfv抗体文库。
(五)本实例中目标基因的定向筛选过程如下:
1)将p2g12scfv抗体文库展示酵母细胞表面:
a)新p2g12scfv抗体文库在sd/-leu液体培养基中37℃过夜扩大培养,以去除死细胞;
b)取至少1×108个细胞于50ml离心管中,3000rpm,5min,去上清,细胞重悬于ypg诱导培养基使od600至0.1,在20℃,200rpm孵育36h);
2)利用流式分选富集高亲和力抗体:
a)将上述诱导的文库细胞离心,14000g,离心30s,弃上清;
b)细胞重悬于1mlpbsf缓冲液(即含1g/lbsa的1×pbs溶液)中;
c)用生物素标记的抗原pd1冰上孵育细胞30min,冰上放置—分钟(后续实验于冰上操作);
d)4℃,14000g,离心30s,弃上清
e)细胞重悬于500ulpbsf缓冲液中,洗两次;
f)加入被稀释的二抗,避光冰浴30min后离心,用预冷pbsf缓冲液冲洗两次;
g)重悬细胞于适量缓冲液中,冰上避光放置直至流式细胞仪分选;
h)将分选后所得细胞加入ypd培养基中培养24h,再换至ypg培养基中诱导生长约36h后,进行第二轮流式细胞仪分选;
i)将两轮分选后所得细胞重悬于ypd培养基中,取菌液涂于ypd平板培养基中孵育;其余分选所得细胞进行扩大培养,可进行下一轮sgrna质粒转化得到新抗体文库,重复以上步骤。
j)从生长有独立菌落的平板培养基上,挑单克隆进行测序鉴定。
(六)循环性诱变新基因突变文库的产生:
将上述分选富集后的酵母细胞于ypd培养基中转接扩大培养,质粒发生丢失,大部分细胞不再表达cas9后,再重复上述(四)、(五)、(六)步骤,直至理想亲和力抗体的出现;
实施例1文库的制备和cas9的检测
具体的实验流程如图1a所示。最初,为了避免两个或者多个sgrna靶点之间诱导的大片段删除,不同的sgrna质粒分别转染表达scfv抗体的酵母菌株。所有的转化子在平板上筛选之后,收集克隆,在液体培养基中扩大形成分选前文库。再在含有半乳糖的完全培养基中诱导抗体表达,以及进行后续的流式分选。由于首次分选之后表达cas9的质粒仍然存在,可能会诱导新的突变产生,所以分选后的细胞再次扩大并进行第二次流式分选。由于无压力完全培养基的使用,使得cas9的质粒发生丢失。我们通过模拟实验,检测cas9在无压力选择培养基中的表达情况(图1b),观察到经过ypg诱导36h后分选,再后续ypad培养至36h后,大部分的细胞已经不再表达cas9,从而为下一轮sgrna的转染和后续的筛选做好准备。
实施例2流式的设门以及流式的分选
如图2a所示,以无sgrna靶向序列的空载体作为阴性对照sgrna质粒转染表达p2g12scfv抗体的酵母菌株之后,首轮流式分选前(t1s1)检测可以看到apc信号的强度增加到2.18%,是阴性对照以及初始抗体细胞群所没有的。通过设门从1×108细胞中将这群细胞分选出来,得到约1×104个细胞,这群细胞可能存在诱导比p2g12抗体更高亲和力的细胞。分选的细胞通过扩增进行第二轮的分选,第二轮分选时使用相对弱的荧光二抗neutravidin-pe,用以避免非特异结合荧光二抗的细胞的富集。回收的细胞将进行下一轮sgrna的转染和流式分选。经过两轮的转染和四轮流式富集(t2s4)后,通过流式数据比较初始群细胞与t2s4分选之后的细胞,可以看到t2s4分先后细胞apc阳性信号明显增强,而c-myc的信号强度没有影响(图2b),表明增加的apc信号强度不是因为scfv表达量增加引起的。
实施例3序列鉴定与亲和力的检测
pd1的抗体经过两轮crispr质粒转化诱变文库,四轮流式筛选后,经测序鉴定得到新突变克隆(p2g12-s111v),蛋白抗体序列与初始抗体(p2g12)序列的比较如图3a所示:p2g12-s111v发生两个碱基的改变,抗体序列发生一个氨基酸的替换。流式、elisa以及生物膜层光学干涉(bli)实验验证,所筛选的抗体亲和力与初始抗体的比较,如图3b、c、d。实验结果显示,新单链抗体p2g12s111v的亲和力较初始抗体p2g12有所提高,kd为3.43nm,实现了对抗体p2g12的进一步亲和成熟。
实施例4两次诱导文库的分析检测
取108个细胞文库细胞建库,通过二代测序(ngs)方法,测pd1抗体cdr3区序列,比较两次突变文库突变克隆情况(图3)。两次诱变文库结果分析表明,通过此系统产生了一定的文库多样性,相同突变序列有8632个占总体的12%,说明文库尚未达到饱和,可以通过此系统进行进一步的序列诱变。
本发明成功将pd1抗体的蛋白基因序列整合到酵母基因组上,并两轮crispr靶向诱导突变形成文库,经过流式富集后得到比初始的亲和力高的新突变抗体p2g12-s111v(图3a、b、c、d);ngs数据表明两次突变产生了新的突变序列文库,分别产生38180及42333个不同突变克隆,两次文库共有约7×104的库容量(图4),且文库尚未达到饱和,说明本发明方法在构建抗体蛋白序列文库用于筛选的实用性。
序列表
<110>复旦大学
<120>通过crispr系统产生蛋白序列多样性筛选文库的方法
<130>20181111
<160>3
<170>siposequencelisting1.0
<210>1
<211>375
<212>dna
<213>artificial
<400>1
gaggtgcagctggtgcagtctgggggaggcttggtacagcctggggggtccctgagactc60
tcctgtgcagcctctggattcaccttcagtagctatagcatgaactgggtccgccaggct120
ccagggaaggggctggagtgggtctcagctattagtggtagtggtggtagcacatactac180
gcagactccgtgaagggccgattcaccatctccagagacaattccaagaacacgctgtat240
ctgcaaatgaacagcctgagagccgaggacacggctgtgtattactgtgcgagagatccc300
tatggttcggggagttattatagaggggatgcttttgatatctggggccaagggacaatg360
gtcaccgtctcctca375
<210>2
<211>253
<212>dna
<213>artificial
<400>2
tactgtgcgagagatccctatggtgcgagagatccctatggttcgggcgagagatcccta60
tggttcgggcgagagatccctatggttcggggccctatggttcggggagttattacctat120
ggttcggggagttattatggttcggggagttattatagagggttcggggagttattatag180
agggttcggggagttattatagagggggaggggatgcttttgatatctggaggggatgct240
tttgatatctggg253
<210>3
<211>20
<212>dna
<213>artificial
<400>3
ctctcgaagtggtcacgtgc20
1.基于crispr系统产生蛋白序列多样性筛选文库的方法,其特征在于,包括以下步骤:
(1)构建crispr系统质粒和含目的蛋白基因表达元件的质粒;
(2)目的蛋白基因表达元件整合细胞基因组,得到表达目的蛋白基因的细胞株;
(3)转化crispr系统质粒,诱变产生蛋白序列多样性筛选文库;
(4)定向筛选目标蛋白。
2.根据权利要求1所述的方法,其特征在于,步骤(1)所述的crispr系统质粒是表达cas9、dcas9蛋白或者sgrna系统的质粒。
3.根据权利要求1所述的方法,其特征在于,步骤(1)所述的crispr系统是与胞嘧啶脱氨酶或者腺苷脱氨酶联合的系统。
4.根据权利要求1所述的方法,其特征在于,步骤(2)所述的目的蛋白基因表达元件整合细胞基因组是指利用步骤(1)中所述的含目的蛋白基因表达元件的质粒,通过合适的整合方法将外源基因整合到相应细胞基因组上。
5.根据权利要求1所述的方法,其特征在于,步骤(3)所述的crispr系统质粒的转化是指将靶向基因序列的crispr系统质粒导入步骤(2)中所述的表达目的蛋白基因的细胞株。
6.根据权利要求1所述的方法,其特征在于,步骤(3)所述的诱变产生多样性突变文库是指通过crispr系统质粒的导入与crispr系统的表达,靶向切割或者修饰整合基因序列,细胞通过不同的修复途径修复基因序列从而产生不同突变,形成蛋白序列多样性筛选文库。
7.根据权利要求1所述的方法,其特征在于,步骤(4)所述的目标基因的定向筛选是通过细胞表面展示、磁珠富集或者流式分选技术,从所得文库中筛选富集出目标蛋白的细胞。
8.根据权利要求1所述的方法,其特征在于,该方法还包括通过测序鉴定目标蛋白。
9.根据权利要求1所述的方法,其特征在于,该方法还包括循环性诱导并筛选蛋白序列多样性文库,直至目标蛋白的产生。
10.根据权利要求9所述的方法,其特征在于,所述的循环性诱变新突变文库的产生,是指通过新一轮crispr系统质粒的转化继续新蛋白序列多样性筛选文库的产生。
技术总结