背景技术:
0、背景
1、crispr(成簇规律间隔短回文重复序列)是见于细菌和古细菌的基因组中的含有多个短正向重复序列的基因座。crispr rna(crrna)与crispr相关(cas)效应蛋白缔合以形成识别外来核酸的crispr-cas系统。crispr系统是细菌和古细菌的适应性免疫系统的一部分,通过以序列依赖性方式裂解外来dna来保护它们对抗侵袭性核酸诸如病毒。免疫性通过在crispr基因座的近端在两个邻近重复序列之间整合侵袭性dna的称为间隔子的短片段来获得。crispr阵列在后续与侵袭性核酸相遇期间被转录,并且被加工成长度是约40nt的小干扰crispr rna(crrna),其与反式活化crispr rna(tracrrna)缔合以将crispr相关核酸酶引导至侵袭性核酸。crispr/cas9效应物复合物裂解侵袭性dna中称为原间隔子的同源性双链dna序列。裂解的先决条件是在靶标dna的下游存在保守原间隔子邻近基序(pam),对于cas9,所述基序通常具有序列5′-ngg-3′,但较不常见地具有序列nag。特异性由crrna中的“种子序列”提供,所述种子序列位于pam上游约12个碱基,必须能够与靶标序列杂交。cpf1,一种v型cas效应蛋白,以与cas9类似的方式起作用,但cpf1不需要tracrrna。
2、将crispr-cas系统分成两个类别:1类crispr系统,再分成i、iii和iv型,并且1类系统利用多个cas蛋白与crrna一起形成复合物;以及2类crispr系统,再分成ii和v型,利用单一cas蛋白与crrna一起形成能够进行序列特异性基因组修饰的复合物。
技术实现思路
0、概述
1、若干实施方案涉及一种包含可操作地连接于编码crispr相关转座酶的多核苷酸的异源性启动子的重组核酸,其中所述crispr相关转座酶包含选自由seq id no:124-246和275-287组成的组的氨基酸序列或其片段。若干实施方案涉及一种包含可操作地连接于编码crispr相关转座酶的多核苷酸的异源性启动子的重组核酸,其中所述crispr相关转座酶与包含选自seq id no:124-246和275-287的氨基酸序列的crispr相关转座酶具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同源性或同一性。在一些实施方案中,提供一种包含重组核酸的载体,所述重组核酸包含可操作地连接于编码具有选自由seq id no:124-246和275-286组成的组的氨基酸序列的crispr相关转座酶的异源性启动子的多核苷酸。在一些实施方案中,提供一种包含重组核酸的载体,所述重组核酸包含可操作地连接于编码crispr相关转座酶的异源性启动子的多核苷酸,其中所述crispr相关转座酶与包含选自seq id no:124-246和275-287的氨基酸序列的crispr相关转座酶具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同源性或同一性。
2、若干实施方案涉及一种包含可操作地连接于编码crispr相关转座酶的多核苷酸的异源性启动子的重组核酸,其中所述多核苷酸包含选自由seq id no:1-123和604-627组成的组的核酸序列或其片段。若干实施方案涉及一种包含可操作地连接于编码crispr相关转座酶的多核苷酸的异源性启动子的重组核酸,其中所述多核苷酸包含选自由seq id no:2020-2699组成的组的核酸序列或其片段。若干实施方案涉及一种包含可操作地连接于编码crispr相关转座酶的多核苷酸的异源性启动子的重组核酸,其中所述多核苷酸包含选自由seq id no:2700-3379组成的组的核酸序列或其片段。若干实施方案涉及一种包含可操作地连接于编码crispr相关转座酶的多核苷酸的异源性启动子的重组核酸,其中所述多核苷酸包含与选自seq id no:1-123、604-627和2020-3379的序列至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%同一的序列。若干实施方案涉及一种包含重组核酸的载体,所述重组核酸包含可操作地连接于编码crispr相关转座酶的异源性启动子的多核苷酸,其中所述多核苷酸包含选自seq id no:1-123、604-627和2020-3379的序列。在一些实施方案中,载体包含重组核酸,所述重组核酸包含异可操作地连接于编码crispr相关转座酶的异源性启动子的多核苷酸,其中所述多核苷酸包含与选自seq idno:1-123、604-627和2020-3379的序列具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的序列。
3、若干实施方案涉及一种包含重组核酸的细胞,所述重组核酸包含可操作地连接于编码crispr相关转座酶的异源性启动子的多核苷酸,其中所述crispr相关转座酶包含选自由seq id no:124-246和275-287组成的组的氨基酸序列或其片段。若干实施方案涉及一种包含重组核酸的细胞,所述重组核酸包含可操作地连接于编码crispr相关转座酶的异源性启动子的多核苷酸,其中所述crispr相关转座酶与包含选自seq id no:124-246和275-287的氨基酸序列的crispr相关转座酶具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同源性或同一性。在一些实施方案中,重组核酸包含与选自seq id no:1-123、604-627和2020-3379的核酸序列具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性的核酸序列。在一些实施方案中,重组核酸在细胞中短暂表达。在一些实施方案中,将重组核酸整合至细胞的基因组中。在一些实施方案中,将重组核酸整合至细胞的b染色体中。在一些实施方案中,细胞是原核细胞。在一些实施方案中,细胞是真核细胞。在一些实施方案中,真核细胞是植物细胞。在一些实施方案中,真核细胞是藻类细胞。在一些实施方案中,真核细胞是哺乳动物细胞。
4、在一个方面,本公开提供一种用于对靶标核酸序列进行序列特异性修饰的系统,其包含(a)引导rna或编码引导rna的dna分子,其中所述引导rna对靶标核酸序列具有特异性,和(b)编码crispr相关转座酶的多核苷酸,所述crispr相关转座酶包含与选自由seq idno:124-246和275-287组成的组的序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性的氨基酸序列。
5、在一个方面,本公开提供一种用于修饰细胞中的靶标核酸序列的方法,其包括向所述细胞提供crispr相关转座酶或编码所述crispr相关转座酶的多核苷酸,所述crispr相关转座酶包含与选自由seq id no:124-246和275-287组成的组的序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性的氨基酸序列。在一些实施方案中,crispr相关转座酶由与选自seq id no:1-123、604-627和2020-3379的核酸序列具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性的核酸序列编码。
6、在一个方面,本公开提供一种用于对细胞中的靶标核酸序列进行序列特异性修饰的方法,其包括向细胞提供(a)对细胞中的靶标核酸序列具有特异性的引导rna,和(b)crispr相关转座酶或编码所述crispr相关转座酶的多核苷酸,所述crispr相关转座酶包含与选自由seq id no:124-246和275-287组成的组的序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性的氨基酸序列,其中所述靶标核酸序列被修饰。在一些实施方案中,编码crispr相关转座酶的多核苷酸包含与选自seq id no:1-123、604-627和2020-3379的核酸序列具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性的核酸序列。
7、在一方面,本公开提供一种含有靶标核酸序列的真核细胞,所述靶标核酸序列已通过用于对细胞中的靶标核酸序列进行序列特异性修饰的方法来加以序列特异性修饰,所述方法包括向细胞提供(a)对细胞中的靶标核酸序列具有特异性的引导rna,和(b)crispr相关转座酶或编码所述crispr相关转座酶的多核苷酸,所述crispr相关转座酶包含与选自由seq id no:124-246和275-287组成的组的序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性的氨基酸序列,其中所述靶标核酸序列被修饰。在一些实施方案中,编码crispr相关转座酶的多核苷酸包含与选自seq id no:1-123、604-627和2020-3379的核酸序列具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性的核酸序列。
8、在一方面,本公开提供一种选择性调节真核细胞中的至少一个靶标dna的转录的方法,其包括使所述真核细胞与以下各物接触:(a)引导rna或编码引导rna的dna,其中所述引导rna进一步包含:(i)包含互补于所述靶标dna的核苷酸序列的第一区段;和(ii)与crispr相关转座酶相互作用的第二区段;和(b)编码所述crispr相关转座酶的多核苷酸,其中所述crispr相关转座酶包含与选自由seq id no:124-246和275-287组成的组的序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性的氨基酸序列,其中组分(a)和(b)位于同一或不同载体上,其中所述引导rna和所述crispr相关转座酶在所述真核细胞中形成复合物,并且其中所述复合物选择性调节所述靶标dna的转录。在一些实施方案中,编码crispr相关转座酶的多核苷酸包含与选自seq id no:1-123、604-627和2020-3379的核酸序列具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性的核酸序列。
9、若干实施方案涉及一种从细菌基因组鉴定crispr相关转座酶的方法。在一些实施方案中,基于它在细菌基因组内与crispr基因座的关联来鉴定编码crispr相关转座酶的多核苷酸。在某些方面,编码crispr相关转座酶的多核苷酸进一步通过在细菌基因组内与cas1、cas2、或cas1和cas2而非cas5或cas3的关联来鉴定。在一些实施方案中,编码crispr相关转座酶的多核苷酸与crispr基因座位于同一操纵子中。在其他实施方案中,编码crispr相关转座酶的多核苷酸位于crispr基因座的2.5千碱基内。在一些实施方案中,编码crispr相关转座酶的多核苷酸通过与包含表1中标识的序列簇的crispr相关转座酶具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%同一性来鉴定。在一些实施方案中,细菌基因组选自由以下组成的组:赖氨酸芽孢杆菌属某种(lysinibacillus sp.)、短芽孢杆菌属某种(brevibacillussp.)、鞘氨醇杆菌属某种(sphingobium sp.)、水杆菌属某种(undibacterium sp.)、芽孢杆菌属某种(bacillus sp.)、金黄杆菌属某种(chryseobacterium sp.)、鞘氨醇单胞菌属某种(sphingomonas sp.)、类芽孢杆菌属某种(paenibacillus sp.)、链霉菌属某种(streptomyces sp.)、寡养单胞菌属某种(stenotrophomonas sp.)和双头菌属某种(labrys sp.)。在一些实施方案中,细菌基因组选自由以下组成的组:侧孢短芽孢杆菌(brevibacillus laterosporus);苏云金芽孢杆菌(bacillus thuringiensis);韦氏芽孢杆菌(bacillus weihenstephanensis)、巨大芽孢杆菌(bacillus megaterium)、粪肠球菌(enterococcus faecalis);短短芽孢杆菌(brevibacillus brevis);迟钝水杆菌(undibacterium pigrum);玫瑰色新鞘氨醇杆菌(novosphingobium rosa);嗜甲氨基双头菌(lybrys methylaminiphilius);类短短芽孢杆菌(brevibacillus parabrevis);解硫胺素类芽孢杆菌(paenibacillus thiaminolyticus);缓病类芽孢杆菌(paenibacilluslentimorbus);和土地类芽孢杆菌(paenibacillus terrae)。
10、若干实施方案涉及一种包含crispr相关转座酶的核酸靶向系统,所述crispr相关转座酶包含与选自由seq id no:124-246和275-287组成的组的序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性的氨基酸序列。在一些实施方案中,核酸靶向系统进一步包含能够与靶标序列杂交的引导rna。在一些实施方案中,核酸靶向系统进一步包含tracrrna。在一些实施方案中,核酸靶向系统进一步包含二价阳离子。在一些实施方案中,核酸靶向系统进一步包含mg2+。在一些实施方案中,使crispr相关转座酶的核酸酶活性失活。在一些实施方案中,核酸靶向系统包含具有异源性功能性结构域的crispr相关转座酶。
11、若干实施方案涉及一种使在所选基因组基因座处的重组增强的方法,其包括向植物细胞提供至少一种在第一基因组基因座中引入基因组修饰,由此诱导所述第一基因组基因座与第二基因组基因座之间的重组的核酸靶向系统,其中所述至少一种核酸靶向系统不在所述第二基因组基因座处引入基因组修饰,以及选择至少一个包含所述第一基因组基因座与所述第二基因组基因座之间的重组事件的植物细胞。若干实施方案涉及一种使在所选基因组基因座处的重组增强的方法,其包括向植物细胞提供至少一种在第一基因组基因座和第二基因组基因座处引入基因组修饰,由此诱导所述第一基因组基因座与所述第二基因组基因座之间的重组的核酸靶向系统,以及选择至少一个包含所述第一基因组基因座与所述第二基因组基因座之间的重组事件的植物细胞。若干实施方案涉及一种使在所选基因组基因座处的重组增强的方法,其包括向细胞提供在第一基因组基因座处引入基因组修饰的第一核酸靶向系统和在第二基因组基因座处引入基因组修饰的第二核酸靶向系统,由此诱导所述第一基因组基因座与所述第二基因组基因座之间的重组,以及选择至少一个包含所述第一基因组基因座与所述第二基因组基因座之间的重组事件的子代。在一些实施方案中,第一基因组基因座和第二基因组基因座呈顺式。在一些实施方案中,第一基因组基因座和第二基因组基因座呈反式。在一些实施方案中,第一基因组基因座和第二基因组基因座是同源物。在一些实施方案中,第一基因组基因座和第二基因组基因座是旁系同源物。在一些实施方案中,第一基因组基因座和第二基因组基因座是部分同源物。在一些实施方案中,第一基因组基因座和第二基因组基因座是相同的。在一些实施方案中,第一基因组基因座和第二基因组基因座在同源染色体上。在一些实施方案中,第一基因组基因座和第二基因组基因座在非同源染色体上。在一些实施方案中,第一基因组基因座和第二基因组基因座在部分同源染色体上。在一些实施方案中,第一基因组基因座和第二基因组基因座共有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些实施方案中,第一基因组基因座和第二基因组基因座位于同源染色体上。在一些实施方案中,第一基因组基因座和第二基因组基因座位于非同源染色体上。在一些实施方案中,基因组修饰是双链断裂(dsb)。在一些实施方案中,基因组修饰是单链断裂。在一些实施方案中,基因组修饰发生在减数分裂开始时。在一些实施方案中,重组是不对称的。在一些实施方案中,重组是对称的。在一些实施方案中,第一靶标序列和/或第二靶标序列是基因序列。在一些实施方案中,第一靶标序列和/或第二靶标序列在基因间区域内。在一些实施方案中,第一靶标序列在与含有第二靶标序列的基因组基因座的至少约100bp、至少约150bp、至少约200bp、至少约250bp、至少约300bp、至少约350bp、至少约400bp、至少约450bp、至少约500bp、至少约600bp、至少约700bp、至少约800bp、至少约900bp或至少约1000bp同源的基因组基因座中。在一些实施方案中,第一靶标序列在与含有第二靶标序列的基因组基因座的至少约100bp、至少约150bp、至少约200bp、至少约250bp、至少约300bp、至少约350bp、至少约400bp、至少约450bp、至少约500bp、至少约600bp、至少约700bp、至少约800bp、至少约900bp或至少约1000bp同源的基因组基因座中,其中含有所述第一靶标序列的所述基因组基因座和含有所述第二靶标序列的所述基因组基因座在基因组中的相应位置中。在一些实施方案中,第一靶标序列在与含有第二靶标序列的基因组基因座的至少约100bp、至少约150bp、至少约200bp、至少约250bp、至少约300bp、至少约350bp、至少约400bp、至少约450bp、至少约500bp、至少约600bp、至少约700bp、至少约800bp、至少约900bp或至少约1000bp同源的基因组基因座中,其中含有所述第一靶标序列的所述基因组基因座和含有所述第二靶标序列的所述基因组基因座不在基因组中的相应位置中。在一些实施方案中,第一靶标序列与第二靶标序列具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些实施方案中,第一基因组基因座和第二基因组基因座中的一者或多者包含一个或多个独立选自由以下组成的组的基因组区域:基因、一系列串联重复基因、增强子、抑制子、启动子、终止序列、剪接受体序列、剪接供体序列、内含子、外显子、sirna和数量性状基因座(qtl)。在一些实施方案中,包含第一基因组基因座与第二基因组基因座之间的重组事件的一个植物细胞的子代展现对一种或多种选自以下的疾病的抗性:炭疽秆腐病(anthracnose stalk rot)(禾生刺盘孢(colletotrichum graminicola))、镰刀菌穗腐病(fusarium ear rot)(轮枝样镰刀菌(fusarium verticillioides))、镰刀菌秆腐病(fusarium stalk rot)(镰刀菌属某些种(fusarium spp.))、赤霉菌穗腐病(gibberella ear rot)(串珠赤霉菌(gibberellamoniliformis))、赤霉菌秆腐病(gibberella stalk rot)(玉米赤霉菌(gibberellazeae))、戈斯氏枯萎病和叶枯病(goss's wilt and leaf blight)(密歇根棒形杆菌(clavibacter michiganensis))、灰色叶斑病(gray leaf spot)(玉蜀黍尾孢菌(cercospora zeae-maydis)、玉米尾孢菌(c.zeina))、北方玉米叶枯病(northern cornleaf blight)(土耳其凸脐孢菌(exserohilum turcicum))、猝死综合征(sudden deathsyndrome)(腐皮镰刀菌大豆专化型(fusarium solani f.sp.glycines))、亚洲大豆锈病(asian soybean rust)(豆薯层锈菌(phakopsora pachyrhizi))、疫霉根茎腐病(phytophthora root and stem rot)(大豆疫霉(phytophthora sojae))、根结线虫病(root-knot nematode)(根结线虫属某些种(meloidogyne spp.))、大豆胞囊线虫病(soybean cyst nematode)(大豆异皮线虫(heterodera glycines))、肾形线虫病(reniform nematode)(肾形肾状线虫(rotylenchulus reniformis))、根结线虫病(南方根结线虫(meloidogyne incognita))、镰刀菌枯萎病(fusarium wilt)(尖孢镰刀菌萎蔫专化型(fusarium oxysporurn f.sp.vasinfectum))、轮枝孢菌枯萎病(verticillium wilt)(大丽轮枝孢菌(verticillium dahlia))、镰刀菌头枯病(fusarium head blight)(禾谷镰刀菌(fusarium graminearum))、镰刀菌苗枯病(fusarium seedling blight)(镰刀菌属某些种、颖枯壳针孢(septoria nodorum))、镰刀菌叶疱病(fusarium leaf blotch)(雪腐明梭孢(monographella nivalis))和茎锈病(stem rust)(禾柄锈菌(puccinia graminis))。在一些实施方案中,植物是玉米植物。在一些实施方案中,植物是大豆植物。在一些实施方案中,植物是棉花植物。在一些实施方案中,植物是小麦植物。在一些实施方案中,植物是高粱植物。在一些实施方案中,植物是卡诺拉油菜(canola)植物。在一些实施方案中,核酸靶向系统包含crispr相关转座酶,其包含与选自由seq id no:124-246和275-287组成的组的序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性的氨基酸序列。在一些实施方案中,核酸靶向系统进一步包含能够与靶标序列杂交的引导rna。在一些实施方案中,核酸靶向系统进一步包含tracrrna。在一些实施方案中,核酸靶向系统进一步包含二价阳离子。在一些实施方案中,核酸靶向系统进一步包含mg2+。在一些实施方案中,使crispr相关转座酶的核酸酶活性失活。在一些实施方案中,核酸靶向系统包含具有异源性功能性结构域的crispr相关转座酶。若干实施方案涉及一种通过根据以上提及的方法产生的植物、植物细胞或植物种子。
12、若干实施方案涉及一种使目标基因组基因座渗入所选种质中的方法,其包括产生包含含有所述目标基因组基因座的第一亲本基因组和含有所述所选种质的第二亲本基因组的植物细胞,向所述植物细胞提供在所述第一亲本基因组中在邻近于所述目标基因组基因座的靶标序列处引入基因组修饰,由此诱导所述第一亲本基因组与所述第二亲本基因组之间的重组的第一核酸靶向系统,以及选择至少一个包含至少一个包含所述所选种质和所述目标基因组基因座的重组染色体的子代。若干实施方案涉及一种使目标基因组基因座渗入所选种质中的方法,其包括产生包含含有所述目标基因组基因座的第一亲本基因组和含有所述所选种质的第二亲本基因组的植物细胞,向所述植物细胞提供在所述第一亲本基因组中在邻近于所述目标基因组基因座的靶标序列处引入基因组修饰,以及在所述第二亲本基因组中在靶标位点处引入基因组修饰,由此诱导所述第一亲本基因组与所述第二亲本基因组之间的重组的第一核酸靶向系统,以及选择至少一个包含至少一个包含所述所选种质和所述目标基因组基因座的重组染色体的子代。若干实施方案涉及一种使目标基因组基因座渗入所选种质中的方法,其包括产生包含含有所述目标基因组基因座的第一亲本基因组和含有所述所选种质的第二亲本基因组的植物细胞,向所述植物细胞提供在所述第一亲本基因组中在邻近于所述目标基因组基因座的靶标序列处引入基因组修饰的第一核酸靶向系统,以及在所述第一亲本基因组中在邻近于所述基因组基因座的第二靶标序列处引入基因组修饰的第二核酸靶向系统,其中所述第二靶标序列与所述第一核酸靶向系统的所述靶标序列处于所述目标基因组基因座的对侧,由此诱导所述第一亲本基因组与所述第二亲本基因组之间的重组,以及选择至少一个包含至少一个包含所述所选种质和所述目标基因组基因座的重组染色体的植物细胞。若干实施方案涉及一种使目标基因组基因座渗入所选种质中的方法,其包括产生包含含有所述目标基因组基因座的第一亲本基因组和含有所述所选种质的第二亲本基因组的植物细胞,向所述植物细胞提供在所述第一亲本基因组中在邻近于所述目标基因组基因座的靶标序列处引入基因组修饰,以及在所述第二亲本基因组中在靶标位点处引入基因组修饰的第一核酸靶向系统,以及进一步向所述植物细胞中引入在所述第一亲本基因组中在邻近于所述基因组基因座的第二靶标序列处引入基因组修饰的第二核酸靶向系统,其中所述第二靶标序列与所述第一核酸靶向系统的所述靶标序列处于所述目标基因组基因座的对侧,由此诱导所述第一亲本基因组与所述第二亲本基因组之间的重组,以及选择至少一个包含至少一个包含所述所选种质和所述目标基因组基因座的重组染色体的植物细胞。在一些实施方案中,第二核酸靶向系统在第二亲本基因组中在靶标序列处引入基因组修饰。在一些实施方案中,重组是不对称的。在一些实施方案中,重组是对称的。在一些实施方案中,目标基因组基因座包含一个或多个独立选自由以下组成的组的基因组区域:基因、一系列串联重复基因、多基因家族、增强子、抑制子、启动子、终止序列、剪接受体序列、剪接供体序列、内含子、外显子、sirna、编码非编码rna的序列、微小rna、转基因和数量性状基因座(qtl)。在一些实施方案中,基因组修饰是双链断裂(dsb)。在一些实施方案中,基因组修饰是单链断裂。在一些实施方案中,基因组修饰是重组酶介导的dna交换反应。在一些实施方案中,基因组修饰是转座酶介导的dna交换反应。在一些实施方案中,基因组修饰发生在减数分裂开始时。在一些实施方案中,靶标序列是基因序列。在一些实施方案中,靶标序列在基因间区域内。在一些实施方案中,靶标序列在第一亲本基因组的与第二亲本基因组的基因组基因座的至少约100bp、至少约150bp、至少约200bp、至少约250bp、至少约300bp、至少约350bp、至少约400bp、至少约450bp、至少约500bp、至少约600bp、至少约700bp、至少约800bp、至少约900bp或至少约1000bp同源的基因组基因座中。在一些实施方案中,靶标序列在第一亲本基因组的与第二亲本基因组的基因组基因座的至少约100bp、至少约150bp、至少约200bp、至少约250bp、至少约300bp、至少约350bp、至少约400bp、至少约450bp、至少约500bp、至少约600bp、至少约700bp、至少约800bp、至少约900bp或至少约1000bp同源的基因组基因座中,其中第一亲本基因组的基因组基因座和第二亲本基因组的基因组基因座位于相应位置中。在一些实施方案中,靶标序列在第一亲本基因组的与第二亲本基因组的基因组基因座的至少约100bp、至少约150bp、至少约200bp、至少约250bp、至少约300bp、至少约350bp、至少约400bp、至少约450bp、至少约500bp、至少约600bp、至少约700bp、至少约800bp、至少约900bp或至少约1000bp同源的基因组基因座中,其中第一亲本基因组的基因组基因座和第二亲本基因组的基因组基因座不位于相应位置中,从而导致不对称重组。在一些实施方案中,第一亲本基因组和第二亲本基因组不是性相容的。在一些实施方案中,第一亲本基因组和第二亲本基因组来自不同物种。在一些实施方案中,第一亲本基因组来自普通小麦(triticum aestivum)(小麦(wheat)),并且第二亲本基因组选自卵穗山羊草(aegilops ovate)、两芒山羊草(ae.biuncialis)、三芒山羊草(ae.triuncialis)、方穗山羊草(ae.quarrosa)、黑麦(secale cereal)、野生二粒小麦(triticum dicoccoides)、二粒小麦(triticum dicoccum)和杜伦小麦(triticum durum)。在一些实施方案中,第一亲本基因组选自卵穗山羊草、两芒山羊草、三芒山羊草、方穗山羊草、黑麦、野生二粒小麦、二粒小麦和杜伦小麦,并且第二亲本基因组是普通小麦(小麦)。在一些实施方案中,第一亲本基因组来自陆地棉(gossypium hirsutum)(棉花(cotton)),并且第二亲本基因组选自斯特提棉(g.sturtii)、戴维森棉(g.davidsonii)、树棉(g.arboretum)和雷蒙德棉(g.raimondii)。在一些实施方案中,第一亲本基因组选自斯特提棉、戴维森棉、树棉和雷蒙德棉,并且第二亲本基因组来自陆地棉(棉花)。在一些实施方案中,第一亲本基因组和/或第二亲本基因组是单倍体。在一些实施方案中,第一亲本基因组和/或第二亲本基因组是二倍体。在一些实施方案中,目标基因组基因座是rp1疾病抗性基因座。在一些实施方案中,目标基因组基因座是rpp1疾病抗性基因座。在一些实施方案中,目标基因组基因座是rps1疾病抗性基因座。在一些实施方案中,目标基因组基因座是rhg1疾病抗性基因座。在一些实施方案中,目标基因组基因座是rgh4疾病抗性基因座。在一些实施方案中,植物是玉米植物。在一些实施方案中,植物是大豆植物。在一些实施方案中,植物是棉花植物。在一些实施方案中,植物是小麦植物。在一些实施方案中,植物是高粱植物。在一些实施方案中,植物是卡诺拉油菜植物。在一些实施方案中,核酸靶向系统包含crispr相关转座酶,其包含与选自由seq id no:124-246和275-287组成的组的序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性的氨基酸序列。在一些实施方案中,核酸靶向系统进一步包含能够与靶标序列杂交的引导rna。在一些实施方案中,核酸靶向系统进一步包含tracrrna。在一些实施方案中,核酸靶向系统进一步包含二价阳离子。在一些实施方案中,核酸靶向系统进一步包含mg2+。在一些实施方案中,使crispr相关转座酶的核酸酶活性失活。在一些实施方案中,核酸靶向系统包含具有异源性功能性结构域的crispr相关转座酶。若干实施方案涉及一种通过根据以上提及的方法产生的植物、植物细胞或植物种子。
13、若干实施方案涉及一种移除连锁累赘的方法,其包括产生包含第一亲本基因组和第二亲本基因组的植物细胞,其中所述第一亲本基因组包含顺式连接于不合需要的基因组基因座的目标基因组基因座,向所述细胞提供在所述目标基因组基因座与所述不合需要的基因组基因座之间引入基因组修饰,由此诱导所述第一亲本基因组与所述第二亲本基因组之间的重组以及解除所述目标基因组基因座和所述不合需要的基因座的连接的第一核酸靶向系统,以及选择至少一个包含所述目标基因组基因座的子代。若干实施方案涉及一种移除连锁累赘的方法,其包括产生包含第一亲本基因组和第二亲本基因组的植物细胞,其中所述第一亲本基因组包含顺式连接于不合需要的基因组基因座的目标基因组基因座,向所述细胞提供在所述目标基因组基因座与所述不合需要的基因组基因座之间引入第一基因组修饰,以及在所述不合需要的基因组基因座的与所述第一基因组修饰相对一侧引入第二基因组修饰,由此诱导所述第一亲本基因组与所述第二亲本基因组之间的重组以及移除所述不合需要的基因座,同时维持所述第一亲本基因组的种质在所述第二基因组修饰的远端的第一核酸靶向系统,以及选择至少一个包含所述目标基因组基因座的子代。在一些实施方案中,第二核酸靶向系统在第二亲本基因组中在靶标序列处引入基因组修饰。在一些实施方案中,重组是不对称的。在一些实施方案中,重组是对称的。在一些实施方案中,目标基因组基因座包含一个或多个独立选自由以下组成的组的基因组区域:基因、一系列串联重复基因、多基因家族、增强子、抑制子、启动子、终止序列、剪接受体序列、剪接供体序列、内含子、外显子、sirna、编码非编码rna的序列、微小rna、转基因和数量性状基因座(qtl)。在一些实施方案中,基因组修饰是双链断裂(dsb)。在一些实施方案中,基因组修饰是单链断裂。在一些实施方案中,基因组修饰是重组酶介导的dna交换反应。在一些实施方案中,基因组修饰是转座酶介导的dna交换反应。在一些实施方案中,基因组修饰发生在减数分裂开始时。在一些实施方案中,第一亲本基因组和第二亲本基因组不是性相容的。在一些实施方案中,第一亲本基因组和第二亲本基因组来自不同物种。在一些实施方案中,第一亲本基因组来自普通小麦(小麦),并且第二亲本基因组选自卵穗山羊草、两芒山羊草、三芒山羊草、方穗山羊草、黑麦、野生二粒小麦、二粒小麦和杜伦小麦。在一些实施方案中,第一亲本基因组选自卵穗山羊草、两芒山羊草、三芒山羊草、方穗山羊草、黑麦、野生二粒小麦、二粒小麦和杜伦小麦,并且第二亲本基因组是普通小麦(小麦)。在一些实施方案中,第一亲本基因组来自陆地棉(棉花),并且第二亲本基因组选自斯特提棉、戴维森棉、树棉和雷蒙德棉。在一些实施方案中,第一亲本基因组选自斯特提棉、戴维森棉、树棉和雷蒙德棉,并且第二亲本基因组来自陆地棉(棉花)。在一些实施方案中,第一亲本基因组和/或第二亲本基因组是单倍体。在一些实施方案中,第一亲本基因组和/或第二亲本基因组是二倍体。在一些实施方案中,目标基因组基因座是rp1疾病抗性基因座。在一些实施方案中,目标基因组基因座是rpp1疾病抗性基因座。在一些实施方案中,目标基因组基因座是rps1疾病抗性基因座。在一些实施方案中,目标基因组基因座是rhg1疾病抗性基因座。在一些实施方案中,目标基因组基因座是rhg4疾病抗性基因座。在一些实施方案中,植物是玉米植物。在一些实施方案中,植物是大豆植物。在一些实施方案中,植物是棉花植物。在一些实施方案中,植物是小麦植物。在一些实施方案中,植物是高粱植物。在一些实施方案中,植物是卡诺拉油菜植物。在一些实施方案中,核酸靶向系统包含crispr相关转座酶,其包含与选自由seq id no:124-246和275-287组成的组的序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性的氨基酸序列。在一些实施方案中,核酸靶向系统进一步包含能够与靶标序列杂交的引导rna。在一些实施方案中,核酸靶向系统进一步包含tracrrna。在一些实施方案中,核酸靶向系统进一步包含二价阳离子。在一些实施方案中,核酸靶向系统进一步包含mg2+。在一些实施方案中,使crispr相关转座酶的核酸酶活性失活。在一些实施方案中,核酸靶向系统包含具有异源性功能性结构域的crispr相关转座酶。若干实施方案涉及一种通过根据以上提及的方法产生的植物、植物细胞或植物种子。
14、若干实施方案涉及一种使处于相斥的基因组基因座相引的方法,其包括产生包含含有第一基因组基因座的第一亲本基因组和含有第二基因组基因座的第二亲本基因组的植物细胞,其中所述第一基因组基因座和所述第二遗传基因座处于相斥,向所述细胞提供邻近于所述第一基因组基因座引入基因组修饰,由此诱导所述第一亲本基因组与所述第二亲本基因组之间的重组的第一核酸靶向系统,以及选择至少一个在同一染色体上包含所述第一基因组基因座和所述第二基因组基因座的植物细胞。在一些实施方案中,第一基因组基因座和第二基因组基因座位于同源染色体。在一些实施方案中,第一亲本基因组和第二亲本基因组不是性相容的。在一些实施方案中,第一亲本基因组和第二亲本基因组来自不同物种。在一些实施方案中,第一目标基因组基因座和/或第二目标基因组基因座包含一个或多个独立选自由以下组成的组的基因组区域:基因、一系列串联重复基因、增强子、抑制子、启动子、终止序列、剪接受体序列、剪接供体序列、内含子、外显子、sirna和数量性状基因座(qtl)。在一些实施方案中,第一亲本基因组和/或第二亲本基因组是单倍体。在一些实施方案中,第一亲本基因组和/或第二亲本基因组是二倍体。在一些实施方案中,第一亲本基因组来自普通小麦(小麦),并且第二亲本基因组选自卵穗山羊草、两芒山羊草、三芒山羊草、方穗山羊草、黑麦、野生二粒小麦、二粒小麦和杜伦小麦。在一些实施方案中,第一亲本基因组选自卵穗山羊草、两芒山羊草、三芒山羊草、方穗山羊草、黑麦、野生二粒小麦、二粒小麦和杜伦小麦,并且第二亲本基因组是普通小麦(小麦)。在一些实施方案中,第一亲本基因组来自陆地棉(棉花),并且第二亲本基因组选自斯特提棉、戴维森棉、树棉和雷蒙德棉。在一些实施方案中,第一亲本基因组选自斯特提棉、戴维森棉、树棉和雷蒙德棉,并且第二亲本基因组来自陆地棉(棉花)。在一些实施方案中,目标基因组基因座是rp1疾病抗性基因座。在一些实施方案中,第一目标基因组基因座和/或第二目标基因组基因座是rpp1疾病抗性基因座。在一些实施方案中,第一目标基因组基因座和/或第二目标基因组基因座是rps1疾病抗性基因座。在一些实施方案中,第一目标基因组基因座和/或第二目标基因组基因座是rhg1疾病抗性基因座。在一些实施方案中,第一目标基因组基因座和/或第二目标基因组基因座是rhg4疾病抗性基因座。在一些实施方案中,第一目标基因组基因座是rhg1,并且第二目标基因组基因座是rhg4。在一些实施方案中,植物是玉米植物。在一些实施方案中,植物是大豆植物。在一些实施方案中,植物是棉花植物。在一些实施方案中,植物是小麦植物。在一些实施方案中,植物是高粱植物。在一些实施方案中,植物是卡诺拉油菜植物。在一些实施方案中,核酸靶向系统包含crispr相关转座酶,其包含与选自由seq id no:124-246和275-287组成的组的序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性的氨基酸序列。在一些实施方案中,核酸靶向系统进一步包含能够与靶标序列杂交的引导rna。在一些实施方案中,核酸靶向系统进一步包含tracrrna。在一些实施方案中,核酸靶向系统进一步包含二价阳离子。在一些实施方案中,核酸靶向系统进一步包含mg2+。在一些实施方案中,使crispr相关转座酶的核酸酶活性失活。在一些实施方案中,核酸靶向系统包含具有异源性功能性结构域的crispr相关转座酶。若干实施方案涉及一种通过根据以上提及的方法产生的植物、植物细胞或植物种子。
15、若干实施方案涉及一种产生新的系列的串联重复基因的方法,其包括使细胞与裂解第一系列的串联重复基因中的至少一个靶标序列的核酸靶向系统接触,由此诱导与第二系列的串联重复基因的同源性序列的不对称重组,以及选择至少一个含有新的系列的串联重复基因的子代。在一些实施方案中,第一系列的串联重复基因和第二系列的串联重复基因是相同的。在其他实施方案中,第一系列的串联重复基因和第二系列的串联重复基因是不同的。在一些实施方案中,视重组位点而定,不对称重组产生两个新的系列的串联重复基因。在一些实施方案中,不对称重组导致至少一个串联重复基因的缺失。在一些实施方案中,细胞是植物细胞。在另一实施方案中,植物细胞从选自近交植物或杂交植物的植物获得。在其他实施方案中,细胞是哺乳动物细胞。在一些实施方案中,核酸靶向系统包含crispr相关转座酶,其包含与选自由seq id no:124-246和275-287组成的组的序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同源性的氨基酸序列。在一些实施方案中,核酸靶向系统进一步包含能够与靶标序列杂交的引导rna。在一些实施方案中,核酸靶向系统进一步包含tracrrna。在一些实施方案中,核酸靶向系统进一步包含二价阳离子。在一些实施方案中,核酸靶向系统进一步包含mg2+。在一些实施方案中,使crispr相关转座酶的核酸酶活性失活。在一些实施方案中,核酸靶向系统包含具有异源性功能性结构域的crispr相关转座酶。若干实施方案涉及一种通过根据以上提及的方法产生的植物、植物细胞或植物种子。
1.一种重组核酸,其包含可操作地连接于编码氨基酸序列如seq id no:201所示的crispr相关转座酶的多核苷酸的异源性启动子。
2.如权利要求1所述的重组核酸,其中所述crispr相关转座酶由与选自由seq id no:78、559-561、2405-2409和3085-3089组成的组的序列具有至少90%同一性的核苷酸序列编码。
3.如权利要求1所述的重组核酸,其进一步包含至少一个编码能够与靶标序列杂交的引导rna的多核苷酸,其中所述引导rna与所述crispr相关转座酶形成复合物。
4.如权利要求3所述的重组核酸,其中所述至少一个编码引导rna的多核苷酸可操作地连接于第二启动子。
5.如权利要求1所述的重组核酸,其进一步包含至少一个编码供体多核苷酸的多核苷酸。
6.如权利要求5所述的重组核酸,其中所述至少一个编码供体多核苷酸的多核苷酸可操作地连接于第二启动子。
7.如权利要求1所述的重组核酸,其中编码所述crispr相关转座酶的所述多核苷酸进一步编码至少一个核定位信号(nls)。
8.一种载体,其包含如权利要求1-7中任一项所述的重组核酸。
9.一种不可再生的真核细胞,其包含如权利要求1-7中任一项所述的重组核酸。
10.一种用于对靶标核酸序列进行序列特异性修饰的非天然存在的系统,其包含(a)一个或多个引导rna或编码所述一个或多个引导rna的dna分子,其中所述一个或多个引导rna能够与所述靶标核酸序列杂交,和(b)氨基酸序列如seq id no:201所示的crispr相关转座酶或编码所述crispr相关转座酶的多核苷酸,其中所述一个或多个引导rna和所述crispr相关转座酶不一起天然存在。
11.如权利要求10所述的系统,其中编码所述crispr相关转座酶的所述多核苷酸包含与选自由seq id no:78、559-561、2405-2409和3085-3089组成的组的核苷酸序列具有至少90%同一性的核苷酸序列。
12.如权利要求10所述的系统,其中所述靶标核酸序列包含编码核酸序列、非编码核酸序列、或编码核酸序列和非编码核酸序列的组合。
13.如权利要求10所述的系统,其中所述靶标核酸序列包含内源性基因或转基因。
14.如权利要求10所述的系统,其中所述系统包含二价阳离子。
15.如权利要求10所述的系统,其中(a)所述引导rna或编码所述引导rna的dna分子提供在第一核酸分子上,并且编码所述crispr相关转座酶的所述多核苷酸提供在第二核酸分子上,或(b)所述引导rna或编码引导rna的dna分子和编码所述crispr相关转座酶的所述多核苷酸提供在单一核酸分子上。
16.如权利要求10所述的系统,其中所述引导rna呈经分离的rna的形式,或在载体中编码,并且其中所述载体是病毒载体、质粒载体或土壤杆菌属载体。
17.如权利要求10所述的系统,其进一步包含供体多核苷酸。
18.如权利要求17所述的系统,其中所述供体多核苷酸包含编码核酸序列、非编码核酸序列、或编码核酸序列和非编码核酸序列的组合。
19.如权利要求17所述的系统,其中所述供体多核苷酸包含启动子。
20.如权利要求17所述的系统,其中所述供体多核苷酸包含一个或多个转基因。
21.如权利要求10所述的系统,其中所述crispr相关转座酶包含一个或多个核定位信号。
22.如权利要求10所述的系统,其中所述靶标序列在细胞内。
23.如权利要求22所述的系统,其中所述细胞是真核细胞。
24.如权利要求23所述的系统,其中所述真核细胞是植物细胞。
25.一种用于对细胞中的靶标核酸序列进行序列特异性修饰的方法,其包括向包含所述靶标核酸序列的细胞提供如权利要求10-24中任一项所述的系统,条件是所述方法不包括治疗人体或动物体中疾病的方法。
26.一种用于对细胞中的靶标核酸序列进行序列特异性修饰的方法,其包括向包含所述靶标核酸序列的细胞提供如权利要求10-24中任一项所述的系统,其中所述细胞为植物细胞。
27.如权利要求25所述的方法,其中所述细胞是植物细胞。
28.一种用于对细胞中的靶标核酸序列进行序列特异性修饰的方法,其包括向所述细胞提供氨基酸序列如seq id no:201所示的crispr相关转座酶,借此所述靶标核酸序列被修饰,条件是所述方法不包括治疗人体或动物体中疾病的方法。
29.一种用于对细胞中的靶标核酸序列进行序列特异性修饰的方法,其包括向所述细胞提供氨基酸序列如seq id no:201所示的crispr相关转座酶,借此所述靶标核酸序列被修饰。
30.如权利要求28或29所述的方法,其进一步包括能够与所述crispr相关转座酶缔合以及与所述靶标核酸序列杂交的引导rna。
31.如权利要求30所述的方法,其中:
32.如权利要求30所述的方法,其中:
33.如权利要求28或29所述的方法,其中所述crispr相关转座酶包含一个或多个核定位信号。
34.如权利要求31或32所述的方法,其中编码所述crispr相关转座酶的所述重组dna分子包含与选自由seq id no:78、559-561、2405-2409和3085-3089组成的组的核苷酸序列具有至少90%同一性的核苷酸序列。
35.如权利要求28或29所述的方法,其中所述靶标核酸序列包含编码核酸序列、非编码核酸序列、或编码核酸序列和非编码核酸序列的组合。
36.如权利要求28或29所述的方法,其中所述靶标核酸序列包含(a)所述细胞或所述细胞中的细胞器的内源性核基因;或(b)所述细胞的内源性细胞器基因;或(c)所述细胞的转基因。
37.如权利要求28或29所述的方法,其进一步包括向所述细胞提供供体多核苷酸。
38.如权利要求37所述的方法,其中所述供体多核苷酸包含编码核酸序列、非编码核酸序列、或编码核酸序列和非编码核酸序列的组合。
39.如权利要求37所述的方法,其中所述供体多核苷酸包含启动子。
40.如权利要求37所述的方法,其中所述细胞是真核细胞。
41.如权利要求40所述的方法,其中所述真核细胞是植物细胞或动物细胞。
42.一种选择性调节真核细胞中的至少一个靶标dna的转录的方法,其包括使所述真核细胞与以下各物接触:
43.一种选择性调节真核细胞中的至少一个靶标dna的转录的方法,其包括使所述真核细胞与以下各物接触:
44.如权利要求42所述的方法,其中所述真核细胞是动物细胞或植物细胞。
45.如权利要求42或43所述的方法,其中所述靶标dna是启动子。
46.如权利要求42或43所述的方法,其中所述靶标dna是编码核酸序列。
47.如权利要求42或43所述的方法,其中所述引导rna或编码引导rna的所述dna是单链引导rna。
48.如权利要求42或43所述的方法,其中所述靶标dna选自由核靶标dna、线粒体靶标dna和质体靶标dna组成的组。
