首页 / 用于提高基因组工程化效率的方法

用于提高基因组工程化效率的方法有效专利 发明

技术领域

[0003] 本文描述了用于真核细胞中基因组工程化的新颖的方法和材料,特别是通过递送编码RKD2和/或RKD4的核酸和基因组工程化组分来提高基因组工程化(即转化或基因组编辑)效率的方法。
[0004] 序列表
[0005] 本申请案含有以电子方式提交的ASCII格式的序列表,并且通过引用的方式整体并入本文。所述ASCII副本创建于2018年11月25日,名称为KWS0304_SEQLIST_20181123_ST25.txt,大小为73,166字节。

相关背景技术

[0006] 传统育种提供了驯化的植物和动物,而现代生物技术,特别是基因组工程,正在扩大育种能力,并能够实现仅以传统近缘物种杂交不可能实现的改进。使用生物技术已在作物中引入了如高产量、耐除草剂和抗害虫性等多种特性,使全球农业和粮食安全取得巨大进步。然而,此类生物技术产品中外源DNA的存在可引发生物安全和环境问题。
[0007] 通过分离出任何整合的DNA,基因组编辑技术可用于在末端植物中不存在外源DNA的情况下生成靶基因组的位点特异性修饰。此外,通过瞬时表达,基因组编辑可具有瞬时编辑活性以创建位点特异性修饰,而无需在过程的任何时刻进行DNA整合。基因组编辑的植物,特别是衍生自瞬时活性的植物,与传统的基因组修饰的植物有很大不同,并且可能不能作为遗传修饰(GM)的植物调节。因此,基因组编辑技术,特别是经由瞬时编辑的方法,可以为农业提供高精度、安全和强有力的植物育种和发育工具。
[0008] 然而,基于瞬时活性的基因组工程面临着更多的挑战。与稳定转化相比,瞬时工程化通常导致较少的修饰的细胞。在没有整合的可选择标记的情况下,识别工程化细胞并在再生植物中实现同源修饰极具挑战性。这些挑战阻碍了瞬时基因编辑作为用于植物改良的育种工具的常规实现。因此,急需提高基因组工程化效率的新颖的方法和材料。

具体实施方式

[0072] 定义
[0073] 除非另外说明,本文使用的技术和科学术语具有与本发明所属的领域内的普通技术人员通常所理解的相同的含义。
[0074] 在本申请的上下文中所使用的术语“约”是指所述值的+/‑10%,优选所述值的+/‑5%。例如,约100个核苷酸(nt)应理解为90‑110nt的值,优选95‑105nt的值。
[0075] 转化的或基因编辑的植物细胞的再生可能包括体细胞胚形成过程,其是从单个体细胞或体细胞群中衍生出植物或胚胎的人工过程。体细胞胚是由通常不参与胚胎发育的植物细胞形成的,即芽、叶、枝条等植物组织。此过程的应用可包括:基因上一致的植物材料的克隆繁殖;消除病毒;为基因转化提供来源组织;从单细胞如原生质体生成整株植物;合成种子技术的发展。可培养源自胜任的来源组织的细胞以形成愈伤组织。组织培养基中的植物生长调节剂如植物生长素或细胞分裂素可被操纵以诱导愈伤组织形成,并随后被改变以诱导愈伤组织形成胚胎。体细胞胚胎被描述为以两种方式发生:直接或间接。当胚胎从外植体组织开始产生完全相同的克隆时,直接胚形成。当外植体产生未分化或部分分化的细胞(即愈伤组织),其然后维持或分化成植物组织如叶、茎或根时,间接胚形成。
[0076] 根据本发明使用的术语“转基因”是指包含基因或基因构建体的植物、植物细胞、组织、器官或材料,所述基因或基因构建体包含通过自然手段或通过来自另一生物的转化技术转移到所述植物、植物细胞、组织、器官或材料中的“转基因”。术语“转基因”包括核酸序列,包括DNA或RNA,或氨基酸序列,或其组合或混合物。因此,术语“转基因”并不限于通常被鉴定为“基因”的序列,即编码蛋白质的序列。它也可以指例如非蛋白质编码DNA或RNA序列。因此,术语“转基因”通常意味着相应的核酸或氨基酸序列并不自然存在于相应的靶细胞中,相应的靶细胞包括植物、植物细胞、组织、器官或材料。因此,本文中使用的术语“转基因”或“转基因的”是指从一个生物体的基因组中提取或合成产生然后通过分子生物学、遗传学等人工技术以瞬时或稳定的方式引入另一生物体中的核酸序列或氨基酸序列。本文所用的“植物材料”是指可从处于任何发育阶段的植物获得的任何材料。所述植物材料可以通过对植物或其组织或器官原位(in planta)或体外培养获得。因此,所述术语包括植物细胞、组织和器官以及已发育的植物结构,以及亚细胞成分,如核酸、多肽以及所有化学植物物质或代谢物,其可以在植物细胞或室中找到和/或可以由植物产生,或可以从任何植物细胞、组织或处于任何发育阶段的植物的提取物中获得。该术语还包括植物材料的衍生物,例如原生质体,其衍生自植物材料包含的至少一个植物细胞。因此,该术语还包括植物的分生组织细胞或分生组织。
[0077] 本文中所用的术语“基因组工程化”是指对植物细胞的任何遗传信息或基因组进行遗传修饰的策略和技术,包括基因组转化、基因组编辑等。同样,“基因组编辑”是指对植物细胞的任何遗传信息或基因组进行靶向特异性修饰的技术。因此,“基因组工程化”和“基因组编辑”包括对基因编码区域的编辑,以及对基因组的基因编码区域以外的区域的编辑。这些还包括植物细胞的核(如果存在)以及其它遗传信息的编辑或工程化。此外,“基因组工程化”还包括表观遗传编辑或工程化,即靶向修饰,例如甲基化、组蛋白修饰或可能导致基因表达的可遗传变化的非编码RNA。
[0078] 本文所用的术语“基因组编辑”是指对植物细胞的任何遗传信息或基因组进行靶向特异性修饰的策略和技术,包括对基因组的基因编码区域以外的区域(如内含子序列、非编码RNA、miRNA、调节元件的序列如启动子、终止子、转录激活因子结合位点、顺式或反式作用元件等)进行编辑。此外,“基因组编辑”可以包括碱基编辑以用于单核碱基的靶向替换。它还可以包括编辑核基因组以及植物细胞的其它遗传信息,即线粒体基因组或叶绿体基因组以及miRNA、pre‑mRNA或mRNA。此外,“基因组编辑”可以包括可能导致基因表达的可遗传变化的表观遗传编辑或工程化,即靶向修饰,例如DNA甲基化或组蛋白修饰,如组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白苏酰化、组蛋白核糖化或组蛋白瓜氨酸化。“基因组编辑”还可包括可能导致基因表达的可遗传变化的非编码RNA的表观遗传编辑或工程化。
[0079] 本文所用的“碱基编辑器”是指具有与其所衍生的蛋白质相同催化活性的蛋白质或其片段,所述蛋白质或其片段单独或作为分子复合体提供时在本文称为碱基编辑复合体。碱基编辑器具有介导靶向碱基修饰的能力,即转换感兴趣的碱基从而导致感兴趣的点突变,如果碱基转换不引起沉默突变,而是转换包含待用该碱基编辑器转换的位置的密码子编码的氨基酸,则所述点突变进而可导致靶向突变。
[0080] 如本文所用,“调节元件”是指不属于编码蛋白质的核苷酸序列的一部分、但介导编码蛋白质的核苷酸序列表达的核苷酸序列。调节元件包括例如启动子、顺式调节元件、增强子、内含子或终止子。根据调节元件的类型其位于编码蛋白质的核苷酸序列之前(即5'处)或之后(即3'处)的核酸分子上。调节元件在活植物细胞中起作用。术语“可操作地连接”意指调节元件通过此类方式与编码蛋白质的核苷酸序列连接,即通过此类方式相对于编码蛋白质的核苷酸序列例如核酸分子定位,使得编码蛋白质的核苷酸序列的表达在调节元件的控制下可以在活细胞中进行。
[0081] 如本文所用,“上游”表示核酸分子上靠近所述核酸分子5'端的位置。同样,术语“下游”是指核酸分子上靠近所述核酸分子3'端的位置。为避免疑义,核酸分子及其序列通常以从5'到3'的方向(从左到右)表示。
[0082] 如本文所用,“侧翼区域”是修复核酸分子的区域,所述修复核酸分子具有与位于预选位点侧翼(即上游或下游)的DNA区域的核苷酸序列同源的核苷酸序列。
[0083] 如本文所用,“瞬时表达”是指转移的蛋白质/多肽和编码所述蛋白质/多肽的核酸片段在细胞中瞬时表达和/或具有活性,并随着细胞生长而很快关闭和/或降解的现象。
[0084] 如本文所用,“双链DNA断裂诱导酶”、“诱导双链断裂的酶”或“DSBI酶”是能够在称为“识别位点”或“预定位点”的特定核苷酸序列处诱导双链DNA断裂的酶。相应地,“单链DNA断裂诱导酶”、“诱导单链断裂的酶”或“SSBI酶”是能够在称为“识别位点”或“预定位点”的特定核苷酸序列处诱导单链DNA或RNA断裂的酶。
[0085] 如本文中所用,“修复核酸分子”是单链或双链DNA分子或RNA分子,其用作修饰在预选位点处的基因组DNA或RNA的模板,所述预选位点在切割位点附近或位于切割位点处。如本文所用,“用作修饰基因组DNA的模板”是指通过在侧翼区域与位于预选位点侧翼的目标基因组中的相应的同源区域之间的同源重组,任选地与在修复核酸分子的两个末端之一处的非同源末端连接(NHEJ)(例如在只有一个侧翼区域的情况下)组合,在预选位点复制或整合修复核酸分子。
[0086] 如本文所用,“基因组的修饰”是指基因组在至少一个核苷酸中或通过至少一个表观遗传编辑已改变。
[0087] 如本文所用,“预选位点”、“预定位点”或“预定义位点”表示基因组(例如细胞核基因组或叶绿体基因组)中的特定核苷酸序列,在该位置处希望插入、替换和/或删除一个或多个核苷酸。
[0088] 如本文所用,“植物激素”或“植物生长调节剂”是指促进植物细胞分裂和/或植物形态发生的天然存在或合成的任何材料和化学物质。如本文所用,“再生”是指单个或多个细胞增殖并发育成组织、器官和最终完整的植株的过程。
[0089] 如本文所用,术语“载体”或“质粒(载体)”指用于引入或转化、转染或转导到任何真核细胞中、包括根据本发明的植物、植物细胞、组织、器官或材料中的构建体,尤其包括质粒或(质粒)载体、粘粒、人工酵母或细菌人工染色体(YAC和BAC)、噬菌粒、基于细菌噬菌体的载体,表达盒,分离的单链或双链核酸序列,包括线性或环形的序列,或氨基酸序列、病毒载体,包括修饰的病毒,及其组合或混合物。
[0090] 在重组基因的上下文中“重组”可以包括调节序列和/或定位序列。根据本发明的重组构建体或DNA构建体可以整合到载体中,或可以是载体(包括质粒载体),和/或它可以孤立于载体结构存在,例如以单链或双链核酸的形式存在。在例如通过生物或物理方式转化或转染引入重组基因或DNA构建体后,所述重组基因或DNA构建体可以在染色体外持续存在,即未整合到靶细胞的基因组中,例如以双链或单链DNA的形式存在。或,重组基因或DNA构建体可以稳定地整合到靶细胞的基因组中,包括细胞核基因组或靶细胞的其它遗传元件,包括像线粒体或叶绿体这样的质体的基因组。
[0091] 发明人表明,编码RKD2和/或RKD4的核酸尤其在递送转基因和/或基因组工程化组分后的再生早期介导强效应。这种效应并不影响植株的发育,且再生植株在成年期表现出良好的植株生长和可育性。因此,RKD2和RKD4基因的整合可以通过杂交和选择在后代中分离出来。
[0092] RKD2和RKD4是植物特异性RWP‑RK转录因子。RKD2和RKD4是在拟南芥和其它植物物种如小麦和玉米中发现的。RKD2和RKD4单独或组合可以改善基因组工程和/或改善转化或基因编辑的植物细胞的植株再生。RKD2和RKD4单独或一起可以增加植物细胞(优选来源于体细胞组织、胚胎组织、愈伤组织或原生质体)在整个植物优选可育植物中再生的性能或能力。因此,RKD2和RKD4各自或一起可调节体细胞胚形成(体细胞胚形成)和/或可提高植物细胞的增殖速率。RKD2和RKD4一起组合可能具有协同作用。在本文公开的多种方法中,RKD2、RKD4或RKD2和RKD4的组合可瞬时共表达。可以将编码RKD2或RKD4的多核苷酸引入植物细胞中。
[0093] 还提供了编码RKD2或RKD4的核酸,其包含SEQ ID NO:2或5的氨基酸序列。进一步提供编码RKD2或RKD4的核酸,其包含与SEQ ID NO:2或5具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、
99%相同性的氨基酸序列。
[0094] 包含SEQ ID NO:2的氨基酸序列或与SEQ ID NO:2具有至少75%、76%、77%、78%、79%、80%、81%、82%、84%、83%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%、99%相同性的氨基酸序列的编码RKD4的核酸可以包括包含SEQ ID NO:1的核苷酸序列的核酸。所述核酸可包含与SEQ ID NO:1具有至少80%、
81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、
96%、97%、98%、99%相同性的核苷酸序列。或,在严格的杂交条件下,所述核酸可以与包含SEQ ID NO:1的核苷酸序列的核酸或包含与SEQ ID NO:1具有至少80%、81%、82%、
83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、99%相同性的核苷酸序列的核酸的互补链杂交。
[0095] 包含SEQ ID NO:5的氨基酸序列或与SEQ ID NO:5具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、99%相同性的氨基酸序列的编码RKD2的核酸还可以包括包含SEQ ID NO:3或4的核苷酸序列的核酸。所述核酸可包含与SEQ ID NO:3具有至少80%、81%、82%、83%、84%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。所述核酸可包含与SEQ ID NO:4具有至少80%、81%、82%、83%、84%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。或,在严格的杂交条件下,所述核酸可以与包含SEQ ID NO:3的核苷酸序列的核酸或包含与SEQ ID NO:3具有至少80%、81%、82%、83%、84%、85%、86%、87%、
88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交。或,在严格的杂交条件下,所述核酸可以与包含SEQ ID NO:4的核苷酸序列的核酸或包含与SEQ ID NO:4具有至少80%、81%、82%、83%、84%、85%、86%、
87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交。
[0096] 提供了一种重组基因,其包含编码RKD2或RKD4的核酸,所述RKD2或RKD4的核酸包含SEQ ID NO:2或5的氨基酸序列,或与SEQ ID NO:2或5具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、
94%、95%、96%、97%、98%、99%相同性的氨基酸序列。所述核酸可以与一个或多个调节元件可操作地连接。所述调节元件可以是启动子、顺式调节元件、增强子、内含子或终止子。
调节元件可以在核酸序列的5'处。调节元件可以在核酸序列的3'处。调节元件可以是定向启动子。所述核酸可以包括包含SEQ ID NO:1、3或4的核苷酸序列的核酸。所述核酸可包含与SEQ ID NO:1、3或4具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。在严格的杂交条件下,所述核酸可以与包含SEQ ID NO:1、3或4的核苷酸序列的核酸或包含与SEQ ID NO:1、3或4具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交。
[0097] 在一些实施方式中,核酸与异源启动子可操作地连接。所述异源启动子可以是可诱导启动子。
[0098] 异源启动子可以是双向可诱导启动子,如化学可诱导启动子pOp6。pOp6启动子包含优化的lac操纵序列的六个拷贝,如Samalova et al.,Plant J.,2005,41(6):919‑35中所述。作为pOp6/LhGR表达系统的一部分,地塞米松调动LhGR定位到细胞核,LhGR在此激活pOp6。LhGR可以与强组成型启动子(例如泛素启动子或双35S启动子)可操作地连接。所述LhGR编码序列还可包括泛素内含子。作为替代,LhGR和强组成型启动子可以在单独的DNA构建体上表达。
[0099] 在一些实施方式中,在步骤(a)(i)中,将包含与强组成型启动子可操作连接的编码转录因子的多核苷酸序列的另一核酸引入植物细胞中,其中所述转录因子在与地塞米松结合后激活pOp6。在特定的实施方式中,转录因子是LhGR或LhG4。在一些实施方式中,LhGR具有SEQ ID NO:17的氨基酸序列,或与SEQ ID NO:17具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、
99%相同性的氨基酸序列;或其中编码LhGR的核酸包括SEQ ID NO:16的编码序列,或与SEQ ID NO:16具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同性的编码序列。
[0100] 在一些实施方式中,强组成型启动子是泛素启动子或双35S启动子。在一些特定的实施方式中,双35S启动子包括SEQ ID NO:21的核苷酸序列,或与SEQ ID NO:21具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。在一些特定的实施方式中,泛素启动子包括SEQ ID NO:23的核苷酸序列,或与SEQ ID NO:23具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。在一些特定的实施方式中,泛素启动子还包括泛素内含子,所述泛素内含子包括SEQ ID NO:20的核苷酸序列,或与SEQ ID NO:20具有至少90%、91%、92%、93%、94%、95%、96%、97%、
98%、99%相同性的核苷酸序列。
[0101] 激活的pOp6能够指导与pOp6可操作地连接的基因的转录。由于具有双向性,pOp6既能表达目的基因(如发育基因),又能表达报告基因(如GUS或tdTomato)。作为替代,也可以使用pOp1、pOp2或pOp4。
[0102] 或,异源启动子可以是XVE/OlexA,例如,作为β‑雌二醇可诱导的XVE/OlexA系统的一部分。在暴露于β‑雌二醇后,XVE/OlexA被激活并能指导与XVE/OlexA可操作地连接的基因的转录。
[0103] 由于植物中β‑葡萄糖醛酸酶具有较低的活性水平,因此GUS报告系统适用于大多数植物(GUS是β‑葡萄糖醛酸酶)。tDTomato基因(tDT)编码异常明亮的红色荧光蛋白,该荧光蛋白的最大激发在554nm处,最大发射在581nm处。另外,也可以使用其它报告酶,如荧光素酶、β‑半乳糖苷酶、氯霉素乙酰转移酶(CAT),以及碱性磷酸酶。
[0104] 还提供了包含上述任何核酸或重组基因的DNA构建体,优选载体。所述核酸可以包括包含SEQ ID NO:1、3或4的核苷酸序列的核酸。所述核酸可包含与SEQ ID NO:1、3或4具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同性的核苷酸序列。或,在严格的杂交条件下,所述核酸可以与包含SEQ ID NO:1、3或4的核苷酸序列的核酸或包含与SEQ ID NO:1、3或4具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、99%相同性的核苷酸序列的核酸的互补链杂交。在一些实施方式中,所述DNA构建体是质粒。在一些实施方式中,DNA构建体包含双向可诱导启动子(例如pOp6)。核酸可以与所述双向可诱导启动子可操作地连接。在一些实施方式中,DNA构建体包含XVE/OlexA启动子系统,所述启动子系统能够在暴露于β‑雌二醇后诱导核酸的表达。另一报告核酸(如GUS或tdTomato)也可以与双向可诱导启动子可操作地连接。报告核酸可以帮助选择以泄漏方式表达核酸的植物,例如当没有双向可诱导启动子的诱导发生时。例如,可以选择表达GUS或tdTomato的植物,当不施用地塞米松时,GUS或tdTomato与地塞米松诱导的pOp6可操作地连接。
[0105] 植物细胞
[0106] 另一方面,提供了一种植物细胞,其包含本文描述的RKD2或RKD4、核酸、重组基因和DNA构建体中的一种或多种,优选转基因。在一些实施方式中,RKD2或RKD4包含SEQ ID NO:2或5的氨基酸序列。在一些实施方式中,RKD2或RKD4包含与SEQ ID NO:2或5具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、99%相同性的氨基酸序列。所述核酸可以包括包含SEQ ID NO:1、3或4的核苷酸序列的核酸。所述核酸可包含与SEQ ID NO:1、3或4具有至少80%、81%、82%、
83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、99%相同性的核苷酸序列。在严格的杂交条件下,所述核酸可以与包含SEQ ID NO:1、
3或4的核苷酸序列的核酸或包含与SEQ ID NO:1、3或4具有至少80%、81%、82%、83%、
84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、
99%相同性的核苷酸序列的核酸的互补链杂交。还提供了包含植物细胞的植物、植物的一部分、种子、胚或愈伤组织。
[0107] 植物细胞可以是任何类型的植物材料的一部分或源于任何类型的植物材料,优选枝条、下胚轴、子叶、茎、叶、叶柄、根、胚、愈伤组织、花、配子体或其部分,或可以是原生质体或源于原生质体。可以使用分离的植物细胞以及植物材料,即包含植物细胞的整个植物或部分植物。
[0108] 植物的一部分,或多个植物的多个部分,可以附属于完整的整株植物,或与完整的整株植物分离。植物的这些部分包括但不限于植物的器官、组织和细胞,优选种子。
[0109] 植物细胞、植物部分或植物可以来自任何植物物种,无论是单子叶植物还是双子叶植物。优选地,可适用于本发明的方法和用途的植物是选自以下属的植物:大麦属(Hordeum)、高粱属(Sorghum)、甘蔗属(Saccharum)、玉米属(Zea)、狗尾草属(Setaria)、稻属(Oryza)、小麦属(Triticum)、黑麦属(Secale)、小黑麦属(Triticale)、苹果属(Malus)、短柄草属(Brachypodium)、山羊草属(Aegilops)、胡萝卜属(Daucus)、甜菜属(Beta)、桉树属(Eucalyptus)、烟草属(Nicotiana)、茄属属(Solanum)、咖啡属(Coffea)、葡萄属(Vitis)、Erythrante、螺旋狸藻属(Genlisea)、黄瓜属(Cucumis)、Marus属、拟南芥属(Arabidopsis)、须弥芥属(Crucihimalaya)、碎米荠属(Cardamine)、独行菜属(Lepidium)、荠菜属(Capsella)、Olmarabidopsis属、筷子芥属(Arabis)、芸苔属(Brassica)、芝麻菜(Eruca)、萝卜属(Raphanus),柑橘属(Citrus)、麻风树属(Jatropha)、杨树属(Populus)、苜蓿属(Medicago)、鹰嘴豆属(Cicer)、木豆属(Cajanus)、菜豆属(Phaseolus)、大豆属(Glycine)、棉属(Gossypium)、黄芪属(Astragalus)、莲属(Lotus)、蝴蝶草属(Torenia)、葱属(Allium)或向日葵属(Helianthus)。更优选地,所述植物选自大麦(Hordeum vulgare)、Hordeum bulbusomuMSorghum bicolor)、甘蔗(Saccharum officinarium)、玉米属(Zea spp.),包括玉米(Zea mays),粟(Setaria italica)、小粒稻(Oryza minuta)、水稻(Oryza sativa)、澳洲野生稻(Oryza australiensis)、高杆稻(Oryza alta)、普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、黑麦(Secale cereale)、小黑麦(Triticale)、苹果(Malus domestica)、二穗短柄草(Brachypodium distachyon)、Hordeum marinum、山羊草(Aegilops tauschii)、胡萝卜(Daucus glochidiatus)、甜菜属(Beta spp.),包括甜菜(Beta vulgaris)、美洲野胡萝卜(Daucus pusillus)、Daucus muricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotiana sylvestris)、绒毛状烟草(Nicotiana tomentosiformis)、绒毛状烟草(Nicotiana tabacum)、本氏烟(Nicotiana benthamiana)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中粒咖啡(Coffea canephora)、葡萄(Vitis vinifera)、Erythrante guttata、螺旋狸藻属(Genlisea aurea)、黄瓜(Cucumis  sativus)、川桑(Marus notabilis)、拟南芥(Arabidopsis arenosa)、Arabidopsis lyrata、鼠耳芥(Arabidopsis thaliana)、须弥芥(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalaya wallichii)、Cardamine nexuosa、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa pastoris)、小拟南芥(Olmarabidopsis pumila)、硬毛南芥(Arabis hirsute)、欧洲油菜(Brassica napus)、甘蓝(Brassica oleracea)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芸苔(Brassica  juncacea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicaria subsp.sativa)、甜橙(Citrus sinensis)、麻风树(Jatropha curcas)、毛果杨(Populus trichocarpa)、蒺藜苜蓿(Medicago truncatula)、Cicer yamashitae、Cicer bijugum、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicer judaicum、Cajanus cajanifolius、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、棉花(Gossypium sp.)、紫云英(Astragalus sinicus)、Lotus japonicas、蓝猪耳(Torenia fournieri)、洋葱(Allium cepa)、葱(Allium fistulosum)、大蒜(Allium sativum)、向日葵(Helianthus annuus)、菊芋(Helianthus tuberosus)和/或韭菜(Allium tuberosum)。
特别优选的是甜菜(Beta vulgaris)、玉米(Zea mays)、普通小麦(Triticum aestivum)、大麦(Hordeum vulgare)、黑麦(Secale cereale)、向日葵(Helianthus annuus)、马铃薯(Solanum tuberosum)、高粱(Sorghum bicolor)、芜菁(Brassica rapa)、油菜(Brassica napus)、芸苔(Brassica  juncacea)、甘蓝(Brassica oleracea)、萝卜(Raphanus sativus)、水稻(Oryza sativa)、大豆(Glycine max)和/或棉花(Gossypium sp)。
[0110] 遗传修饰的植物细胞可以是全株植物的一部分,也可以是该部分中的一部分。因此,本发明还涉及包含上述遗传修饰的植物细胞的植物或植物部分。
[0111] 在允许对所述植物细胞的基因组进行遗传修饰的条件下,通过在RKD2或RKD4的存在下整合目的转基因和基因组工程化组分的活性,培养已经(共)引入基因组工程化组分的植物细胞。
[0112] 植物细胞的遗传修饰
[0113] 还提供了在植物细胞中进行遗传修饰的方法。所述方法包括向植物细胞中引入(i)本文所述的任何核酸、重组基因或DNA构建体;和(ii)转基因和/或基因组工程化组分。植物细胞可以在允许从核酸、重组基因或DNA构建体合成RKD2或RKD4多肽的条件下培养。植物细胞可以在允许在RKD2或RKD4多肽存在下通过基因组工程化组分的活性对所述植物细胞的基因组进行遗传修饰的条件下培养。
[0114] 基因组工程化组分可以作为蛋白质和/或编码基因组工程化组分的核酸引入,特别是作为DNA诸如质粒DNA、RNA、mRNA或RNP引入。基因组工程可用于制造转基因、基因编辑或碱基编辑的植物材料。
[0115] 对于要修饰的植物细胞,可以使用基于生物学途径的转化方法,例如农杆菌(Agrobacterium)转化或病毒载体介导的植物转化。常见的生物学方法是用农杆菌属进行转化,其几十年来已用于多种不同的植物材料中。病毒载体介导的植物转化也可用于将遗传物质引入目的细胞。农杆菌介导的转化是指使用根癌农杆菌(Agrobacterium tumefaciens)将外源DNA输送到植物细胞中,根癌农杆菌是一种土壤细菌,其用作天然的基因工程载体。根癌农杆菌能侵入植物并在相当广泛的植物范围中转移外源DNA。
[0116] 或,可以使用基于物理递送方法的转化方法,如粒子轰击或显微注射。粒子轰击包括基因枪转染或微粒介导的基因转移,其是指将包含核酸或目的基因构建体的包衣微粒或纳米颗粒转移到靶细胞或组织中的物理递送方法。物理引入手段适合于引入核酸即RNA和/或DNA,以及蛋白质。粒子轰击和显微注射已经成为将遗传物质引入目的植物细胞或组织的TM杰出技术。Helenius et al.,“Gene delivery into intact plants using the Helios  Gene Gun”,Plant Molecular Biology Reporter,2000,18(3):287‑288公开了粒子轰击作为将物质引入植物细胞的物理方法。因此,存在多种植物转化方法将基因构建体形式的遗传物质引入目的植物细胞,包括植物生物技术领域的技术人员已知的生物学和物理方法,这些方法可用于将编码至少一种壁相关激酶的至少一种基因引入植物细胞、组织、器官或整株植物中至少一个的至少一个细胞中。
[0117] 本文使用的术语“粒子轰击”,也称为“基因枪转染”或“微粒介导的基因转移”是指将包含RKD2或RKD4基因、基因组工程化组分和/或转基因的包衣微粒或纳米颗粒转移到靶细胞或组织中的物理递送方法。微粒子或纳米粒子起抛射作用,并在高压下使用适当的设备(通常称为基因枪)向目的靶结构发射。通过粒子轰击的转化使用覆着有目的构建体的金属微弹,然后将其使用称为“基因枪”的设备(Sandford et al.1987)以足够快(约1500km/h)的高速射向靶细胞,以穿透靶组织的细胞壁,但不足以导致细胞死亡。对于已将细胞壁完全移除的原生质体来说,条件在逻辑上是不同的。所述至少一个微弹上沉淀的构建体在轰击后被释放到所述细胞中。微弹的加速通过高压放电或压缩气体(氦)完成。关于所使用的金属颗粒,其必须是无毒、无反应性的,并且它们的直径小于靶细胞的直径。最常用的是金或钨。基因枪及相关系统的制造商和供应商提供了大量关于其一般用途的公开信息。
[0118] 在微粒轰击的特别优选实施方式中,一个或多个RKD2或RKD4基因、基因组工程化组分和/或转基因通过微载体共同递送,所述微载体包括大小在0.4‑1.6微米范围内(μm)、优选0.4‑1.0μm范围内的金颗粒.在示例性过程中,每次轰击使用10‑1000μg的金颗粒,优选50‑300μg。
[0119] RKD2或RKD4基因、基因组工程化组分和/或转基因可以例如使用Bio‑Rad PDS‑1000/He粒子枪或手持式Helios基因枪系统递送到靶细胞中。当使用PDS‑1000/He粒子枪系统时,轰击破裂压力为450‑2200psi,优选450‑1100psi,而Helios基因枪系统的破裂压力为
100‑600psi。可以将一种以上的化学物质或构建体与基因组工程化组分同时共递送到靶细胞中。
[0120] 上述用于转化和转染的递送方法可同时用于引入本发明的工具。同样,存在用于将目的核酸或氨基酸构建体特异性引入植物细胞中的特异性转化或转染方法,所述方法包括电穿孔、显微注射、纳米颗粒和细胞穿透肽(CPP)。此外,存在基于化学的转染方法以引入基因构建体和/或核酸和/或蛋白质,所述方法尤其包括用磷酸钙转染,使用脂质体(例如阳离子脂质体)转染,或用阳离子聚合物(包括DEAD‑葡聚糖或聚乙烯亚胺)转染,或其组合。上述递送技术可单独或组合用于体内(包括原位)或体外方法中。
[0121] 在一些实施方式中,基因组工程化组分包含:
[0122] a)诱导双链断裂(DSB)的酶或编码其的核酸,以及任选存在的修复核酸分子,其中所述DSB诱导酶任选地识别所述细胞基因组中的预定位点;
[0123] b)诱导单链断裂(SSB)的酶或编码其的核酸,以及任选存在的修复核酸分子,其中所述SSB诱导酶任选地识别所述细胞基因组中的预定位点;
[0124] c)碱基编辑酶,其任选地与去武装的DSB或SSB诱导酶融合,其中所述碱基编辑酶优选识别所述细胞基因组中的预定位点;或
[0125] d)实现DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白核糖基化或组蛋白瓜氨酸化的酶,其任选地与去武装的DSB或SSB诱导酶融合,其中所述酶优选识别所述细胞基因组中的预定位点。
[0126] 为了能够在预定的靶位点处断裂,所述酶优选包括结合/识别结构域和切割结构域。能够诱导双链或单链断裂的特定的酶是核酸酶或切口酶及其变体,包括不再包含核酸酶或切口酶功能,而是与另一酶结合用作识别分子这样的酶。近年来,已经开发了许多合适的核酸酶,尤其是定制的核酸内切核酸酶,包括大范围核酸酶、锌指核酸酶、TALE核酸酶、例如源自格氏嗜盐碱杆菌(Natronobacterium gregoryi)的Argonaute核酸酶,以及CRISPR核酸酶,所述CRISPR核酸酶包括例如Cas9、Cpf1、Csm1、MAD7、casX或CasY核酸酶作为成簇规律间隔短回文重复序列(CRISPR)系统的一部分。在本发明的优选方案中,基因组工程化组分包含选自以下的DSB或SSB诱导酶或其变体:CRISPR/Cas内切核酸酶、CRISPR/Cas9内切核酸酶、CRISPR/Cpf1内切核酸酶、CRISPR/Csm1内切核酸酶、CRISPR/MAD7内切核酸酶、CRISPR/CasX内切核酸酶、CRISPR/Casy内切核酸酶、锌指核酸酶(ZFN)、归巢内切核酸酶、大范围核酸酶,以及TAL效应子核酸酶。
[0127] 稀有切割核酸内切核酸酶是DSBI/SSBI酶,其具有优选约14至70个连续核苷酸的识别位点,因此即使在较大的基因组(例如大多数植物基因组)中,其也具有很低的切割频率。归巢核酸内切核酸酶,也称为大范围核酸酶,其构成了这种稀有切割核酸内切核酸酶的家族。它们可以由内含子、独立基因或间插序列编码,并具有惊人的结构和功能特性,使它们与更经典的限制酶(通常源自细菌限制性修饰II型系统)区分开来。它们的识别位点具有普遍的不对称性,这与大多数限制性内切核酸酶识别位点的特征性二元对称性相反。由内含子或内蛋白编码的几种归巢核酸内切核酸酶已显示可促进其各自的遗传元件归巢到等位基因的无内含子或无内蛋白位点中。通过在无内含子或无内蛋白等位基因中造成位点特异性双链断裂,这些核酸酶产生重组末端,这些末端参与基因转换过程,该过程复制编码序列并导致在DNA水平上插入内含子或间插序列。其它一系列稀有切割大范围核酸酶及其各自的识别位点在WO 03/004659(第17至20页)的表I(Table I)中提供(通过引用方式并入本文中)。
[0128] 此外,可以使用方法来设计定制的稀有切割内切核酸酶,这些酶基本上识别所选择的任何目标核苷酸序列。简而言之,嵌合限制酶可以通过使用设计成识别特定核苷酸序列的锌指结构域与来自天然限制酶(例如FokI)的非特异性DNA切割结构域之间的杂交来制备。这种方法描述于WO 03/080809、WO 94/18313或WO 95/09233和Isalan et al.(2001)中。以HIV‑1启动子为目标说明了一种快速、普遍适用的锌指工程方法。Nature biotechnology,19(7):656;Liu et al.(1997)。用于在复杂基因组中独特寻址的多指锌指蛋白的设计。Proceedings of the National Academy of Sciences,94(11):5525‑5530。
[0129] 定制的内切核酸酶的另一个实例包括TALE核酸酶(TALEN),其基于与核酸酶(例如FokI或其变体)的催化结构域融合的来自细菌属黄单胞菌(Xanthomonas)的转录激活因子样效应蛋白(TALE)。这些TALE的DNA结合特异性由串联排列的34/35个氨基酸重复单元的重复可变的双连残基(RVD)定义,使得一个RVD特异性地识别目标DNA中的一个核苷酸。这些重复单元可以组装以识别基本上任何的目标序列,并与核酸酶的催化结构域融合,以产生序列特异性内切核酸酶(参见例如Boch et al.(2009).Breaking the code of DNA binding specificity of TAL‑type III effectors.Science,326(5959),1509‑1512;Moscou&Bogdanove(2009).A simple  cipher governs  DNA  recognition  by  TAL effectors.Science,326(5959),1501‑1501;以及WO 2010/079430、WO 2011/072246、WO 
2011/154393、WO 2011/146121、WO 2012/001527、WO 2012/093833、WO 2012/104729、WO 
2012/138927、WO 2012/138939)。WO 2012/138927进一步描述了具有多种催化结构域的单体(致密型)TALEN和TALE以及它们的组合。
[0130] 最近,已经描述了一种新型的可定制的内切核酸酶系统;称为CRISPR/Cas系统。在其自然环境中的CRISPR系统描述了一种分子复合体,其包含至少一种小的单独的非编码RNA与Cas核酸酶或另一种CRISPR核酸酶(如Cpf1核酸酶或Csm1核酸酶)的组合(Zetsche et al.,“Cpf1 Is a Single RNA‑Guides Endonuclease of a Class 2 CRISPR‑Cas System”,Cell,163,pp.1‑13,October 2015.;US 2017/0233756 A1),所述核酸酶可以产生特定的DNA双链断裂。目前,CRISPR系统分成2类,包含5种类型的CRISPR系统,例如使用Cas9作为效应子的II型系统和使用Cpf1作为效应子分子的V型系统(Makarova et al.,Nature Rev.Microbiol.,2015)。在人工CRISPR系统中,合成的非编码RNA和CRISPR核酸酶和/或任选的修饰的CRISPR核酸酶(其经修饰以充当切口酶或缺乏任何核酸酶功能),可与结合了crRNA和/或tracrRNA功能的至少一种合成或人工向导RNA或gRNA组合使用(Makarova et al.,2015,同上)。由自然界中CRISPR/Cas系统介导的免疫应答应需要CRISPR‑RNA(crRNA),其中控制CRISPR核酸酶特异性激活的这种向导RNA的成熟在迄今已表征的多种CRISPR系统之间差异很大。首先,入侵的DNA(也称为间隔区)整合在CRISPR基因座近端的两个相邻重复区域之间。II型CRISPR系统编码Cas9核酸酶作为干扰步骤的关键酶,该系统既包含crRNA又包含反式激活RNA(tracrRNA)作为向导基序。这些杂交并形成双链(ds)RNA区域,这些区域被RNAseIII识别并可以切割以形成成熟的crRNA。然后这些进而与Cas分子结合,以便将核酸酶特异性地引导至目标核酸区域。重组gRNA分子既可以包含可变DNA识别区还可以包含Cas相互作用区域,因此可以独立于特定的靶核酸和所需的Cas核酸酶而进行特异性设计。
[0131] 作为进一步的安全机制,PAM(前间区序列邻近基序)必须存在于靶核酸区域中;这些是直接接在识别Cas9/RNA复合体的DNA之后的DNA序列。来源于化脓性链球菌(Streptococcus pyogenes)的Cas9的PAM序列已描述为“NGG”或“NAG”(标准IUPAC核苷酸代码)(Jinek et al,“A programmable dual‑RNA‑guided DNA endonuclease in adaptive bacterial immunity”,Science 2012,337:816‑821)。来源于金黄色葡萄球菌(Staphylococcus aureus)的Cas9的PAM序列为“NNGRRT”或“NNGRR(N)”。其它变体CRISPR/Cas9系统是已知的。因此,脑膜炎奈瑟氏菌(Neisseria meningitidis)的Cas9在PAM序列NNNNGATT处切割。嗜热链球菌(Streptococcus thermophilus)的Cas9在PAM序列NNAGAAW处切割。最近,已经针对空肠弯曲菌(Campylobacter)的CRISPR系统描述了又一PAM基序NNNNRYAC(WO 2016/021973 A1)。对于Cpf1核酸酶,已经描述了不含tracrRNA的Cpf1‑crRNA复合体有效识别和切割前置有短的富含T的PAM的目标DNA,这与Cas9系统所识别的通常富含G的PAM形成对比(Zetsche et al.,同上)。此外,通过使用修饰的CRISPR多肽,可以获得特定的单链断裂。Cas切口酶与多种重组gRNA的组合使用还可以通过产生双DNA切口诱导高度特异性的DNA双链断裂。此外,通过使用两个RNA,可以优化DNA结合的特异性,并因此优化DNA切割。其它的CRISPR效应子,如最初描述细菌的CasX和CasY效应子,同时是可用的,并代表可用于基因组工程目的的另外的效应子(Burstein et al.,“New CRISPR‑Cas systems from uncultivated microbes”,Nature,2017,542,237‑241)。
[0132] DSBI/SSBI酶的切割位点与DNA或RNA上诱导断裂的确切位置有关。切割位点可以包含或可以不包含在DSBI/SSBI酶的识别位点中(与之重叠),因此据信DSBI/SSBI酶的切割位点位于其识别位点处或附近。DSBI/SSBI酶的识别位点(有时也称为结合位点)是通过DSBI/SSBI酶(特异性)识别并决定其结合特异性的核苷酸序列。例如,TALEN或ZNF单体具有分别由其RVD重复或ZF重复确定的识别位点,而其切割位点由其核酸酶结构域(例如FokI)确定,并且通常在识别位点之外。在为二聚TALEN或ZFN的情况下,切割位点位于各自单体的两个识别/结合位点之间,其中发生切割的该间隔DNA或RNA区域被称为间隔区。
[0133] 本领域技术人员能够选择识别一特定识别位点并在预选/预定位点处或其附近的切割位点处诱导DSB或SSB的DSBI/SSBI酶,或设计这种DSBI/SSBI酶。或,可以使用任何常规的转化方法或通过与其基因组中具有DSBI/SSBI酶识别位点的生物体杂交,将DSBI/SSBI酶识别位点引入目标基因组中,然后,可以在该DSBI/SSBI酶的切割位点处或附近引入任何所需的核酸。
[0134] 在多个实施方式中,基因组的修饰包括以下一种或多种:i)替换至少一个核苷酸;ii)删除至少一个核苷酸;iii)插入至少一个核苷酸;iv)DNA甲基化的变化;和v)组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白苏酰化、组蛋白核糖基化或组蛋白瓜氨酸化的变化。
[0135] 在一些实施方式中,基因组工程化组分的活性诱导植物细胞基因组中的一个或多个双链断裂、植物细胞基因组中的一个或多个单链断裂、植物细胞基因组中的一个或多个碱基编辑事件、或植物细胞基因组中的DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白类泛素化、组蛋白核糖化或组蛋白瓜氨酸化中的一个或多个。
[0136] 在一些实施方式中,在诱导一个或多个双链断裂或一个或多个单链断裂之后,进行非同源末端连接(NHEJ)和/或通过同源重组机制(HDR)对断裂进行同源定向修复。NHEJ和HDR是修复断裂的两个主要和不同的途径。同源重组需要存在同源序列作为模板(如修复核酸分子或“供体”)来指导细胞修复过程且修复结果是无错误和可预测的。在缺乏用于同源重组的模板(或修复核酸分子或“供体”)序列的情况下,细胞通常试图通过非同源末端连接(NHEJ)过程来修复断裂。
[0137] 在本实施方式的特别优选方面,将修复核酸分子另外引入植物细胞中。修复核酸分子是单链或双链DNA分子或RNA分子,其用作修饰在预选位点处的基因组DNA或RNA的模板,所述预选位点在切割位点附近或位于切割位点处。在一些实施方式中,将修复核酸分子用作修饰基因组DNA的模板,其中通过在侧翼区域与位于预选位点侧翼的目标基因组中的相应的同源区域之间的同源重组,任选地与在修复核酸分子的两个末端之一处的非同源末端连接(NHEJ)(例如,在只有一个侧翼区域的情况下)组合,在预选位点复制或整合所述修复核酸分子。通过同源重组的整合允许修复核酸分子精确地连接到目标基因组直至达到核苷酸水平,而NHEJ可能导致在修复核酸分子和基因组DNA之间的连接处有较小的插入/删除。
[0138] 在本文所述方面的多个实施方式中,发生了基因组的修饰,其中基因组已发生至少一个核苷酸改变。可以通过插入转基因(优选包括目的转基因的表达盒)、替换至少一个核苷酸和/或删除至少一个核苷酸和/或插入至少一个核苷酸来修饰基因组,只要导致与修饰前预选基因组靶位点的核苷酸序列相比产生至少一个核苷酸的总变化即可,从而允许例如通过技术人员很清楚的诸如测序或PCR分析等技术来识别修饰。
[0139] 可在基因组(例如,细胞核基因组或叶绿体基因组)中的预选位点、预定位点或预定义位点,即特定的核苷酸序列处修饰基因组,在该位置处希望插入、替换和/或删除一个或多个核苷酸。例如,预选位点、预定位点或预定义位点可以是内源性基因座或在先前引入的外源DNA、RNA或转基因中的或与之连接的特定核苷酸序列。预选位点可以是一个特定的核苷酸位置,在该位置处(之后)打算插入一个或多个核苷酸。所述预选位点还可以包括将被交换(替换)或删除的一个或多个核苷酸的序列。
[0140] 在多个实施方式中,选择侧翼区域的长度和百分比序列相同性以使得能够在所述侧翼区域与其在预选位点上游或下游对应的DNA区域之间进行同源重组。与修复核酸分子的侧翼DNA区域具有同源性的位于预选位点侧翼的DNA区域也被称为基因组DNA中的同源区。
[0141] 为了具有足够的同源性以进行重组,修复核酸分子的侧翼DNA区域的长度可以不同,且其长度至少应为约10nt、约15nt、约20nt、约25nt、约30nt、约40nt或约50nt。然而,侧翼区域实际上可以尽可能长(例如,高达约100‑150kb,如完整的细菌人工染色体(BAC))。优选地,侧翼区域为约50nt至约2000nt,例如约100nt、200nt、500nt或1000nt。此外,目的DNA侧翼的区域不必与同源性区域(预选位点侧翼的DNA区域)相同,并且可以与预选位点侧翼的DNA区域具有约80%至约100%的序列相同性,优选约95%至约100%的序列相同性。侧翼区域越长,对同源性的要求越不严格。此外,为了在不改变相邻DNA序列的DNA序列的情况下实现在预选位点处的目标DNA序列的交换,侧翼DNA序列优选应与预选位点侧翼的上游和下游DNA区域相同。
[0142] 为了在预选位点实现序列修饰,必须选择侧翼区,使得上游侧翼区的3'端和/或下游侧翼区的5'端与预定位点的末端对齐。因此,上游侧翼区域的3'端决定了预定位点的5'端,而下游侧翼区域的5'端决定了预定位点的3'端。
[0143] 预选位点位于所述切割(和/或识别)位点之外或远离所述切割(和/或识别)位点,使得其中欲进行基因组修饰的位点(预选位点)不包括DSBI/SSBI酶的切割位点和/或识别位点,从而使得预选位点不与切割(和/或识别)位点重叠。因此,就这一点而言,在外部/远离意味着位于切割(和/或识别)位点的上游或下游。
[0144] 在多个实施方式中,根据本发明的至少一个碱基编辑器暂时或永久地与至少一个位点特异性DSBI/SSBI酶复合体或至少一个修饰的位点特异性DSBI/SSBI酶复合体连接,或任选地与所述至少一个位点特异性DSBI/SSBI酶复合体的组分连接。该连接可以是共价的和/或非共价的。本文公开的任何碱基编辑器或位点特异性DSBI/SSBI酶复合体、或其催化活性片段、或碱基编辑器复合体或位点特异性DSBI/SSBI酶复合体的任何组分均可以作为核酸片段引入细胞中,所述核酸片段表示或编码DNA、RNA或蛋白质效应子,或其可以作为DNA、RNA和/或蛋白质或其任何组合引入。
[0145] 碱基编辑器是具有介导靶向碱基修饰的能力的蛋白质或其片段,所述能力即转换目的碱基以获得目的点突变。优选地,在本发明的背景下,所述至少一种碱基编辑器暂时或永久地与至少一种DSBI/SSBI酶、或任选地与至少一种DSBI/SSBI的组分融合。该融合可以是共价的和/或非共价的。多个出版物显示了使用与胞苷脱氨酶结构域连接的CRISPR/Cas9切口酶或非功能性核酸酶(载脂蛋白B mRNA编辑催化样多肽(APOBEC1),例如源自大鼠的APOBEC)进行靶向碱基转换,主要是从胞苷(C)转换为胸腺嘧啶(T)。胞嘧啶(C)的脱氨基化由胞苷脱氨酶催化,并产生尿嘧啶(U),尿嘧啶(U)具有与胸腺嘧啶(T)碱基配对的特性。大多数已知的胞苷脱氨酶对RNA都起作用,并且已知接受DNA的少数实例需要单链(ss)DNA。对dCas9‑目标DNA复合体的研究表明,在形成Cas9‑向导RNA‑DNA的“R环”复合体时,置换的DNA链中的至少9个核苷酸(nt)未配对(Jore et al.,Nat.Struct.Mol.Biol.,18,529‑536(2011))。实际上,在Cas9 R环复合体的结构中,被置换的DNA链上的前间隔序列的前11个核苷酸是无序的,这表明它们的运动不受严格限制。还据推测,在非模板链中Cas9切口酶诱导的胞嘧啶的突变可能是由于细胞胞嘧啶脱氨酶的可及性引起的。据推测,R环中ssDNA的这一段的子集可以作为与dCas9拴在一起的胞苷脱氨酶的有效底物,以实现DNA中C到U的直接可编程的转换(Komor et al.,同上)。最近,Goudelli et al.,Programmable base editing of A·T to G·C in genomic DNA without DNA cleavage,Nature,2017,551(7681),464中描述了介导基因组DNA中A·T至G·C的转换的腺嘌呤碱基编辑器(ABE)。
[0146] 实现DNA甲基化的酶以及组蛋白修饰酶在本领域中已鉴定。组蛋白翻译后修饰在调节染色质结构和基因表达方面起着重要作用。例如,用于组蛋白乙酰化的酶描述于Sterner D.E.,Berger S.L.(June 2000):“Acetylation  of histones and transcription‑related factors”,Microbiol.Mol.Biol.Rev.64(2):435‑59中。实现蛋白甲基化的酶描述于Zhang Y.,Reinberg D(2001):“Transcription regulation by histone methylation:interplay between different covalent modifications of the core histone tails”,Genes Dev.15(18):2343‑60中。组蛋白泛素化描述于Shilatifard A(2006):“Chromatin modifications by methylation and ubiquitination:
implications in the regulation of gene expression”,Annu.Rev.Biochem.75:243‑69中。用于组蛋白磷酸化的酶描述于Nowak S.J.,Corces V.G.(April 2004):
“Phosphorylation  of histone H3:a  balancing act between chromosome 
condensation and transcriptional activation”,Trends Genet.20(4):214‑20中。用于组蛋白类泛素化的酶描述于Nathan D.,Ingvarsdottir K.,Sterner D.E.,et al.(April 
2006):“Histone sumoylation is a negative regulator in Saccharomyces 
cerevisiae and shows dynamic interplay with positive‑acting histone 
modifications”,Genes Dev.20(8):966‑76中。用于组蛋白核糖基化的酶描述于Hassa P.O.,Haenni S.S.,Elser M.,Hottiger M.O.(September 2006):“Nuclear ADP‑ribosylation reactions in mammalian cells:where are we today and where are we going?”,Microbiol.Mol.Biol.Rev.70(3):789‑829中。组蛋白瓜氨酸化是由称为肽基精氨酸脱氨酶4(PAD4,也称为PADI4)的酶催化的,它将组蛋白精氨酸(Arg)和单甲基精氨酸残基转化为瓜氨酸。
[0147] 可以将实现DNA甲基化的酶和组蛋白修饰酶融合到去武装的DSB或SSB诱导酶上,所述诱导酶优选辨识出所述细胞基因组中的预定位点。
[0148] 示例性转基因
[0149] 在植物细胞中进行遗传修饰的方法的多个实施方式中,转基因可以是选自以下的基因:编码对非生物胁迫具有抗性或耐受性的基因,所述非生物胁迫包括干旱胁迫、渗透胁迫、热胁迫、冷胁迫、氧化胁迫、重金属胁迫、缺氮、缺磷酸盐、盐胁迫或水涝、除草剂抗性,所述除草剂抗性包括对草甘膦、草铵膦/铵盐草丁膦、潮霉素、原卟啉原氧化酶(PPO)抑制剂、ALS抑制剂和麦草畏的抗性;编码对生物胁迫具有抗性或耐受性的基因,包括病毒抗性基因、真菌抗性基因、细菌抗性基因、昆虫抗性基因;或编码与产量相关性状的基因,所述产量相关的性状包括抗倒伏性、开花时间、抗破碎性、种子颜色、胚乳组成或营养含量。
[0150] 在植物细胞中进行遗传修饰的方法的多个实施方式中,所述方法有效地促进细胞增殖或细胞再生,或有效地提高转基因、基因编辑或碱基编辑的植物的再生效率。所述方法优选在遗传修饰/基因组修饰之后是有效的。在植物细胞中进行遗传修饰的方法的多个实施方式中,所述方法有效地从单个细胞(优选胚胎细胞、体细胞或原生质体)或从愈伤组织细胞诱导直接或间接(体细胞)的胚形成。所述方法优选在遗传修饰/基因组修饰之后是有效的。在多个实施方式中,所述方法有效地提高转基因进入植物细胞的稳定转化效率,或有效地提高遗传修饰的植物的产生效率。在多个实施方式中,该方法有效地提高基因组工程化组分编辑植物细胞基因组的效率,或有效地提高转基因、基因编辑或碱基编辑的植物的生成效率。
[0151] 在一些实施方式中,该方法有效地提高源自顽拗基因型的植物的再生效率,有效地提高来自非常规组织类型的植物的再生效率,或优选地在遗传修饰/基因组修饰之后有效地加速再生过程。
[0152] RKD2或RKD4基因的瞬时表达
[0153] 还提供了在植物细胞中RKD2或RKD4基因瞬时表达的方法。所述方法包括向植物细胞中引入(i)本文所述的核酸、重组基因或DNA构建体;和(ii)转基因和/或基因组工程化组分。
[0154] 在一些实施方式中,RKD2和RKD4瞬时共表达。这种共表达可有效促进细胞增殖。这种共表达可有效促进细胞再生。这种共表达可以有效地从单个细胞诱导胚形成,从而提供无需选择就能再生同质植株的能力。共表达可通过与基因组编辑组分共递送来提高基因组编辑效率。
[0155] 可以如美国临时申请案第62/685,626号中所述进行RKD2和RKD4的瞬时共递送,该案通过全文引用的方式并入本文中。
[0156] 瞬时表达可通过瞬时转化/转染编码优选在化学可诱导启动子下表达的RKD2或RKD4蛋白/多肽的核酸片段来进行。通过在组织和发育特异性启动子或可诱导启动子的控制下稳定转化RKD2或RKD4基因,也可以实现编码RKD2多肽的核酸或编码RKD4多肽的核酸的瞬时表达。RKD2或RKD4基因可以表达,然后具有瞬时活性。RKD2或RKD4基因可以在植物细胞发育改变或诱导条件移除后很快被关闭和降解。例如,地塞米松可诱导启动子pOp6(SEQ ID NO:15)可用于驱动用于RKD2或RKD4基因瞬时转化。
[0157] 瞬时转染、瞬时转化和稳定转化均可产生瞬时表达。“瞬时转化”和“瞬时转染”包括将外来物质[即核酸片段、蛋白质,核糖核蛋白(RNP)等]转移至宿主细胞中,从而在不整合和稳定遗传外来物质的情况下导致基因表达和/或活性。外来成分不是永久地结合到细胞基因组中,而是提供了导致基因组修饰的暂时作用。瞬时转化事件无法传递给下一代,因此是不可继承的。“稳定转化”是指将转移的核酸片段整合到宿主细胞基因组(包括细胞核和细胞器基因组两者)中从而导致核酸片段稳定遗传的事件。
[0158] 例如,瞬时表达可用于瞬时基因组编辑。植物细胞中基因组工程化组分的瞬时活性和/或瞬时存在可导致植物细胞基因组中的一个或多个双链断裂、植物细胞基因组中的一个或多个单链断裂、植物细胞基因组中的一个或多个碱基编辑事件、或植物细胞基因组中的DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白类泛素化、组蛋白核糖化或组蛋白瓜氨酸化中的一个或多个。植物细胞基因组中所产生的修饰例如可选自:至少一个核苷酸的替换,至少一个核苷酸的删除,至少一个核苷酸的插入,DNA甲基化的变化,组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白苯甲酰化、组蛋白核糖基化或组蛋白瓜氨酸化的变化,或其任何组合。
[0159] 除了直接或间接化学诱导与编码RKD2多肽或RKD4多肽的多核苷酸序列可操作连接的异源启动子之外,瞬时表达也可以通过一种或多种定点的转录激活剂来实现。这种定点转录激活剂可以是美国临时申请案第62/609,508号和第62/758,068号中描述的合成转录因子,这两个临时案都通过引用的方式并入本文中。所述合成转录因子可包括至少一个识别结构域和至少一个基因表达调节结构域,特别是激活结构域,其中所述合成转录因子被配置成调节植物或植物细胞的基因组中内源基因的表达。这种内源基因优选为编码参与植物发育过程如根形成或枝条形成中的多肽的(天然)形态发生基因。在一些实施方式中,内源性形态发生基因选自编码RKD4多肽的内源性核酸或编码RKD2多肽的内源性核酸。在一些实施方式中,所述至少一个识别结构域是选自下列的分子或分子片段:至少一个TAL效应子、至少一个去武装的CRISPR/核酸酶系统、至少一个锌指结构域和至少一个去武装的归巢内切核酸酶,或其任何组合。
[0160] 在一些实施方式中,所述至少一个去武装的CRISPR/核酸酶系统是CRISPR/dCas9系统、CRISPR/dCpf1系统、CRISPR/dCsm1系统、CRISPR/dMAD7系统、CRISPR/dCasX系统或CRISPR/dCasY系统,或其任何组合,并且其中所述至少一个去武装的CRISPR/核酸酶系统包括至少一个向导RNA。
[0161] 在一些实施方式中,所述至少一个激活结构域选自酸性转录激活结构域,优选地,其中所述至少一个激活结构域选自水稻白叶枯病菌(Xanthomonas oryzae)的TAL效应基因、来自单纯疱疹(Herpes simplex)的VP16或四聚体VP64、VPR、SAM、Scaffold、Suntag、P300、VP160,或其任何组合。在一些实施方式中,激活结构域是VP64。
[0162] 在一些实施方式中,合成转录因子配置成通过结合位于相对于起始密码子一定距离处的调控区来调节形态发生基因的表达,优选转录。在优选的实施方式中,合成转录因子配置成通过结合位于相对于起始密码子一定距离处的调控区域来增加形态发生基因的表达,优选转录。
[0163] 在一些实施方式中,定点转录激活剂子/合成转录因子或编码其的核酸包括至少一个识别结构域和至少一个激活结构域,其中所述定点转录激活剂配置成增加内源性RKD4多肽或内源性RKD2多肽的表达,优选地通过与位于相对于所述内源性RKD4多肽或内源性RKD2多肽的起始密码子一定距离处的调控区结合来进行。
[0164] 本文所用的“调控区”是指在形态发生基因处或其附近的基因组中至少一个识别结构域与目标序列的结合位点。根据本文进一步公开的至少一个激活结构域和至少一个识别结构域的性质,可以有两个离散的调控区,或可以有重叠的调控区,所述合成转录因子的不同结构域可以以模块化方式组装。
[0165] 在某些实施方式中,所述至少一个识别结构域可以靶向相对于目的基因的起始密码子的至少一个序列(识别位点),所述序列位于相对于目的基因的起始密码子的上游(‑)或下游(+)至少1000bp、‑700bp至+700bp、‑550bp至+500bp、或‑550bp至+425bp处。在某些实施方式中,识别启动子附近的识别结构域可能是优选的,而合成转录因子的靶向范围相比传统的或天然存在的转录因子高度扩展代表了特异性合成转录因子的优点。因为识别和/或激活域可以进行特异性设计和构造以特异性识别和靶向调节的热点。
[0166] 在某些实施方式中,至少一个识别位点可位于相对于目的基因的起始密码子的‑169bp至‑4bp、‑101bp至‑48bp、‑104bp至‑42bp或‑175bp至+450bp处(分别在上游(‑)或下游(+)),以提供允许最佳调节、优选转录激活活性的最佳空间结合环境。尤其对于与作为识别部分的向导RNA一起起作用的基于CRISPR的合成转录因子,结合位点也可以位于目的基因的编码区域内(目的基因的起始密码子下游)。
[0167] 在另外的实施方式中,合成转录因子的识别结构域可以结合到目的基因的5'和/或3'非翻译区(UTR)上。在采用不同识别结构域的实施方式中,至少两个识别结构域可以结合到形态发生基因的不同靶区,包括5'和/或3'UTR,但它们也可以在基因区域之外结合,但仍然与之保持至多1至1500bp的一定的距离。识别结构域可以结合的一个优选区域位于目的形态发生基因的起始密码子上游大约‑4bp到大约‑300bp处,优选大约‑40bp至约‑170p处。此外,这样一来,识别结构域的长度以及因此在目的基因组中相应的识别位点的长度可以根据合成转录因子和所采用的识别结构域的性质而变化。基于所述至少一个识别结构域的分子特征,这也将确定相应的至少一个识别位点的长度。例如,在单个锌指可为约8bp至约20bp,其中优选3至6个锌指基序的阵列的情况下,单个TALE识别位点可为约11bp至约30bp,或更多。基于CRISPR的合成转录因子的gRNA的识别位点包括与目的基因组区域杂交的gRNA的靶向或“间隔”序列,而所述gRNA包括其它结构域,包括与去武装的CRISPR效应子相互作用的结构域。基于去武装的CRISPR效应子的合成转录因子的识别位点将包括PAM基序,因为PAM序列是靶向结合任何CRISPR效应子所必需的,且确切的序列取决于CRISPR效应子的种类,即去武装的CRISPR效应子。
[0168] RKD2或RKD4基因的引入
[0169] 编码RKD2或RKD4的核酸和/或基因组工程化组分可以作为DNA如质粒DNA、RNA、mRNA或RNP引入。
[0170] RKD2或RKD4基因可以与一个或多个基因组工程化组分共同递送。如本文所用,“共同递送”或“共递送”和“共同引入”或“共引入”可互换使用。就本发明而言,“共引入”是指将至少两种不同组分同时递送到同一植物细胞中的过程。因此,将基因组工程化组分和RKD2和/或RKD4一起引入同一植物细胞中。可以通过粒子轰击、显微注射、农杆菌介导转化、电穿孔、电融合、农杆菌渗入法或真空渗入共引入植物细胞中。
[0171] 据信转化细胞的再生能力不如野生型细胞。由于细胞内存在外源DNA,转化细胞易受程序性细胞死亡的影响。递送(例如,轰击损伤)引起的应激也可能触发细胞死亡。因此,促进细胞分裂对修饰细胞的再生是必不可少的。此外,基因组工程的效率在很大程度上受宿主细胞状态的控制。经历快速细胞分裂的细胞,如植物分生组织中的那些,是最适合基因组工程的受体。促进细胞分裂很可能会增加在DNA复制和分裂过程中DNA的整合或修饰,从而提高基因组工程的效率。
[0172] 当RKD2或RKD4多肽与转基因一起在植物细胞中表达时,所述RKD2或RKD4多肽可以增加所述转基因和由所述转基因编码的多肽的表达。当RKD2或RKD4多肽与基因组工程化组分和转基因一起在植物细胞中表达时,可以增加基因组工程化组分的活性。这种增加可能导致转基因更有效地整合到植物细胞的基因组中。
[0173] RKD4多肽编码序列可以来自本领域已知的任何数量的植物。此类植物包括但不限于玉米、拟南芥,以及普通小麦。在一些实施方式中,RKD4多肽编码序列来自普通小麦的RKD4。在一些实施方式中,RKD4多肽编码序列来自拟南芥的RKD4。在一些实施方式中,RKD4多肽编码序列来自玉米的RKD4。在一些实施方式中,RKD2多肽编码序列来自普通小麦的RKD2。在一些实施方式中,RKD2多肽编码序列来自拟南芥的RKD2。在一些实施方式中,RKD2多肽编码序列来自玉米的RKD2。
[0174] 为了本发明的目的,以百分比表示的两个相关的核苷酸或氨基酸序列的“序列相同性”是指两个最佳比对序列中具有相同残基的位置数(×100)除以所比较的位置数。间隙,即比对中残基存在于一个序列中但不存在于另一个序列中的位置,视为具有不相同残基的位置。两个序列的比对通过Needleman和Wunsch算法(Needleman and Wunsch 1970)执行。上述计算机辅助序列比对可以使用标准软件程序方便地进行,例如在European Molecular Biology Open Software Suite(EMBOSS)中实现的程序NEEDLE,例如6.3.1.2版本(Trends in Genetics 16(6),276(2000)),其默认参数为:例如,蛋白质基质=EBLOSUM62,gapopen=10.0和gapextend=0.5。
[0175] 如本文所用,术语“杂交”指的是通过互补核苷酸的碱基配对在两个核酸分子之间形成杂交体。术语“在严格条件下杂交”是指在特定条件下杂交。这种条件的一个实例包括在这样的条件下实质上互补的链即由具有至少80%互补性的核苷酸序列组成的链与指定的链杂交,而互补性较差的链不杂交的条件。或,这种条件是指钠盐浓度、温度和洗涤条件的特定杂交条件。作为一个实例,高度严格的条件包括在42℃,50%甲酰胺,5×SSC(150mM NaCl,15mM柠檬酸三钠),50mM磷酸钠,5×Denhardt溶液,10×硫酸葡聚糖,20mg/ml剪切鲑鱼精子DNA中孵育,以及在0.2×SSC中在约65℃洗涤(SSC代表0.15M氯化钠和0.015M柠檬酸三钠缓冲液)。或,高度严格的条件可能意味着在68℃,在0.25M磷酸钠中,pH 7.2,7%SDDS,1mM EDTA和1%BSA中杂交16小时,并用2×SSC和0.1%SDDS在68℃下洗涤2次。此外,高度严格的杂交条件例如为:在65℃下在4×SSC中杂交,然后在65℃下用0.1×SSC中多次洗涤共计约1小时,或在68℃下在0.25M磷酸钠、pH 7.2、7%SDS、1mM EDTA和1%BSA中杂交16小时,然后在68℃用2×SSC和0.1%SDS洗涤两次。
[0176] 调控表观遗传的化学物质
[0177] 调控表观遗传的化学物质,例如蛋白质脱乙酰酶抑制剂(ii.1),可以与基因组工程化组分共引入。根据本发明使用的示例性表观遗传调控化学物质包括但不限于组蛋白质脱乙酰酶抑制剂(HDACi),如曲古抑菌素A(trichostatin A,TSA)和DNA甲基转移酶抑制剂。
[0178] 一般认为,共递送的表观遗传调控化学物质(ii.1)(特别是HDACi)使植物染色质结构放松,促进DNA对被轰击细胞中基因组工程化组分的可及性,从而促进基因组工程(即转化和基因组编辑)效率。不希望受理论束缚,遗传物质的基本结构和功能单位是核小体,在核小体中,带负电荷的DNA包裹在带正电荷的组蛋白八聚体和相关的连接组蛋白周围。核小体单元进一步折叠并组装成染色质(Andrews,A.J.,and Luger,K.(2011).Nucleosome structure(s)and stability:Variations on a theme.Annu.Rev.Biophys.40:99‑117.)。DNA的可及性很大程度上取决于核小体和染色质的致密性。染色质重塑酶动态地修饰组蛋白中的赖氨酸或其它氨基酸,从而导致改变它们的电荷以及与DNA和其它蛋白质的相互作用,且从而导致染色质折叠或展开(Bannister A.J.,Kouzarides T.(2011)Regulation of chromatin by histone modifications.Cell Res 21:381‑95.)。通过添加或去除乙酰基,组蛋白中赖氨酸残基的乙酰化和去乙酰化通常参与真核生物染色质结构的可逆调节,并介导染色质可及以及基因表达的调控。组蛋白脱乙酰酶(HDAC)是从组蛋白N端尾部上的赖氨酸残基移除乙酰基,以使组蛋白带更多正电荷,从而使组蛋白更紧密地包裹DNA的酶。抑制HDAC可能有助于染色质的展开,使DNA更容易接近。
[0179] 染色质重塑和其它表观遗传修饰无疑在调控细胞全能性和再生中起到重要作用(Zhang,H.,and Ogas,J.(2009).An epigenetic perspective on developmental regulation of seed genes.Mol.Plant 2:610‑627.)。组蛋白脱乙酰酶(HDAC)活性的抑制已被证明与植物再生和小孢子胚形成有关(Miguel,C.,and Marum,L.,2011.An epigenetic view of plant cells cultured in vitro:somaclonal variation and beyond.J.Exp.Bot.62:3713‑3725.,Li Hui et al.(2014)The Histone Deacetylase Inhibitor Trichostatin A Promotes Totipotency in the Male Gametophyte Plant Cell,26:195‑209.)。抑制HDAC活性或下游HDAC介导的途径在引发应激诱导的单倍体胚形成中起主要作用。一种这样的HDACi是曲古抑菌素A(TSA)。研究表明,TSA诱导甘蓝型油菜(B.napus)雄配子体中大量胚性细胞增殖。TSA处理导致培养的小孢子和花粉中孢子体细胞高频率分裂。
[0180] 在存在一种或多种表观遗传调控化学物质(例如蛋白质脱乙酰酶抑制剂,尤其是HDACi)的情况下,可以使用多种方法来进一步提高基因组工程效率。这种HDACi可以是曲古抑菌素A(TSA)、N‑羟基‑7‑(4‑二甲氨基苯甲酰基)‑氨基庚酰胺(M344)、辛二酰苯胺异羟肟酸(SAHA)等。这些HDACis选自针对锌依赖性HDAC的基于异羟肟酸的化学物质。
[0181] 植物激素
[0182] 在多个实施方式中,将一种或多种植物激素,例如生长素和细胞分裂素,如2,4‑D,6‑苄氨基嘌呤(6‑BA)和玉米素(Zeatin),与编码RKD2或RKD4的核酸、基因组工程化组分和转基因中的一种或多种共递送。
[0183] 植物体细胞能够通过体细胞胚形成或器官发生,在离体培养中恢复细胞分裂并再生为完整的植株,这在很大程度上依赖于植物激素,如生长素和细胞分裂素。
[0184] 生长素之一是2,4‑二氯苯氧乙酸(2,4‑D),它对单子叶植物如玉米和小麦的体细胞胚形成和细胞再生几乎是不可或缺的。同时,细胞分裂素如6‑苄氨基嘌呤(6‑BA)或Zeatin,对植物器官发生和枝条分生组织的萌生和发育至关重要。提高基因组工程效率的方法可包括将一种或多种植物激素(2,4‑D、6‑BA、Zeatin等)与基因组工程化组分共递送。
[0185] 可以将基因组工程化组分和至少一种表观遗传调控化学物质以及植物激素共同引入一个植物细胞中。
[0186] 如本文所用,“共同递送”或“共递送”和“共同引入”或“共引入”可互换使用。就本发明而言,“共引入”是指将至少两种不同组分同时递送到同一植物细胞中的过程。因此,可以将基因组工程化组分和表观遗传调控化学物质和植物激素中的至少一种一起引入到同一植物细胞中。
[0187] 可以通过粒子轰击、显微注射、农杆菌介导转化、电穿孔、农杆菌渗入法或真空渗入共引入植物细胞中。根据本发明,基于物理递送的方法,如粒子轰击、显微注射、电穿孔、纳米粒子和细胞穿透肽(CPP),对于共同引入编码RKD2或RKD4的核酸、基因组工程化组分和/或转基因是特别优选的。特别优选的是通过粒子轰击共同引入。
[0188] 植物细胞再生为整株植物
[0189] 根据本发明的另一方面,遗传修饰的植物细胞可以再生为完整的(可育的)植株。因此,在本发明的优选方面,在对植物细胞的遗传修饰之后进行再生植物的步骤。相应地,本发明提供了一种用于产生遗传修饰的植物的方法,包括以下步骤:
[0190] a)根据上述在植物细胞中进行遗传修饰的任何方法对植物细胞进行遗传修饰,和[0191] b)从步骤a)的修饰过的植物细胞再生植物。
[0192] 单个或多个细胞增殖并发育成组织、器官,最终发育成完整的植株。在一些实施方式中,所产生的植物不包含在步骤a)中引入或共同引入的任何基因组工程化组分、编码RKD2或RKD4的核酸。再生植物的步骤b)可以例如包括在再生培养基上培养来自步骤a)的遗传修饰的植物细胞。
[0193] 通过向植物细胞中引入本文所述的任何编码RKD2或RKD4的核酸、重组基因和DNA构建体,可以提高植物再生的效率或增加植物细胞再生能力的效率。
[0194] 遗传修饰的植物的产生
[0195] 本发明还提供了通过上述用于产生遗传修饰的植物或其后代植物的方法获得或可获得的遗传修饰的植物。遗传修饰的植物可以包含本文所述的任何遗传修饰的植物细胞。
[0196] 在多个实施方式中,所产生的植物不包含用于产生其而被引入或共同引入到植物细胞中的任何基因组工程化组分或编码RKD2或RKD4的核酸。
[0197] 本发明还提供了未通过常规选择来源于上述遗传修饰的细胞的植物或种子。如本文所用,“常规选择”是指通过使用整合的选择标记,如抗生素(如卡那霉素(kanamycin)、潮霉素(hygromycin))或除草剂(如草丁膦、草甘膦)抗性基因,从野生型细胞中选择和纯化所转化的细胞的任何过程。如果没有常规的选择,这种植物或种子可能没有整合任何基因组工程化组分,因此导致不含转基因的遗传修饰的植物。
[0198] 遗传修饰可以是植物细胞基因组中永久的、可遗传的变化。植物组织培养和基因组工程可以使用目前可用的方法进行,包括微粒轰击、农杆菌转化、电穿孔等。转化和转基因表达可以通过使用可见的报告基因来监测,例如,红色荧光tDTomato基因(tDT),其编码一种异常明亮的红色荧光蛋白,该荧光蛋白的最大激发在554nm处,最大发射在581nm处。基因组编辑效率可以通过下一代测序(NGS)、qPCR、标记毛细管电泳分析和Droplet Digital PCR等方法进行分析。Sanger测序进一步证实了位点特异性修饰。
[0199] 培养步骤
[0200] 其中引入或共同引入编码RKD2或RKD4的核酸、基因组工程化组分和/或转基因的植物细胞,可在允许在一个或多个编码RKD2或RKD4的核酸和一个或多个转基因存在下,通过基因组工程化组分的活性对所述植物细胞基因组进行遗传修饰的条件下,进行培养。
[0201] 如本文所用,“基因组的遗传修饰”包括任何类型的操作,以使得内源核苷酸改变以包括突变,例如删除、插入、转变、颠换或其组合。例如,可以删除内源性编码区。这种突变可能导致多肽具有与内源性多核苷酸编码的氨基酸序列不同的氨基酸序列。遗传修饰的另一个实例是调控序列如启动子的改变,从而导致可操作连接的内源性编码区表达的增加或减少。
[0202] “适合”进行植物基因组遗传修饰(例如多核苷酸的切割)的条件,或“适合”的条件是不阻止这种事件发生的条件。因此,这些条件允许、增强、促进和/或有利于该事件。根据各自的基因组工程组成(i),这些条件可能会有所不同。
[0203] 在本发明的方法中,优选用基因组工程化组分(i)和至少一种化合物(ii)瞬时转化植物细胞。本文中所用的“瞬时转化”是指将外来物质[即核酸片段、蛋白质,核糖核蛋白(RNP)等]转移至宿主细胞中,从而在不整合和稳定遗传外来物质的情况下导致基因表达和/或活性。因此,基因组工程化组分(i)在植物细胞中为瞬时活性的和/或瞬时存在的。基因组工程化组分不是永久地结合到细胞基因组中,而是提供了导致基因组修饰的暂时作用。例如,植物细胞中基因组工程化组分的瞬时活性和/或瞬时存在可导致植物细胞基因组中的一个或多个双链断裂、植物细胞基因组中的一个或多个单链断裂、植物细胞基因组中的一个或多个碱基编辑事件、或植物细胞基因组中的DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白类泛素化、组蛋白核糖化或组蛋白瓜氨酸化中的一种或多种。
[0204] 在引入一个或多个双链断裂或一个或多个单链断裂之后,进行非同源末端连接(NHEJ)和/或通过同源重组机制(HDR)对断裂进行同源定向修复。
[0205] 植物细胞基因组中所产生的修饰例如可选自:转基因的插入,优选插入包含目的转基因的表达盒,至少一个核苷酸的替换,至少一个核苷酸的删除,至少一个核苷酸的插入,DNA甲基化的变化,组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白苯甲酰化、组蛋白核糖基化或组蛋白瓜氨酸化的变化,或其任何组合。根据本发明的一个特别优选的方面,没有与所用的基因编辑机器/系统相关的外源遗传物质被稳定地整合到植物细胞的基因组中。
[0206] 遗传修饰可以是植物细胞基因组中永久的、可遗传的变化。
[0207] 本发明的主旨还在于通过上述方法获得或可获得的植物细胞。因此,本发明的一个实施方式是通过上述在植物细胞中进行遗传修饰的方法获得或可获得的遗传修饰的植物细胞。与原始植物细胞相比,这些植物细胞中的遗传修饰例如可包括:转基因的插入,优选插入包含目的转基因的表达盒,至少一个核苷酸的替换,至少一个核苷酸的删除,至少一个核苷酸的插入,DNA甲基化的变化,组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白苯甲酰化、组蛋白核糖基化或组蛋白瓜氨酸化的变化,或其任何组合。优选地,遗传修饰的植物细胞不包含任何稳定整合到植物细胞基因组中的外源遗传物质。
[0208] 遗传修饰的植物细胞可以是全株植物的一部分,也可以是该部分中的一部分。因此,本发明还涉及包含上述遗传修饰的植物细胞的植物或植物部分。
[0209] 根据本发明的另一方面,遗传修饰的植物细胞可以再生为完整的(可育的)植物。因此,在本发明的优选方面,在对植物细胞遗传修饰之后进行再生植物的步骤。相应地,本发明提供了一种用于产生遗传修饰的植物的方法,包括以下步骤:
[0210] a)根据上述在植物细胞中进行遗传修饰的方法对植物细胞进行遗传修饰,和[0211] b)从步骤a)的修饰过的植物细胞再生植物。
[0212] 再生植物的步骤b)可以例如包括在再生培养基上培养来自步骤a)的遗传修饰的植物细胞。
[0213] 再生技术依赖于在组织培养生长培养基中操纵某些植物激素,有时依赖于可以引入的杀生物剂和/或除草剂标记。再生可以从来自不同外植体的植物体细胞、愈伤组织细胞或胚胎细胞以及原生质体获得,外植体例如愈伤组织、未成熟或成熟的胚胎、叶、枝条、根、花、小孢子、胚胎组织、分生组织、器官或其任何部分。这种再生技术在Klee(1987)Ann.Rev.of Plant Phys.38:467‑486中进行了一般性描述。从培养的原生质体进行植物再生描述于Evans et al.,Protoplasts Isolation and Culture,Handbook of Plant Cell Culture,pp.124‑176,Macmillan Publishing Company,New York,1983;和Binding,Regeneration of Plants,Plant Protoplasts,pp.21‑73,CRC Press,Boca Raton,1985中。为了从转化或基因编辑的细胞获得完整的植株,细胞可以在受控的环境条件下,在一系列含有营养物质和激素的培养基中生长,这一过程被称为组织培养。一旦整株植物生成并产生种子,就开始后代的评估。
[0214] 本发明还提供了通过上述用于产生遗传修饰的植物或其后代植物的方法获得或可获得的遗传修饰的植物。
[0215] 本发明的另一主旨在于源自上述遗传修饰的植物的植物细胞或种子。
[0216] 本发明的又一主旨在于在没有进行基于标记基因的选择下,源自上述遗传修饰的细胞的植物、植物细胞或种子。如本文所用,“基于标记基因的选择”是指通过使用整合的选择标记(基因),例如抗生素抗性基因(例如卡那霉素抗性基因、潮霉素抗性基因)或除草剂抗性基因(例如草丁膦抗性基因、草甘膦抗性基因),从野生型细胞中选择、识别和/或纯化修饰的细胞,尤其是经转化、基因编辑或碱基编辑的细胞的任何过程。如果没有进行这种选择,这种植物、植物细胞或种子可能没有整合任何基因组工程化组分,从而可能产生(i)不含转基因的遗传修饰的植物或(ii)仅整合了目的转基因的修饰植物。
[0217] 除非在实例中另有说明,所有的重组DNA技术都是根据标准方案进行的,如Sambrook et al.(1989)Molecular Cloning:A Laboratory Manual,Second Edition,Cold Spring Harbor Laboratory Press,NY和Ausubel et al.(1994)Current Protocols in Molecular Biology,Current Protocols,USA的卷1和卷2中所述。植物分子工作的标准材料和方法描述于BIOS Scientific Publications Ltd(UK)和Blackwell Scientific Publications,UK联合出版的R.D.D.Cray的Plant Molecular Biology Labfax(1993)中。标准分子生物学技术的其它参考文献包括Sambrook and Russell(2001)Molecular Cloning:A Laboratory Manual,Third Edition,Cold Spring Harbor Laboratory Press,NY;Brown(1998)Molecular Biology LabFax,Second Edition,Academic Press(UK)的卷I和卷II。聚合酶链式反应的标准材料和方法可在Dieffenbach and Dveksler(1995)PCR Primer:A Laboratory Manual,Cold Spring Harbor Laboratory Press,以及in McPherson at al.(2000)PCR‑Basics:From Background to Bench,First Edition,Springer Verlag,Germany中找到。
[0218] 序列
[0219]
[0220]
[0221] 本文提及或引用的所有专利、专利申请和出版物或公开(包括互联网上的出版物)均通过引用的方式整体并入本文。
[0222] 实施例
[0223] 通过以下实例进一步说明本发明。然而,应理解本发明不限于此类实例。在说明书中的任何地方使用这些和其它实例仅是说明性的,且不以任何方式限制本发明或任何示例性术语的范围和含义。同样,本发明不限于此处描述的任何特定优选的实施方式。事实上,本发明的许多修改和变化对于阅读本说明书的本领域技术人员是显而易见的,并且可以在不脱离本发明的精神或范围的情况下进行此类变化。因此,本发明仅由所附权利要求的条款以及这些权利要求的等同物的全部范围来限定。
[0224] 实施例1.制备pZY ZZ‑TOP,含有与发育基因和GUS报告基因可操作连接的双向启动子pOp6以及激活pOp6的地塞米松可诱导转录因子的质粒
[0225] 生成了质粒(pZY ZZ‑TOP),其带有化学(地塞米松,Dex)可诱导启动子系统(Zuo,J.,&Chua,N.H.(2000).Chemical‑inducible systems for regulated expression of plant genes.Current Opinion in Biotechnology,11(2),146‑151.)。质粒的图谱如图1所示。质粒包含pOp6启动子(SEQ ID NO:15)。pOp6启动子是双向的,并且在暴露于地塞米松(Sigma‑Aldrich.产品号#D4902‑500MG)后,发育基因和GUS基因均表达(图1)。质粒还包含基因LhGR(DNA(SEQ ID NO:16和氨基酸(SEQ ID NO:17))。LhGR为组成型表达(例如pUbi1启动子+内含子)。LhGR是转录因子,其仅在地塞米松存在的情况下进入细胞核。进入细胞核后,LhGR激活pOp6。因此,pZY ZZ‑TOP提供了地塞米松可诱导的GUS和发育基因的表达。
[0226] 表达系统用于稳定转化。GUS染色用于鉴定没有化学诱导下的泄漏表达。在所有随后的实例中,只考虑没有化学诱导时不表达GUS基因的植物。不使用没有化学诱导时表达GUS的植物。
[0227] 实施例2.转录因子用于通过体细胞胚形成诱导植物再生的能力的评估
[0228] 在另一实例中,测试了五种不同转录因子经由体细胞胚形成诱导植物再生的效率。将AtLEC2(SEQ ID NO:6)、AtWUS(SEQ ID NO:8)、AtBBM(SEQ ID NO:10)、AtAGL15(SEQ ID NO:12)和AtRKD4(SEQ ID NO:1)的编码序列克隆到实例1的可诱导启动子系统pZY ZZ‑TOP中。地塞米松可诱导AtLEC2、AtWUS、AtBBM、AtAGL15和AtRKD4中每一个的表达。
[0229] 这些基于pOp6/LhGR反式激活系统的地塞米松可诱导二元构建体通过浸花法稳定地转化为拟南芥Col‑0(Craft et al.(2005).New pOp/LhG4 vectors for stringent glucocorticoid‑dependent transgene expression in Arabidopsis.The Plant Journal,41(6),899‑918.)。拟南芥Col‑0在受控环境条件下(16小时光照/8小时黑暗,22℃)生长在含有添加1%蔗糖的50%MS培养基的平板中。通过GUS染色检测40个独立的转基因株系的泄漏表达。
[0230] 发芽后5~7天诱导非泄漏转化体。通过在含20μM地塞米松的培养板上培养7天进行基因表达的化学诱导,然后将植物转移到无诱导剂的培养基中。用Sudan Red 7B染色后通过显微成像测定体细胞胚的频率。
[0231] 结果显示在图2中。RKD4具有暴露于地塞米松后形成的胚性结构的最高效率。
[0232] 实施例3.在pOp6/LHGR反式激活系统中表达的RKD4具有促进地塞米松可诱导的体细胞胚形成的能力
[0233] 在拟南芥中测试了控制RKD4的可诱导启动子系统的功能。拟南芥种子发芽直至形成初生根。然后将小植物转移到含Dex的平板上(如实施例2所述)。对小植物进行成像,数据如图3所示。在根(图3,左幅)、叶(图3,中幅)或两者(图3,右幅)中观察到体细胞胚形成。也可观察到叶绿素的损失。将体细胞胚结构移至无DEX培养基中后,体细胞胚结构又开始变绿。这些数据表明RKD4表达能够在缺乏激素的情况下诱导体细胞胚形成。
[0234] 实施例4.在pOp6/LhGR反式激活系统中表达的AtRKD4可诱导园艺相关种类中的体细胞胚形成
[0235] 如实施例1所述,使用根癌农杆菌GV3101和地塞米松可诱导AtRKD4二元构建体转化蝴蝶兰的园艺相关种类。将稳定转化的植物的叶的基部在含有含20μM地塞米松的50%MS培养基的平板中孵育两天,然后转移到不含地塞米松的培养基中。在移植后0、7和14天确定体细胞胚胎的存在,数据如图4所示。
[0236] 实施例5.在pOp6/LhGR反式激活系统中表达的AtRKD4可诱导普通小麦的园艺相关种类中的体细胞胚形成
[0237] 测定了诱导的RKD4在普通小麦的农业相关种类中表达的效果。用携带雌二醇可诱导TaRKD2(SEQ ID NO:3)二元构建体的Agrobacterium EHA105转化小麦未成熟胚(Valdivia et al.,2013)。授粉后12天从种子中分离出转化胚,并在含30μM的β‑雌二醇的
50%MS培养基中培养7天。在培养基中可观察到胚性结构的诱导(愈伤组织形成;图5,左幅)。将胚胎结构转移到无诱导剂的培养基中以诱导出体细胞胚。观察到绿变(图5,中幅),然后观察到出新叶(图5,右幅)。实施例证明了RKD4在农业相关种类中表达的效果。
[0238] 实施例6.TaRKD2在大麦未成熟胚中的表达可诱导体细胞胚形成
[0239] 在又一实例中,用携带雌二醇可诱导TaRKD2(SEQ ID NO:3)二元构建体的Agrobacterium EHA105转化大麦未成熟胚(Valdivia et al.,2013)。从种子中分离出转化的大麦不成熟胚,在含有30μM的β‑雌二醇的50%MS培养基中生长7天(图6,左上幅),然后转移到无诱导剂的培养基中以诱导体细胞胚。从诱导培养基中去除胚性结构后,可观察到枝条和根发育(图6,右上幅)。随后,将这些结构移到光下,组织开始变绿(图6,左下幅)。初始未成熟胚分离后约60天,幼苗可形成(图6,右下幅)。
[0240] 实施例7.RKD2和RKD4在玉米中的共表达
[0241] 在玉米愈伤组织中可证明RKD4(来自拟南芥)和RKD2(来自小麦(SEQ ID NO:4))表达的益处。将两个序列克隆到实施例1所述的构建体中,并在组成型启动子(例如双35S启动子(SEQ ID NO:21)和泛素内含子(SEQ ID NO:20))存在下用红色荧光tdTomato基因(DNA:SEQ ID NO:18;氨基酸:SEQ ID NO:19)共轰击。暴露于地塞米松后,根据大量愈伤组织结构的形成和稳定tdTomato整合测量胚形成的诱导。33天后可观察到显示红色荧光的愈伤组织结构(图7,左幅为AtRKD4,右幅为TaRKD2)。结构来自于被两种构建体撞击的单个细胞,导致胚形成和红色荧光标记物的表达。
[0242] ***
[0243] 本发明的范围不受本文描述的特定实施方式的限制。实际上,除了本文所描述的之外,本发明的多种修改通过前述描述和附图对于本领域的技术人员将变得显而易见。此类修改意在落入所附权利要求书的范围内。还应理解,所有值都是近似值,且是为了描述而提供。
[0244] 本申请通篇引用了专利、专利申请、出版物、产品描述和协议,出于所有目的,其公开通过引用的方式整体并入本文。

当前第1页 第1页 第2页 第3页
相关技术
工程化效率相关技术
提高基因组相关技术
J·F·古铁雷斯-马科斯发明人的其他相关专利技术