技术领域
[0005] 本披露涉及植物生物技术领域。特别地,本发明涉及用于修饰光周期植物的开花时间和/或成熟时间以使得能够在具有不同昼长的多个地理位置中培育这些光周期植物的方法和组合物。
相关背景技术
[0006] 大豆(Soybean,Glycine max)是有价值的大田作物。从种子提取的大豆油用于许多零售产品,如烹饪油、烘焙食品、人造黄油等。大豆还用作谷物,作为动物和人二者的食物来源。大豆粕是许多食物和动物饲料的组分。从大豆生产的可食用蛋白质成分为肉类以及乳制品中的动物蛋白提供了更健康且更便宜的替代物。
[0007] 全季大豆的典型生长周期开始于较长的营养生长期。如图1A所示,营养阶段开始于下胚轴从土壤中冒出(VE),随后在子叶正上方的第一节上展开一对单叶的叶片(VC)。在此阶段,叶片充分展开,使得叶片边缘不接触。在VC之后,当三叶的叶片在多个节(n)的每一个处展开时,植物从V1(其中完全发育的叶片在第一节处展开)变为Vn。
[0008] 当第一朵开放的花存在于植物主茎上的任何节时,生殖阶段开始(R1或开始开花)。第一朵花典型地朝向植物的底部。当植物进入完全开花时,它进入R2。在这个阶段,在主茎上的两个最上面的节中的一个处存在开放的花,花完全发育。生殖阶段包括荚发育(R3和R4)、种子发育(R5和R6)以及最终成熟(R7和R8)。在R3(开始结荚阶段)中,在主茎上四个最上部具有完全发育叶片的节中的一个处存在至少十六分之三英寸长的荚。在R4(完全结荚)中,在主茎上四个最上部具有完全发育叶片的节中的一个处存在至少四分之三英寸长的荚。在R5(或开始结籽阶段)中,在主茎上四个最上部具有完全发育叶片的节中的一个处在荚中存在至少八分之一英寸长的种子。在R6(或完全结籽阶段)中,在主茎上四个最上部具有完全发育叶片的节中的一个处存在包含绿色种子的荚,绿色种子充满荚腔。在R7(或开始成熟阶段)中,在主茎上存在至少一个已达到其成熟荚颜色的正常荚。在R8(或完全成熟阶段)中,至少95%的荚已经达到其成熟荚颜色。R8后,需要五至10天的干燥天气以将大豆水分水平降低至小于15%。
[0009] 大多数开花植物对每日光周期循环有反应,并且基于诱导开花所需的光周期条件,被分类为短日照(SD)或长日照(LD)植物。植物所经历的光周期条件又随着培育它们的地理位置(例如,纬度或经度)而变化。大豆是短日照(SD)植物,需要比临界值更短的天数来诱导开花。根据大豆品种对光周期的反应,如基于直至开花发生的天数,将大豆品种分为多个成熟期组。例如,对于大多数北美大豆品种,典型的种植日期为5月1日,大豆生长的营养期可以持续从55‑65天,七月中旬左右开始开花。
[0010] 植物育种者和种植者总是在寻找新的方法以操纵植物的培育和产量,尤其是对于农艺学而言重要的作物。例如,大豆育种者对可以在范围广泛的地理位置中培育的大豆品种感兴趣。因此,本领域持续需要修饰与开花时间相关的农艺性状的改进的组合物和方法。
[0011] 已经鉴定并且发现了在控制大豆的开花时间和成熟中起作用的多种基因。本披露提供了产生参与大豆的光周期反应的基因的新型的且非天然的等位基因变异、以及使用特定的等位基因组合以提供具有一系列经修饰的开花时间的大豆植物的方法。
具体实施方式
[0141] 大豆是短日照(SD)植物,生长在广泛地理区域中以及从赤道到高达50度的宽范围纬度内。这种广泛的适应性最可能是通过在大量主要基因和控制开花行为的数量性状基因座处的遗传多样性产生的。
[0142] 光周期是决定大豆花发育和对不同区域的适应性的主要气候因素之一。短的日照长度可以加速开花,而长的日照长度可以延迟开花。由于它们的光周期敏感性,每个大豆培育品种的培育面积被限制在非常窄的纬度范围内以达到其最高产量。
[0143] 本文提供了包含大豆成熟基因(特别是在E1和E1LB基因座处)的非天然存在的等位基因组合的植物,该非天然存在的等位基因组合修饰所得植物的开花特征(例如,开花时间和/或成熟期值)。在一些情形下,当等位基因在植物或其部分中表达时,与不包含给定等位基因组合的对照植物(如在一个或两个基因座处包含野生型等位基因的对照植物)相比,等位基因组合产生经修饰的大豆成熟特征。由于经修饰的开花特征,所得大豆植物及其后代植物可以在更宽范围的纬度中培育并且生长,从而实现更高的产量。术语“大豆成熟”和“相对成熟期”和“光周期反应”在本文中可互换使用。还披露了将导致非天然存在的等位基因和等位基因组合的突变引入大豆植物中的各种方式,包括转基因方式、基因编辑和育种。还披露了用于鉴定植物中这些非天然存在的等位基因的存在的标记物。如本文所用,术语“表型”、“表型性状”或“性状”是指遗传控制的性状的一种或多种可区分的特征。
[0144] 在一些实施例中,本文提供的植物是具有期望的性状的非天然存在的大豆品种。在具体实施例中,非天然存在的大豆品种是良种大豆品种。“非天然存在的大豆品种”是自然界中不存在的任何品种的大豆。可以通过本领域已知的任何方法产生“非天然存在的大豆品种”,该方法包括但不限于转化大豆植物或种质、转染大豆植物或种质并将天然存在的大豆品种与非天然存在的大豆品种杂交。在一些实施例中,“非天然存在的大豆品种”可以包含一种或多种异源核苷酸序列。在一些实施例中,“非天然存在的大豆品种”可以包含天然存在的基因的一个或多个非天然存在的等位基因(即,将非天然存在的突变引入天然存在于大豆中的基因中)。在一些实施例中,“非天然存在的大豆品种”可以包含大豆成熟基因的一个或多个非天然等位基因的非天然组合(即,E1和E1LB基因的非天然存在的等位基因处于并非天然存在于同一大豆中的不同组合中)。
[0145] “主题植物或植物细胞”是对目的基因进行的遗传改变(如,突变)受到影响以产生非天然存在的且新型的等位基因的植物或植物细胞,或者是由如此改变的植物或细胞遗传下来的并包含该改变的植物或植物细胞。“对照”或“对照植物”或“对照植物细胞”提供了用于测量主题植物或植物细胞的表型的变化的一个参考点。对照植物或植物细胞可以包含,例如:(a)野生型植物或细胞,即与用于导致主题植物或细胞的遗传改变的起始材料具有相同的基因型;(b)与起始材料具有相同基因型但在E1和E1LB基因座处均具有野生型等位基因的植物或植物细胞;(c)与起始材料具有相同基因型但在E1或E1LB基因座处具有野生型等位基因的植物或植物细胞;(d)植物或植物细胞,其是主题植物或植物细胞的后代中的非转化的分离子;(e)植物或植物细胞,其与主题植物或植物细胞基因上相同但未暴露于将诱导目的基因或等位基因表达的条件或刺激;或(f)在未表达目的基因或等位基因的条件下,主题植物或植物细胞本身。
[0146] I.导致经修饰的大豆开花时间的新型非天然存在的E1基因等位基因
[0147] 提供了用于产生具有经修饰的开花特征的大豆植物的方法和组合物。此类植物在E1基因座和E1LB基因座中的一个或两个处包含非天然存在的等位基因。这些植物可以在没有引入等位基因组合(例如,相对于包含任何两种野生型等位基因的植物)时的所限区域之外的地理区域(包括纬度地区)中生长。除了扩大培育范围外,植物的产量也增加。
[0148] 在E1和E1Lb基因座处进行定点突变,随后选择编码具有降低活性的E1和E1Lb蛋白的突变型形式的等位基因。此类等位基因可用于制备具有改变的开花时间的大豆植物。由此产生的新型E1和E1Lb等位基因尤其适合于原位突变(基因组编辑的)植物的情境,这些植物可以在其未突变对应物以外的纬度生长。
[0149] 由本文所述的非天然存在的等位基因产生的等位基因组合的非限制性实例包括:
[0150] (i)导致E1LB蛋白的部分表达的突变型E1LB等位基因和野生型E1等位基因;
[0151] (ii)导致E1LB蛋白表达丧失的突变型E1LB等位基因和野生型E1等位基因;
[0152] (iii)导致E1LB蛋白的部分表达的突变型E1LB等位基因和导致E1蛋白的部分表达的突变型E1等位基因;
[0153] (iv)导致E1LB蛋白表达丧失的突变型E1LB等位基因和导致E1蛋白的部分表达的突变型E1等位基因;
[0154] (v)导致E1LB蛋白的部分表达的突变型E1LB等位基因和导致E1蛋白表达丧失的突变型E1等位基因;以及
[0155] (vi)导致E1LB蛋白表达丧失的突变型E1LB等位基因和导致E1蛋白表达丧失的突变型E1等位基因。
[0156] (vii)导致E1蛋白的部分表达的突变型E1等位基因和野生型E1LB等位基因;
[0157] (viii)导致E1蛋白表达丧失的突变型E1等位基因和野生型E1等位基因。
[0158] 相对于对照植物,包含任何上述等位基因组合的大豆植物的开花时间是经修饰的。在特定实施例中,对照植物包含野生型E1等位基因和野生型E1LB等位基因。
[0159] (a)E1基因及其新型等位基因
[0160] 在不同的连锁群中已经鉴定出了大量参与开花和成熟的QTL。其中,11个已经被证实为控制大豆开花时间和成熟的主要效应QTL:E1和E2、E3、E4、E6、E7、E8、E9、E10、qDTF‑J1和J。已经鉴定出构成QTL E1‑E4、E9、E10、qDTF‑J1基础的基因,并且已经表征了它们在开花的光周期控制中的功能。在这些基因中,E1‑E4是与开花时间(FT)和成熟相关联的四个主要基因座。
[0161] E1是与开花时间和成熟相关联的主要基因,并且位于近着丝粒区域。E1基因(SEQ ID NO:1)是无内含子的并且编码E1蛋白(SEQID NO:2),该E1蛋白包含推定的双组分核定位信号(NLS)和与植物特异性B3结构域远相关的结构域(B3样结构域)(Xia,Z.J.等人Proc Natl Acad Sci USA.[美国国家科学院院刊]109,E2155‑E2164(2012))。E1是转录因子。E1被认为是大豆培育品种中开花时间变异的贡献者。E1除了对开花后反应有影响外还对开花前发育有影响。
[0162] E1基因包括至少4个等位基因天然变异,E1和e1‑as作为两个基本基因型。大豆品种中已知的天然E1隐性等位基因变异包括e1‑as、e1‑fs、e1‑nl和e1‑b3a(Zhai,H.等人Plos One.[公共科学图书馆1号]9(5),e97636(2014))。e1‑as包括在核定位信号区域的单个错义点突变,其导致渗漏等位基因。这一个氨基酸改变导致细胞定位改变并且e1蛋白同时分布在细胞核和细胞质中。然而,e1‑as是渗漏等位基因并且具有延迟开花的部分功能(Xia,2013)。
[0163] 其他三个非功能性等位基因是e1‑fs、e1‑nl和e1‑b3a。e1‑fs在B3结构域中具有1bp缺失,并且该移码突变产生了提前终止密码子和编码41个氨基酸的截短蛋白。e1‑nl是无效等位基因并且所有E1基因都缺失。e1‑b3a等位基因在B3结构域中具有3个SNP和2bp缺失(导致移码突变)。E1‑nl是包含E1基因的具有约130kb缺失的无效等位基因。e1‑b3a在B3结构域的中间包含2bp缺失。e1‑as显然是渗漏等位基因,并且与功能性e1‑fs和e1‑nl相反,部分地抑制大豆开花。
[0164] E1以双重模式表达,长日照(LD)条件下的表达高于短日照(SD)条件下的表达。E1是推定的转录因子(TF),负控制GmFT2a和GmFT5a以在具有功能性PHYA基因(E3,E4)和LD条件的背景下延迟开花(Lin,X.等人Molecular mechanisms for thephotoperiodic regulation of flowering in soybean.[大豆开花光周期调节的分子机制]
J.Integr.Plant Biol.[综合植物生物学杂志](2021)63:981‑994;Xia,Z.等人Positional cloning and characterization revealthe molecular basis for soybean maturity locus E1 that regulatesphotoperiodic flowering[定位克隆和表征揭示了调节光周期开花的大豆成熟基因座E1的分子基础].Proc.Natl.Acad.Sci.USA[美国国家科学院院刊](2021)109:E2155‑2164;Zhai,H.等人Diurnal expressionpattern,allelic variation,and association analysis reveal functionalfeatures of the E1 gene in control of photoperiodic flowering insoybean[日间表达模式、等位基因变异和相关分析揭示了E1基因在控制大豆光周期开花中的功能特征].PloS One[公共科学图书馆1号](2015)10(8),e0135909.doi:10.1371/journal.pone.0135909)。
[0165] 如本文所用,E1活性是指E1蛋白对开花时间和/或成熟时间的影响。导致功能完全丧失的等位基因编码不具有E1活性的突变E1蛋白。导致功能部分丧失的等位基因编码相对于野生型未突变E1蛋白而言具有降低的E1活性的突变E1蛋白。
[0166] 本发明披露了使用诱变和基因组编辑技术产生的新型E1等位基因。使用在鉴定的对应于野生型等位基因的位置处的碱基的缺失和/或取代来产生新型等位基因。在SEQ ID NO:5、7、9、11和13中提供了在E1基因中包含非天然存在的突变的示例等位基因,编码在SEQID NO:6、8、10、12和14中提供的对应突变E1蛋白。至少一些非天然存在的等位基因(例如,SEQ ID NO:5、7和9)导致突变的E1蛋白不具有E1活性。至少一些非天然存在的等位基因(例如,SEQ IDNO:11和13)导致突变的E1蛋白具有降低的或有限的E1活性。
[0167] (b)E1Lb基因及其新型等位基因
[0168] 类似于E1,两种E1直系同源物,即E1La(Glyma.04G156400.1)和E1Lb(Glyma.04G143300.1),可以控制开花的开始。(Xu,M.等人Plant Physiol.[植物生理学]
168,1735‑1746(2015))。这些基因在开花中的功能与E1类似,发现病毒诱导的E1La和E1Lb沉默上调FT2a和FT5a的表达并且导致开花提早。在e3/E4和E3/E4两种遗传背景下,天然功能丧失等位基因(E1Lb)展现出FT2a和FT5a的表达上调,并且在长日照条件下比E1Lb的那些更早开花。E1Lb通过独立于E1抑制FT2a和FT5a的表达来延缓在长日照条件下的开花。
[0169] 如本文所用,E1Lb活性是指E1Lb蛋白对开花时间和/或成熟时间的影响。导致功能完全丧失的等位基因编码不具有E1Lb活性的突变E1Lb蛋白。导致功能部分丧失的等位基因编码相对于野生型未突变E1蛋白具有降低的E1Lb活性的突变E1Lb蛋白。
[0170] 本发明披露了使用诱变和基因组编辑技术产生的新型E1Lb等位基因。使用在鉴定的对应于野生型等位基因的位置处的碱基的缺失和/或取代来产生新型等位基因。在SEQ ID NO:15、17、19、21和23中提供了在E1Lb基因中包含非天然存在的突变的示例等位基因,编码在SEQ ID NO:16、18、20、22和24中提供的对应突变E1Lb蛋白。至少一些非天然存在的等位基因(例如,SEQ ID NO:15和17)导致突变的E1Lb蛋白不具有E1Lb活性。至少一些非天然存在的等位基因(例如,SEQ ID NO:19、21和23)导致突变的E1Lb蛋白具有降低的或有限的E1活性。
[0171] 在核酸序列的上下文中,术语“对应于”意指当某些序列的核酸序列与彼此比对时,“对应于”在本发明中某些枚举的位置的核酸是与参考序列中的这些位置比对的那些,但相对于本发明的特定核酸序列而言并不一定位于这些精确的数字位置中。例如,经由在核苷酸147至154处包含8bp缺失的突变产生的E1等位基因,对应于意指当野生型等位基因的核苷酸序列与突变型等位基因的核苷酸序列比对时,突变型等位基因中存在与野生型等位基因的核苷酸147至154重叠的八个碱基对的空位。换句话说,突变型等位基因与野生型等位基因在位置147之前并且不包括位置147处以及在位置154之后并且不包括位置154处重叠。野生型等位基因和对应的新型等位基因的示例比对示于图4A和图5A中。
[0172] 可以通过已知算法的计算机化实施方式或者通过目视检查进行用于比较的序列的最佳比对。易于获得的序列比较和多重序列比对算法分别是可在因特网(例如,EMBL‑EBI的网站)上获得的基本局部比对搜索工具(BLAST)和ClustalW/ClustalW2/Clustal Omega程序。其他合适的程序包括但不限于GAP、BestFit、Plot Similarity和FASTA,它们是可从Accelrys公司(美国加利福尼亚州圣地亚哥)获得的Accelrys GCG软件包的一部分。还参见Smith和Waterman,1981;Needleman和Wunsch,1970;Pearson和Lipman,1988;Ausubel等人,1988;以及Sambrook和Russell,2001。
[0173] 在一些实施例中,等位基因导致上述E1和E1Lb蛋白的变体和片段,并且当在植物、植物部分或种子中表达时,所述变体和片段导致经修饰的开花时间特征。
[0174] 当在植物、植物部分或种子中表达时,导致E1或E1Lb蛋白片段修饰开花时间特征的等位基因包括比全长序列短的那些,这是由于使用了替代的下游开始位点,或者由于加工产生了具有活性的更短的蛋白质。编码当在植物中表达时修饰开花时间特征的蛋白片段的等位基因可以是如下多肽,SEQ ID NO:2或4中的任一个的长度为例如10、25、50、100、150、200、250个或更多个氨基酸的多肽。如本文所用,片段包含SEQ ID NO:2或4的至少8个连续氨基酸。
[0175] 除非另有说明,否则同一性和相似性将通过尼德曼‑翁施全局比对和评分算法(Needleman‑Wunsch global alignment and scoringalgorithms)(Needleman和Wunsch(1970)J.Mol.Biol.[分子生物学杂志]48(3):443‑453)计算,如通过作为EMBOSS软件包(Rice,P.,Longden,I.,和Bleasby,A.,EMBOSS:The European MolecularBiology Open Software Suite[EMBOSS:欧洲分子生物学开放软件套件],2000,Trends in Genetics[遗传学趋势]16,(6)第276‑277页,6.3.1版,可在embnet.org/resource/emboss and emboss.sourceforge.net上从EMBnet以及其他来源处获得)的一部分分配的“needle”程序实施的,其使用默认的空位罚分和评分矩阵(对于蛋白质用EBLOSUM62并且对于DNA用EDNAFULL)。也可以使用等效程序。“等效程序”是指任何序列比较程序,对于任两个所讨论序列,在与通过EMBOSS6.3.1版的needle生成的对应比对相比时,该程序生成具有相同的核苷酸残基匹配和相同的序列同一性百分比的比对。
[0176] 另外的数学算法是本领域已知的并且可以用于比较两个序列。参见例如,Karlin和Altschul(1990)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]87:2264的算法,该算法在Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:5873‑5877中进行了改良。将这样的算法整合入Altschul等人(1990)J.Mol.Biol.[分子生物学杂志]215:403的BLAST程序中。BLAST核苷酸搜索可以利用以下程序进行:利用BLASTN程序(针对核苷酸序列搜索核苷酸查询)以获得与本发明的核酸分子同源的核苷酸序列,或者利用BLASTX程序(针对蛋白质序列搜索翻译的核苷酸查询)以获得与本发明的核酸分子同源的蛋白质序列。BLAST蛋白质搜索可以利用以下程序进行:利用BLASTP程序(针对蛋白质序列搜索蛋白质查询)以获得与本发明的蛋白质分子同源的氨基酸序列,或者利用TBLASTN程序(针对翻译的核苷酸序列搜索蛋白质查询)以获得与本发明的蛋白质分子同源的核苷酸序列。为了获得用于比较目的的有空位的比对,可以使用如Altschul等人(1997)Nucleic Acids Res.[核酸研究]25:3389中所述的Gapped BLAST(在BLAST 2.0中)。可替代地,可以使用PSI‑Blast进行迭代搜索,该迭代搜索检测分子之间的远的关系。参见Altschul等人(1997)同上。当使用BLAST、GappedBLAST、以及PSI‑Blast程序时,可以使用对应程序(例如BLASTX和BLASTN)的默认参数。比对也可以通过检查手动进行。
[0177] 当使用限定的氨基酸取代矩阵(例如,BLOSUM62)、空位存在罚分和空位扩展罚分(以达到该对序列所可能的最高得分)对两个序列进行比对以进行相似性评分时,两个序列经“最佳比对”。氨基酸取代矩阵及其在定量两个序列之间的相似性中的用途是本领域熟知的,并且描述于例如Dayhoff等人(1978)"A model of evolutionarychange in proteins[蛋白质进化变化的模型]"中。在"Atlas of ProteinSequence and Structure[蛋白质序列和结构的图谱]",第5卷,增刊3(M.O.Dayhoff编辑) ,第345‑352页.Natl.Biomed.Res.Found.[国家生物医学研究基金会],Washington,D.C.[华盛顿哥伦比亚特区]以及Hemkoff等人(1992)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:
10915‑10919。BLOSUM62矩阵通常用作序列比对方案中的默认评分取代矩阵。对于在比对序列中的一个中引入单个氨基酸空位,施加空位存在罚分,并且对于插入已经打开的空位中的每个另外的空氨基酸位置,施加空位扩展罚分。比对由比对开始和结束时的每个序列的氨基酸位置限定,并且任选地通过在一个或两个序列中插入一个空位或多个空位来限定,以便达到最高的可能得分。尽管可以手动完成最佳比对和评分,但通过使用计算机实施的比对算法来协助该过程,该比对算法例如为在Altschul等人(1997)Nucleic Acids Res.[核酸研究]25:3389‑3402中描述且公众可在国家生物技术信息中心网站
(www.ncbi.nlm.nih.gov)获得的gapped BLAST 2.0。包括多重比对的最佳比对可以使用例如PSI‑BLAST制备,PSI‑BLAST可以通过www.ncbi.nlm.nih.gov获得,并且由Altschul等人(1997)NucleicAcids Res.[核酸研究]25:3389‑3402描述。
[0178] II.基因编辑
[0179] 本文提供的开花时间相关序列(即E1和E1LB)可以靶向受体植物细胞的基因组内以产生新型等位基因序列。这样的方法包括但不限于针对目的植物基因组序列CRISPR‑Cas9设计的兆核酸酶、TALEN和用于精确编辑基因组的其他技术(Feng等人Cell Research[细胞研究]23:1229‑1232,2013,WO 2013/026740);Cre‑lox位点特异性重组;FLP‑FRT重组(Li等人(2009)Plant Physiol[植物生理学]151:1087‑1095);Bxbl介导的整合(Yau等人Plant J[植物杂志](2011)701:147‑166);锌指介导的整合(Wright等人(2005)Plant J[植物杂志]44:693‑705;Cai等人(2009)Plant Mol Biol[植物分子生物学]69:699‑709);以及同源重组(Lieberman‑Lazarovich和Levy(2011)Methods Mol Biol[分子生物学方法]:51‑65);引物编辑和转座酶(Anzalone,A.等人,Nat Biotechnol.[自然生物技术]2020年7月;
38(7):824‑844);易位;和倒位。
[0180] 本文所述的方法的各种实施例使用基因编辑。在一些实施例中,基因编辑用于诱变植物的基因组以产生具有赋予经修饰的开花时间的新型E1等位基因和/或新型E1Lb等位基因的植物。新型等位基因可以通过在植物基因组中在E1和/或E1Lb基因座处靶向引入突变来产生。在特定实施例中,编辑包括在E1基因座和E1LB基因座处的核定位信号(NLS)处引入突变(例如,插入、缺失、移码等)。在本研究中,E1中位置15处从精氨酸到苏氨酸的点突变恰好发生在双组分NLS中KKRK(其改变为KKTK)的第一碱性结构域处,导致与E1和e1‑as不同的亚细胞分布。这导致诸位发明人认为第二碱性结构域在E1蛋白分布中可能具有类似的作用。在特定实施例中,编辑包括在E1基因座和/或E1LB基因座处的NLS的碱性结构域处引入突变(例如,插入、缺失、移码等)。在特定实施例中,编辑包括在E1基因座和E1LB基因座处的NLS的两个碱性结构域中的第二碱性结构域处引入突变,其中第二碱性结构域相对于NLS的第一碱性结构域在下游。
[0181] 编辑可以通过使用编辑表达盒来实现。表达盒将在5’‑3’转录方向包含在目的生物体(即,植物或细菌)中起作用的转录和翻译起始区(即,启动子)、目的多核苷酸、以及转录和翻译终止区(即,终止区)。本发明的启动子能够指导或驱动编码序列在宿主细胞中的转录和表达。调节区(即启动子、转录调节区和翻译终止区)对于宿主细胞或对于彼此可以是内源的或异源的。如本文所用,嵌合基因或嵌合核酸分子包含与转录起始区可操作地连接的编码序列,该转录起始区对于该编码序列是异源的。
[0182] 多种转录终止子可用于在表达盒中使用。这些转录终止子负责转基因以外的转录终止以及正确的mRNA多腺苷酸化。终止区可以是与转录引发区天然在一起的、可以是与目的可操作地连接的DNA序列天然在一起的、可以是与宿主植物天然在一起的、或者可以源自另一种来源(即,对于启动子、目的DNA序列、宿主植物、或其任何组合是外来的或异源的)。适当的转录终止子是已知在植物中发挥作用的那些,并且包括CAMV pSOY1终止子、tml终止子、胭脂碱合酶终止子以及豌豆rbcs E9终止子。这些终止子可以在单子叶植物和双子叶植物两者中使用。此外,可以使用基因的天然转录终止子。在表达盒中使用的终止区可以从例如,根癌农杆菌的Ti‑质粒获得,如章鱼碱合酶和胭脂碱合酶终止区。还参见Guerineau等人(1991)Mol.Gen.Genet.[分子遗传学和普通遗传学]262:141‑144;Proudfoot(1991)Cell[细胞]64:671‑674;Sanfacon等人(1991)Genes Dev.[基因与发育]5:141‑149;Mogen等人(990)Plant Cell[植物细胞]2:1261‑1272;Munroe等人(1990)Gene[基因]91:151‑158;
Ballas等人(1989)Nucleic Acids Res.[核酸研究]17:7891‑7903;以及Joshi等人(1987)Nucleic Acid Res.[核酸研究]15:9627‑9639。
[0183] 另外的调节信号包括但不限于转录起始开始位点、操纵子、激活子、增强子、其他调节元件、核糖体结合位点、起始密码子、终止信号等。参见,例如,美国专利号5,039,523和4,853,331;EPO 0480762A2;Sambrook等人(1992)Molecular Cloning:A Laboratory Manual[分子克隆:实验室手册],Maniatis等人编辑(Cold Spring HarborLaboratory Press[冷泉港实验室出版社],Cold Spring Harbor[冷泉港],N.Y.[纽约]),以下称为“Sambrook 11”;Davis等人编辑,(1980)。
[0184] 在制备表达盒时,可以操纵各种DNA片段,以便提供呈适当取向并且视情况呈适当阅读框的DNA序列。为此,可以采用衔接子或接头来连接DNA片段,或者可以涉及其他操纵以提供方便的限制性位点、去除多余DNA的、去除限制性位点等。出于此目的,可以涉及体外诱变、引物修复、限制、退火、再取代(例如,转换和颠换)。
[0185] 在本发明的实践中可以使用许多启动子。可以根据期望的结果来选择启动子。核酸可以与组成型、诱导型、组织偏好型、或其他启动子组合用于在目的生物体中表达。参见例如以下中所示的启动子:WO99/43838和美国专利号:8,575,425;7,790,846;8,147,856;8.586832;7,772,369;7,534,939;6,072,050;5,659,026;5,608,149;5,608,144;5,604,
121;5,569,597;5,466,785;5,399,680;5,268,463;5,608,142;和6,177,611;其通过引用并入本文。在一些实施例中,本文使用的启动子包括外源启动子。术语“外源启动子”是指在自然界中在植物中未发现的启动子,例如合成的启动子。
[0186] 在一些实施例中,本文提供了用如上所述的基因编辑机器转化并对其表达的植物,这些植物当与靶植物杂交时,使得在靶植物中发生基因编辑。
[0187] 通常,基因编辑可能涉及基因编辑组分或系统的瞬时、诱导型或组成型表达。基因编辑可能涉及基因编辑组分或系统的基因组整合或游离体存在。
[0188] 基因编辑通常是指使用定点核酸酶(包括但不限于CRISPR/Cas、锌指、兆核酸酶等)在期望的位置处剪短核苷酸序列。这可能导致插入/缺失(“indel”)突变(即,“SDN1”)、碱基编辑(即,“SDN2”)或等位基因插入或替代(即,“SDN3”)。SDN2或SDN3基因编辑可以包括提供一个或多个重组模板(例如,在载体中),该模板包含可用于植物内同源定向修复(HDR)的目的基因序列(即,待引入到植物基因组中)。在一些实施例中,目的基因或等位基因是能够赋予植物改善的性状(例如,经修饰的开花时间特征)的基因或等位基因。可以将重组模板引入到植物中,利用包含重组模板的供体植物通过转化或通过育种进行编辑。可以将植物基因组中的断裂引入到靶序列的内部、上游和/或下游。在一些实施例中,在靶序列基因座内部或附近产生双链DNA断裂。在一些实施例中,在靶序列基因座的上游和下游产生断裂,这可以导致其从基因组中切除。在一些实施例中,在靶序列内部、上游和/或下游产生一个或多个单链DNA断裂(切口)(例如,使用切口酶Cas9变体)。这些DNA断裂中的任一个以及经由本领域技术人员已知的其他方法引入的那些DNA断裂都可以诱导HDR。通过HDR,靶序列被所提供的重组模板的序列替代,该重组模板包含目的等位基因,例如SEQ ID NO:1、2,或者可以在模板上/作为模板提供编码具有SEQ ID NO:2、4中的任一个的序列的多肽的多核苷酸。通过设计该系统,使得一个或多个单链或双链断裂被引入到不包含目的基因序列的植物基因组中对应区域的内部、上游和/或下游,该区域可以用模板替代。
[0189] 在实施例中,该定点核酸酶选自由以下组成的组:兆核酸酶(MN)、锌指核酸酶(ZFN)、转录激活因子样效应物核酸酶(TALEN)、Cas9核酸酶、Cfp1核酸酶、dCas9‑Fokl、dCpf1‑Fokl、嵌合Cas9‑胞苷脱氨酶、嵌合Cas9‑腺嘌呤脱氨酶、嵌合FEN1‑Fokl、和Mega‑TAL、切口酶Cas9(nCas9)、嵌合dCas9非Fokl核酸酶和dCpfl非Fokl核酸酶。
[0190] 在实施例中,通过用表达盒转化植物细胞来进行编辑,所述表达盒包含(i)编码定点核酸酶的核酸;以及(ii)编码针对靶序列的至少一种指导RNA(gRNA)的核酸。gRNA针对在E1基因座和/或E1LB基因座处的包含核定位序列(NLS)的靶序列。在特定实施例中,gRNA针对在E1基因座和/或E1LB基因座处的包含核定位序列(NLS)的第二碱性结构域的靶序列。在编辑表达盒的实施例中,编码定点核酸酶的核酸可操作地连接至第一启动子,而编码该至少一种gRNA的核酸可操作地连接至第二启动子(可以与第一启动子相同或不同)。在一些实施例中,表达盒可以进一步包含一个或多个另外的调节元件,如可操作地连接至第一启动子或第二启动子的增强子。
[0191] 在一些实施例中,可以在不使用重组模板的情况下经由靶向引入DNA双链断裂来产生本文所述的目的基因或野生型等位基因中的突变。这样的断裂可以通过非同源末端连接(NHEJ)过程进行修复,这可能导致在修复位点产生小的插入或缺失(indel)。这样的indel可能导致移码突变,从而引起靶向基因中过早终止密码子或其他类型的功能失去突变。
[0192] 在一些实施例中,基因编辑可能涉及靶植物中基因编辑组分或系统的瞬时、诱导型或组成型表达。基因编辑还可能涉及靶植物中基因编辑组分或系统的基因组整合或游离体存在。
[0193] 在某些实施例中,核酸修饰或突变由(经修饰的)锌指核酸酶(ZFN)系统实现。ZFN系统使用人工限制性内切酶,该人工限制性内切酶通过将锌指DNA结合结构域与DNA切割结构域融合而生成,该DNA切割结构域可以被工程化以靶向所期望的DNA序列。使用ZFN进行基因组编辑的示例性方法可以在例如以下中发现:美国专利号6,534,261;6,607,882;6,746,838;6,794,136;6,824,978;6,866,997;6,933,113;和6,979,539。
[0194] 在某些实施例中,核酸修饰由(经修饰的)兆核酸酶实现,兆核酸酶是脱氧核糖核酸内切酶,其特征在于大的识别位点(12至40个碱基对的双链DNA序列)。使用兆核酸酶的示例性方法可以在以下中发现:美国专利号:8,163,514;8,133,697;8,021,867;8,119,361;8,119,381;8,124,369;和8,129,134,这些文献特别地通过引用并入。
[0195] 在某些实施例中,核酸修饰由(经修饰的)CRISPR/Cas复合物或系统实现。在某些实施例中,CRISPR/Cas系统或复合物是2类CRISPR/Cas系统。在某些实施例中,所述CRISPR/Cas系统或复合物是II型、V型或VI型CRISPR/Cas系统或复合物。CRISPR/Cas系统不需要生成定制的蛋白质来靶向特定序列,而是可以通过RNA指导序列(gRNA)对单一Cas蛋白进行编程以识别特定的核酸靶标,换句话说,可以使用所述短RNA指导序列将Cas酶蛋白募集到目的特定核酸靶标基因座(该基因座可能包含RNA和/或DNA或由其组成)。
[0196] 通常,CRISPR/Cas或CRISPR系统如本文上述文献所用,统指涉及CRISPR相关(“Cas”)基因的表达或指导其活性的转录物和其他元件,包括编码Cas基因的序列以及以下中的一个或多个:tracr(反式激活CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr‑配对序列(在内源CRISPR系统的上下文中包含“同向重复序列”和tracrRNA处理的部分同向重复序列)、指导序列(在内源CRISPR系统的上下文中也称为“间隔子”)、或一种或多种如本文中使用的术语“RNA”(例如,用于指导Cas如Cas9的一种或多种RNA,例如CRISPR RNA以及在适用的情况下的反式激活(tracr)RNA或单指导RNA(sgRNA)(嵌合RNA))或来自CRISPR基因座的其他序列和转录物。通常,CRISPR系统特征在于在靶序列的位点处促进CRISPR复合物形成的元件(在内源CRISPR系统的上下文中也称为原型间隔子)。在形成CRISPR复合物的情况下,“靶序列”是指指导序列被设计为与其具有互补性的序列,其中靶序列与指导序列之间的杂交促进CRISPR复合物的形成。靶序列可以包含任何多核苷酸,如DNA或RNA多核苷酸。
[0197] 在某些实施例中,gRNA是嵌合指导RNA或单指导RNA(sgRNA)。在某些实施例中,gRNA包含指导序列和tracr配对序列(或同向重复序列)。在某些实施例中,gRNA包含指导序列、tracr配对序列(或同向重复序列)和tracr序列。在某些实施例中,如本文所述的CRISPR/Cas系统或复合物不包含和/或不依赖于tracr序列的存在(例如,如果Cas蛋白是Cas12a)。
[0198] 如本文提及的Cas蛋白,如但不限于Cas9、Cas12a(以前称为Cpf1)、Cas12b(以前称为C2c1)、Cas13a(以前称为C2c2)、C2c3、Cas13b蛋白,可源自任何合适的来源,因此可以包括来自多种(原核)生物体的不同直系同源物,如在本领域中被充分记载的。在某些实施例中,Cas蛋白是(经修饰的)Cas9,优选(经修饰的)金黄色葡萄球菌Cas9(SaCas9)或(经修饰的)酿脓链球菌Cas9(SpCas9)。在某些实施例中,Cas蛋白是Cas12a,任选地来自氨基酸球菌属物种,如氨基酸球菌属物种BV3L6 Cpf1(AsCas12a),或毛螺菌科细菌Cas12a,如毛螺菌科细菌MA2020或毛螺菌科细菌MD2006(LBCas12a)。参见美国专利号10,669,540,通过引用以其全文并入本文。可替代地,Cas12a蛋白可以来自牛眼莫拉氏菌(Moraxellabovoculi)AAX08_00205[Mb2Cas12a]或牛眼莫拉氏菌AAX11_00205[Mb3Cas12a]。参见,WO 2017/189308,通过引用以其全文并入本文。在某些实施例中,Cas蛋白是(经修饰的)C2c2,优选韦德纤毛菌(Leptotrichia wadei)C2c2(LwC2c2)或纽约李斯特菌(Listeria newyorkensis)FSL M6‑0635 C2c2(LbFSLC2c2)。在某些实施例中,(经修饰的)Cas蛋白是C2c1。在某些实施例中,(经修饰的)Cas蛋白是C2c3。在某些实施例中,(经修饰的)Cas蛋白是Cas13b。本领域技术人员可以获得其他Cas酶。
[0199] 基因编辑方法和组合物也披露于美国专利号10,519,456和10,285,348 82中,其全部内容通过引用并入本文。
[0200] 引入植物中的基因编辑机器(例如,DNA修饰酶)可以由能够驱动重组基因在植物中表达的任何启动子控制。在一些实施例中,启动子是组成型启动子。在一些实施例中,启动子是组织特异性启动子,例如花粉特异性启动子或精细胞特异性启动子,接合子特异性启动子,或在精子、卵子和接合子中高度表达的启动子(例如,prOsActin1)。合适的启动子披露于美国专利号10,519,456中,其全部内容通过引用并入本文。
[0201] 在另一个方面,本文提供了编辑植物基因组DNA的方法。在一些实施例中,该方法包括使用表达DNA修饰酶和至少一种任选的如上所述的指导核酸的第一大豆植物来对包含待编辑的基因组DNA的靶植物进行授粉。在一些实施例中,产生新型等位基因和等位基因组合的方法包括经由定点核酸酶在大豆植物基因组的E1基因座和/或E1LB基因座中的一个或多个处编辑。
[0202] III.选择具有新型等位基因和改善的性状的植物。
[0203] 除了表型性状之外,由遗传标记物特征表示的植物的遗传特征可以用于选择具有期望的性状的植物。术语“基于标记物的选择”是指使用遗传标记物从植物中检测一个或多个核酸,其中该核酸与期望的性状相关联,以鉴定出携带期望的(或不期望的)性状的基因或等位基因的植物。标记物包括但不限于限制性片段长度多态性(RFLP)、随机扩增多态性DNA(RAPD)、随机引物聚合酶链式反应(AP‑PCR)、DNA扩增指纹分析(DAF)、序列特征扩增区(SCAR)、扩增片段长度多态性(AFLP)、简单序列重复(SSR)(也称为微卫星)、和单核苷酸多态性(SNP)。已知有一系列公开标记物正在由ASTA和其他行业组织根据美国植物品种保护法(US Plant Variety ProtectionAct)研究,研究其在标准化确定什么构成基本衍生品种中的适用性。然而,这些标准标记物并不限制可用于育种或开发回交转化、或用于区分品种或植物部分或植物细胞或验证后代谱系的标记物和标记物特征的类型。用于测定这些和其他标记物的引物和PCR方案在位于万维网的129.186.26.94/SSR.html的Soybase(由USDA农业研究局(Agricultural Research Service)和爱荷华州立大学(Iowa StateUniversity)资助)中披露。
[0204] 如本文所用的术语“与……相关联”是指两个实体之间可识别和/或可检测的关系。例如,短语“与经修饰的开花时间相关联”是指性状、基因座、基因、等位基因、标记物、表型等或其表达产物,它们的存在或不存在可以影响或指示与对照植物相比植物或其后代展现它们的开花时间和/或成熟期值变化的范围和/或程度。因此,当标记物与性状连锁并且当标记物的存在指明了所希望的性状或性状形式是否会和/或会以什么程度发生在包含标记物的植物/种质中时,则该标记物与该性状“相关联”。类似地,当标记物与等位基因连锁并且当标记物的存在(或不存在)指明了等位基因是否存在(或不存在)于包含标记物的植物、种质或群体中时,该标记物与该等位基因“相关联”。例如,“与赋予经修饰的开花时间特征的新型E1等位基因相关联的标记物”是指这样的标记物,它的存在或不存在可用于确定植物中是否存在新型E1等位基因,和/或与对照植物相比植物将展示开花时间改变到什么程度。同样地,“与赋予经修饰的开花时间特征的新型E1Lb等位基因相关联的标记物”是指这样的标记物,它的存在或不存在可用于确定植物中是否存在新型E1Lb等位基因,和/或与对照植物相比植物将展示开花时间改变到什么程度。
[0205] 术语“一个或多个等位基因”是指基因的一个或多个替代形式中的任一个,所有等位基因均涉及至少一个性状或特征。在二倍体细胞中,给定基因的两个等位基因占有同源染色体对上对应的基因座。
[0206] 术语“基因型”及其变体是指生物体的遗传组分,包括,例如,二倍体生物体对一个或多个基因或基因座(例如,SNP、单倍型、基因突变、插入或缺失)为杂合的(即,对于给定的基因或QTL具有两个不同的等位基因)还是纯合的(即,对于给定的基因或QTL具有相同的等位基因)。
[0207] 在一个实施例中,用于鉴定包含本文披露的等位基因的植物的标记物是SNP。SNP基因型分型方法的非限制性实例包括杂交、引物延伸、寡核苷酸连接、核酸酶切割、微测序和编码球(coded sphere)。这样的方法是熟知的并且披露于例如,Gut,I.G.,Hum.Mutat.[人类突变]17:475‑492(2001);Shi,Clin.Chem.[临床化学]47(2):164‑172(2001);Kwok,Pharmacogenomics[药物基因组学]1(1):95‑100(2000);以及Bhattramakki和Rafalski,Discovery and application ofsingle nucleotide polymorphism markers in plants[植物中单核苷酸多态性标记物的发现和应用],在PLANT GENOTYPING:THE DNAFINGERPRINTING OF PLANTS[植物基因型分型:植物的DNA指纹图谱]中,
CABIPublishing[CABI出版社],Wallingford[瓦林福德](2001)。大范围的可商购的技术利用这些和其他方法询问SNP,包括Masscode SupTM/Sup(凯杰公司(Qiagen),日耳曼敦市,马里兰州)、(好乐杰公司(Hologic),麦迪逊,威斯康星州)、(应用生物系统公司(Applied Biosystems),福斯特城(Foster City),加利福尼亚州)、(应用生物系统公司,福斯特城,加利福尼亚州)和Beadarrays SupTM/Sup(亿明达公司(Illumina),圣地亚哥,加利福尼亚州)。
[0208] 在一些实施例中,测定(例如,通常为两步等位基因鉴别测定或类似测定)、KASP SupTM/Sup测定(通常是以下定义的一步等位基因鉴别测定或类似测定)、或两者均可用于鉴定与经修饰的开花时间特征相关联的SNP。在示例性两步测定中,采用了正向引物、反向引物、以及在SNP位点处识别两个不同的等位基因(或杂交寡核苷酸)的两种测定探针。将正向和反向引物用于扩增包含与经修饰的FT特征相关联的SNP的遗传基因座。然后,在SNP位置处存在的特定核苷酸是使用探针测定的。在一些实施例中,设计测定探针和反应条件使得测定探针将仅与100%完全匹配的序列的反向互补物杂交,从而允许基于杂交的检测来鉴定存在的哪种或哪些等位基因。在一些实施例中,将探针例如用荧光团进行差异标记,以便在单个反应中区分两个测定探针。扩增的示例性方法包括采用聚合酶链式反应(PCR)或连接酶链式反应(LCR),使用分离自大豆植物或种质的核酸作为PCR或LCR中的模板。
[0209] 在一些实施例中,可以使用序列内或跨连锁序列的许多SNP等位基因一起来描述任何特定的基因型的单倍型。Ching等人,BMC Genet.[BMC遗传学]3:19(2002)(第14页);Gupta等人,(2001)Curr Sci.[当代科学]80:524‑535,Rafalski,Plant Sci[植物科学]
162:329‑333(2002)。在一些情况下,单倍型可以比单个SNP更具信息性,并且可以更详细地描述任何特定的基因型。例如,对于特定的疾病抗性品系或品种,单个SNP可以是等位基因“T”,但等位基因“T”也可以出现在用于轮回亲本的大豆育种群体中。在这种情况下,连锁SNP的等位基因的组合可以更具信息性。一旦将独特的单倍型分配给供体染色体区域,该单倍型可以用于该群体或其任何亚群中以确定个体是否具有特定的基因。使用本领域普通技术人员已知的自动化高通量标记物检测平台使得该方法高效且有效。
[0210] 这些SNP标记物可用于标记物辅助育种程序,以将性状(如天然性状或转基因赋予的性状或基因组编辑赋予的性状)转移到期望的植物背景中。如本文所用,术语“天然性状”是指种质中已经存在的性状,包括作物物种的野生近缘种,或可以通过现有性状的重组产生的性状。例如,可以对来自基因组中包含编码SEQ ID NO:5‑14的等位基因的核酸序列的供体大豆植物与不包含所述核酸序列的受体大豆植物之间的杂交的后代植物进行筛选,以检测与经修饰的FT特征相关联的标记物的存在。可以选择包含所述标记物的植物,并验证其与对照植物相比经修饰的FT特征。在一些实施例中,标记物包含实例3中所披露的和所描述的引物序列。
[0211] IV.植物转化
[0212] 一旦基因编辑盒已经克隆到表达系统中,就将其转化到植物细胞中。本发明的受体和目标表达盒可以以多种技术公认的方式被引入到植物细胞中。在多核苷酸(例如,目的核苷酸构建体)的情况下,术语“引入”旨在意指以使该多核苷酸得以进入植物细胞内部的方式将该多核苷酸呈递到植物中。在要引入多于一个多核苷酸的情况下,这些多核苷酸可以被组装为单一核苷酸构建体的一部分,或者被组装为单独的核苷酸构建体,并且可以位于同一或不同转化载体上。因此,可以在单一转化事件中,在单独的转化事件中,或者例如在植物中作为育种方案的一部分,将这些多核苷酸引入目的宿主细胞中。本发明的方法并不依赖于用于将一个或多个多核苷酸引入植物中的特定方法,只要该一个或多个多核苷酸得以进入植物的至少一个细胞内部。用于将多核苷酸引入植物中的方法是本领域中已知的,包括但不限于瞬时转化方法、稳定转化方法和病毒介导的方法。
[0213] 在多核苷酸的情况下,“瞬时转化”旨在意指将多核苷酸引入植物中并且不整合到该植物的基因组中。
[0214] 在被引入植物中的多核苷酸的背景下,“稳定引入(stablyintroducing)”或“稳定引入的(stably introduced)”意指所引入的多核苷酸被稳定地掺入到植物基因组中,并且因此该植物用该多核苷酸进行了稳定转化。
[0215] “稳定转化”或“稳定转化的”旨在意指,被引入植物中的多核苷酸(例如,本文所述的核苷酸构建体)整合至该植物的基因组中,并且能够被其后代继承,更特别地,被多个连续世代的后代继承。
[0216] 可用于植物转化的多种转化载体是植物转化领域的普通技术人员已知的,并且与本发明有关的基因可以与任何这样的载体结合使用。载体的选择将取决于优选的转化技术和用于转化的目标物种。对于某些目标物种,不同的抗生素或除草剂选择性标记物可以是优选的。转化中常规使用的选择标记物包括赋予对卡那霉素和相关抗生素的抗性的nptll基因(Messing&Vierra Gene[基因]19:259‑268(1982);Bevan等人,Nature[自然]304:184‑187(1983)),赋予对除草剂草铵膦(也称为草丁膦)的抗性的pat和bar基因(参见White等人,Nucl.AcidsRes[核酸研究]18:1062(1990),Spencer等人Theor.Appl.Genet[理论和应用遗传学]79:625‑631(1990)和美国专利号5,561,236和5,276,268),赋予对抗生素潮霉素的抗性的hph基因(Blochinger&Diggelmann,Mol.Cell Biol.[分子细胞生物学]4:2929‑
2931),和赋予对甲氨蝶呤的抗性的dhfr基因(Bourouis等人,EMBO J.[欧洲分子生物学学会杂志]2(7):1099‑1104(1983)),赋予对草甘膦抗性的EPSPS基因(美国专利号4,940,935和5,188,642),也赋予对草甘膦的抗性的草甘膦N‑乙酰基转移酶(GAT)基因(Castle等人(2004)Science[科学],304:1151‑1154;美国专利申请公开号20070004912、20050246798和
20050060767);以及提供代谢甘露糖的能力的甘露糖‑6‑磷酸异构酶基因(美国专利号5,
767,378和5,994,629)。
[0217] 用于植物再生的方法也是本领域熟知的。例如,已经利用Ti质粒载体以及直接DNA摄取、脂质体、电穿孔、显微注射和微粒(microprojectile)来递送外来DNA。此外,可以利用来自农杆菌属的细菌来转化植物细胞。以下是对用于转化双子叶和单子叶植物二者的代表性技术连同代表性质体转化技术的描述。
[0218] 对于使用根癌农杆菌的转化而言,很多载体是可获得的。这些典型地携带至少一个T‑DNA边界序列并且包括诸如pBIN19的载体(Bevan,Nucl.Acids Res.[核酸研究](1984))。对于在农杆菌转化中有用的载体的构建,参见,例如,美国专利申请公开号2006/
0260011,其通过引用并入本文。
[0219] 没有使用根癌农杆菌的转化避免了在选择的转化载体中对于T‑DNA序列的需要,并且因此除了如以上描述的含有T‑DNA序列的那些载体以外,可以利用缺乏这些序列的载体。不依赖农杆菌的转化技术包括经由粒子轰击、原生质体摄入(例如PEG和电穿孔)和显微注射的转化。载体的选择很大程度上取决于所转化物种的优先选择。对于此类载体的构建,参见,例如美国申请号20060260011,其通过引用并入本文。
[0220] 用于双子叶植物的转化技术是本领域熟知的,并且包括基于农杆菌的技术以及不需要农杆菌的技术。非农杆菌技术涉及直接由原生质体或细胞对外源基因材料摄入。这可以通过PEG或电穿孔介导的摄取、粒子轰击介导的递送或显微注射来完成。这些技术的实例由以下描述:Paszkowski等人,EMBO J.[欧洲分子生物学学会杂志]3:2717‑2722(1984),Potrykus等人,Mol.Gen.Genet.[分子遗传学与普通遗传学]199:169‑177(1985),Reich等人,Biotechnology[生物技术]4:1001‑1004(1986)以及Klein等人,Nature[自然]327:70‑73(1987)。在每个情形中,使用本领域已知的标准技术使转化的细胞再生为全株植物。
[0221] 对于双子叶植物的转化,农杆菌介导的转化是优选的技术,因为它的转化效率高以及它广泛适用于许多不同的物种。农杆菌转化典型地涉及将携带目的外源DNA的二元载体(例如,pCIB200或pCIB2001)转移到适当的农杆菌菌株中,该二元载体可以依赖于由该宿主农杆菌菌株(例如用于pCIB200以及pCIB2001的CIB542菌株(Uknes等人Plant Cell[植物细胞]5:159‑169(1993)))或者在共驻留Ti质粒上亦或在染色体上携带的vir基因的互补物。通过使用携带重组二元载体的大肠杆菌以及携带质粒(如pRK2013)并且能够将该重组二元载体移动到目标农杆菌菌株中的辅助大肠杆菌菌株的三亲本杂交方法来实现该重组二元载体到农杆菌的转移。可替代地,可以通过DNA转化将该重组二元载体转移到农杆菌中(Hofgen和Willmitzer,Nucl.Acids Res.[核酸研究]16:9877(1988))。
[0222] 通过重组体农杆菌转化目标植物物种通常涉及该农杆菌与来自该植物的外植体的共培养,并且遵循本领域熟知的方案。将转化的组织在存在于二元质粒T‑DNA边界之间的携带有抗生素标记物的选择性培养基上再生。
[0223] 用基因转化植物细胞的另一种方法涉及在植物组织和细胞上推进惰性或生物活性颗粒。这种技术披露于美国专利号4,945,050、5,036,006和5,100,792(均属于Sanford等人)中。一般地,这种方法涉及在细胞上在有效穿透该细胞的外表面并提供掺入在其内部中的条件下推进惰性或生物学活性颗粒。在利用惰性颗粒时,可以通过用含有期望基因的载体包被这些颗粒以将该载体引入细胞中。可替代地,可以使靶细胞被载体包围以使得该载体通过颗粒的尾流而被带入该细胞中。也可以将生物学活性颗粒(例如,干酵母细胞、干细菌或噬菌体,各自包含被试图引入的DNA)推进到植物细胞组织中。
[0224] 大多数单子叶植物物种的转化现在也已经变成了常规操作。优选的技术包括使用PEG或电穿孔技术将基因直接转移至原生质体中,以及粒子轰击至愈伤组织中。可以用单一DNA种类或多种DNA种类(即,共转化)进行转化,并且这两种技术都适合用于本发明中。共转化可以具有如下优点:避免完整载体构建以及生成具有目的基因和选择性标记物的非伴性基因座的转基因植物,使得能够在随后的世代中去除该选择性标记物(如果这被认为所期望的话)。然而,使用共转化的一个缺点是小于100%的频率,分离的DNA种类以该频率被整合到基因组中(Schocher等人Biotechnology[生物技术]4:1093‑1096(1986))。
[0225] 专利申请EP 0 292 435、EP 0 392 225、以及WO 93/07278描述了用于从良种近交品系玉蜀黍制备愈伤组织和原生质体、使用PEG或电穿孔转化原生质体、以及从转化的原生质体再生玉蜀黍植物的技术。Gordon‑Kamm等人(Plant Cell[植物细胞]2:603‑618(1990))和Fromm等人(Biotechnology[生物技术]8:833‑839(1990))已经公开了使用粒子轰击用于转化源于A188的玉蜀黍品系的技术。此外,WO93/07278和Koziel等人(Biotechnology[生物技术]11:194‑200(1993))描述了通过粒子轰击用于转化良种近交品系玉蜀黍的技术。这种技术利用了在授粉后14‑15天从玉蜀黍穗切除的1.5‑2.5mm长的不成熟玉蜀黍胚,以及用于轰击的PDS‑1000He Biolistics装置。
[0226] 还已经描述了使用农杆菌转化单子叶植物。参见WO 94/00977以及美国专利号5,591,616,这两者均通过引用并入本文。还参见Negrotto等人,Plant Cell Reports[植物细胞报告]19:798‑803(2000),其通过引用并入本文。
[0227] 将工程化至上述基因组编辑或转基因种子和植物中的遗传特性通过有性繁殖或营养生长进行传递,并且可以因此在后代植物中维持和传播。通常,维持和传播利用已知的农业方法,开发这些方法以适合特定的目的,如耕种、播种或收获。
[0228] 可以在植物育种中进一步利用根据本发明的基因组编辑或转基因植物和种子的有利的遗传特性。根据期望的特性,采取不同的育种措施。相关的技术是本领域熟知的并且包括但不限于:杂交、近交、回交育种、多系育种、品种共混、种间杂交、非整倍体技术等。因此,根据本发明的基因组编辑的或转基因的种子和植物可以用于改进的植物品系(例如,增加了培育的地理范围)的育种。
[0229] 使用适合的选择标记物(如卡那霉素)、二元载体(如来自农杆菌)以及植物再生(如从烟草叶盘))的许多合适的转化方法是本领域熟知的。
[0230] V.基于改变的开花时间特征确立培育区域。
[0231] 提供了用于确立在E1和E1Lb基因座中的一个或多个处具有基因组编辑的植物应该在何处培育的方法。特别地,所述方法能够确立大豆植物或其种子应该生长在何处,其中大豆植物在E1和E1Lb基因座中的一个或两个处具有基因组编辑,产生了与包含野生型形式的等位基因的对照植物的等位基因组合不同的新型等位基因组合。所述方法需要确定特定的等位基因组合,随后比较由特定的等位基因组合产生的改变的开花时间。在示例实施例中,指定开花时间的变化包括指定所述大豆植物相对于对照植物开花时间变化(例如,提前或延缓)的持续时间(如小时数、天数或周数)。例如,导致与开花时间为45天的对照植物相比开花时间为50天(例如,从VE到R1的持续时间)的等位基因组合指定开花时间的变化(特别是,提前)为(50‑45)5天或(5x 24)120小时。在一些实施例中,5天的提前与所定义的相对成熟期组转变相关联。在其他实施例中,10天的提前与所定义的相对成熟期组转变相关联。然而,将理解,开花时间的变化程度和方向与相对成熟期组的变化之间的关系可以不是线性的,并且可以基于另外的因素,如环境天气条件(例如,温度和湿度)、培育位置(室内或室外)、浇水和化学处理频率等。
[0232] 作为第一非限制性实例,开花时间从约90‑100天的第一时间至约87‑97天(例如,87至95天)的第二时间的变化可以与成熟期组从RM 5.5至RM 5的变化相关。
[0233] 作为第二非限制性实例,开花时间从约90‑100天的第一时间至约83‑84天的第二时间的变化可以与成熟期组从RM 5.5至RM 4的变化相关。
[0234] 作为第三非限制性实例,开花时间从约90‑100天的第一时间至约70‑72天的第二时间的变化可以与成熟期组从RM 5.5至RM 3的变化相关。
[0235] 作为第四非限制性实例,开花时间从约90‑100天的第一时间至约58‑62天的第二时间的变化可以与成熟期组从RM 5.5至RM 2的变化相关。
[0236] 作为第五非限制性实例,开花时间从约90‑100天的第一时间至约43‑44天的第二时间的变化可以与成熟期组从RM 5.5至RM 0或RM1.0的变化相关。
[0237] 作为第六非限制性实例,开花时间从约90‑100天的第一时间至约37‑41天的第二时间的变化可以与成熟期组从RM 5.5至RM 00的变化相关。
[0238] 作为第七非限制性实例,开花时间从约90‑100天的第一时间至约30‑31天的第二时间的变化可以与成熟期组从RM 5.5至RM 000的变化相关。
[0239] 在实施例中,改变的开花时间可以用于确立经编辑的植物的改变的成熟期值或相对成熟期组。基于开花时间的变化,可以选择地理区域(例如,纬度、温度区域等)。在实施例中,选择区域可以进一步包括确定植物是在室内(例如,在温室中)还是在室外(例如,在田地中)生长。
[0240] 作为实例,基于等位基因组合,大豆植物可以从在第一区域中生长过渡至在第二区域中生长。如本文所用,将植物的生长从第一区域过渡至第二区域意指经编辑的植物可以另外地或任选地在第二区域中生长,而未经编辑的对照植物(从其衍生经编辑的植物或相对于其测量开花时间变化)继续仅在第一区域中生长,并且其中对照植物不能在第二区域中生长。
[0241] 作为实例,基于等位基因组合,经编辑的非天然存在的大豆植物可以从在40°N与50°N之间(例如,在40°N与45°N之间、或在45°N与50°N之间)的第一区域中生长过渡至在30°N与40°N之间(例如,在30°N与35°N之间、或在35°N与40°N之间)或在20°N与30°N之间(例如,在20°N与25°N之间、或在25°N与30°N之间)的第二区域中生长。作为另一个实例,基于等位基因组合,经编辑的非天然存在的大豆植物可以从在30°N与40°N之间(例如,在30°N与35°N之间、或在35°N与40°N之间)的第一区域中生长过渡至在20°N与30°N之间(例如,在20°N与
25°N之间、或在25°N与30°N之间)的第二区域中生长。在此,过渡是从日照更长的区域至日照更短的区域。在特定实施例中,由于相对于对照植物而言增加了经编辑的植物的开花时间的等位基因组合,可以实现向具有更短日照的区域的过渡。
[0242] 作为实例,基于等位基因组合,经编辑的非天然存在的大豆植物可以从在20°N与30°N之间(例如,在20°N与25°N之间、或在25°N与30°N之间)的第一区域中生长过渡至在30°N与40°N之间(例如,在30°N与35°N之间、或在35°N与40°N之间)或在40°N与50°N之间(例如,在40°N与45°N之间、或在45°N与50°N之间)的第二区域中生长。作为另一个实例,基于等位基因组合,经编辑的非天然存在的大豆植物可以从在30°N与40°N之间(例如,在30°N与35°N之间、或在35°N与40°N之间)的第一区域中生长过渡至在40°N与50°N之间(例如,在40°N与
45°N之间、或在45°N与50°N之间)的第二区域中生长。在此,过渡是从日照更短的区域至日照更长的区域。在特定实施例中,由于相对于对照植物而言减少了经编辑的植物的开花时间的等位基因组合,可以实现向具有更长日照的区域的过渡。
[0243] 一个确立大豆植物或其种子应在何处生长的方法的示例实施例包括:(a)经由使用定点核酸酶的基因组修饰在大豆植物基因组的E1基因座和E1LB基因座处引入突变;(b)使该植物自交一代或多代,以产生在该E1基因座和该E1LB基因座中的每一个处纯合的后代植物;(c)从所述后代植物获得DNA;(d)经由指示在该E1基因座处引入的突变类型的DNA的第一测定以及指示在该E1LB基因座处引入的突变类型的DNA的第二测定来确定所述后代植物的等位基因组合;以及(e)基于所确定的等位基因组合指定该植物的开花时间的变化,其中该开花时间的变化是相对于不包含该等位基因组合的对照植物而言的。
[0244] 该方法的另一个示例实施例包括经由定点核酸酶在大豆植物的基因组的E1基因座和E1LB基因座处编辑;从大豆植物的经编辑后代中分离DNA;经由指示在该E1基因座处引入的突变类型的第一DNA测定以及指示在该E1LB基因座处引入的突变类型的第二DNA测定来确定所述经编辑的后代植物的等位基因组合;以及基于所确定的等位基因组合指定该后代的开花时间的变化,其中该开花时间的变化是相对于不包含该等位基因组合的对照植物而言的。
[0245] 该方法的另外的实施例包括编辑大豆植物的基因组的内源E1基因和E1LB基因;使该植物自交一代或多代,以产生在E1基因和E1LB基因中的每一个处经纯合编辑的后代植物;从所述后代植物获得DNA;经由指示在该E1基因处引入的突变类型的DNA的第一测定以及指示在该E1LB基因处引入的突变类型的DNA的第二测定来确定所述后代植物的等位基因组合;以及基于所确定的等位基因组合指定该植物的开花时间的变化,其中该开花时间的变化是相对于不包含该等位基因组合的对照植物而言的。
[0246] 另一个确立大豆植物或其种子应在何处生长的方法的示例实施例包括:a.经由使用定点核酸酶的基因组修饰在大豆植物基因组的E1基因座和/或E1LB基因座处引入突变(例如,仅在E1基因座中引入、仅在E1LB基因座中引入、或在E1和E1LB基因座中的每一个中引入);b.使所述植物自交一代或多代,以产生对所述E1基因座和/或所述E1LB基因座处的突变为纯合的后代植物;c.从所述后代植物获得DNA;d.经由指示在所述E1基因座和/或所述E1LB基因座处引入的突变的测定来确定所述后代植物的等位基因组合;以及e.基于所确定的等位基因组合为该子代植物指定开花时间和/或成熟时间的变化,其中该开花时间和/或成熟期时间的变化是相对于不包含所确定的等位基因组合的对照植物而言的。例如,在E1基因座和/或E1LB基因座的核定位信号(NLS)处引入突变。在特定实例中,在E1基因座和/或E1LB基因座的NLS的碱性结构域处引入突变。在特定实例中,在E1基因座和/或E1LB基因座的核定位信号(NLS)的两个碱性结构域中的第二碱性结构域处引入突变,其中第二碱性结构域相对于NLS的第一碱性结构域在下游。在实施例中,引入包括用表达盒转化植物细胞,该表达盒包含:(i)编码所述定点核酸酶的核酸;以及(ii)编码至少一种指导RNA(gRNA)的核酸,该至少一种指导RNA针对在所述E1基因座和/或所述E1LB基因座处的靶序列。在一些实例中,该至少一种gRNA针对在该E1基因座和该E1LB基因座中的一个处的包含核定位信号(NLS)的第二碱性结构域的靶序列。在其他实例中,该至少一种gRNA针对在该E1基因座和该E1LB基因座中的每一个处的包含核定位信号(NLS)的第二碱性结构域的靶序列。在一些实例中,编码定点核酸酶的核酸可操作地连接至表达盒的第一启动子,并且编码该至少一种gRNA的核酸可操作地连接至表达盒的第二启动子,其中第一启动子和第二启动子是不同的启动子序列或具有共同的启动子序列。在实施例中,表达盒进一步包含可操作地连接至第一启动子或第二启动子的增强子,该增强子用于增强可操作地连接至启动子的序列的转录。作为非限制性实例,所述定点核酸酶选自由以下组成的组:兆核酸酶(MN)、锌指核酸酶(ZFN)、转录激活因子样效应物核酸酶(TALEN)、Cas9核酸酶、Cfp1核酸酶、dCas9‑Fokl、dCpf1‑Fokl、嵌合Cas9‑胞苷脱氨酶、嵌合Cas9‑腺嘌呤脱氨酶、嵌合FEN1‑Fokl、和Mega‑TAL、切口酶Cas9(nCas9)、嵌合dCas9非Fokl核酸酶和dCpfl非Fokl核酸酶。在一些实例中,引入E1基因座和/或E1LB基因座中的突变选自由以下组成的组:等位基因替代、一个或多个碱基插入、一个或多个碱基缺失。
[0247] 在特定实例中,等位基因组合包含以下中的一种或多种:导致E1蛋白功能丧失的突变型E1等位基因;导致E1蛋白的部分功能的突变型E1等位基因;导致E1LB蛋白功能丧失的突变型E1LB等位基因;以及导致E1LB蛋白的部分功能的突变型E1LB等位基因。例如,在E1LB基因座处的突变型等位基因可以对应于SEQ ID NO:15、17、19、21和23中的任一个;或编码对应于SEQ ID NO:16、18、20、22和24中任一个的突变型E1LB蛋白。在其他实例中,在E1基因座处的突变型等位基因对应于SEQ ID NO:5、7、9、11和13中的任一个;或编码对应于SEQ ID NO:6、8、10、12和14中任一个的突变型E1蛋白。
[0248] 在实施例中,相对于对照植物而言子代植物具有经修饰的开花时间和/或成熟时间,并且其中对照植物在E1基因座和E1LB基因座中的每一个处包含野生型等位基因。在一些实例中,指定开花时间和/或成熟时间的变化包括指定相对于对照植物而言子代植物的开花时间和/或成熟时间缩短的天数。在特定实施例中,指定开花时间的变化包括相对于对照植物而言子代植物的VE阶段与R1阶段之间的天数减少,和/或其中指定成熟时间的变化包括相对于对照植物而言子代植物的R1阶段与R7或R8阶段之间的天数减少。
[0249] 在实施例中,引入突变进一步包括从该转化的植物细胞再生转化的T0植物,该转化的T0植物具有多个T1种子,其中该多个T1种子在E1基因座和/或E1LB基因座中含有多个独特的编辑;从该T1种子长成多个T1植物;以及使T1植物自交一代或多代,以获得对E1基因座和/或E1LB基因座处引入的突变为纯合的子代植物。其中确定等位基因组合包括对后代植物的E1基因座和E1LB基因座进行测序;对该T0植物的E1基因座和E1LB基因座进行测序;以及将该子代植物的E1基因座和E1LB基因座序列与该子代植物的对应序列进行比对,以确定引入该E1基因座和/或该E1LB基因座中的突变。
[0250] 本发明的非限制性实施例包括确立大豆植物或其种子应在何处生长的方法。在实施例中,该方法包括:a.经由使用定点核酸酶的基因组修饰在大豆植物基因组的E1基因座和E1LB基因座处引入突变;b.使该植物自交一代或多代,以产生在该E1基因座和该E1LB基因座中的每一个处纯合的后代植物;c.从所述后代植物获得DNA;d.经由指示在该E1基因座处引入的突变类型的DNA的第一测定以及指示在该E1LB基因座处引入的突变类型的DNA的第二测定来确定所述后代植物的等位基因组合;以及e.基于所确定的等位基因组合指定该植物的开花时间的变化,其中该开花时间的变化是相对于不包含该等位基因组合的对照植物而言的。在一些实施例中,编辑包括在E1基因座和E1LB基因座处的核定位信号(NLS)处引入突变。在其他实施例中,编辑包括在E1基因座和E1LB基因座处的NLS的碱性结构域处引入突变。在特定实施例中,编辑包括在E1基因座和E1LB基因座处的NLS的两个碱性结构域中的第二碱性结构域处引入突变,其中第二碱性结构域相对于NLS的第一碱性结构域在下游。在实施例中,指定开花时间的变化包括指定相对于不包含该等位基因组合的对照植物而言的相对成熟期组值,其中任选地,该对照植物在该E1基因座和E1LB基因座中的每一个处包含野生型等位基因。在其他实施例中,指定开花时间的变化包括指定该大豆植物相对于该对照植物而言开花时间提前或延缓的天数。
[0251] 本发明的非限制性实施例还包括用于编辑植物细胞的表达盒。示例实施例包括用表达盒转化植物细胞,该表达盒包含(i)编码定点核酸酶的核酸;以及(ii)编码针对靶序列的至少一种指导RNA(gRNA)的核酸。在实施例中,该至少一种gRNA针对在该E1基因座和该E1LB基因座处的包含核定位信号(NLS)的靶序列。在实施例中,该至少一种gRNA针对在该E1基因座和该E1LB基因座处的包含核定位信号(NLS)的第二碱性结构域的靶序列。在实施例中,该编码该定点核酸酶的核酸可操作地连接至第一启动子,并且其中该编码该至少一种gRNA的核酸可操作地连接至第二启动子。在表达盒的另外的实施例中,增强子可操作地连接至第一启动子或第二启动子。在实施例中,该定点核酸酶选自由以下组成的组:兆核酸酶(MN)、锌指核酸酶(ZFN)、转录激活因子样效应物核酸酶(TALEN)、Cas9核酸酶、Cfp1核酸酶、dCas9‑Fokl、dCpf1‑Fokl、嵌合Cas9‑胞苷脱氨酶、嵌合Cas9‑腺嘌呤脱氨酶、嵌合FEN1‑Fokl、和Mega‑TAL、切口酶Cas9(nCas9)、嵌合dCas9非Fokl核酸酶和dCpfl非Fokl核酸酶。
[0252] 本发明的非限制性实施例还包括在E1和/或E1Lb基因座处编辑植物以产生新型等位基因和具有新型等位基因组合的植物的方法,相对于不包含新型等位基因组合的对照植物,这些新型等位基因组合赋予植物改变的开花时间特征。编辑方法的示例实施例包括向E1基因座和E1LB基因座中引入突变,该突变选自由以下组成的组:等位基因替代、一个或多个碱基插入、一个或多个碱基缺失。在另外的实施例中,该方法包括从转化的植物细胞再生转化的T0植物,该转化的T0植物具有多个T1种子,其中该多个T1种子在E1基因座和E1LB基因座中含有多个独特的编辑;从该T1种子长成多个T1植物;以及使这些T1植物自交一代或多代,以获得在该E1基因座和该E1LB基因座处纯合的后代植物。
[0253] 本发明的非限制性实施例还包括确定新型等位基因组合的方法。在示例实施例中,该方法包括对后代植物的E1基因座和E1LB基因座进行测序;对该T0植物的E1基因座和E1LB基因座进行测序;将该后代植物的E1基因座和E1LB基因座序列与该后代植物的对应序列进行比对,以确定引入该E1基因座和该E1LB基因座中的突变的类型。等位基因组合的示例实施例包括功能丧失的E1等位基因或部分功能的E1等位基因;以及功能丧失的E1LB等位基因或部分功能的E1LB等位基因。还有其他组合也是可能的。
[0254] 本发明的非限制性实施例进一步包括产生具有经修饰的开花时间的大豆植物的方法。示例实施例包括将编辑引入植物细胞的E1基因中以产生突变型E1等位基因,该突变型E1等位基因相对于野生型E1等位基因而言具有降低的E1蛋白功能;将另一编辑引入该植物细胞的E1LB基因中以产生突变型E1LB等位基因,该突变型E1LB等位基因相对于野生型E1LB等位基因而言具有降低的E1LB蛋白功能;从该经编辑的植物细胞再生经编辑的植物;以及使该经编辑的植物自交,以获得包含含有该突变型E1等位基因和该突变型E1LB等位基因的等位基因组合的经编辑的后代,其中相对于包含该野生型E1等位基因和/或该野生型E1LB等位基因的对照植物的开花时间而言,该经编辑的后代具有经修饰的开花时间。在实施例中,将编辑引入E1基因中包括将多个碱基对缺失引入E1基因中,其中突变型E1等位基因编码移码的E1蛋白或截短的E1蛋白;并且将编辑引入E1LB基因中包括将多个碱基对缺失引入E1LB基因中,其中突变型E1LB等位基因编码移码的E1LB蛋白或截短的E1LB蛋白。在特定实施例中,该截短的E1蛋白相对于野生型E1蛋白而言没有功能活性,该框内缺失突变型E1蛋白相对于该野生型E1蛋白而言具有部分功能活性,该截短的E1LB蛋白相对于野生型E1LB蛋白没有功能活性,并且其中该框内缺失突变型E1LB蛋白相对于野生型E1LB蛋白具有部分功能活性。在实施例中,将编辑引入E1基因中包括将编辑引入E1基因的核定位信号的碱性结构域中;并且将编辑引入E1LB基因中包括将编辑引入E1LB基因的核定位信号的碱性结构域中。在实施例中,将编辑引入E1基因和E1LB基因中包括用表达盒转化植物细胞,该表达盒包含:(i)编码定点核酸酶的核酸;(ii)编码针对靶序列的至少一种指导RNA(gRNA)的核酸;以及(iii)可操作地连接至定点核酸酶的至少一种启动子。在实施例中,表达盒进一步包含可操作地连接至至少一种gRNA的另一种启动子和任选地可操作地连接至该至少一种启动子的增强子元件。在另外的实施例中,该至少一种gRNA针对在E1基因座和E1LB基因座处的包含核定位信号(NLS)的靶序列。
[0255] 产生具有经修饰的开花时间的大豆植物的方法的其他示例实施例包括将编辑引入大豆植物细胞的E1基因和E1LB基因中的一个或多个中,以产生相对于对应的野生型等位基因而言功能降低的突变型E1等位基因和/或突变型E1LB等位基因(例如,仅产生突变型E1等位基因同时留下作为野生型的E1LB等位基因,仅产生突变型E1LB等位基因同时留下作为野生型的E1等位基因,或产生突变型E1和E1LB等位基因中的每一个);从该经编辑的植物细胞再生经编辑的植物;以及使该经编辑的植物自交,以获得包含非天然存在的等位基因组合的经编辑的后代植物,该非天然存在的等位基因组合包含该突变型E1等位基因和该突变型E1LB等位基因中的一个或多个,其中相对于包含该野生型E1等位基因和该野生型E1LB等位基因的对照植物的开花时间和/或成熟时间而言,该经编辑的后代植物具有经修饰的开花时间和/或成熟时间。在特定实施例中,将编辑引入E1基因中包括将多个碱基对缺失引入E1基因中,其中该突变型E1等位基因对应于SEQID NO:5、7、9、11和13中的任一个,并且编码对应于SEQ ID NO:6、8、10、12和14中的任一个的框内缺失突变型E1蛋白或截短的E1蛋白。在其他实施例中,将编辑引入E1LB基因中包括将多个碱基对缺失引入E1LB基因中,其中该突变型E1LB等位基因对应于SEQID NO:15、17、19、21和23中的任一个,并且编码对应于SEQ ID NO:16、18、20、22和24中的任一个的框内缺失突变型E1LB蛋白或截短的E1LB蛋白。在这些实施例中,该截短的E1蛋白相对于野生型E1蛋白而言没有功能活性,该框内缺失突变型E1蛋白相对于该野生型E1蛋白而言具有部分功能活性,该截短的E1LB蛋白相对于野生型E1LB蛋白没有功能活性,并且该框内缺失突变型E1LB蛋白相对于该野生型E1LB蛋白具有部分功能活性。在实施例中,将E1基因中的编辑引入E1基因的核定位信号(NLS)的第二碱性结构域中;并且将E1LB基因的编辑引入E1LB基因的核定位信号(NLS)的第二碱性结构域中。在实施例中,将编辑引入E1基因和/或E1LB基因中包括用表达盒转化植物细胞,所述表达盒包含(i)可操作地连接至启动子的编码定点核酸酶的核酸,该启动子任选地进一步连接至增强子,该增强子被配置为通过该启动子增强该定点核酸酶的转录;以及(ii)编码至少一种指导RNA(gRNA)的核酸,该至少一种指导RNA针对该E1基因和/或该E1LB基因的NLS的第二碱性结构域中的靶序列。
[0256] 在特定实施例中,经编辑的后代植物的开花时间短于对照植物的开花时间。在另外的实施例中,经编辑的后代植物的相对成熟期组值不同于对照植物的相对成熟期组值。
[0257] 本发明的非限制性实施例进一步包括通过以上所披露的方法产生的经编辑的后代植物以及经编辑的后代植物的另外的后代植物,如通过育种或自交获得的那些。在实施例中,经编辑的后代植物的开花时间与对照植物的开花时间相比是经修饰的(例如,更短或更长)。在实施例中,该经编辑的后代植物的相对成熟期组值不同于该对照植物的相对成熟期组值。
[0258] 本发明的非限制性实施例进一步包含非天然存在的大豆植物,这些非天然存在的大豆植物具有经修饰的开花时间并且包含新型等位基因组合。在实施例中,新型等位基因组合选自包含以下的组:导致E1LB蛋白的部分表达的突变型E1LB等位基因和野生型E1等位基因;导致E1LB蛋白表达丧失的突变型E1LB等位基因和野生型E1等位基因;导致E1LB蛋白的部分表达的突变型E1LB等位基因和导致E1蛋白的部分表达的突变型E1等位基因;导致E1LB蛋白表达丧失的突变型E1LB等位基因和导致E1蛋白的部分表达的突变型E1等位基因;导致E1LB蛋白的部分表达的突变型E1LB等位基因和导致E1蛋白表达丧失的突变型E1等位基因;以及导致E1LB蛋白表达丧失的突变型E1LB等位基因和导致E1蛋白表达丧失的突变型E1等位基因,野生型E1LB等位基因和导致E1蛋白表达丧失的突变型E1等位基因,以及野生型E1LB等位基因和导致E1蛋白的部分表达的突变型E1LB等位基因,其中相对于包含野生型E1等位基因和野生型E1LB等位基因的对照植物而言非天然存在的大豆植物的开花时间是经修饰的。在实施例中,通过使用DNA修饰酶编辑植物的E1LB基因来引入导致部分表达的突变型E1LB等位基因或导致表达丧失的突变型E1LB等位基因。在实施例中,通过使用DNA修饰酶编辑植物的E1基因来引入导致部分表达的突变型E1等位基因或导致表达丧失的突变型E1等位基因。
[0259] 本发明的非限制性实施例包括经修饰的大豆植物或其植物部分。在实施例中,经修饰的大豆植物或其植物部分在E1基因座和/或E1Lb基因座处包含非天然存在的突变型等位基因,其中该非天然存在的突变型等位基因是经由使用定点核酸酶的基因组修饰引入的。在特定实施例中,所述非天然存在的突变型等位基因是纯合突变型等位基因。在示例实施例中,经修饰的大豆植物或其植物部分在E1基因座和E1Lb基因座中的每一个处都包含非天然存在的突变型等位基因,其中所述E1基因座和所述E1Lb基因座两者都包含纯合突变型等位基因。在实施例中,相对于未经修饰的野生型E1或E1LB基因等位基因而言,突变型等位基因展现出表达或酶活性的降低。在特定实施例中,在E1基因座或E1LB基因座处的突变型等位基因包含在由基因编码的蛋白质的核定位信号(NLS)的第二碱性结构域中的突变。在实施例中,在E1基因座和/或E1LB基因座处的突变型等位基因包含选自由以下组成的组的一种或多种突变类型:无义突变、框内缺失突变、错义突变、移码突变、剪接位点突变及其任何组合。
[0260] 在经修饰的大豆植物或其植物部分的非限制性实施例中,在E1基因座处的突变型等位基因导致以下中的一种:E1蛋白截短、非功能性E1蛋白、功能降低的E1蛋白、所述E1基因中的提前终止密码子以及所述E1基因中的框内缺失;并且其中在所述E1LB基因座处的所述突变型等位基因导致以下中的一种:E1LB蛋白截短、非功能性E1LB蛋白、功能降低的E1LB蛋白、所述E1LB基因中的提前终止密码子以及所述E1LB基因中的框内缺失。在经修饰的大豆植物或其植物部分的特定实施例中,与包含未经修饰的野生型E1和/或野生型E1LB基因等位基因的对照植物相比,经修饰的植物具有更少的开花时间,如相对于对照植物而言,经修饰的植物的VE阶段与R1阶段之间的天数更少。在另外的或可替代的实施例中,与包含未经修饰的野生型E1和/或野生型E1LB基因等位基因的对照植物相比,经修饰的植物具有更少的成熟时间,如相对于对照植物而言,经修饰的植物的R1阶段与R7或R8阶段之间的天数更少。
[0261] 在经修饰的大豆植物或其植物部分的特定实施例中,纯合突变型等位基因包含在E1基因座处的选自由以下组成的组的纯合突变:从E1基因的位置147至154的8bp缺失;从E1基因的位置144至156的13bp缺失;从E1基因的位置131至155的25bp缺失;从E1基因的位置146至154的9bp缺失;以及从E1基因的位置145至159的15bp取代,其中所述位置参照SEQ ID NO:1的E1基因。在实施例中,在E1基因座处的纯合突变对应于SEQ ID NO:5、7、9、11和13中的任一个;或编码对应于SEQ ID NO:6、8、10、12和14中任一个的突变型E1蛋白。
[0262] 在经修饰的大豆植物或其植物部分的其他实施例中,纯合突变型等位基因包含在E1LB基因座处的选自由以下组成的组的纯合突变:从E1LB基因的位置149至155的7bp缺失;从E1LB基因的位置149至151的3bp缺失;从E1LB基因的位置13至151的139bp缺失;从E1LB基因的位置149至154的6bp缺失;以及从E1LB基因的位置148至156的9bp缺失,其中所述位置参照SEQ ID NO:3的E1LB基因。在实施例中,在E1LB基因座处的纯合突变对应于SEQ ID NO:
15、17、19、21和23中的任一个;或编码对应于SEQ ID NO:16、18、20、22和24中任一个的突变型E1LB蛋白。
[0263] 在其他实施例中,具有经修饰的开花时间的非天然存在的大豆植物包含选自包括以下的组的等位基因组合:(a)导致E1LB蛋白的部分表达的突变型E1LB等位基因和野生型E1等位基因;(b)导致E1LB蛋白表达丧失的突变型E1LB等位基因和野生型E1等位基因;(c)导致E1LB蛋白的部分表达的突变型E1LB等位基因和导致E1蛋白的部分表达的突变型E1等位基因;(d)导致E1LB蛋白表达丧失的突变型E1LB等位基因和导致E1蛋白的部分表达的突变型E1等位基因;(e)导致E1LB蛋白的部分表达的突变型E1LB等位基因和导致E1蛋白表达丧失的突变型E1等位基因;(f)导致E1LB蛋白表达丧失的突变型E1LB等位基因和导致E1蛋白表达丧失的突变型E1等位基因;(g)导致E1蛋白的部分表达的突变型E1等位基因和野生型E1LB等位基因;以及(h)导致E1蛋白表达丧失的突变型E1等位基因和野生型E1LB等位基因;其中相对于包含野生型E1等位基因和野生型E1LB等位基因的对照植物而言,非天然存在的大豆植物的开花时间是经修饰的。
[0264] 在特定实施例中,突变型E1LB等位基因对应于SEQ ID NO:15、17、19、21和23中的任一个;或编码对应于SEQ ID NO:16、18、20、22和24中任一个的突变型E1LB蛋白;并且突变型E1等位基因对应于SEQ ID NO:5、7、9、11和13中的任一个;或编码对应于SEQID NO:6、8、10、12和14中任一个的突变型E1蛋白。在实施例中,通过使用DNA修饰酶编辑植物的E1LB基因来引入导致部分表达的突变型E1LB等位基因或导致表达丧失的突变型E1LB等位基因。在其他实施例中,通过使用DNA修饰酶编辑植物的E1基因来引入导致部分表达的突变型E1等位基因或导致表达丧失的突变型E1等位基因。
[0265] 非限制性实施例进一步包括育种方法,该育种方法包括:
[0266] 将以上所披露的非天然存在的大豆植物与不包含非天然存在的大豆植物的等位基因组合的不同大豆植物杂交;以及选择具有经修饰的开花的后代植物。
[0267] 实例
[0268] 以下实例提供了示意性实施例。根据本披露以及本领域中一般水平的技能,普通技术人员应当理解以下实例仅仅旨在是示例性的并且可以采用不偏离本披露的主题的范围的许多改变、修改和变更。实例1:通过递送LbCas12a核酸内切酶和指导RNA表达盒修饰植物细胞基因组中的内源E1和E1LB基因序列
[0269] 在本发明的一个方面,提供了一种产生E1和E1LB基因的等位基因变异的方法,这些等位基因变异相对于基因的内源形式具有改变的表达水平和模式。在含有E1或E1LB基因的任何植物物种中,等位基因变异包括具有降低的E1或E1LB蛋白活性的E1和E1LB基因的等位基因变体(本文也称为部分功能变体)和具有消失的E1或E1LB蛋白活性的等位基因变体(本文也称为功能丧失变体)。该方法包括通过使用针对植物进行充分测试和描述的方法来使用由E1和E1LB基因编码的蛋白质的核定位信号(NLS)的第二碱性结构域的DNA序列。根据这些公认的方案,合成基于与E1和/或E1LB基因的靶区域(例如,NLS的第二碱性结构域)(其被靶向改变(例如,功能区的靶向缺失、终止密码子的插入、移码突变的插入或设计用于影响基因表达的基因和调节区中的任何其他改变))的同向序列同源性的指导RNA,或将该指导RNA优选地与编码LbCas12a蛋白的基因一起编码在用于在植物中表达的载体中(但在一些实施例中,也可以将LbCas12a编码在单独的载体中)。
[0270] LbCas12a表达载体和靶向供体的构建先前已经描述(H.Puchta等人,通过引用以其全文并入本文)。在二元载体25462(图2)中,拟南芥属密码子优化的并且催化失活的毛螺菌科细菌Cas12a(以下称为dLbCas12a,也称为dLbCpf1)是在具有eFMV增强子的拟南芥属EF‑1αA1启动子的控制下被驱动,该启动子用以驱动Lb12Cas12a(prAtEF1aA1)(其后为NOS终止子)的组成型表达。核定位信号也被并入LbCas12a的C末端以改进其对核的靶向。
[0271] 如图2A中所示,通过GenScript(www.genscript.com)合成包含大豆泛素启动子(prGmUbi)(其在3’端可操作地连接至gRNA和gRNA支架的编码序列)的gRNA表达盒,并且将该gRNA表达盒克隆到二元载体25462中,该二元载体包括由大豆EF启动子驱动的aadA基因作为选择标记物。
[0272] 指导RNA的设计是本领域技术人员熟知的。靶标是GmE1(SEQID NO:1)。典型地,指导RNA设计对于每个基因序列和待进行的所希望的改变而言是特异性的。例如,如果仅需要靶向E1或E1Lb序列,其被预测具有所希望的效果,如降低基因功能。然而,在这种情况下,鉴于GmE1Lb靶标的序列同源性为约93%,因此针对该靶标使用相同的gRNA。如果基因家族的所有成员都被靶向,例如如果它们具有冗余功能,如在E1和E1Lb的情况下,那么可以靶向这些基因所特有的保守序列来进行所希望的改变。在这种情况下,靶标是E1和E1Lb的NLS的保守的第二碱性结构域。
[0273] 二元载体25462的详细信息如下:
[0274] bNLB插入序列12,219 12,348 130反向根癌农杆菌胭脂碱ti质粒的T‑DNA的左边缘区
[0275] bNRB插入序列4 143 140反向根癌农杆菌胭脂碱ti质粒的T‑DNA的右边界区
[0276] cLbCas12a CDS1,871 5,743 3,873正向该LbCas12a是拟南芥属密码子优化的形式。
[0277] cRepA CDS14,471 15,544 1,074正向cRepA‑01,其中在nt735处A变为G
[0278] cSpec CDS12,628 13,416 789正向也称为aadA;编码酶氨基糖苷3’腺苷酰转移酶的基因,赋予了对壮观霉素和链霉素的抗性以用于将载体保持在大肠杆菌和农杆菌中。
[0279] cVirG CDS13,716 14,441 726正向来自pAD1289的virG(推定的)(具有TTG起始密码子)。描述于Hansen等人1994,PNAS 91:7603‑7607中
[0280] eFMV增强子157 698 542正向玄参花叶病毒(FMV)增强子GmE1靶标尚未归类的特征8,072 8,094 23正向
[0281] iAtEF1aA1u内含子1,252 1,864 613正向AtEF1aA1的UTR内含子。
[0282] iGmEF内含子9,570 10,476 907正向大豆延伸因子(EF)基因的第一内含子
[0283] iGmUbi1内含子7,470 8,001 532正向GmaSOYUBI基因的5'UTR内含子。
[0284] oCOLE复制起点16,669 17,475 807反向从pUC19得到的在大肠杆菌中起作用的ColE1复制起点
[0285] oVS1复制起点15,587 15,991 405正向根癌农杆菌宿主中的复制起点
[0286] 在大多数Cpf1 CrRNA(LbCpf1、AsCpF1和FnCpf1)中前6bp的互补链序列,以允许恰好在随后的CrRNA之前的正确位置处进行锤头自切割
[0287] prAtEF1aA1启动子705 1,864 1,160正向来自拟南芥延伸因子EF‑1αA1基因的启动子
[0288] prGmEF启动子8,424 10,487 2,064正向
[0289] 翻译延伸因子EF‑1α/Tu启动子,包括第一内含子和相邻的UTR,来自大豆(威廉姆斯82)
[0290] prGmUbi1启动子6,004 8,001 1,998正向泛素1启动子候选物,来源于大豆威廉姆斯82
[0291] prVirG启动子13,511 13,641 131正向virG启动子(Winans J.Bact.[细菌学杂志]172:2433‑38(1990)),其由两个启动子元件构成,一个响应于乙酰丁香酮和磷酸盐饥饿(bp 45至83),另一个响应于中度酸化(86至128)
[0292] rHDV尚未归类的RNA 8,095 8,162 68正向编码来自丁型肝炎病毒(HDV)的可自切割的核酶的序列。
[0293] rHH尚未归类的RNA 8,014 8,050 37正向锤头型RNA;来自某些病毒(包括烟草环斑病毒)的卫星RNA的保守序列基序,负责自切割。需要在5'端添加配对序列以确保适当切割。
[0294] rHHLbCrRNA尚未归类的RNA 8,008 8,050 43正向锤头型RNA;来自某些病毒(包括烟草环斑病毒)的卫星RNA的保守序列基序,负责自切割。在5'端添加来自Cas12a CrRNA的配对序列以确保适当切割
[0295] rLbCrRNA‑01尚未归类的RNA 8,051 8,071 21正向
[0296] LbCpf1的支架crRNA(当前称为Cas12a),也称为指导RNA的同向重复序列(DR)。
[0297] rLbgRNACas12aGmE1‑01尚未归类的RNA 8,051 8,094 44正向
[0298] Cas12a(先前称为Cpf1)指导RNA,包括靶向GmE1的ggacatcaaggagaagattctgc的LbCrRNA的同向重复序列
[0299] 起点尚未归类的特征9,507 9,507 1无转录起始位点
[0300] 起点尚未归类的特征9,507 9,507 1无转录起始位点