本发明涉及一种抑制基因表达、具体是抑制植物中基因表达的方法。 本发明也涉及一种用于该方法的核苷酸序列。此外,本发明涉及一种可用 于表达该核苷酸序列的启动子。 在植物、尤其是高等植物中,淀粉是主要的贮存糖类之一。淀粉的结 构包括直链淀粉和支链淀粉。直链淀粉基本上是由α-1-4-连接的糖残基的 直链组成的。支链淀粉包括具有一些α-1-6分支的α-1-4-连接的糖残基的 链。支链淀粉分支的性质是通过其中一种通常称作淀粉分支酶(“SBE”) 的酶的作用来实现的。通过在α-1,6-糖苷分支键中加入α-1,4葡聚糖,SBE 催化支链淀粉分子中分支点的形成。在图1中示意性地显示出直链淀粉和 支链淀粉的生物合成,而在图2中显示出α-1-4-键和α-1-6键。 已知淀粉是一种重要的原材料。淀粉广泛用于食品、造纸以及化学工 业。但是为了得到具有某种所需功能特性的淀粉,用于这些工业应用中的 大部分淀粉均是通过化学、物理或者酶的方法采后修饰的。 在过去的几年里,制成能够生产出与采后修饰(modified)淀粉相同 的修饰淀粉的基因修饰植物正是人们所需要的。也已知通过表达反义核苷 酸的编码序列可能可以制备出上述经基因修饰的植物。在这一方面, June Bourque提供了一个在植物中进行基因操作的反义方案的详细摘要 (Bourque 1995植物科学105 pp 125-149)。目前可以参阅图3,该图 是所提出的一种反义-RNA抑制机制的示意图。 具体说来,WO 92/11375报道了一种通过基因修饰马铃薯从而形成 直链淀粉-类型的淀粉的方法。该方法涉及使用在不同程度上能够明显地 抑制编码马铃薯中形成分支酶的基因表达的反义构建体。WO 92/11375 的反义构建体由对块茎具有特异性的启动子、转录起始序列以及位于反义 方向上的分支酶的第一个外显子组成。但是,WO 92/11375没有提供任 何反义序列的数据。此外,WO 92/11375仅公开了马铃薯GBSS启动子 的使用。 WO 92/14827报道了一种在插入植物的基因组后可以在再生的植物中 显著地引起糖类浓度和糖类组成(诸如直链淀粉和支链淀粉的浓度及组 成)变化的质粒。该质粒含有以反义取向的分支酶的部分编码序列。 EP-A-0647715报道了使用编码DNA的反义内源性mRNA来改变观 赏性植物的特征以及代谢途径。 EP-A-0467349报道了控制基因表达的启动子上游序列的反义序列的 表达。 EP-A-0458367以及US-A-5107065报道了在植物中调节基因表达的核 苷酸序列的表达。该核苷酸序列互补于一个基因的mRNA序列并且可能 覆盖该基因的全部或者部分的非编码区。换言之,EP-A-0458367和US- A-5107065的核苷酸序列必须至少包括一个互补于编码区的序列。EP- A-0458367以及US-A-5107065含有最少的序列信息。 Kuipers等人在《分子基因遗传学》[1995]246 745-755中报道了一系 列马铃薯颗粒结合淀粉合酶的基因组的内含子部分序列的反义核苷酸的 表达。此处是把反义内含子序列连接到反义外显子的部分序列上—其中上 述内含子序列和外显子序列本来就彼此相关。此外,所表达的反义内含子 序列最长为231bp。 同样,Kull等人在《遗传与繁殖杂志》[1995]49 69-76中也报道了一 系列马铃薯颗粒结合淀粉合成酶的基因组的内含子部分序列的反义核苷 酸的表达。而且此处也是把反义内含子序列连接到反义外显子的部分序列 上—其中上述内含子序列和外显子序列本来就彼此相关。此外,所表达的 反义内含子序列最长也为231bp。 Shimada等人在《应用遗传学原理》[1993]86 665-672中报道了一系 列大米颗粒结合淀粉合成酶的基因组的内含子部分序列的反义核苷酸的 表达。此处是把反义内含子序列连接到反义外显子的部分序列上—其中上 述内含子序列和外显子序列本来就彼此相关。此外,所表达的反义内含子 序列的长度小于350bp。 在Finnegan和McElroy[1994]《生物技术》12 883-888以及Matzke 和Matzke[1995]TIG 11 1-3的教导中可以找到有关酶的活性是如何受到 具体核苷酸序列的表达影响的综述。 虽然已知酶的活性受到具体的核苷酸序列的表达影响,仍需要一种可 以更可靠和/或更有效和/或更具体地影响酶活性的方法。 根据本发明的第一方面,本发明提供了一种在植物(或其细胞,组织 或者器官)中影响酶的活性的方法,该方法包括在植物(或其细胞,组织 或者器官)中表达核苷酸序列,其中所说的核苷酸序列部分或者完整地以 反义取向编码(是)内含子;并且其中所说的核苷酸序列不含有通常与该 内含子有关的外显子序列的反义序列。 根据本发明的第二方面,本发明提供了一种在生产淀粉的生物体(或 其细胞,组织或者器官)中影响酶活性的方法,该方法包括在生产淀粉的 生物体(或其细胞,组织或者器官)中表达核苷酸序列,其中该核苷酸序 列部分或者完整地以反义取向编码(是)内含子;并且其中淀粉分支酶的 活性受到影响和/或支链淀粉的含量受到影响和/或改变了淀粉的组成。 根据本发明的第三方面,本发明提供了一种包括如SEQ.I.D.No.15至 SEQ.I.D.No.27之任一所示的核苷酸序列的反义序列或其变体、衍生物或 者同系物。 根据本发明的第四方面,本发明提供了一种包括如SEQ.I.D.No.14所 示序列的启动子或其变体、衍生物或者同系物。 根据本发明的第五方面,本发明提供了一种能够包括或者表达本发明 的构建体。 根据本发明的第六方面,本发明提供了一种包括或者表达本发明的载 体。 根据本发明的第七方面,本发明提供了一种包括或者表达本发明的细 胞、组织或者器官。 根据本发明的第八方面,本发明提供了一种包括或者表达本发明的转 基因的生产淀粉的生物体。 根据本发明的第九方面,本发明提供了一种从本发明得到的淀粉。 根据本发明的第十方面,本发明提供了pBEA8(NCIMB 40753)或 者pBEA9(NCIMB 40815)。 根据本发明的第十一方面,本发明提供了一种可以从λ-SBE 3.2 (NCIMB 40751)或λ-SBE 3.4(NCIMB 40752)得到的任意一个或者 多个内含子序列的反义核苷酸序列或其变体、衍生物或者同系物。 本发明主要的优点在于它提供了一种用于制备修饰淀粉的方法,而该 方法不需要进行淀粉的采后修饰。因此本发明的方法避免了对通常用于淀 粉采后修饰的危险化学物质使用的需要。 此外,本发明还提供了经基因修饰的植物,该植物可以生产出其特性 将满足不同的工业需要的修饰的和/或新的和/或改进的淀粉。 因此,本发明提供了一种在植物中制备特制(tailor-made)淀粉的 方法,其中该淀粉可以代替采后修饰的淀粉。 本发明也提供了一种可以通过与已知的采后修饰方法相比对环境的 影响更为有益的方法来制备修饰淀粉的方法,其中的采后修饰方法要求使 用危险的化学物质以及大量的能量。 本发明另一个主要的优点在于与已知的影响酶活性的方法相比,它提 供了一种可能更可靠和/或更有效和/或更特异地影响酶活性的方法。关于 本发明的这一优点,应当指出在SBEs的编码区之间存在一定程度的同源 性。但与SBEs的内含子序列存在极少的或者不存在同源性。 因此,反义内含子的表达提供了选择性地影响具体的SBE表达的机 制。这一有利方面例如可以用来减少或者除去一种具体的SBE酶以及用 另一种酶来代替该酶,其中的另一种酶可以是另一种分支酶或者甚至为受 到影响的酶的重组形式或者甚至为一种比如可以包括来自一个来源的 SBE酶的一部分以及至少来自另一来源的另一SBE酶的至少一部分的杂 种酶。以下更详细地讨论本发明结合的几个方面将包括本发明的这一具体 特征。 因此本发明提供了一种选择性地影响SBE活性的机制,这与现有技术 中取决于使用例如反义外显子表达的方法形成对比,通过现有技术的方法 是不可能引入新的SBE的活性而又不影响原有活性的。 优选关于本发明的第一方面,淀粉分支酶的活性受到影响和/或其中支 链淀粉的含量受到影响和/或改变了淀粉的组成。 优选关于本发明的第二方面,所说的核苷酸序列不含有通常与所说的 内含子有关的外显子序列的反义序列。 优选关于本发明的第四方面,所说的启动子与一个感兴趣的基因 (“GOI”)结合。 优选地,降低或者去除了所说的酶的活性。 优选地,所说的核苷酸序列至少基本上编码以反义取向的至少一个内 含子的全部。 优选地,所说的核苷酸序列部分或者完整地编码2个或者多个内含子 并且其中的每个内含子均以反义取向。 优选地,所说的核苷酸序列包括至少350个核苷酸(例如至少 350bp),更优选包括至少500个核苷酸(例如至少500bp)。 优选地,所说的核苷酸序列包括如SEQ.I.D.No.15至SEQ.I.D.No.27 之任一所示的序列或其变体、衍生物或者同系物,其中也包括上述物质的 结合。 优选地,所说的核苷酸序列是通过具有如SEQ.I.D.No.14所示序列的 启动子或其变体、衍生物或者同系物表达的。 优选地,转基因的生产淀粉的生物体为植物。 因此,本发明一个优选的方面涉及一种在植物(或其细胞,组织或者 器官)中影响酶的活性的方法,该方法包括在植物(或其细胞,组织或者 器官)中表达核苷酸序列,其中所说的核苷酸序列部分或者完整地以反义 取向编码内含子;其中所说的核苷酸序列不合有通常与该内含子有关的外 显子序列的反义序列;并且其中淀粉分支酶的活性受到影响和/或其中支 链淀粉的含量受到影响和/或改变了淀粉的组成。 因此,本发明一个更优选的方面涉及一种在植物(或其细胞,组织或 者器官)中影响酶的活性的方法,该方法包括在植物(或其细胞,组织或 者器官)中表达核苷酸序列,其中所说的核苷酸序列部分或者完整地编码 以反义取向的内含子;其中所说的核苷酸序列不含有通常与该内含子有关 的外显子序列的反义序列;其中淀粉分支酶的活性受到影响和/或其中支 链淀粉的含量受到影响和/或改变了淀粉的组成;并且其中所说的核苷酸 序列包括如SEQ.I.D.No.15至SEQ.I.D.No.27之任一所示的序列或其变 体、衍生物或者同系物,其中也包括上述物质的结合。 与本发明有关的术语“核苷酸”包括DNA和RNA。优选地,该术语 是指DNA,更优选地是指通过使用重组DNA技术制备的DNA。 在常规意义上,使用术语“内含子”来表示核苷酸的一个区段,它通 常为DNA,并且它不编码部分或者全部所表达的蛋白质或酶。 在常规意义上,使用术语“外显子”来表示核苷酸的一个区段,它通 常为DNA,并且它编码部分或者全部所表达的蛋白质或酶。 因此,术语“内含子”是指被转录成RNA分子但在把该RNA翻译成 蛋白质之前从RNA中剪接调的基因区。相反地,术语“外显子”是指被 转录成RNA,随后又翻译成蛋白质的基因区。 与本发明的核苷酸序列有关的术语“变体”或“同系物”或“片段” 包括各个核苷酸序列的一个(或多个)核酸的任意的取代、变化、修饰、 置换、缺失或者添加,只要所得到的核苷酸序列可以影响植物或其细胞或 者组织中的酶的活性即可,优选其中所得到的核苷酸序列至少与如 SEQ.I.D.No.s 15-27所示的反义序列的任意一个序列具有相同的效果。更 具体地讲,术语“同系物”包括与结构相似性和/或功能相似性有关的同 源性,只要所得到的核苷酸序列具有影响本发明的酶活性的能力即可。就 序列同源性(即相似性)而言,优选存在大于80%的同源性,更优选至 少有85%的同源性,更优选至少有90%的同源性,甚至于更优选至少有 95%的同源性,更优选至少有98%的同源性。以上的术语与序列的等位 变异也是同义的。 类似地,与本发明的启动子有关的术语“变体”或“同系物”或“片 段”包括各个启动子序列的一个(或多个)核酸的任意的取代、变化、修 饰、置换、缺失或者添加,只要所得到的启动子序列允许GOI的表达即 可,优选其中所得到的启动子序列至少与SEQ.I.D.No.14具有相同的效 果。更具体地讲,术语“同系物”包括与结构相似性和/或功能相似性有 关的同源性,只要所得到的启动子序列具有允许诸如本发明的一个核苷酸 序列GOI表达的能力即可。就序列同源性(即相似性)而言,优选存在 大于80%的同源性,更优选至少有85%的同源性,更优选至少有90% 的同源性,甚至于更优选至少有95%的同源性,更优选至少有98%的同 源性。以上的术语与序列的等位变异也是同义的。 术语“反义”是指互补于本发明的任意一个或者全部的内含子序列并 从而能够与之杂交的核苷酸序列,该序列包括其部分序列。 对本发明而言,反义内含子可以互补于待抑制基因的一个完整的内含 子。但在某些情况下,只要部分反义序列影响酶的活性则可以使用该部分 序列(即并非或者不包括完整的互补序列的序列)。部分序列的合适的例 子包括短于如SEQ.I.D.No.s 15至27所示的任意一个完整的反义序列的 序列,但该序列包括至少是靠近各个外显子(或多个外显子)的有义内含 子序列的反义核苷酸。 对于本发明的第二方面而言(即特异性地影响SBE活性),本发明的 核苷酸序列可以包括SBE基因的一个或者多个有义或反义外显子序列, 其中也包括其完整的或者部分的序列,而只要该核苷酸序列可以影响SBE 活性即可,优选其中所说的核苷酸序列降低或者去除了SBE活性。优选 地,本发明第二方面的核苷酸序列不包括反义外显子序列。 术语“载体”包括表达载体和转化载体。术语“表达载体”是指能够 在体内或体外进行表达的构建体。术语“转化载体”是指能够从一个物种 转移至另一物种的构建体-诸如从大肠杆菌质粒转移至真菌或者植物细 胞中,或者从农杆菌转移至植物细胞中。 与本发明的反义核苷酸序列方面有关的术语“构建体”包括直接或间 接地附着到一个启动子上的本发明的核苷酸序列,该术语与诸如“偶联 物”、“序列盒”和“杂种分子”之类的术语是同义的。间接附着的实例 为提供了一种诸如内含子序列(诸如Sh1-内含子或ADH内含子)的合适 的间隔序列来间隔本发明的启动子及核苷酸序列。对于与本发明有关的包 括直接或间接附着的术语“融合的”而言,情况同样属实。该术语不包括 在天然环境下与野生型SBE基因启动子有关的野生型SBE基因的天然组 合。 所说的构建体甚至可以包括或表达一种可用于选择转移了遗传构建 体的植物细胞的标记物,其中的标记物已被转化至该植物细胞中。存在多 种可用于例如植物的标记物-诸如甘露糖。其它标记物的实例包括那些提 供了抗生素抗性的标记物-例如对G418、潮霉素、博来霉素、卡那霉素 及庆大霉素的抗性。 本发明的构建体优选包括一个启动子。术语“启动子”按照本领域的 通常意义来使用,例如在基因表达的Jacob-Monod理论中RNA聚合酶的 结合位点。合适的启动子的例子为那些可以指导本发明的核苷酸序列有效 表达和/或在特异细胞类型中指导有效表达的启动子。在WO 92/11375中 公开了对组织具有特异性的启动子的一些实例。 该启动子还可以包括如Pribnow盒或TATA盒之类的保守区。该启动 子甚至可以包含影响(诸如维持、提高、降低)本发明的核苷酸序列表达 水平的其它序列。上述序列的合适的例子包括Sh1-内含子或ADH内含 子。其它序列包括可诱导元件-诸如温度,化学药剂,光或者应激可诱导 元件。而且可以存在适于提高转录或翻译的元件。一个在后元件的实例为 TMV 5’前导序列。(参见Sleat Gene 217 [1987]217-225;以及Dawson 植物分子生物学23[1993]97)。 正如所述,本发明的构建体和/或载体可以包括能够提供受调控的或者 组成型表达的转录起始区。任意合适的用于转录起始区的启动子为 patatin启动子或E35S启动子。另一方面,优选启动子为SBE启动子。 例如,如果生物体为植物的话,那么启动子可以是一种影响在种子、 块茎、茎、新芽、根及叶片组织的任意一种或多种中的核苷酸序列表达的 启动子,其中优选块茎。举例来说,用于本发明核苷酸序列的启动子可以 为如我们在1994年10月21日提交的共同未决的英国专利申请 No.9421292.5中所述的α-Amy 1启动子(此处称作Amy 1启动子,Amy 637启动子或α-Amy 637启动子)。另外,用于本发明核苷酸序列的启动 子可以为如我们在1994年10月21日提交的共同未决的英国专利申请 No.9421286.7中所述的α-Amy 3启动子(此外称作Amy 3启动子,Amy 351启动子或α-Amy 351启动子)。 本发明也包括使用启动子以表达本发明的核苷酸序列,其中使该启动 子的一部分失活但其中该启动子仍能起到一个启动子的作用。在某些情况 下,一个启动子的部分失活是有利的。尤其对以前提到的Amy 351启动 子而言,使该启动子的一部分失活从而该部分失活的启动子以更为特异的 方式,诸如仅以一种特异的组织类型或器官,来表达本发明的核苷酸序列 是可能的。术语“失活的”是指在改进了启动子的表达模式但其中部分失 活的启动子仍起到一个启动子作用的意义上而言的部分失活。但是如上所 述,经修饰的启动子能够在原始启动子的至少一种(但并非全部)特异的 组织中表达编码本发明的酶的基因。部分失活的实例包括改变启动子序列 的折叠模式或者改变与部分核苷酸序列的结合种类,以便于该核苷酸序列 的一部分不为例如RNA聚合酶所识别。另外并且优选地,使启动子部分 失活的方式是截短启动子以形成其片段。另一种方式为使该序列的至少一 部分突变,以便于RNA聚合酶无法结合到该部分或另一部分上。另一种 修饰为突变调节蛋白(例如从丝状真菌中已知的CreA蛋白)的结合位点 以产生碳的分解代谢物的阻遏并从而消除天然启动子的分解代谢物的阻 遏。 本发明的构建体和/或载体可以包括转录的终止区。 本发明的核苷酸可以与额外的构建体组合(但不必同时)加以表达。 因此本发明也提供了构建体的一种组合,该组合包括含有可操作地连接到 第一启动子上的本发明的核苷酸序列的第一构建体;以及含有可操作地连 接到第二启动子上(该启动子不必与第一启动子相同)的GOI的第二构 建体。就本发明的这一方面而言,构建体的这种组合可以存在于同一载 体、质粒、细胞、组织、器官或生物体中。本发明的这一方面也包括表达 上述物质的方法,其中优选在生物体的特异的细胞或组织中表达,诸如仅 在生物体的一种特异的细胞或组织中表达,而生物体一般为植物。就本发 明的这一方面而言,当通常与野生型基因的启动子有关的编码酶的基因与 该野生型基因的启动子均处于其天然状态时,所说的第二构建体不包括这 种天然组合。 合适的组合的实例为包括本发明的核苷酸序列和启动子,诸如本发明 的启动子,的第一构建体以及包括启动子,诸如本发明的启动子,和GOI 的第二构建体,其中GOI以有义或者反义取向来编码另一种淀粉分支 酶。 以上有关于针对本发明的反义核苷酸的术语“构建体”的注释同样可 用于针对本发明启动子的术语“构建体”。在这一方面,该术语包括直接 或间接附着到GOI上的本发明的启动子。 就本发明的启动子方面或本发明的组合方面而言的术语“GOI”是指 任何感兴趣的基因,如下所述,该基因不必编码蛋白质或酶。GOI可以 是讨论中的生物体,例如植物,外源或者天然的任意核苷酸序列。 GOI的典型实例包括编码改进了代谢及分解代谢途径的其它蛋白质 或者酶的基因。GOI可以编码用于引入或者提高病原体抗性的试剂。 GOI甚至可以为用于改进存在于相关组织中的天然转录物表达的反 义构建体。上述GOI的实例为本发明的核苷酸序列。 GOI甚至可以编码宿主生物体,例如植物,的非天然蛋白质。GOI 可以编码有利于动物或者人类的化合物。例如,GOI能编码具有药物活 性的蛋白质或酶,诸如治疗化合物胰岛素、干扰素、人血清白蛋白、人生 长因子以及凝血因子中的任意一种。GOI甚至可以编码给食品或饲料或 作物提供额外的营养价值的蛋白质。典型的实例包括可以抑制抗-营养因 子形成的植物蛋白以及具有更为人所需的氨基酸的组成,例如比非转基因 植物具有更高的赖氨酸含量,的植物蛋白。GOI甚至可以编码可用于食 品加工中的酶,诸如木聚糖酶和α-半乳糖苷酶,GOI可以为编码任意一 种害虫毒素的基因,可以为一种诸如针对α-淀粉酶、蛋白酶或葡聚糖酶的 反义转录物。此外,GOI可以为本发明的核苷酸序列。 GOI可以是编码阿拉伯呋喃糖苷酶的核苷酸序列,而这是我们共同未 决的英国专利申请9505479.7的主题。GOI可以是编码葡聚糖酶的核苷 酸序列,而这是我们共同未决的英国专利申请9505475.5的主题。GOI 可以是编码α-淀粉酶的核苷酸序列,而这是我们共同未决的英国专利申请 9413439.2的主题。GOI可以是编码α-淀粉酶的核苷酸序列,而这是我们 共同未决的英国专利申请9421290.9的主题。GOI可以是编码α- glucanlyase的任意一种核苷酸序列,而这在我们共同未决的PCT专利申 请PCT/EP94/03397中已有描述。 一方面,GOI甚至可以是可操作地连接到一个不同的启动子的本发 明的核苷酸序列。 GOI可以包括编码木聚糖酶、arabinase、乙酰酯酶、鼠李糖半乳糖 醛酸聚糖酶(rhamnogalacturonase)、葡聚糖酶、果胶酶、分支酶或另 一种糖类修饰酶或蛋白酶的一种或多种酶的序列。此外,GOI可以是任 意一种上述序列的反义序列。 如上所述,本发明提供了一种选择性地影响特有的酶活性的机制。 就本发明一个重要的应用而言,目前可能通过表达特有的基因组的蛋 白质或酶的反义内含子构建体以及(例如同时)表达该酶或蛋白质的重组 形式,换言之即GOI为编码该基因组的酶或蛋白质的重组核苷酸序列, 来减少或消除编码该基因组的蛋白质或酶的基因组核苷酸序列的表达。这 一应用使得可以在缺乏各自的基因组酶及蛋白质(或者该酶及蛋白质的含 量降低)的条件下表达所需的重组酶或蛋白质。因此,所需的重组酶及蛋 白质可以容易地从宿主生物体中分离和纯化。本发明这一特有的方面明显 优越于现有技术的方法,例如现有技术的方法取决于使用了反义外显子的 表达,而该方法也影响重组酶的表达。 因此,本发明另一方面涉及在一个宿主生物体中表达重组蛋白或酶的 方法,该方法包括表达编码该重组蛋白或酶的核苷酸序列;以及表达另一 个核苷酸序列,其中所说的另一个核苷酸序列部分或者完整地以反义取向 编码内含子;其中所说的内含子为通常与编码相应于重组蛋白或酶的蛋白 或酶的基因组基因有关的内含子;并且其中所说的另一个核苷酸序列不含 有通常与该内含子有关的外显子序列的反义序列。另一方面包括上述核苷 酸序列的组合,其中包括所说序列在构建体、载体、细胞、组织、及转基 因生物体中的插入。 因此,本发明也涉及核苷酸序列的组合,该组合包括编码重组酶的第 一核苷酸序列;以及对应于以反义取向的内含子的第二核苷酸序列;其中 所说的内含子为与编码对应于重组酶的酶的基因组基因有关的内含子;并 且其中所说的第二核苷酸序列不含有通常与该内含子有关的外显子序列 的反义序列。 GOI甚至可以编码一个或多个内含子,诸如在所附序列表中提供的任 意一个或多个内含子序列。例如,本发明也包括与如一个有义内含子组合 的一个反义内含子(例如SEQ.I.D.No.15)的表达,其中优选该有义内 含子不互补于所说的反义内含子序列(如SEQ.I.D.No.2)。 术语“细胞”、“组织”和“器官”包括其自身及存在于生物体内的 细胞、组织和器官。 与本发明有关的术语“生物体”包括可以含有本发明的核苷酸序列和 /或其中当本发明的核苷酸序列存在于该生物体中时可以表达所说序列的 任意的生物体。所说的生物体优选为生产淀粉的生物体,诸如任意一种植 物、藻类、真菌、酵母、细菌及其细胞系。所说的生物体优选为植物。 术语“生产淀粉的生物体”包括能够生物合成淀粉的任意的生物体。 优选地,该生产淀粉的生物体为植物。 如本文所使用的术语“植物”包括任何适宜的被子植物,裸子植物, 单子叶植物及双子叶植物。合适的植物的典型实例包括如马铃薯等的蔬 菜;如小麦、玉米及大麦等的谷物;水果;树木;花卉;以及其它的植物 作物。该术语优选是指“马铃薯”。 与本发明有关的术语“转基因生物体”包括含有本发明的核苷酸序列 和/或从中得到产物的任意的生物体,和/或在其中可以表达本发明的核苷 酸序列生物体。优选在该生物体的基因组中插入本发明的核苷酸序列。该 转基因生物体优选为植物,更优选为马铃薯。 为了制备宿主生物体,人们可以使用原核或真核生物体。适宜的原核 宿主的实例包括大肠杆菌和枯草芽孢杆菌。关于转化原核宿主的教导在现 有技术中已进行了详尽地报道,例如可参阅Sambrook等人(Sambrook 等人,《分子克隆:实验室手册》,第2版,1989,冷泉港实验室出版 社)。 尽管在EP-B-0470145与CA-A-2006454中没有公开本发明的酶和编 码该酶的核苷酸序列,但这两篇文献均就可用于制备本发明的转基因植物 的技术类型方面提供了一些有用的背景技术的解释。目前,在以下的解释 中包括了上述背景技术的一些教导。 在构建遗传修饰的植物中的基本原则为在植物基因组中插入遗传信 息以便于达到稳定地维持被插入的遗传材料。 存在多种用于插入遗传信息的技术,其中两个主要的原则为直接地引 入该遗传信息以及通过使用载体系统来引入遗传信息。在Potrykus(植 物生理植物分子生物学年度回顾[1991]42:205-225)与Christou(农 业-食品-工业高技术进步/1994年4月17-27)的文章中可以找到上述 常规技术的综述。 因此一方面,本发明涉及一种携带本发明的核苷酸序列或构建体并且 能够向生物体(诸如植物)的基因组中引入该核苷酸序列或构建体的载体 系统。 所说的载体系统可以包括一个载体,但该系统也可以包括两个载体。 在两个载体的情况中,该载体系统通常称作二元载体系统。Gynheung An 等人(1980)在《植物分子生物学手册A3》第1-19页的“二元载体” 中进一步详细地描述了二元载体系统。 一种用于以给定的启动子或核苷酸序列或构建体来转化植物细胞而 广泛使用的系统基于使用来自根瘤农杆菌的Ti质粒或来自毛根农杆菌的 Ri质粒(An等人(1986)植物生理81,301-305以及Butcher D.N.等人 (1980),适于植物病理学家的组织培养方法,版本:D.S.Ingrams与 J.P.Helgeson,203-208)。已经构建了适于构建上述植物或植物细胞构 建体的几种不同的Ti与Ri质粒。上述Ti质粒的一个非限制性的实例为 pGV3850。 应当优选把本发明的核苷酸序列或构建体在介于T-DNA的末端序列 之间或靠近T-DNA序列处插入Ti-质粒中,从而避免紧邻T-DNA边界序 列破裂,这是因为对于向植物的基因组中插入修饰的T-DNA而言,上述 区域中至少有一个区域似乎是必不可少的。 这正如从上面的解释中理解的那样,如果所说的生物体为植物的话, 本发明的载体系统优选为一个含有为感染植物所必需的序列(例如Vir 区)以及T-DNA序列的至少一个边界部分的系统,所说的边界部分与遗 传构建体位于同一载体上。 另外,所说的载体系统优选为根瘤农杆菌Ti-质粒或者毛根农杆菌Ri- 质粒或其衍生物。由于这些质粒是人们熟知的并且广泛用于构建转基因植 物,所以存在许多基于上述质粒或其衍生物的载体系统。 在转基因植物的构建中,可以先在微生物中构建本发明的核苷酸序列 或构建体,其中载体可以在该微生物中复制并且在插入植物之前该微生物 是易于操作的。一种有用的微生物的实例为大肠杆菌,但也可以使用具有 以上特性的其它微生物。当在大肠杆菌中已经构建了如上定义的载体系统 的载体时,如有需要的话把该载体转化到一种合适的农杆菌菌株中(例如 根瘤农杆菌)。因而,优选把包含本发明的核苷酸序列或构建体的Ti-质 粒转化至一种合适的农杆菌菌株中(例如根瘤农杆菌),以便于获得含有 本发明的启动子或核苷酸序列或构建体的农杆菌细胞,随后把该DNA转 化至待修饰的植物细胞中。 例如如果为了转化而使用了所说植物细胞的Ti-或Ri-质粒的话,那么 至少可以把Ti-与Ri-质粒T-DNA的右边界、但通常是其右边界和左边 界,作为引入基因的侧翼区,连接起来。在EP-A-120516中、Hoekema 在《二元植物载体系统》Offset-drukkerij Kanters B.B.,Alblasserdam, 1985,第五章中、Fraley等人在Crit.Rev.Plant Sci.,4:1-46中以及An等 人在EMBO J.(1985)4:277-284中已经深入地研究并描述了用于转化 植物细胞而使用的T-DNA。 由农杆菌直接侵染植物组织是一种现已广泛使用并在Butcher D.N.等 人(1980)《适于植物病理学家的组织培养方法》版本:D.S.Ingrams 与J.P.Helgeson,203-208中有所描述的简单的技术。就这一主题的进 一步的教导可参阅Potrykus(植物生理植物分子生物学年度回顾[1991] 42:205-225)和Christou(农业-食品-工业高技术进步/1994年4月 17-27)。就该技术而言,可以在植物的某一部分或组织之中或之上(即 在叶、根、茎的一部分上或在该植物的另一部分上)进行植物的侵染。 一般说来,由携带GOI(诸如本发明的核苷酸序列)以及选择性地携 带启动子的农杆菌直接侵染植物组织,例如通过以剃刀刀片切割植物或用 针刺植物或用研磨料摩擦植物来使待侵染的植物受伤。然后用所说的农杆 菌接种该伤口。随后在合适的培养基上培养接种的植物或植物的部分并使 其发育为成熟的植株。 当构建植物细胞时,可以根据熟知的组织培养方法来培养和维持上述 细胞,诸如通过在提供了如氨基酸、植物激素、维生素等必须的生长因子 的合适的培养基上培养细胞。 采用用于从细胞或组织培养物中再生植物的已知方法可以实现转化 细胞再生为遗传修饰的植物,例如通过采用抗生素来选择转化的幼苗并且 通过在含有合适的营养物、植物激素等的培养基上传代培养上述幼苗。 在EP-A-0449375中可以找到有关植物转化的进一步的教导。 正如在CA-A-2006454中所报道的,可以得到大量含有大肠杆菌中的 复制系统并且能够选择转化细胞的标记物的克隆载体。所说的载体例如包 括pBR 322,pUC系列,M13mp系列,pACYC184等。通过这种方式, 可以把本发明的核苷酸或构建体引入位于载体中的合适的限制性位点 上。然后使用这种被包含的质粒在大肠杆菌中进行转化。在合适的营养培 养基中培养上述大肠杆菌细胞,然后获得细胞并裂解。随后回收上述质 粒。作为分析方法,有常用的序列分析、限制酶切分析、电泳以及进一步 的生物化学-分子生物学方法。在每种操作之后,所使用的DNA序列可 以进行限制性消化并与接下来的DNA序列连接起来。每种序列均可以在 同样的或不同的质粒中克隆。 在植物中引入本发明的核苷酸序列或构建体后,进一步的DNA序列 的操作和/或插入可能是必须的-诸如为了建立如上提及的组合系统(例 如包含构建体的组合的生物体)。 以上用于以本发明的核苷酸序列转化原核生物和植物的解释同样可 用于以本发明的启动子转化上述生物体。 总而言之,本发明涉及通过表达反义内含子序列来影响酶的活性。 而且,本发明也涉及对上述反义内含子序列的表达有用的启动子。 下面的样品已按照布达佩斯条约于1995年7月13日保藏在位于英国 苏格兰Aberdeen AB2 1RY 23 St Machar Drive的国立工业及海洋细菌有 限保藏公司(NCIMB)这一公认的保藏机构中: NCIMB 40754(是指如本文所述的pBEA 11); NCIMB 40751(是指如本文所述的λ-SBE3.2),以及 NCIMB 40752(是指如本文所述的λ-SBE3.4)。 下面的样品已按照布达佩斯条约于1996年7月9日保藏在位于英国苏 格兰Aberdeen AB2 1RY 23 St Machar Drive的国立工业及海洋细菌有限 保藏公司(NCIMB)这一公认的保藏机构中: NCIMB 40815(是指如本文所述的pBEA 9); 因此,本发明的一个高度优选的实例涉及一种影响植物(或其细胞, 组织或者器官)中酶的活性的方法,该方法包括在植物(或其细胞,组织 或者器官)中表达核苷酸序列,其中所说的核苷酸序列部分或者完整地以 反义取向编码内含子;其中所说的核苷酸序列不含有通常与该内含子有关 的外显子序列的反义序列;其中淀粉分支酶的活性受到影响和/或支链淀 粉的含量受到影响和/或改变了淀粉的组成;并且其中所说的核苷酸序列 可以从NCIMB 40753或NCIMB 40815得到,或者该序列为任意一个或 多个可从λ-SBE3.2(NCIMB 40751)或λ-SBE3.4(NCIMB 40752)得 到的内含子序列的反义序列或其变体、衍生物或同系物。 因此,本发明的一个更为高度优选的方面涉及一种影响植物(或其细 胞,组织或者器官)中酶的活性的方法,该方法包括在植物(或其细胞, 组织或者器官)中表达核苷酸序列,其中所说的核苷酸序列部分或者完整 地以反义取向编码内含子;其中所说的核苷酸序列不合有通常与该内含子 有关的外显子序列的反义序列;其中淀粉分支酶的活性受到影响和/或支 链淀粉的含量受到影响和/或改变了淀粉的组成;其中所说的核苷酸序列 包括如SEQ.I.D.No.15至SEQ.I.D.No.27之任一所示的序列或其变体、 衍生物或者同系物,其中也包括上述物质的结合;并且其中所说的核苷酸 序列可以从NCIMB 40753或NCIMB 40815得到,或者该序列为任意一 个或多个可从λ-SBE3.2(NCIMB 40751)或λ-SBE3.4(NCIMB 40752)得到的内含子序列的反义序列或其变体、衍生物或同系物。 现在,仅通过实施例的方式来描述本发明,其中参考了以下所附的附 图: 图1为直链淀粉及支链淀粉生物合成的示意表示; 图2为支链淀粉α-1-4-键及α-1-6-键的图解表示; 图3为可能的反义RNA抑制机制的图解表示; 图4为基因组SBE克隆的外显子-内含子结构的图解表示; 图5为pPATA1的质粒图,其大小为3936bp; 图6为pABE6的质粒图,其大小为5106bp; 图7为pVictorIV Man的质粒图,其大小为7080bp; 图8为pBEA8的质粒图,其大小为9.54kb; 图9为pBEA9的质粒图,其大小为9.54kb; 图10为pBEP2的质粒图,其大小为10.32kb; 图11为pVictor5a的质粒图,其大小为9.12kb;以及 图12显示出包括启动子、外显子及内含子的完整的SBE基因组的核 苷酸序列。 图1和图2可以参阅以上关于淀粉的一般介绍性的描述。图3可以参 阅以上关于反义表达的介绍性的描述。 正如所提及的,图4为基因组SBE克隆的外显子-内含子结构的图解 表示,图12中所显示的为其序列。这一具有大约11.5k碱基对的克隆包 括14个外显子和13个内含子。从5’末端至3’末端以升序的方式来编号 上述内含子并且这些内含子分别对应于SEQ.I.D.No.s 1-13。它们各自的 反义内含子序列如SEQ.I.D.No.s 15-27所示。 图4和图12更加详细地提供了有关马铃薯SBE基因的11478个碱基 对的信息。自第1至第2082个核苷酸的5’区含有SBE基因的启动子区。 位于第2048至2051个核苷酸的TATA盒的候选物用方框表示。在马铃 薯SBE cDNA克隆(Poulsen与Kreiberg(1993) 植物生理 102:1053-1054)与外显子DNAs之间的同源性起始于第2083bp并终止 于第9666bp。在cDNA与外显子DNA之间的同源性是通过以大写字母 表示的核苷酸来表示的,而翻译成的氨基酸序列则以单字母密码显示在该 外显子DNA的下面。内含子序列是以小写字母表示的。 下面讨论图5至图7。正如所提到的,图8为pBEA8的质粒图,其 大小为9.54k碱基对;并且图9为pBEA9的质粒图,其大小为9.54k碱 基对。pBEA8及pBEA9的每一个序列均包括马铃薯SBE基因的第一内 含子序列的反义序列。这种具有1177个碱基对的第一内含子序列示于图 4并且位于第一外显子与第二外显子之间。 现在将更加详细地讨论本发明的一些实验及方面。 实验方案 分离,在质粒中亚克隆以及基因组SBE克隆的测序 使用放射性标记的马铃薯SBE cDNA(Poulsen与Kreiberg(1993) 植物生理102:1053-1054)作探针从Desiree马铃薯基因组文库(克隆技 术实验室公司,Palo Alto CA,USA)中分离出含有马铃薯SBE基因的多 种克隆。通过Southern分析来鉴别被分离的含有SBE DNA的λ-噬菌体 的片段(λSBE 3.2-NCIMB 40751-与λSBE-3.4-NCIMB 40752),然后将 该片段亚克隆至pBluescript II载体中(克隆技术实验室公司,Palo Alto CA,USA)。λSBE 3.2含有15kb的马铃薯DNA插入片段,λSBE-3.4含 有13kb的马铃薯DNA插入片段。所得到的质粒称作pGB3,pGB11, pGB15,pGB16和pGB25(参见以下的讨论)。然后使用Pharmacia 自动读数测序试剂盒(Pharmacia,Uppsala)和A.LF.DNa测序仪 (Pharmacia,Uppsala)对各个插入片段测序。 总计一共对SBE基因的一段11.5kb的序列进行了测序。所说的序列 可以从上述质粒中推导出来,其中:pGB25含有从1bp至836bp的序 列,pGB15含有从735bp至2580bp的序列,pGB16含有从2580bp 至5093bp的序列,pGB11含有从3348bp至7975bp的序列,并且pGB3 含有从7533bp至11468bp的序列。 更详细地讲,通过把从λSBE 3.2分离出来的一段4kb的EcoRI片段插 入pBluescript II SK(+)的EcoRI位点来构建pGB3。通过把从λSBE 3.4 分离出来的一段4.7kb的I片段插入pBluescript II SK(+)的XhoI位点 来构建pGB11。通过把从λSBE 3.4分离出来的一段1.7kb的SpeI片段 插入pBluescript II SK(+)的SpeI位点来构建pGB15。通过把从λSBE 3.4 分离出来的一段2.5kb的SpeI片段插入pBluescript II SK(+)的SpeI位 点来构建pGB16。为了构建pGB25,采用引物 5’GGA ATT CCA GTC GCA GTC TAC ATT AC 3’ 和 5’CGG GAT CCA GAG GCA TTA AGA TTT CTG G 3’ 并以λSBE 3.4作模板来生产PCR片段。 用BamHI和EcoRI消化上述PCR片段并将该片段插入以同一限制酶 消化的pBluescript II SK(+)中。 构建SBE反义内含子质粒pBEA 8和pBEA 9 通过PCR使用寡核苷酸 5’CGG GAT CCA AAG AAA TTC TCG AGG TTA CAT GG 3’ 和 5’CGG GAT CCG GGG TAA TTT TTA CTA ATT TCA TG 3’ 并以含有SBE基因的λSBE 3.4噬菌体作模板扩增SBE内含子1。 用BamHI消化上述PCR产物并将该产物以反义取向插入介于patatin 启动子与35S终止子之间的质粒pPATA 1(在WO 94/24292中有所描 述)的BamHI位点。以KpnI消化构建体pABE6,分离出2.4kb的 “patatin启动子-SBE内含子1-35S终止子”的KpnI片段并将该片段插 入植物转化载体pVictorIV Man的KpnI位点。以两种取向插入上述KpnI 片段,便生成了质粒pBEA8和pBEA9。pVictorIV Man示于图7并且 是通过把含有从质粒pVictorIV SGiN Man(WO 94/24292)分离出来 的E35S启动子-manA-35S终止子序列盒的补齐的XbaI片段插入pVictor IV的补齐的XhoI位点而形成的。pVictor IV Man的pVIctor区包含在 坐标2.52bp至0.32bp之间(参见图7)。 转基因马铃薯植株的生产 纯性原种培养物 于25℃及16小时光照/8小时黑暗下,将马铃薯’Bintje’和’Dianella’ 的幼苗培养物维持在根据Linsmaier,E.U.与Skoog,F.(1965)在《植物 生理学》18:100-127中配制的培养基(LS)上,此外该培养基还含有 2μM的硫代硫酸银。 大约40天后,传代培养上述培养物。然后从幼苗上切下叶子,并将其 切成每段含有一个节的节切片(segment)(大约0.8厘米)。 接种马铃薯组织 把来自培养了大约40天的幼苗培养物的幼苗(高度约为5-6厘米)切 成内部节的切片(大约0.8厘米)。将该切片放入含有转化的根瘤农杆菌 的液体LS-培养基中,其中的根瘤农杆菌含有感兴趣的二元载体。在含 有合适的抗生素(对应于农杆菌菌株的抗性基因)的YMB-培养基(三 水合磷酸氢二钾(0.66g/l);七水合硫酸镁(0.20g/l);氯化钠(0.10 g/l);甘露糖醇(10.0g/l);和酵母提取物(0.40g/l))中培养上述 农杆菌过夜,直至在660nm下的光密度(OD-660)约为0.8,将上述 农杆菌离心并重新悬浮于LS-培养基至OD-660为0.5。 在农杆菌的悬浮液中保留该切片30分钟,然后通过在无菌滤纸上吸干 该切片来除去过量的细菌。 共培养 直接在含有琼脂(8.0g/l)、2,4-二氯苯氧乙酸(2.0mg/l)和反 式-玉米素(0.5mg/l)的LS-培养基上与细菌一起共培养幼苗的切片 48小时。用无菌滤纸覆盖上述培养基还有外植体,在25℃与16小时光 照/8小时黑暗下放置培养皿。 “洗涤”步骤 在共培养的培养基上经48小时后,把上述切片转移至含有液体LS- 培养基的容器中,其中的培养基含有800mg/l的羧苄青霉素。轻轻地振 荡该容器,通过这一步骤,农杆菌的主要部分或从切片中洗去和/或被杀 死。 选择 在洗涤步骤之后,将上述切片转移至平板,该平板含有LS-培养基、 琼脂(8g/l)、反式-玉米素(1-5mg/l)、赤霉素(0.1mg/l)、羧 苄青霉素(800mg/l)和硫酸卡那霉素(50-100mg/l)或者取决于所使 用的载体构建的膦基麦黄酮(1-5mg/l)或甘露糖(5g/l)。 每隔3-4周,将上述切片传代培养至新鲜培养基上。 在3至4周内,从上述切片发育成幼苗,并且新的幼苗的形成将持续 3-4个月。 再生幼苗的生根 把再生的幼苗转移至由LS-培养基、琼脂(8g/l)和羧苄青霉素 (800mg/l)组成的生根培养基中。 通过测试在含有硫酸卡那霉素(200mg/l)的上述培养基上的生根能 力,通过进行NPTII测定(Radke,S.E.等人,应用遗传学原理(1988) 75:685-694)或者根据Wang等人(1993,NAR 21 pp4153-4154)进行 PCR分析来验证再生幼苗的转基因的基因型。把在上述任意一种测定中 均不呈阳性的植物弃去或用作对照物。另一方面,通过进行根据Hodal,L. 等人(植物科学(1992)87:115-122)有关共同引入的β-葡糖醛酸酶的 基因的GUS测定也可以验证上述转基因植物。 转移至土壤 把新生根的植物(高度约为2-3厘米)从生根培养基移植入土壤并放 置在生长室中(21℃,16小时光照200-400uE/m2/sec)。当植物很 好地生长时,将这些植物移入温室,在温室中培养该植物直至块茎已经发 育并且该植物的上部开始衰老。 收获 在大约3个月后收获这些马铃薯,然后进行分析。 分支酶的分析 采用由Blennow与Johansson(植物化学(1991)30:437-444)所 述的SBE测定并且通过标准的Western方法采用定向的抗马铃薯SBE的 抗体来测定转基因马铃薯系中SBE的表达。 淀粉分析 从马铃薯块茎中分离出淀粉,该淀粉用于分析直链淀粉与支链淀粉之 比(Hovenkamp-Hermelink等人(1988)马铃薯研究31:241-246)。 此外,通过在Dionex HPAEC上分析异淀粉酶消化的淀粉来测定支链淀 粉的链长分布。 通过N.Nelson(1944)在《生物化学杂志》153:375-380中所述的方 法来测定异淀粉酶消化的淀粉中还原端的数目。 上述结果表明SBE合成的水平和/或SBE活性的水平和/或转基因植物 中淀粉SBE的组成有所下降。 构建SBE启动子构建体 使用引物 5’CCA TCG ATA CTT TAA GTG ATT TGA TGG C 3’ 和 5’CGG GAT CCT GTT CTG ATT CTT GAT TTC C 3’ 从λ-SBE 3.4中扩增一段SBE启动子片段。用ClaI与BamHI消化该 PCR产物。然后将得到的1.2kb的片段插入用ClaI和BglII线性化的 pVictor 5a中(参见图11),从而生成pBEP2(参见图10)。 马铃薯块茎的淀粉分支酶的测量 把来自用pBEA8或pBEA9转化的马铃薯植株的马铃薯切成小块并使 用Ultra-Turax匀浆器在提取缓冲液(50mM Tris-HCl pH 7.5,连二亚 硫酸钠(0.1g/l)和2mM DTT)中进行匀浆;向每10克的块茎中加入 1克Dowex xl。将粗的匀浆物通过Miracloth过滤器进行过滤并在4℃、 24,700g下离心10分钟。上清液用于淀粉分支酶的测定。 淀粉分支酶的测定是在25℃下、体积为400μl的容器中进行的,上述 溶液是由0.1M柠檬酸钠缓冲液pH 7.0、0.75mg/ml直链淀粉、5mg/ml 牛血清白蛋白和马铃薯提取物组成的。在0、15、30和60分钟时,从 上述反应中取走50μl的等分试样至20μl的3N HCl中。加入1ml碘溶液 并用ELISA分光光度计测量620nm处吸光度的下降。 在来自用质粒pBEA9转化的34株转基因Dianella马铃薯植株的块茎 提取物中测量淀粉分支酶(SBE)的含量。 pBEA9转化的转基因系生产出SBE含量为在未转化的Dianella植株 中SBE含量的10%至15%的块茎。 小结 上述实施例涉及马铃薯SBE的基因的分离和测序。这些实施例进一步 阐明可能可以制备出SBE的内含子的反义构建体。可以把这些SBE的内 含子的反义构建体引入诸如马铃薯之类的植物中。在引入后,可以实现 SBE合成水平和/或SBE活性的水平和/或植物中淀粉组成的降低。 人们认为本发明所表达的反义核苷酸序列结合到位于前-mRNA的有 义内含子上并从而防止了前-mRNA的剪接和/或随后mRNA的翻译, 而这并不希望与理论相结合。因此人们认为这一结合降低了植物的酶活性 (尤其是SBE活性)的水平,反过来人们认为SBE活性又影响了直链淀 粉与支链淀粉的比例并从而影响支链淀粉的分支模式。 因此,本发明提供了一种可能通过采用反义RNA技术降低SBE活性 水平来控制植物或其组织或者细胞(诸如马铃薯块茎)中的淀粉组成的方 法,其中的反义-RNA技术使用了反义内含子序列。 因此总而言之,本发明涉及以影响植物中酶的活性的方法来令人吃惊 地使用反义内含子序列。 在不偏离本发明的范围的情况下,本发明的其它改进对本领域的普通 技术人员而言是显而易见的。 例如,可能可以使用反义启动子序列来影响酶的活性,比如反义SBE 启动子-诸如包括如SEQ.I.D.No.28所示的核苷酸序列或其变体、衍生 物或者同系物的核苷酸序列。 下面几页提供了已从SEQ.I.D.No.1至SEQ.I.D.No.29顺序排号的许多 序列表。简而言之,SEQ.I.D.No.1至SEQ.I.D.No.13表示有义内含子序 列(基因组DNA);SEQ.I.D.No.14表示SBE启动子序列(基因组序 列);SEQ.I.D.No.15至SEQ.I.D.No.27表示反义内含子序列;并且 SEQ.I.D.No.28表示(是)互补于SBE启动子序列的序列—即以反义取 向的SBE启动子序列。包括启动子、外显子和内含子的SBE的完整的基 因组核苷酸序列如SEQ.I.D.No.29所示并且通过突出了具体的基因特征 的图4和图12进行了解释。 序列信息 SEQ.I.D.No.1 内含子1的序列 (1167bp). GTAATTTTTACTAATTTCATGTTAATTTCAATTATTTTTAGCCTTTGCATTTCATTTTCCAATATATCT GGATCATCTCCTTAGTTTTTTATTTTATTTTTTATAATATCAAATATGGAAGAAAAATGACACTTGTAG AGCCATATGTAAGTATCATGTGACAAATTTGCAAGGTGGTTGAGTGTATAAAATTCAAAAATTGAGAGA TGGAGGGGGGGTGGGGGBARAGACAATATTTAGAAAGAGTGTTCTAGGAGGTTATGGAGGACACGGATG AGGGGTAGAAGGTTAGTTAGGTATTTGAGTGTTGTCTGGCTTATCCTTTCATACTAGTAGTCGTGGAAT TATTTGGGTAGTTTCTTGTTTTGTTATTTGATCTTTGTTATTCTATTTTCTGTTTCTTGTACTTCGATT ATTGTATTATATATCTTGTCGTAGTTATTGTTCCTCGGTAAGAATGCTCTAGCATGCTTCCTTTAGTGT TTTATCATGCCTTCTTTATATTCGCGTTGCTTTGAAATGCTTTTACTTTAGCCGAGGGTCTATTAGAAA CAATCTCTCTATCTCGTAAGGTAGGGGTAAAGTCCTCACCACACTCCACTTGTGGGATTACATTGTGTT TGTTGTTGTAAATCAATTATGTATACATAATAAGTGGATTTTTTACAACACAAATACATGGTCAAGGGC AAAGTTCTGAACACATAAAGGGTTCATTATATGTCCAGGGATATGATAAAAATTGTTTCTTTGTGAAAG TTATATAAGATTTGTTATGGCTTTTGCTGGAAACATAATAAGTTATAATGCTGAGATAGCTACTGAAGT TTGTTTTTTCTAGCCTTTTAAATGTACCAATAATAGATTCCGTATCGAACGAGTATGTTTTGATTACCT GGTCATGATGTTTCTATTTTTTACATTTTTTTGGTGTTGAACTGCAATTGAAAATGTTGTATCCTATGA GACGGATAGTTGAGAATGTGTTCTTTGTATGGACCTTGAGAAGCTCAAACGCTACTCCAATAATTTCTA TGAATTCAAATTCAGTTTATGGCTACCAGTCAGTCCAGAAATTAGGATATGCTGCATATACTTGTTCAA TTATACTGTAAAATTTCTTAAGTTCTCAAGATATCCATGTAACCTCGAGAATTTCTTTGACAG SEQ.I.D.No.2 内含子2的序列 (321bp) GTATGTTTGATAATTTATATGGTTGCATGGATAGTATATAAATAGTTGGAAAACTTCTGGACTGGTGCT CATGGCATATTTGATCTGTGCACCGTGTGGAGATGTCAAACATGTGTTACTTCGTTCCGCCAATTTATA ATACCTTAACTTGGGAAAGACAGCTCTTTACTCCTGTGGGCATTTGTTATTTGAATTACAATCTTTATG AGCATGGTGTTTTCACATTATCAACTTCTTTCATGTGGTATATAACAGTTTTTAGCTCCGTTAATACCT TTCTTCTTTTTGATATAAACTAACTGTGGTGCATTGCTTGCBKKK SEQ.I.D.No.3 内含子3的序列 (504bp). GTAACAGCCAAAAGTTGTGCTTTAGGCAGTTTGACCTTATTTTGGAAGATGAATTGTTTATACCTACTT TGACTTTGCTAGAGAATTTTGCATACCGGGGAGTAAGTAGTGGCTCCATTTAGGTGGCACCTGGCCATT TTTTTGATCTTTTAAAAAGCTGTTTGATTGGGTCTTCAAAAAAGTAGACAAGGTTTTTGGAGAAGTGAC ACACCCCCGGAGTGTCAGTGGCAAAGCAAAGATTTTCACTAAGGAGATTCAAAATATAAAAAAAGTATA GACATAAAGAAGCTGAGGGGATTCAACATGTACTATACAAGCATCAAATATAGTCTTAAAGCAATTTTG TAGAAATAAAGAAAGTCTTCCTTCTGTTGCTTCACAATTTCCTTCTATTATCATGAGTTACTCTTTCTG TTCGAAATAGCTTCCTTAATATTAAATTCATGATACTTTTGTTGAGATTTAGCAGTTTTTTCTTGTGTA AACTGCTCTCTTTTTTTGCAG SEQ.I.D.No.4 内含子4的序列 (146bp). GTAGGTCCTCGTCTACTACAAAATAGTAGTTTCCATCATCATAACAGATTTTCCTATTAAAGCATGATG TTGCAGCATCATTGGCTTTCTTACATGTTCTAATTGCTATTAAGGTTATGCTTCTAATTAACTCATCCA CAATGCAG SEQ.I.D.No.5 内含子5的序列 (218bp). GTTTTGTTATTCATACCTTGAAGCTGAATTTTGAACACCATCATCACAGGCATTTCGATTCATGTTCTT ACTAGTCTTCTTATGTAAGACATTTTGAAATGCAAAAGTTAAAATAATTGTGTCTTTACTAATTTGGAC TTGATCCCATACTCTTTCCCTTAACAAAATGAGTCAATTCTATAAGTGCTTGAGAACTTACTACTTCAG CAATTAAACAG SEQ.I.D.No.6 内含子6的序列 (198bp). GTATTTTAAATTTATTTCTACAACTAAATAATTCTCAGAACAATTGTTAGATAGAATCCAAATATATAC GTCCTGAAAGTATAAAAGTACTTATTTTCGCCATGGGCCTTCAGAATATTGGTAGCCGCTGAATATCAT GATAAGTTATTTATCCAGTGACATTTTTATGTTCACTCCTATTATGTCTGCTGGATACAG SEQ.I.D.No.7 内含子7的序列 (208bp) GTTTGTCTGTTTCTATTGCATTTTAAGGTTCATATAGGTTAGCCACGGAAAATCTCACTCTTTGTGAGG TAACCAGGGTTCTGATGGATTATTCAATTTTCTCGTTTATCATTTGTTTATTCTTTTCATGCATTGTGT TTCTTTTTCAATATCCCTCTTATTTGGAGGTAATTTTTCTCATCTATTCACTTTTAGCTTCTAACCACAG SEQ.I.D.No.8 内含子8的序列 (293bp). GTATGTCTTACATCTTTAGATATTTTGTGATAATTACAATTAGTTTGGCTTACTTGAACAAGATTCATT CCTCAAAATGACCTGAACTGTTGAACATCAAAGGGGTTGAAACATAGAGGAAAACAACATGATGAATGT TTCCATTGTCTAGGGATTTCTATTATGTTGCTGAGAACAAATGTCATCTTAAAAAAAACATTGTTTACT TTTTTGTAGTATAGAAGATTACTGTATAGAGTTTGCAAGTGTGTCTGTTTTGGAGTAATTGTGAAATGT TTGATGAACTTGTACAG SEQ.I.D.No.9 内含子9的序列 (376bp). GTTCAAGTATTTTGAATCGCAGCTTGTTAAATAATCTAGTAATTTTTAGATTGCTTACTTGGAAGTCTA CTTGGTTCTGGGGATGATAGCTCATTTCATCTTGTTCTACTTATTTTCCAACCGAATTTCTGATTTTTG TTTCGAGATCCAAGTATTAGATTCATTTACACTTATTACCGCCTCATTTCTACCACTAAGGCCTTGATG AGCAGCTTAAGTTGATTCTTTGAAGCTATAGTTTCAGGCTACCAATCCACAGCCTGCTATATTTGTTGG ATACTTACCTTTTCTTTACAATGAAGTGATACTAATTGAAATGGTCTAATCTGATATCTATATTTCTC CGTCTTTCCTCCCCCTCATGATGAAATGCAG SEQ.I.D.No.10 内含子10的序列 (172bp). GTAAAATCATCTAAAGTTGAAAGTGTTGGGTTTATGAAGTGCTTTAATTCTATCCAAGGACAAGTAGAA ACCTTTTTACCTTCCATTTCTTGATGATGGATTTCATATTATTTAATCCAATAGCTGGTCAAATTCGGT AATAGCTGTACTGATTAGTTACTTCACTTTGCAG SEQ.I.D.No.11 内含子11的序列 (145bp). GTATATATGTTTTACTTATCCATGAAATTATTGCTCTGCTTGTTTTTAATGTACTGAACAAGTTTTATG GAGAAGTAACTGAAACAAATCATTTTCACATTGTCTAATTTAACTCTTTTTTCTGATCCTCGCATGACG AAAACAG SEQ.I.D.No.12 内含子12的序列 (242bp). GTAAGGATTTGCTTGAATAACTTTTGATAATAAGATAACAGATGTAGGGTACAGTTCTCTCACCAAAAA GAACTGTAATTGTCTCATCCATCTTTAGTTGTATAAGATATCCGACTGTCTGAGTTCGGAAGTGTTTGA GCCTCCTGCCCTCCCCCTGCGTTGTTTAGCTAATTCAAAAAGGAGAAAACTGTTTATTGATGATCTTTG TCTTCATGCTGACATACAATCTGTTCTCATGACAG SEQ.I.D.No.13 内含子13的序列 (797bp). GTACAGTTCTTGCCGTGTGACCTCCCTTTTTATTGTGGTTTTGTTCATAGTTATTTGAATGCGATAGAA GTTAACTATTGATTACCGCCACAATCGCCAGTTAAGTCCTCTGAACTACTAATTTGAAAGGTAGGAATA GCCGTAATAAGGTCTACTTTTGGCATCTTACTGTTACAAAACAAAAGGATGCCAAAAAAATTCTTCTCT ATCCTCTTTTTCCCTAAACCAGTGCATGTAGCTTGCACCTGCATAAACTTAGGTAAATGATCAAAAATG AAGTTGATGGGAACTTAAAACCGCCCTGAAGTAAAGCTAGGAATAGTCATATAATGTCCACCTTTGGTG TCTGCGCTAACATCAACAACAACATACCTCGTGTAGTCCCACAAAGTGGTTTCAGGGGGAGGGTAGAGT GTATGCAAAACTTACTCCTATCTCAGAGGTAGAGAGGATTTTTTCAATAGACCCTTGGCTCAAGAAAAA AAGTCCAAAAAGAAGTAACAGAAGTGAAAGCAACATGTGTAGCTAAAGCGACCCAACTTGTTTGGGACT GAAGTAGTTGTTGTTGTTGAAACAGTGCATGTAGATGAACACATGTCAGAAAATGGACAACACAGTTAT TTTGTGCAAGTCAAAAAAATGTACTACTATTTCTTTGTGCAGCTTTATGTATAGAAAAGTTAAATAACT AATGAATTTTGCTAGCAGAAAAATAGCTTGGAGAGAAATTTTTTATATTGAACTAAGCTAACTATATTC ATCTTTCTTTTTGCTTCTTCTTCTCCTTGTTTGTGAAG SEQ.I.D.No.14 SBE基因启动子区的DNA序列 ATCATGGCCAATTACTGGTTCAAATGCATTACTTCCTTTCAGATTCTTTCGAGTTCTCAT 60 GACCGGTCCTACTACAGACGATACTAACCCGTGGAACTGTTGCATCTGCTTCTTAGAACT 120 CTATGGCTATTTTCGTTAGCTTGGCGTCGGTTTGAACATAGTTTTTGTTTTCAAACTCTT 180 CATTTACAGTCAAAATGTTGTATGGTTTTTGTTTTCCTCAATGATGTTTACAGTGTTGTG 240 TTGTCATCTGTACTTTTGCCTATTACTTGTTTTGAGTTACATGTTAAAAAAGTGTTTATT 300 TTGCCATATTTTGTTCTCTTATTATTATTATCATACATACATTATTACAAGGAAAAGACA 360 AGTACACAGATCTTAACGTTTATGTTCAATCAACTTTTGGAGGCATTGACAGGTACCACA 420 AATTTTGAGTTTATGATTAAGTTCAATCTTAGAATATGAATTTAACATCTATTATAGATG 480 CATAAAAATAGCTAATGATAGAACATTGACATTTGGCAGAGCTTAGGGTATGGTATATCC 540 AACGTTAATTTAGTAATTTTTGTTACGTACGTATATGAAATATTGAATTAATCACATGAA 600 CGGTGGATATTATATTATGAGTTGGCATCAGCAAAATCATTGGTGTAGTTGACTGTAGTT 660 GCAGATTTAATAATAAAATGGTAATTAACGGTCGATATTAAAATAACTCTCATTTCAAGT 720 GGGATTAGAACTAGTTATTAAAAAAATGTATACTTTAAGTGATTTGATGGCATATAATTT 780 AAAGTTTTTCATTTCATGCTAAAATTGTTAATTATTGTAATGTAGACTGCGACTGGAATT 840 ATTATAGTGTAAATTTATGCATTCAGTGTAAAATTAAAGTATTGAACTTGTCTGTTTTAG 900 AAAATACTTTATACTTTAATATAGGATTTTGTCATGCGAATTTAAATTAATCGATATTGA 960 ACACGGAATACCAAAATTAAAAAGGATACACATGGCCTTCATATGAACCGTGAACCTTTG 1020 ATAACGTGGAAGTTCAAAGAAGGTAAAGTTTAAGAATAAACTGACAAATTAATTTCTTTT 1080 ATTTGGCCCACTACTAAATTTGCTTTACTTTCTAACATGTCAAGTTGTGCCCTCTTAGTT 1140 GAATGATATTCATTTTTCATCCCATAAGTTCAATTTGATTGTCATACCACCCATGATGTT 1200 CTGAAAAATGCTTGGCCATTCACAAAGTTTATCTTAGTTCCTATGAACTTTATAAGAAGC 1260 TTTAATTTGACATGTTATTTATATTAGATGATATAATCCATGACCCAATAGACAAGTGTA 1320 TTAATATTGTAACTTTGTAATTGAGTGTGTCTACATCTTATTCAATCATTTAAGGTCATT 1380 AAAATAAATTATTTTTTGACATTCTAAAACTTTAAGCAGAATAAATAGTTTATCAATTAT 1440 TAAAAACAAAAAACGACTTATTTATAAATCAACAAACAATTTTAGATTGCTCCAACATAT 1500 TTTTCCAAATTAAATGCAGAAAATGCATAATTTTATACTTGATCTTTATAGCTTATTTTT 1560 TTTAGCCTAACCAACGAATATTTGTAAACTCACAACTTGATTAAAAGGGATTTACAACAA 1620 GATATATATAAGTAGTGACAAATCTTGATTTTAAATATTTTAATTTGGAGGTCAAAATTT 1680 TACCATAATCATTTGTATTTATAATTAAATTTTAAATATCTTATTTATACATATCTAGTA 1740 AACTTTTAAATATACGTATATACAAAATATAAAATTATTGGCGTTCATATTAGGTCAATA 1800 AATCCTTAACTATATCTGCCTTACCACTAGGAGAAAGTAAAAAACTCTTTACCAAAAATA 1860 CATGTATTATGTATACAAAAAGTCGATTAGATTACCTAAATAGAAATTGTATAACGAGTA 1920 AGTAAGTAGAAATATAAAAAAACTACAATACTAAAAAAAATATGTTTTACTTCAATTTCG 1980 AAACTAATGGGGTCTGAGTGAAATATTCAGAAAGGGGAGGACTAACAAAAGGGTCATAAT 2040 GTTTTTTTATAAAAAGCCACTAAAATGAGGAAATCAAGAATCAGAACATACAAGAAGGCA 2100 GCAGCTGAAGCAAAGTACCATAATTTAATCAATGGAAATTAATTTCAAAGTTTTATCAAA 2160 ACCCATTCG SEQ.I.D.No.15 内含子1的反义序列 (1167bp). CTGTCAAAGAAATTCTCGAGGTTACATGGATATCTTGAGAACTTAAGAAATTTTACAGTATAATTGAAC AAGTATATGCAGCATATCCTAATTTCTGGACTGACTGGTAGCCATAAACTGAATTTGAATTCATAGAAA TTATTGGAGTAGCGTTTGAGCTTCTCAAGGTCCATACAAAGAACACATTCTCAACTATCCGTCTCATAG GATACAACATTTTCAATTGCAGTTCAACACCAAAAAAATGTAAAAAATAGAAACATCATGACCAGGTAA TCAAAACATACTCGTTCGATACGGAATCTATTATTGGTACATTTAAAAGGCTAGAAAAAACAAACTTCA GTAGCTATCTCAGCATTATAACTTATTATGTTTCCAGCAAAAGCCATAACAAATCTTATATAACTTTCA CAAAGAAACAATTTTTATCATATCCCTGGACATATAATGAACCCTTTATGTGTTCAGAACTTTGCCCTT GACCATGTATTTGTGTTGTAAAAAATCCACTTATTATGTATACATAATTGATTTACAACAACAAACACA ATGTAATCCCACAAGTGGAGTGTGGTGAGGACTTTACCCCTACCTTACGAGATAGAGAGATTGTTTCTA ATAGACCCTCGGCTAAAGTAAAAGCATTTCAAAGCAACGCGAATATAAAGAAGGCATGATAAAACACTA AAGGAAGCATGCTAGAGCATTCTTACCGAGGAACAATAACTACGACAAGATATATAATACAATAATCGA AGTACAAGAAACAGAAAATAGAATAACAAAGATCAAATAACAAAACAAGAAACTACCCAAATAATTCCA CGACTACTAGTATGAAAGGATAAGCCAGACAACACTCAAATACCTAACTAACCTTCTACCCCTCATCCG TGTCCTCCATAACCTCCTAGAACACTCTTTCTAAATATTGTCTYTVCCCCCACCCCCCCTCCATCTCTC AATTTTTGAATTTTATACACTCAACCACCTTGCAAATTTGTCACATGATACTTACATATGGCTCTACAA GTGTCATTTTTCTTCCATATTTGATATTATAAAAAATAAAATAAAAAACTAAGGAGATGATCCAGATAT ATTGGAAAATGAAATGCAAAGGCTAAAAATAATTGAAATTAACATGAAATTAGTAAAAATTAC SEQ.I.D.No.16 内含子2的反义序列 (321bp). MMMVGCAAGCAATGCACCACAGTTAGTTTATATCAAAAAGAAGAAAGGTATTAACGGAGCTAAAAACTG TTATATACCACATGAAAGAAGTTGATAATGTGAAAACACCATGCTCATAAAGATTGTAATTCAAATAAC AAATGCCCACAGGAGTAAAGAGCTGTCTTTCCCAAGTTAAGGTATTATAAATTGGCGGAACGAAGTAAC ACATGTTTGACATCTCCACACGGTGCACAGATCAAATATGCCATGAGCACCAGTCCAGAAGTTTTCCAA CTATTTATATACTATCCATGCAACCATATAAATTATCAAACATAC SEQ.I.D.No.17 内含子3的反义序列 (504bp). CTGCAAAAAAAGAGAGCAGTTTACACAAGAAAAAACTGCTAAATCTCAACAAAAGTATCATGAATTTAA TATTAAGGAAGCTATTTCGAACAGAAAGAGTAACTCATGATAATAGAAGGAAATTGTGAAGCAACAGAA GGAAGACTTTCTTTATTTCTACAAAATTGCTTTAAGACTATATTTGATGCTTGTATAGTACATGTTGAA TCCCCTCAGCTTCTTTATGTCTATACTTTTTTTATATTTTGAATCTCCTTAGTGAAAATCTTTGCTTTG CCACTGACACTCCGGGGGTGTGTCACTTCTCCAAAAACCTTGTCTACTTTTTTGAAGACCCAATCAAAC AGCTTTTTAAAAGATCAAAAAAATGGCCAGGTGCCACCTAAATGGAGCCACTACTTACTCCCCGGTATG CAAAATTCTCTAGCAAAGTCAAAGTAGGTATAAACAATTCATCTTCCAAAATAAGGTCAAACTGCCTAA AGCACAACTTTTGGCTGTTAC SEQ.I.D.No.18 内含子4的反义序列 (146bp). CTGCATTGTGGATGAGTTAATTAGAAGCATAACCTTAATAGCAATTAGAACATGTAAGAAAGCCAATGA TGCTGCAACATCATGCTTTAATAGGAAAATCTGTTATGATGATGGAAACTACTATTTTGTAGTAGACGA GGACCTAC SEQ.I.D.No.19 内含子5的反义序列 (218bp). CTGTTTAATTGCTGAAGTAGTAAGTTCTCAAGCACTTATAGAATTGACTCATTTTGTTAAGGGAAAGAG TATGGGATCAAGTCCAAATTAGTAAAGACACAATTATTTTAACTTTTGCATTTCAAAATGTCTTACATA ACAAGACTAGTAAGAACATGAATCGAAATGCCTGTGATGATGGTGTTCAAAATTCAGCTTCAAGGTATG AATAACAAAAC SEQ I.D.No.20 内含子6的反义序列 (198bp). CTGTATCCAGCAGACATAATAGGAGTGAACATAAAAATGTCACTGGATAAATAACTTATCATGATATTC AGCGGCTACCAATATTCTGAAGGCCCATGGCGAAAATAAGTACTTTTATACTTTCAGGACGTATATATT TGGATTCTATCTAACAATTGTTCTGAGAATTATTTAGTTGTAGAAATAAATTTAAAATAC SEQ.I.D.No.21 内含子7的反义序列 (208bp). CTGTGGTTAGAAGCTAAAAGTGAATAGATGAGAAAAATTACCTCCAAATAAGAGGGATATTGAAAAAGA AACACAATGCATGAAAAGAATAAACAAATGATAAACGAGAAAATTGAATAATCCATCAGAACCCTGGTT ACCTCACAAAGAGTGAGATTTTCCGTGGCTAACCTATATGAACCTTAAAATGCAATAGAAACAGACAAAC SEQ.I.D.No.22 内含子8的反义序列 (293bp). CTGTACAAGTTCATCAAACATTTCACAATTACTCCAAAACAGACACACTTGCAAACTCTATACAGTAAT CTTCTATACTACAAAAAAGTAAACAATGTTTTTTTTAAGATGACATTTGTTCTCAGCAACATAATAGAA ATCCCTAGACAATGGAAACATTCATCATGTTGTTTTCCTCTATGTTTCAACCCCTTTGATGTTCAACAG TTCAGGTCATTTTGAGGAATGAATCTTGTTCAAGTAAGCCAAACTAATTGTAATTATCACAAAATATCT AAAGATGTAAGACATAC SEQ.I.D.No.23 内含子9的反义序列 (376bp). CTGCATTTCATCATGAGGGGGAGGAAAGACGGAGAAATATAGATATCAGATTTAGACCATTTCAATTAG TATCACTTCATTGTAAAGAAAAGGTAAGTATCCAACAAATATAGCAGGCTGTGGATTGGTAGCCTGAAA CTATAGCTTCAAAGAATCAACTTAAGCTGCTCATCAAGGCCTTAGTGGTAGAAATGAGGCGGTAATAAG TGTAAATGAATCCAATACTTGGATCTCGAAACAAAAATCAGAAATTCGGTTGGAAAATAAGTAGAACAA GATGAAATGAGCTATCATCCCCAGAACCAAGTAGACTTCCAAGTAAGCAATCTAAAAATTACTAGATTA TTTAACAAGCTGCGATTCAAAATACTTGAAC SEQ.I.D.No.24 内含子10的反义序列 (172bp). CTGCAAAGTGAAGTAACTAATCAGTACAGCTATTACCGAATTTGACCAGCTATTGGATTAAATAATATG AAATCCATCATCAAGAAATGGAAGGTAAAAAGGTTTCTACTTGTCCTTGGATAGAATTAAAGCACTTCA TAAACCCAACACTTTCAACTTTAGATGATTTTAC SEQ.I.D.No.25 内含子11的反义序列 (145bp). CTGTTTTCGTCATGCGAGGATCAGAAAAAAGAGTTAAATTAGACAATGTGAAAATGATTTGTTTCAGTT ACTTCTCCATAAAACTTGTTCAGTACATTAAAAACAAGCAGAGCAATAATTTCATGGATAAGTAAAACA TATATAC SEQ.I.D.No.26 内含子12的反义序列 (242bp). CTGTCATGAGAACAGATTGTATGTCAGCATGAAGACAAAGATCATCAATAAACAGTTTTCTCCTTTTTG AATTAGCTAAACAACGCAGGGGGAGGGCAGGAGGCTCAAACACTTCCGAACTCAGACAGTCGGATATCT TATACAACTAAAGATGGATGAGACAATTACAGTTCTTTTTGGTGAGAGAACTGTACCCTACATCTGTTA TCTTATTATCAAAAGTTATTCAAGCAAATCCTTAC SEQ I.D.No.27 内含子13的反义序列 (797bp). CTTCACAAACAAGGAGAAGAAGAAGCAAAAAGAAAGATGAATATAGTTAGCTTAGTTCAATATAAAAAA TTTCTCTCCAAGCTATTTTTCTGCTAGCAAAATTCATTAGTTATTTAACTTTTCTATACATAAAGCTGC ACAAAGAAATAGTAGTACATTTTTTTGACTTGCACAAAATAACTGTGTTGTCCATTTTCTGACATGTGT TCATCTACATGCACTGTTTCAACAACAACAACTACTTCAGTCCCAAACAAGTTGGGTCGCTTTAGCTAC ACATGTTGCTTTCACTTCTGTTACTTCTTTTTGGACTTTTTTTCTTGAGCCAAGGGTCTATTGAAAAAA TCCTCTCTACCTCTGAGATAGGAGTAAGTTTTGCATACACTCTACCCTCCCCCTGAAACCACTTTGTGG GACTACACGAGGTATGTTGTTGTTGATGTTAGCGCAGACACCAAAGGTGGACATTATATGACTATTCCT AGCTTTACTTCAGGGCGGTTTTAAGTTCCCATCAACTTCATTTTTGATCATTTACCTAAGTTTATGCAG GTGCAAGCTACATGCACTGGTTTAGGGAAAAAGAGGATAGAGAAGAATTTTTTTGGCATCCTTTTGTTT TGTAACAGTAAGATGCCAAAAGTAGACCTTATTACGGCTATTCCTACCTTTCAAATTAGTAGTTCAGAG GACTTAACTGGCGATTGTGGCGGTAATCAATAGTTAACTTCTATCGCATTCAAATAACTATGAACAAAA CCACAATAAAAAGGGAGGTCACACGGCAAGAACTGTAC SEQ.I.D.No.28 SBE基因启动子区的反义DNA序列 CGAATGGGTTTTGATAAAACTTTGAAATTAATTTCCATTGATTAAATTATGGTACTTTGC 60 TTCAGCTGCTGCCTTCTTGTATGTTCTGATTCTTGATTTCCTCATTTTAGTGGCTTTTTA 120 TAAAAAAACATTATGACCCTTTTGTTAGTCCTCCCCTTTCTGAATATTTCACTCAGACCC 180 CATTAGTTTCGAAATTGAAGTAAAACATATTTTTTTTAGTATTGTAGTTTTTTTATATTT 240 CTACTTACTTACTCGTTATACAATTTCTATTTAGGTAATCTAATCGACTTTTTGTATACA 300 TAATACATGTATTTTTGGTAAAGAGTTTTTTACTTTCTCCTAGTGGTAAGGCAGATATAG 360 TTAAGGATTTATTGACCTAATATGAACGCCAATAATTTTATATTTTGTATATACGTATAT 420 TTAAAAGTTTACTAGATATGTATAAATAAGATATTTAAAATTTAATTATAAATACAAATG 480 ATTATGGTAAAATTTTGACCTCCAAATTAAAATATTTAAAATCAAGATTTGTCACTACTT 540 ATATATATCTTGTTGTAAATCCCTTTTAATCAAGTTGTGAGTTTACAAATATTCGTTGGT 600 TAGGCTAAAAAAAATAAGCTATAAAGATCAAGTATAAAATTATGCATTTTCTGCATTTAA 660 TTTGGAAAAATATGTTGGAGCAATCTAAAATTGTTTGTTGATTTATAAATAAGTCGTTTT 720 TTGTTTTTAATAATTGATAAACTATTTATTCTGCTTAAAGTTTTAGAATGTCAAAAAATA 780 ATTTATTTTAATGACCTTAAATGATTGAATAAGATGTAGACACACTCAATTACAAAGTTA 840 CAATATTAATACACTTGTCTATTGGGTCATGGATTATATCATCTAATATAAATAACATGT 900 CAAATTAAAGCTTCTTATAAAGTTCATAGGAACTAAGATAAACTTTGTGAATGGCCAAGC 960 ATTTTTCAGAACATCATGGGTGGTATGACAATCAAATTGAACTTATGGGATGAAAAATGA 1020 ATATCATTCAACTAAGAGGGCACAACTTGACATGTTAGAAAGTAAAGCAAATTTAGTAGT 1080 GGGCCAAATAAAAGAAATTAATTTGTCAGTTTATTCTTAAACTTTACCTTCTTTGAACTT 1140 CCACGTTATCAAAGGTTCACGGTTCATATGAAGGCCATGTGTATCCTTTTTAATTTTGGT 1200 ATTCCGTGTTCAATATCGATTAATTTAAATTCGCATGACAAAATCCTATATTAAAGTATA 1260 AAGTATTTTCTAAAACAGACAAGTTCAATACTTTAATTTTACACTGAATGCATAAATTTA 1320 CACTATAATAATTCCAGTCGCAGTCTACATTACAATAATTAACAATTTTAGCATGAAATG 1380 AAAAACTTTAAATTATATGCCATCAAATCACTTAAAGTATACATTTTTTTAATAACTAGT 1440 TCTAATCCCACTTGAAATGAGAGTTATTTTAATATCGACCGTTAATTACCATTTTATTAT 1500 TAAATCTGCAACTACAGTCAACTACACCAATGATTTTGCTGATGCCAACTCATAATATAA 1560 TATCCACCGTTCATGTGATTAATTCAATATTTCATATACGTACGTAACAAAAATTACTAA 1620 ATTAACGTTGGATATACCATACCCTAAGCTCTGCCAAATGTCAATGTTCTATCATTAGCT 1680 ATTTTTATGCATCTATAATAGATGTTAAATTCATATTCTAAGATTGAACTTAATCATAAA 1740 CTCAAAATTTGTGGTACCTGTCAATGCCTCCAAAAGTTGATTGAACATAAACGTTAAGAT 1800 CTGTGTACTTGTCTTTTCCTTGTAATAATGTATGTATGATAATAATAATAAGAGAACAAA 1860 ATATGGCAAAATAAACACTTTTTTAACATGTAACTCAAAACAAGTAATAGGCAAAAGTAC 1920 AGATGACAACACAACACTGTAAACATCATTGAGGAAAACAAAAACCATACAACATTTTGA 1980 CTGTAAATGAAGAGTTTGAAAACAAAAACTATGTTCAAACCGACGCCAAGCTAACGAAAA 2040 TAGCCATAGAGTTCTAAGAAGCAGATGCAACAGTTCCACGGGTTAGTATCGTCTGTAGTA 2100 GGACCGGTCATGAGAACTCGAAAGAATCTGAAAGGAAGTAATGCATTTGAACCAGTAATT 2160 GGCCATGAT SEQ.I.D.No.29 基因组SBE基因 ATCATGGCCA ATTACTGGTT CAAATGCATT ACTTCCTTTC AGATTCTTTC GAGTTCTCAT 60 GACCGGTCCT ACTACAGACG ATACTAACCC GTGGAACTGT TGCATCTGCT TCTTAGAACT 120 CTATGGCTAT TTTCGTTAGC TTGGCGTCGG TTTGAACATA GTTTTTGTTT TCAAACTCTT 180 CATTTACAGT CAAAATGTTG TATGGTTTTT GTTTTCCTCA ATGATGTTTA CAGTGTTGTG 240 TTGTCATCTG TACTTTTGCC TATTACTTGT TTTGAGTTAC ATGTTAAAAA AGTGTTTATT 300 TTGCCATATT TTGTTCTCTT ATTATTATTA TCATACATAC ATTATTACAA GGAAAAGACA 360 AGTACACAGA TCTTAACGTT TATGTTCAAT CAACTTTTGG AGGCATTGAC AGGTACCACA 420 AATTTTGAGT TTATGATTAA GTTCAATCTT AGAATATGAA TTTAACATCT ATTATAGATG 480 CATAAAAATA GCTAATGATA GAACATTGAC ATTTGGCAGA GCTTAGGGTA TGGTATATCC 540 AACGTTAATT TAGTAATTTT TGTTACGTAC GTATATGAAA TATTGAATTA ATCACATGAA 600 CGGTGGATAT TATATTATGA GTTGGCATCA GCAAAATCAT TGGTGTAGTT GACTGTAGTT 660 GCAGATTTAA TAATAAAATG GTAATTAACG GTCGATATTA AAATAACTCT CATTTCAAGT 720 GGGATTAGAA CTAGTTATTA AAAAAATGTA TACTTTAAGT GATTTGATGG CATATAATTT 780 AAAGTTTTTC ATTTCATGCT AAAATTGTTA ATTATTGTAA TGTAGACTGC GACTGGAATT 840 ATTATAGTGT AAATTTATGC ATTCAGTGTA AAATTAAAGT ATTGAACTTG TCTGTTTTAG 900 AAAATACTTT ATACTTTAAT ATAGGATTTT GTCATGCGAA TTTAAATTAA TCGATATTGA 960 ACACGGAATA CCAAAATTAA AAAGGATACA CATGGCCTTC ATATGAACCG TGAACCTTTG 1020 ATAACGTGGA AGTTCAAAGA AGGTAAAGTT TAAGAATAAA CTGACAAATT AATTTCTTTT 1080 ATTTGGCCCA CTACTAAATT TGCTTTACTT TCTAACATGT CAAGTTGTGC CCTCTTAGTT 1140 GAATGATATT CATTTTTCAT CCCATAAGTT CAATTTGATT GTCATACCAC CCATGATGTT 1200 CTGAAAAATG CTTGGCCATT CACAAAGTTT ATCTTAGTTC CTATGAACTT TATAAGAAGC 1260 TTTAATTTGA CATGTTATTT ATATTAGATG ATATAATCCA TGACCCAATA GACAAGTGTA 1320 TTAATATTGT AACTTTGTAA TTGAGTGTGT CTACATCTTA TTCAATCATT TAAGGTCATT 1380 AAAATAAATT ATTTTTTGAC ATTCTAAAAC TTTAAGCAGA ATAAATAGTT TATCAATTAT 1440 TAAAAACAAA AAACGACTTA TTTATAAATC AACAAACAAT TTTAGATTGC TCCAACATAT 1500 TTTTCCAAAT TAAATGCAGA AAATGCATAA TTTTATACTT GATCTTTATA GCTTATTTTT 1560 TTTAGCCTAA CCAACGAATA TTTGTAAACT CACAACTTGA TTAAAAGGGA TTTACAACAA 1620 GATATATATA AGTAGTGACA AATCTTGATT TTAAATATTT TAATTTGGAG GTCAAAATTT 1680 TACCATAATC ATTTGTATTT ATAATTAAAT TTTAAATATC TTATTTATAC ATATCTAGTA 1740 AACTTTTAAA TATACGTATA TACAAAATAT AAAATTATTG GCGTTCATAT TAGGTCAATA 1800 AATCCTTAAC TATATCTGCC TTACCACTAG GAGAAAGTAA AAAACTCTTT ACCAAAAATA 1860 CATGTATTAT GTATACAAAA AGTCGATTAG ATTACCTAAA TAGAAATTGT ATAACGAGTA 1920 AGTAAGTAGA AATATAAAAA AACTACAATA CTAAAAAAAA TATGTTTTAC TTCAATTTCG 1980 AAACTAATGG GGTCTGAGTG AAATATTCAG AAAGGGGAGG ACTAACAAAA GGGTCATAAT 2040 GTTTTTTTAT AAAAAGCCAC TAAAATGAGG AAATCAAGAA TCAGAACATA CAAGAAGGCA 2100 GCAGCTGAAG CAAAGTACCA TAATTTAATC AATGGAAATT AATTTCAAAG TTTTATCAAA 2160 ACCCATTCGA GGATCTTTTC CATCTTTCTC ACCTAAAGTT TCTTCAGGGG TAATTTTTAC 2220 TAATTTCATG TTAATTTCAA TTATTTTTAG CCTTTGCATT TCATTTTCCA ATATATCTGG 2280 ATCATCTCCT TAGTTTTTTA TTTTATTTTT TATAATATCA AATATGGAAG AAAAATGACA 2340 CTTGTAGAGC CATATGTAAG TATCATGTGA CAAATTTGCA AGGTGGTTGA GTGTATAAAA 2400 TTCAAAAATT GAGAGATGGA GGGGGGGTGG GGGBARAGAC AATATTTAGA AAGAGTGTTC 2460 TAGGAGGTTA TGGAGGACAC GGATGAGGGG TAGAAGGTTA GTTAGGTATT TGAGTGTTGT 2520 CTGGCTTATC CTTTCATACT AGTAGTCGTG GAATTATTTG GGTAGTTTCT TGTTTTGTTA 2580 TTTGATCTTT GTTATTCTAT TTTCTGTTTC TTGTACTTCG ATTATTGTAT TATATATCTT 2640 GTCGTAGTTA TTGTTCCTCG GTAAGAATGC TCTAGCATGC TTCCTTTAGT GTTTTATCAT 2700 GCCTTCTTTA TATTCGCGTT GCTTTGAAAT GCTTTTACTT TAGCCGAGGG TCTATTAGAA 2760 ACAATCTCTC TATCTCGTAA GGTAGGGGTA AAGTCCTCAC CACACTCCAC TTGTGGGATT 2820 ACATTGTGTT TGTTGTTGTA AATCAATTAT GTATACATAA TAAGTGGATT TTTTACAACA 2880 CAAATACATG GTCAAGGGCA AAGTTCTGAA CACATAAAGG GTTCATTATA TGTCCAGGGA 2940 TATGATAAAA ATTGTTTCTT TGTGAAAGTT ATATAAGATT TGTTATGGCT TTTGCTGGAA 3000 ACATAATAAG TTATAATGCT GAGATAGCTA CTGAAGTTTG TTTTTTCTAG CCTTTTAAAT 3060 GTACCAATAA TAGATTCCGT ATCGAACGAG TATGTTTTGA TTACCTGGTC ATGATGTTTC 3120 TATTTTTTAC ATTTTTTTGG TGTTGAACTG CAATTGAAAA TGTTGTATCC TATGAGACGG 3180 ATAGTTGAGA ATGTGTTCTT TGTATGGACC TTGAGAAGCT CAAACGCTAC TCCAATAATT 3240 TCTATGAATT CAAATTCAGT TTATGGCTAC CAGTCAGTCC AGAAATTAGG ATATGCTGCA 3300 TATACTTGTT CAATTATACT GTAAAATTTC TTAAGTTCTC AAGATATCCA TGTAACCTCG 3360 AGAATTTCTT TGACAGGCTT CTAGAAATAA GATATGTTTT CCTTCTCAAC ATAGTACTGG 3420 ACTGAAGTTT GGATCTCAGG AACGGTCTTG GGATATTTCT TCCACCCCAA AATCAAGAGT 3480 TAGAAAAGAT GAAAGGGTAT GTTTGATAAT TTATATGGTT GCATGGATAG TATATAAATA 3540 GTTGGAAAAC TTCTGGACTG GTGCTCATGG CATATTTGAT CTGTGCACCG TGTGGAGATG 3600 TCAAACATGT GTTACTTCGT TCCGCCAATT TATAATACCT TAACTTGGGA AAGACAGCTC 3660 TTTACTCCTG TGGGCATTTG TTATTTGAAT TACAATCTTT ATGAGCATGG TGTTTTCACA 3720 TTATCAACTT CTTTCATGTG GTATATAACA GTTTTTAGCT CCGTTAATAC CTTTCTTCTT 3780 TTTGATATAA ACTAACTGTG GTGCATTGCT TGCBKKKATG AAGCACAGTT CAGCTATTTC 3840 CGCTGTTTTG ACCGATGACG ACAATTCGAC AATGGCACCC CTAGAGGAAG ATGTCAAGAC 3900 TGAAAATATT GGCCTCCTAA ATTTGGATCC AACTTTGGAA CCTTATCTAG ATCACTTCAG 3960 ACACAGAATG AAGAGATATG TGGATCAGAA AATGCTCATT GAAAAATATG AGGGACCCCT 4020 TGAGGAATTT GCTCAAGGTA ACAGCCAAAA GTTGTGCTTT AGGCAGTTTG ACCTTATTTT 4080 GGAAGATGAA TTGTTTATAC CTACTTTGAC TTTGCTAGAG AATTTTGCAT ACCGGGGAGT 4140 AAGTAGTGGC TCCATTTAGG TGGCACCTGG CCATTTTTTT GATCTTTTAA AAAGCTGTTT 4200 GATTGGGTCT TCAAAAAAGT AGACAAGGTT TTTGGAGAAG TGACACACCC CCGGAGTGTC 4260 AGTGGCAAAG CAAAGATTTT CACTAAGGAG ATTCAAAATA TAAAAAAAGT ATAGACATAA 4320 AGAAGCTGAG GGGATTCAAC ATGTACTATA CAAGCATCAA ATATAGTCTT AAAGCAATTT 4380 TGTAGAAATA AAGAAAGTCT TCCTTCTGTT GCTTCACAAT TTCCTTCTAT TATCATGAGT 4440 TACTCTTTCT GTTCGAAATA GCTTCCTTAA TATTAAATTC ATGATACTTT TGTTGAGATT 4500 TAGCAGTTTT TTCTTGTGTA AACTGCTCTC TTTTTTTGCA GGTTATTTAA AATTTGGATT 4560 CAACAGGGAA GATGGTTGCA TAGTCTATCG TGAATGGGCT CCTGCTGCTC AGTAGGTCCT 4620 CGTCTACTAC AAAATAGTAG TTTCCATCAT CATAACAGAT TTTCCTATTA AAGCATGATG 4680 TTGCAGCATC ATTGGCTTTC TTACATGTTC TAATTGCTAT TAAGGTTATG CTTCTAATTA 4740 ACTCATCCAC AATGCAGGGA AGCAGAAGTT ATTGGCGATT TCAATGGATG GAACGGTTCT 4800 AACCACATGA TGGAGAAGGA CCAGTTTGGT GTTTGGAGTA TTAGAATTCC TGATGTTGAC 4860 AGTAAGCCAG TCATTCCACA CAACTCCAGA GTTAAGTTTC GTTTCAAACA TGGTAATGGA 4920 GTGTGGGTAG ATCGTATCCC TGCTTGGATA AAGTATGCCA CTGCAGACGC CACAAAGTTT 4980 GCAGCACCAT ATGATGGTGT CTACTGGGAC CCACCACCTT CAGAAAGGTT TTGTTATTCA 5040 TACCTTGAAG CTGAATTTTG AACACCATCA TCACAGGCAT TTCGATTCAT GTTCTTACTA 5100 GTCTTGTTAT GTAAGACATT TTGAAATGCA AAAGTTAAAA TAATTGTGTC TTTACTAATT 5160 TGGACTTGAT CCCATACTCT TTCCCTTAAC AAAATGAGTC AATTCTATAA GTGCTTGAGA 5220 ACTTACTACT TCAGCAATTA AACAGGTACC ACTTCAAATA CCCTCGCCCT CCCAAACCCC 5280 GAGCCCCACG AATCTATGAA GCACATGTCG GCATGAGCAG CTCTGAGCCA CGTGTAAATT 5340 CGTATCGTGA GTTTGCAGAT GATGTTTTAC CTCGGATTAA GGCAAATAAC TATAATACTG 5400 TCCAGTTGAT GGCCATAATG GAACATTCTT ACTATGGATC ATTTGGATAT CATGTTACAA 5460 ACTTTTTTGC TGTGAGCAGT AGATATGGAA ACCCGGAGGA CCTAAAGTAT CTGATAGATA 5520 AAGCACATAG CTTGGGTTTA CAGGTTCTGG TGGATGTAGT TCACAGTCAT GCAAGCAATA 5580 ATGTCACTGA TGGCCTCAAT GGCTTTGATA TTGGCCAAGG TTCTCAAGAA TCCTACTTTC 5640 ATGCTGGAGA GCGAGGGTAC CATAAGTTGT GGGATAGCAG GCTGTTCAAC TATGCCAATT 5700 GGGAGGTTCT TCGTTTCCTT TTTTCCAACT TGAGGTGGTG GCTAGAAGAG TATAACTTTG 5760 ACGGATTTCG ATTTGATGGA ATAACTTCTA TGCTGTATGT TCATCATGGA ATCAATATGG 5820 GATTTACAGG AAACTATAAT GAGTATTTCA GCGAGGCTAC AGATGTTGAT GCTGTGGTCT 5880 ATTTAATGTT GGCCAATAAT CTGATTCACA AGATTTTCCC AGATGCAACT GTTATTGCCG 5940 AAGATGTTTC TGGTATGCCG GGCCTTGGCC GGCCTGTTTC TGAGGGAGGA ATTGGTTTTG 6000 TTTACCGCCT GGCAATGGCA ATCCCAGATA AGTGGATAGA TTATTTAAAG AATAAGAATG 6060 ATGAAGATTG GTCCATGAAG GAAGTAACAT CGAGTTTGAC AAATAGGAGA TATACAGAGA 6120 AGTGTATAGC ATATGCGGAG ACCCATGATC AGGTATTTTA AATTTATTTC TACAACTAAA 6180 TAATTCTCAG AACAATTGTT AGATAGAATC CAAATATATA CGTCCTGAAA GTATAAAAGT 6240 ACTTATTTTC GCCATGGGCC TTCAGAATAT TGGTAGCCGC TGAATATCAT GATAAGTTAT 6300 TTATCCAGTG ACATTTTTAT GTTCACTCCT ATTATGTCTG CTGGATACAG TCTATTGTTG 6360 GTGACAAGAC CATTGCATTT CTCCTAATGG ACAAAGAGAT GTATTCTGGC ATGTCTTGCT 6420 TGACAGATGC TTCTCCTGTT GTTGATCGAG GAATTGCGCT TCACAAGGTT TGTCTGTTTC 6480 TATTGCATTT TAAGGTTCAT ATAGGTTAGC CACGGAAAAT CTCACTCTTT GTGAGGTAAC 6540 CAGGGTTCTG ATGGATTATT CAATTTTCTC GTTTATCATT TGTTTATTCT TTTCATGCAT 6600 TGTGTTTCTT TTTCAATATC CCTCTTATTT GGAGGTAATT TTTCTCATCT ATTCACTTTT 6660 AGCTTCTAAC CACAGATGAT CCATTTTTTC ACAATGGCCT TGGGAGGAGA GGGGTACCTC 6720 AATTTCATGG GTAACGAGGT ATGTCTTACA TCTTTAGATA TTTTGTGATA ATTACAATTA 6780 GTTTGGCTTA CTTGAACAAG ATTCATTCCT CAAAATGACC TGAACTGTTG AACATCAAAG 6840 GGGTTGAAAC ATAGAGGAAA ACAACATGAT GAATGTTTCC ATTGTCTAGG GATTTCTATT 6900 ATGTTGCTGA GAACAAATGT CATCTTAAAA AAAACATTGT TTACTTTTTT GTAGTATAGA 6960 AGATTACTGT ATAGAGTTTG CAAGTGTGTC TGTTTTGGAG TAATTGTGAA ATGTTTGATG 7020 AACTTGTACA GTTTGGCCAT CCTGAGTGGA TTGACTTCCC TAGAGAGGGC AATAATTGGA 7080 GTTATGACAA ATGTAGACGC CAGTGGAACC TCGCGGATAG CGAACACTTG AGATACAAGG 7140 TTCAAGTATT TTGAATCGCA GCTTGTTAAA TAATCTAGTA ATTTTTAGAT TGCTTACTTG 7200 GAAGTCTACT TGGTTCTGGG GATGATAGCT CATTTCATCT TGTTCTACTT ATTTTCCAAC 7260 CGAATTTCTG ATTTTTGTTT CGAGATCCAA GTATTAGATT CATTTACACT TATTACCGCC 7320 TCATTTCTAC CACTAAGGCC TTGATGAGCA GCTTAAGTTG ATTCTTTGAA GCTATAGTTT 7380 CAGGCTACCA ATCCACAGCC TGCTATATTT GTTGGATACT TACCTTTTCT TTACAATGAA 7440 GTGATACTAA TTGAAATGGT CTAAATCTGA TATCTATATT TCTCCGTCTT TCCTCCCCCT 7500 CATGATGAAA TGCAGTTTAT GAATGCATTT GATAGAGCTA TGAATTCGCT CGATGAAAAG 7560 TTCTCATTCC TCGCATCAGG AAAACAGATA GTAAGCAGCA TGGATGATGA TAATAAGGTA 7620 AAATCATCTA AAGTTGAAAG TGTTGGGTTT ATGAAGTGCT TTAATTCTAT CCAAGGACAA 7680 GTAGAAACCT TTTTACCTTC CATTTCTTGA TGATGGATTT CATATTATTT AATCCAATAG 7740 CTGGTCAAAT TCGGTAATAG CTGTACTGAT TAGTTACTTC ACTTTGCAGG TTGTTGTGTT 7800 TGAACGTGGT GACCTGGTAT TTGTATTCAA CTTCCACCCA AAGAACACAT ACGAAGGGTA 7860 TATATGTTTT ACTTATCCAT GAAATTATTG CTCTGCTTGT TTTTAATGTA CTGAACAAGT 7920 TTTATGGAGA AGTAACTGAA ACAAATCATT TTCACATTGT CTAATTTAAC TCTTTTTTCT 7980 GATCCTCGCA TGACGAAAAC AGGTATAAAG TTGGATGTGA CTTGCCAGGG AAGTACAGAG 8040 TTGCACTGGA CAGTGATGCT TGGGAATTTG GTGGCCATGG AAGAGTAAGG ATTTGCTTGA 8100 ATAACTTTTG ATAATAAGAT AACAGATGTA GGGTACAGTT CTCTCACCAA AAAGAACTGT 8160 AATTGTCTCA TCCATCTTTA GTTGTATAAG ATATCCGACT GTCTGAGTTC GGAAGTGTTT 8220 GAGCCTCCTG CCCTCCCCCT GCGTTGTTTA GCTAATTCAA AAAGGAGAAA ACTGTTTATT 8280 GATGATCTTT GTCTTCATGC TGACATACAA TCTGTTCTCA TGACAGACTG GTCATGATGT 8340 TGACCATTTC ACATCACCAG AAGGAATACC TGGAGTTCCA GAAACAAATT TCAATGGTCG 8400 TCCAAATTCC TTCAAAGTGC TGTCTCCTGC GCGAACATGT GTGGTACAGT TCTTGCCGTG 8460 TGACCTCCCT TTTTATTGTG GTTTTGTTCA TAGTTATTTG AATGCGATAG AAGTTAACTA 8520 TTGATTACCG CCACAATCGC CAGTTAAGTC CTCTGAACTA CTAATTTGAA AGGTAGGAAT 8580 AGCCGTAATA AGGTCTACTT TTGGCATCTT ACTGTTACAA AACAAAAGGA TGCCAAAAAA 8640 ATTCTTCTCT ATCCTCTTTT TCCCTAAACC AGTGCATGTA GCTTGCACCT GCATAAACTT 8700 AGGTAAATGA TCAAAAATGA AGTTGATGGG AACTTAAAAC CGCCCTGAAG TAAAGCTAGG 8760 AATAGTCATA TAATGTCCAC CTTTGGTGTC TGCGCTAACA TCAACAACAA CATACCTCGT 8820 GTAGTCCCAC AAAGTGGTTT CAGGGGGAGG GTAGAGTGTA TGCAAAACTT ACTCCTATCT 8880 CAGAGGTAGA GAGGATTTTT TCAATAGACC CTTGGCTCAA GAAAAAAAGT CCAAAAAGAA 8940 GTAACAGAAG TGAAAGCAAC ATGTGTAGCT AAAGCGACCC AACTTGTTTG GGACTGAAGT 9000 AGTTGTTGTT GTTGAAACAG TGCATGTAGA TGAACACATG TCAGAAAATG GACAACACAG 9060 TTATTTTGTG CAAGTCAAAA AAATGTACTA CTATTTCTTT GTGCAGCTTT ATGTATAGAA 9120 AAGTTAAATA ACTAATGAAT TTTGCTAGCA GAAAAATAGC TTGGAGAGAA ATTTTTTATA 9180 TTGAACTAAG CTAACTATAT TCATCTTTCT TTTTGCTTCT TCTTCTCCTT GTTTGTGAAG 9240 GCTTATTACA GAGTTGATGA ACGCATGTCA GAAACTGAAG ATTACCAGAC AGACATTTGT 9300 AGTGAGCTAC TACCAACAGC CAATATCGAG GAGAGTGACG AGAAACTTAA AGATTCGTTA 9360 TCTACAAATA TCAGTAACAT TGACGAACGC ATGTCAGAAA CTGAAGTTTA CCAGACAGAC 9420 ATTTCTAGTG AGCTACTACC AACAGCCAAT ATTGAGGAGA GTGACGAGAA ACTTAAAGAT 9480 TCGTTATCTA CAAATATCAG TAACATTGAT CAGACTGTTG TAGTTTCTGT TGAGGAGAGA 9540 GACAAGGAAC TTAAAGATTC ACCGTCTGTA AGCATCATTA GTGATGTTGT TCCAGCTGAA 9600 TGGGATGATT CAGATGCAAA CGTCTGGGGT GAGGACTAGT CAGATGATTG ATCGACCCTT 9660 CTACCGATTG GTGATCGCTA TCCTTGCTCT CTGACAAATA GGTGAGGCGA AACAAAAAAT 9720 AATTTGCATG ATAAAAAGTC TGATTTTATG ATCGCTATCC TCGCTCTCTG AGAAAGAAGC 9780 GAAACAAAGG CGACTCCTGG ACTCGAATCT ATAAGATAAC AAAGGCGACT CCTGGGACTC 9840 GAATCTATAA GATAACAAAG GCAATTCCAA GACTTGAATC TATAAAAAAT TTAGTTAAGA 9900 ATGATTAACG TCCGATCCTA ATTCGAATCG AGGCATCTTA CCACTCCATT GATAATTATA 9960 TAAGTCAATA AGTCATATAA WAGTATTAAA AACTAAATTG ACTTGATCGG TCTATCAAAA 10020 ATMAGATMAA ATTGTGTTCA TATGTAACAT TTTTGTTGTC ACAATTAGCT TAATTACATC 10080 TTTCATGTGC AATAACAAAG AAATGATAGG AATTTAGAGA TTCCAATTTT TTTGTTGCCA 10140 CAATTAACTT AATTACATCT TTCATTTGCA ATAACAAAGA AATGATAGGA ATTTAGAGAT 10200 CCAGTGTCAA TACACAACCT AGGCCAACAT CGAAAGCATA ACTGTAAACT CATGCATGAA 10260 GAAATCAGTC GTAAAAATGA ATAAATGCGA CATAAAAACA AATTGCATGT ATCATTAATG 10320 TGACTTAACT ACAAGTAAAA ATAAATTTAA CAAATGTAAC TTAACTACAA GTAAAAATAA 10380 ATTGCTTCTA TCATTAACAA ACAAACAGAA TTAAAAAGAA AAAAACATAC TAAATCTTAC 10440 CGTCATTCGA TAAAAAAAAA TACCAAATTC ATAATGCAAG GAAAACGAAA CGCGTCCTGA 10500 TCGGGTATCA ACGATGAAAT GGACCAGTTG GATCGACTGC CTGCACAACG TTAGGTATGC 10560 CAAAAAAAAG AACACGATCC TTTGCACCCG TTCGATGATT ATCAGTATGT TCACAAAAAA 10620 AACTTAAGTT CATCCCAGTG TACAACAGCC CCAACATCTG CCCCAAGTAA CAAAAAACAA 10680 CCAATTTATC TTATTCTTAT CTGCCACAAA ATAATCGGTT TCACACTATT CTCTTGTTAT 10740 ACAAAATTGA CAAGTAGGAA GGAGAGGAGT CATCCAAATA AACGGTGCAC GTTCTTTGAG 10800 AAAAGTCTTA TTTTTCGTAA GATCCAATTT CAACAAACTT TTCTTCAAGT CAAAATTCCT 10860 GATAGTGTAT CTCCTCTCGA CGACCTCTTG CATTGAACGA TCTCCGCTTA TCATGAAAAG 10920 TTGCTTGGAT AACAAGTATT GCAAGGGGGG GACAGTAGCT ATTAAGTTAG TCGGCCCAAG 10980 GAAATGGAGG AGTGATAGTC TCGAATATTA TTCACCTCTT TAGCATTACC CGGTCTGGCT 11040 TTAAGGAGTT ACGTCTTTTA CGCTCGCCAA TTTCTTTTTT TAGAATGGTT GGTGTCAAAA 11100 TCGCGAGTTG TGGAAGGTTC AAGTTACTCG ATTCGTGATT TTCAAGTATG AGTGGTGAGA 11160 GAGATTCGAT ATTTTCACGA GGTGTATTCG AGGTCTAGTA GAACGAAGGG TGTCACTAAT 11220 GAAAGTTTCA AGAGTTCATC ATCATCTTCT TCTAGTAGAT TTTCGCTTTC AAATGAGTAT 11280 GAAAATTCTT CCTCTTTTCT ATTGATTTTC TTCATTGTTT TCTTCATTGT TGTGGTTGTT 11340 ATTGAAAAGA AAGAAAATTT ATAACAGAAA AAGATGTCAA AAAAAAGGTA AAATGAAAGA 11400 GTATCATATA CTTAAAGAGT TGCGTAGAGA TAAGTCAAAA GAAACAGAAT TATAGTAATT 11460 TCAGCTAAGT TAGAATTC 11478