首页 / 用于使多种逆转录病毒毒株中的不对称靶位点重组的修整重组酶

用于使多种逆转录病毒毒株中的不对称靶位点重组的修整重组酶无效专利 发明

技术内容

用于使多种逆转录病毒毒株中的不对称靶位点重组的修整 重组酶 [0001] 本发明涉及用于制备编码修整重组酶(tailored recombinase)的表达载体的方 法,所述修整重组酶能够使可插入宿主细胞基因组中的多种逆转录病毒毒株的原病毒DNA 的长末端重复序列(LTR)内的不对称靶序列重组,以及涉及所获得的表达载体、用所述表 达载体转染的细胞、表达的重组酶和包含所述表达载体、细胞和/或重组酶的药物组合物。 药物组合物可用于例如治疗和/或预防逆转录病毒感染。特别地,公开了存在于多种HIV-1 毒株中的不对称靶序列,以及能够使这些序列重组的修整重组酶(Tre 3.0和4.0)和编码 所述修整重组酶的表达载体。 技术背景 [0002] 逆转录病毒感染例如被人免疫缺陷病毒(HIV)感染仍是最重要和最普遍的人类 疾病之一。 [0003] 治疗逆转录病毒(例如HIV)的一种方法是靶向插入宿主细胞基因组中的原病毒。 将原病毒DNA从宿主基因组上切除可防止例如HIV进一步复制,而且不同于现有方法,因为 它具有根除甚至是存在于宿主基因组中的潜伏病毒的潜力。 [0004] 考虑用于这种备选方法的一类蛋白质是位点特异性重组酶(Flowers等,1997)。 位点特异性重组酶事实上介导从基因重排到基因组分离的许多功能,例如限定DNA单位的 切除、倒位或整合(有关综述参见Stark等,1992)。 [0005] 最简单和最被了解的重组酶之一是来自噬菌体P1的Cre重组酶,其通过特定序列 的两个相同的双链DNA位点之间的重组使基因组二聚体解离成单体(Hoess和Abremski, 1985)。Cre重组酶已广泛用于小鼠遗传学(NAGY,2000)。Cre是以其功能命名的38 kDa 蛋白质,因为它引起重组(causes recombination) (Sternberg和Hamilton,1981)。这种 重组的先决条件是在反向平行方向上由Cre识别的两个重组位点的排列,所述重组位点随 后被连接构成环的4个相同的Cre亚基结合,其中每个亚基接触2个邻近亚基和一个重组 位点的一半位点(Hoess和Abremski,1985)。被Cre识别的重组位点是称为loxP (出自 locus of crossing over (x),P1 (交换(x)的基因座P1);Sternberg和Hamilton,1981) 的34-bp双链DNA序列,除了其8个最里面的碱基对(称为间隔区)外,它是回文的,所述 8个最里面的碱基对赋予位点方向性。 [0006] 一些位点特异性重组系统包括Cre/loxP系统,无需辅助蛋白质或辅因子而发挥 作用,并且在广泛多样的细胞条件下发挥作用。然而,因为位点特异性重组酶通过重组酶亚基与其关联DNA靶序列的特定相互作用而发挥作用,所以这些酶的使用受以下必要条件的 限制:被靶向的DNA区域必须含有适当定位的靶位点(LEWANDOSKI,2001)。迄今为止,尚未鉴定识别天然逆转录病毒序列作为其DNA靶序列的野生型重组酶。 [0007] 近年来已进行了大量的位点特异性重组酶的突变和结构分析,以改变其性质,并 实现对这些酶的复杂机制的更好理解(有关综述参见van Duyne,2001;以及Coates等, 2005)。许多研究集中于Cre重组酶以探究其可进化性(evolvability)。几项研究证实, 当Cre在其loxP识别位点中的少数核苷酸改变时,Cre靶向特异性可被改变(BUCHHOLZ和 STEWART,2001;SANTORO和SCHULTZ,2002;RUFER和SAUER,2002)。进一步的研究致力于工程改造含有来自HIV-1 LTR的序列的突变loxP靶位点,以开发可能的靶位点用于使用Cre 作为抗病毒策略(Lee和Park,1998;Lee等,2000)。 [0008] 定向进化的方法是选择其特异性发生改变的酶的有力方法(有关综述参见Yuan 等,2005;以及Johannes和Zhao,2006)。最初,在RNA的基础上,通过选择其底物位点发生改变的RNA分子,而采用这种方法来分离改进的酶。基于PCR的方法的使用允许筛选非常 大的文库,和从候选物库中回收成功的编码区。相比之下,在蛋白质的定向进化中,通过蛋白质性质的改变鉴定的改进的突变体的筛选和回收,需要用于寻找编码该蛋白质的核酸序 列的方法。通常通过区室化维持蛋白质及其编码序列之间的关联。因此,定向蛋白质进化 中的文库筛选限于维持区室的“逐一(one-by-one)”方法,而且尚无与筛选候选物库有关的优势。 [0009] 通过开发使用mRNA-蛋白质融合物和核糖体展示,允许蛋白质与其对应的信 使RNA (mRNA)交联的方法,克服了这种局限性。因此将改进的蛋白质性质的功能筛 选与相应编码分子的直接寻找相联系,并且大的库已在体外进行了筛选(参见例如 Buchholz等,1998)。定向蛋白质进化的进一步改进通过所谓的底物关联的蛋白质进化 (substrate-linked protein evolution,SLiPE;Buchholz和Stewart,2001)而实现,其中将重组酶的底物置于与蛋白质编码区相同的DNA分子上。以这种方式,当重组酶在区室内 表达时,它的作用改变与其自身编码区邻接的DNA底物。因此,可通过只扩增邻接经改变的底物的候选编码区的PCR将文库筛选为库。这允许合宜地筛选大的文库,用于快速寻找成 功的编码区。应用这种方法以改变Cre重组酶的DNA特异性,并且使其适应新的识别靶位 点(Buchholz和Stewart,2001)。 [0010] 鉴于位点特异性重组酶的潜力和找出从宿主细胞基因组中根除HIV-1原病毒的 AIDS疗法的需要,WO 2008/083931公开了修整重组酶(TRE)的产生,所述修整重组酶能够 使插入宿主细胞基因组中的逆转录病毒的原病毒DNA的LTR内的不对称靶位点重组,因此 从宿主细胞基因组中切除原病毒。公开于其实施例中的工程改造的重组酶Tre,识别存在于特定HIV-1毒株中的特异性loxP样位点。WO 2008/083931认为,对于带有不同HIV毒株的 患者的治疗,由于逆转录病毒特别是HIV的高序列变异性,可能不得不改变不同的修整重 组酶,或制备含有对各种靶序列有特异性的修整重组酶的一批重组酶。 [0011] 鉴于此,本发明人目前克服了提供能够切除多种逆转录病毒(例如HIV)毒株的修 整重组酶的问题。因此,在不需要产生针对每种毒株的新的重组酶的情况下,可将所产生的重组酶应用于多种HIV感染。本发明解决了这个问题。 [0012] 发明描述 本发明人首次提供用于产生编码修整重组酶的表达载体的方法,所述修整重组酶能够 使插入宿主细胞基因组中的一种病毒种的多种逆转录病毒毒株的原病毒DNA的LTR内的不 对称靶序列重组。通过将底物分解成与原始靶标具有较小差别的许多新的亚组,并逐步修 整重组酶以识别这些亚组,而对重组酶进行修整以识别不同于其天然对称靶位点的不对称 靶位点(WO 2008/083931)。组合方法允许选择识别给定序列内的不对称靶位点的功能分 子。因此,采用在定向分子进化期间穿过底物中间体的方法,可能产生具有远缘的新的不对称靶特异性的酶。本发明利用针对提供能够使多种逆转录病毒毒株、优选来自一种病毒种 的毒株重组的修整重组酶的问题的这种方法。他们发现尽管逆转录病毒的高序列变异性, 但可能鉴定存在于高比例的特定亚型病毒中的不对称靶序列。 [0013] 本发明提供用于制备编码修整重组酶的表达载体的方法,所述修整重组酶能够使 可插入宿主细胞基因组中的多种逆转录病毒毒株的原病毒DNA的LTR内的不对称靶序列重 组,所述方法包括以下步骤:在多种逆转录病毒毒株的原病毒DNA的LTR的序列中鉴定与至 少一个已知重组酶靶位点的左半位点序列和右半位点序列有至少30%同源性的序列,其中 同源序列被5-12个核苷酸的间隔区分隔开,且其中不对称靶序列存在于多种逆转录病毒 毒株中;以及通过以下重复步骤产生直到获得对逆转录病毒DNA的LTR内的不对称靶序列 有活性的至少一种重组酶: i)使用修饰的靶序列作为底物对识别已知同源靶位点的至少一种重组酶进行分子定 向进化,所述修饰的靶序列基于不对称靶序列的序列,但经修饰以仅含有区别于所述已知 靶序列的有限数目的变异;其中,在每一轮中,靶序列在其1、2或3个核苷酸上可不同于已知重组酶对之起作用的靶序列;和 ii) 改组重组酶文库,以得到能够使与不对称靶序列更同源的靶序列重组的重组酶文 库; 分离所得到的至少一种重组酶的核酸;以及将编码该重组酶的核酸克隆至合适的表达 载体中。 [0014] 公开于WO 2008/083931的产生修整重组酶的方法可用来产生能够使不对称靶序 列重组的修整重组酶。 [0015] 本发明还提供用于制备编码修整重组酶的表达载体的方法,所述修整重组酶能够 使可插入宿主细胞基因组中的多种逆转录病毒毒株的原病毒DNA的LTR内的不对称靶序列 重组,所述方法包括以下步骤: (a) 在多种逆转录病毒毒株的原病毒DNA的LTR的序列中鉴定与至少一个已知重组酶 靶位点的左半位点序列和右半位点序列有至少30%同源性的序列,其中同源序列被5-12个 核苷酸的间隔区分隔开,且其中不对称靶序列存在于多种逆转录病毒毒株中; (b) 鉴定两种序列,其中第一序列相当于与所述已知靶位点的左半位点同源的步骤 (a)的不对称靶序列的序列,并称为“半位点序列1”,且其中第二序列相当于与右半位点同源的步骤(a)的不对称靶序列的序列,并称为“半位点序列2”; (c) 测定步骤(b)的序列内偏离步骤(a)的已知同源靶位点的相应同源左半位点和右 半位点序列的核苷酸; (d) 产生包含靶序列的两种靶核酸的第一亚组,其中第一靶序列称为亚位点 (subsite) 1,包含彼此邻接且按5'至3'顺序的步骤(b)的半位点序列1、不对称靶序列的 间隔区序列和半位点序列1的反向重复序列,且其中第二靶序列称为亚位点2,包含彼此邻 接且按5'至3'顺序的半位点序列2的反向重复序列、不对称靶序列的间隔区序列和步骤 (b)的半位点序列2; (e) 在步骤(d)的第一亚组中的靶序列的基础上,产生包含修饰靶序列的靶核酸的第 二亚组, 其中,在基于亚位点1的序列中,在左半位点序列中,偏离步骤(a)的至少一个已知靶 位点的相应同源半位点序列的核苷酸的一部分被存在于所述已知靶位点上的天然核苷酸 置换,直到所述半位点序列含有1、2或3个偏离所述已知靶位点的核苷酸,其中所述修饰靶序列的右半位点通过所述修饰左半位点序列的反向重复而形成,其通过不对称靶序列的间 隔区序列而与所述修饰左半位点序列分隔开,和 其中,在基于亚位点2的序列中,在右半位点序列中,偏离步骤(a)的至少一个已知靶 位点的相应同源半位点序列的核苷酸的一部分被存在于所述已知靶位点上的天然核苷酸 置换,直到所述半位点序列含有1、2或3个偏离所述已知靶位点的核苷酸,其中所述修饰靶序列的左半位点通过所述修饰右半位点序列的反向重复而形成,其通过不对称靶序列的间 隔区序列与所述修饰右半位点序列分隔开, 使得合起来看,在来源于步骤(d)的第一亚组的一种靶序列的所有修饰半位点序列 中,可找出所有偏离的核苷酸,但是所述修饰半位点序列无一单独包含所有的偏离核苷酸,(f) 使用步骤(e)中获得的第二亚组的每种核酸作为底物,分别将分子定向进化应用 于识别步骤(a)的已知同源靶位点的至少一种重组酶; (g) 改组步骤(f)中进化的重组酶文库,其中将在基于亚位点1的序列上进化的所有 重组酶文库组合并改组,且其中将在基于亚位点2的序列上进化的所有重组酶文库组合并 改组; (h) 使用步骤(d)的亚组的每种核酸作为底物,将分子定向进化应用于步骤(g)中所 获得的改组文库; (i) 改组在步骤(h)中进化的重组酶文库; (j) 使用包含步骤(a)的不对称靶序列的核酸作为底物,将分子定向进化应用于步骤 (g)中所获得的改组文库,直到获得对步骤(a)的逆转录病毒DNA的LTR内的不对称靶序列 有活性的至少一种重组酶; (k) 从文库中分离在步骤(j)中获得的至少一种重组酶的核酸;和 (l) 将步骤(k)中获得的核酸克隆到合适的表达载体中。 [0016] 在本发明方法的步骤(a)中,可通过例如使用链终止抑制剂(chain-terminating inhibitor)的DNA测序,来测定原病毒DNA的LTR序列(Sanger等,1977)。然而,如果已测 定插入宿主基因组中的逆转录病毒DNA的LTR序列,则可参照数据库来确定该序列。以序 列信息为基础,进行序列信息的基于计算机的分析,以鉴定其中分别与已知重组酶的已知 靶位点的左半位点和右半位点序列有至少30%同源性的序列,所述序列被合适的5-12个核 苷酸的间隔区分隔开,其中不对称靶序列存在于多种逆转录病毒毒株中。优选与已知靶位 点的左半位点和右半位点序列的同源性为至少40%或至少50%。优选这些逆转录病毒毒株 是一种病毒种或其一种亚型的毒株。优选多种毒株包含超过10种毒株、更优选超过100种 毒株、超过130种毒株、超过200种毒株或超过300种毒株,例如HIV毒株。毒株可来自病 毒的一种亚型,例如HIV-1、HIV-1 A和B亚型或HIV-1 B亚型。因此,所获得的重组酶或编 码所述重组酶的表达载体可用于治疗多种毒株感染,例如逆转录病毒或其亚型的超过50%、超过70%、超过80%、超过90%或所有已知毒株。 [0017] 本文所用术语“重组酶”是指涉及重组的蛋白质。就此而言,重组酶识别和结合称为“重组位点”或“靶位点”的两个特定DNA序列,并且介导这两个靶位点间的重组。因此,术语“重组酶”欲指介导在特定DNA基因座中DNA重排的任何重组系统的任何蛋白质组分。 天然存在的重组酶识别由两个相同序列组成的对称靶位点,所述相同序列称为“半位点”,具有约9-20 bp,构成反向重复,其中半位点序列被5-12 bp的间隔区序列分隔开来。来自 酪氨酸整合酶家族的重组酶的特征在于具有酪氨酸作为用于DNA切割的活性位点亲核体, 而来自丝氨酸整合酶家族的重组酶利用丝氨酸而不是酪氨酸。 [0018] 在本发明的一个实施方案中,其靶序列用于步骤(a)和在步骤(h)和(j)中对其 应用分子定向进化的至少一种已知重组酶属于丝氨酸整合酶家族。属于丝氨酸整合酶家族 的优选重组酶选自phiC31整合酶(Combes等,2002)、Gin或Hin重组系统的任何组分、Tn3 解离酶(Krasnow和Cozzarelli,1983)或大的丝氨酸重组酶的任何其它成员、VDJ重组系 统的Rag1、Rag2或任何其它组分或其变体。 [0019] 在另一个实施方案中,所述重组酶属于酪氨酸整合酶家族。属于酪氨酸整合酶家 族的优选重组酶选自来自噬菌体P1的Cre (Abremski等,1983,1984)、来自酵母的FLP重 组酶(Volkert和Broach,1986)、来自噬菌体D6的Dre (Sauer & McDermott,2004)、来自 鲁氏接合糖酵母(Zygosaccharomyces rouxii)质粒pSR1的R重组酶、来自果蝇克鲁维氏 酵母(Kluveromyces drosophilarium)质粒pKD1的A重组酶、来自Kluveromyces waltii 质粒pKW1的重组酶、来自芽孢杆菌属(Bacillus)转座子Tn4430的TnpI、λInt重组系统 的任何组分或其变体。优选所述重组酶为Cre重组酶或其变体。例如可以使用公开于WO 2008/083931的修整重组酶(Tre)。 [0020] 在这种情况下,术语变体是指这样的蛋白质,其通过氨基酸的缺失、取代和/或添加而衍生自上述蛋白质,并且保持它们自其中衍生的蛋白质的一些或全部固有功能。 [0021] 在一个优选的实施方案中,已知重组酶是通过例如Crameri等(1998)描述的“家 族改组”而获得的嵌合重组酶。使用家族改组的先决条件是用于产生嵌合重组酶的重组酶 之间的显著同源性。可用于本发明的嵌合重组酶的一个实例是分别由重组酶Cre的序列和 重组酶Dre的序列组成的嵌合重组酶。 [0022] 在一个更优选的实施方案中,重组酶是识别称为loxP (SEQ ID NO:3)的34 bp的 对称靶位点的Cre重组酶。loxP位点(及野生型重组酶的其它重组位点)是具有被8个最 里面的碱基对分隔开的2个13 bp重复序列的回文序列,所述8个最里面的碱基对代表赋 予该位点方向性的所谓的间隔区。重组通过间隔区序列内切割而发生。根据2个参与loxP 位点的相对位置和取向,Cre催化DNA整合、切除或重排(Hoess和Abremski,1985)。 [0023] 一种有用的重组酶是自肠道沙门氏菌(Salmonella enterica)分离的Zre (SEQ ID NO:26)或其例如与野生型序列有至少约70%、至少约80%、至少约90%或至少约95%同源 性且具有重组酶功能的变体、片段和同源物。Zre重组酶使DNA在zox位点上重组(图1)。 它们可用于单独或在文库的情况下开始本发明的方法。 [0024] 在一个实施方案中,重组酶文库用作分子进化的起始点,例如包含不同的野生型 和/或改动/改组的重组酶的重组酶文库,例如如下文或实施例2中描述的。这类文库优 选用作用于产生能够识别SEQ ID NO:1和SEQ ID NO:2的修整重组酶的起始点。 [0025] 修整重组酶能够使多种逆转录病毒毒株的原病毒DNA的LTR内的不对称靶序列 重组。被重组酶靶定的原病毒DNA可插入宿主细胞的基因组中。或者,本发明的修整重组 酶可使多种逆转录病毒毒株的原病毒DNA的LTR内的不对称靶序列重组,所述不对称靶序 列(尚)未整合到宿主细胞基因组中,即其作为未整合的整合前复合体(pre-integration complex, PIC)存在。因此尚未整合到宿主细胞基因组中的HIV以及已经整合的HIV可通 过本发明的修整重组酶钝化。 [0026] 在本发明中以及在本领域中要注意的是,术语“靶序列”、“靶位点”和“重组位点”可互换使用。 [0027] 与识别对称靶位点的天然存在的重组酶相反,本发明的方法提供识别靶位点的修 整重组酶,其并非由被间隔区分隔开的回文序列组成。相反,在不对称靶位点中,该序列不构成对称的反向重复序列。因此,能够识别不对称靶位点的修整重组酶应识别并且使由变 化序列的半位点组成的靶位点重组。 [0028] 在不对称靶位点内,分别称为“左半位点”和“右半位点”的序列,通过其与已知靶位点的左半位点和右半位点的同源性界定。位于与已知靶位点的左半位点和右半位点同源 的序列间的序列称为间隔区。 [0029] 然而,如果序列存在于只与已知靶位点的左半位点或右半位点序列具有同源性的 LTR中,则这些序列仍可用于实施本发明。属于重组酶的靶位点的大小为技术人员所知,所述重组酶的天然靶序列与LTR内的序列具有同源性。例如,如果与被Cre重组酶识别的靶 序列的同源性存在于LTR序列内,则被Cre重组酶识别的不对称靶位点可由34个核苷酸组 成,其具有两个13个核苷酸的半位点序列,各被8个核苷酸的间隔区分隔开。因此,LTR内 的同源序列定义为不对称靶位点的左半位点或右半位点或间隔区,这取决于与已知靶位点 的序列的同源性。因此,与已知靶序列的左半位点具有同源性的序列定义为左半位点,与已知靶序列的右半位点具有同源性的序列定义为右半位点。从这个定义开始,在考虑已知靶 位点的结构的情况下,定义不对称靶位点的其它部分。因此,如果就与loxP位点(被Cre 重组酶识别)的同源性,在定义了例如LTR内右半位点序列后,则可容易地定义相当于不对 称靶序列的间隔区和左半位点的其它序列。例如间隔区序列通过计数定义为右半位点序列 的序列5'端上游的8个核苷酸来定义,而左半位点序列通过计数先前定义的间隔区序列5' 端上游的13个核苷酸来类似地定义。 [0030] 同源性在这种情况下以及在整个申请中意指序列同一性。用于同源性目的的优 选比较是采用本领域已知的标准技术对至少2个序列进行比较,包括但不限于Smith和 Waterman (1981)的局部同源性算法、Needleman和Wunsch (1970)的同源性比对算法或 Pearson和Lipman (1988)的搜索相似性方法。对于本申请的目的,序列同源性优选采用可 获自欧洲生物信息学会(European Bioinformatics Institute (EBI))的ClustalW计算 机程序测定,除非另有说明。 [0031] 鉴于原病毒基因组必须存在2个相同靶位点以允许重组酶切除这两个靶位点之 间的序列的必要条件,在本发明方法的步骤(a)中扫描在基因组中至少出现2次的原病毒 DNA序列。这类序列是例如原病毒DNA的LTR序列。因此优选扫描LTR序列,因为原病毒 DNA的5'-LTR和3'-LTR是相同的。5'-LTR中存在的不对称靶位点也存在于3'-LTR中,且 因此允许切除位于LTR之间的原病毒DNA。 [0032] 在LTR序列内鉴定的与已知靶位点具有足够同源性的序列中,优选选择与已知重 组酶的靶位点的序列具有最高同源性的序列。然而,也可能选择具有最高同源性的序列以 外的序列,例如在最大数目的逆转录病毒毒株中,或在目标逆转录病毒毒株中存在的序列,例如,如果患者被特定毒株感染。 [0033] 要注意的是,本发明方法的潜力甚至允许修整识别与已知靶位点的同源性小于 30%、例如至少11%或至少20%同源性的不对称靶位点的重组酶。然而,为了确保各个不对 称靶位点的残余重组活性的存在,优选扫描与已知重组酶的已知靶位点的左半位点和右半 位点序列具有至少30%同源性的序列。在其它优选的实施方案中,选择与已知重组酶的已 知靶位点的左半位点和右半位点序列具有至少31、32、33、34、35、36、37、38、39、40、41、42、 43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、 68、69、70、71、72、73、74、75、76、77、78、79、80%同源性、更优选85%、特别优选90%和最优选 95%同源性的不对称靶序列。 [0034] 在本发明的一个实施方案中,在LTR内选择的序列与被位点特异性重组酶Cre识 别的对称loxP靶位点具有同源性。 [0035] 在一个实施方案中,重组酶文库用作分子进化的起始点,例如,包含不同的野生型和/或改动/改组重组酶的重组酶文库,例如实施例2中描述的文库。示例性文库包含Cre 和由其衍生的重组酶。它还可包含Tre、Dre、来自沙门氏菌属(Salmonella)和希瓦氏菌属 (Shewanella)的重组酶和/或由其衍生的重组酶。文库可包含例如Cre、Dre、Dre “Cre-ed” (SEQ ID NO: 24)、希瓦氏菌属重组酶(Shew)、Shew “Cre-ed” (SEQ ID NO:25)和/或Zre (SEQ ID NO:26)。图3A中描述了一种文库。Tre是WO 2008/083931所公开的修整重组酶, 其亦称为Tre 1.0。 [0036] 在一个实施方案中,文库中所有的重组酶都识别具有相同间隔区长度的靶序列。 包括间隔区在内的半位点序列1和2的总长度优选为34个核苷酸。 [0037] 如果至少一种重组酶是重组酶文库,则同源性是与已知重组酶靶位点库的同源性 (即在给定位置上与至少一种靶序列的同源性定义为同源性)。因此,在步骤(c)中,仅与 至少一种已知靶序列上的核苷酸不一致的那些核苷酸定义为偏离核苷酸。就重组酶文库而 言,步骤(e)中的“天然核苷酸”可以是在任何已知靶序列的该位置上存在的核苷酸,优选为在几个或大多数已知靶序列上的该位置上存在的核苷酸。 [0038] 为了鉴定在多种逆转录病毒毒株中存在的靶序列,文献中已有描述的重组酶的已 知识别位点,可用作针对基因组序列段对保守不对称靶序列进行搜索的查询位点(query)。 考虑到区域的重复性质,标准序列相似性搜索工具的使用无论如何都行不通。Sarkar等人 (2007)采用BLAST (ALTSCHUL等,1997)跨HIV毒株以寻找lox样结合位点。当跨HIV-1 LTR序列进行时,BLAST搜索lox样位点导致发现了存在于单个毒株的唯一一个位点。然而,如果重组酶用作针对逆转录病毒基因组的治疗剂,则关键的是对重组酶进行改造以靶向跨 越尽可能多的逆转录病毒毒株而存在的识别位点。 [0039] 由于对于这类短的丰余序列无法良好地执行BLAST,因此考虑应用HMMER (EDDY 等,1998)、RepeatMasker或Emboss软件套装的回文程序。HMMER被开发来根据待查找的 序列模式的概率模型查寻远缘同源物,这并非意欲执行的搜索的性质。HMMER可被强制执 行以解决这种搜索问题,但是数据和参数的处理前和处理后的量可使之极易出错和低效。 RepeatMasker只搜索已充分表征的重复序列和低复杂性区,这同样并非这种搜索的性质。 Emboss回文程序与解决搜索问题最接近,但不允许搜索被限定,相反地导致一系列lox样 位点的可能性。因此这些应须与目标lox-位点签名(signature)匹配。显然,该策略只能 使搜索复杂化和繁重。为了解决寻找lox样位点的程序和方法的缺乏,不得不开发能够搜 索基因组序列中的简并lox样位点的程序。 [0040] 可应用以基于重组酶的已知识别位点的侧翼区的位置权矩阵为基础的算法,根据 该程序来鉴定存在于多种逆转录病毒毒株中的不对称靶序列。优选为了使搜索是计算有效 的,在把序列转化成位串后,对其采用二进制运算。 [0041] 在一个优选的本发明的实施方案中,逆转录病毒是HIV,特别是HIV-1。对于 HIV-1,测定了合适的不对称靶序列,其具有以下SEQ ID NO:1或SEQ ID NO:2所示的序列。 [0042] 左半位点和右半位点序列加下划线,间隔区用黑体字印制: SEQ ID NO:1 AACCCACTGCTTAAGCCTCAATAAAGCTTGCCTT SEQ ID NO:2 CTGGGCGGGACTGGGGAGTGGCGAGCCCTCAGAT SEQ ID NO:1在所搜索的HIV-1 B亚型毒株的92% (348/379)中相同,在所搜索的 HIV-1 A亚型毒株的80% (32/40)中相同。SEQ ID NO:2在所搜索的B亚型毒株的76% (288/379)中相同。82%的C亚型毒株也包含该序列。SEQ ID NO:2不存在于任何所搜索的 A亚型毒株中。 [0043] 如图1所示,SEQ ID NO:1与已知重组酶靶位点库具有54%同源性,SEQ ID NO:2 与这些序列的库具有42%同源性(分别就左半位点和右半位点而言)。与单个已知靶位点 的同源性较低,例如对于SEQ ID NO:1至少30%,对于SEQ ID NO:2至少11%。特别就与已 知靶位点低的个别同源性而言,可能有利的是使用重组酶文库作为起始原料,用于例如产 生能够使SEQ ID NO:1或SEQ ID NO:2重组的修整重组酶,文库包含Cre、Fre、Dre、Zre和 Tre。 [0044] 在本发明方法的步骤(b)中,与已知靶位点的左半位点同源的原病毒LTR内不对 称靶位点的序列定义为“半位点序列1”。与已知靶位点的右半位点同源的原病毒LTR内不 对称靶位点的序列定义为半位点序列2。表示左半位点和右半位点的序列之间的序列称为 间隔区。 [0045] 在步骤(c)中,偏离已知靶标的相应的同源左半位点和右半位点序列的序列的步 骤(b)序列的“半位点序列1”和“半位点序列2”中的核苷酸分别通过序列比对和序列比 较进行测定。在这种情况下,将“半位点序列1”的序列与相应的天然半位点进行比较,其优选为左半位点序列,而将“半位点序列2”的序列与构成回文天然靶位点的另一半位点进行比较,其优选为右半位点序列。 [0046] 图1表示与重组酶文库进行比较的SEQ ID NO:1和2的这种比较的结果。偏离核 苷酸在黑色背景前显示。 [0047] 这种比较不一定在本发明方法的步骤(b)之后和步骤(d)之前进行,而也可在步 骤(a)之后和步骤(e)之前的所述方法的不同阶段进行。 [0048] 在步骤(d)中,产生包含靶序列的2种靶核酸的第一亚组,其中第一靶序列称为亚 位点1,包含彼此邻接且按5'至3'顺序的步骤(b)的半位点序列1、不对称靶序列的间隔 区序列和半位点序列1的反向重复序列,且其中第二靶序列称为亚位点2,包含彼此邻接且 按5'至3'顺序的半位点序列2的反向重复序列、不对称靶序列的间隔区序列和步骤(b) 的半位点序列2。第一亚组的靶序列是具有对称靶位点结构的回文寡核苷酸序列。这些人 工对称靶位点是以步骤(b)的半位点序列为基础,通过补充各寡核苷酸序列中缺失的半位 点序列作为反向重复序列来合成,其中“半位点序列1”和“半位点序列2”的序列分别用来在间隔区序列的相对端处补充第二半位点序列。因此,第一亚组的第一靶序列(称为“亚位点1”)包含由被间隔区序列分隔开的“半位点序列1”和反向重复的“半位点序列1'”组成的反向重复序列,而第一亚组的第二靶序列(称为“亚位点2”)包含由被间隔区序列分隔 开的反向重复的“半位点序列2'”和“半位点序列2”组成的反向重复序列。在“亚位点1”中,序列如下排列:5'-“半位点序列1”-间隔区-“半位点序列1'的反向重复序列”-3',在“亚位点2”中,序列如下排列:5'-“半位点序列2'的反向重复序列”-间隔区-“半位 点序列2”-3'。 [0049] 第一亚组的每2个合成靶序列内的间隔区序列优选是相同的,并对应于代表或定 义为不对称靶位点的间隔区序列的LTR序列。然而,在进一步的实施方案中,间隔区序列可包含来源于核苷酸取代的一个或两个序列偏离。 [0050] 一般而言,这个步骤代表被选择用于修整特定重组酶的不对称靶位点的序列的第 一次分解(参见WO 2008/083931的图1,其通过引用全部结合到本文中,以及本申请的图 2)。在这个步骤中产生具有衍生自不对称靶位点的半位点的对称靶位点的序列,所述不对 称靶位点被选择用于修整特定重组酶。因此,在所述不对称靶位点的一个半位点中存在的 每个突变(即与被野生型重组酶识别的靶位点的不同)现已分散到第一亚组中的对称靶序 列之间。 [0051] 在本发明方法的步骤(e)中,在步骤(d)的第一亚组的靶序列基础上产生包含修 饰靶序列的靶核酸的第二亚组。在基于亚位点1的序列中,在左半位点序列中,偏离步骤 (a)的至少一个已知靶位点的相应的同源半位点序列的核苷酸的一部分被存在于所述已知 靶位点上的天然核苷酸置换,直到所述半位点序列含有偏离所述已知靶位点的1、2或3个 (优选2个)核苷酸,其中所述修饰靶序列的右半位点通过所述修饰左半位点序列的反向重 复而形成,其通过不对称靶序列的间隔区序列而与所述修饰左半位点序列分隔开。 [0052] 在基于亚位点2的序列中,在右半位点序列中,偏离步骤(a)的至少一个已知靶位 点的相应的同源半位点序列的核苷酸的一部分被存在于所述已知靶位点上的天然核苷酸 置换,直到所述半位点序列含有偏离所述已知靶位点的1、2或3个(优选2个)核苷酸,其 中所述修饰靶序列的左半位点通过所述修饰右半位点序列的反向重复而形成,其通过不对 称靶序列的间隔区序列与所述修饰右半位点序列分隔开。 [0053] 例如,如果1个亚位点包含6个偏离核苷酸,例如图1中所示的有关重组酶文库的 基于SEQ ID NO:1的亚位点或SEQ ID NO:2的亚位点2两者,可根据亚位点产生3个修饰 靶序列,其在左半位点(如果基于亚位点1)或右半位点(如果基于亚位点2)中各含有2 个(不同的)偏离核苷酸。因此,在每个修饰靶序列中,对相应亚位点的序列进行修饰以与 4个核苷酸中的已知靶序列(或至少一个已知的靶序列)的序列一致(图2)。当然,还可 能产生各含有1个偏离核苷酸的6种修饰靶序列,或各含有3个偏离核苷酸的2种靶序列。 [0054] 在另一个实例中,如果1个亚位点包含9个偏离核苷酸,例如图1所示有关重组酶 文库的SEQ ID NO:2的亚位点1,可根据亚位点产生3个修饰靶序列,其在半位点中各含有 3个(不同的)偏离核苷酸。 [0055] 因此,合起来看在来源于步骤(d)的第一亚组的1个靶序列的所有修饰半位点序 列中,可找出所有偏离核苷酸,但是所述修饰半位点序列无一单独包含所有的偏离核苷酸。 [0056] 此外,以修饰的半位点序列为基础产生反向重复序列,使得间隔区序列将构成反 向重复序列的两个序列分隔开(参见图2)。从更高亚组的靶序列衍生的新亚组的每个修饰 靶序列内的间隔区序列优选是相同的,并且对应于代表或定义为不对称靶位点的间隔区序 列的LTR序列。然而,在进一步的实施方案中,间隔区序列可包含一个或两个来源于核苷酸取代的序列偏离。利用该方法,与起始不对称靶序列中的相比,在代表每个亚组的靶序列中的突变(即与被野生型重组酶识别的靶位点的不同)数目较少,但是所有突变仍在1个靶 序列中表示(参见WO 2008/083931的图1,本申请的图2)。 [0057] 本文所用术语“偏离核苷酸”是指在LTR内鉴定或定义的不对称靶序列或者根据 本发明产生的亚组的靶序列内的下列核苷酸:其偏离(即不同于)在本发明方法的步骤 (a)中所选择的已知重组酶的已知同源对称靶序列的相应同源序列的相同位置处存在的核 苷酸。在这种情况下,术语“偏离核苷酸”和“突变”可互换使用。 [0058] WO 2008/083931的教导指出,如果用作底物的靶序列有至多3个核苷酸不同于 天然靶序列,则可使用靶序列作为底物,使用分子定向进化对重组酶进行修整。因此,上 述不同级次的亚组的产生,用来减少每个靶序列偏离核苷酸的数目至3或更少(参见WO 2008/083931的图1)。逐步减少偏离核苷酸的数目最终产生其偏离核苷酸数目减少的不同 级次的靶序列的许多亚组,直到产生可用作用于分子定向进化的底物的最终亚组。在产生 不同亚组并因此减少偏离核苷酸的数目的同时,使与被野生型重组酶识别的靶位点的不同 在各不含超过这些偏离核苷酸的3个的几个靶序列之间分散,同时整体来看最终级次的靶 序列仍代表了所有的偏离核苷酸。 [0059] 任选在本发明的方法中,可逐步重复步骤(e)的过程,自第二亚组的靶序列开始 产生靶序列的更多亚组,即将靶序列分解成相应的半位点序列,在改变衍生自第二亚组的 靶序列的半位点序列后,以这些半位点序列为基础产生新的回文结构,每次产生靶序列的 新亚组,其中用于产生反向重复序列的半位点序列含有与至少一个已知靶位点的相应的同 源半位点序列偏离的较少核苷酸。这些额外的靶序列可用于重组酶文库的定向分子进化和 改组的额外步骤。当然,也可仅对于一些序列,例如对于其中获得低重组效率的重组酶的序列,进行这类额外的步骤。如果产生额外的亚组,且重组酶因其进化,则将进化的重组酶文库用于本发明方法的步骤(f)。 [0060] 从步骤(e)获得的靶序列的第二亚组开始,可产生第三亚组,如有必要,则接着产生第四、第五、第六亚组等。然而,如果第二亚组的靶序列仍含有超过3个的偏离核苷酸,则第三亚组的产生一般才是必需的。下一亚组的产生同样适用,如果前一亚组的靶序列仍含 有超过3个的偏离核苷酸,则才是必需的。应当注意的是,在一个实施方案中,可产生靶序列的亚组,直到最终亚组的靶序列只包含1个偏离核苷酸。因此,根据每个半位点序列的偏离核苷酸的数目,对于不对称靶位点的每个半位点序列所产生的亚组数目可以不同。例如,对于左半位点序列,可能必须产生仅2个亚组,而对于右半位点则必须产生3或4个亚组, 以在几个靶序列中分散偏离核苷酸,使得单个靶序列不包含超过3个的这些偏离核苷酸。 [0061] WO 2008/083931的图1中说明了产生靶序列的更多亚组以减少偏离核苷酸数目 至3个以下数目的原理,本申请的图2提供修饰靶序列的具体实例。 [0062] 在步骤(f)中,使用步骤(e)中获得的最终亚组或第二亚组的靶序列作为底物,将 分子定向进化的方法应用于识别步骤(a)的已知同源靶位点的至少一种重组酶,所述靶序 列含有偏离所述已知同源靶位点相应的同源半位点序列的1、2或3个核苷酸。 [0063] 本文所用术语“最终亚组”是指步骤(e)中产生的最后亚组,即如果不在第二亚组上产生额外的亚组。根据不对称靶位点中偏离核苷酸的数目和不得不产生以减少每个靶序 列的偏离核苷酸数目低于3个的亚组数目,“最终亚组”可相当于任何亚组,例如第二、第三、第四或更后的亚组,并且对于LTR内的不对称靶序列的半位点序列可以不同。如果重组酶 之前已在偏离所述已知同源靶位点相应的同源半位点序列的核苷酸较少的修饰靶序列的 额外亚组上进化,则使用在该步骤中获得的重组酶。 [0064] 当然,对于特定的修饰靶序列,可能用特定重组酶开始本发明的方法,而对于另一特定的修饰靶序列,可用另一重组酶(或文库)。 [0065] 分子定向进化方法,亦称实验室进化或体外进化,是本领域已知的(有关综述参 见Yuan等,2005及其中的参考文献;Johannes和Zhao,2006)。 [0066] 在分子定向进化的第一步中,随机突变重组酶序列的文库通过本领域已知的方法 产生,例如通过采用易错PCR和DNA改组(有关综述参见例如Yuan等,2005),或国际专利 申请WO 2002/44409中公开的方法。包含突变重组酶的每个文库的质粒还含有步骤(f)中 获得的最终亚组的靶序列之一。在将所产生的质粒文库转染至合适细胞中后,使重组酶能 够表达,按本领域技术人员所知,进行分子定向进化。 [0067] 在一个优选的实施方案中,应用于本发明方法的步骤(f)中的分子定向进化是底 物关联的蛋白质进化(SLiPE;Buchholz和Stewart,2001;国际专利申请WO 02/44409)。底物关联的蛋白质进化可按WO 2008/083931的实施例中的详细描述进行。简单地说,将步 骤(e)中得到的靶序列连同重组酶的随机突变的编码序列一起克隆至质粒(所谓的进化载 体)中。随机突变通过易错PCR进行(参见Buchholz和Stewart,2001)。然后将所产生 的质粒文库转染至大肠杆菌(E. coli)细胞中以供重组酶表达。通过使用驱动重组酶表达 的诱导型启动子,可调整表达水平。在过夜温育后,将质粒DNA从细胞中分离,并用Nde Ⅰ消化以切除未重组的质粒,仅重组的质粒随后用引物扩增。质粒重组形式的PCR产物产生 1.7 Kb条带。PCR产物用BsrGⅠ和Xba Ⅰ消化,并亚克隆回同样消化的进化载体中用于接 下来的进化循环。 [0068] 在步骤(g)中,将在步骤(f)中进化的重组酶文库组合并改组。DNA改组技术是本 领域已知的(有关综述参见Minshull和Stemmer,1999;Stemmer,1994)。分别地,将在基 于亚位点1的修饰靶序列上进化的重组酶文库组合并改组,并将在基于亚位点2的修饰靶 序列上进化的重组酶文库组合并改组。 [0069] 然后将组合并改组的文库克隆至新产生的包含下一更高亚组的靶序列的载体中, 即如果产生2个亚组,则下一更高亚组为步骤(d)中产生的亚组。例如,对于在基于亚位点 1的序列上进化的文库,载体包含亚位点1的序列作为靶序列,而对于在基于亚位点2的序 列上进化的文库,载体包含亚位点2的序列作为靶序列。 [0070] 在步骤(h)中,使用下一高级亚组的靶序列,其如论述一样可以是步骤(d)的亚 组,将分子定向进化的方法应用于步骤(g)中获得的改组文库。在该步骤中,可以采用与之前在步骤(f)中应用的那些相同的分子定向进化方法,但在本发明方法的该步骤中,也可 能采用不同的分子定向进化方法。例如Yuan等人(2005)描述不同的分子定向进化方法的 实例。优选还将底物关联的蛋白质进化的方法应用于组合并改组的文库。 [0071] 该步骤产生识别和重组靶序列的重组酶,所述靶序列带有来自较低亚组的不同靶 序列的突变的组合(且因此增加突变的数目)。来自靶序列的较低亚组的不同文库的突变 组合导致协同效应,并引起重组酶的产生,其此时使较高亚组的靶序列重组,证实了可采用穿过中间体的进化策略以获得所需活性。 [0072] 在步骤(i)中,重复步骤(g)即组合和改组重组酶文库及(j)即将分子定向进化 应用于组合并改组的文库,直到获得对原病毒DNA的LTR中存在的不对称靶序列有活性的 至少一种重组酶。 [0073] 例如,在其中必须产生靶序列的2个亚组以产生只具有1、2或3个核苷酸偏离的 靶序列的方法中,例如对于靶序列的第二亚组,对进化的重组酶文库进行组合并改组,并且使用第一亚组的靶序列,将分子定向进化应用于该改组文库。在下一(和最后)步骤中,通 过分子定向进化,使用原病毒DNA的LTR内的步骤(a)的不对称靶序列,使包含识别第一亚 组的靶序列的重组酶的重组酶文库进化,获得对逆转录病毒DNA的LTR内的不对称靶序列 有活性的至少一种重组酶。在该步骤中,分子定向进化的方法优选为底物关联的蛋白质进 化的方法。 [0074] 在步骤(k)中,从文库中分离对逆转录病毒DNA的LTR内的步骤(a)的不对称靶 序列具有活性的重组酶的核酸。使用合适的限制酶,从文库内各个质粒中分离核酸。限制 性内切核酸酶消化的方法为技术人员所知。然后可通过已知方法例如凝胶电泳回收编码重 组酶的核酸。 [0075] 核酸可贮存(优选在低于-80℃的温度下),或可任选在步骤(l)中克隆至表达载 体中用于进一步分析、用于蛋白质表达方法或用于给予受试者以治疗和/或预防逆转录病 毒感染,特别是HIV感染和/或AIDS。合适的表达载体是现有技术已知的或公开于下文中。 [0076] 优选在步骤(a)中鉴定的不对称靶序列位于原病毒的5'-LTR和3'-LTR两者中以 供从宿主细胞基因组中切除原病毒DNA。 [0077] 使用底物关联的定向进化及SEQ ID NO:1和SEQ ID NO:2中鉴定的序列作为底物, 本发明人产生了修整重组酶,其使多种HIV-1毒株的HIV-1长末端重复序列中存在的这种 不对称DNA靶序列重组。对于感染HIV-1的大部分受试者,开发特异性靶向多种HIV-1 LTR 内的不对称序列的这类修整重组酶可供从其染色体整合中切除相应的原病毒。因此,在一 个实施方案中,修整重组酶衍生自包含Cre重组酶的重组酶文库,例如图3中描述的文库, 且它靶向多种HIV-1毒株,识别具有SEQ ID NO:1或SEQ ID NO:2所示序列的靶序列。优 选分子定向进化是底物关联的蛋白质进化(SLiPE)。编码修整重组酶的表达载体优选来源 于慢病毒载体。这种表达载体,用所述表达载体转染的细胞和/或由其衍生的重组酶蛋白 具有医学用途,例如在治疗和/或预防HIV-1感染中。 [0078] 在一个实施方案中,本发明提供用于制备编码修整重组酶的表达载体的方法,所 述修整重组酶能够使可插入宿主细胞的基因组中的多种HIV-1毒株的原病毒DNA的LTR内 的不对称靶序列重组,所述方法包括以下步骤: (a) 鉴定与包含图1指定的重组酶的重组酶文库的重组酶靶位点的左半位点序列和 右半位点序列具有同源性的SEQ ID NO:1或SEQ ID NO:2; (b) 鉴定两种序列,其中第一序列对应于与所述已知靶位点的左半位点同源的步骤 (a)的不对称靶序列的序列,并称为“半位点序列1”,其中第二序列对应于与右半位点同源的步骤(a)的不对称靶序列的序列,并称为“半位点序列2”; (c) 测定步骤(b)的序列内偏离步骤(a)的已知同源靶位点的相应同源左半位点和右 半位点序列的核苷酸,如图1所示; (d) 产生包含靶序列的两种靶核酸的第一亚组,其中第一靶序列称为亚位点1,并包含 SEQ ID NO:8 (对于SEQ ID NO:1)或SEQ ID NO:16 (对于SEQ ID NO:2),其中第二靶序 列称为亚位点2,并包含SEQ ID NO:12 (对于SEQ ID NO:1)或SEQ ID NO:20 (对于SEQ ID NO:2); (e) 在步骤(d)的第一亚组中的靶序列的基础上,产生包含修饰靶序列的靶核酸的第 二亚组, 分别包含SEQ ID NO:9-11和13-15 (对于SEQ ID NO:1)或SEQ ID NO:17-19和21-23 (对于SEQ ID NO:2), (f) 使用步骤(e)中获得的第二亚组的每种核酸作为底物,分别将分子定向进化应用 于所述重组酶文库; (g) 改组步骤(f)中进化的重组酶文库,其中将在基于亚位点1的序列上进化的所有 重组酶文库组合并改组,且其中将在基于亚位点2的序列上进化的所有重组酶文库组合并 改组; (h) 使用步骤(d)的亚组的每种核酸作为底物,将分子定向进化应用于步骤(g)中所 获得的改组文库; (i) 改组在步骤(h)中进化的重组酶文库; (j) 使用包含步骤(a)的不对称靶序列的核酸作为底物,将分子定向进化应用于步骤 (g)中所获得的改组文库,直到获得对步骤(a)的逆转录病毒DNA的LTR内的不对称靶序列 有活性的至少一种重组酶; (k) 从文库中分离步骤(j)中获得的至少一种重组酶的核酸;和 (l) 将步骤(k)中获得的核酸克隆到合适的表达载体中 其中分子定向进化的方法优选是底物关联的蛋白质进化。 [0079] 经修整以识别SEQ ID NO:1的TRE重组酶称为TRE 3.0。经修整以识别SEQ ID NO:2的TRE重组酶称为TRE 4.0。 [0080] 然而,对于本领域技术人员显而易见的是,可以产生其它修整的位点特异性重组 酶,其使存在于插入宿主细胞的基因组中的原病毒的多种逆转录病毒的基因组中的趋异靶 位点重组。例如可测定存在于多种逆转录病毒毒株的基因组中的其它候选靶序列。 [0081] 优选可插入宿主细胞的基因组中或可能尚未插入的原病毒DNA是逆转录病毒的 DNA。逆转录病毒包含大的和不同的有包膜RNA病毒家族。该家族的标志特征是其复制策 略,这包括以下基本步骤:病毒RNA反转录成线性双链DNA,随后这种DNA (原病毒DNA)整 合到宿主细胞基因组中。将逆转录病毒再分成由进化关联性限定的7个组。这些组中的5 个(α、β、δ、ε和γ逆转录病毒)代表具有致癌潜力的逆转录病毒,而其它2个组是慢 病毒和泡沫病毒。人致病性人T细胞白血病病毒I型和II型(HTLV-I和HTLV-II)属于 δ-逆转录病毒组,而AIDS病毒人免疫缺陷病毒1型和2型(HIV-1和HIV-2)属于慢病毒 组(有关综述参见Coffin JM,Hughes SH,Varmus HE (编辑) 1997,Cold Spring Harbor Laboratory Press,New York的标准教科书“Retroviruses”)。 [0082] 在一个实施方案中,可插入宿主细胞的基因组中的原病毒DNA是选自以下的逆转 录病毒的DNA:小鼠乳腺肿瘤病毒(MMTV)、梅森-普菲策尔猴病毒(Mason Pfizer monkey virus, MPMV)、人T细胞白血病病毒I型(HTLV-I)、人T细胞白血病病毒II型(HTLV-II)、 猿猴T细胞白血病病毒I型(STLV-I)、猿猴T细胞白血病病毒II型(STLV-II)、牛白血病 病毒(BLV)、猫白血病病毒(FeLV)和莫洛尼鼠白血病病毒(MoMLV)。 [0083] 在另一个实施方案中,逆转录病毒是选自以下的慢病毒:人免疫缺陷病毒1型 (HIV-1)、人免疫缺陷病毒2型(HIV-2)、猿猴免疫缺陷病毒(SIV)、猫免疫缺陷病毒(FIV)、牛免疫缺陷病毒(BIV)、Maedi-visna病毒(MVV)、马传染性贫血病毒(EIAV)和山羊关节炎 脑炎病毒(CAEV)。如上所述,优选HIV,特别是HIV-1。 [0084] 在一个更优选的实施方案中,在本发明方法的步骤(a)中鉴定的不对称靶序列位 于HIV原病毒的5'-LTR和3'-LTR两者中。优选位于HIV原病毒的5'-LTR和3'-LTR中的 所述不对称靶序列具有SEQ ID NO:1或SEQ ID NO:2所示序列。 [0085] 在一个优选的实施方案中,应用于本发明方法中的分子定向进化方法是底物关联 的蛋白质进化方法(SLiPE;Buchholz和Stewart,2001;另参见WO 02/44409)。 [0086] 通过实施本文描述的本发明方法,本发明人产生几个编码修整重组酶的核酸和修 整重组酶本身。因此,本发明提供包含SEQ ID NO:40-64的任一个的序列或由其组成的修 整重组酶,或编码所述修整重组酶的核酸。 [0087] 出人意料地发现,这些修整重组酶优选包含如图5所示的特定共有序列。具体 地说,所有所分析的能够使不对称靶序列重组的修整重组酶均包含SEQ ID NO:37的序列 (“Tre通用”共有序列)。进一步发现,所有所分析的能够使SEQ ID NO:1的靶序列重组的 修整重组酶均包含SEQ ID NO:38的序列。所有所分析的能够使SEQ ID NO:1的靶序列重 组的修整重组酶的95%均包含SEQ ID NO:39的序列。在SEQ ID NO:37、38和39中,可变 氨基酸用X表示(参见图5)。 [0088] 本发明因此提供能够使可插入宿主细胞基因组中的逆转录病毒毒株的原病毒DNA 的LTR内的不对称靶序列重组的修整重组酶(即功能性修整重组酶),其优选包含SEQ ID NO:37。优选所述修整重组酶能够使可插入宿主细胞基因组中的多种逆转录病毒毒株的原 病毒DNA的LTR内的不对称靶序列重组。这类修整重组酶例如可按照本发明的方法获得。 优选所述修整重组酶包含SEQ ID NO:37,并包含与Cre序列(SEQ ID NO:36)相比至少1 个、优选2、3、4、5、6或7个下列限定的氨基酸交换:P12S、P15L、M44V、K86N、G93A、A175S、P307A。这些交换提供特别适于在SEQ ID NO:1的靶序列或与SEQ ID NO:1具有高序列同 一性(例如与SEQ ID NO:1有至少80%、至少90%或至少95%序列同一性)的靶序列上重组 的酶。 [0089] 在一个实施方案中,WO 2008/083931中未公开本发明的修整重组酶、特别是包含 SEQ ID NO:37的修整重组酶的序列。优选序列不包含本申请的SEQ ID NO:65 (其与WO 2008/083931的SEQ ID NO:3相同)或SEQ ID NO:65的11-351位,且编码本发明的修整重 组酶的核酸序列不编码包含SEQ ID NO:65的11-351位的蛋白质。包含SEQ ID NO:37的 本发明的修整重组酶的序列也不同于天然存在的重组酶例如Cre、Dre、Fre或Zre,这从以 下特征来看是显然的:其能够使可插入宿主细胞基因组中的逆转录病毒毒株的原病毒DNA 的LTR内的不对称靶序列重组,且优选能够使可插入宿主细胞基因组中的多种逆转录病毒 毒株的原病毒DNA的LTR内的不对称靶序列重组。 [0090] 如果能够使插入宿主细胞基因组中的多种逆转录病毒毒株的原病毒DNA的LTR内 的不对称靶序列重组的修整重组酶将使SEQ ID NO:1的靶序列重组,则优选它包含SEQ ID NO:38或SEQ ID NO:39。 [0091] 可通过例如本发明的方法获得的、能够使可插入宿主细胞基因组中的多种逆转录 病毒毒株的原病毒DNA的LTR内的不对称靶序列重组的功能性修整重组酶,可不同于所述 序列,但是这些序列甚至在不实施本发明方法的情况下,为技术人员产生能够使不对称靶 位点(例如SEQ ID NO:1)重组的修整重组酶提供有价值的指导。本发明还提供包含与SEQ ID NO:38具有至少97%序列同一性和/或与SEQ ID NO:38具有至少98%序列同一性和/ 或与SEQ ID NO:38具有至少99%序列同一性的序列的修整重组酶。优选修整重组酶与SEQ ID NO:39具有至少97%序列同一性和/或与SEQ ID NO:39具有至少98%序列同一性和/ 或与SEQ ID NO:39具有至少99%序列同一性。在本发明的情况下,与SEQ ID NO:37、38或 39的序列具有某种百分比序列同一性意指与相应序列中限定的位置的序列同一性,例如在 97%序列同一性的情况下,所述序列3%的限定氨基酸位置可改变。优选相对于参比序列的 氨基酸交换是保守取代,其为技术人员所熟知(例如Creighton (1984),Proteins. W. H. Freeman and Company (编辑))。例如,保守取代将来自带负电荷的氨基酸组的一个氨基 酸替换成另一个。 [0092] 能够使可插入宿主细胞基因组中的多种逆转录病毒毒株的原病毒DNA的LTR内的 不对称靶序列重组的修整重组酶还可包含选自以下的2、3、4个或更多个序列的组合:SEQ ID NO:40-64,例如这些序列中任一个(例如SEQ ID NO:40)的C端部分以及这些序列中任 何其它一个(例如SEQ ID NO:64)的N端部分。C端部分可具有1-342个氨基酸的长度。 在2个序列的组合中,N端部分可具有1-342个氨基酸的长度。无论如何该组合都包含TRE 共有基序,例如SEQ ID NO:37,或优选SEQ ID NO:38或SEQ ID NO:39。 [0093] 本发明还提供组合物,其包含两种或更多种包含SEQ ID NO:37、优选SEQ ID NO:38或SEQ ID NO:39的不同序列的修整重组酶或编码所述修整重组酶的核酸。在一个实 施方案中,组合物包含2种或更多种、3种或更多种、4种或更多种、5种或更多种、10种或更多种、20种或更多种或25种包含SEQ ID NO:40-64中任一个的序列的重组酶或编码所述修 整重组酶的核酸。这类组合物可以是下文所述的药物组合物。 [0094] 本发明还提供编码能够使可插入宿主细胞基因组中的多种逆转录病毒毒株的原 病毒DNA的LTR内的不对称靶序列重组的修整重组酶的核酸,修整重组酶包含上述氨基酸 序列。在优选的实施方案中,所述氨基酸序列与SEQ ID NO:38的序列具有至少97%序列同 一性、与SEQ ID NO:38的序列具有至少98%序列同一性或与SEQ ID NO:38具有至少99% 序列同一性或包含SEQ ID NO:38。本发明还提供编码包含以下氨基酸序列的修整重组酶 的核酸:与SEQ ID NO:39的序列具有至少97%序列同一性、与SEQ ID NO:39的序列具有至 少98%序列同一性或与SEQ ID NO:38具有至少99%序列同一性,或包含SEQ ID NO:39的 氨基酸序列。本发明还提供编码包含选自SEQ ID NO:40-64的氨基酸序列或所述序列的组 合的修整重组酶的核酸。 [0095] 在本发明的情况下,包含序列的核酸或蛋白质也可由该序列组成。 [0096] 还可包含其它序列,例如提供用于表达/定位于特异性细胞区室的信号序列,例 如核定位信号(例如SEQ ID NO:65的2-9位处的信号)。如果蛋白质用于药物组合物,则 尤其优选作为与蛋白质转导域(例如tat蛋白质转导域)的融合蛋白表达该蛋白质,所述 蛋白质转导域可允许靶细胞的蛋白质转导。优选用于药物组合物的本发明的修整重组酶作 为与核定位序列和与蛋白质转导域(例如来自tat)的融合蛋白来制备,且编码本发明的修 整重组酶的核酸可编码这类融合蛋白。例如,下列蛋白质转导域可用于与本发明的修整重 组酶的融合蛋白,其优选进一步包括核定位信号: - HIV-1 Tat反式激活蛋白的碱性结构域(Fawell S, Seery J, Daikh Y, Moore C, Chen LL, Pepinsky B, Barsoum J., Tat-mediated delivery of heterologous proteins into cells (Tat介导的递送异源蛋白质至细胞中)., Proc Natl Acad Sci U S A. 1994 年1月18日;91(2):664-8)。 [0097] - 果蝇触角足(Antp)同源域(Derossi D, Joliot AH, Chassaing G, Prochiantz A., The third helix of the Antennapedia homeodomain translocates through biological membranes (触角足同源域的第三螺旋通过生物膜易位)., J Biol Chem. 1994年4月8日;269(14):10444-50)。 [0098] - HSV VP22转录因子(Elliott G, O'Hare P., Intercellular trafficking and protein delivery by a herpesvirus structural protein (经由疱疹病毒结构蛋白质的 胞间运输和蛋白质递送)., Cell. 1997年1月24日;88(2):223-33)。 [0099] - 乙型肝炎病毒(HBV) PreS2表面抗原的细胞可渗透易位基序(TLM) (Oess S, Hildt E., Novel cell permeable motif derived from the PreS2-domain of hepatitis-B virus surface antigens (来源于乙型肝炎病毒表面抗原PreS2结构域的新 的细胞可渗透基序)., Gene Ther. 2000年5月;7(9):750-8)。 [0100] 如果蛋白质是要纯化的,则还可加入有利于蛋白质纯化的标签,例如His标签。 [0101] 技术人员可以选择编码如上定义的Tre重组酶的本发明核酸的密码子选择。例 如,特别是如果在人细胞中的表达欲用于例如治疗目的,则可选择适于在人细胞中表达的 密码子选择。密码子选择还可以是根据例如Cre重组酶的密码子选择。 [0102] 修整重组酶或编码所述修整重组酶的核酸可通过本文描述的本发明方法获得,或 者可通过这种方法获得。还可根据本文公开的序列,任选通过组合和/或进一步改变这些 序列,任选针对不对称靶位点(例如SEQ ID NO:1或SEQ ID NO:2)重组中的活性进行测试 来获得。 [0103] 本发明还提供包含编码上文定义的修整重组酶的两种或更多种核酸、例如编码包 含SEQ ID NO:37的不同序列、优选SEQ ID NO:38或SEQ ID NO:39的不同序列的两种或更 多种修整重组酶的核酸的组合物(例如文库)。在一个实施方案中,组合物包含编码修整重 组酶的核酸,所述修整重组酶包含含有SEQ ID NO:40-64中任一个的序列或这些序列的组 合的2种或更多种、3种或更多种、4种或更多种、5种或更多种、10种或更多种、20种或更多种或者25种或更多种重组酶。这类组合物,特别是其中核酸是表达载体的组合物可能特别 适宜作为下文描述的药物组合物。 [0104] 在本发明的方法中,将编码对逆转录病毒DNA的LTR内的不对称靶序列有活性的 至少一种修整重组酶的核酸克隆至表达载体中。表达载体是遗传构建体,用于表达由该载 体内的核酸编码的蛋白质。这类表达载体可以是自我复制的染色体外载体或整合至宿主基 因组中的载体。一般而言,这些表达载体包括与编码本发明的修整重组酶的核酸有效连接 的转录和翻译调节核酸。 [0105] 术语“控制序列”指用于在特定宿主生物中表达有效连接的编码序列所必需的DNA序列。适合于原核生物的控制序列例如包括启动子、任选操纵基因序列和核糖体结合位点。 已知真核细胞利用启动子、聚腺苷酸化信号和增强子。 [0106] 当核酸置于与另一核酸序列的功能关系中时,它是“有效连接的”。例如,如果启动子或增强子影响序列的转录,则它与编码序列有效连接;或者,如果核糖体结合位点所处位置有利于翻译,则它与编码序列有效连接。连接通过在合适的限制位点处连接来完成。如 果这类位点不存在,则按常规做法使用合成的寡核苷酸衔接子或接头。转录和翻译调节核 酸一般可适于用于表达修整重组酶的宿主细胞。用于各种宿主细胞的众多类型的合适表达 载体和合适的调节序列是本领域已知的。 [0107] 在本发明中使用的表达载体可以是逆转录病毒载体、慢病毒载体、泡沫病毒载体 或腺病毒载体。然而,在一个优选的实施方案中,表达载体是慢病毒载体,选自HIV-1-、 SIV-、FIV-或EIAV-衍生的慢病毒载体。例如Schambach等人(2006)或欧洲专利申请号 11000751.5中描述了慢病毒载体。 [0108] 在本发明的优选实施方案中,表达载体包含细胞、细菌、病毒或杂合启动子。 [0109] 一般而言,为了本发明的目的,启动子可以是组成型或诱导型启动子。此外,启动子可以是天然存在的启动子(例如细菌、细胞或病毒启动子)或杂合启动子。使不止一种 启动子的元件组合的杂合启动子是本领域已知的,并可用于本发明。此外,用于本发明中 的启动子还可以是天然存在的启动子的衍生物。本文所用的天然存在的启动子的“衍生 物”可以是得自不同来源的启动子或序列的顺式活性元件的组合,或者,可以通过特定天然存在的启动子内的顺式活性元件的缺失或突变而获得(Edelman等,2000;Alper等,2006; Hartenbach和Fussenegger,2006)。 [0110] 在本发明的一个实施方案中,组成型启动子或其衍生物选自或衍生自巨细胞病 毒、劳斯肉瘤病毒、鼠白血病病毒相关逆转录病毒、磷酸甘油激酶基因、鼠脾脏病灶形成病毒或人延伸因子1 α的启动子。 [0111] 在本发明进一步的实施方案中,诱导型启动子或其衍生物选自或衍生自来源于慢 病毒、泡沫病毒和δ逆转录病毒的LTR或其衍生物。 [0112] 在这种情况下,术语“LTR”是指具有启动子功能的原病毒的5'和3'长末端重复 序列两者(有关综述参见标准教科书“Retroviruses” (Coffin JM, Hughes SH, Varmus HE (编辑) 1997, Cold Spring Harbor Laboratory Press, New York))。 [0113] 优选诱导型启动子或其衍生物选自或衍生自由HIV-1、HIV-2、MVV、EIAV、CAEV、SIV、FIV、BIV、HTLV-I和HTLV-II衍生的LTR或其衍生物。 [0114] 本发明还提供用于制备修整重组酶的方法,其中所述方法包括用于制备编码修整 重组酶的表达载体的前述方法,以及在合适的宿主细胞中自插入到表达载体中的编码重组 酶的核酸表达修整重组酶或含有所述修整重组酶的氨基酸序列的融合多肽的另外步骤,所 述表达载体获自用于制备编码修整重组酶的表达载体的前述方法。 [0115] 优选在哺乳动物细胞中测试最终获得的重组酶以确保它们在哺乳动物细胞环境 中起作用。此外,为了在哺乳动物细胞中得到良好表达,可使重组酶最优化以在这些细胞中表达(例如采用本领域众所周知的方法的密码子选择优化。参见例如Shimshek等,2002), 或将蛋白质引导至哺乳动物细胞核中所必需的信号序列,例如NLS序列(Macara,2001)可 加入修整重组酶的核酸中。 [0116] 例如,按照用于制备编码修整重组酶的表达载体的方法的步骤(l),克隆至表达载体中的编码修整重组酶的核酸的表达可使用例如细菌、昆虫或哺乳动物表达系统来进行。 然而,也可采用本领域已知的其它表达系统。将外源核酸导入哺乳动物、昆虫或细菌宿主以及其它宿主的方法也为本领域所熟知,并且将随所使用的宿主细胞而变化。技术包括葡聚 糖介导的转染、磷酸钙沉淀、polybrene介导的转染、原生质体融合、电穿孔、病毒感染、脂质体中多核苷酸的囊化和DNA直接显微注射至核内。 [0117] 融合蛋白通过本领域众所周知的方法制备。例如,其中已克隆有编码修整重组酶 的核酸的表达载体包含编码第二多肽或蛋白质的核序列。通过将编码修整重组酶的核酸与 第二多肽或蛋白质的序列一起符合读框地克隆,2种序列将作为融合蛋白表达。 [0118] 用于表达来自表达载体的修整重组酶的宿主细胞优选为这样的宿主细胞,包括原 核细胞,例如细菌细胞或酵母细胞,或真核细胞,例如昆虫细胞或哺乳动物细胞。宿主细胞可以是造血细胞,例如成体造血干细胞或T细胞,例如CD4+细胞。细胞可来源于感染逆转 录病毒的受试者,并且在转化、任选培养和/或增殖后,可将细胞给回受试者。 [0119] 本发明还提供用于制备转化的成体干细胞的方法,其中所述方法包括用于制备编 码修整重组酶的表达载体的前述方法和将表达载体体外导入合适的成体干细胞的另外步 骤,所述表达载体获自用于体外制备编码修整重组酶的表达载体的前述方法。 [0120] 在又一方面,本发明涉及可获自本发明前述方法的核酸。本文还提供由序列限定 的编码修整重组酶的核酸。 [0121] 本文所用“核酸”是由共价连接的亚单位(称为核苷酸)组成的聚合物。核酸包括 聚核糖核酸(RNA)和聚脱氧核糖核酸(DNA),这二者可以是单链或双链的。DNA包括cDNA、 基因组DNA、合成DNA和半合成DNA。 [0122] 在其最广泛的方面,通过本发明或本文定义的方法获得的核酸是编码修整重组酶 的核酸,其中修整重组酶使可插入宿主细胞的基因组中的来自多种病毒毒株的原病毒DNA 内的不对称靶序列重组,导致从宿主细胞的基因组中切除原病毒,其中不对称靶位点不同 于野生型重组酶的靶位点。 [0123] 又一方面,本发明还涉及可获自本发明前述方法的表达载体和包含编码本文定义 的修整重组酶的核酸的表达载体。 [0124] 本文所用术语 “蛋白质”包括蛋白质、多肽和肽。正如本领域技术人员可了解的一样,本发明的核酸序列可用来产生蛋白质序列。本发明的又一方面是可获自例如本发明的 前述方法的修整重组酶蛋白,所述重组酶可任选为包含功能性重组酶的融合蛋白。在一个 实施方案中,可采用本领域众所周知的技术来制备作为融合多肽的修整重组酶蛋白。在一 个优选的实施方案中,修整重组酶蛋白与第二多肽连接。优选融合多肽获自本发明的前述 方法,其中修整重组酶与第二多肽连接。 [0125] 在一个实施方案中,制备作为融合多肽的修整重组酶蛋白以提高表达。在进一步 的实施方案中,制备作为融合多肽的修整重组酶蛋白以供将多肽导入活细胞。通常,纯化的蛋白质无法进入细胞,因为由其大小所致它们不能通过细胞膜。然而,特定肽序列与蛋白质的融合可导致这些融合蛋白被摄入细胞。在细胞中,蛋白质然后可执行其功能。用此方法,已成功将位点特异性重组酶(包括Cre重组酶)递送至细胞中(Peitz等,2002)。Nolden 等(2006)和Lin等(2004)进一步描述了细胞通透性重组酶。因此,这种策略可用来将修整 重组酶递送至细胞中以从感染细胞中除去原病毒。因此,融合多肽中的第二多肽可包含信 号肽。信号肽可以是蛋白质转导域例如TAT肽或来自触角足同源域第三螺旋的肽(Derossi 等,1994,1996;Vives等,1997;Vives,2003;Richard等,2005)或用于将融合多肽递送至真核细胞核中的NLS (核定位序列) (Macara,2001)。 [0126] 本发明的又一个方面涉及可获自用于制备本发明的转化成体干细胞的前述方法 的成体干细胞。干细胞优选用本发明的表达载体感染或转染。在一个优选的实施方案中,成体干细胞是表达修整重组酶、前述融合多肽或包含前述表达载体的造血谱系的干细胞。造 + 血干细胞(HSC)是骨髓衍生的CD34 细胞,其可例如通过常规白细胞除去法从供体(例如 HIV感染患者)的G-CSF动员的外周血中纯化(Scherr和Eder,2002)。然后可配制体外遗 传修饰的细胞,用于重输回给患者。 [0127] 现有技术水平中,术语“干细胞”是这样的细胞,其(a)具有自我更新的能力,和(b)由于其不对称分裂能力而形成至少一种、通常多种特化细胞类型的能力(Donovan和 Gearhart,2001)。成体干细胞可以从成体的不同组织(即从分化的个体)中分离出来。这 类干细胞在现有技术水平下称为“多能成体干细胞”。在胚胎多潜能干细胞和成体多能干细胞之间的基本差异在于可由相应细胞获得的分化组织的数目。 [0128] 在进一步的实施方案中,本发明的表达载体用来转化T细胞,例如逆转录病毒(例 + 如HIV)感染患者中的CD4 原代细胞(血细胞)。 [0129] 在本发明方法的另外步骤中,将通过本发明方法获得的包含编码本发明的修整重 组酶的核酸序列的表达载体、重组酶蛋白、融合蛋白或成体干细胞配制成药物组合物用于 预防和/或治疗逆转录病毒感染和/或用于减少被逆转录病毒(例如HIV)、特别是HIV-1 感染的受试者中的病毒载量。 [0130] 本发明的又一个目的是通过前述方法得到的药物组合物。药物组合物优选以适于 静脉内应用(输注)的溶液剂的形式存在。 [0131] 药物制剂还可包含一种或多种药学上可接受的载体、赋形剂和/或佐剂。适用于 药物组合物的载体、赋形剂和佐剂是本领域已知的。 [0132] 当给予受试者时,本发明的药物组合物优选减少受逆转录病毒感染的受试者中的 病毒载量至低于5.000基因组当量/ml血浆,优选低于500基因组当量/ml血浆,更优选低 于50基因组当量/ml血浆。因此,包含编码修整重组酶的表达载体(或作为蛋白质或融合 多肽的修整重组酶或包含表达载体的干细胞)的本发明的药物组合物能够通过清除宿主 细胞内逆转录病毒的遗传库,从而防止病毒进一步的生活周期,来减少感染逆转录病毒的 受试者的病毒载量。 [0133] 本文所用术语“病毒载量”是指例如与1 ml患者血浆有关的HIV RNA当量(即基 因组) (Dybul等,2002)。因此,通过测量得自患者的样品中的病毒DNA含量来测定病毒载 量。目前,有3种主要类型的可用的病毒载量测定法: TM 1) HIV RNA逆转录聚合酶链反应(RT-PCR):Amplicor HIV-1 Monitor Test;Roche Diagnostics TM 2) 支链DNA (bDNA):Versant HIV RNA Assay;Bayer Diagnostics;和 TM 3) 基于核酸序列的扩增(NASBA):NucliSens Assay;bioMerieux。 [0134] 在一个优选的实施方案中,本发明的药物组合物能够减少受逆转录病毒感染的受 试者中的病毒载量低于5.000基因组当量/ml血浆,优选低于500基因组当量/ml血浆,更 优选低于50基因组当量/ml血浆。其病毒载量低于5000基因组当量/ml血浆的患者被视 为对药物治疗的适应相对良好。然而,现行AIDS疗法的目的是减少病毒载量低于病毒载量 测定法的检出限,所述检出限目前为低于约50基因组当量/ml血浆。 [0135] 药物组合物优选减少选自以下的逆转录病毒的病毒载量:小鼠乳腺肿瘤病毒 (MMTV)、梅森-普菲策尔猴病毒(MPMV)、人T细胞白血病病毒I型(HTLV-I)、人T细胞白血 病病毒II型(HTLV-II)、猿猴T细胞白血病病毒I型(STLV-I)、猿猴T细胞白血病病毒II 型(STLV-II)、牛白血病病毒(BLV)、猫白血病病毒(FeLV)和莫洛尼鼠白血病病毒(MoMLV)。 在又一个优选的实施方案中,待用本发明的药物治疗的逆转录病毒是慢病毒。所述慢病毒 优选选自人免疫缺陷病毒1型(HIV-1)、人免疫缺陷病毒2型(HIV-2)、猿猴免疫缺陷病毒 (SIV)、猫免疫缺陷病毒(FIV)、牛免疫缺陷病毒(BIV)、Maedi-visna病毒(MVV)、马传染性贫血病毒(EIAV)和山羊关节炎脑炎病毒(CAEV)。最优选逆转录病毒是HIV,特别是HIV-1。 然而,对本领域技术人员显而易见的是,本发明还适用于上述提及的病毒以外的其它逆转 录病毒的逆转录病毒感染。 [0136] 将向其给予药物组合物的被逆转录病毒感染的受试者选自人,灵长类动物、猴、 牛、马、山羊、绵羊和家猫。然而,受试者优选是人类。 [0137] 一般而言,将有效量的本发明的表达载体、修整重组酶或转化细胞给予受试者。给药可以是例如静脉内或肌内给药。 [0138] 在一个实施方案中,配制药物组合物用于伴随高效抗逆转录病毒疗法(HAART)的 其它活性剂给予。高效抗逆转录病毒疗法HAART是靶向病毒逆转录酶、蛋白酶和融合物的 联合疗法(GULICK等,1997;LALEZARI等,2003)。 [0139] 在另一个实施方案中,配制药物组合物用于伴随全局免疫激活疗法或原病毒基因 表达的特异性激活或在之后给予。免疫激活疗法的前提是基于以下设想:潜伏HIV-感染细 胞的有意激活可加快持续病毒库的根除。根除可通过活跃表达HIV-1 (促凋亡)产物的细 胞的程序性死亡,经免疫清除而发生(Kulkosky和Bray,2006)。全局免疫激活(免疫细胞 包括静息细胞的激活)通常通过例如给予免疫毒素、细胞因子(例如IL-2)或T细胞激活 抗体(例如OKT3)而实现。 [0140] 鉴于以下事实,即由于全局T细胞激活还显然诱导病毒复制并且增加潜在HIV-1 靶细胞的数目超出可由HAART控制的水平(FRASER等,2000)的事实所致,所进行的有意 激活HAART抗性潜伏库的免疫激活遗憾地未能永久清除HIV-1和病毒反弹(有关综述见 KULKOSKY和BRAY 2006;MARCELLO,2006;SHEHU-XHILAGA等,2005),故需要更多的特殊治疗来治疗HIV。一种方法是激活本来是静息的病毒基因组的转录。潜伏原病毒基因表达的特 定激活可通过给予佛波酯Prostratin或人细胞因子IL-7来实现,这两者似乎在不存在细 胞增殖的情况下再激活潜伏的HIV-1 (Marcello,2006)。此外,HIV-1的选择性转录激活还可通过组蛋白脱乙酰酶(HDAC1)抑制剂例如丙戊酸来实现,其在细胞激活不存在时最终诱 导来自静息细胞的HIV-1的过度生长(Marcello,2006;LEHRMAN等,2005)。 [0141] 然而,全局免疫激活疗法或原病毒基因表达的特异性激活或类似治疗策略大大获 益于原病毒DNA的同时去除,从而减少患者中的感染细胞库。 [0142] 本发明还提供治疗和/或预防受试者的逆转录病毒感染、特别是HIV感染的方法。 在一个实施方案中,分析获自受试者的样品中的感染受试者的逆转录病毒的序列,如果来 自受试者的原病毒DNA包含步骤(a)中鉴定的选择重组酶所针对的不对称靶序列,则将至 少一种编码修整重组酶的表达载体、至少一种修整重组酶或至少一种用所述表达载体转化 的细胞(例如一种成体干细胞)给予受试者。获自受试者的样品可以是例如包含感染的 CD4+细胞的血样。 [0143] 附图简述 图1:图1提供特定重组酶的靶位点loxP (被Cre识别)、loxH (被Fre识别)、rox (被Dre识别)、zox (被Zre识别)和loxLTR (被Tre识别) (SEQ ID NO:3-7)以及多 种HIV-1毒株中存在的不对称靶位点(SEQ ID NO:1和2)。间隔区序列用黑体字表示。SEQ ID NO:1或SEQ ID NO:2的左半位点和右半位点中非与已知靶位点同源的核苷酸位置加下 划线。SEQ ID NO:1与已知重组酶靶位点库具有54%同源性;SEQ ID NO:2与已知重组酶靶 位点库具有42%同源性。 [0144] 图2:图2提供用于产生修整重组酶TRE 3.0和TRE 4.0的亚位点的序列。SEQ ID NO:1或2的左半位点和右半位点中非与已知靶位点同源的核苷酸位置加下划线。在本发明 方法的步骤(d)中产生亚位点1和2,在本发明方法的步骤(e)中产生亚位点1A-C和亚位 点2A-C。在本发明方法的另外步骤中产生亚位点1a/b和亚位点2a/b以及中间体亚位点 1b+1、1b+2、2a+1和2a+2。 [0145] 图3:图3提供进化策略的概要图,并显示SEQ ID NO:1的第一进化步骤的结果。 起始重组酶文库通过合并(pooling)并且家族改组Cre和几种已知的Cre样重组酶(A)来 产生。通过在第二亚组的亚位点上进行几轮底物关联的蛋白质进化来富集成功的重组酶。 在(B)中,在第一次进化循环后测定了重组活性,在(E)中,在第6次进化循环后进行了测 定。重组产物较短,因为切除了靶位点之间的序列,所述重组产物用一个三角形标出。非重组产物用2个三角形标出。成功的重组酶通过PCR扩增,导致1.7-kb产物(C和D)。分别 接近亚位点1C和2C上的各个错配之一(通过突变的loxP靶位点(称为ΔloxP)),以在亚 位点1C和2C上获得更高的残余重组活性(D)。 [0146] 图4:图4提供进化策略另外步骤的概要图,并显示SEQ ID NO:1的最终进化步骤 的结果。图的(A)部分对应于图3中详细描述的第一进化循环的步骤。 [0147] (B) 此外,通过第三亚组的亚位点上进行几轮底物关联的蛋白质进化,接着在中 间体底物(C)上,最后在第一亚位点(D)上进行几轮底物关联的进化循环,来富集成功的重 组酶,以得到对不对称靶位点SEQ ID NO:1有特异性的重组酶。在(E)中,在第8个进化循 环后,用较大量转录激活因子L-阿拉伯糖(L-ara;200 µg/ml)测定了重组活性,在(F)中,在第16个进化循环后,用仅50 µg/ml L-ara的较低的转录诱导测量了重组活性。重组产物 用一个三角形标出,非重组的用两个三角形标出。(G)和(H)显示在所示的进化循环后、在 所示的L-ara浓度下和在所示的亚位点上各自的重组活性。在最后的进化循环(循环43) 后,分离并富集具有最高活性的重组酶群,产生活性文库。选择重组酶的单个克隆,并进行进一步的分析。 [0148] 图5:图5提供以下蛋白质序列的比对:(a) Cre重组酶EQ ID NO:36,(b) Tre重组酶的通用共有序列SEQ ID NO:37 (对HIV-1 LTR内的不对称靶位点有特异性) (c)对SEQ ID NO:1有特异性的Tre重组酶的强制/严格共有序列(mandatory/stringent consensus sequence) SEQ ID NO:38和(d)对SEQ ID NO:1有特异性的Tre重组酶的松散共有序列 (relaxed consensus sequence) SEQ ID NO:39 (具有95%约束(obligation))。黑体字 母表明保守氨基酸,无指定位置用X表示。 实施例 [0149] 实施例1: 鉴定多种毒株中存在的不对称靶序列 通过分为3步的方法鉴定不对称靶序列:根据重组酶的已知识别位点产生位置权矩 阵,提供待搜索识别位点的基因组序列,以及二分检索所提供的序列中的潜在靶位点并 根据起始位置权矩阵对所得命中物(hit)评分,其中核苷酸被转化成二元空间(binary space)。 [0150] 发现379种B亚型HIV-1毒株中348种存在SEQ ID NO:1。此外发现40种A亚型 HIV-1毒株中32种存在SEQ ID NO:1。它位于LTR的R区。 [0151] 发现379种B亚型HIV-1毒株中288种存在SEQ ID NO:2。在所搜索的40种A亚 型HIV-1毒株任一种中未发现存在SEQ ID NO:2。它位于LTR的U3区。 [0152] 实施例2:识别和重组HIV-1的LTR内的不对称靶序列的修整重组酶的产生 为了开始进化过程,选择在HIV-1毒株中是高度保守的HIV-1 LTR序列。发现SEQ ID NO:1和SEQ ID NO:2符合这些标准,并代表了可针对其选择修整重组酶的不对称靶序列。 [0153] 在下文中,详细描述了识别SEQ ID NO:1的修整重组酶的产生。 [0154] 图2中列出迄今为止制作的进化策略和进程的略图。总的来说,按WO 2008/083931中公开和Sarkar等人(Sarkar等,Science 2007)描述,进行特异性识别所需 靶序列的新的Tre重组酶的进化。 [0155] 通过合并及家族改组Cre和几种已知的Cre样重组酶,即Cre突变体的文库(Cre/ Fre) (Buchholz和Stewart,Nature 2001)、之前产生的Tre文库(Sarkar等,Science 2007)、Dre (Sauer等,Nucl Acids Res 2004)、Zre (自肠道沙门氏菌分离,Genbank保 藏号NZ_ABEW01000015)和Shew (希瓦氏菌菌株ANA-3,Genbank保藏号CP000470),来产 生起始重组酶文库(图2A)。为了提高家族改组的效率,在不导致蛋白质序列改变的情况 下,通过尽可能与Cre类似的方式改变核苷酸序列,对Dre和Shew进行修饰(“Cre-ed”)。 为了进行底物关联的蛋白质进化,将起始重组酶文库克隆至含有相应靶亚位点的进化载体 (Sarkar等,Science 2007)中。 [0156] 产生包含靶序列的2种靶核酸的第一亚组,其中第一靶序列称为亚位点1,包含 SEQ ID NO:8,且其中第二靶序列称为亚位点2,包含SEQ ID NO:12。 [0157] 然后在亚位点1和2的基础上产生包含修饰靶序列的靶核酸的第二亚组。如图2 所示,它们分别包含SEQ ID NO:9-11和13-15。用灰色突出显示的是有关被起始文库中所 包含的重组酶识别的已知靶序列的合并库的序列错配。使亚位点文库独立地在大肠杆菌中 生长。在最初几次进化循环(1-4)中,重组酶表达用200 µg/mL L-阿拉伯糖诱导,在接下 来的循环中用100 µg/mL诱导(循环5-6)。使培养物在37℃、振荡下生长13小时。为了 测定重组活性,将从培养物分离的质粒DNA用BsrGI和XbaI消化。与非重组的质粒片段相 比,重组的质粒DNA的消化形成较短的片段(Sarkar等,Science 2007)。在第一个进化循 环后,对于所有亚位点文库1A、1B、1C、2A、2B和2C,未能监测到重组产物条带或可监测到极弱的重组产物条带(图3B)。为了分离成功的重组酶,将质粒DNA用NdeI消化,并通过PCR 扩增后,将其克隆回各自的进化载体中用于下一进化循环(Sarkar等,Science 2007)。在 第一个进化循环后,对于亚位点文库1A、1B、2A和2B,获得足够的残余活性,但对于亚位点文库1C和2C则无(图3C)。发现34-bp靶序列第11位处的错配对于重组活性最为关键。 因此,产生修饰的loxP位点,称为ΔloxP,其只含有这个单一突变(T)和24位(A)处的各 自的反向重复序列。当在含有ΔloxP靶位点的进化载体中测试起始重组酶文库时,获得足 够的残余活性(图3D)。将成功的重组酶的扩增文库克隆回分别具有亚位点1C和2C的进 化载体中,并测试重组活性。此时,对于亚位点文库1C和2C也获得足够的残余活性(图 3D),使得可以开始在所有亚位点上的进化过程。对亚位点1A、1B、1C、2A、2B和2C的每一个进行6个进化循环,显著富集了成功重组酶的文库,正如在图3E所示试验凝胶中所见一样 (与图3B相比)。 [0158] 组合并改组所富集的亚位点文库,以获得用于在靶序列的第二亚组即亚位点1和 亚位点2上继续进化循环过程的文库。然后,如前所述富集成功的重组酶的文库后,对其 进行组合并改组用于进化循环的最终阶段,其是被Tre重组酶特异性识别的靶位点上的进 化。编码重组酶的核酸可自文库获得;并克隆至表达载体中。 [0159] 按WO 2008/083931和Buchholz和Stewart,2001中的描述使用材料和方法,如果 未另有规定的话。 [0160] 对所获得的适于识别并重组不对称靶序列SEQ ID NO:1和SEQ ID NO:2的TRE重 组酶进行测序,并证实其重组不同HIV-1靶毒株的原病毒DNA的能力。 [0161] 参考文献一览 Abremski K, Hoess RH, Sternberg N (1983) “Studies on the properties of P1 site-specific recombination: evidence for topologically unlinked products following recombination (对P1位点特异性重组性质的研究:重组后拓扑学未连接产物 的证据).” Cell 32, 1301-1311。 [0162] Abremski K, Hoess R (1983) “Bacteriophage P1 site-specific recombination. Purification and properties of the Cre recombinase protein (噬菌体P1位点特异性重组。Cre重组酶蛋白的纯化和性质).” J. Biol. Chem. 259, 1509-1514。 [0163] Adachi A, Gendelman HE, Koenig S, Folks T, Willey R, Rabson A, Martin MA (1986) “Production of acquired immunodeficiency syndrome-associated retrovirus in human and nonhuman cells transfected with an infectious molecular clone (用 感染性分子克隆转染的人和非人细胞中获得性免疫缺陷综合征相关逆转录病毒的产生).” J. Virol. 59, 284-291。 [0164] Alper H, Fischer C, Nevoigt E, Stephanopoulos G (2006) “Tuning genetic control through promoter engineering (通过启动子工程调节遗传控制)” Proc. Natl. Acad. Sci. USA 102, 12678-12683。 [0165] Altschul, S.F., Madden, T.L., Schaffer, A.A., Zhang, J., Zhang, Z., Miller, W.和Lipman, D.J. (1997) Gapped BLAST and PSI-BLAST: a new generation of protein database search programs (空位化BLAST和PSI-BLAST:新一代的蛋白质数 据库搜索程序). Nucleic acids research, 25, 3389-3402。 [0166] Beyer WR, Westphal M, Ostertag W, von Laer D (2002) “Oncoretrovirus and lentivirus vectors pseudotyped with lymphocytic choriomeningitis virus glycoprotein: generation, concentration and broad host range (用淋巴细胞脉络 丛脑膜炎病毒糖蛋白准型化的致癌逆转录病毒和慢病毒载体:产生、浓度和宽泛的宿主范 围)”. J. Virol. 76, 1488-1495。 [0167] Blackard JT, Renjifo BR, Mwakagile D, Montano MA, Fawzi WW, Essex M (1999) “Transmission of human immunodeficiency type 1 viruses with intersubtype recombinant long terminal repeat sequences (具有亚型间重组长末端重复序列的人免 疫缺陷1型病毒的传播).” Virology 254, 220-225。 [0168] Bloom JD, Meyer MM, Meinhold P, Otey CR, MacMillan D, Arnold FH (2005) “Evolving strategies for enzyme engineering (酶工程的进化策略).” Curr. Opin. Struct. Biol. 15, 447-452。 [0169] Buchholz F, Ringrose L, Angrand PO, Rossi F, Stewart AF (1996) “Different thermostabilities of FLP and Cre recombinases: implications for applied site-specific recombination (FLP和Cre重组酶的不同热稳定性:对所采用的 位点特异性重组的影响).” Nucl. Acids Res. 24, 4256-4262。 [0170] Buchholz F, Angrand PO, Stewart AF (1998) “Improved properties of FLP recombinase evolved by cycling mutagenesis (通过循环诱变进化的FLP重组酶的改良 性质).” Nat. Biotechnol. 16, 657-662。 [0171] Buchholz F, Stewart AF (2001) “Alteration of Cre recombinase site specificity by substrate-linked protein evolution (因底物关联的蛋白质进化引起 的Cre重组酶位点特异性变化).” Nat. Biotechnol. 19, 1047-1052。 [0172] Chiu YL, Soros VB, Kreisberg JF, Stopak K, Yonemoto W, Greene WC (2005) “Cellular APOBEC3G restricts HIV-1 infection in resting CD4+ T cells (细胞 APOBEC3G限制静息CD4+ T细胞中的HIV-1感染).” Nature 435, 108-114。 [0173] Chun T-W, Engel D, Berrey MM, Shea T, Corey L, Fauci AS (1998) “Early establishment of a pool of latently infected, resting CD4+ T cells during primary HIV-1 infection (初期HIV-1感染期间潜伏感染的静息CD4+ T细胞库的早期建 立).” Proc. Natl. Acad. Sci. USA 95, 8869-8873。 [0174] Coates CJ, Kaminski JM, Summers JB, Segal DJ, Miller AD, Kolb AF (2005) “Site-directed genome modification: derivatives of DNA-modifying enzymes as targeting tools (位点定向的基因组修饰:作为打靶工具的DNA修饰性酶的衍生物).” Trends Biotechnol. 23, 407-419。 [0175] Collins CH, Yokobayashi Y, Umeno D, Arnold FH, (2003) “Engineering proteins that bind, move, make and break DNA (结合、移动、制备和破坏DNA的工程蛋白质).” Curr. Opin. Biotechnol. 14, 665。 [0176] Combes P, Till R, Bee S, Smith MC (2002) “The streptomyces genome contains multiple pseudo-attB sites for the (phi)C31-encoded site-specific recombination system (链霉菌基因组含有多个用于(phi)C31编码的位点特异性重组系 统的pseudo-attB位点).” J. Bacteriol. 184, 5746-5752。 [0177] Crameri A, Raillard SA, Bermudez E, Stemmer WP (1998) “DNA shuffling of a family of genes from diverse species accelerates directed evolution (来自不 同物种的基因家族的DNA改组加快定向进化).” Nature 391, 288-291。 [0178] Derossi D, Joliot AH, Chassaing G, Prochiantz A (1994)“ The thrid helix of the Antennapedia homeodomain translocates through biological membranes (触 角足同源域的第3个螺旋通过生物膜易位).” J. Biol. Chem. 269, 10444-10450。 [0179] Derossi D, Calvet S, Trembleau A, Chassaing G, Prochiantz A (1996) “Cell internalization of the third helix of the Antennapedia homeodomain is receptor-independent (触角足同源域的第3个螺旋的细胞内化不依赖于受体).” J Biol Chem 271, 18188-18193。 [0180] Donovan, P.J., Gearhart, J. (2001) “The end of the beginning for pluripotent stem cells (多潜能干细胞的起始端).” Nature 414, 92-97。 [0181] Donzella GA, Schols D, Lin SW, Este JA, Nagashima KA, Maddon PJ, Allaway GP, Sakmar TP, Henson G, De Clercq E, Moore JP (1998) “AMD3100, a small molecule inhibitor of HIV-1 entry via the CXCR4 co-receptor (AMD3100,一种HIV-1经由CXCR4共同受体进入的小分子抑制剂).” Nature Medicine 4, 72-77。 [0182] Dybul M, Fauci AS, Bartlett JG, Kaplan JE, Pau AK (2002) “Guidelines for using antiretroviral agents among HIV-infected adults and adolescents (HIV-感染成人和青少年中使用抗逆转录病毒药的准则).” Annals of Internal Medicine 137, 381-433。 [0183] Eddy, S.R. (1998) Profile hidden Markov models (图谱隐Markov模型). Bioinformatics (Oxford, England), 14, 755-763。 [0184] Edelman GM, Meech R, Owens GC, Jones FS (2000) “Synthetic promoter elements obtained by nucleotide sequence variation and selection for activity (通过核苷酸序列变异和对活性的选择所获得的合成启动子元件).” Proc. Natl. Acad. Sci. USA 97, 3038-3043。 [0185] Emerman M, Malim MH (1998) “HIV-1 regulatory/accessory genes: keys to unraveling viral and host cell biology (HIV-1调节/辅助基因:阐明病毒和宿主细 胞生物学的关键).” Science 280, 1880-1884。 [0186] Finzi D, Hemankova M, Pierson T, Carruth LM, Buck C, Chaisson RE, Quinn TC, Chadwick K, Margolick J, Brookmeyer R, Gallant J, Markowitz M, Ho DD, Richman DD, Siliciano RF (1997) “Identification of a reservoir for HIV-1 in patients on highly active antiretroviral therapy (接受高效抗逆转录病毒疗法 的患者中HIV-1库的鉴定).” Science 278, 1295-1300。 [0187] Flowers CC, Woffendin C, Petryniak J, Yang S, Nabel GJ (1997) “Inhibition of recombinant human immunodeficiency virus type 1 replication by a site-specific recombinase (通过位点特异性重组酶抑制重组人免疫缺陷病毒1型的 复制).” J. Virol. 71, 2685-2692。 [0188] Gulick RM, Mellors JW, Havlir D, Eron JJ, Gonzalez C, McMahon D, Richman DD, Valentine FT, Jonas L, Meibohm A, Emini EA, Chodakewitz JA (1997) “Treatment with indinavir, zidovudine, and lamivudine in adults with human immunodeficiency virus infection and prior antiretroviral therapy (在患有人免 疫缺陷病毒感染和接受既往抗逆转录病毒疗法的成人中用茚地那韦、齐多夫定和拉米夫定 的治疗).” N. Engl. J. Med. 337, 734-739。 [0189] Guzman LM, Belin D, Carson MJ, Beckwith J (1995) “Tight regulation, modulation, and high-level expression by vectors containing the arabinose PBAD promoter (由含有阿拉伯糖PBAD启动子的载体引起的严格调节、调制和高水平表达).” J. Bacteriol. 177, 4121-4130。 [0190] Hartenbach S, Fussenegger M (2006) “A novel synthetic mammalian promoter derived from an internal ribosome entry site (来源于内部核糖体进入位 点的新的合成哺乳动物启动子).” Biotechnology and Bioengineering 95, 547-559。 [0191] Hauber I, Bevec D, Heukeshoven J, Krätzer F, Horn F, Choidas A, Harrer T, Hauber J (2005) “Identification of cellular deoxyhypusine synthase as a novel target for antiretroviral therapy (作为抗逆转录病毒疗法的新靶标的细胞 ε N -(4-氨丁基)赖氨酸合酶的鉴定).” J. Clin. Invest. 115, 76-85。 [0192] Hazuda DJ, Young SD, Guare JP, Anthony NJ, Gomez RP, Wai JS, Vacca JP, Handt L, Motzel SL, Klein HJ, Dornadula G, Danovich RM, Witmer MV, Wilson KA, Tussey L, Schleif WA, Gabryelski LS, Jin L, Miller MD, Casimiro DR, Emini EA, Shiver JW (2004) “Integrase inhibitors and cellular immunity suppress retroviral replication in rhesus macaques (整合酶抑制剂和细胞免疫在猕猴中抑制 逆转录病毒复制).” Science 305, 528-532。 [0193] Hoess RH, Abremski K (1985) “ Mechanism of strand cleavage and exchange in the Cre-lox site-specific recombination system (Cre-lox位点特异性重组系统中 链切割和交换的机制).” J. Mol. Biol. 181, 351-362。 [0194] Johannes TW, Zhao H (2006) “Directed evolution of enzymes and biosynthetic pathways (酶的定向进化与生物合成途径).” Curr. Opin. Microbiol. 9, 261-267。 [0195] Krasnow MA, Cozzarelli NR (1983) “Site-specific relaxation and recombination by the Tn3 resolvase: Recognition of the DNA path between oriented res sites (经Tn3解离酶引起的位点特异性松驰和重组:定向res 位点间DNA 途径的识别).” Cell 32, 1313-1324。 [0196] Kulkosky J, Bray S (2006) “HAART-persistent HIV-1 latent reservoirs: their origin, mechanisms of stability and potential strategies for eradication (HAART持续的HIV-1潜伏库:其起源、稳定性机制和根除的潜在策略).” Curr. HIV Res. 4, 199-208。 [0197] Lalezari JP, Henry K, O'Hearn M, Montaner JS, Piliero PJ, Trottier B, Walmsley S, Cohen C, Kuritzkes DR, Eron Jr. JJ, Chung J, DeMasi R, Donatacci L, Drobnes C, Delehanty J, Salgo M (2003) “Enfuvirtide, an HIV-1 fusion inhibitor, for drug-resistant HIV infection in North and South America (恩夫韦肽,一种在 北美和南美地区用于抗药性HIV感染的HIV-1融合抑制剂).” N. Engl. J. Med. 348, 2175-2185。 [0198] Lee YS, Park JS (1998) “A novel mutant loxP containing part of long terminal repeat of HIV-1 in spacer region: presentation of possible target site for antiviral strategy using site-specific recombinase (在间隔区中含有HIV-1长 末端重复序列的部分的新的突变体loxP:使用位点特异性重组酶用于抗病毒策略的可能 靶位点的提供).” Biochem. Biophys. Res. Comm. 253, 588-593。 [0199] Lee YS, Kim ST, Kim GW, Lee M, Park JS (2000) “An engineered lox sequence containing part of a long terminal repeat of HIV-1 permits Cre recombinase-mediated DNA excision (含有HIV-1长末端重复序列的部分的工程改造lox 序列允许Cre重组酶介导的DNA切除).” Biochem. Cell Biol. 78, 653-658。 [0200] Lehrman G, Hogue IB, Palmer S, Jennings C, Spina CA, Wiegand A, Landay AL, Coombs RW, Richman DD, Mellors JW, Coffin JM, Bosch RJ, Margolis DM (2005) “Depletion of latent HIV-1 infection in vivo: a proof-of-concept study (体内潜伏HIV-1感染的耗尽:概念验证研究)” Lancet 366, 549-555。 [0201] Lewandoski, M. (2001) “Conditional control of gene expression in the mouse (小鼠中基因表达的条件控制).” Nat. Rev. Genet. 2, 743-755。 [0202] Lin Q, Jo D, Gebre-Amlak KD, Ruley HE (2004) “Enhanced cell-permeant Cre protein for site-specific recombination in cultured cells (培养细胞中位点 特异性重组的增强的细胞通透性Cre蛋白).“ BMC Biotechnol. 4, 25。 [0203] Little SJ, Holte S, Routy JP, Daar ES, Markowitz M, Collier AC, Koup RA, Mellors JW, Connick E, Conway B, Kilby M, Wang L, Whitcomb JM, Hellmann NS, Richman DD (2002) “Antiretroviral-drug resistance among patients recently infected with HIV (新感染HIV的患者中的抗逆转录病毒-药物抗性).” N. Engl. J. Med. 347, 385-394。 [0204] Macara IG (2001) “Transport into and out of the nucleus (核的输入与输 出).” Microbiology and molecular biology reviews 65, 570-594。 [0205] Malim MH, Hauber J, Fenrick R, Cullen BR (1988) “Immunodeficiency virus rev trans-activator modulates the expression of the viral regulatory genes (免 疫缺陷病毒rev反式激活蛋白调节病毒调节基因的表达).” Nature 335, 181-183。 [0206] Marcello A (2006) “Latency: the hidden HIV-1 challenge (潜伏期:隐蔽的HIV-1攻击).” Retrovirology 3, 7。 [0207] Matsumura I, Ellington AD (2001) “In vitro evolution of beta-glucuronidase into a beta-galactosidase proceeds through non-specific intermediates (β-葡糖醛酸糖苷酶朝β-半乳糖苷酶的体外进化通过非特异性中间体 进行).” J. Mol. Biol. 305, 331-339。 [0208] Minshull J, Stemmer WP. (1999) “Protein evolution by molecular breeding (通过分子育种的蛋白质进化).” Curr. Opin. Chem. Biol. 3, 284-290。 [0209] Nagy A (2000) “Cre recombinase: the universal reagent for genome tailoring. (Cre重组酶:基因组修整的通用试剂)” Genesis 26, 99-109。 [0210] Needleman SB, Wunsch CD (1970) “A general method applicable to the search for similarities in the amino acid sequence of two proteins (可适用于在 两种蛋白质的氨基酸序列中搜索相似性的通用方法).” J. Mol. Biol. 48, 443-453。 [0211] Nolden L, Edenhofer F, Haupt S, Koch P, Wunderlich FT, Siemen H, Brustle O. (2006) “Site-specific recombination in human embryonic stem cells induced by cell-permeant Cre recombinase (由细胞通透性Cre重组酶诱导的人胚胎干细胞中的位 点特异性重组).” Nat. Methods 3, 461-467。 [0212] O'Doherty U, Swiggard WJ, Malim MH (2000) “Human immunodeficiency virus type 1 spinoculation enhances infection through virus binding (人免疫缺陷病毒 1型离心提高通过病毒结合的感染).” J. Virol. 74, 10074-10080。 [0213] Pearson WR, Lipman DJ (1988) “Improved tools for biological sequence comparison (用于生物序列比较的改进工具).” Proc Natl Acad Sci USA 85, 2444-2448。 [0214] Peitz M, Pfannkuche K, Rajewsky K, Edenhofer F. (2002) “Ability of the hydrophobic FGF and basic TAT peptides to promote cellular uptake of recombinant Cre recombinase: A tool for efficient genetic engineering of mammalian genomes (疏水FGF和碱性TAT肽促进重组Cre重组酶的细胞摄取的能力:一 种用于哺乳动物基因组的有效遗传工程改造的工具).” Proc. Natl. Acad. Sci. USA 99, 4489-4494。 [0215] Ratner L, Starcich B, Josephs SF, Hahn BH, Reddy EP, Livak KJ, Petteway SR, Jr., Pearson ML, Haseltine WA, Arya SK, (1985) “Polymorphism of the 3' open reading frame of the virus associated with the acquired immune deficiency syndrome, human T-lymphotropic virus type III (获得性免疫缺陷综合征相关病毒、人嗜T淋巴细胞病毒III型的3'可读框的多态性).” Nucl. Acids Res. 13, 8219-8229。 [0216] Richard JP, Melikov K, Brooks H, Prevot P, Lebleu B, Chernomordik LV (2005) “Cellular uptake of the unconjugated TAT peptide involves clathrin-dependent endocytosis and heparin sulfate receptors (非缀合的TAT 肽的细胞摄取涉及网格蛋白依赖性胞吞和硫酸肝素受体).” J. Biol. Chem. 280, 15300-15306。 [0217] Rüfer AW, Sauer B (2002)“ Non-contact positions impose site selectivity on Cre recombinase (强加于Cre重组酶的位点选择性的非接触位置).” Nucl. Acids Res. 30, 2764-2771。 [0218] Ruhl M, Himmelspach M, Bahr GM, Hammerschmid F, Jaksche H, Wolff B, Aschauer H, Farrington GK, Probst H, Bevec D, Hauber J (1993) “Eukaryotic initiation factor 5A is a cellular target of the human immunodeficiency virus type 1 Rev activation domain mediating trans-activation (真核起始因子5A是介 导反式激活的人免疫缺陷病毒1型Rev激活结构域的细胞靶标)” J. Cell Biol. 123, 1309-1320。 [0219] Sanger F, Nickler S, Coulson AR (1977) “DNA sequencing with chain-terminating inhibitors (用链终止抑制剂的DNA测序).” Proc. Natl. Acad. Sci. USA 74, 5463-5467。 [0220] Santoro SW, Schultz PG (2002) “Directed evolution of the site specificity of Cre recombinase (Cre重组酶位点特异性的定向进化).” Proc. Natl. Acad. Sci. USA 99, 4185-4190。 [0221] Saraf-Levy T, Santoro SW, Volpin H, Kushnirsky T, Eyal Y, Schultz PG, Gidoni D, Carmi N (2006) “Site-specific recombination of asymmetric lox sites mediated by a heterotetrameric Cre recombinase complex (由杂四聚Cre重组酶复合 物介导的不对称lox 位点的位点特异性重组).” Bioorg. Med. Chem. 14, 3081-3089。 [0222] Sauer B, McDermott J (2004) “DNA recombination with a heterospecific Cre homolog identified from comparison of the pac-c1 regions of P1-related phages (具有自P1相关噬菌体的pac-cl区的比较鉴定的异种特异性Cre同源物的DNA重 组).” Nucl. Acids. Res. 32, 6086-6095。 [0223] Schambach A, Bohne J, Chandra S, Will E, Margison GP, Williams DA, Baum C (2006) “Equal potency of gammaretroviral and lentiviral SIN vectors for 6 expression of O-methylguanine-DNA methyltransferase in hematoietic cells (用 6 于造血细胞中O-甲基鸟嘌呤-DNA甲基转移酶表达的γ逆转录病毒和慢病毒SIN载体的 同等效能).” Molecular Therapy 13, 391-400。 [0224] Scherr M, Eder M (2002) “Gene Transfer into Hematopoietic Stem Cells Using Lentiviral Vectors (使用慢病毒载体使基因转移至造血干细胞中).” Current Gene Therapy 2, 45-55。 [0225] Shehu-Xhilaga M, Tachedjian G, Crowe SM, Kedzierska K. (2005) “Antiretroviral compounds: mechanisms underlying failure of HAART to eradicate HIV-1 (抗逆转录病毒化合物:HAART根除HIV-1失效的机制).” Curr. Med. Chem. 12, 1705-1719。 [0226] Shimshek DR, Kim J, Hubner MR, Spergel DJ, Buchholz F, Casanova E, Stewart AF, Seeburg PH, Sprengel R (2002) “Codon-improved Cre recombinase (iCre) expression in the mouse (小鼠中密码子改进的Cre重组酶(iCre)表达).” Genesis 32(1), 19-26。 [0227] Smith Tf, Waterman MS (1981) “Overlapping genes and information theory (重叠基因与信息理论).” J. Theor. Biol. 91, 379-380。 [0228] Stark WM, Boocock MR, Sherratt DJ (1992) “Catalysis by site-specific recombinases (位点特异性重组酶的催化).” Trends Genet. 8, 432-439。 [0229] Stemmer WPC (1994) “Rapid evolution of a protein in vitro by DNA shuffling (因DNA改组所致体外蛋白质的快速进化).” Nature 370, 389-391。 [0230] Sternberg N, Hamilton D (1981) “Bacteriophage P1 site-specific recombination. I. Recombination between loxP sites (噬菌体P1位点特异性重组. I. loxP位点之间的重组).” J. Mol. Biol. 150, 467-486。 [0231] Van Duyne GD (2001) “A structural view of cre-loxp site-specific recombination (cre-loxp位点特异性重组的结构示图).” Annu. Rev. Biophys. Biomol. Struct. 30, 87-104。 [0232] Vives E, Brodin P, Lebleu B (1997) “A truncated HIV-1 Tat protein basic domain rapidly translocates through the plasma membrane and accumulates in the cell nucleus (截短HIV-1 Tat蛋白碱性结构域通过血浆膜快速易位并在细胞核中蓄 积).” J. Biol. Chem. 272, 16010-16017。 [0233] Vives E (2003) “Cellular uptake of the TAT peptide: an endocytosis mechanism following ionic interactions (TAT肽的细胞摄取:离子相互作用后的胞吞 机制).” J. Mol. Recognit. 16, 265-271。 [0234] Volkert FC, Broach JR (1986) “Site-specific recombination promotes plasmid amplification in yeast (位点特异性重组促进酵母中的质粒扩增).” Cell 46, 541-550。 [0235] Voziyanov Y, Konieczka JH, Stewart AF, Jayaram M (2003) “Stepwise manipulation of DNA specificity in Flp recombinase: progressively adapting Flp to individual and combinatorial mutations in its target site. (Flp重组酶中DNA 特异性的逐步操作:使Flp逐步适应其靶位点中的单个和组合突变)” J. Mol. Biol. 326, 65-76。 [0236] Yuan L, Kurek I, English J, Keenan R (2005) “Laboratory-directed protein evolution (实验室定向的蛋白质进化)” Microbiol. Mol. Biol. Rev. 69, 373-92。 [0237] WO 2002/44409 WO 2008/083931 Fawell S, Seery J, Daikh Y, Moore C, Chen LL, Pepinsky B, Barsoum J., Tat-mediated delivery of heterologous proteins into cells (异源蛋白质至细胞的 Tat介导的递送)., Proc Natl Acad Sci U S A. 1994 Jan 18;91(2):664-8。 [0238] Elliott G, O'Hare P., Intercellular trafficking and protein delivery by a herpesvirus structural protein (通过疱疹病毒结构蛋白质的胞间运输和蛋白质 递送)., Cell. 1997 Jan 24;88(2):223-33。 [0239] Oess S, Hildt E., Novel cell permeable motif derived from the PreS2-domain of hepatitis-B virus surface antigens (来源于乙型肝炎病毒表面抗原 的PreS2结构域的新的细胞可渗透基序)., Gene Ther. 2000 May;7(9):750-8。