首页 / 增强的基因表达

增强的基因表达有效专利 发明

技术内容

增强的基因表达 [0001] 相关申请的交叉引用 [0002] 本申请要求2010年11月25日提交的美国临时申请号61/417,272的优先权,其通过引用整体并入本文。 发明领域 [0003] 本申请涉及基因表达领域。 [0004] 发明背景 [0005] 对用于诊断或治疗的蛋白的大量制备而言,在哺乳动物细胞中高水平的基因表达一直都是一个挑战。蛋白制备的典型工艺包括以下步骤:1)将包含目标基因的载体转染入哺乳动物细胞,从而使得载体可以通过重组随机并入细胞染色体的位点,以及2)筛选和选出目标基因高水平表达的细胞。随机重组使得蛋白制备类似于科学领域的艺术,而不是可预测可重复的科学过程。此外,大量的筛选工作同样也是高成本、累赘而又不可预知的过程。因此,本领域急需将目标基因并入染色体上可预测的特异位点,并达到高水平的基因表达。 [0006] 发明概述 [0007] 本申请的一方面涉及产生高水平的蛋白的方法,该方法包括将外源目标基因可预见地置于宿主细胞染色体的增强的基因表达区(RIDGE)中并使所述基因在宿主细胞中表达的步骤。 [0008] 在某些实施方式中,本申请所述的方法包括识别宿主细胞染色体上的RIDGE并将锚基因引入RIDGE的步骤。锚基因可以是目标转基因或整合酶特异性位点。锚基因可以通过同源重组被引入RIDGE。 [0009] 在某些实施方式中,本申请所述的方法包括,例如,识别宿主细胞染色体上的RIDGE并将第一整合酶特异性位点引入所述RIDGE的步骤。该方法还包括构建载体并在整合酶存在的条件下将载体引入所述宿主细胞的步骤,所述载体包含目标基因和第二整合酶特异性位点,其中所述基因被不可逆地并入染色体,并且在所述基因的两侧连接有两个整合酶产生位点。在某些实施方式中,所述整合酶产生位点是attL和attR。 [0010] 本申请的另一方面涉及分离的核苷酸,所述核苷酸包含至少一个目标基因的序列和整合酶特异性位点的序列。 [0011] 本申请的另一方面涉及包含至少一个目标基因和整合酶特异性位点的载体。 [0012] 本申请的另一方面涉及包含至少一个目标基因的宿主细胞,所述目标基因的两侧连接有整合酶产生位点(例如,attL和attR)。 [0013] 本申请的另一方面涉及在宿主细胞的单个RIDGE中具有多个相同基因的宿主细胞,或在宿主细胞的多个RIDGE(例如,第一RIDGE和第二RIDGE)中分别具有多个相同基因的宿主细胞。 [0014] 本申请的另一方面涉及在单个RIDGE中具有第一基因和第二基因的宿主细胞,或在第一RIDGE中具有第一基因并在第二RIDGE中具有第二基因的宿主细胞。 [0015] 本申请的另一方面涉及通过在单个如本发明所述的宿主细胞中表达多个基因以产生蛋白的方法。 [0016] 附图简要说明 [0017] 图1显示了整合酶如何催化attB和attP间的不可逆重组。例如,用 整合酶介导包含第一整合酶特异性位点(attP)的质粒整合入包含第二整合酶特异性位点(attB)的染色体,从而使得载体不可逆地整合入染色体并且载体的两侧连接有一组整合酶产生位点(attL和attR)。 [0018] 图2显示了如何在染色体的RIDGE区产生attP位点。用两侧连接有两个LoxP位点的GFP(绿荧光蛋白)和NEO(新霉素抗性)基因的报告子盒进行随机整合,以筛选和识别RIDGE区。盒位点的5’端包含整合酶(例如,PhiC31整合酶)识别位点,attP,其将被同时整合入盒。随后用Cre/LoxP系统从RIDGE区中除去报告子盒并在所述区内产生attP位点。 [0019] 图3显示了包含目标基因(例如,表达抗体或其抗原结合片段的基因)和attB的载体如何在整合酶存在的条件下被整合入染色体。 [0020] 图4显示了野生型attB和attP序列的实例。 [0021] 发明的实施方式 [0022] 本申请的一方面涉及一种增加目标基因表达的新的意想不到的方法,通过将特定的基因以可预测的、任选地不可逆的方式,并入宿主细胞染色体的特定整合位点。本发明的方法包括以下步骤,例如,识别宿主细胞染色体中特定的基因整合位点;将第一整合酶特异性(例如,attP或attB)整合入所述位点,构建包含目标基因和第二整合酶特异性(例如,attB或attP)位点的载体;在整合酶存在或由整合酶介导的条件下,将所述载体整合入宿主细胞,其中所述基因被不可逆地整合入染色体并且基因两侧连接有attL和attR。 [0023] I.特定的基因整合位点的识别 [0024] 本申请使用的术语“特定的基因整合位点”指的是染色体上增强的基因表达区(RIDGE)中的位置或位点。RIDGE是染色体上的区域,在该区域中的基因残基易于高表达。 当外源基因被引入和并入染色体时,在RIDGE中的外源基因表达的水平常常是在非RIDGE中或随机整合位点的相同基因表达水平的数倍(例如,2、5、10、20、50、100、200、300、500、 1000倍)。 [0025] 通过对含有高表达基因簇的转录组的绘图,已经识别了全基因组中的RIDGE。 表1显示了在脑、乳腺、肝和肺组织细胞中,通过比较基因组杂交已被识别的RIDGE(参见,Zhou等,Can.Res.63:5781-5784(2003))。同样可也参见Caron等,Science291: 1289-1292(2001)。 [0026] [0027] 也可通过如Jiao等标题为“retargeting of pre-set regions on chromosome for high gene expression in mammalian cells”中所公开的系统和方法来识别RIDGE(参见,http://hdl.handle.net/1721.1/7491(2005))。简单地说,包含gfp2报告基因的载体被转染入哺乳动物细胞(例如,中国仓鼠卵巢(CHO)细胞),并选出GFP表达水平最高的细胞,其中线性化的载体被整合入CHO细胞的染色体并且在RIDGE中。目标基因,例如,干扰素,随后被用于替换gfp2基因,并且选出能高表达干扰素且GFP荧光强度最弱的CHO细胞。 [0028] RIDGE的识别也可以通过使用全细胞或细胞质mRNA转录水平的微阵列分析,识别那些比看家mRNA,如β-肌动蛋白转录更高(例如,(例如,2、5、10、20、50、100、200、300、 500、1000倍)的RNA,并识别转录出这些RNA的相应的外显子区。 [0029] 特定的基因整合位点包括至少一个下述特征:1)外源基因的插入不应当扰乱RIDGE或染色体中调控元件或基因的功能;2)位点应当是基因间隔区;3)位点应当是在空间和时间上普遍具有活性的;4)位点应当在染色体水平具有转录活性,使得转录机制在所述位点是具有活性的,并且具有更高的转录水平;以及5)外源基因的插入不应当干扰宿主细胞的存活。 [0030] 特定的基因整合位点包含本领域已知的核苷酸序列。例如,表1所示的RIDGE的DNA标记序列是公知的并可从基因数据库中很容易地获得。 [0031] 在某些实施方式中,一旦RIDGE和特定的基因整合位点被识别,可以通过重组将转基因整合入所述位点。例如,常规的靶向载体可以被改造,以用于在目标基因组中的选定位点处插入转基因,其中载体由以下组成:5’同源臂(对应于位点的3’端),其后是目标转基因(通常其前面是特定的启动子或无启动子)、包含正选择标记基因的盒、以及3’同源臂(对应于位点的5’端)。在这些方法中使用的包含选择标记基因的盒由以下组成:普遍存在的表达启动子,以及其后的能使转录信息有效聚腺苷酸化的多腺苷酸化信号序列,所述启动子例如磷酸甘油酸激酶启动子,其驱动阳性药物选择基因的表达,例如新霉素磷酸转移酶,或本领域内熟知的其他合适的药物选择基因。当载体通过同源重组整合至所希望的特定基因整合位点时,选择盒能提供抗药性。随后分析转基因的转录或表达水平。 [0032] 在某些实施方式中,通过同源重组将整合酶特异性位点整合入RIDGE和特定的基因整合位点,使得那些表现出整合酶特异性位点的细胞可作为主细胞系,以便在需要时用于不同的目标基因的整合。 [0033] II.将至少一个整合酶特异性位点整合入至少一个特定的基因整合位点 [0034] 本申请使用的术语“整合酶特异性位点”或“ISS”指的是attP或attB。当第一ISS是attP时,相应的第二ISS是attB(或第一ISS是attB且第二ISS是attP),使得第一ISS和第二ISS可以在整合酶存在或由整合酶介导的条件下,进行位点特异性整合。 [0035] 在某些实施方式中,根据如Jiao等在题为“retargeting of pre-set regions on chromosome for high gene expression in mammalian cells”所公开的方法(参见http://hdl.handle.net/1721.1/7491(2005)),识别RIDGE,并且将报告基因gfp2整合入CHO细胞的RIDGE中。 [0036] 如图2所示,gfp2的基因序列(或其部分),也叫做“U”,可以作为同源重组的基础。在CHO细胞中引入包含序列“U”以及attP和两侧连接有loxP的双选择基因(例如,Neo或hrGFP)的载体,并且attP被引入至与“U”和Neo-hrGFP相邻。通过Cre酶可以将Neo和hRGFP可逆地除去。这使得完整的attP被整合至与特定基因整合位点相邻,并整合至RIDGE中。 [0037] 在某些实施方式中,通过如Zhou等Can.Res.63:5781-5784(2003)所公开的方法已经识别出全基因组中的RIDGE。图2所示的锚序列“U”可以使用本领域已知的,例如染色体II11q13中的特定的DNA标记序列。 [0038] 在某些实施方式中,已经识别出染色体11ROSA26位点是转录活性位点,转录机制可以接近该位点,并且在细胞内也存在由其转录得到的RNA(参见美国专利7,473,557)。 ROSA26位点外显子1下游的序列可以用作如图2所示的锚序列“U”。 [0039] 在某些实施方式中,沿一条染色体或在不同的染色体内有多个“U”或多个特定基因整合位点(其分别具有相同或不同的序列),从而可以在一条或多条染色体内整合入多个整合酶特异性位点。 [0040] III.包含至少一个目标基因和第二整合酶特异性位点的载体的构建 [0041] 如本领域所知,可以很容易地构建包含至少一个目标基因和第二整合酶特异性位点的载体。第二整合酶特异性位点是第一ISS的相应位点,当整合酶存在时,第一和第二位点将进行位点特异性的整合(参见图1)。如图3所示,可以构建包含目标基因、attB位点和标记基因DHFR的靶载体。 [0042] 目标基因可以是编码用于治疗、诊断或预防的蛋白的基因。例如,目标蛋白可以是下述一种或多种,包括,但不限于: [0043] 白血球标记,例如CD2、CD3、CD4、CD5、CD6、CD7、CD8、CD11a,b,c、CD13、CD14、CD18、CD19、CD20、CD22、CD23、CD27及其配体、CD28及其配体B7.1、B7.2、B7.3、CD29及其配体、CD30及其配体、CD40及其配体gp39、CD44、CD45和亚型、CDw52(阿仑单抗(Campath)抗原)、CD56、CD58、CD69、CD72、CTLA-4、LFA-1和TCR; [0044] 组织相容性抗原,例如I类或II类MHC、路易斯Y抗原、SLex、SLey、SLea和SLeb; [0045] 整合素,例如,VLA-1、VLA-2、VLA-3、VLA-4、VLA-5、VLA-6和LFA-1; [0046] 粘附因子,例如Mac-1和p150,95; [0047] 选择素,例如,L-选择素、P-选择素和E-选择素及其反受体VCAM-1、ICAM-1、ICAM-2和LFA-3; [0048] 白介素,例如,IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-10、IL-11、IL-12、IL-13、IL-14和IL-15; [0049] 白介素受体,例如,IL-1R、IL-2R、IL-4R、IL-5R、IL-6R、IL-7R、IL-8R、IL-10R、IL-11R、IL-12R、IL-13R、IL-14R和IL-15R; [0050] 趋化因子,例如,PF4、RANTES、MIP1α、MCP1、NAP-2、Grou、Grog和IL-8; [0051] 生长因子,例如,TNFα、TGFβ、TSH、VEGF/VPF、PTHrP、EGF家族、FGF、PDGF家族、内皮素和胃泌素释放肽(GRP); [0052] 生长因子受体,例如,TNFαR、RGFβR、TSHR、VEGFR/VPFR、FGFR、EGFR、PTHrPR、PDGFR家族、EPO-R、GCSF-R和其他造血生长因子受体; [0053] 干扰素受体,例如,IFNαR、IFNβR和IFNγR; [0054] 免疫球蛋白(Ig)及其受体,例如,IgE、FceRI和FCeRII; [0055] 肿瘤抗原,例如,her2-neu、mucin、CEA和内皮唾酸蛋白; [0056] 过敏原,例如,屋尘螨抗原、lol p1(草)抗原和漆酚; [0057] 病毒蛋白,例如,CMV糖蛋白B、H和gCIII、HIV-1衣壳糖蛋白、RSV衣壳糖蛋白、HSV衣壳糖蛋白、EBV衣壳糖蛋白、VZV衣壳糖蛋白、HPV衣壳糖蛋白、肝炎家族表面抗原; [0058] 毒素,例如,假单孢菌内毒素和骨调素/尿桥蛋白、蛇毒和蜂毒; [0059] 血液因子,例如,补体C3b、补体C5a、补体C5b-9、Rh因子、纤维蛋白原、纤维蛋白和与生长抑制因子相关的髓鞘质; [0060] 酶,例如,胆固醇酯转移蛋白、膜结合基质金属蛋白酶和谷氨酸脱羧酶(GAD);以及 [0061] 各种抗原,包括神经节苷脂GD3、神经节苷脂GM2、LMP1、LMP2、嗜酸性粒细胞主要碱蛋白、嗜酸性粒细胞阳离子蛋白、PANCA、阿马杜里蛋白、IV型胶原、糖化脂质、γ-干扰素、A7、P-糖蛋白和Fas(AFO-1)和氧化-LDL。 [0062] 在某些实施方式中,目标蛋白可以是与抗原(上文已给出了抗原的非限制性的例子)结合的抗体或其片段。抗体或片段可以是多克隆、单克隆、动物源(例如,鼠、兔、骆驼)、人源(例如,全人)、嵌合的、人源化的、可变区、CDR、ScFv、双特异性的、双特异抗体或具有抗原结合能力的其他形式的抗体。 [0063] 在某些实施方式中,载体可以包含多个目标基因。本文所述的载体包括质粒,所述质粒能够表达包含在其中的DNA序列,其中这些序列可操作地连接于其他能够影响其表达的序列,即,启动子/操作子序列。载体被给予了功能性定义:能够影响设置在其中的特定DNA遗传密码表达的任何DNA序列。 [0064] IV.在整合酶存在或由整合酶介导的条件下,将包含至少一个目标基因和整合酶特异性位点的载体与包含至少另一个整合酶特异性位点的染色体整合。 [0065] 如图3所示,包含目标基因和attB的载体被引入宿主细胞,宿主细胞染色体内整合有如上文所公开的attP位点。在宿主细胞内,当整合酶存在或由整合酶介导的条件下(整合酶例如, 整合酶),attP与attB整合从而使得目标基因被整合入染色体。因此,目标基因的两侧连接有两个整合酶产生位点(attL和attR),并位于宿主细胞染色体的增强的基因表达区(RIDGE)中的特定基因整合位点,或与其相邻。 [0066] 在某些实施方式中,整合酶是解离酶或转化酶或位点特异性重组酶的丝氨酸重组酶家族的成员。例如,整合酶是φC31(基因编号:2715866);R4(基因编号:1099373)、来自链霉菌噬菌体TP901-1的整合酶(基因编号:921049和921048)、来自乳球菌噬菌体SpoIVCA的整合酶(基因编号:937799)、在孢子形成时从杆菌基因组中切除前噬菌体样元件的重组酶。 [0067] 在某些实施方式中,本文所述的宿主细胞是能够被载体转化的细胞。宿主细胞可以是原核的(例如,细菌)或真核的(例如,酶母、植物、动物细胞,例如CHO细胞)。 [0068] 在某些实施方式中,通过将含有整合酶基因的载体(包括启动子和其他用于表达的元件)引入宿主细胞使得整合酶能够在宿主细胞中表达,由此使得在宿主细胞中存在整合酶。 [0069] 在某些实施方式中,整合酶特异性位点可以是attB(SEQ ID NO.1)或attB的同源物(例如,98%、95%、90%、85%、80%与SEQ ID NO.1同源)或attP(SEQ ID NO.2)或attP的同源物(例如,98%、95%、90%、85%、80%与SEQ ID NO.2同源)。图4显示了野生型attB和attP序列的示例。 [0070] 在某些实施方式中,整合酶产生位点的序列产生自两个相应的整合酶特异性位点的整合。例如,整合酶产生位点是attL或attR。attL可以具有GTGCCAGGGCGTGCCCTTGAGTTCTCAGTTGGGGG(SEQ ID NO.3)的核苷酸序列或其同源物(例如,98%、95%、90%、85%、 80%与SEQ ID NO.3同源)。attR可以具有CCCCAACTGGGGTAACCTTTGGGCTCCCCGGGCGCG(SEQ ID NO.4)的核苷酸序列或其同源物(例如,98%、95%、90%、85%、80%与SEQ ID NO.4同源)。 [0071] 在某些实施方式中,包含多个基因的多个载体可以被整合入单个宿主细胞染色体的多个整合酶特异性位点,或单个宿主细胞多个染色体的多个整合酶特异性位点。 [0072] 在某些实施方式中,目标基因是表达抗体或其片段的基因。在被整合到染色体的RIDGE后,抗体的表达水平高于随机整合表达水平的数倍(例如,2、3、4、5、10、20、50、100)。 例如,抗体的表达水平达到1pg/细胞/天、2pg/细胞/天、5pg/细胞/天、10pg/细胞/天、 20pg/细胞/天、50pg/细胞/天、100pg/细胞/天。 [0073] 优点。本申请为蛋白制备带来了很大的益处。通过将外源基因整合至宿主细胞染色体的增强的基因表达区(RIDGE)并能确保有效的基因表达,本申请的方法能实现基因的高水平表达。本文所公开的方法为外源基因的位点提供了可预测性,并能消除由多轮扩增和筛选所引起的遗传不稳定性和不需要的表型;并为宿主细胞中蛋白制备的优化缩短时间和降低成本,这对于生产用于治疗、预防和诊断的蛋白而言是十分有益的。此外,在第一整合酶特异性位点被引入宿主细胞的RIDGE后,宿主细胞可以用作主细胞系,用于多种目标基因的表达,因为通过在存在有整合酶的宿主细胞中引入包含目标基因和第二整合酶特异性位点的载体,可以很容易地将目标基因整合至所述第一位点。