首页 / 编辑活性改善的Cas12j蛋白及其应用

编辑活性改善的Cas12j蛋白及其应用实质审查 发明

技术领域

[0002] 本发明涉及基因编辑领域,特别是规律成簇的间隔短回文重复(CRISPR)技术领域。具体而言,本发明涉及一种活性提高的突变的Cas12j蛋白及其应用。

相关背景技术

[0003] CRISPR/Cas技术是一种被广泛使用的基因编辑技术,它通过RNA引导对基因组上的靶序列进行特异性结合并切割DNA产生双链断裂,利用生物非同源末端连接或同源重组进行定点基因编辑。
[0004] CRISPR/Cas9系统是最常用的II型CRISPR系统,它识别3’‑NGG的PAM基序,对靶标序列进行平末端切割。CRISPR/Cas Type V系统是一类新发现的CRISPR系统,它具有5’‑TTN的基序,对靶标序列进行粘性末端切割,例如Cpf1,C2c1,CasX,CasY。然而目前存在的不同的CRISPR/Cas各有不同的优点和缺陷。例如Cas9,C2c1和CasX均需要两条RNA进行指导RNA,而Cpf1只需要一条指导RNA而且可以用来进行多重基因编辑。CasX具有980个氨基酸的大小,而常见的Cas9,C2c1,CasY和Cpf1通常大小在1300个氨基酸左右。此外,Cas9,Cpf1,CasX,CasY的PAM序列都比较复杂多样,而C2c1识别严谨的5’‑TTN,因此它的靶标位点比其他系统容易被预测从而降低了潜在的脱靶效应。
[0005] 中国发明专利CN111770992B中公开了一种Cas蛋白Cas12j.19,还公开了该蛋白可以在真核细胞中进行基因编辑,但是,其编辑活性并不高,为了提高该蛋白的编辑效率,本申请对该蛋白进行了优化,提高了其在真核细胞中的编辑效率。

具体实施方式

[0274] 以下实施例仅用于描述本发明,而非限定本发明。除非特别指明,否则基本上按照本领域内熟知的以及在各种参考文献中描述的常规方法进行实施例中描述的实验和方法。例如,本发明中所使用的免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA等常规技术,可参见萨姆布鲁克(Sambrook)、弗里奇(Fritsch)和马尼亚蒂斯(Maniatis),《分子克隆:实验室手册》(MOLECULAR CLONING:A LABORATORY MANUAL),第2次编辑(1989);《当代分子生物学实验手册》(CURRENT PROTOCOLS IN MOLECULAR BIOLOGY)(F.M.奥苏贝尔(F.M.Ausubel)等人编辑,(1987));《酶学方法》(METHODS IN ENZYMOLOGY)系列(学术出版公司):《PCR 2:实用方法》(PCR 2:A PRACTICAL APPROACH)(M.J.麦克弗森(M.J.MacPherson)、B.D.黑姆斯(B.D.Hames)和G.R.泰勒(G.R.Taylor)编辑(1995))、哈洛(Harlow)和拉内(Lane)编辑(1988)《抗体:实验室手册》(ANTIBODIES,ALABORATORY MANUAL),以及《动物细胞培养》(ANIMAL CELL CULTURE)(R.I.弗雷谢尼(R.I.Freshney)编辑(1987))。
[0275] 另外,实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。本领域技术人员知晓,实施例以举例方式描述本发明,且不意欲限制本发明所要求保护的范围。本文中提及的全部公开案和其他参考资料以其全文通过引用合并入本文。
[0276] 实施例1.Cas突变蛋白的获得
[0277] 针对已知的Cas蛋白(CN111770992B中的Cas12j.19,本实施例中,将其称之为Cas12j19),申请人通过生物信息学预测可能影响其生物学功能的关键氨基酸位点,并将氨基酸位点进行突变,得到了编辑活性提高的Cas突变蛋白。具体的,将Cas12j19编码序列经过密码子优化并合成,野生型Cas12j19的氨基酸序列如SEQ ID No.1所示,其核酸序列如SEQ ID No.2所示,通过生物信息学方法对潜在的Cas12j19与目标序列相互结合的氨基酸进行定点突变。
[0278] SEQ ID No.1:
[0279] MPSYKSSRVLVRDVPEELVDHYERSHRVAAFFMRLLLAMRREPYSLRMRDGTEREVDLDETDDFLRSAGCEEPDAVSDDLRSFALAVLHQDNPKKRAFLESENCVSILCLEKSASGTRYYKRPGYQLLKKAIEEEWGWDKFEASLLDERTGEVAEKFAALSMEDWRRFFAARDPDDLGRELLKTDTREGMAAALRLRERGVFPVSVPEHLDLDSLKAAMASAAERLKSWLACNQRAVDEKSELRKRFEEALDGVDPEKYALFEKFAAELQQADYNVTKKLVLAVSAKFPATEPSEFKRGVEILKEDGYKPLWEDFRELGFVYLAERKWERRRGGAAVTLCDADDSPIKVRFGLTGRGRKFVLSAAGSRFLITVKLPCGDVGLTAVPSRYFWNPSVGRTTSNSFRIEFTKRTTENRRYVGEVKEIGLVRQRGRYYFFIDYNFDPEEVSDETKVGRAFFRAPLNESRPKPKDKLTVMGIDLGINPAFAFAVCTLGECQDGIRSPVAKMEDVSFDSTGLRGGIGSQKLHREMHNLSDRCFYGARYIRLSKKLRDRGALNDIEARLLEEKYIPGFRIVHIEDADERRRTVGRTVKEIKQEYKRIRHQFYLRYHTSKRDRTELISAEYFRMLFLVKNLRNLLKSWNRYHWTTGDRERRGGNPDELKSYVRYYNNLRMDTLKKLTCAIVRTAKEHGATLVAMENIQRVDRDDEVKRRKENSLLSLWAPGMVLERVEQELKNEGILAWEVDPRHTSQTSCITDEFGYRSLVAKDTFYFEQDRKIHRIDADVNAAINIARRFLTRYRSLTQLWASLLDDGRYLVNVTRQHERAYLELQTGAPAATLNPTAEASYELVGLSPEEEELAQTRIKRKKREPFYRHEGVWLTREKHREQVHELRNQVLALGNAKIPEIRT
[0280] SEQ ID No.2:
[0281] atgcccagctacaagagcagcagagtgctggtgagGgacgtgccagaggagctggtggaccactacgaaagaagccacagggtggccgccttcttcatgagactgctgctggccatgagaagagagccctacagcctgagaatgagGgacggaaccgagagagaggtggacctggacgaaaccgacgacttcctgagaagcgccggatgcgaggagccagacgccgtgtctgacgacctgagaagcttcgccctggccgtgctgcaccaggacaacccaaagaagagagcctttctggagagcgagaactgcgtgtcaatcctgtgtctggagaaaagcgcctccggcaccagatactacaaaagacccggctaccagctgctgaagaaggccatcgaggaggagtggggatgggacaagttcgaggcctctctgctggacgagagaacaggagaagtggccgagaagttcgccgccctgagcatggaagactggagaagattcttcgccgccagagaccccgacgatctgggaagagagctgctgaagaccgacaccagagaaggcatggccgccgccctgagactgagagaaagaggagtgttccccgtgagcgtgcccgagcacctggacctggacagcctgaaggccgccatggccagcgccgctgaaagactgaagtcatggctggcctgtaaccagcgcgccgtggacgagaagagcgaactgagaaagagattcgaggaggccctggacggagtggaccctgaaaagtatgccctgtttgagaagttcgctgccgagctgcagcaggccgactacaacgtgaccaagaaactggtgctggccgtgagcgccaagttccccgctaccgagcctagcgagtttaagagaggagtggagatcctgaaggaagatggctacaagcccctgtgggaggactttagagagctgggctttgtgtatctggccgagagaaagtgggaaagaagaagaggcggagccgccgtgaccctgtgtgacgctgacgacagccctatcaaggtgagatttggactgactggcagaggcagaaagtttgtgctgtccgccgccgggagcagattcctgatcacagtgaagctgccctgcggcgatgtgggactgaccgccgtgcccagcaggtacttttggaacccctcagtgggcagaaccacctccaactcttttagaattgagttcaccaagcggaccaccgagaatcgcaggtacgtgggcgaggtgaaagagattggcctggtgaggcagagaggcagatactattttttcatcgactacaacttcgacccagaggaggtgagcgacgagaccaaggtgggcagagccttcttcagagcccccctgaacgagtcaagacctaagccaaaggacaagctgaccgtgatggggattgacctgggcattaacccagcctttgcctttgccgtgtgcaccctgggcgaatgccaggacggaatccggagccccgtggccaaaatggaggacgtgagcttcgactctaccggactgagaggcggaatcggcagccagaagctgcacagagagatgcacaacctgagcgacagatgcttttacggcgccagatacattagactgagcaagaagctgagggacagaggagctctgaacgatatcgaggctagactgctggaagagaagtacatccccggctttagaattgtgcacattgaggacgccgacgagagaagaagaaccgtgggaagaacagtgaaagaaatcaaacaggagtacaaaagaatcagacaccagttctacctgaggtaccacaccagcaagagggacagaacagagctgattagcgccgagtacttcagaatgctgttcctggtgaagaacctgagaaacctgctgaagagctggaacagataccactggacaaccggcgacagagaaagaagaggagggaacccagacgagctgaagagctatgtgagatactataacaatctgagaatggacaccctgaagaaactgacctgcgccatcgtgaggaccgccaaggaacacggagccaccctggtggccatggagaacatccagagagtggacagGgacgacgaggtgaaaagaagaaaggaaaatagcctgctgagcctgtgggcccccggaatggtgctggagagagtggagcaggagctgaagaacgagggaatcctggcctgggagg tggacccaagacatacaagtcagacaagctgcatcaccgacgaatttggctacagaagcctggtggccaaggacaccttctactttgaacaggacagaaaaatccacagaatcgacgccgacgtgaacgccgccatcaacatcgcccgccgcttcctgacccggtacaggagcctgacccagctgtgggccagcctgctggacgacggcagatacctggtgaacgtgaccagacagcacgagagagcctacctggaactgcagaccggcgcccccgccgctacactgaaccctaccgccgaagccagctacgaactggtgggactgagccccgaagaagaagagctggcccagaccagaatcaaacgcaaaaagagagaaccattctacagacacgaaggcgtgtggctgacaagagagaagcacagagagcaggtgcacgaactgagaaaccaggtgctggccctgggcaacgccaagatccccgaaatcagaacc[0282] 通过基于PCR的定点诱变产生Cas蛋白的变体。具体的方法是以突变的位点为中心将Cas12j19蛋白的DNA序列设计分成两部分,设计两对引物分别扩增这两部分DNA序列,同时引物上引入需要突变的序列,最后通过Gibson克隆的方式将两个片段装载到pcDNA3.3‑eGFP载体上。突变体的组合则通过将Cas12j19蛋白的DNA拆分成多段,使用PCR、Gibson clone实现构建。片段扩增试剂盒:TransStart FastPfu DNAPolymerase(含2.5mM dNTPs),具体实验流程详见说明书。胶回收试剂盒: Gel DNA Extraction Mini Kit,具体实验流程详见说明书。载体构建所用试剂盒:pEASY‑Basic Seamless Cloning and Assembly Kit(CU201‑03),具体实验流程详见说明书。
[0283] 基于上述氨基酸突变位点,分别获得了Cas12j19的野生型蛋白(WT),以及不同氨基酸单个位点发生突变的蛋白。
[0284] 实施例2.Cas突变蛋白的编辑活性的验证
[0285] 参照文献(Yang,Yi,et al."Highly efficient and rapid detection of the cleavage activity of Cas9/gRNA  via a fluorescent reporter."Applied biochemistry and biotechnology 180.4(2016):655‑667.)构建了适于验证Cas12j19切割的荧光报告系统。其中荧光报告载体上有RFP和不发光的GFFP荧光蛋白,Cas载体上有CFP的荧光蛋白。选取GFFP序列上的FUT8‑3:ATGGAGGCTGTCTACAATGGGGA靶点进行测试,下划线的位置为PAM序列,DR序列为GUGCUGCUGUCUCCCAGACGGGAGGCAGAACUGCAC,转染CHO细胞48h后用流式分选CFP和RFP中GFP荧光的比例即可确定编辑效率。选取实施例1获得的不同的突变体进行测试。
[0286] 图1示出了不同Cas蛋白的编辑效率,将野生型Cas12j19蛋白(WT,SEQ ID No.1所示)的编辑效率视为1,不同的点代表不同的单氨基酸位点突变的Cas蛋白。如图1,虚线表示编辑效率是野生型编辑效率的1.3倍,均一化之后作图后,大部分单个氨基酸位点突变的突变蛋白相对于野生型Cas12j19的编辑活性会大幅度下降;但是,突变蛋白S3R、Y4R、A154R、S228R、A231R、L99R、S400R、T411R、T647R、D649R、D658R的编辑效率相对于野生型明显提高,其编辑效率是野生型Cas12j19的1.3倍以上,上述突变蛋白S3R、Y4R、A154R、S228R、A231R、L99R、S400R、T411R、T647R、D649R、D658R相对于SEQ ID No.1所示的序列,自N端起第3位氨基酸、第4位氨基酸、第154位氨基酸、第228位氨基酸、第231位氨基酸、第99位氨基酸、第400位氨基酸、第411位氨基酸、第647位氨基酸、第649位氨基酸、第658位氨基酸分别突变为R。
[0287] 由此可知SEQ ID No.1自N端起第3位、第4位、第154位、第228位、第231位、第99位、第400位、第411位、第647位、第649位或第658位是Cas12j19发挥活性的关键位点,通过上述氨基酸位点的突变,可以大幅度提高Cas12j19的编辑效率。
[0288] 实施例3.多突Cas蛋白的编辑活性的验证
[0289] 对Cas12j19编辑效率的进一步优化,将实施例2中筛选到可以提高编辑效率的氨基酸位点与SEQ ID No.1第100位氨基酸突变为K进行突变位点的组合,验证突变后的Cas蛋白的活性,选取GFFP序列上的FUT8‑3:ATGGAGGCTGTCTACAATGGGGA靶点进行测试,下划线的位置为PAM序列,DR序列为GUGCUGCUGUCUCCCAGACGGGAGGCAGAACUGCAC,突变蛋白的获得以及验证方法参考实施例1‑2,获得双位点突变蛋白E100K‑S3R、E100K‑L99R、E100K‑A154R、E100K‑A231R、E100K‑S400R、E100K‑T411R、E100K‑T647R、E100K‑D649R、E100K‑D658R。
[0290] 结果如图2所示,野生型Cas12j19(WT,SEQ ID No.1所示)的编辑效率为30%左右,双突Cas蛋白大幅度提升编辑效率,提升幅度在1‑3倍左右,其中E100K‑S400R突变蛋白的编辑效率为90%左右,编辑效果最好。
[0291] 在E100K‑S400R突变蛋白的基础上进行进一步优化,鉴于FUT8‑3的荧光突变体效率过高,靶点选取FUT8‑8:ATGGAAGGCTGCTTCTGTTCCCA序列进行测试,下划线的位置为PAM序列,突变蛋白的构建以及编辑效率验证的方法同上述实施例。
[0292] 结果如图3所示,在靶点为FUT8‑8时,野生型Cas12j19(WT,SEQ ID No.1所示)的编辑效率为6%,组合三突蛋白E100K‑S400R‑L763R(相对于SEQ ID No.1,第100位氨基酸突变为K,同时,第400位氨基酸突变为R,第763位氨基酸突变为R)以及组合四突蛋白E100K‑S400R‑L763R‑S45T(相对于SEQ ID No.1,第100位氨基酸突变为K,同时第400位氨基酸突变为R,第763位氨基酸突变为R,第45位氨基酸突变为T)的编辑效率均在90%左右,与野生型Cas12j19相比编辑效率明显提升。
[0293] 检测上述筛选的组合四突蛋白E100K‑S400R‑L763R‑S45T对于不同PAM的识别情况,结果如图4所示,野生型Cas12j19在PAM为ATA和ATG时表现出显著的识别偏好性,而组合四突蛋白E100K‑S400R‑L763R‑S45T在测试的所有PAM处均表现显著的识别偏好性,组合四突蛋白E100K‑S400R‑L763R‑S45T与野生型Cas12j19相比在不同PAM的靶点的编辑效率均明显提升,突变蛋白E100K‑S400R‑L763R‑S45T与野生型Cas12j蛋白相比具有更广的PAM识别范围,具有更广阔的应用前景。
[0294] 实施例4.Cas蛋白在植物中编辑效率的验证
[0295] 本实施方式中,采用野生型Cas12j19(WT,SEQ ID No.1所示)、E100K突变的Cas12j19(相对于SEQ ID No.1,第100位氨基酸突变为K)、E100K‑S400R‑L763R‑S45T突变的Cas12j19(相对于SEQ ID No.1,第100位氨基酸突变为K,同时第400位氨基酸突变为R,第763位氨基酸突变为R,第45位氨基酸突变为T)在水稻和大豆中验证其基因编辑效率。采用本领域常规技术构建基因编辑载体,并进行水稻和大豆的遗传转化,在gRNA靶向位点两侧设计引物,扩增得到的片段进行Sanger测序,确定其编辑类型,并计算编辑效率。
[0296] 上述不同的Cas12j19在水稻和大豆中不同靶点的编辑效率如下表所示。
[0297]
[0298] 由上表可知,四突蛋白E100K‑S400R‑L763R‑S45T与野生型Cas12j19以及E100K单突蛋白相比,在水稻和大豆测试的靶点中的编辑效率有显著的提升;甚至,在某些野生型Cas12j19以及E100K单突蛋白没有编辑效率的靶点中,四突蛋白E100K‑S400R‑L763R‑S45T也表现出了良好的编辑效率。
[0299] 尽管本发明的具体实施方式已经得到详细的描述,但本领域技术人员将理解:根据已经公布的所有教导,可以对细节进行各种修改和变动,并且这些改变均在本发明的保护范围之内。本发明的全部分为由所附权利要求及其任何等同物给出。

当前第1页 第1页 第2页 第3页