首页 / Cas13蛋白及其应用

Cas13蛋白及其应用有效专利 发明

技术领域

[0001] 本发明涉及基因工程技术领域,特别是涉及一种Cas13蛋白及其应用。

相关背景技术

[0002] CRISPR‑Cas13是一种基于细菌免疫系统的RNA靶向和编辑系统,可保护细菌免受病毒侵害。CRISPR‑Cas13系统类似于CRISPR‑Cas9系统,但与靶向DNA的Cas9蛋白不同,
Cas13蛋白靶向RNA。
[0003] CRISPR‑Cas13属于Type VI CRISPR‑Cas13系统,它包含一个单一的效应蛋白Cas13。目前,CRISPR‑Cas13根据系统发育可分为多个亚型(如Cas13a、Cas13b、Cas13c和Cas13d)。然而,目前对于发现尺寸紧凑(例如,适用于AAV递送)、在哺乳动物细胞中编辑效率高(例如,RNA靶向/切割活性)和/或细胞毒性低(例如,旁式RNA降解引起的细胞休眠和细胞凋亡,或者脱靶)的新Cas13系统仍存在迫切的需求。

具体实施方式

[0116] 下面通过实施例的方式进一步说明本披露,但并不因此将本披露限制在所述的实施例范围之中。下列实施例中未注明具体条件的实验方法,按照常规方法和条件,或按照商品说明书选择。
[0117] 如本文中所使用的,术语“序列同一性”(identity或percent identity)用于指两个多肽之间或两个核酸之间序列的匹配情况。当两个进行比较的序列中的某个位置都被相同的碱基或氨基酸单体亚单元占据时(例如,两个DNA分子中的每一个的某个位置都被腺嘌
呤占据,或两个多肽中的每一个的某个位置都被赖氨酸占据),那么各分子在该位置上是同一的。两个序列之间的“百分比序列同一性”(percent identity)是由这两个序列共有的匹配位置数目除以进行比较的位置数目× 100%的函数。例如,如果两个序列的10个位置中有
6个匹配,那么这两个序列具有60%的序列同一性。通常,在将两个序列比对以产生最大序列同一性时进行比较。这样的比对可通过使用已公开和可商购的比对算法和程序,诸如但
不限于Clustal  Ω、MAFFT、Probcons、T‑Coffee、Probalign、BLAST,本领域的普通技术人员可合理选择使用。本领域技术人员能确定用于比对序列的适宜参数,例如包括对所比较序
列全长实现较优比对或最佳对比所需要的任何算法,以及对所比较序列的局部实现较优比
对或最佳对比所需要的任何算法。
[0118] 如本文中所使用的,术语“指导多核苷酸”用于指CRISPR‑Cas系统中与Cas蛋白形成CRISPR复合物并将CRISPR复合物引导至靶序列的分子。通常情况下,指导多核苷酸包含与指导序列连接的骨架序列,指导序列可以与靶序列杂交。骨架序列通常包含同向重复序
列,有时还可包含tracrRNA序列。当骨架序列不包含tracrRNA序列时,指导多核苷酸包含指导序列和同向重复序列,此时指导多核苷酸也可称为crRNA。
[0119] CRISPR‑Cas13系统:2类CRISPR‑Cas系统赋予微生物多种适应性免疫机制。本文提供了对原核基因组
和宏基因组的分析,以鉴定包含C13‑52、C13‑55和C13‑88的先前未表征的RNA引导的、可靶向RNA的CRISPR‑Cas13系统,其被归类为VI型系统。基于C13‑52、C13‑55和C13‑88的工程化CRISPR‑Cas13系统在人体细胞中具有较好的活性。本文的结果展示了将C13‑52、C13‑55和C13‑88作为一种可编程的 RNA 结合模块,用于有效靶向细胞RNA,从而为转录组工程以及治疗和诊断方法提供通用平台。
[0120] 本文描述的工程化CRISPR‑Cas13系统可以有效地敲低人类细胞中的内源性靶RNA,为作为转录组工程工具箱的一部分的RNA靶向应用铺平了道路。在一些实施方案中,
C13‑52、C13‑55和C13‑88介导的跨多种内源性转录物的敲低能够比PspCas13b、Cas13X.1和/或Cas13Y.1介导的敲低实现更高的效率和/或特异性。
[0121] 在一些实施方案中,所述编码Cas13蛋白或融合蛋白的多核苷酸序列和/或所述编码指导多核苷酸的多核苷酸序列可操作地连接至调控序列。在一些实施方案中,所述编码
Cas13蛋白或融合蛋白的多核苷酸序列可操作地连接至调控序列。在一些实施方案中,所述编码指导多核苷酸的多核苷酸序列可操作地连接至调控序列。在一些实施方案中,所述编
码Cas13蛋白或融合蛋白的多核苷酸序列的调控序列与所述编码指导多核苷酸的多核苷酸
序列的调控序列相同或不同。
[0122] 在一些实施方案中,本文所述的Cas13蛋白或融合蛋白与SEQ ID NO: 1‑3中任一项相比具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%或100%的序列同一性。当所述CRISPR‑Cas13系统包括包含所述Cas13蛋白与蛋白结构域和/或多肽标签的融合蛋白时,计算融合蛋白的
Cas13部分与参考序列之间的序列同一性百分比。
[0123] 在一些实施方案中,本文所述的Cas13蛋白或融合蛋白包含一个或多个(例如1个或2个)天然HEPN结构域,每个天然HEPN结构域包含RX4H氨基酸基序(其中X表示任意氨基
酸,下标“4”表示为4个连续的氨基酸)。在一些实施方案中,本文所述的Cas13蛋白或融合蛋白包含一个或多个突变的HEPN结构域。在一些实施方案中,所述突变Cas13蛋白或融合蛋白可以加工其指导多核苷酸,但不能切割靶RNA。
[0124] 在一些实施方案中,本文所述的Cas13蛋白或融合蛋白用于RNA切割时没有原间隔区侧翼序列(Protospacer Flanking Sequence, PFS)的要求。
[0125] 本文所述的CRISPR‑Cas13系统可以以多种非限制性方式引入细胞(或无细胞系统):(i)作为Cas13 mRNA或融合蛋白mRNA和指导多核苷酸,(ii)作为单个载体或质粒的一部分,或分为多个载体或质粒,(iii)作为单独的Cas13蛋白或融合蛋白,以及指导多核苷酸,或(iv)作为Cas13蛋白或融合蛋白,以及指导多核苷酸的RNP复合物。
[0126] 在一些实施方案中,所述CRISPR‑Cas13系统、组合物或试剂盒包含编码所述Cas13蛋白或融合蛋白的核酸分子,其中编码序列被密码子优化以在真核细胞中表达。在一些实施方案中,所述CRISPR‑Cas13系统、组合物或试剂盒包含编码所述Cas13蛋白或融合蛋白的核酸分子,其中编码序列被密码子优化以在哺乳动物细胞中表达。在一些实施方案中,所述CRISPR‑Cas13系统、组合物或试剂盒包含编码所述Cas13蛋白或融合蛋白的核酸分子,其中编码序列被密码子优化以在人细胞中表达。
[0127] 在一些实施方案中,编码所述Cas13蛋白或融合蛋白的核酸分子是质粒。在一些实施方案中,编码所述Cas13蛋白或融合蛋白的核酸分子是病毒载体基因组的一部分,例如侧翼为ITR的AAV载体的DNA基因组。在一些实施方案中,编码所述Cas13蛋白或融合蛋白的核
酸分子是mRNA。
[0128] 指导多核苷酸:在一些实施方案中,所述CRISPR‑Cas13系统的所述指导多核苷酸是指导RNA。在一
些实施方案中,所述指导多核苷酸是化学修饰的指导多核苷酸。在一些实施方案中,所述指导多核苷酸包含至少一个化学修饰的核苷酸。在一些实施方案中,所述指导多核苷酸是杂
合RNA‑DNA指导。在一些实施方案中,所述指导多核苷酸是杂合RNA‑LNA(锁核酸)指导。
[0129] 在一些实施方案中,所述指导多核苷酸包含与至少一个同向重复序列(direct repeat,DR)连接的至少一个指导序列(guide sequence,也称为间隔序列spacer 
sequence)。在一些实施方案中,所述指导序列位于同向重复序列的3'端。在一些实施方案中,所述指导序列位于同向重复序列的5'端。
[0130] 在一些实施方案中,所述指导序列包含至少15个核苷酸、至少16个核苷酸、至少17个核苷酸、至少18个核苷酸、至少19个核苷酸、至少20个核苷酸、至少21个核苷酸、至少22个核苷酸、至少23个核苷酸、至少24个核苷酸、至少25个核苷酸、至少26个核苷酸、至少27个核苷酸、至少28个核苷酸、至少29个核苷酸、或至少30个核苷酸。在一些实施方案中,所述指导序列包含不超过60个核苷酸、不超过55个核苷酸、不超过50个核苷酸、不超过45个核苷酸、不超过40个核苷酸、不超过35个核苷酸、或不超过30个核苷酸。在一些实施方案中,所述指导序列包含15‑20个核苷酸、20‑25个核苷酸、25‑30个核苷酸、30‑35个核苷酸或35‑40个核苷酸。
[0131] 在一些实施方案中,所述指导序列与所述靶RNA序列具有足够的互补性以与所述靶RNA杂交并指导所述CRISPR‑Cas13复合物与所述靶RNA的序列特异性结合。在一些实施方案中,所述指导序列与所述靶RNA(或要靶向的RNA的区域)具有100%的互补性,但所述指导序列可以与所述靶RNA具有小于100%的互补性,例如至少80%、至少 85%、至少90%、至少95%、至少98%或至少99%的互补性。
在一些实施方案中,所述指导序列被工程化以与所述靶RNA杂交,错配不超过两个
核苷酸。在一些实施方案中,所述指导序列被工程化以与所述靶RNA杂交,且错配不超过一个核苷酸。在一些实施方案中,所述指导序列被工程化以与所述靶RNA杂交,有或没有错配。
[0132] 在一些实施方案中,所述同向重复序列包含至少20个核苷酸、至少21个核苷酸、至少22个核苷酸、至少23个核苷酸、至少24个核苷酸、至少25个核苷酸,至少26个核苷酸,至少27个核苷酸,至少28个核苷酸,至少29个核苷酸,至少30个核苷酸,至少31个核苷酸,至少32个核苷酸,至少33个核苷酸、至少34个核苷酸、至少35个核苷酸或至少36个核苷酸。在一些实施方案中,所述同向重复序列包含不超过60个核苷酸、不超过55个核苷酸、不超过50个核苷酸、不超过45个核苷酸、不超过40个核苷酸或不超过35个核苷酸。在一些实施方案中,所述同向重复序列包含20‑25个核苷酸、25‑30个核苷酸、30‑35个核苷酸或35‑40个核苷酸。
[0133] 在一些实施方案中,所述同向重复序列被修饰以改变茎环中的核苷酸序列。在一些实施方案中,适配体(aptamer)序列插入或附加到同向重复序列的末端。在一些实施方案中,所述同向重复序列具有与SEQ ID NO: 4‑6中任一项相比至少60%、至少70%、至少 80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少
98%、至少99%或100%的序列同一性。
[0134] 在一些实施方案中,所述CRISPR‑Cas13系统、组合物或试剂盒包含至少2个、至少3个、至少4个、至少5个、至少10个或至少20个不同的指导多核苷酸。在一些实施方案中,所述指导多核苷酸靶向至少2个、至少3个、至少4个、至少5个、至少10个或至少20个不同的靶RNA分子,或靶向一个或多个靶RNA分子的至少2个、至少3个、至少4个、至少5个、至少10个或至少20个不同区域。
[0135] 在一些实施方案中,所述指导多核苷酸包括位于可变指导序列上游的恒定同向重复序列。在一些实施方案中,多个指导多核苷酸是阵列的一部分(其可以是载体的一部分,例如病毒载体或质粒)。例如,包括序列DR‑间隔区‑DR‑间隔区‑DR‑间隔区‑DR的指导阵列可以包括三个独特的未加工指导多核苷酸。一旦被引入细胞或无细胞系统,阵列就会被所述
Cas13蛋白加工成三个单独的成熟指导多核苷酸。这允许多路复用,例如将多个指导多核苷酸递送至细胞或系统以靶向多个靶RNA或单个靶RNA内的多个区域。
[0136] 指导多核苷酸指导CRISPR复合物与靶RNA的序列特异性结合的能力可以通过任何合适的测定来评估。例如,可以将足以形成CRISPR复合物的CRISPR系统的组分,包括待测试的指导多核苷酸,提供给具有相应靶RNA分子的宿主细胞,例如通过编码CRISPR复合物的组分的载体的转染,然后评估靶序列内的优先切割。类似地,可以在试管中评估靶RNA序列的切割,方法是提供靶RNA、CRISPR复合物的组分,包括待测试的指导多核苷酸和不同于测试指导多核苷酸的对照指导多核苷酸,并比较待测试和对照指导多核苷酸之间结合靶RNA的
能力或切割靶RNA的速率。
[0137] Cas13突变体:在一些实施方案中,与野生型Cas13蛋白(SEQ ID NO: 1‑3中任一项)相比,本文提
供的Cas13蛋白包含一个或多个突变,例如单个氨基酸插入、单个氨基酸缺失、单个氨基酸取代,或其组合。在一些实例中,与野生型Cas13蛋白(SEQ ID NO: 1‑3中任一项)相比所述Cas13蛋白包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、
25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、
50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、
75、76、77、78、79、80、81、82、83、84、85、86、87、88、89或90个氨基酸变化(例如插入、缺失或取代),但保留结合与指导多核苷酸的指导序列互补的靶RNA分子的能力,和/或保留将指导阵列RNA转录物加工成指导多核苷酸分子的能力。在一些实例中,与野生型Cas13蛋白(SEQ ID NO: 1‑3中任一项)相比所述Cas13蛋白包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、
16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、
41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、
66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89或90个氨基酸变化(例如插入、缺失或取代),但保留结合与指导多核苷酸的指导序列互补的靶RNA分子的能力。在一些实例中,与野生型Cas13蛋白(SEQ ID NO: 1‑3中任一项)相比所述
Cas13蛋白包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、
25、26、27、28、29或30个氨基酸变化(例如插入、缺失或取代),但保留结合与指导多核苷酸的指导序列互补的靶RNA分子的能力,和/或保留将指导阵列RNA转录物加工成指导多核苷
酸分子的能力。
[0138] 在一些实施方案中,所述Cas13蛋白在催化结构域中包含一个或多个突变并且具有降低的RNA切割活性。在一些实施方案中,所述Cas13蛋白在催化结构域中包含一个突变
并且具有降低的RNA切割活性。在一些实施方案中,所述Cas13蛋白在一个或两个HEPN结构
域中包含一个或多个突变并且基本上缺乏RNA切割活性。在一些实施方案中,所述Cas13蛋
白在一个或两个HEPN结构域中包含突变并且基本上缺乏RNA切割活性。在一些实施方案中,所述“基本上缺乏RNA切割活性”是指与野生型Cas13蛋白相比仅保留≤50%、≤40%、≤30%、≤20%、≤10%、≤5%或≤1%的RNA切割活性,或无可检测的RNA切割活性。
[0139] 在一些实施方案中,所述Cas13蛋白具有与SEQ ID NO: 1‑3中任一项 相比至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。当所述CRISPR‑ Cas13系统包含所述Cas13与蛋白结构域和/或多肽标签的
融合蛋白时,计算融合蛋白的Cas13部分与参考序列之间的序列同一性百分比。
[0140] 在一些实施方案中,所述Cas13蛋白能与指导多核苷酸形成CRISPR复合物,所述CRISPR复合物能与靶RNA序列特异性结合。
[0141] 在一些实施方案中,所述Cas13蛋白能与指导多核苷酸形成CRISPR复合物,所述指导多核苷酸包含与指导序列连接的同向重复序列,所述指导序列被工程化以指导所述
CRISPR复合物与靶RNA的序列特异性结合。
[0142] 一种类型的修饰或突变包括用氨基酸取代具有相似生化性质的氨基酸残基,即保守取代(例如1‑4、1‑8、1‑10或1‑20个氨基酸的保守取代)。通常,保守取代对所得蛋白或肽的活性影响很小或没有影响。例如,保守取代是Cas13蛋白中的氨基酸取代,其基本上不影响Cas13蛋白和与gRNA分子指导序列互补的靶RNA分子的结合,和/或加工指导阵列RNA转录
物成gRNA分子的过程。丙氨酸扫描可用于鉴定Cas13蛋白中的哪些氨基酸残基可以耐受氨
基酸取代。在一个实例中,当丙氨酸或其他保守氨基酸被1‑4、1‑8、1‑10或1‑20个天然氨基酸取代后,变体Cas13蛋白在CRISPR‑Cas系统中修饰基因表达的能力的改变不超过25%,例如不超过20%,例如不超过10%。可以被取代并且被认为是保守取代的氨基酸的例子包括:用Ser替换Ala;用Lys替换Arg;用Gln或His替换Asn;用Glu替换Asp;用Ser替换Cys;用Asn替换Gln;用Asp替换Glu;用Pro替换Gly;用Asn或Gln替换His;用Leu或Val替换Ile;用Ile或Val替换Leu;用Arg或Gln替换Lys;用Leu或Ile替换Met;用Met,Leu或Tyr替换Phe;用Thr替换Ser;用Ser替换Thr;用Tyr替换Trp;用Trp或Phe替换Tyr;用Ile或Leu替换Val。
[0143] 可以通过使用保守性较低的取代来进行更实质性的改变,例如,选择在维持以下效果方面差异更大的残基:(a) 取代发生区域中多肽骨架的结构,例如,作为一个螺旋或折叠构象;(b)与靶位点相互作用的区域的电荷或疏水性;或(c)侧链的体积。通常预期会在多肽功能中产生最大变化的取代是(a):亲水残基(例如丝氨酸或苏氨酸)与疏水残基(例如亮氨酸、异亮氨酸、苯丙氨酸、缬氨酸或丙氨酸)之间的取代;(b)半胱氨酸或脯氨酸与任何其他残基之间的取代;(c)带正电侧链的残基(例如赖氨酸、精氨酸或组氨酸)与带负电残基(例如谷氨酸或天冬氨酸)之间的取代;或(d)具有庞大侧链的残基(例如苯丙氨酸)与不具有侧链的残基(例如甘氨酸)之间的取代。
[0144] 在一些实施方案中,所述Cas13蛋白的RxxxxH基序(x表示任意氨基酸,RxxxxH也可记为Rx4H或R4xH)包含一个或多个突变并且基本上缺乏RNA切割活性。
[0145] 亚细胞定位信号(或称定位信号):在一些实施方案中,所述Cas13蛋白或其功能片段与至少一种同源或异源亚细胞
定位信号融合。示例性的亚细胞定位信号包括细胞器定位信号,例如核定位信号(NLS)、核输出信号(NES)或线粒体定位信号。
[0146] 在一些实施方案中,所述Cas13蛋白或其功能片段与至少1个同源或异源NLS融合。在一些实施方案中,所述Cas13蛋白或其功能片段与至少2个NLS融合。在一些实施方案中,所述Cas13蛋白或其功能片段与至少3个NLS融合。在一些实施方案中,所述Cas13蛋白或其
功能片段与至少1个N‑末端NLS和至少1个C‑末端NLS融合。在一些实施方案中,所述Cas13蛋白或其功能片段与至少2个C‑末端NLS融合。在一些实施方案中,所述Cas13蛋白或其功能片段与至少2个N‑末端NLS融合。
[0147] 在一些实施例中,所述NLS独立地选自SPKKKRKVEAS(SEQ ID NO: 41)、GPKKKRKVAAA(SEQ ID NO: 42)、PKKKRKV(SEQ ID NO: 43)、KRPAATKKA GQA KKKK(SEQ ID NO: 44)、PAAKRVKLD(SEQ ID NO: 45)、RQRRNELKRSP(SEQ ID NO: 46)、NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO: 47)、RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO: 48)、VSRKRPRP(SEQ ID NO: 49)、PPKKARED(SEQ ID NO: 50)、POPKKKPL(SEQ ID NO: 51)、SALIKKKKKMAP(SEQ ID NO: 52)、DRLRR(SEQ ID NO: 53)、PKQKKRK(SEQ ID NO:  54)、RKLKKKIKKL(SEQ ID NO: 55)、REKKKFLKRR(SEQ  ID  NO: 56)、
KRKGDEVDGVDEVAKKKSKK(SEQ ID NO: 57)、RKCLQAGMNLEARKTKK(SEQ ID NO: 58)和
PAAKKKKLD(SEQ ID NO: 59)。
[0148] 在一些实施方案中,所述Cas13蛋白或其功能片段与同源或异源NES融合。在一些实施方案中,所述Cas13蛋白或其功能片段与至少两个NES融合。在一些实施方案中,所述
Cas13蛋白或其功能片段与至少三个NES融合。在一些实施方案中,所述Cas13蛋白或其功能片段与至少一个N‑末端NES和至少一个C‑末端NES融合。在一些实施方案中,所述Cas13蛋白或其功能片段与至少两个C‑末端NES融合。在一些实施方案中,所述Cas13蛋白或其功能片段与至少两个N‑末端NES融合。
[0149] 在一些实施方案中,所述NES独立地选自腺病毒5型E1B NES、HIV Rev NES、MAPK NES和PTK2 NES。
[0150] 在一些实施方案中,所述Cas13蛋白或其功能片段与同源或异源的NLS和NES融合,在所述NLS和所述NES之间存在一个可切割接头。在一些实施方案中,在生产细胞系中所述
NES促进产生包含所述Cas13蛋白或其功能片段的递送颗粒(例如,病毒样颗粒)。在一些实
施方案中,靶细胞中所述接头的切割可以暴露所述NLS并促进靶细胞中所述Cas13蛋白或其
功能片段的核定位。
[0151] 蛋白结构域及多肽标签:在本发明的一些实施方案中,所述融合蛋白包含本文所述的Cas13蛋白或其功能
片段,以及同源或异源蛋白结构域和/或多肽标签。
[0152] 在一些实施方案中,所述Cas13蛋白或其功能片段与同源或异源蛋白结构域和/或多肽标签共价连接或融合。在一些实施方案中,所述Cas13蛋白或其功能片段与同源或异源蛋白结构域和/或多肽标签融合。
[0153] 在一些实施方案中,所述蛋白结构域和多肽标签任选自:胞嘧啶脱氨酶结构域、腺嘌呤脱氨酶结构域、翻译激活结构域、翻译抑制结构域、RNA甲基化结构域、RNA去甲基化结构域、核酸酶结构域、剪接因子结构域、报告域、亲和域、亚细胞定位信号、报告标签和亲和标签。
[0154] 在一些实施方案中,所述蛋白结构域包含胞嘧啶脱氨酶结构域、腺嘌呤脱氨酶结构域、翻译激活结构域、翻译抑制结构域、RNA甲基化结构域、RNA去甲基化结构域、核糖核酸酶结构域、剪接因子结构域、报告域和亲和域。在一些实施方案中,所述多肽标签包含报告标签和亲和标签。
[0155] 在一些实施方案中,所述蛋白结构域的氨基酸序列的长度为≥40个氨基酸、≥50个氨基酸、≥60个氨基酸、≥70个氨基酸、≥80个氨基酸、≥90个氨基酸、≥100个氨基酸、≥
150个氨基酸、≥200个氨基酸、≥250个氨基酸、≥300个氨基酸、≥350个氨基酸或≥400个氨基酸。
[0156] 示例性的蛋白结构域包括可以切割RNA的结构域(例如,PIN 内切核酸酶结构域、NYN结构域、来自SOT1的SMR结构域,或来自葡萄球菌核酸酶的RNase结构域),可以影响RNA稳定性的结构域(例如,tristetraprolin(TTP)或来自UPF1、EXOSC5和STAU1的结构域),可以编辑核苷酸或核糖核苷酸的结构域(例如,胞苷脱氨酶、PPR 蛋白、腺嘌呤脱氨酶、ADAR家族蛋白或APOBEC家族蛋白),可以激活翻译的结构域(例如,eIF4E和其他翻译起始因子,酵母多聚(A)结合蛋白或GLD2的结构域),可以抑制翻译的结构域(例如,Pumilio或FBF PUF蛋白,去腺苷酶,CAF1,Argonaute 蛋白),可以甲基化RNA的结构域(例如,来自m6A甲基转移酶因子(如METTL14、METTL3或WTAP)的结构域),可以使RNA去甲基化的结构域(例如,人类烷基化修复同源物5),可以影响剪接的结构域(例如,SRSF1的富含RS的结构域,hnRNP A1 的富含Gly的结构域,RBM4的富含丙氨酸的基序,或DAZAP1的富含脯氨酸的基序),可以实现亲和纯化或免疫沉淀的结构域,以及可以实现邻近依赖(proximity‑based)蛋白质标记和识别的结构域(例如,生物素连接酶(如BirA)或过氧化物酶(如APEX2),以使靶DNA相互作用蛋白被生物素化)。
[0157] 在一些实施方案中,所述蛋白结构域包含腺嘌呤脱氨酶结构域。在一些实施方案中,具有突变HEPN结构域的所述Cas13蛋白、催化失活的所述Cas13蛋白、或其功能片段与腺嘌呤脱氨酶结构域共价连接或融合以指导哺乳动物细胞中RNA转录物的A‑to‑I脱氨酶活
性。Cox et al., Science 358(6366):1019‑1027 (2017)中描述了基于ADAR2工程化的用
于靶向A‑to‑I RNA编辑的腺嘌呤脱氨酶结构域,其通过引用整体并入本文。在其他实施方案中,腺嘌呤脱氨酶结构域与接头蛋白共价连接或融合,该接头蛋白能够结合插入或附加
到所述指导多核苷酸内的适配体序列,从而允许所述腺嘌呤脱氨酶结构域非共价连接到与
所述指导多核苷酸复合的Cas13蛋白或其功能片段上。
[0158] 在一些实施方案中,所述蛋白结构域包含胞嘧啶脱氨酶结构域。在一些实施方案中,具有突变HEPN结构域的所述Cas13蛋白、催化失活的所述Cas13蛋白、或其功能片段与胞嘧啶脱氨酶结构域共价连接或融合以指导哺乳动物细胞中RNA转录物的C‑to‑U脱氨酶活
性。Abudayyeh et al., Science 365(6451):382‑386 (2019)中描述了从ADAR2进化而来
的用于靶向C‑to‑U RNA编辑的胞嘧啶脱氨酶结构域,该文献通过引用整体并入本文。在其他实施方案中,所述胞嘧啶脱氨酶结构域与接头蛋白共价连接或融合,该接头蛋白能够结
合插入或附加至所述指导多核苷酸的适配体序列,从而允许所述胞嘧啶脱氨酶结构域非共
价连接到与所述指导多核苷酸复合的所述Cas13蛋白或其功能片段上。
[0159] 在一些实施方案中,所述蛋白结构域包含剪接因子结构域。在一些实施方案中,具有突变HEPN结构域的所述Cas13蛋白、催化失活的所述Cas13蛋白、或其功能片段与剪接因子结构域共价连接或融合以指导哺乳动物细胞中靶RNA的可变剪接。Konermann et al., 
Cell 173(3):665‑676 (2018)中描述了用于靶向选择性剪接的剪接因子结构域,其通过引用整体并入本文。剪接因子结构域的非限制性实例包括SRSF1的富含RS的结构域、hnRNPA1
的富含Gly的结构域、RBM4的富含丙氨酸的基序或DAZAP1的富含脯氨酸的基序。在其他实施方案中,所述剪接因子结构域与接头蛋白共价连接或融合,该接头蛋白能够结合插入或附
加至所述指导多核苷酸的适配体序列,从而允许所述剪接因子结构域非共价连接到与所述
指导多核苷酸复合的所述Cas13蛋白或其功能片段上。
[0160] 在一些实施方案中,所述蛋白结构域包含翻译激活结构域。在一些实施方案中,具有突变HEPN结构域的所述Cas13蛋白、催化失活的所述Cas13蛋白、或其功能片段与翻译激活结构域共价连接或融合以激活或增加靶RNA的表达。翻译激活结构域的非限制性实例包
括eIF4E和其他翻译起始因子、酵母聚(A)结合蛋白或GLD2的结构域。在其他实施方案中,所述翻译激活结构域与接头蛋白共价连接或融合,该接头蛋白能够结合插入或附加至所述指
导多核苷酸的适配体序列,从而允许所述翻译激活结构域非共价连接到与所述指导多核苷
酸复合的所述Cas13蛋白或其功能片段上。
[0161] 在一些实施方案中,所述蛋白结构域包含翻译抑制结构域。在一些实施方案中,具有突变HEPN结构域的所述Cas13蛋白、催化失活的所述Cas13蛋白、或其功能片段与翻译抑制结构域共价连接或融合以抑制或降低靶RNA的表达。翻译抑制结构域的非限制性实例包
括Pumilio或FBF PUF蛋白、去腺苷酶、CAF1、Argonaute 蛋白。在其他实施方案中,所述翻译抑制结构域与接头蛋白共价连接或融合,该接头蛋白能够结合插入或附加到所述指导多核
苷酸内的适配体序列,从而允许所述翻译抑制结构域非共价连接到与所述指导多核苷酸复
合的所述Cas13蛋白或其功能片段上。
[0162] 在一些实施方案中,所述蛋白结构域包含RNA甲基化结构域。在一些实施方案中,具有突变HEPN结构域的所述Cas13蛋白、催化失活的所述Cas13蛋白、或其功能片段与RNA甲基化结构域共价连接或融合以用于靶RNA的甲基化。RNA甲基化结构域的非限制性例子包括
m6A结构域,例如METTL14、METTL3或WTAP。在其他实施方案中,所述RNA甲基化结构域与接头蛋白共价连接或融合,该接头蛋白能够结合插入或附加至所述指导多核苷酸的适配体序
列,从而允许所述RNA甲基化结构域非共价连接到与所述指导多核苷酸复合的所述Cas13蛋
白或其功能片段上。
在一些实施方案中,所述蛋白结构域包含RNA去甲基化结构域。在一些实施方案
中,具有突变HEPN结构域的所述Cas13蛋白、催化失活的所述Cas13蛋白或其功能片段与RNA去甲基化结构域共价连接或融合以用于靶RNA的去甲基化。RNA去甲基化结构域的非限制性
实例包括人烷基化修复同源物5或ALKBH5。在其他实施方案中,所述RNA去甲基化结构域共
价连接或融合至接头蛋白,该接头蛋白能够结合插入或附加至所述指导多核苷酸的适配体
序列,从而允许所述RNA去甲基化结构域非共价连接到与所述指导多核苷酸复合的所述
Cas13蛋白或其功能片段上。
[0163] 在一些实施方案中,所述蛋白结构域包含核糖核酸酶结构域。在一些实施方案中,具有突变HEPN结构域的所述Cas13蛋白、催化失活的所述Cas13蛋白、或其功能片段与核糖核酸酶结构域共价连接或融合以切割靶RNA。核糖核酸酶结构域的非限制性实例包括PIN内
切核酸酶结构域、NYN结构域、来自SOT1的SMR结构域或来自葡萄球菌核酸酶的RNase结构
域。
[0164] 在一些实施方案中,所述蛋白结构域包含亲和结构域(亲和域)和/或报告结构域(报告域)。在一些实施方案中,所述Cas13蛋白或其功能片段共价连接或融合至报告结构域,例如荧光蛋白。报告域的非限制性例子包括GST、HRP、CAT、GFP、HcRed、DsRed、CFP、YFP、BFP。
[0165] 在一些实施方案中,所述Cas13蛋白与多肽标签共价连接或融合。在一些实施方案中,所述多肽标签的实例是小多肽序列。在一些实施方案中,所述多肽标签的氨基酸序列的长度为≤50个氨基酸、≤40个氨基酸、≤30个氨基酸、≤25个氨基酸、≤20个氨基酸、≤15个氨基酸、≤10个氨基酸或≤5个氨基酸。在一些实施方案中,Cas13蛋白与亲和标签如纯化标签共价连接或融合。亲和标签的非限制性实例包括HA‑标签、His‑标签(例如6‑His)、Myc‑标签、E‑标签、S‑标签、钙调蛋白标签、FLAG‑标签、GST‑标签、MBP‑标签、Halo 标签或生物素。
[0166] 在一些实施方案中,所述Cas13的失活突变体与蛋白结构域和/或多肽标签融合。
[0167] 在一些实施方案中,Cas13蛋白与ADAR融合。
[0168] 在一些实施方案中,所述Cas13的失活突变体与胞嘧啶脱氨酶或腺嘌呤脱氨酶融合。
[0169] 在一些实施方案中,所述Cas13的失活突变体与胞嘧啶脱氨酶或腺嘌呤脱氨酶直接共价连接、通过刚性连接肽序列连接,或通过柔性连接肽序列连接。
[0170] 适配体序列(Aptamer Sequence):在一些实施方案中,所述指导多核苷酸进一步包含适配体(aptamer)序列。在一些
实施方案中,所述适配体序列被插入到指导多核苷酸的环(loop)中。在一些实施方案中,所述适配体序列被插入到指导多核苷酸的tetra loop中。在一些实施方案中,所述适配体序
列附加到所述指导多核苷酸的末端。
[0171] Konermann et al., Nature 517:583–588 (2015)中描述了将适配体序列插入到CRISPR‑Cas 系统的指导多核苷酸上,该文献通过引用整体并入本文。在一些实施方案中,所述适配体序列包括MS2适配体序列、PP7适配体序列或Qβ适配体序列。
[0172] 接头蛋白(Adaptor protein):在一些实施方案中,所述CRISPR‑Cas13系统进一步包含含有接头蛋白以及同源或
异源蛋白结构域和/或多肽标签的融合蛋白,或编码该融合蛋白的核酸,其中所述接头蛋白能够结合适配体序列。
[0173] Konermann et al., Nature 517:583‑588 (2015)中描述了接头蛋白和蛋白结构域的融合蛋白,该文献通过引用整体并入本文。在一些实施方案中,所述接头蛋白包括MS2噬菌体外壳蛋白(MCP)、PP7噬菌体外壳蛋白(PCP)或Qβ噬菌体外壳蛋白(QCP)。在一些实施方案中,所述蛋白结构域包含胞嘧啶脱氨酶结构域、腺嘌呤脱氨酶结构域、翻译激活结构
域、翻译抑制结构域、RNA甲基化结构域、RNA去甲基化结构域、核酸酶结构域、剪接因子结构域、亲和域或报告域。
[0174] 修饰的指导多核苷酸:在一些实施方案中,所述指导多核苷酸包含修饰的核苷酸。在一些实施方案中,修
饰的核苷酸包含2'‑O‑甲基、2'‑O‑甲基‑3'‑硫代磷酸酯或2'‑O‑甲基‑3'‑硫代PACE。在一些实施方案中,所述指导多核苷酸是化学修饰的指导多核苷酸。Hendel et al., Nat. 
Biotechnol. 33(9):985‑989 (2015)中描述了化学修饰的指导多核苷酸,其全文以引用方式并入本文。
[0175] 在一些实施方案中,所述指导多核苷酸是杂合RNA‑DNA指导、杂合RNA‑LNA(锁核酸)指导、杂合DNA‑LNA指导或杂合DNA‑RNA‑LNA指导。在一些实施方案中,所述同向重复序列包含一个或多个被相应脱氧核糖核苷酸取代的核糖核苷酸。在一些实施方案中,所述指
导序列包含一种或多种被相应脱氧核糖核苷酸取代的核糖核苷酸。杂合RNA‑DNA指导多核
苷酸在WO2016/123230中进行了描述,其通过引用整体并入本文。
[0176] 载体系统:本发明的另一方面涉及包含本文所述的CRISPR‑Cas13系统的载体系统,所述载体
系统包含一个或多个载体,所述载体包含编码所述Cas13蛋白或融合蛋白的多核苷酸序列
和编码所述指导多核苷酸的多核苷酸序列。
[0177] 在一些实施方案中,所述载体系统包含至少一个质粒或病毒载体(例如,逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒)。在一些实施方案中,所述编码Cas13蛋白或融合蛋白的多核苷酸序列和所述编码指导多核苷酸的多核苷酸序列位于同一载体上。在
一些实施方案中,所述编码Cas13蛋白或融合蛋白的多核苷酸序列和所述编码指导多核苷
酸的多核苷酸序列位于多个载体上。
[0178] 在一些实施方案中,所述编码Cas13蛋白或融合蛋白的多核苷酸序列和/或所述编码指导多核苷酸的多核苷酸序列可操作地连接至调控序列。在一些实施方案中,所述编码
Cas13蛋白或融合蛋白的多核苷酸序列可操作地连接至调控序列。在一些实施方案中,所述编码指导多核苷酸的多核苷酸序列可操作地连接至调控序列。在一些实施方案中,所述编
码Cas13蛋白或融合蛋白的多核苷酸序列的调控序列与所述编码指导多核苷酸的多核苷酸
序列的调控序列相同或不同。在一些实施方案中,所述调控序列任选自启动子、增强子、内部核糖体进入位点(IRES)和其他表达控制元件(例如,转录终止信号,如多腺苷酸化信号和poly‑U序列)。在一些实施方案中,所述调控序列包括使核苷酸序列在许多类型的宿主细胞中组成型表达的调控序列,以及使核苷酸序列仅在某些宿主细胞中表达的调控序列(例如,组织特异性调节序列)。组织特异性启动子可以主要在所需的感兴趣组织中直接表达,例如肌肉、神经元、骨、皮肤、血液、特定器官(例如肝脏、胰腺)、或特定的细胞类型(例如淋巴细胞)。调控序列还可以以时间依赖性方式指导表达,例如以细胞周期依赖性或发育阶段依赖性方式,其也可能是或可能不是组织或细胞类型特异性的。在一些实施例中,所述调控序列是增强子元件,例如WPRE、CMV增强子、HTLV‑1的LTR中的R‑U5区段、SV40增强子、或兔β‑珠蛋白外显子2和3之间的内含子序列。
[0179] 在一些实施方案中,所述载体包含pol III启动子(例如,U6和H1启动子)、pol II启动子(例如,逆转录病毒Rous肉瘤病毒(RSV)LTR启动子(任选地带有RSV增强子)、巨细胞病毒(CMV)启动子(任选地带有CMV增强子)、SV40启动子、二氢叶酸还原酶启动子、β‑肌动蛋白启动子、磷酸甘油激酶(PGK)启动子、或EF1α启动子),或pol III启动子和pol II启动子。
[0180] 在一些实施方案中,所述启动子是组成型启动子,其是连续活性的并且不受外部信号或分子的调节。合适的组成型启动子包括但不限于CMV、RSV、SV40、EF1α、CAG和β‑肌动蛋白启动子。在一些实施方案中,所述启动子是受外部信号或分子(例如,转录因子)调节的诱导型启动子。
[0181] 在一些实施方案中,所述启动子是组织特异性启动子,其可用于驱动所述Cas13蛋白或融合蛋白的组织特异性表达。合适的肌肉特异性启动子包括但不限于CK8、MHCK7、肌红蛋白启动子(Mb)、结蛋白(Desmin)启动子、肌肉肌酸激酶启动子(MCK)及其变体,以及SPc5‑
12合成启动子。合适的免疫细胞特异性启动子包括但不限于B29启动子(B细胞)、CD14启动子(单核细胞)、CD43启动子(白细胞和血小板)、CD68(巨噬细胞)和SV40/CD43启动子(白细胞和血小板)。合适的血细胞特异性启动子包括但不限于CD43启动子(白细胞和血小板)、CD45启动子(造血细胞)、INF‑β(造血细胞)、WASP启动子(造血细胞)、SV40/CD43启动子(白细胞和血小板),和SV40/CD45启动子(造血细胞)。合适的胰腺特异性启动子包括但不限于弹性蛋白酶‑1启动子。合适的内皮细胞特异性启动子包括但不限于Fit‑1启动子和ICAM‑2启动子。合适的神经元组织/细胞特异性启动子包括但不限于GFAP启动子(星形胶质细胞)、SYN1启动子(神经元)和NSE/RU5'(成熟神经元)。合适的肾特异性启动子包括但不限于
NphsI启动子(足细胞)。合适的骨特异性启动子包括但不限于OG‑2启动子(成骨细胞、成牙本质细胞)。合适的肺特异性启动子包括但不限于SP‑B启动子(肺)。合适的肝脏特异性启动子包括但不限于SV40/Alb启动子。合适的心脏特异性启动子包括但不限于α‑MHC。
[0182] AAV载体:本发明的另一方面涉及包含本文所述的CRISPR‑Cas13系统的腺相关病毒(AAV)载
体,其中所述腺相关病毒(AAV)载体包含编码本文所述的Cas13蛋白或融合蛋白以及指导多
核苷酸的DNA。
[0183] 通过AAV载体递送CRISPR‑Cas系统在Maeder et al., Nature Medicine 25:229‑233 (2019) 中进行了描述,其通过引用整体并入本文。在一些实施方案中,所述AAV载体包含ssDNA基因组,该基因组包含Cas13蛋白或融合蛋白以及侧接ITR的指导多核苷酸的编码
序列。
[0184] 在一些实施方案中,本文所述的CRISPR‑Cas13系统被包装在AAV载体中,例如AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9和AAVrh74。在一些实施方案中,本文所述的CRISPR‑Cas13系统被包装在AAV载体中,该AAV载体包含具有组织嗜性的工程化衣壳,例如工程化肌肉嗜性衣壳。Tabebordbar et al., Cell 184:4919‑4938 (2021)中描述了
通过定向进化对具有组织趋向性的AAV衣壳进行工程改造,该文献通过引用整体并入本文。
[0185] 脂质纳米粒:本发明的另一方面涉及脂质纳米粒(LNP),其包含本文所述的CRISPR‑Cas13系统,
其中所述LNP包含本文所述的指导多核苷酸,以及编码本文所述的Cas13蛋白或融合蛋白的
mRNA。
[0186] Gillmore et al., N. Engl. J. Med., 385:493‑502 (2021)中描述了CRISPR‑Cas系统的LNP递送,其全文以引用方式并入本文。在一些实施方案中,除了RNA有效负载
(Cas13 mRNA和指导多核苷酸)之外,脂质纳米粒(LNP)还包含四种组分:阳离子或可电离脂质、胆固醇、辅助脂质和PEG‑脂质。在一些实施方案中,所述阳离子或可电离脂质包括 cKK‑E12、C12‑200、ALC‑0315、DLin‑MC3‑DMA、DLin‑KC2‑DMA、FTT5、Moderna SM‑102和Intellia LP01。在一些实施方案中,所述PEG‑脂质包含PEG‑2000‑C‑DMG、PEG‑2000‑DMG或ALC‑0159。
在一些实施方案中,所述辅助脂质包括DSPC。LNP的组分在Paunovska et al., Nature 
Reviews Genetics 23:265‑280 (2022)中进行了描述,该文献通过引用整体并入本文。
[0187] 慢病毒载体:本发明的另一方面涉及包含本文所述CRISPR‑Cas13系统的慢病毒载体,其中所述
慢病毒载体包含本文所述的指导多核苷酸,以及编码本文所述的Cas13蛋白或融合蛋白的
mRNA。在一些实施方案中,所述慢病毒载体是用同源或异源包膜蛋白如VSV‑G假型化的。在一些实施方案中,所述编码Cas13蛋白或融合蛋白的mRNA与适配体序列连接。
[0188] RNP复合物:本发明的另一方面涉及包含本文所述的CRISPR‑Cas13系统的核糖核蛋白复合物,
其中所述核糖核蛋白复合物由本文所述的指导多核苷酸以及Cas13蛋白或融合蛋白形成。
在一些实施方案中,可以通过显微注射或电穿孔将所述核糖核蛋白复合物递送至真核细
胞、哺乳动物细胞或人类细胞。在一些实施方案中,所述核糖核蛋白复合物可以包装在病毒样颗粒中并在体内递送至哺乳动物或人类受试者。
[0189] 病毒样颗粒:本发明的另一方面涉及包含本文所述的CRISPR‑Cas13系统的病毒样颗粒(VLP),
其中所述病毒样颗粒包含:本文所述的指导多核苷酸,以及Cas13蛋白或融合蛋白;或由所述指导多核苷酸以及Cas13蛋白或融合蛋白组成的核糖核蛋白复合物。
[0190] Banskota et al. Cell 185(2):250‑265 (2022)、Mangeot et al., Nature Communications 10(1):1‑15 (2019)、Campbell, et al., Molecular Therapy 27:151‑
163 (2019)、Campbell, et al., Molecular Therapy,27 (2019): 151‑163和Mangeot et al. Molecular Therapy, 19(9):1656‑1666 (2011)描述了工程化VLP,其全文以引用方式并入本文。在一些实施方案中,工程化的病毒样颗粒(VLP)是用同源或异源包膜蛋白例如
VSV‑G假型化的。在一些实施方案中,所述Cas13蛋白通过可切割连接子与gag蛋白(例如
MLVgag)融合,其中靶细胞中接头的切割暴露了位于连接子和Cas13蛋白之间的NLS。在一些实施方案中,所述融合蛋白包含(例如,从5'到3')gag蛋白(例如,MLVgag)、一种或多种NES、可切割连接子、一种或多种NLS、和 Cas13,如Banskota et al. Cell 185(2):250‑265
(2022)所述。在一些实施方案中,所述Cas13蛋白与第一二聚化结构域融合,所述第一二聚化结构域能够与融合至膜蛋白的第二二聚化结构域二聚化或异二聚化,其中配体的存在促
进所述二聚化并富集Cas13蛋白或融合蛋白至VLP中,如Campbell, et al., Molecular 
Therapy 27:151‑163 (2019)中所述。
[0191] 细胞:本发明的另一方面涉及包含本文所述的CRISPR‑Cas13系统的细胞。细胞(例如,其
可用于产生无细胞系统)可以是真核或原核的。此类细胞的实例包括但不限于细菌、古细
菌、植物、真菌、酵母、昆虫和哺乳动物细胞,例如乳杆菌、乳球菌、芽孢杆菌(例如枯草芽孢杆菌)、埃希氏菌属(例如大肠杆菌)、梭菌属、酵母菌属或毕赤酵母属(如酿酒酵母或巴斯德毕赤酵母),乳酸克鲁维酵母、鼠伤寒沙门氏菌、果蝇细胞、秀丽隐杆线虫细胞、非洲爪蟾细胞、SF9细胞、C129细胞、293细胞、脉孢菌和永生化哺乳动物细胞系(例如,Hela细胞、骨髓细胞系和淋巴样细胞系)。
[0192] 在一些实施方案中,所述细胞是原核细胞,例如细菌细胞,例如大肠杆菌。在一些实施方案中,细胞是真核细胞,例如哺乳动物细胞或人类细胞。在一些实施方案中,细胞是原代真核细胞、干细胞、肿瘤/癌细胞、循环肿瘤细胞(CTC)、血细胞(例如,T细胞、B细胞、NK细胞、Tregs等)、造血干细胞、特化免疫细胞(如肿瘤浸润淋巴细胞或肿瘤抑制淋巴细胞)、肿瘤微环境中的基质细胞(如癌症相关成纤维细胞等)。在一些实施方案中,细胞是中枢或外周神经系统的脑或神经元细胞(例如,神经元、星形胶质细胞、小胶质细胞、视网膜神经节细胞、视杆/视锥细胞等)。
[0193] 靶RNA分子:本文所述的CRISPR‑Cas13系统、组合物或试剂盒可用于靶向一种或多种靶RNA分
子,例如存在于生物样品、环境样品(例如土壤、空气或水样品)等中的靶RNA分子。在一些实施方案中,所述靶RNA是编码RNA,例如pre‑mRNA或成熟mRNA。在一些实施方案中,所述靶RNA是核RNA。在一些实施方案中,所述靶RNA是位于真核细胞核中的RNA转录物。在一些实施方案中,所述靶RNA是非编码RNA,例如功能性RNA、siRNA、microRNA、snRNA、snoRNA、piRNA、scaRNA、tRNA、rRNA、lncRNA或lincRNA。
[0194] 在一些实施方案中,除了靶向靶RNA分子之外,本文所述的CRISPR‑Cas13系统、组合物或试剂盒对靶RNA执行以下功能中的一种或多种:切割一种或多种靶RNA分子或使一种或多种靶RNA分子产生切口(nicking),激活或上调一种或多种靶RNA分子,激活或抑制一种或多种靶RNA分子的翻译,使一种或多种靶RNA分子失活,可视化、标记或检测一种或多种靶RNA分子,结合一种或多种靶RNA分子,编辑一种或多种靶RNA分子,运输一种或多种靶RNA分子,以及掩蔽一种或多种靶RNA分子。在一些实例中,本文所述的CRISPR‑Cas13系统、组合物或试剂盒修饰一种或多种靶RNA分子,所述修饰一种或多种靶RNA分子包括以下中的一种或
多种:RNA碱基取代、RNA碱基缺失、RNA碱基插入、靶RNA的断裂、RNA甲基化和RNA去甲基化。
在一些实施方案中,本文所述的CRISPR‑Cas13系统、组合物或试剂盒可以靶向一种或多种靶RNA分子。在一些实施方案中,本文所述的CRISPR‑Cas13系统、组合物或试剂盒可以结合一种或多种靶RNA分子。在一些实施方案中,本文所述的CRISPR‑Cas13系统、组合物或试剂盒可以切割一种或多种靶RNA分子。在一些实施方案中,本文所述的CRISPR‑Cas13系统、组合物或试剂盒可以激活一种或多种靶RNA分子的翻译。在一些实施方案中,本文所述的
CRISPR‑Cas13系统、组合物或试剂盒可以抑制一种或多种靶RNA分子的翻译。在一些实施方案中,本文所述的CRISPR‑Cas13系统、组合物或试剂盒可以检测一种或多种靶RNA分子。在一些实施方案中,本文所述的CRISPR‑Cas13系统、组合物或试剂盒可以编辑一种或多种靶RNA分子。
[0195] 在一些实施方案中,所述靶RNA是AQp1 RNA。使用本文所述的CRISPR‑Cas13系统敲低Aqp1 RNA水平可以减少房水的产生并降低眼压,可用于治疗青光眼等疾病。在一些实施方案中,靶RNA是AQp1 RNA,指导多核苷酸的指导序列为SEQ ID NO: 8。
[0196] 在一些实施方案中,靶RNA是PTBP1 RNA。使用本文所述的CRISPR‑Cas13系统敲低PTBP1 RNA的水平可以促进脑星形胶质细胞转分化为神经元,这可用于治疗帕金森病等疾
病。在一些实施方案中,靶RNA是PTBP1 RNA。
[0197] 在一些实施方案中,靶RNA是VEGFA RNA。使用本文所述的CRISPR‑Cas13系统降低VEGFA RNA的水平可以防止脉络膜新生血管形成,这可以用于治疗诸如年龄相关性黄斑变
性等疾病。
[0198] 在一些实施方案中,靶RNA是ANGPTL3 RNA。使用本文所述的CRISPR‑Cas13系统敲低ANGPTL3 RNA水平可以降低低密度脂蛋白胆固醇(LDL‑C)等血脂,可用于治疗高脂血症、家族性高胆固醇血症等动脉粥样硬化性心血管疾病。
[0199] 治疗应用:本发明的另一方面涉及一种药物组合物,其包含本文所述的CRISPR‑Cas13系统、
本文所述的Cas13蛋白、本文所述的融合蛋白、本文所述的指导多核苷酸、本文所述的核酸、本文所述的载体系统、本文所述的脂质纳米粒、本文所述的慢病毒载体、本文所述的核糖核蛋白复合物、本文所述的病毒样颗粒、或本文所述的真核细胞。所述药物组合物可以包含例如编码本文所述的Cas13蛋白或融合蛋白以及指导多核苷酸的AAV载体。所述药物组合物可
以包含例如脂质纳米粒,该脂质纳米粒包含本文所述的指导多核苷酸和编码所述Cas13蛋
白或融合蛋白的mRNA。所述药物组合物可以包含例如包含本文所述的指导多核苷酸和编码
所述Cas13蛋白或融合蛋白的mRNA的慢病毒载体。所述药物组合物可以包含例如:包含本文所述的指导多核苷酸以及Cas13蛋白或融合蛋白的病毒样颗粒;或由所述指导多核苷酸以
及Cas13蛋白或融合蛋白形成的核糖核蛋白复合物。
[0200] 本发明的另一方面涉及本文所述的CRISPR‑Cas13系统、本文所述的Cas13蛋白、本文所述的融合蛋白、本文所述的指导多核苷酸、本文所述的核酸、本文所述的载体系统、本文所述的脂质纳米粒、本文所述的慢病毒载体、本文所述的核糖核蛋白复合物、本文所述的病毒样颗粒、或本文所述的真核细胞在切割或编辑哺乳动物细胞中的靶RNA中的用途。
[0201] 本发明的另一方面涉及本文所述的CRISPR‑Cas13系统、本文所述的Cas13蛋白、本文所述的融合蛋白、本文所述的指导多核苷酸、本文所述的核酸、本文所述的载体系统、本文所述的脂质纳米粒、本文所述的慢病毒载体、本文所述的核糖核蛋白复合物、本文所述的病毒样颗粒、或本文所述的真核细胞在以下任一项的用途:切割一种或多种靶RNA分子或使一种或多种靶RNA分子产生切口(nicking),激活或上调一种或多种靶RNA分子,激活或抑制一种或多种靶RNA分子的翻译,使一种或多种靶RNA分子失活,可视化、标记或检测一种或多种靶RNA分子,结合一种或多种靶RNA分子,运输一种或多种靶RNA分子,以及掩蔽一种或多种靶RNA分子。
[0202] 本发明的另一方面涉及本文所述的CRISPR‑Cas13系统、本文所述的Cas13蛋白、本文所述的融合蛋白、本文所述的指导多核苷酸、本文所述的核酸、本文所述的载体系统、本文所述的脂质纳米粒、本文所述的慢病毒载体、本文所述的核糖核蛋白复合物、本文所述的病毒样颗粒、或本文所述的真核细胞在哺乳动物细胞中修饰一种或多种靶RNA分子的用途,所述修饰一种或多种靶RNA分子包括以下中的一种或多种:RNA碱基取代、RNA碱基缺失、RNA碱基插入、靶RNA的断裂、RNA甲基化和RNA去甲基化。
[0203] 本发明的另一方面涉及本文所述的CRISPR‑Cas13系统、本文所述的Cas13蛋白、本文所述的融合蛋白、本文所述的指导多核苷酸、本文所述的核酸、本文所述的载体系统、本文所述的脂质纳米粒、本文所述的慢病毒载体、本文所述的核糖核蛋白复合物、本文所述的病毒样颗粒、或本文所述的真核细胞在诊断、治疗或预防与靶RNA相关的疾病或病症中的用途。在一些实施方案中,所述疾病或病症是帕金森病。在一些实施方案中,所述疾病或病症是帕金森病,并且靶RNA是PTBP1 RNA。在一些实施方案中,所述疾病或病症是青光眼。在一些实施方案中,所述疾病或病症是青光眼,并且靶RNA是AQp1 RNA。在一些实施方案中,所述疾病或病症是肌萎缩侧索硬化症。在一些实施方案中,所述疾病或病症是肌萎缩侧索硬化症,并且靶RNA是超氧化物歧化酶1 (SOD1) RNA。在一些实施方案中,所述疾病或病症是年龄相关性黄斑变性,并且靶RNA是VEGFA RNA。在一些实施方案中,所述疾病或病症是年龄相关性黄斑变性,并且靶RNA是VEGFA RNA或VEGFR1 RNA。在一些实施方案中,所述疾病或病症是血浆LDL胆固醇水平升高。在一些实施方案中,所述疾病或病症是血浆LDL胆固醇水平升
高,并且靶RNA是PCSK9 RNA或ANGPTL3 RNA。
[0204] 本发明的另一方面涉及涉及本文所述的CRISPR‑Cas13系统、本文所述的Cas13蛋白、本文所述的融合蛋白、本文所述的指导多核苷酸、本文所述的核酸、本文所述的载体系统、本文所述的脂质纳米粒、本文所述的慢病毒载体、本文所述的核糖核蛋白复合物、本文所述的病毒样颗粒、或本文所述的真核细胞在制备用于诊断、治疗或预防与靶RNA相关的疾病或病症的药物中的用途。在一些实施方案中,所述疾病或病症是帕金森病。在一些实施方案中,所述疾病或病症是青光眼。在一些实施方案中,所述疾病或病症是肌萎缩侧索硬化
症。在一些实施方案中,所述疾病或病症是年龄相关性黄斑变性。在一些实施方案中,所述疾病或病症是血浆LDL胆固醇水平升高。在一些实施方案中,所述疾病或病症是帕金森病,并且靶RNA是PTBP1 RNA。在一些实施方案中,所述疾病或病症是青光眼,并且靶RNA是AQp1 RNA。在一些实施方案中,所述疾病或病症是肌萎缩侧索硬化症,并且靶RNA是超氧化物歧化酶1(SOD1)RNA。在一些实施方案中,所述疾病或病症是年龄相关性黄斑变性,并且靶RNA是VEGFA RNA或VEGFR1 RNA。在一些实施方案中,所述疾病或病症是血浆LDL胆固醇水平升高,并且靶RNA是PCSK9 RNA或ANGPTL3 RNA。
[0205] 在一些实施方案中,将药物组合物体内递送至人类受试者。所述药物组合物可以通过任何有效途径递送。示例性给药途径包括但不限于静脉内输注、静脉内注射、腹膜内注射、肌肉内注射、瘤内注射、皮下注射、皮内注射、心室内注射、血管内注射、小脑内注射、眼内注射、视网膜下注射、玻璃体内注射 、前房内注射、鼓室内注射、鼻内给药和吸入。
[0206] 在一些实施方案中,靶向RNA的方法导致编辑靶RNA的序列。例如,通过使用具有非突变HEPN结构域的Cas13蛋白或融合蛋白以及包含对靶RNA特异的指导序列的指导多核苷酸,可以在精确位置切割靶RNA或使靶RNA形成切口(nick,例如在靶RNA以双链型核酸分子存在时切割其中任一条单链)。在一些实例中,这种方法用于降低靶RNA的表达,这将降低相应蛋白质的翻译。这种方法可以用于不需要增加RNA表达的细胞中。在一个实例中,RNA与诸如囊性纤维化、亨廷顿氏病、Tay‑Sachs、脆性X综合征、脆性X相关性震颤/共济失调综合征、肌营养不良、强直性肌营养不良、脊髓性肌萎缩、脊髓小脑共济失调、年龄相关性黄斑变性,或家族性ALS等疾病有关。在另一个例子中,RNA与癌症(例如肺癌、乳腺癌、结肠癌、肝癌、胰腺癌、前列腺癌、骨癌、脑癌、皮肤癌(例如黑素瘤)或肾癌)相关。靶RNA的实例包括但不限于与癌症相关的那些(例如,PD‑L1、BCR‑ABL、Ras、Raf、p53、BRCA1、BRCA2、CXCR4、β‑连环蛋白、HER2 和 CDK4)。编辑这样的靶RNA可以产生治疗效果。
[0207] 在一些实施方案中,RNA在免疫细胞中表达。例如,靶RNA可以编码导致抑制所需免疫反应(例如肿瘤浸润)的蛋白质。敲低这种RNA可以促进这种需要的免疫反应(例如,PD1、CTLA4、LAG3、TIM3)。在另一个例子中,靶RNA编码导致不希望的免疫反应激活的蛋白质,例如在自身免疫疾病如多发性硬化、克罗恩病、狼疮或类风湿性关节炎的情况下。
[0208] 诊断应用:本发明的另一方面涉及一种体外组合物,其包含本文所述的CRISPR‑Cas13系统和
不能与本文所述的指导多核苷酸杂交的标记的detector RNA。
[0209] 本发明的另一方面涉及本文所述的CRISPR‑Cas13系统在检测疑似包含靶RNA的核酸样品中的靶RNA的用途。
[0210] 在一些实施方案中,检测靶RNA的方法包括与荧光蛋白或其他可检测标记融合的Cas13蛋白或融合蛋白以及包含对靶RNA特异的指导序列的指导多核苷酸。Cas13蛋白或融
合蛋白与靶RNA的结合可以通过显微镜或其他成像方法进行可视化。在另一个例子中,RNA
适配体序列可以附加到或插入到指导多核苷酸,例如MS2、PP7、Qβ和其他适配体。引入与这些适配体特异性结合的蛋白质,例如与荧光蛋白或其他可检测标记融合的MS2噬菌体外壳
蛋白可用于检测靶RNA,因为Cas13‑指导‑靶RNA复合物将通过适配体相互作用而被标记。
[0211] 在一些实施方案中,在无细胞系统中检测靶RNA的方法导致产生可检测的标记或酶活性。例如,通过使用Cas13蛋白、包含对靶RNA特异的指导序列的指导多核苷酸、和可检测标记,靶RNA将被Cas13识别。Cas13与靶RNA的结合会触发其RNase活性,这会导致靶RNA以及可检测标记的切割。
[0212] 在一些实施方案中,可检测标记是与荧光探针和淬灭剂连接的RNA。完整的可检测RNA连接荧光探针和淬灭剂,抑制荧光。在可检测RNA被Cas13切割后,荧光探针从淬灭剂中释放出来并显示出荧光活性。这种方法可用于确定靶RNA是否存在于裂解的细胞样品、裂解的组织样品、血液样品、唾液样品、环境样品(例如水、土壤或空气样品)、或其他裂解的细胞或无细胞样品中。这种方法还可用于检测病原体,例如病毒或细菌,或诊断疾病状态,例如癌症。
[0213] 在一些实施方案中,靶RNA的检测有助于诊断疾病和/或病理状态,或病毒或细菌感染的存在。例如,Cas13介导的非编码RNA如PCA3的检测,如果在患者尿液中检测到则可用于诊断前列腺癌。在另一个例子中,Cas13介导的lncRNA‑AA174084的检测,其是一种胃癌的生物标志物,可用于诊断胃癌。
[0214] 实施例1.Cas13蛋白的筛选1、CRISPR和基因的注释
对来自NCBI Gebank和CNGB(中国国家基因库)数据库的微生物基因组,预测全基
因组的蛋白,然后使用软件预测基因组上的CRISPR array进行分析注释。
[0215] 2、蛋白的初步筛选用聚类分析去除冗余的蛋白,同时过滤掉氨基酸序列长度小于800AA(氨基酸)或
者大于1400AA的蛋白。
[0216] 3、CRISPR相关蛋白的获得CRISPR Array上下游10kb以内的蛋白序列和已知Cas13蛋白进行比对,过滤掉
evalue大于1*e‑5的蛋白。然后再与NCBI的NR库、EBI的专利库比对,过滤掉相似度高的蛋白,再经挑选得到候选蛋白。
[0217] 发明人对众多候选蛋白进行进一步筛选和实验验证,最终得到C13‑52蛋白(SEQ ID NO: 1)、C13‑55蛋白(SEQ ID NO: 2)和C13‑88蛋白(SEQ ID NO: 3)。C13‑52蛋白也称为CasRfg.7。C13‑55蛋白也称为CasRfg.5。C13‑88蛋白也称为CasRfg.6。这些蛋白的基因组序列来源如表1所示。
[0218] 表1. Cas13蛋白的基因组序列的来源.
[0219] C13‑52对应的同向重复(direct repeat,DR)序列为:5’‑GTTGTGAAAGGCCACCGAAATGGTGGTTCAAGCAAC‑3’(SEQ ID NO: 4)。
[0220] C13‑55对应的同向重复(direct repeat,DR)序列为:5’‑GTTGAGAAACACCGCTGATGGCGGCTGTTCTGAGAC‑3’(SEQ ID NO: 5)。
[0221] C13‑88对应的同向重复(direct repeat,DR)序列为:5’‑GTTGTTTAGACCGCCATTTCGGCGACCCTTCGCAAC ‑3’(SEQ ID NO: 6)。
[0222] 使用RNA fold预测得到上述同向重复序列的RNA二级结构如图1‑图3所示。
[0223] 实施例2. Cas13蛋白的编辑效率验证1、构建靶向AQp1 RNA的编辑载体
本实验选择的测试靶核酸是AQp1(Aquaporin 1) RNA,使用高表达AQp1的293T细
胞系。
[0224] 高表达AQp1的293T细胞系(293T‑AQp1细胞)的构建方法如下:按照常规方法构建过表达AQp1基因的载体Lv‑AQp1‑T2a‑GFP(序列如SEQ ID NO: 
7所示)。上述载体以慢病毒载体为基础,插入AQp1基因和EGFP基因,AQp1与EGFP使用2A肽(T2a)进行间隔。将Lv‑AQp1‑T2a‑GFP质粒包装慢病毒后转导293T细胞,形成稳定过表达AQp1基因的细胞系。
[0225] CRISPR‑Cas13系统中,靶向AQp1的gRNA的指导序列为:AGGGCAGAACCGATGCTGATGAAGAC(SEQ ID NO: 8)。
[0226] 在外包公司分别合成带有通用型gRNA骨架表达框的C13‑55‑BsaI质粒载体(序列如SEQ ID NO: 9)、C13‑88‑BsaI质粒载体(序列如SEQ ID NO: 10)。
[0227] 选择阳性对照蛋白时,考虑CasRx是本领域目前已公开的编辑效率最高的Cas13蛋白,将其作为对照,使用常规方法制备得到以下对照载体:
阴性对照载体CasRx‑blank(SEQ ID NO: 11),用于表达CasRx和gRNA,该gRNA不靶
向真核细胞的任何基因;
阳性对照载体CasRx‑AQp1(SEQ ID NO: 12),用于表达CasRx和靶向AQp1 RNA的
gRNA。
[0228] 使用引物退火方式获得靶向AQp1靶位点的片段,其引物如下所示:C13‑55‑AQp1对应引物:
AGACagggcagaaccgatgctgatgaagac(SEQ ID NO: 13)
AAAAgtcttcatcagcatcggttctgccct(SEQ ID NO: 14)
C13‑88‑AQp1对应引物:
CACCGagggcagaaccgatgctgatgaagac(SEQ ID NO: 15)
CAACgtcttcatcagcatcggttctgccctc(SEQ ID NO: 16)
引物退火反应体系如下:
Oligo‑F(10 μM)2 μl
Oligo‑R(10 μM)2 μl
10×内切酶反应缓冲液2 μl
去离子水up to 20 μl。
[0229] 在PCR仪内95℃孵育5分钟,随后立刻取出在冰上孵育5分钟,使引物之间互相退火形成含粘性末端的双链DNA。
[0230] 对合成的C13‑55‑BsaI、C13‑88‑BsaI质粒使用内切酶(BsaI)进行酶切后,将纯化回收的骨架和上述退火产物进行T4连接,转化大肠杆菌后挑选阳性克隆并提取质粒。得到C13‑55‑AQp1、C13‑88‑AQp1载体,载体架构为CMV‑Cas13‑U6‑gRNA,可表达C13‑55、C13‑88蛋白(架构为NLS‑Cas13‑SV40 NLS‑nucleoplasmin NLS‑HA),以及含对应DR序列的靶向AQp1的gRNA。
[0231] 2、待验证载体转染293T‑AQp1细胞按照Lipofectamine 2000(Thermo)说明书操作,将C13‑55‑AQp1、C13‑88‑AQp1及
对照质粒按照500ng在24孔板中转染293T‑AQp1细胞。未转染质粒的293T‑AQp1细胞作为空白对照(blank)。
[0232] 3、qPCR检测靶基因的RNA变化转染后72h的细胞使用SteadyPureUniversal RNA Extraction Kit AG21017试剂
盒提取RNA,并使用超微量分光光度计检测RNA浓度。RNA产物使用Evo M‑MLVMix Kit with gDNA Clean for qPCR AG11728反转录试剂盒进行反转录,反转录产物使用SYBRGreen 
PremixPro TaqHS qPCR Kit(Low Rox Plus)AG11720 qPCR试剂盒进行检测。
[0233] 其中qPCR所使用引物如下所示:检测AQp1:gctcttctggagggcagtgg(SEQ ID NO: 17)
cagtgtgacagccgggttgag(SEQ ID NO: 18)
检测内参GAPDH:CCATGGGGAAGGTGAAGGTC(SEQ ID NO: 19)
GAAGGGGTCATTGATGGCAAC(SEQ ID NO: 20)
按照SYBR® Green Premix Pro Taq HS qPCR Kit(Rox Plus)AG11718使用说明
配置反应体系,使用QuantStudio™ 5 Real‑Time PCR System进行检测。
[0234] 使用相对定量方法即2‑△△Ct法计算目标RNA的变化。其计算方式如下所示:△Ct= Ct (AQp1)‑Ct (GAPDH)
△△Ct=△Ct(待验证样品)‑△Ct(CasRx‑blank)
2‑△△Ct=2^(‑△△Ct)
独立重复3次实验,结果数据取3次测试的平均值。结果如表2和图4所示。
表2. Cas13对AQp1 RNA的敲降测试结果
[0235] 上述实验结果显示,C13‑55、C13‑88均对AQp1 RNA有明显的敲降(P<0.05),编辑效率高达97%、78%,且C13‑55蛋白的编辑效率接近于CasRx。
[0236] 实施例3. 与已知Cas13工具对比1、验证载体及对照载体构建
选择阳性对照蛋白时,考虑CasRx是本领域目前已公开的编辑效率最高的Cas13蛋
白,同时设置报道较多的Cas13蛋白如PspCas13b、Cas13X.1、Cas13Y.1作为对照。
[0237] 构建得到表3所示的CasRx、PspCas13b、Cas13X.1、Cas13Y.1、C13‑52、C13‑55、C13‑88、C13‑115靶向PTBP1和VEGFA的验证载体。本实验例全部验证载体均使用与实施例2同样的质粒骨架,其架构为CMV‑Cas13‑U6‑crRNA,表达的Cas13均在N端带有1个NLS,在C端带有2个NLS,总共为3×NLS的结构。crRNA由指导序列以及现有技术已公开的各自对应的DR序列
组成。示例性地,给出CasRx‑EGFP(SEQ ID NO: 32)、CasRx‑VEGFA(SEQ ID NO: 33)、PspCas13b‑VEGFA(SEQ ID NO: 34)、Cas13X.1‑VEGFA(SEQ ID NO: 35)、Cas13Y.1‑VEGFA(SEQ ID NO: 36)、C13‑52‑VEGFA(SEQ ID NO: 37)、C13‑55‑VEGFA(SEQ ID NO: 38)、C13‑
88‑VEGFA(SEQ ID NO: 39)和C13‑115‑VEGFA(SEQ ID NO: 40)质粒序列。靶向PTBP1的质粒序列仅是gRNA编码序列不同。
[0238] C13‑115的氨基酸序列如SEQ ID NO: 21所示,对应DR序列如SEQ ID NO: 22所示。
[0239] 因为293T细胞中不含有EGFP序列,因此使用CasRx靶向EGFP的载体作为阴性对照。
[0240] 靶向EGFP的spacer为tgccgttcttctgcttgtcggccatgatat(SEQ ID NO: 29)。
[0241] 靶向PTBP1的spacer为GTGGTTGGAGAACTGGATGTAGATGGGCTG(SEQ ID NO: 30)。
[0242] 靶向VEGFA的spacer为TGGGTGCAGCCTGGGACCACTTGGCATGG(SEQ ID NO: 31)。
[0243] 构建的验证载体如下所示:表3. 验证载体及架构
[0244] 2、待验证载体转染293T细胞将验证载体以及对照载体转染293T细胞。
[0245] 按照Lipofectamine 2000(Thermo)说明书操作转染24孔板。未转染质粒的293T细胞作空白对照。
[0246] 3、qPCR检测靶基因的RNA变化转染后48h的细胞使用SteadyPureUniversal RNA Extraction Kit AG21017试剂
盒提取RNA,并使用超微量分光光度计检测RNA浓度。RNA产物使用Evo M‑MLVMix Kit with gDNA Clean for qPCR AG11728反转录试剂盒进行反转录,反转录产物使用SYBRGreen 
PremixPro TaqHS qPCR Kit(Low Rox Plus)qPCR试剂盒进行检测。
[0247] 其中qPCR所使用引物如下所示:检测VEGFA:ACCTCCACCATGCCAAGTGG(SEQ ID NO:23)
CAGGGTCTCGATTGGATGGC(SEQ ID NO:24)
检测PTBP1:ATTGTCCCAGATATAGCCGTTG(SEQ ID NO:25)
GCTGTCATTTCCGTTTGCTG(SEQ ID NO:26)
检测内参GAPDH:CCATGGGGAAGGTGAAGGTC(SEQ ID NO:27)
GAAGGGGTCATTGATGGCAAC(SEQ ID NO:28)
按照SYBR® Green Premix Pro Taq HS qPCR Kit(Rox Plus)使用说明配置反应
体系,使用QuantStudio™ 5 Real‑Time PCR System进行检测。
[0248] 本实验使用相对定量方法即2‑△△Ct法计算目标RNA的变化。其计算方式如下所示:
△Ct= Ct (VEGFA或PTBP1)‑Ct (GAPDH)
△△Ct=△Ct(待验证样品)‑△Ct(CasRx‑EGFP)
2‑△△Ct=2^(‑△△Ct)
按照上述计算方式计算靶向VEGFA或PTBP1的2‑△△Ct值。独立重复4次实验,结果
数据取4次测试的平均值。如表4、表5所示。
[0249] 表4. 靶向VEGFA的敲降结果
[0250] 在靶向VEGFA RNA的测试中,编辑效率均值排序为CasRx>C13‑55>PspCas13b>C13‑52>Cas13X.1>C13‑88>Cas13Y.1>C13‑115。相比CasRx‑EGFP组,C13‑55、C13‑52和C13‑88组都可显著敲降VEGFA RNA,有统计学差异(P<0.05)。
[0251] 表5. 靶向PTBP1的敲降结果
[0252] 在靶向PTBP1 RNA的测试中,编辑效率均值排序为CasRx>C13‑55>PspCas13b>Cas13X.1>C13‑52>C13‑88>Cas13Y.1。相比CasRx‑EGFP组,C13‑55、C13‑52和C13‑88组都可显著敲降PTBP1 RNA,有统计学差异(P<0.05)。
[0253] 4. 脱靶分析RNAseq测序。
[0254] 将靶向VEGFA的实验组以及对照组的总RNA样品进行RNAseq测序(每组样品数n=3),建库类型为LncRNA链特异性文库,测序数据量是16G,测序策略是PE150。
[0255] RNAseq分析(1)使用fastqc、multiqc对数据进行质控,使用fastp去除低质量reads。
[0256] (2)比对至人rRNA序列的reads进行去除,使用Hisat2比对软件将剩下的reads比对至hg38参考基因组。
[0257] (3)比对后使用Kallisto软件对基因进行表达水平的定量,而后使用sleuth软件进行表达量差异分析,将|b|>0.5,qval<0.05,mean_obs>2的基因视为差异表达基因(DEG)。
[0258] (4)将gRNA指导序列序列使用EMBOSS water软件比对至参考cDNA,将比对碱基数>=18,错配碱基数<=6, 最小连续配对碱基数>=8的转录本视为预测靶向的转录本(在靶+脱靶),对应的基因视为靶向基因(在靶+脱靶基因)。
[0259] (5)将表达显著下调的差异表达基因与预测脱靶的靶向基因取交集,剔除在靶基因,得到脱靶基因集。
[0260] 结果如下表6所示。脱靶基因数量CasRx>Cas13X.1>C13‑88>C13‑52>C13‑55。其中C13‑55兼具高编辑效率以及低脱靶。
[0261] 表6. 脱靶基因数目对比
[0262] 综上,本发明发现的C13‑52、C13‑55、C13‑88,以及C13‑115‑gRNA系统的发明扩展了Cas13蛋白工具的范围,为CRISPR‑Cas13系统在RNA靶向中的应用进一步铺平了道路。
[0263] 以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存
在矛盾,都应当认为是本说明书记载的范围。
[0264] 以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来
说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

当前第1页 第1页 第2页 第3页