首页 / 一种基于Sanger法测序展示判读基因编辑目标位点结果的方法

一种基于Sanger法测序展示判读基因编辑目标位点结果的方法实质审查 发明

技术领域

[0001] 本发明属于生物检测领域,具体涉及基因编辑目标位点结果的展示判读方法。

相关背景技术

[0002] 基因编辑技术是一种通过特异性改变目标基因序列来实现对生物体遗传信息进行精确修改的技术。其基本原理是利用外源切割复合体在细胞内识别并切割特定的DNA序列,从而引发细胞内的DNA修复机制,导致基因的敲除、插入或替换。
[0003] CRISPR‑Cas9是目前应用最广泛的基因编辑技术之一。它由一个具有核酸内切酶功能的Cas9蛋白和一条单链向导RNA(sgRNA)组成。sgRNA与Cas9蛋白结合后,能够靶向到基因组的特定位点,并引导Cas9蛋白切割该位置的DNA双链,形成双链断裂(DSB)。随后,细胞通过非同源末端连接(NHEJ)或同源重组(HDR)等修复途径修复这些断裂,从而实现基因的敲除、插入或替换。
[0004] 基因编辑技术在多个领域展现出广阔的应用前景。在医学领域,基因编辑技术被用于研究和治疗遗传病、传染病和癌症等疾病。例如,通过CRISPR技术可以生成基因敲除的小鼠模型,用于癌症研究和药物开发。在农业领域,基因编辑技术被用于改良作物品种,提高作物产量和抗病性。
[0005] Sanger测序在基因编辑结果检测中具有重要应用,其主要优势在于高精度、长读长和简单的工作流程,使其成为验证CRISPR‑Cas9基因编辑效率的理想选择。Sanger测序能够通过精确解读突变的碱基组合来判断基因编辑的类型,并且可以结合人工复核以提高准确性。
[0006] 对于样品在基因编辑之后,其目标位点结果的检测是非常重要的一环。在基因编辑技术(如CRISPR‑Cas9)的应用中,Sanger测序被广泛用于验证编辑效率并定向筛选克隆。研究人员可以通过SeqScreener软件协助,利用Sanger测序快速、准确地对CRISPR‑Cas9基因编辑产物进行分析。此外,Sanger测序还可以用于检测基因编辑后的染色体大片段缺失情况。
[0007] Sanger测序现主要使用ABi3730xl测序仪完成,但用一般软件(如DNAMAN等)无法有效体现目标位置编辑情况,特别是等位基因存在杂合时导致各碱基序列的峰图混合在一起,不利于判读基因中是否存在野生型等问题。

具体实施方式

[0042] 下面通过具体实施例本发明进行说明,以期更好理解本发明,但不构成对本发明的限制。
[0043] 实施例
[0044] 一种判读基因编辑目标位点结果的方法,其包括如下步骤:
[0045] 第一步使用开源软件Biopython,将Sanger测序结果的默认碱基序列与样品野生型基因组参考序列进行比对,得到序列相同区域的位置。
[0046] 第二步使用开源软件Biopython,将sgRNA序列与样品野生型基因组部分参考序列进行比对,得到序列相同区域的位置。
[0047] 第三步使用开源软件以Savitzky‑Golay方法对Sanger测序结果的各碱基信号进行滤波降噪,ABI测序结果各碱基信号为独立通道(DNA的4种碱基信号在数据文件中是分开独立存储的,可以理解为每种碱基都有一个独立的峰图,因此可以通过在某一个位置是否有峰而推断该位置的碱基可能性,即如果该位置同时存在AG两种碱基的峰,即说明可能同时有AG)。根据第二步中得到的位置,采用python开源工具scipy的findpeaks方法查找位置附近左右各2个点内的峰,可得到每个位置的可能碱基序列。
[0048] 第四步以顺序形式将Sanger测序结果峰图、碱基序列及野生型基因组参考序列通过HTML5的Canvas绘图技术进行展示;具体地,第一行为参考基因组序列,第二行为测序结果的默认序列,峰图为4种碱基信号。
[0049] 第五步将sgRNA序列的位置以高亮形式在第四步的Canvas中展示,最终效果如图1所示。
[0050] 第六步将第一步中得到的所有可能的碱基按照顺序与野生型基因组参考序列进行比对,以判断是否存在野生型等位基因。基于基因编辑技术的原因,这里主要考虑sgRNA所在部分的序列,也可适当延长判读区域以提高准确性,根据等位基因的不同,进而得出4中等位基因可能性结果,就是“纯合野生型”、“纯合非野生型”、“杂合且包括野生型”、“杂合且不包括野生型”。
[0051] 下面以具体例子的形式提供四种不同情形下的判断过程。其中,对于基因编辑是否成功无法下一个很准确的定义,这和实验人的设计和需求有关。一般来说纯合的野生型肯定是不符合要求的,所以通过判断得出的结论是不能给出是否成功的判断,只是给出结果的具体情况。其中,核心是第4步中“根据第二步中得到的位置,采用python开源工具scipy的findpeaks方法查找位置附近左右各2个点内的峰,得到每个位置的可能碱基序列”的处理,这样可以得到所有的可能性序列,就是下面实例1至4的4种情况:“纯合野生型”、“纯合非野生型”、“杂合且包括野生型”、“杂合且不包括野生型”。
[0052] 实施例一
[0053] 以下是纯合野生型样本判读与展示的过程(图2)。
[0054] (1)在本样品中为所输入的参考基因组序列第255到628个碱基。
[0055] (2)使用开源软件Biopython,将sgRNA序列(图中黄色部分,GTTCCACGAGACCCGCCACCCGG)与野生型样本基因组参考序列进行比对,得到序列相同区域的位置,在本样品中为参考基因组的437到459,结合第一步中ABI测序结果的比对位置信息(ABI测序结果PLOC字段数据),可确定437到459各碱基的峰位置为2150、2162、2174、2187、
2199、2211、2222、2232、2243、2256、2269、2280、2294、2304、2316、2328、2340、2353、2365、
2375、2386、2398、2410、2423;
[0056] (3)使用开源软件以Savitzky‑Golay方法对Sanger测序结果的各碱基信号进行滤波降噪。根据第二步中得到的位置,采用python开源工具scipy的findpeaks方法查找位置附近左右各2个点内的峰,得到每个位置的可能碱基序列,此样本在sgRNA位置的序列只存在一种可能性,为GTTCCACGAGACCCGCCACCCGG,与参考基因组完全一致;
[0057] (4)以顺序形式将Sanger测序结果峰图、碱基序列及野生型基因组参考序列通过HTML5的Canvas绘图技术进行展示(图2);
[0058] (5)将sgRNA序列的位置以高亮形式在基因组与结果默认序列中标出;
[0059] (6)根据第3步中以峰信号为基础的可能碱基信息,可知在sgRNA位置只有一种可能序列,且与参考基因组一致,可判断本样本为纯合野生型。
[0060] 实施例二
[0061] 以下是纯合非野生型样本判读与展示的过程(图3)。
[0062] (1)本样品所输入的参考基因组序列第1到234个碱基。
[0063] (2)使用开源软件Biopython,将sgRNA序列(图中黄色部分,GAAGATGTGCGGGATCAAGCAGG)与野生型样本基因组参考序列进行比对,得到序列相同区域的位置,在本样品中为参考基因组的76到98,因为在此样本在sgRNA位置检测到了碱基插入,实际碱基位置为76到99,结合第一步中ABI测序结果的比对位置信息(ABI测序结果PLOC字段数据),可确定76到99各碱基的峰位置为925、937、949、960、971、981、992、1003、1015、
1026、1037、1051、1062、1075、1087、1099、1111、1123、1135、1146、1157、1168、1177、1189;
[0064] (3)使用开源软件以Savitzky‑Golay方法对Sanger测序结果的各碱基信号进行滤波降噪,ABI测序结果各碱基信号为独立通道。根据第二步中得到的位置,采用python开源工具scipy的findpeaks方法查找位置附近左右各2个点内的峰,可得到每个位置的可能碱基序列,此样本在sgRNA位置的序列只存在一种可能性,为GAAGATGTGCGGGATCAAAGCAGG,相对于参考基因组在92号位置插入了1个A碱基;
[0065] (4)以顺序形式将Sanger测序结果峰图、碱基序列及野生型基因组参考序列通过HTML5的Canvas绘图技术进行展示(图3);
[0066] (5)将sgRNA序列的位置以高亮形式在基因组与结果默认序列中标出;
[0067] (6)根据第3步中以峰信号为基础的可能碱基信息,可知在sgRNA位置只有一种可能序列,相对于参考基因组在92号位置插入了1个A碱基,可判断本样本为纯合非野生型,插入的A碱基以红色高亮显示。
[0068] 实施例三
[0069] 以下是杂合且包括野生型等位基因样本判读与展示的过程(图4)。
[0070] (1)本样品所输入的参考基因组序列第36到309个碱基。
[0071] (2)使用开源软件Biopython,将sgRNA序列(图中黄色部分,GCAGTACAAGAAGCGGCCCGCGG)与野生型样本基因组参考序列进行比对,得到序列相同区域的位置,在本样品中为参考基因组的146到168,结合第一步中ABI测序结果的比对位置信息(ABI测序结果PLOC字段数据),可确定146到168各碱基的峰位置为1766、1778、1790、1801、
1813、1825、1837、1849、1863、1873、1886、1897、1909、1920、1934、1946、1957、1968、1980、
1993、2006、2019、2030;
[0072] (3)使用开源软件以Savitzky‑Golay方法对Sanger测序结果的各碱基信号进行滤波降噪,ABI测序结果各碱基信号为独立通道。根据第二步中得到的位置,采用python开源工具scipy的findpeaks方法查找位置附近左右各2个点内的峰,可得到每个位置的可能碱基序列,此样本在sgRNA位置的序列为GCAGTACAAGAAGCGGC[CG]CG[CG]GG([]内为在该位置可能的碱基),可知等位基因可能存在GCAGTACAAGAAGCGGCCCGCGG(野生型)及GCAGTACAAGAAGCGGCGCGGGG两种情况;
[0073] (4)以顺序形式将Sanger测序结果峰图、碱基序列及野生型基因组参考序列通过HTML5的Canvas绘图技术进行展示(图4);
[0074] (5)将sgRNA序列的位置以高亮形式在基因组与结果默认序列中标出;
[0075] (6)根据第3步中以峰信号为基础的可能碱基信息,可知在sgRNA位置等位基因可能存在两种情况。
[0076] 实施例四
[0077] 以下讲述杂合且不包括野生型等位基因样本判读与展示的过程(图5)。
[0078] (1)本样品所输入的参考基因组序列第1到231个碱基。
[0079] (2)使用开源软件Biopython,将sgRNA序列(图中黄色部分,GAAGATGTGCGGGATCAAGCAGG)与野生型样本基因组参考序列进行比对,得到序列相同区域的位置,在本样品中为参考基因组的76到98,结合第一步中ABI测序结果的比对位置信息(ABI测序结果PLOC字段数据),可确定76到98各碱基的峰位置为951、963、974、984、995、1006、
1018、1029、1040、1054、1066、1078、1091、1103、1115、1127、1138、1150、1161、1172、1181、
1193、1205;
[0080] (3)使用开源软件以Savitzky‑Golay方法对Sanger测序结果的各碱基信号进行滤波降噪,ABI测序结果各碱基信号为独立通道。根据第二步中得到的位置,采用python开源工具scipy的findpeaks方法查找位置附近左右各2个点内的峰,可得到每个位置的可能碱基序列,此样本在sgRNA位置的序列为GAAGATGTGCGGGA[AG][GC][CG][AG]G[AG][AG][AG]([]内为在该位置可能的碱基),可知不存在等位基因为野生型的情况;
[0081] (4)以顺序形式将Sanger测序结果峰图、碱基序列及野生型基因组参考序列通过HTML5的Canvas绘图技术进行展示(图5);
[0082] (5)将sgRNA序列的位置以高亮形式在基因组与结果默认序列中标出;
[0083] (6)根据第3步中以峰信号为基础的可能碱基信息,可知在sgRNA位置不存在等位基因为野生型的情况。

当前第1页 第1页 第2页 第3页
相关技术
基因编辑相关技术
展示判相关技术
任玉龙发明人的其他相关专利技术