首页 / 包含固定引物的能够变形的聚合物

包含固定引物的能够变形的聚合物公开 发明

技术领域

[0001] 本发明涉及包含固定引物的能够变形的聚合物,特别是用于核酸测序,诸如并发测序。

相关背景技术

[0002] 在一些类型的下一代测序(NGS)技术中,通过扩增初始模板核酸链在流通池上产生核酸簇。测序循环可在合成模板核酸的互补链时进行,即,使用合成测序(SBS)方法。
[0003] 在每个测序循环中,缀合到荧光标记的脱氧核糖核酸类似物与模板核酸杂交,并且使用激发光源激发脱氧核糖核酸类似物上的荧光标记。检测器捕获荧光标记的荧光发射并识别脱氧核糖核酸类似物。因此,模板核酸的序列可通过反复执行此类测序循环进行确定。
[0004] NGS允许同时对许多不同的模板核酸进行测序,这在过去二十年已经显著降低了测序的成本。
[0005] 一个困难是对正向链和反向链(或正向链和正向互补链,或反向链和反向互补链)的测序,因为这些链具有形成自杂交结构的倾向。当前的方法通常是在没有反向链存在的情况下(例如通过去除反向链)首先对正向链进行测序,重新合成反向链并去除正向链,随后在没有正向链存在的情况下对反向链进行测序。
[0006] 然而,仍然期望开发新的测序策略,特别是为了更高的效率、通量和速度。

具体实施方式

[0129] 本文提及的所有专利、专利申请和其他出版物,包括在这些参考文献中公开的所有序列,均明确地以引用方式并入本文,其程度如同具体且单独地指出每个单独的出版物、专利或专利申请以引用方式并入本文。所有引用文献的相关部分均全文以引用方式并入本文以用于本文引用的上下文所指示的目的。然而,不可将任何文献的引用理解为是对其作为本公开的现有技术的认可。
[0130] 本发明可用于测序,特别是并发测序。适用于本发明的方法已描述于WO 08/041002、WO 07/052006、WO 98/44151、WO 00/18957、WO 02/06456、WO 07/107710、WO 05/
068656、US13/661,524和US 2012/0316086中,其内容以引用方式并入本文。更多信息可见于US 20060024681、US20060292611、WO 06/110855、WO 06/135342、WO 03/074734、WO 07/
010252、WO 07/091077、WO 00/179553、WO 98/44152和WO 2022/087150,其内容以引用方式并入本文。
[0131] 如本文所用,术语“变体”是指保留完整非变体序列的期望功能的变体多肽序列或多肽序列的部分。例如,固定引物的期望功能保留了与靶序列结合(即,杂交)的能力。
[0132] 如在本文所述的任何方面中所使用的,“变体”与非变体核酸序列具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、
41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、
56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、
71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、
86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%的总体序列同一性。变体的序列同一性可使用本领域已知的任何数目的序列比对程序来确定。例如,可使用来自EMBL‑EBI的Emboss Stretcher:https://www.ebi.ac.uk/Tools/psa/emboss_stretcher/(使用默认参数:成对输出格式,对于蛋白质,矩阵=BLOSUM62,空位开始=1,空位延伸=1;成对输出格式,对于核苷酸,矩阵=DNAfull,空位开始=16,空位延伸=4)。
[0133] 如本文所用,术语“片段”是指来自较长核酸序列的一系列具有功能活性的连续核酸。该片段可以是该较长核酸序列的长度的至少99%、至少95%、至少90%、至少80%、至少70%、至少60%、至少50%、至少40%或至少30%。在一个实施方案中,如本文所用的片段也保留了与靶序列结合(即,杂交)的能力。
[0134] 测序一般包括四个基本步骤:1)文库制备,以形成多个用于鉴定的靶多核苷酸;2)簇生成,以形成扩增模板多核苷酸的阵列;3)对这些扩增模板多核苷酸的簇阵列进行测序;以及4)数据分析,以从扩增模板多核苷酸序列中鉴定靶多核苷酸的特征。下文更详细地描述了这些步骤。
[0135] 文库链和模板术语
[0136] 对于待鉴定的给定双链多核苷酸序列100,多核苷酸序列100包含该序列的正向链101和该序列的反向链102。参见图1。
[0137] 当多核苷酸序列100被复制(例如,使用DNA/RNA聚合酶)时,产生序列100的正向链101和序列100的反向链102的互补形式。因此,多核苷酸序列100的复制提供了双链多核苷酸序列100a和双链多核苷酸序列100b,其中双链多核苷酸序列100a包含该序列的正向链
101和该序列的正向互补链101′,并且双链多核苷酸序列100b包含该序列的反向链102和该序列的反向互补链102'。
[0138] 术语“模板”可用于描述双链多核苷酸序列100的互补形式。因此,“模板”包含序列的正向互补链101′和该序列的反向互补链102'。因此,通过使用序列的正向互补链101′作为用于互补碱基配对的模板,测序过程(例如,合成测序或连接法测序过程)复制了存在于该序列的初始正向链101中的信息。类似地,通过使用序列的反向互补链102'作为用于互补碱基配对的模板,测序过程(例如,合成测序或连接法测序过程)复制了存在于该序列的初始反向链102中的信息。
[0139] 该模板中的两条链也可被称为模板的正向链101′和该模板的反向链102'。模板的正向链101′的互补链被称为模板的正向互补链101,而模板的反向链102'的互补链被称为该模板的反向互补链102。
[0140] 通常,在本文中使用正向链、反向链、正向互补链和反向互补链而不限定它们是关于初始多核苷酸序列100还是关于“模板”的情况下,这些术语可被解释为是指“模板”。
[0141]
[0142] 文库制备
[0143] 文库制备是任何高通量测序平台中的第一步骤。这些文库允许通过互补碱基配对产生模板,这些模板随后可被聚簇并扩增。在文库制备期间,将核酸序列(例如基因组DNA样品,或者cDNA或RNA样品)转化到测序文库中,然后可对该核酸序列进行测序。以DNA样品为例,文库制备的第一步骤是DNA样品的随机片段化。首先将样品DNA片段化,并将特定大小(通常为200bp至500bp,但也可为更大)的片段连接、亚克隆或“插入”在两个寡核苷酸衔接子(衔接子序列)之间。初始样品DNA片段被称为“插入序列”。在用衔接子序列修饰之前,还可有利地将靶多核苷酸按大小分级。
[0144] 如本文所述,待产生的模板通常包括单独的多核苷酸序列,特别是包含第一部分的第一多核苷酸序列和包含第二部分的第二多核苷酸序列。可根据本领域技术人员已知的方法从特定文库产生这些模板。然而,下文描述了制备适于产生此类模板的文库的一些示例性方法。
[0145] 在一些实施方案中,可通过将衔接子序列连接到双链多核苷酸序列来制备该文库,这些双链多核苷酸序列各自包含序列的正向链和该序列的反向链,如在例如WO 07/052006中更详细描述的,其以引用方式并入本文。在一些情况下,“标签化”可用于将样品DNA附接到衔接子,如在例如WO 10/048605、US2012/0301925、US2013/0143774和WO 2016/
189331中更详细描述的,这些文献中的每篇文献以引用方式并入本文。在标签化中,双链DNA同时被片段化并且用衔接子序列和PCR引物结合位点标记。组合反应消除了在文库制备期间对单独的机械剪切步骤的需求。这些工序可用于例如制备模板,这些模板包括包含第一部分的第一多核苷酸序列和包含第二部分的第二多核苷酸序列,其中该第一部分是该模板的正向链,并且第二部分是该模板的正向互补链,即,正向链的拷贝(或者另选地,其中该第一部分是该模板的反向链,并且第二部分是该模板的反向互补链)。
[0146] 在本文中关于“正向”链描述特征的情况下,应认为这些特征可同样适用于“反向链”。
[0147] 在如上所述通过将衔接子序列连接到双链多核苷酸序列来制备文库时,文库制备可包括将第一引物结合序列301′(例如,P5',诸如SEQ ID NO.3)和第二末端测序引物结合位点304(例如,SBS3',例如SEQ ID NO.8)连接到序列的正向链101的3′端。参见图2。可以安排文库制备,使得第二末端测序引物结合位点304附接(例如,直接附接)到序列的正向链101的3′端,并且使得第一引物结合序列301′附接(例如,直接附接)到第二末端测序引物结合位点304的3′端。
[0148] 文库制备还可包括将第一末端测序引物结合位点的互补序列303′(例如,SBS12,诸如SEQ ID NO.9)(在本文中也被称为第一末端测序引物结合位点互补序列303′)和第二引物结合序列302的互补序列(在本文中也被称为第二引物结合互补序列302)(例如,P7,诸如SEQ ID NO.2)连接到序列的正向链101的5′端。可以安排文库制备,使得第一末端测序引物结合位点互补序列303′附接(例如,直接附接)到序列的正向链101的5′端,并且使得第二引物结合互补序列302附接(例如,直接附接)到第一末端测序引物结合位点互补序列303'的5′端。
[0149] 因此,多核苷酸文库内的多核苷酸的一条链可在5′至3′方向上包含第二引物结合互补序列302(例如,P7)、第一末端测序引物结合位点互补序列303′(例如,SBS12)、序列的正向链101、第二末端测序引物结合位点304(例如SBS3′)和第一引物结合序列301′(例如,P5′)(图2——下链)。
[0150] 尽管在图2中未示出,但是该链还可包含一个或多个索引序列。因此,可在第二引物结合互补序列302(例如,P7)和第一末端测序引物结合位点互补序列303′(例如,SBS12)之间设置第一索引序列(例如,i7)。单独地或此外,可在第二末端测序引物结合位点304(例如,SBS3′)和第一引物结合序列301′(例如,P5′)之间设置第二索引互补序列(例如,i5′)。因此,在一些实施方案中,多核苷酸文库内的多核苷酸的一条链可在5′至3′方向上包含第二引物结合互补序列302(例如,P7)、第一索引序列(例如,i7)、第一末端测序引物结合位点互补序列303′(例如,SBS12)、序列的正向链101、第二末端测序引物结合位点304(例如,SBS3′)、第二索引互补序列(例如,i5′)和第一引物结合序列301′(例如,P5′)。典型的多核苷酸如图3所示(下链)。
[0151] 当使用双链序列100时,文库制备还可包括将第二引物结合序列302′(例如,P7′)和第一末端测序引物结合位点303(例如,SBS12′)连接到该序列的反向链102的3′端。可以安排文库制备,使得第一末端测序引物结合位点303附接(例如,直接附接)到序列的反向链102的3′端,并且使得第二引物结合序列302'附接(例如,直接附接)到第一末端测序引物结合位点303的3′端。
[0152] 文库制备还可包括将第二末端测序引物结合位点的互补序列304′(例如,SBS3)(在本文中也被称为第二末端测序引物结合位点互补序列304′)和第一引物结合序列的互补序列301(在本文中也被称为第一引物结合互补序列301)(例如,P5)连接到该序列的反向链102的5′端。可以安排文库制备,使得第二末端测序引物结合位点互补序列304'附接(例如,直接附接)到序列的反向链102的5′端,并且使得第一引物结合互补序列301附接(例如,直接附接)到第二末端测序引物结合位点互补序列304'的5′端。
[0153] 因此,多核苷酸文库内的多核苷酸的另一条链可在5′至3′方向上包含第一引物结合互补序列301(例如,P5)、第二末端测序引物结合位点互补序列304′(例如,SBS3)、序列的反向链102、第一末端测序引物结合位点303(例如,SBS12′)和第二引物结合序列302′(例如,P7′)(图2‑‑上链)。
[0154] 尽管在图2中未示出,但是另一条链还可包含一个或多个索引序列。因此,可在第一引物结合互补序列301(例如,P5)和第二末端测序引物结合位点互补序列304′(例如,SBS3)之间设置第二索引序列(例如,i5)。单独地或此外,可在第一末端测序引物结合位点303(例如,SBS12′)和第二引物结合序列302′(例如,P7′)之间设置第一索引互补序列(例如,i7′)。因此,在一些实施方案中,多核苷酸文库内的多核苷酸的另一条链可在5′至3′方向上包含第一引物结合互补序列301(例如,P5)、第二索引序列(例如,i5)、第二末端测序引物结合位点互补序列304′(例如,SBS3)、序列的反向链102、第一末端测序引物结合位点303(例如,SBS12′)、第一索引互补序列(例如,i7′)和第二引物结合序列302′(例如,P7′)。典型的多核苷酸如图3所示(上链)。
[0155] 如技术人员将理解的,双链核酸通常将由两个互补的多核苷酸链形成,这两个互补多核苷酸链由通过磷酸二酯键连接的脱氧核糖核苷酸或核糖核苷酸构成,但可附加包含一个或多个核糖核苷酸和/或非核苷酸化学部分和/或非天然存在的核苷酸和/或非天然存在的主链键。具体地讲,双链核酸可包括非核苷酸化学部分,例如在一条或两条链的5′端处的接头或间隔区。作为非限制性示例,双链核酸可包括甲基化核苷酸、尿嘧啶碱基、硫代磷酸酯基团、肽缀合物等。可包括此类非DNA或非天然修饰以便赋予核酸一些期望的特性,例如用于实现对固体载体的共价附接、非共价附接或金属配位附接,或充当间隔区以将切割位点定位在距离固体载体的最佳距离处。单链核酸由一个此类多核苷酸链组成。在多核苷酸链仅与互补链部分杂交的情况下,例如,与短核苷酸引物杂交的长多核苷酸链,其在本文中仍可被称为单链核酸。
[0156] 包含至少一个引物结合序列(引物结合序列和测序引物结合位点,在另一方面,引物结合序列、索引序列和测序引物结合位点的组合)的序列在本文中可被称为衔接子序列,并且插入序列的两侧为5′衔接子序列和3′衔接子序列。该引物结合序列还可包含用于索引读取的测序引物。
[0157] 如本文所用,“衔接子”是指包含短序列特异性寡核苷酸的序列,其作为文库制备的一部分连接到测序文库中每个DNA(或RNA)片段的5′端和3′端。衔接子序列还可包含非肽接头。
[0158] 在另一个实施方案中,P5'引物结合序列和P7'引物结合序列与存在于流通池表面上的短引物序列(或苔引物)互补。P5'和P7'与它们的互补序列(P5和P7)在例如流通池表面上的结合允许核酸扩增。如本文所用,“′”表示互补链。
[0159] 允许与扩增引物(例如,苔引物)杂交的衔接子中的引物结合序列的长度通常为约20至40个核苷酸,尽管本发明不限于该长度的序列。扩增引物(例如,苔引物)中的精确同一性,并且因此衔接子中的同源序列对于本发明而言一般不重要,只要引物结合序列能够与扩增引物相互作用以便引导PCR扩增即可。扩增引物的序列可对期望扩增的特定靶核酸具有特异性,但是在其他实施方案中,这些序列可以是“通用”引物序列,这些通用引物序列能够扩增具有已知或未知序列的任何靶核酸,这些靶核酸已被修饰成能够用通用引物进行扩增。PCR引物的设计标准一般来讲是本领域普通技术人员所熟知的。
[0160] 索引序列(也称为条形码或标签序列)是独特的短DNA(或RNA)序列,其在文库制备期间被添加到每个DNA(或RNA)片段中。独特的序列允许许多文库合并在一起并同时测序。在最终数据分析之前,基于它们的条形码,通过计算鉴定并分类来自合并文库的测序读取。
当使用小基因组进行工作或靶向感兴趣的基因组区域时,文库多路复用也是有用的技术。
与条形码的多路复用可以指数地增加在单次运行中分析的样品的数目,而不显著增加运行成本或运行时间。标签序列的示例见于WO05/068656中,其内容以引用方式整体并入本文。
标签可在第一读取结束时被读取,或者同样在第二读取结束时被读取,例如使用与标记为P7的链互补的测序引物。本发明不受每簇的读取次数的限制,例如每簇两个读取:可简单地通过使第一延伸测序引物去杂交并且在簇再增殖/链再合成步骤之前或之后再杂交第二引物,来获得每簇三个或更多个读取。制备用于索引的合适样品的方法描述于例如WO 2008/
093098中,其以引用方式并入本文。还可使用单索引或双索引。使用单索引,可使用多达48个独特的6碱基索引,以产生多达48个独特标记的文库。使用双索引,可组合使用多达24个独特的8碱基索引1序列和多达16个独特的8碱基索引2序列,以产生多达384个独特标记的文库。还可使用索引对,使得每个i5索引和每个i7索引仅使用一次。使用这些独特的双索引,有可能识别和过滤索引的跳读,从而在多路复用样本中提供甚至更高的置信度。
[0161] 测序引物结合位点是测序和/或索引引物结合位点,并且指示测序读取的起始点。在测序过程期间,测序引物与模板链上的测序引物结合位点的至少一部分退火(即,杂交)。
聚合酶与该位点结合,并将互补的核苷酸逐个碱基地掺入到生长的相反链中。
[0162] 簇的产生和扩增
[0163] 一旦形成双链核酸文库,通常该文库先前已经历变性条件以提供单链核酸。适合的变性条件对于技术人员而言将是显而易见的,参考标准分子生物学方案(Sambrook等人,2001,Molecular Cloning,A Laboratory Manual,第四版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor Laboratory Press,NY;Current Protocols,Ausubel等人编辑)。在一个实施方案中,可使用化学变性。
[0164] 变性后,可使单链文库在游离的溶液中接触到包含表面捕获部分(例如,P5苔引物和P7苔引物)的固体载体。
[0165] 因此,本发明的实施方案可在固体载体200,诸如流通池上进行。然而,在另选的实施方案中,可使用其他类型的固体载体在流通池外进行接种和聚簇。
[0166] 固体载体200可包括基底204。参见图4。基底204包括至少一个孔203(例如,纳米孔),并且通常包括多个孔203(例如,多个纳米孔)。例如,基底204可以是孔203的平面阵列。
[0167] 在一个实施方案中,固体载体包含多个第一固定引物和多个第二固定引物。
[0168] 因此,每个孔203可包含多个第一固定引物201。此外,每个孔203可包含多个第二固定引物202。因此,每个孔203可包含多个第一固定引物201和多个第二固定引物202。
[0169] 当能够变形的聚合物以颗粒(例如,纳米颗粒)的形式使用时,每个颗粒可以被认为是单个孔203。
[0170] 第一固定引物201可以通过其多核苷酸链的5′端附接到固体载体200。当从第一固定引物201发生延伸时,延伸可位于远离固体载体200的方向上。
[0171] 第二固定引物202可以通过其多核苷酸链的5′端附接到固体载体200。当从第二固定引物202发生延伸时,延伸可位于远离固体载体200的方向上。
[0172] 第一固定引物201可不同于第二固定引物202和/或第二固定引物202的互补序列。第二固定引物202可不同于第一固定引物201和/或第一固定引物201的互补序列。
[0173] 第一固定引物201(或第一固定引物中的每个第一固定引物)可包含如SEQ ID NO.1或5所定义的序列或其变体或片段。第二固定引物202(或第二固定引物中的每个第二固定引物)可包含如SEQ ID NO.2所定义的序列或其变体或片段。虽然第一固定引物201在此示出为对应于P5,并且第二固定引物202在此示出为对应于P7,但是这些引物的定义可以交换,换句话讲,第一固定引物201可改为对应于P7,并且第二固定引物202可对应于P5。
[0174] 在一些实施方案中,孔203内的第一固定引物201和第二固定引物202可在空间上彼此分离。换句话讲,第一固定引物201可占据第一区域,并且第二固定引物202可占据第二区域,其中该第一区域和该第二区域彼此不重叠。合适的方法描述于WO 2020/005503中,其内容以引用方式并入本文。例如,第一固定引物201可接枝到第一聚合物中,并且第二固定引物202可接枝到第二聚合物(例如,具有与第一聚合物不同的主链的第二聚合物)上;另选地,第一固定引物201可接枝到聚合物(例如,嵌段共聚物)的一个区域上,并且第二固定引物202可接枝到同一聚合物的另一区域上。这意味着所生成的任何信号(例如,如本文所提及的第一信号和第二信号)在空间上被分辨。
[0175] 在其他实施方案中,孔203内的第一固定引物201和第二固定引物202可在空间上彼此不分离。换句话讲,第一固定引物201可占据第一区域,并且第二固定引物202可占据第二区域,其中该第一区域和该第二区域可对应于同一区域或者可基本上重叠。这意味着所生成的任何信号(例如,如本文所提及的第一信号和第二信号)不能在空间上被分辨。
[0176] 作为简单的示例,在将P5引物和P7引物附接到固体载体之后,可在允许模板和固定引物之间杂交(或退火,此类术语可以互换使用)的条件下使固体载体与待扩增的模板接触。通常在合适的杂交条件下在自由溶液中添加模板,这对于技术人员将是显而易见的。通常,杂交条件是例如在40℃处5×SSC。然而,在杂交期间可使用其他温度,例如约50℃至约75℃、约55℃至约70℃或约60℃至约65℃。然后可进行固相扩增。扩增的第一步骤是引物延伸步骤,其中使用模板将核苷酸添加到固定引物的3′端,以产生完全延伸的互补链。然后通常将模板从固体载体上洗掉。互补链在其3′端处包括一个引物结合序列(即P5’或P7’),该序列能够桥接到固定在固体载体上的第二引物分子上并与其结合。另外轮次的扩增(类似于标准PCR反应)使得形成与结合在固体载体上的模板分子的簇或集落。这被称为聚簇。
[0177] 因此,通过类似于WO 98/44151或WO 00/18957(其内容以引用方式整体并入本文)的方法进行固相扩增将导致产生由“桥接”扩增产物的集落构成的簇阵列。该过程被称为桥式扩增。扩增产物的两条链将在5′端处或附近固定到固体载体上,这种附接来源于扩增引物的初始附接。通常,每个集落内的扩增产物将来源于单个模板分子的扩增。可使用其他扩增程序,并且将是技术人员已知的。例如,扩增可使用链置换聚合酶进行等温扩增;或可以为排除扩增,如WO 2013/188582中所述的。关于扩增的更多信息可见于WO 02/06456和WO 07/107710,其内容以引用方式整体并入本文。
[0178] 通过此类方法,形成模板分子的簇,该簇包含模板链的拷贝和模板链的互补链的拷贝。
[0179] 用于模板的簇的产生和扩增步骤在下文和图5中进行说明,这些模板包括包含第一部分的第一多核苷酸序列和包含第二部分的第二多核苷酸序列。
[0180] 在使用(单独的)多核苷酸链的情况下,每个第一多核苷酸序列可(通过该第一多核苷酸序列的5′端)附接到第一固定引物,并且其中每个第二多核苷酸序列(通过该第二多核苷酸序列的5′端)附接到第二固定引物。每个第一多核苷酸序列可包含第二衔接子序列,其中该第二衔接子序列包含与第二固定引物基本上互补的部分(或者与第二固定引物基本上互补)。该第二衔接子序列可位于第一多核苷酸序列的3′端。每个第二多核苷酸序列可包含第一衔接子序列,其中该第一衔接子序列包含与第一固定引物基本上互补的部分(或者与第一固定引物基本上互补)。该第一衔接子序列可位于第二多核苷酸序列的3′端。
[0181] 在一个实施方案中,可使包含多核苷酸文库的溶液流过流通池,该多核苷酸文库通过如上所述将衔接子序列连接到双链多核苷酸序列来制备。
[0182] 来自待测序的多核苷酸文库的特定多核苷酸链在5′至3′方向上包含第二引物结合互补序列302(例如,P7)、第一末端结合位点互补序列303′(例如,SBS12)、序列的正向链101、第二末端测序引物结合位点304(例如,SBS3′)和第一引物结合序列301′(例如,P5′),并且可与位于特定孔203内的第一固定引物201(例如,P5苔引物)(通过第一引物结合序列
301′)退火(图5A)。
[0183] 该多核苷酸文库可包含具有序列的不同正向链101的其他多核苷酸链。此类其他多核苷酸链可与不同孔203中的对应第一固定引物201(例如,P5苔引物)退火,从而能够在多核苷酸文库内并行处理各种不同的链。
[0184] 然后可以合成新的多核苷酸链,该多核苷酸链从第一固定引物201(例如,P5苔引物)在远离基底204的方向上延伸。通过使用互补碱基配对,这产生了模板链,该模板链在5′至3′方向上包含附接到固体载体200的第一固定引物201(例如,P5苔引物)、第二末端测序引物结合位点互补序列304′(例如,SBS3)、模板的正向链101′(其表示一种类型的“第一部分”)、第一末端测序引物结合位点303(其表示一种类型的“第一测序引物结合位点”)(例如,SBS12′)和第二引物结合序列302′(例如,P7′)(图5B)。这种方法可利用适当的聚合酶,诸如DNA或RNA聚合酶。
[0185] 如果文库中的多核苷酸包含索引序列,则在模板中也产生对应索引序列。
[0186] 然后可将来自多核苷酸文库的多核苷酸链去杂交并洗掉,留下附接到第一固定引物201(例如,P5苔引物)的模板链(图5C)。
[0187] 模板链上的第二引物结合序列302′(例如,P7′)然后可与位于孔203内的第二固定引物202(例如,P7苔引物)退火。这形成了“桥”(图5D)。
[0188] 然后可通过桥式扩增合成新的多核苷酸链,该多核苷酸链从第二固定引物202(例如,P7苔引物)(最初)在远离基底204的方向上延伸。通过使用互补碱基配对,这产生了模板链,该模板链在5′至3′方向上包含附接到固体载体200的第二固定引物202(例如,P7苔引物)、第一末端测序引物结合位点互补序列303′(例如,SBS12)、模板的正向互补链101(其表示一种类型的“第二部分”)、第二末端测序引物结合位点304(其表示一种类型的“第二测序引物结合位点”)(例如,SBS3′)和第一引物结合序列301′(例如,P5′)(图5E)。同样,这种方法可利用合适的聚合酶,诸如DNA或RNA聚合酶。
[0189] 附接到第二固定引物202(例如,P7苔引物)的链然后可与附接到第一固定引物201(例如,P5苔引物)的链去杂交(图5F)。
[0190] 后续的桥式扩增循环可随后导致附接到第一固定引物201(例如,P5苔引物)的链和附接到第二固定引物202(例如,P7苔引物)的链的扩增。类似于图5D,附接到第一固定引物201(例如,P5苔引物)的模板链上的第二引物结合序列302′(例如,P7′)然后可与位于孔203内的另一第二固定引物202(例如,P7苔引物)退火。以类似的方式,附接到第二固定引物
202(例如,P7苔引物)的模板链上的第一引物结合序列301′(例如,P5′)然后可与位于孔203内的另一第一固定引物201(例如,P5苔引物)退火(图5G)。
[0191] 桥式扩增和去杂交的完成然后可提供扩增(双克隆(duoclonal))簇,从而提供包含模板的正向链101′的多个第一多核苷酸序列(即,“第一部分”)和包含模板的正向互补链101的多个第二多核苷酸序列(即,“第二部分”)(图5H)。
[0192] 如果需要,可以进行进一步的桥式扩增循环以增加孔203内的第一多核苷酸序列和第二多核苷酸序列的数目。
[0193] 用于实现聚簇和扩增的其他方法包括排阻扩增(例如,如在WO 2013/188582中所述的)、解旋酶依赖性扩增(例如,如Vincent等人,EMBO Rep.,2004年,第5卷第8期,第795‑800页所述的)和滚环扩增(例如,如Mohsen等人,Acc.Chem.Res.,2016年,第49卷第11期,第
2540‑2550页所述的),其内容以引用方式并入本文。
[0194] 上述用于聚簇和扩增的方法通常涉及进行非选择性扩增。然而,涉及选择性处理的本发明的方法可包括进行选择性扩增,这将在下文的选择性处理下进一步详细描述。
[0195] 测序
[0196] 如本文所述,模板提供关于初始靶多核苷酸序列的信息(例如,遗传序列的鉴定、表观遗传修饰的鉴定)。例如,测序过程(例如,合成测序或连接法测序过程)可以通过使用互补碱基配对来复制存在于初始靶多核苷酸序列中的信息。
[0197] 在一个实施方案中,可使用任何合适的“合成测序”技术进行测序,其中核苷酸以循环的方式连续添加到游离的3′羟基基团上,从而导致在5′至3′方向上合成多核苷酸链。可在每次添加之后确定添加的核苷酸的性质。一种特定的测序方法依赖于使用可充当可逆链终止子的经修饰的核苷酸。此类可逆链终止剂包含可去除的3′封端基团。一旦已将此类经修饰的核苷酸掺入与待测序的模板区域互补的生长的多核苷酸链中,就没有游离的3′‑OH基团可用于引导进一步的序列延伸,所以聚合酶不能添加另外的核苷酸。一旦已确定掺入生长链中的碱基的性质,就可去除3′嵌段以允许添加下一个连续核苷酸。通过对使用这些经修饰核苷酸衍生的产物进行排序,就可推断出DNA模板的DNA序列。如果经修饰核苷酸中的每一者均已附接了已知对应于特定碱基的不同标记,以有利于区分在每个掺入步骤时添加的碱基,则可在单个实验中完成此类反应。合适的标记描述于PCT申请PCT/GB2007/
001770中,其内容以引用方式整体并入本文。另选地,可进行含有单独添加的每种经修饰的核苷酸的单独反应。
[0198] 经修饰的核苷酸可携带标记以有利于其检测。这种标记可被配置为发射信号,诸如电磁信号或(可见)光信号。
[0199] 在具体实施方案中,标记是荧光标记(例如,染料)。因此,这种标记可被配置为发射电磁信号或(可见)光信号。一种用于检测荧光标记的核苷酸的方法包括使用对标记的核苷酸具有特异性波长的激光,或使用其他合适的照明源。来自掺入的核苷酸上的标记的荧光可通过CCD相机或其他合适的检测方式来检测。合适的检测方式描述于PCT/US2007/007991中,其内容全文以引用方式并入本文。
[0200] 然而,可检测标记不需要是荧光标记。可使用允许检测核苷酸掺入DNA序列中的任何标记。
[0201] 每个循环可涉及将四种不同核苷酸类型同时递送到模板分子的阵列。另选地,可以依次添加不同的核苷酸类型,并且可以在每个添加步骤之间获得模板分子的阵列的图像。
[0202] 在一些实施方案中,每种核苷酸类型可具有(光谱上)不同的标记。换句话讲,四个通道可用于检测四个核碱基(也被称为4通道化学)(图6‑左图)。例如,第一核苷酸类型(例如,A)可包括第一标记(例如,被配置为发射第一波长,诸如红光),第二核苷酸类型(例如,G)可包括第二标记(例如,被配置为发射第二波长,诸如蓝光),第三核苷酸类型(例如,T)可包括第三标记(例如,被配置为发射第三波长,诸如绿光),并且第四核苷酸类型(例如,C)可包括第四标记(例如,被配置为发射第四波长,诸如黄光)。然后可获得四个图像,每个图像使用对四个不同标记中的一个标记具有选择性的检测通道。例如,第一核苷酸类型(例如,A)可能在第一通道(例如,被配置为检测第一波长,诸如红光)中被检测到,第二核苷酸类型(例如,G)可能在第二通道(例如,被配置为检测第二波长,诸如蓝光)中被检测到,第三核苷酸类型(例如,T)可能在第三通道(例如,被配置为检测第三波长,诸如绿光)中被检测到,并且第四核苷酸类型(例如,C)可能在第四通道(例如,被配置为检测第四波长,诸如黄光)中被检测到。尽管上文描述了碱基与信号类型(例如,波长)的特定配对,但是也可使用不同的信号类型(例如,波长)和/或排列。
[0203] 在一些实施方案中,可使用少于四种不同的标记进行每种核苷酸类型的检测。例如,可使用描述于US2013/0079232中的方法和系统进行合成测序,其以引用方式并入本文。
[0204] 因此,在一些实施方案中,两个通道可用于检测四个核碱基(也被称为2通道化学)(图6‑中间图)。例如,第一核苷酸类型(例如,A)可包括第一标记(例如,被配置为发射第一波长,诸如绿光)和第二标记(例如,被配置为发射第二波长,诸如红光),第二核苷酸类型(例如,G)可不包括第一标记并且可不包括第二标记,第三核苷酸类型(例如,T)可包括第一标记(例如,被配置为发射第一波长,诸如绿光)并且可不包括第二标记,并且第四核苷酸类型(例如,C)可不包括第一标记并且可包括第二标记(例如,被配置为发射第二波长,诸如红光)。然后,使用用于第一标记和第二标记的检测通道,可获得两个图像。例如,第一核苷酸类型(例如,A)可能在第一通道(例如,被配置为检测第一波长,诸如红光)和第二通道(例如,被配置为检测第二波长,诸如绿光)两者中被检测到,第二核苷酸类型(例如,G)可能在该第一通道中未被检测到并且可能在该第二通道中未被检测到,第三核苷酸类型(例如,T)可能在该第一通道(例如,被配置为检测第一波长,诸如红光)中被检测到并且可能在该第二通道中未被检测到,并且第四核苷酸类型(例如,C)可能在该第一通道中未被检测到并且可能在该第二通道(例如,被配置为检测第二波长,诸如绿光)中被检测到。尽管上文描述了碱基与信号类型(例如,波长)和/或通道组合的特定配对,但是也可使用不同的信号类型(例如,波长)和/或排列。
[0205] 在一些实施方案中,一个通道可用于检测四个核碱基(也被称为1通道化学)(图6‑右图)。例如,第一核苷酸类型(例如,A)可包括能够切割的标记(例如,被配置为发射波长,诸如绿光),第二核苷酸类型(例如,G)可不包括标记,第三核苷酸类型(例如,T)可包括不能够切割的标记(例如,被配置为发射波长,诸如绿光),并且第四核苷酸类型(例如,C)可包括不包括标记的标记接受位点。然后可获得第一图像,并且进行后续的处理以切割附接到第一核苷酸类型的标记,并且将该标记附接到第四核苷酸类型上的标记接受位点。然后可获得第二图像。例如,第一核苷酸类型(例如,A)可能在第一图像中的通道(例如,被配置为检测波长,诸如绿光)中被检测到,并且在第二图像中的通道中未被检测到,第二核苷酸类型(例如,G)可能在该第一图像中的该通道中未被检测到,并且在该第二图像中的该通道中未被检测到,第三核苷酸类型(例如,T)可能在该第一图像中的该通道(例如,被配置为检测波长,诸如绿光)中被检测到,并且在该第二图像中的该通道(例如,被配置为检测波长,诸如绿光)中被检测到,并且第四核苷酸类型(例如,C)可能在该第一图像中的该通道中未被检测到,并且在该第二图像中的该通道(例如,被配置为检测波长,诸如绿光)中被检测到。尽管上文描述了碱基与信号类型(例如,波长)和/或图像组合的特定配对,但是也可使用不同的信号类型(例如,波长)、图像和/或排列。
[0206] 在一个实施方案中,测序过程包括第一测序读取和第二测序读取。第一测序读取和第二测序读取可并发进行。换句话讲,第一测序读取和第二测序读取可同时进行。
[0207] 第一测序读取可包括第一测序引物(也被称为读段1测序引物)与第一测序引物结合位点(例如,模板中的第一末端测序引物结合位点303,这些模板包括包含第一部分的第一多核苷酸序列和包含第二部分的第二多核苷酸序列)的结合。第二测序读取可包括第二测序引物(也被称为读段2测序引物)与第二测序引物结合位点(例如,模板中的第二末端测序引物结合位点304,这些模板包括包含第一部分的第一多核苷酸序列和包含第二部分的第二多核苷酸序列)的结合。
[0208] 这导致第一部分(例如,模板中的模板的正向链101′,这些模板包括包含第一部分的第一多核苷酸序列和包含第二部分的第二多核苷酸序列)和第二部分(例如,模板中的模板的正向互补链101,这些模板包括包含第一部分的第一多核苷酸序列和包含第二部分的第二多核苷酸序列)的测序。
[0209] 另选的测序方法包括连接法测序,例如,如US 6,306,597或WO 06/084132中所述的,其内容以引用方式并入本文。
[0210] 上述用于测序的方法通常涉及进行非选择性测序。然而,涉及选择性处理的本发明的方法可包括进行选择性测序,这将在下文的选择性处理下进一步详细描述。
[0211] 具体地讲,在进行并发测序的情况下,所生成的信号可以在空间上被分辨或不能在空间上被分辨。在所生成的信号在空间上被分辨的情况下,由第一部分和第二部分生成的信号可通过根据空间分离而分别解释这些信号来解析,并且可使用非选择性处理方法(诸如非选择性扩增和非选择性测序)。然而,在由第一部分和第二部分生成的信号不能在空间上被分辨的情况下,可能需要其他方法来解析生成的信息,因此,不能在空间上被分辨的信号可涉及选择性处理方法(诸如选择性扩增和/或选择性测序)。
[0212] 选择性处理方法
[0213] 在一些实施方案中,选择性处理方法可用于生成不同强度的信号。因此,在一些实施方案中,该方法可包括选择性地处理包含第一部分的至少一个第一多核苷酸序列和包含第二部分的至少一个第二多核苷酸序列,使得一定比例的第一部分能够生成第一信号并且一定比例的第二部分能够生成第二信号,其中该选择性处理使该第一信号的强度大于该第二信号的强度。
[0214] 该方法可包括选择性地处理各自包含第一部分的多个第一多核苷酸序列和各自包含第二部分的多个第二多核苷酸序列,使得一定比例的第一部分能够生成第一信号并且一定比例的第二部分能够生成第二信号,其中该选择性处理使该第一信号的强度大于该第二信号的强度。
[0215] “选择性处理”在本文中意指进行改变包含第一部分的至少一个第一多核苷酸序列和包含第二部分的至少一个第二多核苷酸序列(或各自包含第一部分的多个第一多核苷酸序列和各自包含第二部分的多个第二多核苷酸序列)中的第一部分和第二部分的相对特性的动作,使得第一信号的强度大于第二信号的强度。该特性可以是,例如,能够生成第一信号的第一部分的浓度相对于能够生成第二信号的第二部分的浓度。该动作可包括例如进行选择性扩增、进行选择性测序或准备选择性测序。
[0216] 在一个实施方案中,选择性处理导致能够生成第一信号的第一部分的浓度大于能够生成第二信号的第二部分的浓度。换句话讲,本发明的方法导致R1:R2分子的比率发生改变,诸如在单个簇或单个孔内。
[0217] 在一个实施方案中,该比率可介于1.25:1至5:1之间。在另一个实施方案中,该比率可介于1.5:1至3:1之间。在更进一步的实施方案中,该比率可以是约2:1。
[0218] 选择性处理可以指进行选择性测序。另选地,选择性处理可以指准备选择性测序。如图7所示,在一个示例中,可使用未封端的测序引物和封端的测序引物的混合物实现选择性测序。
[0219] 在本发明的方法涉及(单独的)多核苷酸链(其中第一多核苷酸链具有第一部分,并且第二多核苷酸链具有第二部分)的情况下,该第一多核苷酸链可包含第一测序引物结合位点,并且该第二多核苷酸链可包含第二测序引物结合位点,其中该第一测序引物结合位点和该第二测序引物结合位点彼此具有不同的序列并且结合不同的测序引物。
[0220] 在一个实施方案中,第一测序引物与第一测序引物位点的结合生成第一信号,并且第二测序引物与第二测序引物位点的结合生成第二信号,其中该第一信号的强度大于该第二信号的强度。这可应用于第一多核苷酸链包含第一测序引物结合位点并且第二多核苷酸链包含第二测序引物结合位点的实施方案。这是使用结合第二测序引物位点的封端的第二测序引物和未封端的第二测序引物的混合群体来实现的。可使用封端的第二引物:未封端的第二引物的任何比率,生成强度低于第一信号的第二信号,例如,封端的引物:未封端的引物的比率可以是20:80至80:20。在另一个实施方案中,该比率可以是1:2至2:1。
[0221] 在更进一步的实施方案中,使用封端的第二引物:未封端的第二引物的50:50的比率,这继而生成第二信号,其强度为第一信号的强度的大约50%。
[0222] 第一测序引物和第二测序引物可同时添加到流通池中,或者分开地但依次添加到流通池中。
[0223] “封端的”意指测序引物在该测序引物的3′端包含封端基团。合适的封端基团包括发夹环(例如,附接到3′端的多核苷酸,其在5′至3′方向上包含能够切割的位点,诸如包含尿嘧啶的核苷酸、环部分和互补部分,其中该互补部分与固定引物的全部或部分基本上互补)、脱氧核苷酸、脱氧核糖核苷酸、代替3'‑OH基团的氢原子、磷酸酯基团、硫代磷酸酯基团、丙基间隔基(例如,代替3'‑OH基团的‑O‑(CH2)3‑OH)、使3′‑羟基基团封端的修饰(例如,羟基保护基团,诸如甲硅烷基醚基团(例如,三甲基甲硅烷基、三乙基甲硅烷基、三异丙基甲硅烷基、叔丁基(二甲基)甲硅烷基、叔丁基(二苯基)甲硅烷基)、醚基团(例如,苄基、烯丙基、叔丁基、甲氧基甲基(MOM)、2‑甲氧基乙氧基甲基(MEM)、四氢吡喃基)或酰基基团(例如,乙酰基、苯甲酰基))或反向核碱基。然而,封端基团可以是防止引物通过聚合酶延伸(即,延长)的任何修饰。
[0224] 测序引物的序列和序列引物结合位点对于本发明的方法并不重要,只要测序引物能够与序列引物结合位点结合以实现待鉴定的区域的扩增和测序。
[0225] 在一个方面,未封端的第二测序引物和封端的第二测序引物以相等的浓度存在于测序组合物中。也就是说,封端的第二测序引物:未封端的第二测序引物的比率为约50:50。该测序组合物还可包含至少一个附加(第一)测序引物。在一个示例中,该测序组合物包含封端的第二测序引物、未封端的第二测序引物和至少一个第一测序引物。
[0226] 如图7所示,可对扩增(双克隆)簇进行选择性测序(在这种情况下,在对图5H中所示的簇进行另外轮次的扩增之后),如下文进一步详细描述的。添加多个第一测序引物501。这些测序引物501与第一末端测序引物结合位点303退火。多个第二未封端的测序引物502a和多个第二封端的测序引物502b与第一测序引物501同时添加,或者依次添加(例如,在添加第一测序引物501之前或之后)。这些第二未封端的测序引物502a和第二封端的测序引物
502b与第二末端测序引物结合位点304退火。然后这允许对模板的正向链101′(即,“第一部分”)进行测序以及对模板的正向互补链101(即,“第二部分”)进行测序,其中与该模板的正向互补链101(黑色箭头)的比例相比,该模板的正向链101′(灰色箭头)被测序的比例更大。
[0227] 在其他实施方案中,第一测序引物和第二测序引物的定位可以交换。换句话讲,第一测序结合引物可改为与第二末端测序引物结合位点304退火,并且第二测序结合引物可改为与第一末端测序引物结合位点303退火。
[0228] 另选地或此外,选择性处理可以指选择性扩增。也就是说,选择性地扩增第一多核苷酸链或第二多核苷酸链上的一个部分(例如,第一部分或第二部分)。
[0229] 在一个示例中,选择性处理包括选择性地去除尚未延伸(延伸以形成第二多核苷酸链)的第二固定引物中的一些或基本上全部第二固定引物,以及进行至少一个进一步的扩增循环以便相对于第二多核苷酸序列选择性地扩增第一多核苷酸序列。尚未延伸的固定引物在本文中可被称为游离的或未延伸的第二固定引物。
[0230] 因此,在该示例中,一些或基本上全部游离的第二固定引物的选择性去除是在至少一个另外轮次的桥式扩增之前以及在靶区域的任何测序之前进行的。因此,能够生成第一信号的第一多核苷酸与能够生成第二信号的第二多核苷酸的比率被改变,这继而产生不同强度的两个信号,从而允许两个序列(或那些序列内的靶区域)的并发测序。
[0231] “一些或基本上全部”意指去除至少75%、至少80%、至少90%或介于95%和100%之间的游离的第二固定引物。
[0232] 全部或基本上全部游离的第二固定引物的选择性去除可使用能够从固体载体上切割固定引物的试剂来进行。该试剂可在至少5、至少10、至少15或至少20至24轮次的桥式扩增后添加。该试剂可以单独地添加或与扩增试剂一起添加以进行至少一个另外轮次的扩增。
[0233] 如上所述,以及在WO 2008/041002中进一步详细描述的,第一固定引物和第二固定引物可以通过接头附接到固体载体的表面。对第一固定引物和第二固定引物来说,该接头可能不同。该接头可以是任何能够切割的接头;也就是说,该接头可包含一个或多个部分,诸如修饰的核苷酸,所述一个或多个部分使得能够从固体载体的表面选择性切割固定引物。作为非限制性示例,该接头可包含尿嘧啶碱基、硫代磷酸酯基团、核糖核苷酸、二醇键、二硫键、肽等,这些可被包括在内,不仅允许将接头共价附接到固体载体,而且允许接头的选择性切割。
[0234] 在一个示例中,第一固定引物通过第一接头附接到固体载体,其中该接头包含尿嘧啶或2‑脱氧尿苷。在该示例中,可使用尿嘧啶糖基化酶去除游离的第一固定引物(即,未延伸的引物)。在一个实施方案中,可使用USER酶混合物(其是尿嘧啶糖基化酶和核酸内切酶VIII的混合物)去除游离的第一固定引物。
[0235] 在一个示例中,第一固定引物的序列包含以下序列或其片段的变体:
[0236] 5'‑PS‑TTTTTTTTTTAATGATACGGCGACCACCGAUCTACAC‑3′,其中U=2‑脱氧尿苷(SEQ ID NO.11)。
[0237] 在另一示例中,第二固定引物通过第二接头附接到固体载体,其中该接头包含8‑氧代鸟嘌呤。在该示例中,可使用FPG糖基化酶去除游离的第二固定引物(即,未延伸的引物)。
[0238] 在一个示例中,第二固定引物的序列包含以下序列或其片段的变体:
[0239] 5'‑PS‑TTTTTTTTTTCAAGCAGAAGACGGCATACGA[G氧代]AT‑3′,其中[G氧代]=8‑氧代鸟嘌呤(SEQ ID NO.12)。
[0240] 该方法的一个示例示于图8中。可对扩增(双克隆)簇进行选择性扩增,如图5H所示。固体载体200包含游离的第一固定引物201和游离的第二固定引物202。游离的第二固定引物202从固体载体200上切割,从而留下游离的第一固定引物201(图8A)。
[0241] 一组模板链上的第一引物结合序列301′(例如,P5′)然后可与位于孔203内的游离的第一固定引物201(例如,P5苔引物)退火。相比之下,由于游离的第二固定引物202(例如,P7苔引物)已被去除,因此第二引物结合序列302′(例如,P7′)不能退火(图8B)。
[0242] 在进行桥式扩增循环后,这导致包含模板的正向链101′和第一末端测序引物结合位点303的模板链相对于包含模板的正向互补链101和第二末端测序引物结合位点304的模板链的选择性扩增(图8C)。
[0243] 然后进行标准(非选择性)测序允许对模板的正向链101′(即,“第一部分”)进行测序以及对模板的正向互补链101(即,“第二部分”)进行测序,其中与该模板的正向互补链101(黑色箭头)的比例相比,该模板的正向链101′(灰色箭头)被测序的比例更大(图8D)。
[0244] 在另一示例中,选择性地处理包括使尚未延伸(延伸以形成第二多核苷酸链)的第二固定引物中的一些或基本上全部第二固定引物的延伸部选择性地封端。同样,这些引物在本文中可被称为游离的或未延伸的第二固定引物。该方法可涉及使用引物封端剂,其中该引物封端剂被构造为限制或防止从第二固定引物延伸的链(即,多核苷酸链)的合成。该方法还可涉及进行至少一个进一步的扩增循环。由于游离的第二固定引物被引物封端剂封端而不能延伸,因此只有第一固定引物可以延伸。这导致仅第一多核苷酸链(即,不是第二多核苷酸链)的扩增,并且因此,第一多核苷酸序列相对于第二多核苷酸序列的量增加。
[0245] “一些或基本上全部”意指使至少75%、至少80%、至少90%或介于95%和100%之间的游离的第二固定引物封端。
[0246] 在桥式扩增后,可使引物封端剂流过固体载体。在一个实施方案中,在至少1、2、3、4、5、6、7、8、9或10个循环后,在至少15、至少20或至少25轮次的桥式扩增后,使引物封端剂流过固体载体。
[0247] 在一个示例中,在第一多核苷酸序列与第二固定引物杂交的同时添加引物封端剂。也就是说,在至少第一多核苷酸链的扩增期间和延伸后添加引物封端剂。在该阶段,延伸的第一多核苷酸链弯曲(桥接)并在其5′端与第二固定引物杂交。在该阶段添加引物封端剂防止了第二固定引物的延伸,这通常会使用第一多核苷酸链作为其模板而发生。
[0248] 在一个实施方案中,该引物封端剂是封端的核苷酸。在一个示例中,该封端的核苷酸可以是A、C、T或G,但可以选自A或G。
[0249] 同样,“封端的”意指测序引物在该测序引物的3′端包含封端基团。合适的封端基团包括发夹环(例如,附接到3′端的多核苷酸,其在5′至3′方向上包含能够切割的位点,诸如包含尿嘧啶的核苷酸、环部分和互补部分,其中该互补部分与固定引物的全部或部分基本上互补)、脱氧核苷酸、脱氧核糖核苷酸、代替3′‑OH基团的氢原子、磷酸酯基团、硫代磷酸酯基团、丙基间隔基(例如,代替3′‑OH基团的‑O‑(CH2)3‑OH)、使3′一羟基基团封端的修饰(例如,羟基保护基团,诸如甲硅烷基醚基团(例如,三甲基甲硅烷基、三乙基甲硅烷基、三异丙基甲硅烷基、叔丁基(二甲基)甲硅烷基、叔丁基(二苯基)甲硅烷基)、醚基团(例如,苄基、烯丙基、叔丁基、甲氧基甲基(MOM)、2‑甲氧基乙氧基甲基(MEM)、四氢吡喃基)或酰基基团(例如,乙酰基、苯甲酰基))或反向核碱基。然而,封端基团可以是防止引物通过聚合酶延伸(即,延长)的任何修饰。嵌段可以是可逆的或不可逆的。
[0250] 该封端的核苷酸可以作为包含封端的核苷酸和未封端的核苷酸的混合物的一部分添加。另选地,该封端的核苷酸可以单独地添加到流通池中,并且在添加未封端的核苷酸之前或之后添加。在添加该封端的核苷酸后,再进行至少一轮次的桥式扩增。
[0251] 该方法的一个示例示于图9中。可对扩增(双克隆)簇进行选择性扩增,如图5H所示。一组模板链上的第一引物结合序列301′(例如,P5′)可与第一固定引物201(例如,P5苔引物)退火,并且另一组模板链上的第二引物结合序列302′(例如,P7′)可与第二固定引物202(例如,P7苔引物)退火(图9A)。
[0252] 当第二引物结合序列302′(例如,P7′)与第二固定引物202退火时,引物封端剂601被选择性地安装到第二固定引物202的3′端上,而第一固定引物201的3′端没有发生安装(图9B)。
[0253] 进行桥式扩增循环导致包含模板的正向链101′和第一末端测序引物结合位点303的模板链相对于包含模板的正向互补链101和第二末端测序引物结合位点304的模板链的选择性扩增。引物封端剂601防止从第二固定引物202延伸。(图9C)。
[0254] 然后进行标准(非选择性)测序允许对模板的正向链101′(即,“第一部分”)进行测序以及对模板的正向互补链101(即,“第二部分”)进行测序,其中与该模板的正向互补链101(黑色箭头)的比例相比,该模板的正向链101′(灰色箭头)被测序的比例更大(图9D)。
[0255] 在一个另选的示例中,该方法包括使至少一个或多个延伸引物序列流过固体载体(例如,流通池)的表面,其中此类序列可结合(例如,杂交)游离的固定引物(例如,P5或P7),并且其中这些延伸引物序列还包含至少一个附加5′核苷酸;以及(b)添加引物封端剂,其中该引物封端剂与该附加5′核苷酸互补。
[0256] 该延伸引物序列可与第一固定引物或第二固定引物(例如,P5或P7)基本上互补,或者与该第一固定引物或该第二固定引物的一部分基本上互补。
[0257] 该附加5′核苷酸可以选自A、T、C或G,但可以选自T(或U)或C。在一个实施方案中,该附加5′核苷酸不是第二固定引物的3′核苷酸的互补序列(其中该延伸引物序列结合第一固定引物),或者不是第一固定引物的3′核苷酸的互补序列(其中该延伸引物序列结合第二固定引物)。例如,在第一固定引物是P5(例如,SEQ ID NO:1或5中所定义的)并且第二固定引物是P7(例如,SEQ ID NO:2中所定义的)的情况下,以及在该延伸引物序列结合该第一固定引物的情况下,该附加5′核苷酸不是A。类似地,在该延伸引物序列结合该第二固定引物的情况下,该附加5′核苷酸不是G。
[0258] 在一个实施方案中,该引物封端剂是封端的核苷酸,例如,如上所述。在一个实施方案中,该封端的核苷酸可以是A、C、T或G,但可以选自A或G。因此,在该附加5′核苷酸是T或U的情况下,该引物封端剂是A,并且在该附加5′核苷酸是C的情况下,该引物封端剂是G。
[0259] 同样,可使延伸引物序列和引物封端剂在桥式扩增后流过固体载体。在一个实施方案中,在至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少15、至少20或至少25轮次的桥式扩增后,可使引物封端剂流过固体载体。
[0260] 在一个实施方案中,该延伸引物序列选自SEQ ID NO.13至24或其变体或片段。
[0261] 该方法的一个示例示于图10中。可对扩增(双克隆)簇进行选择性扩增,如图5H所示;因此,在多个轮次的扩增后,形成了簇,该簇包含延伸的第一(例如,P5)固定多核苷酸链和第二(例如,P7)固定多核苷酸链两者。在下一轮次的扩增之前,使一个(或多个)延伸引物序列流过固体载体200的表面。延伸引物序列701与固定引物(例如,P5或P7)的至少一部分(如果不是全部的话)基本上互补,并与固定引物(例如,P5或P7)结合,如图10A所示。还是如图10A所示,延伸引物序列701包含至少一个附加5′核苷酸。
[0262] 添加延伸引物序列701后,添加引物封端剂601并使其流过固体载体(例如,流通池)的表面。由于引物封端剂601与延伸引物序列701的附加5′核苷酸互补,因此引物封端剂601结合至与延伸引物序列701杂交的固定链的3′端,如图10B所示。因此,添加引物封端剂
601不仅防止了固定链(例如,P5或P7)的延伸,而且使得固定引物(P5或P7)不可用于针对其他延伸链(例如,101′)的杂交和后续的桥式扩增(参见图10B)。
[0263] 再进行至少一个循环的桥式扩增导致包含模板的正向链101′的模板链的选择性扩增(以101′与101为2:1的比率)。同样,类似于图9D,进行标准(非选择性)测序允许对模板的正向链101′(即,“第一部分”)进行测序以及对模板的正向互补链101(即,“第二部分”)进行测序,其中与该模板的正向互补链101(黑色箭头)的比例相比,该模板的正向链101′(灰色箭头)被测序的比例更大(图9D)。
[0264] 该延伸引物序列可以作为上述扩增混合物的一部分添加。另选地,该封端的固定引物结合序列可以单独地添加到流通池中,并且可以在添加扩增混合物之前添加。在添加该封端的固定引物结合序列后,再进行至少一轮次的桥式扩增。
[0265] 使用16QAM的数据分析
[0266] 图11是示出了由本文公开的多核苷酸序列生成的信号的十六种分布的示例的散点图。
[0267] 图11的散点图示出了来自较亮信号(即,如本文所述的第一信号)和较暗信号(即,如本文所述的第二信号)的组合的强度值的十六种分布(或分区);如上所述,这两个信号可共位并且不能在光学上被分辨。图11中示出的强度值可高达比例系数或归一化系数;强度值的单位可以是任意的或相对的(即,表示实际强度与参考强度的比率)。由第一部分生成的较亮信号和由第二部分生成的较暗信号的总和产生组合信号。该组合信号可由第一光学通道和第二光学通道捕获。由于较亮信号可以是A、T、C或G,并且较暗信号可以是A、T、C或G,因此组合信号有十六种可能性,在光学捕获时对应于十六种可区分的模式。也就是说,十六种可能性中的每种可能性均对应于图11所示的分区。计算机系统可以将所生成的组合信号映射到十六个分区中的一个分区,从而分别确定第一部分处所添加的核碱基和第二部分处所添加的核碱基。
[0268] 例如,当组合信号被映射到分区1612进行碱基判读循环时,计算机处理器将第一部分处所添加的核碱基和第二部分处所添加的核碱基均碱基判读为C。当组合信号被映射到分区1614进行碱基判读循环时,处理器将第一部分处所添加的核碱基碱基判读为C,以及将第二部分处所添加的核碱基碱基判读为T。当组合信号被映射到分区1616进行碱基判读循环时,处理器将第一部分处所添加的核碱基碱基判读为C,以及将第二部分处所添加的核碱基碱基判读为G。当组合信号被映射到分区1618进行碱基判读循环时,处理器将第一部分处所添加的核碱基碱基判读为C,以及将第二部分处所添加的核碱基碱基判读为A。
[0269] 当组合信号被映射到分区1622进行碱基判读循环时,处理器将第一部分处所添加的核碱基碱基判读为T,以及将第二部分处所添加的核碱基碱基判读为C。当组合信号被映射到分区1624进行碱基判读循环时,处理器将第一部分处所添加的核碱基和第二部分处所添加的核碱基均碱基判读为T。当组合信号被映射到分区1626进行碱基判读循环时,处理器将第一部分处所添加的核碱基碱基判读为T,以及将第二部分处所添加的核碱基碱基判读为G。当组合信号被映射到分区1628进行碱基判读循环时,处理器将第一部分处所添加的核碱基碱基判读为T,以及将第二部分处所添加的核碱基碱基判读为A。
[0270] 当组合信号被映射到分区1632进行碱基判读循环时,处理器将第一部分处所添加的核碱基碱基判读为G,以及将第二部分处所添加的核碱基碱基判读为C。当组合信号被映射到分区1634进行碱基判读循环时,处理器将第一部分处所添加的核碱基碱基判读为G,以及将第二部分处所添加的核碱基判读为T。当组合信号被映射到分区1636进行碱基判读循环时,处理器将第一部分处所添加的核碱基和第二部分处所添加的核碱基均碱基判读为G。当组合信号被映射到分区1638进行碱基判读循环时,处理器将第一部分处所添加的核碱基碱基判读为G,以及将第二部分处所添加的核碱基碱基判读为A。
[0271] 当组合信号被映射到分区1642进行碱基判读循环时,处理器将第一部分处所添加的核碱基碱基判读为A,将第二部分处所添加的核碱基碱基判读为C。当组合信号被映射到分区1644进行碱基判读循环时,处理器将第一部分处所添加的核碱基碱基判读为A,以及将第二部分处所添加的核碱基碱基判读为T。当组合信号被映射到分区1646进行碱基判读循环时,处理器将第一部分处所添加的核碱基碱基判读为A,以及将第二部分处所添加的核碱基碱基判读为G。当组合信号被映射到分区1648进行碱基判读循环时,处理器将第一部分处所添加的核碱基和第二部分处所添加的核碱基均碱基判读为A。
[0272] 在该特定示例中,T被配置为在图像1通道和图像2通道两者中发射信号,A被配置为仅在图像1通道中发射信号,C被配置为仅在图像2通道中发射信号,而G在任何一个通道中都不发射信号。然而,可使用核碱基的不同排列通过进行染料交换来实现相同的效果。例如,A可被配置为在图像1通道和图像2通道两者中发射信号,T可被配置为仅在图像1通道中发射信号,C可被配置为仅在图像2通道中发射信号,而G可被配置为在任何一个通道中都不发射信号。
[0273] 有关基于具有十六个分区的散点图来执行碱基判读的更多细节可见于美国专利申请公开号2019/0212294,该美国专利申请公开的公开内容以引用方式并入本文。
[0274] 图12是示出了根据本公开的碱基判读的方法1700的流程图。所述方法允许在单次测序运行中根据从第一部分和第二部分获得的单个组合信号对两个(或更多个)部分(例如,第一部分和第二部分)进行同时测序,因此需要更少的测序试剂消耗以及从该第一部分和该第二部分两者更快地生成数据。进一步地,与现有的下一代测序方法相比,该简化的方法可减少工作流程步骤的数目,同时产生相同的产率。因此,该简化的方法可使测序运行时间缩短。
[0275] 如图12所示,所公开的方法1700可从框1701开始。该方法可接着转到框1710。
[0276] 在框1710处,获得强度数据。该强度数据包括第一强度数据和第二强度数据。该第一强度数据包括基于第一部分的相应第一核碱基获得的第一信号分量和基于第二部分的相应第二核碱基获得的第二信号分量的组合强度。类似地,该第二强度数据包括基于第一部分的相应第一核碱基获得的第三信号分量和基于第二部分的相应第二核碱基获得的第四信号分量的组合强度。
[0277] 因此,该第一部分能够生成包括第一信号分量和第三信号分量的第一信号。该第二部分能够生成包括第二信号分量和第四信号分量的第二信号。
[0278] 如上所述,第一部分和第二部分可布置在固体载体上,使得来自该第一部分和该第二部分的信号被单个感测部分检测和/或可包括单个簇,使得来自相应第一部分和第二部分中的每一者的第一信号和第二信号不能在空间上被分辨。
[0279] 在一个示例中,获得强度数据包括选择对应于两个(或更多个)不同部分(例如,第一部分和第二部分)的强度数据。在一个示例中,基于纯净度评分选择强度数据。纯净度评分可被计算为最亮的碱基信号强度除以最亮的碱基信号强度和第二亮的碱基信号强度之和的比率。期望的纯净度评分可能会有所不同,具体取决于与不同部分相关联的光发射的预期强度比率。如上所述,可能期望产生包括第一部分和第二部分的簇,这些簇产生比率为2:1的信号。在一个示例中,对应于强度比率为2:1的两个部分的高品质数据的纯净度评分可为约0.8至0.9。
[0280] 在已获得强度数据之后,该方法可进行到框1720。在该步骤中,基于强度数据选择多个分类中的一个分类。每个分类表示相应的第一核碱基和第二核碱基的可能组合。在一个示例中,多个分类包括如图11所示的十六个分类,这十六个分类各自表示第一核碱基和第二核碱基的独特组合。在有两个部分的情况下,有十六种第一核碱基和第二核碱基的可能组合。基于该第一强度数据和该第二强度数据选择该分类包括基于第一信号分量和第二信号分量的组合强度以及第三信号分量和第四信号分量的组合强度选择该分类。
[0281] 然后该方法可以进行到框1730,其中基于在框1720中选择的分类对相应第一核碱基和第二核碱基进行碱基判读。测序循环期间生成的信号指示测序期间添加的核碱基的同一性(例如,使用合成测序)。应当理解,所掺入的核碱基的同一性和结合在固体载体上的模板序列的对应位置处的互补碱基的同一性之间存在直接对应。因此,本文中对两个部分处的相应核碱基的碱基判读的任何提及涵盖与模板序列杂交的核碱基的碱基判读,以及另选地或附加地,模板序列的对应核碱基的鉴定。该方法可接着在框1740处结束。
[0282] 能够变形的聚合物
[0283] 根据本发明的一个实施方案,描述了一种能够变形的聚合物,该能够变形的聚合物包含:
[0284] 多个第一固定引物;和
[0285] 多个第二固定引物,
[0286] 其中所述多个第一固定引物和所述多个第二固定引物占据该能够变形的聚合物上的第一组位置,
[0287] 其中该能够变形的聚合物被构造为使得当该能够变形的聚合物暴露于变形触发时,所述多个第一固定引物和该第二固定引物移位到该能够变形的聚合物上不同于该第一组位置的第二组位置。
[0288] 在一个实施方案中,第二固定引物在序列上不同于第一固定引物。
[0289] 根据一个实施方案,物质组合物包含:
[0290] 能够变形的聚合物;
[0291] 多个第一固定引物;和
[0292] 多个第二固定引物,
[0293] 其中所述多个第一固定引物和所述多个第二固定引物占据该能够变形的聚合物上的第一组位置,
[0294] 其中该能够变形的聚合物被构造为使得当组合物暴露于变形触发时,所述多个第一固定引物和该第二固定引物移位到该能够变形的聚合物上不同于该第一组位置的第二组位置。
[0295] 在一些实施方案中,组合物可包含多个固定引物。在一些实施方案中,所述多个引物可附接到能够变形的聚合物。在一些实施方案中,该组合物可包含能够变形的聚合物,该能够变形的聚合物功能性地附接到多个固定引物。在一些实施方案中,固定可以是固定在能够变形的聚合物上。在一些实施方案中,该组合物可与含有游离的溶液聚合物的溶液接触。在一些实施方案中,该组合物可与溶液中的游离引物处于化学平衡,该溶液与固定引物接触。在一些实施方案中,固定引物可共价结合到组合物中的能够变形的聚合物。
[0296] 当产生模板链和模板互补链时,这些链具有形成自杂交结构的倾向(例如,当进行桥式扩增时,模板链和模板互补链形成双链桥式结构)。在典型的测序过程中,切割并洗掉一组链(例如,全部模板链或全部模板互补链),从而留下可供用于测序的单链部分。然而,在根据本发明的测序方法中(例如,在期望对模板链和模板互补链两者进行测序,即,对模板的正向链和该模板的正向互补链,或模板的正向链和该模板的反向链进行并发测序的情况下),由于缺少单链部分,自杂交可能干扰测序过程。
[0297] 有利地,能够变形的聚合物将位于第一组位置的第一固定引物和第二固定引物移位到不同于第一组位置的第二组位置的能力允许模板链和模板互补链(一旦从第一固定引物和第二固定引物延伸)彼此分离。这有效地致使模板链和模板互补链一旦暴露于变形触发就变成单链,并因此可供用于引发和测序。因此,对模板的正向链和正向互补链(或模板的正向链和反向链)进行测序而没有出现自杂交问题。
[0298] 第一组位置可对应于第一固定引物的5′端和第二固定引物的5′端在能够变形的聚合物上的空间位置(例如,第一固定引物和第二固定引物与能够变形的聚合物的附接点);类似地,第二组位置可对应于第一固定引物的5′端和第二固定引物的5′端在能够变形的聚合物上的空间位置(例如,第一固定引物和第二固定引物与能够变形的聚合物的附接点),其中这些空间位置不同于第一组位置。另选地,第一组位置可对应于第一固定引物的3′端和第二固定引物的3′端在能够变形的聚合物上的空间位置;类似地,第二组位置可对应于第一固定引物的3′端和第二固定引物的3′端在能够变形的聚合物上的空间位置,其中这些空间位置不同于第一组位置。另选地,第一组位置可对应于第一固定引物的中心部分和第二固定引物的中心部分在能够变形的聚合物上的空间位置;类似地,第二组位置可对应于第一固定引物的中心部分和第二固定引物的中心部分在能够变形的聚合物上的空间位置,其中这些空间位置不同于第一组位置。
[0299] 移位的类型不受特别限制,前提条件是第二组位置不同于第一组位置。例如,移位可涉及能够变形的聚合物的膨胀或该能够变形的聚合物的收缩;和/或第一固定引物和第二固定引物的改组。
[0300] 在一个实施方案中,该变形触发可引起能够变形的聚合物的体积膨胀。换句话讲,该能够变形的聚合物可以是能够膨胀的。体积膨胀可以是至少20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%或150%的体积增加。
[0301] 在另一个实施方案中,膨胀可以是至少20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%或150%的体积增加。在更进一步的实施方案中,膨胀可以是至少50%、60%、70%、80%、90%、100%、110%、120%、130%、140%或150%的体积增加。在又一更进一步的实施方案中,膨胀可以是少100%、110%、120%、130%、140%或
150%的体积增加。一般来讲,膨胀越大,模板链和模板互补链保持彼此杂交的可能性越小。
[0302] 在一些实施方案中,能够变形的聚合物的体积膨胀的上限可高达2000%、1500%、1000%、950%、900%、850%、800%、750%、700%、650%、600%、550%、500%、450%、
400%、350%或300%的体积增加。
[0303] 在另一个实施方案中,膨胀可以是至少20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%或150%的体积增加,最高至2000%的体积增加。在更进一步的实施方案中,膨胀可以是至少50%、60%、70%、80%、90%、100%、110%、
120%、130%、140%或150%的体积增加,最高至800%的体积增加。在又一更进一步的实施方案中,膨胀可以是至少100%、110%、120%、130%、140%或150%的体积增加,最高至
400%的体积增加。
[0304] 在一个实施方案中,该变形触发可引起能够变形的聚合物的体积收缩。换句话讲,该能够变形的聚合物可以是能够收缩的。体积收缩可以是至少20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%或150%的体积减少。
[0305] 在另一个实施方案中,收缩可以是至少20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%或150%的体积减少。在更进一步的实施方案中,收缩可以是至少50%、60%、70%、80%、90%、100%、110%、120%、130%、140%或150%的体积减少。在又一更进一步的实施方案中,收缩可以是至少100%、110%、120%、130%、140%或150%的体积减少。一般来讲,收缩越大,模板链和模板互补链保持彼此杂交的可能性就越小。
[0306] 在一些实施方案中,能够变形的聚合物的体积收缩的上限可高达2000%、1500%、1000%、950%、900%、850%、800%、750%、700%、650%、600%、550%、500%、450%、
400%、350%或300%的体积减小。
[0307] 在另一个实施方案中,收缩可以是至少20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%或150%的体积减小,最高至2000%的体积减小。在更进一步的实施方案中,收缩可以是至少50%、60%、70%、80%、90%、100%、110%、
120%、130%、140%或150%的体积减小,最高至800%的体积减小。在又一更进一步的实施方案中,收缩可以是至少100%、110%、120%、130%、140%或150%的体积减小,最高至
400%的体积减小。
[0308] 在一个实施方案中,该变形触发可引起第一固定引物和第二固定引物的改组。换句话讲,改组可以指第一固定引物和第二固定引物经历空间重排(例如,随机空间重排)的情况。这可发生在能够变形的聚合物能够膨胀的实施方案中,在该能够变形的聚合物能够收缩的实施方案中,或在第二组位置处具有第一固定引物和第二固定引物的该能够变形的聚合物与在第一组位置处具有第一固定引物和第二固定引物的该能够变形的聚合物具有相似体积的实施方案中。
[0309] 在一个实施方案中,在第二组位置处具有第一固定引物和第二固定引物的该能够变形的聚合物与在第一组位置处具有第一固定引物和第二固定引物的该能够变形的聚合物具有相似体积的情况下,该改组可伴随着该能够变形的聚合物的20%的体积减少至20%的体积增加。在另一个实施方案中,该改组可伴随着能够变形的聚合物的10%的体积减少至10%的体积增加。在更进一步的实施方案中,该改组可伴随着能够变形的聚合物的5%的体积减少至5%的体积增加。
[0310] 通过使能够变形的聚合物膨胀然后使该能够变形的聚合物收缩,或者使该能够变形的聚合物收缩然后使该能够变形的聚合物膨胀,可触发该改组。在此类情况下,在膨胀和收缩或收缩和膨胀之后,第一固定引物和第二固定引物然后可位于与膨胀和收缩或收缩和膨胀之前不同的位置。
[0311] 变形触发的类型不受特别限制,并且可以例如包括或者是物理触发和/或(生物)化学触发。
[0312] 在一个实施方案中,该物理触发可包括能够变形的聚合物的温度变化。例如,该物理触发可涉及加热或冷却能够变形的聚合物。合适的热响应聚合物是本领域技术人员已知的,并且一旦引物已经被固定到能够变形的聚合物上(即形成多个第一固定引物和第二固定引物),这些热响应聚合物就可以用作能够变形的聚合物。
[0313] 在一些实施方案中,该能够变形的聚合物可具有上临界溶解温度和/或下临界溶解温度。
[0314] 例如,该物理触发可涉及将能够变形的聚合物从低于上临界溶解温度加热至高于上临界溶解温度。在其他实施方案中,该物理触发可涉及将能够变形的聚合物从低于下临界溶解温度加热至高于下临界溶解温度。
[0315] 在其他实施方案中,该物理触发可涉及将能够变形的聚合物从高于上临界溶解温度冷却至低于上临界溶解温度。在其他实施方案中,该物理触发可涉及将能够变形的聚合物从高于下临界溶解温度冷却至低于下临界溶解温度。
[0316] 在一个实施方案中,该物理触发可涉及将能够变形的聚合物从介于50℃至100℃之间(在另一实施方案中,介于55℃至95℃之间;在更进一步的实施方案中,介于60℃至90℃之间)的温度冷却至介于10℃至40℃之间(在另一个实施方案中,介于15℃至35℃之间;在更进一步的实施方案中,介于20℃至30℃之间)的温度。在另一实施方案中,该物理触发可涉及将能够变形的聚合物从介于10℃至40℃之间(在另一实施方案中,介于15℃至35℃之间;在更进一步的实施方案中,介于20℃至30℃之间)的温度加热至介于50℃至100℃之间(在另一个实施方案中,介于55℃至95℃之间;在更进一步的实施方案中,介于60℃至90℃之间)的温度。
[0317] 在一个实施方案中,该(生物)化学触发可包括盐浓度变化。对盐浓度有响应的合适的聚合物是本领域技术人员已知的,并且一旦引物已经被固定到能够变形的聚合物上(即形成多个第一固定引物和第二固定引物),这些聚合物就可以用作能够变形的聚合物。
[0318] 例如,(生物)化学触发可涉及暴露于浓度大于10mM、大于20mM、大于50mM、大于100mM、大于150mM、大于200mM、大于250mM、大于300mM、大于350mM、大于400mM、大于450mM或大于500mM的盐的溶液。在一些实施方案中,盐可以是氯化钠。因此,(生物)化学触发可涉及暴露于包含浓度大于10mM、大于20mM、大于50mM、大于100mM、大于150mM、大于200mM、大于
250mM、大于300mM、大于350mM、大于400mM、大于450mM或大于500mM的氯化钠的溶液。
[0319] 在一些实施方案中,盐浓度的上限可高达1000mM、900mM、800mM、700mM或600mM。氯化钠浓度的上限可高达1000mM、900mM、800mM、700mM或600mM。
[0320] 在另一个实施方案中,盐浓度可大于10mM、大于20mM、大于50mM、大于100mM、大于150mM、大于200mM、大于250mM、大于300mM、大于350mM、大于400mM、大于450mM或大于500mM,最高至1000mM。在更进一步的实施方案中,盐浓度可大于100mM、大于150mM、大于200mM、大于250mM、大于300mM、大于350mM、大于400mM、大于450mM或大于500mM,最高至800mM。在又一更进一步的实施方案中,盐浓度可大于250mM、大于300mM、大于350mM、大于400mM、大于
450mM或大于500mM,最高至600mM。
[0321] 在另一个实施方案中,氯化钠浓度可大于10mM、大于20mM、大于50mM、大于100mM、大于150mM、大于200mM、大于250mM、大于300mM、大于350mM、大于400mM、大于450mM或大于500mM,最高至1000mM。在更进一步的实施方案中,氯化钠浓度可大于100mM、大于150mM、大于200mM、大于250mM、大于300mM、大于350mM、大于400mM、大于450mM或大于500mM,最高至
800mM。在又一更进一步的实施方案中,氯化钠浓度可大于250mM、大于300mM、大于350mM、大于400mM、大于450mM或大于500mM,最高至600mM。
[0322] 在一个实施方案中,(生物)化学触发可包括pH变化。对pH有响应的合适的聚合物是本领域技术人员已知的,并且一旦引物已经被固定到能够变形的聚合物上(即形成多个第一固定引物和第二固定引物),这些聚合物就可以用作能够变形的聚合物。
[0323] 在一些实施方案中,该能够变形的聚合物可包含聚电解质;或者可以是包含聚电解质的共聚物。在另外的实施方案中,该聚电解质可以是阴离子聚电解质、阳离子聚电解质或两亲聚电解质。
[0324] 例如,该(生物)化学触发可涉及暴露于酸性pH。在一个实施方案中,该(生物)化学触发可涉及暴露于小于7的pH、小于6.5的pH、小于6的pH、小于5.5的pH、小于5的pH、小于4.5的pH、小于4的pH、小于3.5的pH或小于3的pH。在另一个实施方案中,该(生物)化学触发可涉及暴露于介于2至7之间的pH、介于2.5至6.5之间的pH或介于3至6之间的pH。在另一示例中,该(生物)化学触发可涉及暴露于碱性pH。在一个实施方案中,该(生物)化学触发可涉及暴露于大于7的pH、大于7.5的pH、大于8的pH、大于8.5的pH、大于9的pH、大于9.5的pH、大于10的pH、大于10.5的pH或大于11的pH。在另一个实施方案中,该(生物)化学触发可涉及暴露于介于9至14之间的pH、介于9.5至13.5之间的pH或介于10至13之间的pH。
[0325] 合适的能够变形的聚合物的非限制性示例可包括聚(N‑异丙基丙烯酰胺)(PNiPAm)、聚(N‑异丙基甲基丙烯酰胺)(PNiPMAm)、聚(丙烯酸)(PAAc)、聚(甲基丙烯酸)、聚(4‑乙烯基吡啶)和/或聚(乙烯胺)。因此,在一些实施方案中,该能够变形的聚合物可包含聚(N‑异丙基丙烯酰胺)(PNiPAm)、聚(N‑异丙基甲基丙烯酰胺)(PNiPMAm)、聚(丙烯酸)(PAAc)、聚(甲基丙烯酸)、聚(4‑乙烯基吡啶)和/或聚(乙烯胺);或者可以是包含聚(N‑异丙基丙烯酰胺)(PNiPAm)、聚(N‑异丙基甲基丙烯酰胺)(PNiPMAm)、聚(丙烯酸)(PAAc)、聚(甲基丙烯酸)、聚(4‑乙烯基吡啶)和/或聚(乙烯胺)的共聚物。
[0326] 在一个实施方案中,第一固定引物和/或第二固定引物可通过共价键附接到能够变形的聚合物。在另一个实施方案中,这些共价键可包括环加合物、亚烯基键、酯、酰胺、醛缩醇、半缩醛胺醚、缩醛胺、亚胺、腙、硫化物键、硼基键、硅基键或磷基键。在又一个实施方案中,环加合物可包含1,2,3‑三唑键。
[0327] 在一个实施方案中,该能够变形的聚合物可由多个颗粒构成。在另一个实施方案中,颗粒可以是纳米颗粒。
[0328] 例如,纳米颗粒的(平均)粒径可介于约50nm至约500nm之间。在另外的实施方案中,纳米颗粒的(平均)粒径可介于约200nm至约400nm之间。(平均)粒径可以指在室温(25℃)下测量的颗粒尺寸。可诸如通过光散射进行颗粒尺寸分析,以获得相关的颗粒尺寸分布或Z平均值。
[0329] 在一个实施方案中,该能够变形的聚合物可包含水凝胶。
[0330] 在一个实施方案中,该能够变形的聚合物可以是共聚物,该共聚物包含对变形触发有响应的聚合物和与第一固定引物中的每个第一固定引物和第二固定引物中的每个第二固定引物已经形成共价键的聚合物。在另一个实施方案中,该能够变形的聚合物可以是共聚物,该共聚物包含对变形触发有响应的聚合物和与第一固定引物中的每个第一固定引物和第二固定引物中的每个第二固定引物已经形成环加合物的聚合物。在更进一步的实施方案中,该能够变形的聚合物可以是共聚物,该共聚物包含对变形触发有响应的聚合物和与第一固定引物中的每个第一固定引物和第二固定引物中的每个第二固定引物已经形成1,2,3‑三唑键的聚合物。
[0331] 在一个实施方案中,该能够变形的聚合物可由丙烯酰胺基单体形成。
[0332] 在一个实施方案中,该能够变形的聚合物可以是共聚物,该共聚物包含由丙烯酰胺基单体形成的聚合物、对变形触发有响应的聚合物和与第一固定引物中的每个第一固定引物和第二固定引物中的每个第二固定引物已经形成共价键的聚合物。在另一个实施方案中,该能够变形的聚合物可以是共聚物,该共聚物包含由丙烯酰胺基单体形成的聚合物、对变形触发有响应的聚合物和与第一固定引物中的每个第一固定引物和第二固定引物中的每个第二固定引物已经形成环加合物的聚合物。在更进一步的实施方案中,该能够变形的聚合物可以是共聚物,该共聚物包含由丙烯酰胺基单体形成的聚合物、对变形触发有响应的聚合物和与第一固定引物中的每个第一固定引物和第二固定引物中的每个第二固定引物已经形成1,2,3‑三唑键的聚合物。
[0333] 如本文所述的能够变形的聚合物可用作固体载体上的表面或涂层,特别是用于核酸测序的表面或涂层。
[0334] 因此,在本发明的另一方面,提供了一种包含如本文所述的能够变形的聚合物的固体载体。
[0335] 在一个实施方案中,该固体载体可以是流通池。
[0336] 如上所述,如本文所述的能够变形的聚合物和/或固体载体可用于核酸测序中,特别是并发测序。
[0337] 因此,在本发明的另一方面,提供了如本文所述的能够变形的聚合物或如本文所述的固体载体在核酸测序中的用途。
[0338] 在本发明的另一方面,提供了一种制造能够变形的聚合物的方法,该方法包括:
[0339] (a)将多个第一前体引物固定到能够变形的聚合物上以形成多个第一固定引物;以及
[0340] (b)将多个第二前体引物固定到该能够变形的聚合物上以形成多个第二固定引物;
[0341] 其中该能够变形的聚合物被构造为使得当该能够变形的聚合物暴露于变形触发时,所述多个第一固定引物和该第二固定引物移位到该能够变形的聚合物上不同于该第一组位置的第二组位置。
[0342] 在一个实施方案中,第二前体引物在序列上不同于第一前体引物。
[0343] 待制造的能够变形的聚合物可以是如本文所述的能够变形的聚合物。因此,与如本文所述的能够变形的聚合物和该能够变形的聚合物的其他特征相关的方面同样适用于本文所述的用于制造该能够变形的聚合物的方法。
[0344] 术语“第一前体引物”是指固体载体的第一固定引物在被固定到固体载体上之前的状态。因此,第一前体引物可以作为溶液中的“游离的”引物提供。在固定之后,“第一前体引物”然后被称为“第一固定引物”。
[0345] 术语“第二前体引物”是指固体载体的第二固定引物在被固定到固体载体上之前的状态。因此,第二前体引物可以作为溶液中的“游离的”引物提供。在固定之后,“第二前体引物”然后被称为“第二固定引物”。
[0346] 步骤(a)和步骤(b)可以依次或同时进行。
[0347] 例如,在步骤(a)和步骤(b)依次进行的一个实施方案中,步骤(b)可在步骤(a)之后进行。另选地,步骤(a)可在步骤(b)之后进行。
[0348] 在一个实施方案中,步骤(a)和步骤(b)可同时进行。
[0349] 固定方法不受特别限制,前提条件是第一固定引物和第二固定引物在扩增、聚簇和测序期间保留在固体载体上。
[0350] 在一个实施方案中,固定可包括在固体载体和多个第一前体引物中的每个第一前体引物之间以及在该固体载体和多个第二前体引物中的每个第二前体引物之间形成共价键。在另一个实施方案中,形成共价键涉及使用点击反应(例如,金属催化的叠氮化物‑炔烃环加成反应,诸如铜催化的叠氮化物‑炔烃环加成反应和应变促进的叠氮化物‑炔烃环加成)。
[0351] 具体地讲,形成共价键可涉及形成1,2,3‑三唑键。固定之前的固体载体可包括叠氮化物部分(例如,PAZAM),而第一前体引物和第二前体引物可各自包含炔烃部分(例如,末端炔烃、环炔烃)。固体载体上的叠氮化物部分和第一前体引物和第二前体引物上的炔烃部分之间的点击反应允许形成1,2,3‑三唑键。叠氮化物部分和炔烃部分的构型也可以例如通过下列方式进行交换:在固定之前在固体载体上包括炔烃部分,以及在第一前体引物和第二前体引物的每一者上包括叠氮化物部分。
[0352] 如本文所述的能够变形的聚合物可用于制备用于鉴定的多核苷酸序列的方法中。
[0353] 因此,在本发明的另一方面,提供了一种制备用于鉴定的多核苷酸序列的方法,该方法包括:
[0354] (a)提供如本文所述的能够变形的聚合物;
[0355] (b)合成至少一个第一多核苷酸序列和至少一个第二多核苷酸序列,所述至少一个第一多核苷酸序列各自包含第一部分并且各自从第一固定引物延伸,所述至少一个第二多核苷酸序列各自包含第二部分并且各自从第二固定引物延伸,其中该第二多核苷酸序列与该第一多核苷酸序列基本上互补。
[0356] “鉴定”在此意指从多核苷酸链获得遗传信息。这可包括多核苷酸链的遗传序列的鉴定(即,测序)。此外,这可替代地或附加地包括错配碱基对的鉴定。此外,这可替代地或附加地包括任何表观遗传修饰例如甲基化的鉴定。因此,“鉴定”可以意指多核苷酸链、错配碱基对的遗传序列的鉴定和/或任何表观遗传修饰的鉴定。
[0357] 在一个实施方案中,步骤(b)可涉及合成多个第一多核苷酸序列和多个第二多核苷酸序列,所述多个第一多核苷酸序列各自包含第一部分并且各自从第一固定引物延伸,所述多个第二多核苷酸序列各自包含第二部分并且各自从第二固定引物延伸。因此,在一个实施方案中,提供了一种制备用于鉴定的多核苷酸序列的方法,该方法包括:
[0358] (a)提供如本文所述的能够变形的聚合物;
[0359] (b)合成多个第一多核苷酸序列和多个第二多核苷酸序列,该第一多核苷酸序列各自包含第一部分并且各自从第一固定引物延伸,该第二多核苷酸序列各自包含第二部分并且各自从第二固定引物延伸,其中该第二多核苷酸序列与该第一多核苷酸序列基本上互补。
[0360] 本发明可应用于(单独的)多核苷酸链,其中第一链包含待鉴定的第一部分,并且第二链包含待鉴定的第二部分。
[0361] (单独的)多核苷酸链可包含第一链和第二链,该第一链包含可包含(或可以是)多核苷酸序列的正向链(例如,模板的正向链)的第一部分,该第二链包含可包含(或可以是)该多核苷酸序列的反向链(例如,该模板的反向链)或该多核苷酸序列的正向互补链(例如,该模板的正向互补链)的第二部分。作为另一个替代方案,(单独的)多核苷酸链可包含第一链和第二链,该第一链包含可包含(或可以是)多核苷酸序列的反向链(例如,模板的反向链)的第一部分,该第二链包含可包含(或可以是)该多核苷酸序列的正向链(例如,该模板的正向链)或该多核苷酸序列的反向互补链(例如,该模板的反向互补链)的第二部分。
[0362] 由于正向链和反向链(或正向链和正向互补链或反向链和反向互补链)基本上彼此互补,因此这些链倾向于自杂交。考虑到使用了能够变形的聚合物,其中该能够变形的聚合物被构造为使得当该能够变形的聚合物暴露于变形触发时,多个第一固定引物和第二固定引物移位到该能够变形的聚合物上不同于第一组位置的第二组位置,并且该能够变形的聚合物一暴露于变形触发,能够变形的引物就处于准备分离这些自杂交结构的状态。因此,这使得这些链成为单链并可供用于引发和测序。
[0363] 第一部分在本文中可被称为读段1(R1)。第二部分在本文中可被称为读段2(R2)。
[0364] 在一个实施方案中,第一部分是至少25或至少50个碱基对,并且第二部分是至少25个碱基对或至少50个碱基对。
[0365] 该能够变形的聚合物可以设置在固体载体上(例如,在该固体载体的表面上)。在另一个实施方案中,该固体载体可以是流通池。在另一个实施方案中,第一链和第二链中的每一者位于固体载体的单个孔中。
[0366] 多核苷酸链可以在固体载体上形成簇或成为该簇的一部分。
[0367] 如本文所用,术语“簇”可以指结合在固体载体(例如,流通池)的单个孔内的模板多核苷酸(例如,DNA或RNA)的(基本上)克隆组。因此,簇可以指孔内随后被测序的多核苷酸分子的群体。“簇”可含有模板多核苷酸的足够数目的拷贝,使得该簇能够输出允许对该簇进行测序读取的信号(例如,光信号)。“簇”可包含模板多核苷酸的例如约500至约2000个拷贝、约600至约1800个拷贝、约700至约1600个拷贝、约800至约1400个拷贝、约900至约1200个拷贝或约1000个拷贝。
[0368] 如上所述,可通过桥式扩增形成簇。
[0369] 形成的簇可以是双克隆簇。
[0370] “双克隆”簇意指随后被测序(作为下一步骤)的多核苷酸序列的群体基本上有两种类型——例如,第一序列和第二序列。因此,“双克隆”簇可以指孔内随后被测序的单一第一序列和单一第二序列的群体。“双克隆”簇可含有单一第一序列的足够数目的拷贝和单一第二序列的足够数目的拷贝,使得该簇能够输出允许对“单克隆”簇进行测序读取的信号(例如,光信号)。“双克隆”簇可包含单一第一序列和单一第二序列的例如约500至约2000个组合拷贝、约600至约1800个组合拷贝、约700至约1600个组合拷贝、约800至约1400个组合拷贝、约900至约1200个组合拷贝或约1000个组合拷贝。单一第一序列和单一第二序列的拷贝一起可包含流通池的单个孔内的全部多核苷酸的至少约50%、至少约60%、至少约70%、甚至至少约80%、至少约90%、或约95%、98%、99%或100%,从而提供基本上双克隆的“簇”。
[0371] 该方法还可包括以下步骤:制备用于并发测序的第一部分和第二部分。
[0372] 例如,该方法可包括同时使位于第一部分的3′端之后的第一测序引物结合位点与第一引物接触,并且使位于第二部分的3′端之后的第二测序引物结合位点与第二引物接触。因此,第一部分和第二部分被引发以进行并发测序。
[0373] 在一些实施方案中,该方法可包括以下步骤:处理包含第一部分的至少一个第一多核苷酸序列和包含第二部分的至少一个第二多核苷酸序列,使得一定比例的第一部分能够生成第一信号,并且一定比例的第二部分能够生成第二信号。
[0374] 在一些实施方案中,第一信号和第二信号可以在空间上被分辨。在其他实施方案中,第一信号和第二信号不能在空间上被分辨。
[0375] 在一些实施方案中(例如,在使用在空间上能够分辨的信号的情况下),一定比例的第一部分能够生成第一信号,并且一定比例的第二部分能够生成第二信号,其中该第一信号的强度与该第二信号的强度基本上相同。
[0376] 在其他实施方案中(例如,在如本文所述使用选择性处理方法的情况下),一定比例的第一部分能够生成第一信号,并且一定比例的第二部分能够生成第二信号,其中该选择性处理使该第一信号的强度大于该第二信号的强度。第一信号和第二信号不能在空间上被分辨(例如,从同一区域或基本上重叠的区域生成)。
[0377] 与选择性处理方法(例如,进行选择性扩增、进行选择性测序或准备选择性测序)相关的其他方面已经在本文中进行了描述,并且适用于制备如本文所述的用于鉴定的多核苷酸序列的方法。
[0378] 在一个实施方案中,该方法还可包括以下步骤:
[0379] (c)将该能够变形的聚合物暴露于变形触发。
[0380] 将能够变形的聚合物暴露于变形触发的步骤(c)可在合成至少一个第一多核苷酸序列和至少一个第二多核苷酸序列的步骤(b)之后进行,所述至少一个第一多核苷酸序列各自包含第一部分并且各自从第一固定引物延伸,所述至少一个第二多核苷酸序列各自包含第二部分并且各自从第二固定引物延伸。
[0381] 通过在暴露于变形触发时致动能够变形的引物,这导致第一固定引物和第二固定引物从第一组位置移位到第二组位置。因此,第一多核苷酸序列和第二多核苷酸序列也发生物理移动,从而使任何自杂交结构分离。
[0382] 如上所述,移位的类型不受特别限制,前提条件是第二组位置不同于第一组位置。
[0383] 在一个实施方案中,该变形触发可引起能够变形的聚合物的膨胀。
[0384] 在另一实施方案中,该变形触发可引起能够变形的聚合物的收缩。
[0385] 在其他实施方案中,该变形触发可引起能够变形的聚合物的膨胀然后收缩,或者该能够变形的聚合物的收缩然后膨胀。例如,该变形触发可涉及反应条件的多于一种变化,诸如加热然后冷却、冷却然后加热、暴露于高盐浓度然后低盐浓度、暴露于较低pH然后较高pH、暴露于较高pH然后较低pH等。也可以组合不同类型的变形触发,诸如温度变化、盐浓度变化和pH变化。
[0386] 如上所述,以这种方式引起膨胀然后收缩(或收缩然后膨胀)可引起第一固定引物和第二固定引物的改组。
[0387] 合适类型的变形触发(例如,物理触发和/或(生物)化学触发,诸如温度变化、盐浓度变化或pH变化)在本文中参考能够变形的聚合物进行描述,并且同样适用于可用于制备如本文所述用于鉴定的多核苷酸序列的方法中的变形触发的类型。
[0388] 测序方法
[0389] 本文还描述了对多核苷酸序列进行测序的方法,该方法包括使用如本文所述的方法制备用于鉴定的多核苷酸序列;以及对第一部分和第二部分中的核碱基进行测序。
[0390] 在一个实施方案中,对第一部分和第二部分中的核碱基进行测序的步骤可涉及对第一部分和第二部分中的核碱基进行并发测序。
[0391] 在一个实施方案中,测序可以通过合成测序或连接法测序进行。
[0392] 在一个实施方案中,该方法还可包括以下步骤:进行配对末端读取。
[0393] 在一些实施方案中,可以使用本文提到的16QAM对数据进行分析。
[0394] 因此,对核碱基进行并发测序的步骤可包括:
[0395] (a)获得第一强度数据,该第一强度数据包括基于第一部分处的相应第一核碱基获得的第一信号分量和基于第二部分处的相应第二核碱基获得的第二信号分量的组合强度,其中该第一信号分量和该第二信号分量是同时获得的;
[0396] (b)获得第二强度数据,该第二强度数据包括基于第一部分处的相应第一核碱基获得的第三信号分量和基于第二部分处的相应第二核碱基获得的第四信号分量的组合强度,其中该第三信号分量和该第四信号分量是同时获得的;
[0397] (c)基于该第一强度数据和该第二强度数据选择多个分类中的一个分类,其中每个分类表示相应第一核碱基和相应第二核碱基的可能组合;以及
[0398] (d)基于所选择的分类,碱基判读该相应第一核碱基和该相应第二核碱基。
[0399] 在一个实施方案中,基于该第一强度数据和该第二强度数据选择该分类可包括基于第一信号分量和第二信号分量的组合强度以及第三信号分量和第四信号分量的组合强度选择该分类。
[0400] 在一个实施方案中,多个分类可包括十六个分类,每个分类表示第一核碱基和第二核碱基的十六种独特组合中的一种组合。
[0401] 在一个实施方案中,可基于与相应核碱基相关联的光发射生成第一信号分量、第二信号分量、第三信号分量和第四信号分量。
[0402] 在一个示例中,光发射可由传感器检测,其中该传感器被配置为基于第一信号和第二信号提供单一输出。
[0403] 在一个实施方案中,该传感器可包括单个感测元件。
[0404] 在一个实施方案中,该方法还可包括对多个碱基判读循环中的每个碱基判读循环重复步骤(a)至步骤(d)。
[0405] 试剂盒
[0406] 如本文所述的方法可由用户物理地执行。换句话讲,用户可以自己进行如本文所述的制备用于鉴定的多核苷酸序列的方法,并且因此如本文所述的方法可不需要计算机实现。
[0407] 在本发明的另一方面,提供了一种试剂盒,该试剂盒包含如本文所述的能够变形的聚合物或如本文所述的固体载体。
[0408] 在本发明的另一方面,提供了一种试剂盒,该试剂盒包含用于制备根据本文所述的方法用于鉴定的多核苷酸序列和/或根据本文所述的方法对多核苷酸序列进行测序的说明书。
[0409] 计算机程序和产品
[0410] 在其他实施方案中,如本文所述的方法可由计算机执行。换句话讲,计算机可含有进行如本文所述的制备用于鉴定的多核苷酸序列的方法的指令,并且因此如本文所述的方法可由计算机实现。
[0411] 因此,在本发明的另一方面,提供了一种数据处理设备,该数据处理设备包括用于执行如本文所述的方法的装置。
[0412] 该数据处理设备可以是多核苷酸测序仪。
[0413] 该数据处理设备可包括用于如本文所述方法的试剂。
[0414] 该数据处理设备可包括如本文所述的固体载体,诸如流通池。
[0415] 在本发明的另一方面,提供了一种计算机程序产品,该计算机程序产品包括指令,当程序由处理器执行时,这些指令使得该处理器执行如本文所述的方法。
[0416] 在本发明的另一方面,提供了一种计算机可读存储介质,该计算机可读存储介质包括指令,当这些指令由处理器执行时,使得该处理器执行如本文所述的方法。
[0417] 在本发明的另一方面,提供了一种计算机可读数据载体,该计算机可读数据载体上存储有如本文所述的计算机程序产品。
[0418] 在本发明的另一方面,提供了一种数据载体信号,该数据载体信号承载如本文所述的计算机程序产品。
[0419] 结合本文公开的实施方案描述的各种例示性成像或数据处理技术可以实现为电子硬件、计算机软件或两者的组合。为了说明硬件和软件的这种可互换性,各种例示性的部件、块、模块和步骤已经在上文总体上就其功能性进行了描述。将此功能性实施为硬件还是软件取决于特定应用和强加于整个系统的设计约束。所描述的功能性可以针对每个特定应用以不同方式实施,但此类实施决策不应被解释为导致脱离本公开的范围。
[0420] 结合本文所公开的实施方案描述的各种例示性检测系统可以由被设计成执行本文所述功能的机器实现或执行,该机器诸如配置有具体指令的处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其他可编程逻辑器件、离散栅极或晶体管逻辑部件、分立硬件部件,或它们的任何组合。处理器可以是微处理器,但在替代方案中,处理器可以是控制器、微控制器或状态机、它们的组合等。处理器也可以被实现为计算装置的组合,例如,DSP和微处理器的组合、多个微处理器、与DSP内核结合的一个或多个微处理器,或任何其他这种配置。例如,本文描述的系统可以使用分立存储器芯片、微处理器中的存储器的一部分、闪存、EPROM或其他类型的存储器来实现。
[0421] 结合本文所公开的实施方案描述的方法、过程或算法的要素可以直接实施于硬件中、由处理器执行的软件模块中,或这两者的组合中。软件模块可以驻留在RAM存储器、闪存存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD‑ROM,或本领域中已知的任何其他形式的计算机可读存储介质中。示例性存储介质可以耦合到处理器,使得处理器可以从该存储介质读取信息并将信息写入到其中。在替代方案中,存储介质可以与处理器成一整体。处理器和存储介质可以驻留在ASIC中。软件模块可以包括使硬件处理器执行计算机可执行指令的计算机可执行指令。
[0422] 计算机可执行指令可被存储在存储代码或计算机可读指令的(暂态或非暂态)计算机可读存储介质(例如,存储器、存储系统等)中。
[0423] 附加说明
[0424] 本文描述的实施方案是示例性的。可以对这些实施方案进行修改、重新布置、替代加工等,这些仍然涵盖在本文阐述的教导内容之中。本文描述的步骤、过程或方法中的一者或多者可以由适当编程的一个或多个处理装置和/或数字装置来执行。
[0425] 除非另外特别说明或者在使用的上下文中以其他方式理解,否则本文所使用的条件语言诸如“能够”、“可能”、“可以”、“例如”等通常旨在传达某些实施方案包括、而其他实施方案不包括某些特征、要素和/或状态。因此,这种条件语言通常并不旨在暗示特征、要素和/或状态以任何方式对于一个或多个实施方案是必须的,也不旨在暗示一个或多个实施方案必然包括用于在有或没有作者输入或提示的情况下决定这些特征、要素和/或状态是否包括在任何特定实施方案中或要在任何特定实施方案中执行的逻辑。术语“包括”、“包含”、“具有”、“涉及”等是同义词,以开放的方式包含性地使用,而且不排除附加的要素、特征、动作、操作,诸如此类。而且,术语“或”以其包含的意义(而不是以其排他的意义)使用,使得当例如用于连接要素的清单时,术语“或”意指该清单中的要素中的一个、一些或全部。术语“包含”可被认为涵盖“组成”。
[0426] 除非另外特别说明或者在通常用于表示某个项目、术语等的上下文中以其他方式理解,否则析取性语言诸如短语“X、Y或Z中的至少一者”可以是X、Y或Z,或者它们的任何组合(例如,X、Y和/或Z)。因此,此类析取性语言通常并不旨在且不应暗示某些实施方案需要X中的至少一者、Y中的至少一者或Z中的至少一者各自都存在。
[0427] 术语“约”或“近似”等是同义词,用于指示由该术语修饰的值具有与其相关联的理解范围,其中该范围可以是±20%、±15%、±10%、±5%或±1%。术语“基本上”用于表示结果(例如,测量值)接近目标值,其中“接近”可以意指例如结果在该值的80%内、在该值的90%内、在该值的95%内,或在该值的99%内。术语“部分地”用于表示效果仅部分地或在有限程度上。
[0428] 除非另外明确说明,否则诸如“一个”或“一种”的冠词通常应当被解释为包括一个或多个所描述的项目。因此,短语诸如“一种装置,其被配置为”或“一种装置,其用于”旨在包括一个或多个所记载的装置。此类一个或多个所述设备还可以被共同配置为执行所述表述。例如,“用于执行表述A、B和C的处理器”可以包括被配置为执行表述A并且与被配置为执行表述B和表述C的第二处理器协同工作的第一处理器。
[0429] 虽然以上的详细描述已展示、描述并指出应用于例示性实施方案的新颖特征,但是应当理解,可以在不脱离本公开实质的情况下,对举例说明的装置或算法的形式和细节作出各种省略、替代和改变。如将认识到的,本文描述的某些实施方案可以在并没有提供本文阐述的所有特征和益处的形式内体现,因为一些特征可以与其他特征分开使用或实践。在各项权利要求的等效含义和范围内的所有改变都将包含在其范围内。
[0430] 应当理解,前述概念(假设此类概念不相互矛盾)的所有组合都被设想为是本文公开的发明主题的一部分。具体地讲,出现在本公开末尾的要求保护的主题的所有组合都被设想为是本文所公开的发明主题的一部分。
[0431] 现在将通过以下非限制性实施例来描述本发明。
[0432] 实施例
[0433] 实施例1:不同扩增对正向链和反向链自杂交能力的影响的研究
[0434] 聚合物通常表现为无规卷曲的意大利式面条球状物,其尺寸由分子的持续长度决定。可通过新的膨胀距离对聚合物的延伸功进行一些简单的估计。参见下表中的计算结果。延伸功可用于估计DNA分子将自发延伸至该距离并与其互补链结合的可能性。从下表中可以看出,该可能性随着膨胀而大大降低。
[0435]   3×膨胀 2×膨胀 1.5×膨胀 纳米孔尺寸 400 400 400 nm
#DNA分子 500 500 500 计数
平均间距 17.9 17.9 17.9 nm
[0436]
[0437] 在低张力下,ssDNA的行为大致像由下式描述的虎克弹簧一样:
[0438]
[0439] 对于在正则系综中处于平衡的系统,该系统处于能量为E的状态的概率与e‑ΔE/kT成比例。
[0440] 实施例2:P5/P7接枝的纳米凝胶的合成
[0441] 含叠氮基的聚合物颗粒的合成。在水性介质中使用悬浮聚合合成颗粒。十二烷基硫酸钠(SDS)用作阴离子表面活性剂。在典型的工序中,将由N‑异丙基丙烯酰胺、丙烯酸、N‑(5‑(2‑叠氮基乙酰胺基)戊基)丙烯酰胺和N,N′‑亚甲基双丙烯酰胺组成的单体混合物添加到反应烧瓶中的去离子水中,之后添加SDS。将混合物在氮气下在70℃下进行脱气,之后添加自由基引发剂(过硫酸铵)。该反应在氮气下在70℃下进行。在反应结束时,将混合物暴露于空气并在冰浴中猝灭。使用对去离子水渗析对颗粒进行纯化,其中截留分子量膜(MWCO)为14,000Da。
[0442] P5/P7接枝的纳米凝胶的合成。使用(1R,8S,9S)‑二环[6.1.0]壬炔(BCN)和叠氮基(N3)之间的应变促进的叠氮化物‑炔烃环加成反应将P5/P7引物接枝到颗粒上。将含有BCN端基的P5/P7添加到纳米凝胶颗粒的溶液中。反应在室温下进行18小时。使用对去离子水渗析对颗粒进行纯化,其中截留分子量膜(MWCO)为14,000Da。
[0443] 更多示例描述于US 63/407,852中,其内容以引用方式并入本文。
[0444] 序列表
[0445] SEQ ID NO.1:P5序列
[0446] AATGATACGGCGACCACCGAGATCTACAC
[0447] SEQ ID NO.2:P7序列
[0448] CAAGCAGAAGACGGCATACGAGAT
[0449] SEQ ID NO.3:P5′序列(与P5互补)
[0450] GTGTAGATCTCGGTGGTCGCCGTATCATT
[0451] SEQ ID NO.4:P7′序列(与P7互补)
[0452] ATCTCGTATGCCGTCTTCTGCTTG
[0453] SEQ ID NO.5:替代P5序列
[0454] AATGATACGGCGACCGA
[0455] SEQ ID NO.6:替代P5′序列(与替代P5序列互补)
[0456] TCGGTCGCCGTATCATT
[0457] SEQ ID NO.7:SBS3
[0458] ACACTCTTTCCCTACACGACGCTCTTCCGATCT
[0459] SEQ ID NO.8:SBS3′
[0460] AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT
[0461] SEQ ID NO.9:SBS12
[0462] GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
[0463] SEQ ID NO.10:SBS12′
[0464] AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC
[0465] SEQ ID NO.11:可去除的P5序列
[0466] TTTTTTTTTTAATGATACGGCGACCACCGAUCTACAC
[0467] (其中U=2‑脱氧尿苷)
[0468] SEq ID NO.12:可去除的P7序列
[0469] TTTTTTTTTTCAAGCAGAAGACGGCATACGA[G氧代]AT
[0470] (其中[G氧代]=8‑氧代鸟嘌呤)
[0471] SEQ ID NO.13:以A作为附加5′核苷酸且具有P5′序列(与P5互补)的延伸引物序列[0472] AGTGTAGATCTCGGTGGTCGCCGTATCATT
[0473] SEQ ID NO.14:以T作为附加5′核苷酸且具有P5′序列(与P5互补)的延伸引物序列[0474] TGTGTAGATCTCGGTGGTCGCCGTATCATT
[0475] SEQ ID NO.15:以C作为附加5′核苷酸且具有P5′序列(与P5互补)的延伸引物序列[0476] CGTGTAGATCTCGGTGGTCGCCGTATCATT
[0477] SEQ ID NO.16:以G作为附加5′核苷酸且具有P5′序列(与P5互补)的延伸引物序列[0478] GGTGTAGATCTCGGTGGTCGCCGTATCATT
[0479] SEQ ID NO.17:以A作为附加5′核苷酸且具有P7′序列(与P7互补)的延伸引物序列[0480] AATCTCGTATGCCGTCTTCTGCTTG
[0481] SEQ ID NO.18:以T作为附加5′核苷酸且具有P7′序列(与P7互补)的延伸引物序列[0482] TATCTCGTATGCCGTCTTCTGCTTG
[0483] SEQ ID NO.19:以C作为附加5′核苷酸且具有P7′序列(与P7互补)的延伸引物序列[0484] CATCTCGTATGCCGTCTTCTGCTTG
[0485] SEQ ID NO.20:以G作为附加5′核苷酸且具有P7′序列(与P7互补)的延伸引物序列[0486] GATCTCGTATGCCGTCTTCTGCTTG
[0487] SEQ ID NO.21:以A作为附加5′核苷酸且具有替代P5′序列(与替代P5互补)的延伸引物序列
[0488] ATCGGTCGCCGTATCATT
[0489] SEQ ID NO.22:以T作为附加5′核苷酸且具有替代P5′序列(与替代P5互补)的延伸引物序列
[0490] TTCGGTCGCCGTATCATT
[0491] SEQ ID NO.23:以C作为附加5′核苷酸且具有替代P5′序列(与替代P5互补)的延伸引物序列
[0492] CTCGGTCGCCGTATCATT
[0493] SEQ ID NO.24:以G作为附加5′核苷酸且具有替代P5′序列(与替代P5互补)的延伸引物序列
[0494] GTCGGTCGCCGTATCATT

当前第1页 第1页 第2页 第3页
相关技术
变形聚合物相关技术
固定引相关技术
M·多沃特发明人的其他相关专利技术