CN116323974A - 多路复用covid-19锁式测定 - Google Patents

多路复用covid-19锁式测定 Download PDF

Info

Publication number
CN116323974A
CN116323974A CN202180066938.1A CN202180066938A CN116323974A CN 116323974 A CN116323974 A CN 116323974A CN 202180066938 A CN202180066938 A CN 202180066938A CN 116323974 A CN116323974 A CN 116323974A
Authority
CN
China
Prior art keywords
nucleic acid
acid probe
probe molecule
sample
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180066938.1A
Other languages
English (en)
Inventor
洛伦佐·贝尔蒂
塞米恩·克鲁格利亚克
马修·克林格
莫利·何
锡南·阿尔斯兰
赵军花
迈克尔·普雷维特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Element Bioscience Corp
Original Assignee
Element Bioscience Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Element Bioscience Corp filed Critical Element Bioscience Corp
Publication of CN116323974A publication Critical patent/CN116323974A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Abstract

描述了用于检测多个样品中的一个或多个样品中靶核酸序列的存在的方法和系统。该方法可包括线性条形码化核酸探针的使用,其在与靶核酸序列杂交后可被连接以环化探针分子、被扩增且被测序。整合至核酸探针分子中的探针特异性条形码以及可整合至核酸探针分子中或可在扩增步骤期间添加的样品特异性条形码的使用使得能够进行大规模多路复用的测定和样品处理。

Description

多路复用COVID-19锁式测定
交叉引用
本申请要求于2020年7月31日提交的美国临时申请63/059,723号的权益,其通过引用以其整体并入本文。
序列表
本申请包括以ASCII格式电子提交的序列表,其通过引用以其整体并入本文。所述ASCII副本创建于2021年7月27日,命名为52933-732_601_SL.txt,大小为123,892字节。
背景技术
COVID-19疫情凸显了当前基于PCR的分子诊断测试能力的缺点。除了许多基于PCR的测试缺乏精确性和不可接受的假阳性率/假阴性率之外,现有测定的关键缺点是无法快速且成本有效地将测试规模化至传染病的群体水平监测。这些缺点主要是由于单个测定产生的信息量有限,单个测定通常限于仅测试几个样品复制品,因此不足以产生高精确性测试结果。另外,所用的(主要基于PCR的)分子诊断技术当前无法适用于大规模样品多路复用。因此,仍需要一种也与大规模多路复用策略兼容的成本有效的方法来增加每个测定的样品复制测试数。
本公开涉及用于解决当前分子诊断测试能力在涉及传染病的群体规模监测时的缺点的组合物、方法和系统。
发明内容
本文公开的方面提供了用于核酸检测的方法,所述方法包括:(a)使获自样品的核酸序列与包括远端和近端的核酸探针分子在足以使所述核酸探针分子的所述远端和所述核酸探针分子的所述近端与所述核酸序列偶联的条件下接触,从而形成环状核酸探针分子;以及(b)通过鉴定所述环状核酸探针分子的序列来检测所述核酸序列的存在,其中所述检测包括在聚合酶的存在下在(i)所述环状核酸探针分子或其衍生物与(ii)包括可检测标记的核苷酸部分之间进行核苷酸结合反应,其中所述核苷酸结合反应在所述核苷酸部分未掺入所述环状核酸探针分子或其衍生物中的情况下进行。在一些实施方案中,所述环状核酸探针分子在其序列中包括缺口(gap)。在一些实施方案中,所述方法进一步包括使所述核酸探针分子与聚合酶在足以进行延伸反应的条件下接触,从而用所述核酸序列的一部分的拷贝填补所述缺口。在一些实施方案中,(b)中鉴定的所述环状核酸探针分子的所述序列包括所述核酸序列的所述部分。在一些实施方案中,所述方法进一步包括在所述延伸反应后,使所述核酸探针分子与连接酶在足以将所述核酸探针分子的所述远端连接至所述核酸探针分子的所述近端的条件下接触。在一些实施方案中,所述缺口的长度包括1至200个连续核苷酸。在一些实施方案中,所述方法进一步包括使所述核酸探针分子与连接酶在足以将所述核酸探针分子的所述远端连接至所述核酸探针分子的所述近端的条件下接触,从而形成所述环状核酸探针分子。在一些实施方案中,所述核酸探针分子在未杂交时是线性的。在一些实施方案中,(b)中鉴定的所述环状核酸探针分子的所述核酸序列包括条形码序列,该条形码序列在被鉴定时独特地鉴定所述核酸序列的所述存在。在一些实施方案中,所述方法进一步包括:(c)重复(a)至(b),以鉴定样品中多个所述环状核酸探针分子的多个所述核酸序列;以及(d)对(c)中鉴定到所述多个所述核酸序列中的每个所述核酸序列的次数进行计数。在一些实施方案中,所述方法进一步包括确定所述样品中所述核酸序列的拷贝数,其中所述样品中所述核酸序列的所述拷贝数与(d)中计数到所述每个所述核酸序列的所述次数成比例。在一些实施方案中,所述方法进一步包括多路复用所述方法,包括:(c)重复(a)至(b),以鉴定所述样品中多个所述环状核酸探针分子的多个所述核酸序列,其中所述多个所述环状核酸探针分子的第一子集不同于所述多个所述环状核酸分子的第二子集;以及(d)对(c)中鉴定到所述第一子集的第一核酸序列和所述第二子集的第二核酸序列的次数进行计数。在一些实施方案中,所述多个所述环状核酸探针分子的所述第一子集与所述多个所述环状核酸分子的所述第二子集的不同之处在于:(i)所述第一子集包括与所述第二子集不同的条形码序列;(ii)所述第一子集包括与所述第二子集不同的远端或近端;或(iii)(i)和(ii)的组合。在一些实施方案中,所述方法进一步包括检测所述样品中第二核酸序列的存在,包括:(c)使所述样品中的所述第二核酸序列与第二核酸探针分子在足以使所述第二核酸序列与所述第二核酸探针分子偶联的条件下接触,从而形成第二环状核酸探针分子;以及(d)使所述第二环状核酸探针分子或其衍生物与(i)第二聚合酶和(ii)包括第二可检测标记的第二核苷酸部分在足以引起所述第二环状核酸探针分子或其衍生物与所述第二核苷酸部分之间发生第二核苷酸结合反应的条件下、在所述第二核苷酸部分未掺入所述第二环状核酸探针分子或其衍生物中的情况下接触,其中所述第二核酸序列不同于(b)中检测到的所述核酸序列。在一些实施方案中,所述方法进一步包括扩增所述环状核酸探针分子,以产生所述其衍生物。在一些实施方案中,所述扩增包括进行滚环扩增。在一些实施方案中,所述核苷酸部分与聚合物-核苷酸组合物中的聚合物核偶联,形成聚合物-核苷酸缀合物。在一些实施方案中,所述可检测标记与所述聚合物-核苷酸组合物的所述聚合物核偶联。在一些实施方案中,所述核苷酸结合反应包括所述核苷酸部分中的两个或更多个与所述核酸序列的两个或更多个拷贝之间的两个或更多个结合事件。在一些实施方案中,所述可检测标记包括荧光标记。在一些实施方案中,所述方法进一步包括检测来源于第二样品的第二核酸序列的存在,包括:(c)使所述第二样品中的所述第二核酸序列与第二核酸探针分子在足以使所述第二核酸序列与所述第二核酸探针分子偶联的条件下接触,从而形成第二环状核酸探针分子;以及(d)使所述第二环状核酸探针分子或其衍生物与(i)第二聚合酶和(ii)包括第二可检测标记的第二核苷酸部分在足以引起所述第二环状核酸探针分子或其衍生物与所述第二核苷酸部分之间发生第二核苷酸结合反应的条件下、在所述第二核苷酸部分未掺入所述第二环状核酸探针分子或其衍生物中的情况下接触,其中所述第二核酸序列不同于(b)中检测到的所述核酸序列,从而检测所述第二样品中所述第二核酸序列的存在。在一些实施方案中,所述第二样品获自与所述样品不同的来源。在一些实施方案中,所述方法进一步包括通过所述核酸序列和所述第二核酸序列的病原体来源追踪病原体感染,其中所述追踪包括将收集所述样品的第一位置或第一时间与收集所述第二样品的第二位置或第二时间进行比较。根据权利要求1-23中任一项所述的方法,其中所述样品获自包括以下项的来源:(i)土壤;(ii)污水;(iii)生物组织;(iv)食品;(v)与(i)至(iv)中的一个或多个接触的物体表面;或(vi)(i)至(v)的任何组合。
本文公开的方面提供了用于核酸检测的系统,所述系统包括:一个或多个计算机处理器,其单独地或共同地经编程以实施方法,包括:(a)使核酸序列与核酸探针分子在足以引起(i)所述核酸探针分子的近端与所述核酸序列的第一部分偶联和(ii)所述核酸探针分子的远端与所述核酸序列的第二部分偶联的条件下接触,从而形成环状核酸探针分子;以及(b)使所述环状核酸探针分子或其衍生物与(i)聚合酶和(ii)包括可检测标记的核苷酸部分在足以引起所述环状核酸探针分子或其衍生物与所述核苷酸部分之间发生核苷酸结合反应的条件下、在所述核苷酸部分未掺入所述环状核酸探针分子或其衍生物中的情况下接触。在一些实施方案中,所述系统进一步包括所述核酸探针分子,其中所述核酸探针分子包括(i)包括与所述核酸序列的所述第一部分互补的第一核酸序列的所述近端和(ii)包括与所述核酸序列的所述第二部分互补的第二核酸序列的所述远端。在一些实施方案中,所述系统进一步包括具有表面的基底,该表面包括与其偶联的聚合物层,其中所述环状核酸探针分子与所述聚合物层偶联。在一些实施方案中,所述聚合物层包括亲水性聚合物。在一些实施方案中,所述亲水性聚合物包括聚(乙二醇)(PEG)、聚(乙烯醇)(PVA)、聚(乙烯基吡啶)、聚(乙烯基吡咯烷酮)(PVP)、聚(丙烯酸)(PAA)、聚丙烯酰胺、聚(N-异丙基丙烯酰胺)(PNIPAM)、聚(甲基丙烯酸甲酯)(PMA)、聚(甲基丙烯酸2-羟乙基酯)(PHEMA)、聚(低聚(乙二醇)甲基醚甲基丙烯酸酯)(POEGMA)、聚谷氨酸(PGA)、聚赖氨酸、聚葡糖苷、链霉亲和素、葡聚糖或其任何组合。在一些实施方案中,所述表面包括流动池的两个或更多个内表面。在一些实施方案中,所述系统进一步包括连接酶或其催化活性片段,所述连接酶或其催化活性片段配置为连接所述核酸探针分子的所述近端和所述核酸探针分子的所述远端,以形成所述环状核酸探针分子。在一些实施方案中,所述环状核酸探针分子在其核酸序列中包括缺口。在一些实施方案中,所述系统进一步包括聚合酶,其配置为进行所述环状核酸探针分子的延伸反应,从而填补所述缺口。在一些实施方案中,所述缺口用所述核酸序列的第三部分的拷贝填补。在一些实施方案中,所述缺口的长度包括1至200个连续核苷酸。在一些实施方案中,所述核酸探针分子在未杂交时是线性的。在一些实施方案中,所述方法进一步包括重复(a)和(b),以鉴定所述环状核酸探针分子或其衍生物的序列,其中所述序列包括独特地鉴定所述序列的条形码序列。在一些实施方案中,所述方法进一步包括:(c)重复(a)至(b),以鉴定所述样品中多个所述环状核酸探针分子的多个所述核酸序列;以及(d)对(c)中鉴定到所述多个所述环状核酸探针分子的所述多个所述序列中的每个序列的次数进行计数。在一些实施方案中,所述系统进一步包括多个所述环状核酸探针分子,其包括所述多个所述环状核酸探针分子的第一子集和所述多个所述环状核酸探针分子的第二子集,其中所述第一子集不同于所述第二子集。在一些实施方案中,所述方法进一步包括:(c)重复(a)至(b),以鉴定所述样品中多个所述环状核酸探针分子的多个所述核酸序列;以及(d)对(c)中鉴定到所述第一子集的第一序列和所述第二子集的第二序列的次数进行计数。根据权利要求39或权利要求40所述的系统,所述多个所述环状核酸探针分子的所述第一子集与所述多个所述环状核酸探针分子的所述第二子集的不同之处在于:(i)所述第一子集包括与所述第二子集不同的条形码序列;(ii)所述第一子集包括与所述第二子集不同的远端或近端;或(iii)(i)和(ii)的组合。在一些实施方案中,所述系统进一步包括第二核酸探针分子,其中所述第二核酸探针分子配置为与不同于所述核酸序列的第二核酸序列偶联。在一些实施方案中,所述方法进一步包括检测所述样品中所述第二核酸的存在,包括:(c)使所述样品中的所述第二核酸序列与所述第二核酸探针分子在足以使所述第二核酸序列与所述第二核酸探针分子偶联的条件下接触,从而形成第二环状核酸探针分子;以及(b)使所述第二环状核酸探针分子或其衍生物与(i)第二聚合酶和(ii)包括第二可检测标记的所述第二核苷酸部分在足以引起所述第二环状核酸探针分子或其衍生物和第二核苷酸部分之间发生第二核苷酸结合反应的条件下、在所述第二核苷酸部分未掺入所述第二环状核酸探针分子或其衍生物中的情况下接触。在一些实施方案中,所述核苷酸部分与聚合物-核苷酸组合物中的聚合物核偶联。在一些实施方案中,所述可检测标记与所述聚合物-核苷酸组合物中的所述聚合物核偶联,形成聚合物-核苷酸缀合物。在一些实施方案中,所述核苷酸结合反应包括所述核苷酸部分中的两个或更多个与所述核酸序列的两个或更多个拷贝之间的两个或更多个结合事件。在一些实施方案中,所述可检测标记包括荧光标记。在一些实施方案中,所述核酸序列获自包括以下项的样品:(i)土壤;(ii)污水;(iii)生物组织;(iv)食品;(v)与(i)至(iv)中的一个或多个接触的物体表面;或(vi)(i)至(v)的任何组合。
援引并入
在本说明书中提及的所有出版物、专利和专利申请通过引用以其整体并入本文,其程度如同每个单独的出版物、专利或专利申请被具体地和单独地指出通过引用以其整体并入。在本文中的术语与并入的参考文献中的术语之间存在冲突的情况下,以本文中的术语为准。
附图说明
本发明的新颖特征在所附权利要求中特别阐述。通过参照以下阐述说明性实施方案的详细描述,将更好地理解本发明的特征和优点,其中利用了本发明原理,并且在附图中:
图1提供了根据本文的一些实施方案的常规锁式探针及其用于检测单核苷酸多态性(SNP)的示意图(来自New England Biolabs)。
图2提供了本公开的条形码化锁式探针的非限制性实例。图2按出现的顺序分别公开了SEQ ID NO 7-9。
图3提供了根据本文的一些实施方案的SARS-CoV-2(COVID-19)基因组的示意图(来自约翰霍普金斯卫生安全中心(Johns Hopkins Center for Health Security),“Comparison of National RT-PCR Primers,Probes,and Protocols for SARS-CoV-2Diagnostics”,2020年4月13日)。
图4提供了根据本文的一些实施方案的条形码化分子倒置探针(MIP)测定的工作流的非限制性实例。
图5提供了根据本文的一些实施方案的用于进行本公开的多路复用锁式测定的工作流的示意图,其指示不同测定步骤所需的大致时间。
图6提供了根据本文的一些实施方案的使用本文描述的多价结合组合物形成的多价结合复合物的示意图。
图7示出了根据本文的一些实施方案的在结合、持续以及洗涤和去除多价基底期间观察到的信号强度增加的概括性图示。
图8提供了根据本文的一些实施方案的用于进行多路复用锁式测定和随后的测序以检测条形码序列并解复用测定数据的工作流的示意图。
图9A-9C提供了根据本文的一些实施方案的多路复用COVID-19测定的模拟数据输出的实例。图9A:阳性,高滴度样品。图9B:阳性样品,低滴度。图9C:阴性样品。
图10示意性地描绘了根据本文的一些实施方案的示例计算机控制系统。
图11提供了根据本文的一些实施方案的来自确定绿色荧光染料与根据不同表面修饰方案处理的玻璃基底表面非特异性结合的相对水平的研究的图像数据的实例。
图12提供了根据本文的一些实施方案的来自确定红色荧光染料与根据不同表面修饰方案处理的玻璃基底表面非特异性结合的相对水平的研究的图像数据的实例。
图13提供了根据本文的一些实施方案的根据不同表面修饰方案处理的基底表面的寡核苷酸引物接枝数据的实例。
图14提供了根据本文的一些实施方案的通过改变基底上的寡核苷酸引物密度证明在低结合固体支持体上“可调”核酸扩增的图像和数据的实例。蓝色直方图:低引物密度。红色直方图:高引物密度。通过调节寡核苷酸引物密度,低非特异性结合和可调的核酸扩增效率的组合产生高CNR以及随后核酸测序性能的改进。
图15提供了根据本文的一些实施方案的绿色和红色荧光染料与根据不同表面修饰方案处理的基底表面非特异性结合的图像和数据的实例。为了比较,在偶联单个Cy3标记的核苷酸碱基后,在同一组实验条件下测量的克隆扩增的模板群落的荧光强度为约1,500个计数。
图16提供了根据本文的一些实施方案的本公开的低结合固体支持体的荧光图像的实例,在该低结合固体支持体上使用不同的引物密度、等温扩增方法和扩增缓冲液添加剂扩增了栓系的寡核苷酸。
图17提供了根据本文的一些实施方案的本公开的低结合支持体的荧光图像和强度数据的实例,在该低结合支持体上进行了固相核酸扩增,以产生模板寡核苷酸序列的克隆扩增簇。
图18提供了根据本文的一些实施方案的本公开的低结合支持体的荧光图像和强度数据的第二实例,在该低结合支持体上进行了固相核酸扩增,以产生模板寡核苷酸序列的克隆扩增簇。
图19提供了根据本文的一些实施方案的本公开的低结合支持体的荧光图像和强度数据的实例,在该低结合支持体上进行了固相核酸扩增,以产生模板寡核苷酸序列的克隆扩增簇。
图20A-图20B提供了如本文描述的证明通过重新配制用于固相核酸扩增的杂交缓冲液可以实现杂交严格性、速度和效力的改善的图像数据的非限制性实例。图20A提供了两种不同杂交缓冲液配方和方案的图像数据的实例。图20B提供了使用标准杂交缓冲液和方案获得的相应图像数据的实例。
图21A-图21J示出了使用多价PEG-基底组合物的测序反应步骤的荧光图像。图21A:在含有20nM Klenow聚合酶和2.5mM Sr+2的暴露缓冲液中将DNA RCA模板(G和A第一碱基)暴露于500nM碱基标记的核苷酸(A-Cy3和G-Cy5)后的红色和绿色荧光图像。在用与暴露缓冲液组成相同但不含核苷酸或聚合酶的成像缓冲液洗涤后,收集图像。缩放对比度,以使最微弱信号的可视化最大化,但在用成像缓冲液洗涤后无信号持续(图21A,小图)。图21B-21E:显示如上所述在暴露缓冲液中混合并在成像缓冲液中成像后有效核苷酸浓度为500nM的多价PEG-核苷酸(碱基标记的)配体PB1(图21B)、图21C)、PB3(图21D)和PB5(图21E)的荧光图像。图21F:显示如上所述在暴露缓冲液中混合并在成像缓冲液中成像后的2.5uM的多价PEG-核苷酸(碱基标记的)配体PB5的荧光图像。图21G-22I:显示通过将多价结合组合物暴露于klenow聚合酶的非活性突变体(图21G:D882;图21H:D882E;图21I:HD882A)与野生型Klenow(对照)酶(图21J)进一步碱基辨别的荧光图像。
图22示出了根据本文的一些实施方案的毛细管腔中簇扩增的可视化。
图23提供了根据本文的一些实施方案的基于云的监测全球疫情的方法的示意图。
具体实施方式
虽然市场上存在大量用于检测COVID-19的快速且成本有效的测定,但样品多路复用有限是所有当前方法的共同缺点。即使在确保了关键测定组分供应链的情况下,大多数实验室仍难以处理大量样品,这导致不可接受的回复时间。这些测定的有限价值在于它们可以诊断有限数量的个体,同时抢先隔离他们,但对提供疫情演变的实时地理和环境图景无效。由于上述样品通量限制,当前的COVID-19测试基础设施提供了被动、延迟的疫情状态观察,而不是所需的主动和抢占的监测基础设施。所公开的组合物、方法和系统通过使用利用本申请人正在开发的专有测序平台的新型条形码化锁式探针测定或条形码化分子倒置探针测定,克服了当前分子诊断测试能力的主要缺点,即低通量、缺乏精确性,不可接受的假阳性率/假阴性率,以及无法快速且成本有效地将测试规模化至传染病的群体水平监测。
本文公开了条形码化锁式测定和条形码化分子倒置探针测定,其利用包括与特异性靶核酸序列互补的捕获序列(例如,靶特异性捕获区域或序列)的线性核酸探针分子。在一些情况下,线性核酸探针分子包括锁式探针。在一些情况下,例如,捕获序列可以与特异性COVID-19序列或其他传染病病原体序列互补。在一些情况下,线性核酸探针分子可包括与通用引发位点(例如,扩增引物结合位点或测序引物结合位点)相邻的探针特异性条形码序列(位于探针序列的非靶特异性区域中),其中探针特异性条形码(或简称为“探针条形码”)对于给定的成对靶特异性捕获序列是独特的。在一些情况下,线性核酸探针分子可包括与探针特异性条形码序列和通用引发位点(例如,扩增引物结合位点)相邻的样品特异性条形码序列(也位于探针序列的非靶特异性区域中),其中样品特异性条形码(或简称为“样品条形码”)对于一个或多次实验运行中待分析的多个样品中的给定样品是独特的。如果样品中存在目的靶核酸序列(例如,COVID-19序列),则锁式探针将与靶序列(或其区域)特异性杂交,从而促进可以通过连接完成的环化事件。在连接后,可以使用例如等温滚环扩增(RCA)来扩增环状核酸探针分子(例如,阳性锁式探针),包括其中含有的条形码序列。在一些情况下,例如,在锁式探针不包括样品条形码的情况下,可以使用样品索引扩增引物(例如,包括样品特异性条形码的扩增引物)来扩增测试的每个样品。在利用滚环扩增的情况下,这快速产生包括多个拷贝的探针条形码和样品条形码序列的多联体。如果靶核酸分子(例如,COVID-19靶序列)存在于给定样品中,则将产生多联体,并且产生的多联体数将与最初存在于样品中的靶核酸序列拷贝数成比例。在完成锁式/扩增测定(例如,需要1小时来进行的锁式/RCA测定)后,可以合并多个条形码化样品,栓系至测序流动池内的表面上,并装载至配置为用作DNA条形码读取器的测序仪中。在通用引发位点处引发多联体后,可以使用序列/条形码读取器通过探针条形码(靶基因座ID)和样品条形码(或样品索引)对每个多联体进行测序。样品条形码允许多联体序列数据的解复用,然后可以通过探针条形码进一步分离。序列数据集中样品条形码的检测指示给定样品中靶核酸序列的存在,给定探针条形码序列的存在指示特异性靶序列(例如,COVID-19序列或对照)的存在,并且每个样品扩增的多联体总数(或每个样品的给定单个探针条形码的拷贝数)提供滴度。
使用测序读取寡核苷酸条形码序列提供了实施大规模基于条形码的多路复用的机会。虽然存在多种市售测序平台,但大多数主要设计用于基因组应用,并且不容易适用于低端的短读段应用,例如条形码读取。
在一些实施方案中,本文公开了测序平台,其设计为提供短读段序列的高质量、高通量、低成本测序数据。在一些实施方案中,本文公开的测序平台具有模块化格式,其可以重新配置为进行高通量DNA条形码读取,并且用于需要样品和探针多路复用的高通量分子诊断测定。
所公开的用于大规模分子测试的方法和系统的优点包括但不限于:
1.由于以非常低的拷贝数扩增核酸靶序列产生数十万个多联体,因此具有空前的测定灵敏度和精确性。每个多联体基本上是样品复制品,并且可以通过对DNA条形码进行测序来单独寻址。因此可获得的大量多联体数据将确保空前的测定精确性,并且提供滴度信息。
2.通过使用寡核苷酸条形码序列实现灵活的样品和探针多路复用策略。使用可测序的寡核苷酸条形码提供了同时解复用测定(例如,通过使用两个或更多个条形码化锁式探针,每个探针针对不同的靶核酸序列或对照)以及解复用几乎任何数量的待并行处理样品的可能性。预期该方法在适度的样品批量大小(例如,每次实验运行384-1,536个样品)下是非常经济的,这使得所公开的方法和系统对于分子诊断测试的去中心化模型特别有吸引力。
3.使基于云的分析系统能够实时收集和合并由分布式测序仪器网络产生的数据,以便于群体规模测试和监测。部署产生每天数百万数据点的去中心化仪器网络的能力提供了空前的实时监测传染病(例如COVID-19)以及其他潜在疫情的演变的机会。
去中心化分子诊断测定平台
基于PCR的测定是用于快速且成本有效地检测COVID-19和其他病毒感染的选择方法。然而,这些测定的主要缺点是它们的通量不足,特别是当考虑到为了监测传染病在群体中的传播而可以定期测定的大量样品时。这些方法通量低的主要原因是缺乏用于高样品多路复用的实用方法。当前的多路复用策略依赖于微孔板或微阵列的孔中的颜色辨别或空间分离。这些方法不能很好地在高于少量多路复用样品(每次运行约48个样品)时进行规模化,或实施起来非常昂贵(使用Roche COBAS系统每天1,536个样品)。
本文公开的组合物、方法和系统通过提供样品多路复用的可扩展方法和允许分子测试去中心化的测试平台解决了现有分子诊断测试方法的通量限制,其中每个测试设施能够使用例如每次运行384-1536个样品的可管理样品批量大小来每年每个仪器处理数百万个样品。去中心化和高样品通量(任选地与基于云的分析成对)也将提供部署用于检测传染病(例如COVID-19)的全球和实时监测网络的机会。该相同的样品多路复用方法可以适用于各种分子诊断测定,因此提供了在测试应用方面具有极大灵活性的所公开的分子诊断平台。
条形码化锁式探针测定
所公开的组合物、方法和系统提供了一种同时检测给定样品中的多种靶分析物和高度多路复用样品处理的灵活且可扩展的方法。所公开的DNA测序平台配置为在条形码化锁式探针测定中读取短DNA条形码。在该测定中,探针条形码(或探针索引)用于解复用一个或多个靶核酸的测试结果,样品条形码(或样品索引)用于在单个测试运行中解复用两个或更多个样品的测试结果。
存在许多现有的锁式探针测定用于进行分子诊断测试。这些测定例如对检测RNA病毒是高度灵敏和准确的。锁式测定等温地识别、结合和扩增RNA靶,并且不将RNA转录成cDNA,从而提供非常快速且有效的诊断方法。图1提供了根据本文公开的一些实施方案的设计为检测单核苷酸多态性(SNP)102的存在的锁式探针101的说明。包括与靶核酸分子105的连续区域104(例如,跨越目的SNP的区域)互补的5’端和3’端序列103的线性核酸探针分子101(例如,锁式探针分子)与靶杂交106并连接107,以形成环状核酸分子108。如果待测样品中存在靶,则形成环状核酸探针分子。在用核酸外切酶任选处理109样品以消化任何剩余的靶核酸分子后,使用锁式探针序列的非互补区域110中包括的扩增引物结合位点、使用例如PCR或滚环扩增(RCA)111来扩增和检测环状分子。
图2示出了根据本文公开的各种实施方案的本公开的条形码化锁式探针的架构。靶特异性序列区识别靶基因座,当靶核酸分子存在时,在与靶杂交后,使5’和3’端紧密接近。除了靶特异性序列区域之外,图2中所示的条形码化锁式探针分子的非限制性实例包括用于RCA扩增的两个引物结合位点和“随机”序列,该“随机”序列可包括一个或多个条形码序列,例如,对于每对靶特异性序列区域独特的探针条形码序列、对于特异性样品独特的样品条形码序列或其任何组合。在图2所示的实例中,探针的靶特异性序列区域设计为靶向COVID-19基因组的Ca-Y132H序列。连接使探针环化,然后可以例如使用RCA来扩增探针,以产生包括包括条形码序列的多个拷贝的探针序列的多联体分子。然后可以合并这些多联体,并装载在配置为用作高度多路复用条形码读取器的测序平台上。短基因座特异性探针条形码可以被快速测序和解码,并且对于给定样品鉴定的探针条形码数将提供改进的测定准确度以及病毒滴度信息。
如图3所示,靶向特异性核酸分子(例如,COVID-19特异性核酸序列)的条形码化锁式探针可以设计为在非靶向锁式区域中包括探针条形码序列(也称为“探针索引”或“探针ID”序列),以便于测定多路复用并加速多个靶序列的鉴定。在一些情况下,条形码化锁式探针分子还可包括样品条形码序列。在一些情况下,在锁式探针的环化后将进行引物索引RCA扩增,这导致如果样品中存在靶核酸分子,则产生样品条形码化(或样品索引化)多联体。然后可以将这些多联体装载至测序流动池中,测序、解复用,并基于样品或探针条形码进行分箱(binned)。样品和探针条形码的测序(与病毒基因组基因座的实际扩增子相反)使得能够使用短读段长度,其缩短回复时间并降低测定成本。在一些情况下,所公开的组合物、方法和系统可以实现2.5小时或更少的采样到回复周转时间、每个样品$10或更少的测定成本,以及每年每个仪器多达数百万样品的样品处理通量,这取决于所实施的样品多路复用程度。条形码化锁式探针或分子倒置探针(MIP)设计
在一些情况下,本公开的条形码化锁式探针或分子倒置探针分子可包括靶特异性5’端区域(或序列)、一个或多个引物结合区域(或序列)、一个或多个条形码区域(或序列)以及靶特异性3’端区域(或序列)。
在一些情况下,例如,对于条形码化锁式探针分子,5’端和3’端靶特异性序列可以设计为靶向靶核酸序列内的两个相邻(连续)序列,例如,其中连接反应切割锁式探针的5’端磷酸基团,并通过在锁式探针的5’端核苷酸部分和锁式探针的3’端核苷酸部分之间催化形成共价键而产生环状分子。
在一些情况下,例如,对于条形码化分子倒置探针分子,5’端和3’端靶特异性序列可以设计为靶向靶核酸序列内的两个相邻但不连续的序列,该序列被多达例如100个核苷酸分开,其中在探针序列的一端开始的引物延伸/填入反应与连接反应结合使用,以完成环状分子的形成。在一些情况下,两个相邻靶核酸序列可以被多达1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100或多于100个核苷酸(或该范围内的任何数量的核苷酸)分开。图4提供了条形码化分子倒置探针测定的示意图。
在一些情况下,所公开的条形码化锁式探针和条形码化分子倒置探针的5’端和3’端靶特异性序列可以设计为靶向多种靶核酸序列中的任一种。在一些情况下,例如,它们可以设计为靶向病毒核酸。在一些情况下,它们设计为靶向COVID-19核酸序列。图3提供了COVID-19基因组的说明,其包括开放阅读框(Orf)序列、刺突基因(S)序列;包膜基因(E)序列;膜基因(M)序列;以及核壳基因(N)序列。这些开放阅读框或基因序列中的任一种或其片段可用于设计本公开的条形码化锁式探针分子。在一些情况下,条形码化锁式探针可以设计为靶向COVID-19基因组的Ca-Y132H序列。
在一些情况下,所公开的条形码化锁式探针和条形码化分子倒置探针的5’端和3’端靶特异性序列可以具有相同长度。在一些情况下,它们可以具有不同长度。在一些情况下,所公开的条形码化锁式探针和条形码化分子倒置探针的5’端和3’端靶特异性序列的长度可以在约10个核苷酸至约30个核苷酸的范围内。在一些情况下,5’端或3’端靶特异性序列的长度可以为至少10、至少11、至少12、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29或至少30个核苷酸。在一些情况下,5’端或3’端靶特异性序列的长度可以为至多30、至多29、至多28、至多27、至多26、至多25、至多24、至多23、至多22、至多21、至多20、至多19、至多18、至多17、至多16、至多15、至多13、至多12、至多11或至多10个核苷酸。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本公开内的范围,例如,在一些情况下,5’端或3’端靶特异性序列的长度可以在约14至约26个核苷酸的范围内。5’端或3’端靶特异性序列的长度可具有此范围内的任何值,例如,约23个核苷酸。
在一些情况下,所公开的条形码化锁式探针或分子倒置探针分子可包括一个、两个、三个、四个、五个或多于五个引物结合区域(或引物结合序列或位点)。在一些情况下,引物结合序列可包括扩增引物结合序列、测序引物结合序列、通用引物结合序列或其任何组合。在一些情况下,所公开的锁式探针或分子倒置探针分子的一个或多个引物结合序列的长度可以在约10个核苷酸至约30个核苷酸的范围内。在一些情况下,一个或多个引物结合序列的长度可以为至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29或至少30个核苷酸。在一些情况下,一个或多个引物结合序列的长度可以为至多30、至多29、至多28、至多27、至多26、至多25、至多24、至多23、至多22、至多21、至多20、至多19、至多18、至多17、至多16、至多15、至多14、至多13、至多12、至多11或至多10个核苷酸。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本公开内的范围,例如,在一些情况下,一个或多个引物结合序列的长度可以在约18至约22个核苷酸的范围内。一个或多个引物结合序列的长度可具有此范围内的任何值,例如,约21个核苷酸。
在一些情况下,所公开的条形码化锁式探针或分子倒置探针分子可包括探针条形码(或探针索引)、样品条形码(或样品索引)或两者。在一些情况下,所公开的条形码化锁式探针或分子倒置探针分子可包括探针条形码,并且可以在扩增(例如,环状探针分子的滚环扩增)期间使用索引引物添加样品条形码。
所公开的组合物、方法和系统的一个关键优点是通过使用条形码作为测序的代理来获得极高靶特异性探针和样品解复用精确性的能力。探针条形码和样品索引序列二者都可以根据使错指配错误或其他测序问题的发生最小化的规则来设计。作为样品条形码设计的非限制性实例,假定保守值为每个样品40,000个测序读段并且每个测序运行200,000,000个测序读段(条形码),在同一测序运行中可以并行处理多达5,000个样品。
长度为L个核苷酸的独特探针或样品索引序列数由4L给出,但对条形码设计施加了附加限制,以避免可能阻碍合成或测序的核苷酸运行。维持汉明距离(例如,两个核苷酸不同的两个相等长度的条形码序列中的核苷酸位置数)大于1也是重要的,以便单个测序错误不会导致条形码鉴定不正确。例如,存在16,384个长度为7个核苷酸的独特序列,但可以选择最小汉明距离为2的4,096个序列的子集,其可以很好地适合上述实例中5,000个样品的合并,并且提供显著的错误校正能力。通过进一步延伸条形码长度(例如至10-12个碱基),可以产生更多的独特序列,并且在任何成对条形码序列之间施加更大的汉明距离。较大的汉明距离使得能够错误检查和错误校正。具体地,2d+1的最小距离可以使得能够校正多达d个测序错误。考虑到申请人专有测序平台(将在下文讨论)的高碱基判定准确度和测序所需的短条形码长度,能够校正至少1、至少2或至少3个错误可能是可行的。设计探针或样品条形码的过程通过首先鉴定满足指定汉明距离要求和其他要求的剩余序列、随后合成和经验评估质量来进行。
在一些情况下,可以设计两个较小的索引集合(例如,集合A和B),然后使用一对索引(其中,独特索引的总数=|A|*|B|)对样品进行条形码化。这种条形码设计策略可以便于制造大量的独特索引序列。探针条形码的设计存在许多选择,包括例如使用在每个位置处彼此不同的3个核苷酸的序列。设计策略还可以设计多于所需数量的独特探针,然后根据经验测试性能。在一些情况下,由于样品条形码未整合至锁式或分子倒置探针中,而是在扩增步骤期间(由客户进行)添加,因此可以产生锁式探针池(或分子倒置探针池),而不需要在合成阶段进行物理探针分离。从生产角度来看,这基本上意味着可以采用大规模并行合成方法来快速和成本有效地定制探针池,例如由Twist Bioscience(San Francisco,CA)或Genscript(Piscataway,NJ)提供的那些方法。
在一些情况下,所公开的条形码化锁式探针或分子倒置探针分子的探针条形码或样品条形码序列的长度可以在约3个核苷酸至约20个核苷酸的范围内。在一些情况下,所公开的条形码化锁式探针或分子倒置探针分子的探针条形码或样品条形码序列可以为至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29或至少30个核苷酸。在一些情况下,探针条形码或样品条形码序列的长度可以为至多30、至多29、至多28、至多27、至多26、至多25、至多24、至多23、至多22、至多21、至多20、至多19、至多18、至多17、至多16、至多15、至多14、至多13、至多12、至多11、至多10、至多9、至多8、至多7、至多6、至多5、至多4或至多3个核苷酸。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本公开内的范围,例如,在一些情况下,探针条形码或样品条形码序列的长度可以在约6至约10个核苷酸的范围内。探针条形码或样品条形码序列的长度可具有此范围内的任何值,例如,约7个核苷酸。
在一些情况下,所公开的条形码化锁式探针或分子倒置探针分子的总长度可以在约50个核苷酸至约200个核苷酸的范围内。在一些情况下,所公开的探针分子的总长度可以为至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少160、至少170、至少180、至少190或至少200个核苷酸。在一些情况下,所公开的探针分子的总长度可以为至多200、至多190、至多180、至多170、至多160、至多150、至多140、至多130、至多120、至多110、至多100、至多90、至多80、至多70、至多60或至多50个核苷酸。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本公开内的范围,例如,在一些情况下,所公开的探针分子的总长度可以在约80至约160个核苷酸的范围内。所公开的探针分子的总长度可具有此范围内的任何值,例如,约126个核苷酸。
病原体
本文描述的核酸包括来源于人、动物或植物的病原体的核酸部分,病原体例如真菌、细菌、古细菌、真核寄生虫、原生动物或病毒、包括但不限于线状病毒、冠状病毒、腺病毒、逆转录病毒、毒素等。在一些实施方案中,这种病原体天然存在。在一些实施方案中,这种病原体可以是合成的。
在一些实施方案中,具有本本公开考虑的核酸组分的这种病毒包括但不限于埃博拉病毒、马尔堡病毒、其他线状病毒、α冠状病毒(例如229E和NL63)、β冠状病毒(例如OC43和HKU1)、其他冠状病毒(例如MERS-CoV、SARS-COV、2019-nCoV、严重呼吸综合征2(SARS-CoV-2)和轻度呼吸道疾病(HCoV-NL63、HCoV-229E、HCoV-OC43和HKU1))、逆转录病毒(例如人免疫缺陷病毒和猫免疫缺陷病毒)、腺病毒、流感病毒(包括H1N1和H5N1亚型,但考虑流感病毒的所有亚型和组合)、痘病毒、疱疹病毒等。
在一些实施方案中,病毒包括冠状病毒。在一些实施方案中,冠状病毒可以是α冠状病毒或β冠状病毒。在一些实施方案中,这种α冠状病毒是冠状病毒的四个属(α、β、γ或δ)中的第一个的成员,包括229E和NL63。在一些实施方案中,这种β冠状病毒是冠状病毒的四个属(α、β、γ和δ)的成员,包括OC43、HKU1、严重急性呼吸综合征(SARS)冠状病毒或中东呼吸综合征(MERS)冠状病毒。在一些实施方案中,所述SARS冠状病毒是SARS-CoV、SARS-CoV-2或其变体。在一些实施方案中,MERS冠状病毒是MERS-CoV或其变体。在一些实施方案中,SARS冠状病毒引起疾病或病症,例如2019冠状病毒病(COVID-19)或变体。
在一些实施方案中,冠状病毒可以选自:α冠状病毒、β冠状病毒、δ冠状病毒和γ冠状病毒。α冠状病毒的实例可包括但不限于蝙蝠冠状病毒CDPHE15、蝙蝠冠状病毒HKU10、人冠状病毒229E、人冠状病毒NL63、小型蝙蝠冠状病毒1、小型蝙蝠冠状病毒HKU8、水貂冠状病毒1、猪流行性腹泻病毒、菊头蝠冠状病毒HKU2和黄蝠冠状病毒512。β冠状病毒的实例可包括但不限于β冠状病毒1、刺猬冠状病毒1、人冠状病毒HKU1、中东呼吸综合征相关冠状病毒、鼠冠状病毒、伏翼蝙蝠冠状病毒HKU5、果蝠冠状病毒HKU9、严重急性呼吸综合征相关冠状病毒、扁颅蝠冠状病毒HKU4。δ冠状病毒的实例可包括但不限于夜莺冠状病毒HKU11、黑水鸡冠状病毒HKU21、冠状病毒HKU15、文鸟冠状病毒HKU13、夜鹭冠状病毒HKU19、画眉冠状病毒HKU12、绣眼鸟冠状病毒(white-eye coronavirus)HKU16、野鸭冠状病毒HKU20。γ冠状病毒的实例可包括但不限于禽冠状病毒、白鲸冠状病毒SW1。冠状病毒的其他实例可包括MERS-CoV、SARS-CoV和SARS-CoV-2。在一些实施方案中,冠状病毒可以是SARS-CoV-2。
在一些实施方案中,所述冠状病毒2019(COVID-19)由SARS-CoV-2病毒或其变体引起。在一些实施方案中,所述SARS-CoV-2病毒或变体由SEQ ID NO:1-4中的任一个提供的核酸序列编码。在一些实施方案中,冠状病毒(或其变体)由与SEQ ID NO:1-4中的任一个具有至少约70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核酸序列编码。在一些实施方案中,冠状病毒(或其变体)由与SEQ ID NO:1具有至少约70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核酸序列编码。在一些实施方案中,冠状病毒(或其变体)由与SEQ ID NO:2具有至少约70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核酸序列编码。在一些实施方案中,冠状病毒(或其变体)由与SEQ ID NO:3具有至少约70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核酸序列编码。在一些实施方案中,冠状病毒(或其变体)由与SEQ IDNO:4具有至少约70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核酸序列编码。
表1.病原体序列
Figure BDA0004151510670000211
/>
Figure BDA0004151510670000221
/>
Figure BDA0004151510670000231
/>
Figure BDA0004151510670000241
/>
Figure BDA0004151510670000251
/>
Figure BDA0004151510670000261
/>
Figure BDA0004151510670000271
/>
Figure BDA0004151510670000281
/>
Figure BDA0004151510670000291
/>
Figure BDA0004151510670000301
/>
Figure BDA0004151510670000311
/>
Figure BDA0004151510670000321
/>
Figure BDA0004151510670000331
/>
Figure BDA0004151510670000341
/>
Figure BDA0004151510670000351
/>
Figure BDA0004151510670000361
/>
Figure BDA0004151510670000371
/>
Figure BDA0004151510670000381
在一些实施方案中,这种病原体是来源于植物、动物、细菌或古细菌的病毒。本文考虑的其他病毒包括但不限于包括植物花叶病毒(番茄花叶病毒、烟草花叶病毒、黄瓜花叶病毒)的核酸组分的病毒和与常见动物疾病相关的病毒,包括狂犬病病毒。类似地,在本本公开中作为核酸考虑的是类病毒和亚病毒病原体,例如丁型肝炎RNA、柑桔裂皮类病毒、金鱼花潜隐类病毒(columnea latent viroid)、辣椒小果类病毒(pepper chat fruitviroid)、马铃薯纺锤形块茎类病毒、番茄萎黄矮化类病毒、椰子死亡类病毒和番茄顶缩类病毒(tomato apical stunt viroid)等。
在一些实施方案中,病原体是包括RNA病毒或DNA病毒的病毒。在一些实施方案中,这种RNA或DNA病毒是单链或双链的。在一些实施方案中,RNA或DNA病毒是负义或正义病毒。
在一些实施方案中,这种病原体是包括单链DNA(ssDNA)的病毒。这种包括单链DNA的病毒来源于指环病毒科、Bacillariodnaviridae、双DNA病毒科、环病毒科、双生病毒科、小病毒科、微病毒科、纳米病毒科、细小病毒科和螺旋病毒科。
在一些实施方案中,这种病原体是包括双链DNA(dsDNA)的病毒。这种包括双链DNA的病毒来源于腺病毒科、异疱疹病毒科、瓶状病毒科(ampullaviridae)、囊泡病毒科、非洲猪瘟病毒科(Asfaviridae)、杆状病毒科、双尾病毒科、Clavaviridae、被脂病毒科、小纺锤形噬菌体科、球状病毒科、滴状病毒科、疱疹病毒科、Hytrosaviridae、虹彩病毒科、脂毛噬菌体科、软体动物疱疹病毒科、Marseilleviridae、拟菌病毒科、肌病毒科、线形病毒科(Nimaviridae)、潘多拉病毒科(Pandoraviridae)、乳头瘤病毒科、藻类去氧核糖核酸病毒科(Phycodnaviridae)、原质噬菌体科(Plasmaviridae)、短尾噬菌体科、多DNA病毒、多瘤病毒科、痘病毒科、古噬菌体科、长尾噬菌体科、复层病毒科、球脂病毒科等。
在一些实施方案中,这种病原体是包括ssDNA和dsDNA区域的病毒。这种包括ssDNA和dsDNA区域的病毒来源于包括西班牙盐盒菌多形性病毒1、波多黎各盐几何形菌多形性病毒1、盐红菌多形性病毒1、盐红菌多形性病毒2、盐红菌多形性病毒3、盐红菌多形性病毒6等的嗜盐菌多形病毒家族。
在一些实施方案中,这种病原体是包括双链RNA(dsRNA)的病毒。这种包括双链RNA的病毒来源于包括双RNA病毒科、金色病毒科、囊病毒科、内源核糖核酸病毒科、减毒病毒科、巨大双分核糖核酸病毒科(Megabirnaviridae)、分体病毒科、小双节RNA病毒、呼肠孤病毒科、轮状病毒、全病毒科等的家族。
在一些实施方案中,这种病原体是包括负义RNA的病毒。这种包括负义RNA病毒的病毒来源于沙粒病毒科、玻那病毒科、布尼亚病毒科、丝状病毒科、Nyamiviridae、蛇形病毒科、正粘病毒科、副粘病毒科、弹状病毒科等的家族。
在一些实施方案中,这种病原体是包括正义RNA的病毒。这种包括正义RNA的病毒来源于甲型线形病毒科、Alphatetraviridae、蜂窝状病毒科(Alvernaviridae)、动脉炎病毒科、星状病毒科、杆菌状核糖核酸病毒科、乙型线形病毒科、雀麦花叶病毒科、杯状病毒科、香石竹斑驳四病毒科(Carmotetraviridae)、修道院病毒科、冠状病毒科、二顺反子病毒科、足病毒科、丙型线形病毒科、传染性软化病毒科、光滑病毒科、黄症病毒科、Marnaviridae、海洋病毒科、裸露核糖核酸病毒科、野田病毒科、Permutotetraviridae、微小核糖核酸病毒科、马铃薯Y病毒科、杆状套病毒科、伴生豇豆病毒科、披衣病毒科、番茄丛矮病毒科、芜菁发黄镶嵌病毒科、帚状病毒科等的家族。
靶核酸分子
所公开的方法和系统可用于检测多种靶核酸分子(有时称为“分析物”)中的任一种。实例包括但不限于DNA分子或其片段、基因组DNA或其片段、线粒体DNA或其片段、染色体DNA或其片段、质粒DNA或其片段、基因序列或其片段、外显子序列或其片段、内含子序列或其片段、细菌DNA或其片段、病毒DNA或其片段、RNA分子或其片段、mRNA分子或其片段、tRNA分子或其片段、rRNA分子或其片段、细菌RNA或其片段、病毒RNA或其片段等,或其任何组合。
样品
所公开的方法和系统可用于检测多种样品中的任一种中的靶核酸分子。样品的非限制性实例包括但不限于组织样品、细胞悬液样品、手术切除样品、活检样品、鼻咽拭子样品、痰样品、支气管肺泡灌洗液样品、血液样品、尿液样品、粪便样品或其任何组合。在一些实施方案中,样品获自土壤、污水、生物组织、食品、与前述样品中的一个或多个接触的物体表面,或其任何组合。在一些实施方案中,在不同时间点或在不同位置处或两者获得多个样品。在这种实施方案中,靶核酸(例如,来源于本文公开的病原体)的存在指示病原体的感染传播。在一些实施方案中,可能需要处理样品,以提取和纯化目的靶核酸分子。
条形码测定工作流
设计并合成包括靶核酸特异性识别序列(例如,COVID-19基因座特异性序列)的锁式(或分子倒置)探针。每个锁式探针包括位于探针分子非靶向区域中的基因座特异性探针条形码。在识别靶序列后,锁式探针将与靶杂交,产生可环化中间体,然后可以通过连接完全环化。任选地,然后可以由核酸外切酶消化任何剩余的未反应探针分子或线性样品核酸分子(例如,DNA),留下与靶核酸分子(例如,病毒RNA分子)数成比例的许多环状探针,其中可以通过插入其中的探针条形码来鉴定多路复用测定中的每种环状探针。然后进行样品索引滚环扩增(RCA)(例如,使用包括独特样品条形码序列的扩增引物),以产生包括多个拷贝的环状探针序列的多联体分子。
图5示出了所公开的条形码化锁式探针或分子倒置探针测定的工作流的实例。使用几个不同的探针池,每个探针池通过独特的探针条形码鉴定,其允许进行多路复用测试,以检测多种靶或疾病。可以在小于例如1小时内进行等温锁式测定,随后进行索引RCA。然后将所得多联体分子缩合成纳米球,并装载至测序流动池中。然后可以使用例如15个测序循环对条形码和索引进行测序,从而快速读出测序数据(例如,在约75min内)。由于对每个样品计数了大量探针条形码,因此样品索引解复用和探针条形码计数以高精确性为给定样品中靶核酸的存在提供了是/否的回复。病毒滴度数据也可获得,因为所计数的探针条形码数将与样品中存在的病毒拷贝数成比例。
可以实施所提出的条形码方法来引入用于多路复用样品处理的样品索引或独特的探针条形码,以鉴定给定探针靶向的特异性基因座,从而实现测定多路复用。除了样品多路复用之外,所公开的方法实现可以靶向传染病病原体基因组(例如,COVID-19基因组)内的多个位点的测定,从而提高测定(例如,COVID-19测定)的特异性,并且允许鉴定多个菌株。
样品处理和DNA提取
在一些情况下,可能需要处理样品,以提取目的靶核酸分子。可以利用多种现有样品处理和核酸提取技术中的任一种。
在一些实施方案中,DNA提取包括:(i)收集待提取DNA的样品(例如,拭子样品、细胞样品、血液样品或组织样品);(ii)在裂解缓冲液存在下,破坏细胞膜(例如,细胞裂解),以释放DNA和其他细胞质组分;(iii)用浓缩的盐溶液处理裂解的样品,以沉淀蛋白质、脂质和RNA,随后离心分离出沉淀的蛋白质、脂质和RNA;以及(iv)从上清液中纯化DNA,以去除细胞膜裂解步骤期间使用的去污剂、蛋白质、盐或其他试剂。
用于DNA(或RNA)提取的细胞膜的破坏可以使用各种机械剪切(例如,通过弗氏压碎器或细针)、基于珠的破坏或超声破坏技术来进行。细胞裂解步骤通常包括使用去污剂和表面活性剂来溶解细胞和核膜的脂质。在一些情况下,裂解步骤可进一步包括使用蛋白酶分解蛋白质,或使用RNA酶消化样品中的RNA。
用于DNA纯化的现有技术的实例包括但不限于(i)在冰冷的乙醇或异丙醇中沉淀,随后离心(DNA的沉淀可以通过增加离子强度来增强,例如,通过添加乙酸钠);(ii)苯酚-氯仿提取,随后从含有变性蛋白质的有机相中离心分离含有核酸的水相;以及(iii)固相色谱,其中核酸吸附至固相(例如,二氧化硅或其他),这取决于缓冲液的pH和盐浓度。
在一些情况下,可以通过添加蛋白酶或通过用乙酸钠或乙酸铵沉淀蛋白质或通过在DNA沉淀步骤前用苯酚-氯仿混合物提取来去除细胞和与DNA结合的组蛋白。
在一些情况下,可以使用各种商业DNA提取和纯化试剂盒中的任一种来提取DNA。实例包括但不限于来自Qiagen(Germantown,MD)的QIAamp(用于从人样品中分离基因组DNA)和DNAeasy试剂盒(用于从动物或植物样品中分离基因组DNA)或来自Promega(Madison,WI)的
Figure BDA0004151510670000431
和ReliaPrepTM系列试剂盒。
分离后,将DNA溶于弱碱性缓冲液(例如,Tris-EDTA(TE)缓冲液)或超纯水中。如果需要,可以使用机械片段化(例如,使用超声、针剪切、喷雾、点-槽(point-sink)剪切或通过压力池)或酶消化技术(例如,使用限制性内切酶或核酸内切酶)进行额外的DNA片段化。
样品处理和RNA提取
一种现有的RNA提取程序包括:(i)收集待提取RNA的样品(例如,拭子样品、细胞样品、血液样品或组织样品);(ii)任选地,保护和冷冻样品,以供随后的处理,其中RNA稳定试剂(例如InvitrogenTM RNAlaterTM和InvitrogenTM RNAlaterTM-ICE RNA稳定溶液)可用于稳定样品中的RNA,以供随后的纯化;(iii)使用例如有机提取方法、旋转篮形式、磁性颗粒方法和直接裂解方法提取RNA。
有机提取方法广泛用于RNA制备。将样品均化在例如含苯酚的溶液中,然后离心产生三个分离的相:下层有机相、含有变性蛋白质和基因组DNA的中间相,以及含有RNA的上层水相。回收上层水相,并通过醇沉淀和再水化收集RNA。尽管有机提取方法提供了可扩展形式的核酸酶的快速变性和RNA的稳定,但包括使用氯化有机试剂的这些方法可能是劳动密集型的,并且可能难以自动化。
基于滤光器的旋转篮RNA制备技术利用玻璃纤维、衍生二氧化硅或位于小塑料篮底部的离子交换膜。将样品在含有RNA酶抑制剂(例如,胍盐)的缓冲液中裂解,并通过使用离心力或施加的真空使裂解物通过膜,随后进行几个洗涤步骤,将核酸结合至膜上。然后施加洗脱液,并通过离心将提取的RNA收集至管中。一些方法将有机提取的使用与旋转篮形式的样品收集、洗涤和洗脱步骤组合。用于RNA提取的旋转篮技术是方便且易于使用的,易于处理单样品和96孔形式的样品,并且相对容易自动化。缺点包括过滤材料被颗粒阻塞的倾向、大核酸分子(例如基因组DNA)的滞留,以及在制造形式内的固定结合能力。
磁性颗粒提取方法利用小(0.5-1μm直径)颗粒,其含有经修饰以与目的分子结合的顺磁性核和周围壳。顺磁性颗粒在外加磁场中迁移,但一旦磁场去除,它们保留的磁记忆很小。这种现象允许磁性颗粒基于它们的表面修饰而与溶液中的目的分子相互作用,使用外部磁场快速收集,然后一旦磁场去除,就易于重悬磁性颗粒。将样品在包括RNA酶抑制剂的溶液中裂解,并使其与磁性颗粒结合。可以通过施加磁场收集磁性颗粒和相关RNA,并进行几轮释放,在洗涤溶液中重悬和再捕获,随后将RNA释放至洗脱缓冲液中,并去除磁性颗粒。磁性颗粒提取技术的优点中的一个是基于溶液的结合动力学提高了靶捕获的效率。磁珠形式还允许快速收集/浓缩样品RNA(或取决于珠表面的其他生物分子;存在多种可用的表面化学),并且易于自动化。潜在缺点包括将磁性颗粒带入洗脱的样品中、磁性颗粒在粘性溶液中迁移缓慢,以及人工进行时捕获/释放步骤耗时费力。
直接裂解方法通过利用裂解缓冲液制剂进行样品制备(非纯化),该裂解缓冲液制剂破坏样品、稳定核酸,并且与下游分析兼容。将样品与裂解剂混合,并在指定条件下孵育指定时间。在一些情况下,裂解物可以直接用于下游分析。在许多情况下,可以例如使用磁珠、旋转过滤篮或其他现有技术从稳定的裂解物中纯化样品(例如,RNA样品)。通过消除结合和从固体表面洗脱的需要,直接裂解方法可以避免在使用其他提取/纯化方法时可能发生的样品偏差和回收效率影响。直接裂解方法是快速的、与小样品兼容、易于自动化,并且为准确表示样品内RNA种类分布提供了最高潜力。直接裂解方法的潜在缺点可包括样品的显著稀释、与现有分析方法(例如产率的分光光度测量)不兼容,以及如果未正确处理裂解物,则由于残余RNA酶活性导致样品降解等。
将核酸分子片段化
在一些实施方案中,本文提供了用于片段化已经获得的核酸的方法。在一些实施方案中,片段化包括剪切、超声处理、限制性酶切、序列特异性核酸内切酶处理、序列非依赖性核酸内切酶处理和化学酶切以及其他剪切方法中的至少一种。各种剪切选择包括声剪切、点-槽剪切和针剪切。在一些步骤中,限制性酶切是核酸分子的有意的序列特异性断裂。限制性酶切的一种类型是基于酶的处理,其通过同时切割双链核酸分子的两条链,或通过在双链核酸分子的每条链上产生切口以产生双链核酸分子断裂来断裂双链核酸分子。一种类型的超声处理通过暴露于短时间的超声处理而使核酸分子经受声空化和流体动力剪切。作为剪切的一种类型,声剪切将高频声能波传输到核酸分子。作为另一种类型的剪切,点-槽剪切使用注射泵,通过推动核酸文库通过小的突然收缩来产生流体动力剪切力。作为另一种类型的剪切,针剪切通过使DNA文库通过小规格针而产生剪切力。片段化后,双链核酸片段中的一些含有具有至少约20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、225、250、300、350、400、450、500、550、600bp或更多的核酸序列区域。在一些情况下,在片段化后,双链核酸片段中的一些含有小于约20的核酸序列区域。
在一些实施方案中,片段化进一步包括末端修复、粘性末端产生和突出端产生。一种类型的突出端产生包括5’端产生。一种类型的突出端产生包括3’端产生。一些步骤,例如末端修复、粘性末端产生或突出端产生在管中进行。用含有双链核酸片段、末端修复缓冲液和末端修复酶的溶液进行一些步骤,例如末端修复、粘性末端产生或突出端产生。
在一些实施方案中,片段化进一步包括末端修复、粘性末端产生和突出端产生。一种类型的突出端生成包括5’端产生。一种类型的突出端生成包括3’端产生。一些步骤,例如末端修复、粘性末端产生或突出端产生在管中进行。用含有双链核酸片段、末端修复缓冲液和末端修复酶的溶液进行一些步骤,例如末端修复、粘性末端产生或突出端产生。将片段化的核酸分子固定至表面
在一些实施方案中,本文提供了将片段化的核酸分子固定至本文表面的方法。在一些实施方案中,表面是低非特异性结合表面,例如亲水性表面。在一些实施方案中,固定包括使表面结合的捕获核酸分子与片段化的核酸分子的至少一部分(用作测序反应的模板)杂交。
捕获核酸分子
通常,一层或多层低非特异性结合材料中的至少一层可包括用于共价或非共价连接核酸分子的官能团,例如,衔接子或引物序列,或者至少一层可以在其沉积在支持体表面上时已经包括共价或非共价连接的核酸衔接子或引物序列。在一些情况下,栓系至至少一个第三层的聚合物分子的核酸衔接子或引物序列可以分布在遍及该层的多个深度处。
在一些情况下,核酸衔接子或引物分子与溶液中的聚合物共价偶联,即,在将聚合物偶联或沉积在表面上之前。在一些情况下,核酸衔接子或引物分子在其已偶联至或沉积于表面上之后共价偶联至聚合物。在一些情况下,至少一个亲水性聚合物层包括多个共价连接的寡核苷酸衔接子或引物分子。在一些情况下,至少两层、至少三层、至少四层或至少五层亲水性聚合物包括多个共价连接的衔接子或引物分子。
在一些情况下,核酸衔接子或引物分子可使用多种缀合化学中的任一种与一层或多层亲水性聚合物偶联。例如,寡核苷酸衔接子或引物序列可包括与胺基、羧基、硫醇基等反应的部分。可使用的胺反应性缀合化学的实例包括但不限于涉及异硫氰酸酯、异氰酸酯、酰基叠氮化物、NHS酯、磺酰氯、醛、乙二醛、环氧化物、环氧乙烷、碳酸酯、芳基卤化物、亚氨酸酯、碳二亚胺、酸酐和氟苯基酯基团的反应。羧基反应性缀合化学的实例包括但不限于涉及碳二亚胺化合物例如水溶性EDC(1-乙基-3-(3-二甲基氨基丙基)碳二亚胺·HCL)的反应。巯基反应性缀合化学物质的实例包括马来酰亚胺、卤代乙酰基和吡啶基二硫化物。
一种或多种类型的核酸分子可以附着或栓系于支持体表面。在一些情况下,一种或多种类型的寡核苷酸衔接子或引物可包括间隔序列,用于与衔接子连接的模板文库核酸序列杂交的衔接子序列、正向扩增引物、反向扩增引物、测序引物、分子条形码序列或其任何组合。在一些情况下,可以将1个引物或衔接子序列栓系表面的至少一层上。在一些情况下,至少2、3、4、5、6、7、8、9、10或多于10个不同的引物或衔接子序列可以栓系至表面的至少一层上。
在一些情况下,栓系的核酸衔接子或引物序列的长度可以在约10个核苷酸至约100个核苷酸的范围内。在一些情况下,栓系的寡核苷酸衔接子或引物序列的长度可以为至少10、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90或至少100个核苷酸。在一些情况下,栓系的寡核苷酸衔接子或引物序列的长度可以为至多100、至多90、至多80、至多70、至多60、至多50、至多40、至多30、至多20或至多10个核苷酸。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本本公开内的范围,例如,在一些情况下,栓系的寡核苷酸衔接子或引物序列的长度可以在约20个核苷酸至约80个核苷酸的范围内。在一个实例中,栓系的寡核苷酸衔接子或引物序列的长度可具有此范围内的任何值,例如,约24个核苷酸。
在一些情况下,本公开的低结合支持体表面上的引物的所得表面密度可在约100个引物分子/μm2至约100,000个引物分子/μm2的范围内。在一些情况下,本公开的低结合支持体表面上的引物的所得表面密度可在约1,000个引物分子/μm2至约1,000,000个引物分子/μm2的范围内。在一些情况下,引物的表面密度可以为至少1,000、至少10,000、至少100,000或至少1,000,000分子/μm2。在一些情况下,引物的表面密度可以为至多1,000,000、至多100,000、至多10,000或至多1,000个分子/μm2。在本段落中描述的下限和上限值中的任一个可以组合以形成本本公开内包括的范围,例如,在一些情况下,引物的表面密度可以为约10,000分子/μm2至约100,000分子/μm2。在一些情况下,引物分子的表面密度可具有此范围内的任何值,例如,约455,000分子/μm2。在一些情况下,最初与支持体表面上的衔接子或引物序列杂交的靶文库核酸序列的表面密度可以小于或等于栓系引物的表面密度。在一些情况下,与支持体表面上的衔接子或引物序列杂交的克隆扩增的靶文库核酸序列的表面密度可以跨越与栓系引物的表面密度所示相同的范围。在一些情况下,可以调节毛细管或通道内腔涂层的表面特性,包括栓系的寡核苷酸引物的表面密度,以便优化例如,固相核酸杂交特异性和效率或固相核酸扩增速率、特异性和效率。
如上所列的局部密度不排除整个表面上的密度变化,使得表面可包括具有例如,500,000/μm2的寡聚物密度的区域,同时还包括具有基本上不同的局部密度的至少第二区域。
在一些情况下,栓系的衔接子或引物序列可包括经设计以促进在低结合支持体上进行的核酸扩增的特异性和效率的修饰。例如,在一些情况下,引物可包括聚合酶终止点,使得表面缀合点和修饰位点之间的引物序列的延伸总是单链形式,并且在一些解旋酶依赖性等温扩增方法中充当5’至3’解旋酶的负载位点。可用于产生聚合酶终止点的引物修饰的其他实例包括但不限于将PEG链插入引物主链中朝向5’端的两个核苷酸之间,插入脱碱基核苷酸(即,既不具有嘌呤也不具有嘧啶碱基的核苷酸)或可被解旋酶绕过的损伤位点。
如将在以下实施方案中进一步讨论的,当使用给定的扩增方法时,可能期望改变栓系的寡核苷酸衔接子或引物在支持体表面上的表面密度或连接的衔接子或引物离开支持体表面的间距(例如,通过改变用于将衔接子或引物连接至表面的接头分子的长度)以“调节”支持体以获得最佳性能。如下所述,调节栓系的寡核苷酸衔接子或引物的表面密度可以影响在支持体上观察到的特异性或非特异性扩增的水平,其方式根据选择的扩增方法而变化。在一些情况下,栓系的核酸衔接子或引物的表面密度可以通过调节用于产生支持体表面的分子组分的比例来改变。例如,在使用核酸引物-PEG缀合物来产生低结合支持体的外层的情况下,寡核苷酸引物-PEG缀合物与非缀合的PEG分子的比例可以变化。然后可使用多种技术中的任一种来估计或测量栓系引物分子的所得表面密度。实例包括但不限于使用放射性同位素标记和计数方法,可裂解分子的共价偶联,可裂解分子包括可从限定区域的支持体表面裂解的光学可检测标签(例如,荧光标签),收集在固定体积的适当溶剂中,然后通过将荧光信号与已知光学标签浓度的校准溶液的荧光信号进行比较来定量,或使用荧光成像技术,条件是注意标记反应条件和图像获取设置以确保荧光信号与表面上荧光团的数量线性相关(例如,表面上不存在荧光团的显著自猝灭)。
在一些情况下,本公开的低结合支持体表面上的核酸衔接子或引物的所得表面密度可以在约100个引物分子/μm2至约1,000,000个引物分子/μm2的范围内。在一些情况下,寡核苷酸衔接子或引物的表面密度可以为至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1,000、至少1,500、至少2,000、至少2,500、至少3,000、至少3,500、至少4,000、至少4,500、至少5,000、至少5,500、至少6,000、至少6,500、至少7,000、至少7,500、至少8,000、至少8,500、至少9,000、至少9,500、至少10,000、至少15,000、至少20,000、至少25,000、至少30,000、至少35,000、至少40,000、至少45,000、至少50,000、至少55,000、至少60,000、至少65,000、至少70,000、至少75,000、至少80,000、至少85,000、至少90,000、至少95,000、至少100,000、至少150,000、至少200,000、至少250,000、至少300,000、至少350,000、至少400,000、至少450,000、至少500,000、至少550,000、至少600,000、至少650,000、至少700,000、至少750,000、至少800,000、至少850,000、至少900,000、至少950,000或至少1,000,000个分子/μm2。在一些情况下,寡核苷酸衔接子或引物的表面密度可以为至多1,000,000、至多950,000、至多900,000、至多850,000、至多800,000、至多750,000、至多700,000、至多650,000、至多600,000、至多550,000、至多500,000、至多450,000、至多400,000、至多350,000、至多300,000、至多250,000、至多200,000、至多150,000、至多100,000、至多95,000、至多90,000、至多85,000、至多80,000、至多75,000、至多70,000、至多65,000、至多60,000、至多55,000、至多50,000、至多45,000、至多40,000、至多35,000、至多30,000、至多25,000、至多20,000、至多15,000、至多10,000、至多9,500、至多9,000、至多8,500、至多8,000、至多7,500、至多7,000、至多6,500、至多6,000、至多5,500、至多5,000、至多4,500、至多4,000、至多3,500、至多3,000、至多2,500、至多2,000、至多1,500、至多1,000、至多900、至多800、至多700、至多600、至多500、至多400、至多300、至多200或至多100个分子/μm2。在本段落中描述的下限和上限值中的任一个可以组合以形成本本公开内包括的范围,例如,在一些情况下,衔接子或引物的表面密度可以为约10,000分子/μm2至约100,000分子/μm2。衔接子或引物分子的表面密度可具有此范围内的任何值,例如,在一些情况下为约3,800个分子/μm2,或在其他情况下为约455,000个分子/μm2。在一些情况下,如下文将进一步讨论的,最初与支持体表面上的衔接子或引物序列杂交的模板文库核酸序列(例如,样品DNA分子)的表面密度可以小于或等于对于栓系核酸引物的表面密度所指示的表面密度。在一些情况下,如下面还将进一步讨论的,与支持体表面上的衔接子或引物序列杂交的克隆扩增的模板文库核酸序列的表面密度可以跨越与栓系的寡核苷酸衔接子或引物的表面密度所示的范围相同或不同的范围。
在一些实施方案中,文库中的核酸与表面(例如,低非特异性结合表面)偶联。在一些实施方案中,通过核酸分子的区域和与表面偶联的捕获分子的区域之间的杂交进行偶联。除非另有说明,杂交可以在任何长度的核酸之间发生,并且杂交的核酸可以采取许多结构形式中的一种或组合,包括但不限于:B-型、A-型、Z-型、茎环、假结或由两个或多个单链核酸之间的碱基配对相互作用形成的其他杂交结构。在一些实施方案中,杂交发生在任何长度的两个单链核酸之间。在一些实施方案中,杂交发生在单链线性核酸和单链线性核酸之间。在一些实施方案中,杂交发生在单链线性核酸和单链环状核酸之间。在一些实施方案中,杂交发生在单链环状核酸和单链环状核酸之间。在一些实施方案中,杂交发生在DNA分子和DNA分子之间。在一些实施方案中,杂交发生在DNA分子和RNA分子之间。在一些实施方案中,杂交发生在RNA分子和RNA分子之间。在一些实施方案中,杂交发生在DNA分子和DNA/RNA杂交分子之间。在一些实施方案中,杂交发生在RNA分子和DNA/RNA杂交分子之间。在一些实施方案中,杂交发生在DNA/RNA杂交分子和DNA/RNA杂交分子之间。
在一些实施方案中,文库的核酸分子通过核酸分子的核酸序列和与表面偶联的一个或多个捕获核酸分子之间的杂交与表面偶联。在一些实施方案中,一种或多种捕获核酸分子是本文描述的夹板核酸分子,并且在本文的连接酶或其催化活性部分的存在下促进核酸分子在表面上的环化。
在一些实施方案中,一个或多个捕获核酸分子(本文称为表面结合引物)与核酸分子的一个或多个衔接子杂交,例如含有本文公开的索引序列的衔接子。在一些实施方案中,索引序列是可用作独特索引序列对的8至10个核苷酸的任何独特序列。
条形码化探针分子与靶标的杂交
在一些情况下,公开的条形码化锁式探针或分子倒置探针分子与靶核酸序列的杂交可以在包括例如纯化的、部分纯化的或未纯化的靶核酸分子的样品中进行。可以使用多种现有杂交方案中的任一种进行杂交。
在一些情况下,杂交反应可包括使用杂交缓冲液制剂,该杂交缓冲液制剂包括pH缓冲液、有机溶剂、分子群集试剂(molecular crowding agent)、用于控制双链核酸解链温度的添加剂、影响核酸水合的添加剂,或其任何组合。
在本公开的一些方面,描述了杂交缓冲液制剂,其与所公开的低非特异性结合支持体组合,提供改善的杂交速率、杂交特异性(或严格性)和杂交效率(或产率)。如本文所用,杂交特异性是通常栓系的衔接子序列、引物序列或寡核苷酸序列与完全互补序列正确杂交的能力的量度,而杂交效率是通常与互补序列杂交的总可用栓系的衔接子序列、引物序列或寡核苷酸序列的百分比的量度。
通过优化与所公开的低结合性表面一起使用的杂交缓冲液制剂可以实现提高的杂交特异性或效率,这将在下面的实施方案中更详细地讨论。可以调节以实现改善的性能的杂交缓冲液组分的实例包括但不限于缓冲液类型、有机溶剂混合物、缓冲液pH、缓冲液粘度、去污剂和两性离子组分、离子强度(包括调节一价和二价离子浓度)、抗氧化剂和还原剂、碳水化合物、BSA、聚(乙二醇)、硫酸葡聚糖、甜菜碱、其他添加剂等。
在一些情况下,杂交缓冲液制剂可包括pH缓冲液,选自Tris、HEPES、TAPS、Tricine、Bicine、Bis-Tris、NaOH、KOH、TES、EPFS和MOPS。在一些情况下,杂交缓冲液制剂的pH可以在约3至约10的范围内。在一些情况下,pH可以为至少3、至少4、至少5、至少6、至少7、至少8、至少9或至少10。在一些情况下,pH可以为至多10、至多9、至多8、至多7、至多6、至多5、至多4或至多3。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本公开内的范围,例如,杂交缓冲液的pH可以在约4至约8的范围内。杂交缓冲液的pH可具有此范围内的任何值,例如,约pH 7.8。
用于杂交缓冲液制剂的去污剂包括但不限于两性离子去污剂(例如,1-十二烷酰基-sn-甘油基-3-磷酸胆碱、3-(4-叔丁基-1-吡啶)-1-丙磺酸盐、3-(N,N-二甲基十四烷基铵)丙磺酸盐,3-(N,N-二甲基十四烷基铵)丙磺酸盐、ASB-C80、C7BzO、CHAPS、CHAPS水合物、CHAPSO、DDMAB、二甲基乙基铵丙烷磺酸盐、N,N-二甲基十二烷胺N-氧化物、N-十二烷基-N,N-二甲基-3-铵基-1-丙磺酸盐或N-十二烷基-N,N-二甲基-3-铵基-1-丙磺酸盐)和阴离子、阳离子和非离子去污剂。非离子去污剂的实例包括聚(氧乙烯)醚和相关聚合物(例如,
Figure BDA0004151510670000521
TRITON X-100和/>
Figure BDA0004151510670000522
CA-630)、胆汁盐和糖苷去污剂。
单独或与优化的缓冲液制剂组合使用所公开的低非特异性结合支持体可产生比现有杂交方案快约2×至约20×的相对杂交速率。在一些情况下,相对杂交速率可以是现有杂交方案的至少2×、至少3×、至少4×、至少5×、至少6×、至少7×、至少8×、至少9×、至少10×、至少12×、至少14×、至少16×、至少18×、至少20×、至少25×、至少30×或至少40×。
在一些情况下,单独使用或与优化的缓冲液制剂组合使用所公开的低结合支持体可产生小于60分钟、50分钟、40分钟、30分钟、20分钟、15分钟、10分钟或5分钟的总杂交反应时间(即,达到杂交反应完成90%、95%、98%或99%所需的时间),用于任何这些完成度量。
在一些情况下,与现有杂交方案相比,单独或与优化的缓冲液制剂组合使用所公开的低非特异性结合支持体可产生改善的杂交特异性。在一些情况下,可实现的杂交特异性优于10个杂交事件中的1个错配碱基、20个杂交事件中的1个错配碱基、30个杂交事件中的1个错配碱基、40个杂交事件中的1个错配碱基、50个杂交事件中的1个错配碱基、75个杂交事件中的1个错配碱基、100个杂交事件中的1个错配碱基、200个杂交事件中的1个错配碱基、300个杂交事件中的1个错配碱基、400个杂交事件中的1个错配碱基、500个杂交事件中的1个错配碱基、600个杂交事件中的1个错配碱基、700个杂交事件中的1个错配碱基、800个杂交事件中的1个错配碱基、900个杂交事件中的1个错配碱基、1,000个杂交事件中的1个错配碱基、2,000个杂交事件中的1个错配碱基、3,000个杂交事件中的1个错配碱基、4,000个杂交事件中的1个错配碱基、5,000个杂交事件中的1个错配碱基、6,000个杂交事件中的1个错配碱基、7,000个杂交事件中的1个错配碱基、8,000个杂交事件中的1个碱基错配、9,000个杂交事件中的1个碱基错配,或在10,000个杂交事件中的1个碱基错配。
在一些情况下,与现有杂交方案相比,单独使用所公开的低结合支持体或与优化的缓冲液制剂组合使用所公开的低结合支持体可产生改善的杂交效率(例如,支持体表面上与靶寡核苷酸序列成功杂交的可用寡核苷酸引物的部分)。在一些情况下,对于以下指定的任何输入靶寡核苷酸浓度和以上指定的任何杂交反应时间,可实现的杂交效率优于50%、60%、70%、80%、85%、90%、95%、98%或99%。在一些情况下,例如,其中杂交效率小于100%,与支持体表面杂交的靶核酸序列的所得表面密度可小于表面上寡核苷酸衔接子或引物序列的表面密度。
在一些情况下,杂交缓冲液制剂可包括有机溶剂。溶剂的实例包括但不限于乙腈、乙醇、DMF和甲醇,或其不同百分比(>5%)的任何组合。在一些情况下,杂交缓冲液中包括的有机溶剂的百分比(按体积计)可以在约1%至约20%的范围内。在一些情况下,有机溶剂的体积百分比可以为至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少15%或至少20%。在一些情况下,有机溶剂的体积百分比可以为至多20%、至多15%、至多10%、至多9%、至多8%、至多7%、至多6%、至多5%、至多4%、至多3%、至多2%或至多1%。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本公开内的范围,例如,有机溶剂的体积百分比可以在约4%至约15%的范围内。有机溶剂的体积百分比可具有此范围内的任何值,例如,约7.5%。
在一些情况下,杂交缓冲液制剂可包括分子群集试剂,选自聚(乙二醇)(PEG)、葡聚糖、羟丙基甲基纤维素(HPMC)、羟乙基甲基纤维素(HEMC)、羟丁基甲基纤维素、羟丙基纤维素、甲基纤维素和羟甲基纤维素、卵清蛋白、血红蛋白、Ficoll或其任何组合。在一些情况下,杂交缓冲液制剂中包括的分子群集试剂的百分比可以在约1%至约60%的范围内。在一些情况下,基于制剂的总体积,杂交缓冲液中的分子群集试剂的体积百分比可以为至少1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%、40%、50%、60%或更高。在一些情况下,基于制剂的总体积,杂交缓冲液中的分子群集试剂的体积百分比可以为至多60%、50%、40%、35%、30%、25%、20%、15%、10%、5%、4%、3%、2%、1%或更低。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本公开内的范围,例如,在一些情况下,分子群集试剂的体积百分比可以在约5%至约25%的范围内。分子群集试剂的体积百分比可具有此范围内的任何值,例如,约8.5%。
在一些情况下,杂交缓冲液制剂可包括用于控制解链温度的添加剂。实例包括但不限于甲酰胺、四甲基氯化铵(TMAC)或其任何组合。用于控制核酸解链温度的添加剂的量可以根据杂交缓冲液制剂中使用的其他试剂变化。在一些情况下,杂交缓冲液制剂中包括的解链温度添加剂的百分比可以在约1%至约60%的范围内。在一些情况下,基于制剂的总体积,杂交缓冲液中的解链温度添加剂的体积百分比可以为至少1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%、40%、50%、60%或更高。在一些情况下,基于制剂的总体积,杂交缓冲液中的解链温度添加剂的体积百分比可以为至多60%、50%、40%、35%、30%、25%、20%、15%、10%、5%、4%、3%、2%、1%或更低。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本公开内的范围,例如,在一些情况下,解链温度添加剂的体积百分比可以在约4%至约35%的范围内。解链温度添加剂的体积百分比可具有此范围内的任何值,例如,约6.5%。
在一些情况下,杂交缓冲液制剂可包括影响核酸水合的添加剂。实例包括但不限于甜菜碱、尿素、甘氨酸甜菜碱或其任何组合。在一些情况下,杂交缓冲液制剂中包括的水合添加剂的体积百分比可以在约1%至约50%的范围内。在一些情况下,水合添加剂的体积百分比可以为至少1%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%或至少50%。在一些情况下,水合添加剂的体积百分比可以为至多50%、至多45%、至多40%、至多35%、至多30%、至多25%、至多20%、至多15%、至多10%、至多5%或至多1%。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本公开内的范围,例如,水合添加剂的体积百分比可以在约1%至约30%的范围内。解链温度添加剂的体积百分比可具有此范围内的任何值,例如,约6.5%。
连接
除了DNA连接酶之外,所公开的条形码化锁式探针或分子倒置探针分子产生环状探针分子的连接可包括使用优化的连接缓冲液。条形码化锁式探针(在与靶序列杂交后)或分子倒置探针(在与靶序列杂交和缺口填补后)的两个相邻末端通过DNA连接酶连接在一起,该连接酶催化在探针一端的3’-OH和另一端的5’-磷酸基团之间形成磷酸二酯键。影响连接反应速率和产率的因素包括核酸浓度、连接酶浓度、反应温度(DNA连接酶活性的最佳温度为37℃,但最佳反应温度也将取决于杂交的探针-靶序列的解链温度(Tm))和连接缓冲液组成(例如,离子强度和存在的阳离子种类)。在一些情况下,连接缓冲液组成可以与上述杂交缓冲液制剂相同,或者可包括上述杂交缓冲液组分中的任一种或其组合。
核酸扩增
在一些情况下,所公开的方法可包括一个或多个核酸扩增步骤。在一些实施方案中,这种扩增在溶液中进行。在一些实施方案中,这种应用在表面上进行。在一些实施方案中,在对核酸分子或其衍生物测序之前进行扩增。核酸扩增技术的实例包括但不限于聚合酶链反应(PCR)、多重置换扩增(MDA)、转录介导的扩增(TMA)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、实时SDA、滚环扩增或环对环扩增(circle-to-circleamplification)。
如本文所用,短语“核酸表面扩增”(NASA)可与短语“固相核酸扩增”(或简称为“固相扩增”)互换使用。在本公开的一些方面,描述了核酸扩增制剂,其与所公开的低非特异性结合支持体组合提供了改善的扩增速率,扩增特异性和扩增效率。如本文所用,特异性扩增是指扩增共价或非共价栓系至固相支持体上的模板文库寡核苷酸链。如本文所用,非特异性扩增是指引物-二聚体或其他非模板核酸的扩增。如本文所用,扩增效率是支持体表面上在给定扩增循环或扩增反应期间成功扩增的栓系寡核苷酸的百分比的量度。在本文公开的表面上进行的核酸扩增可获得至少50%、60%、70%、80%、90%、95%或大于95%、如98%或99%的扩增效率。
在一些情况下,索引扩增引物可用于在扩增给定样品的环状锁式探针或分子倒置探针分子期间将样品条形码添加至每个扩增的核酸分子中,从而允许在进行测序前合并来自多个样品的扩增子。在一些情况下,扩增引物还可用于将衔接子序列、测序引物结合位点、额外引物结合位点或其任何组合添加至给定样品的扩增产物中。
多种热循环或等温核酸扩增方案中的任一种可与所公开的低非特异性结合支持体一起使用。可与所公开的低结合支持体一起使用的核酸扩增方法的实例包括但不限于聚合酶链反应(PCR)、多重置换扩增(MDA)、转录介导的扩增(TMA)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、实时SDA、桥式扩增、等温桥式扩增、滚环扩增、环对环扩增、解旋酶依赖性扩增、重组酶依赖性扩增或单链结合(SSB)蛋白依赖性扩增。
通常,扩增速率、扩增特异性和扩增效率的改进可以单独使用公开的低非特异性结合支持体或与扩增反应组分的制剂组合使用来实现。除了包括核苷酸、一种或多种聚合酶、解旋酶、单链结合蛋白等(或其任何组合)之外,可以以多种方式调节扩增反应混合物以实现改善的性能,包括但不限于选择缓冲液类型、缓冲液pH、有机溶剂混合物、缓冲液粘度、去污剂和两性离子组分、离子强度(包括调节单价和二价离子浓度)、抗氧化剂和还原剂、碳水化合物、BSA、聚(乙二醇)、硫酸葡聚糖、甜菜碱、其他添加剂等。
在一些情况下,可以在将包括环状探针分子(或其再线性化的拷贝)的扩增子栓系至测序表面之后进行固相扩增,从而在表面上产生条形码序列的克隆群落或簇。
等温滚环扩增(RCA)
在一些实施方案中,所公开的方法可包括使用滚环扩增(RCA),以产生包括多个拷贝的环状探针分子的多联体分子。RCA是等温核酸扩增技术,其中聚合酶将单个核苷酸连续添加至与环状模板退火的引物中,从而产生包括单链DNA的多联体分子,该单链DNA含有数十至数百个串联重复的核酸序列(与环状模板互补)。进行RCA所需的组分包括DNA聚合酶、聚合酶兼容缓冲液、短DNA或RNA引物、环状DNA模板和三磷酸脱氧核苷酸(dNTP)。用于RCA的聚合酶是用于DNA扩增的Phi29、Bst和Vent exo-DNA聚合酶,以及用于RNA扩增的T7 RNA聚合酶。Phi29 DNA聚合酶经常使用,因为它具有最好的持续合成能力和链置换能力。RCA在恒定温度(例如,室温至约37℃的范围)下在自由溶液中进行,并且用于固相扩增。
DNA RCA反应涉及三个步骤:(i)环状模板连接,其可经由模板介导的酶连接(例如,T4 DNA连接酶)或使用特殊DNA连接酶(例如,CircLigase)的无模板连接进行;(ii)引物诱导的单链DNA伸长;多个引物可以与同一环状模板杂交(“多引物RCA”),这导致引发多个扩增事件并产生多个RCA产物(任选地,使用限制性内切酶消化和随后的模板介导的酶连接来将线性RCA产物转化为多个环状物);以及(iii)扩增产物检测和可视化,例如,通过使用荧光团缀合的dNTP、荧光团标记的互补序列或荧光标记的分子信标的荧光检测方法。
在一些情况下,可以在RCA期间使用索引扩增引物,以在扩增给定样品的环状锁式探针或分子倒置探针分子期间将样品条形码添加至每个扩增的核酸分子中,从而允许在进行测序前合并来自多个样品的扩增子。在一些情况下,扩增引物还可用于将衔接子序列、测序引物结合位点、额外引物结合位点或其任何组合添加至给定样品的扩增产物中。
鉴定核酸序列
在一些实施方案中,本文公开了鉴定本文公开的病原体的核酸序列的方法。在一些实施方案中,病原体是严重呼吸综合征2(SARS-CoV-2)。在一些实施方案中,鉴定核酸序列包括测序。在一些实施方案中,鉴定核酸序列包括靶向富集病原体基因组的区域,例如使用对病原体基因组内的区域特异的一组核酸探针。在一些实施方案中,鉴定病原体的完整基因组。在一些实施方案中,在冠状病毒的情况下,鉴定基因组的区域。在一些实施方案中,编码冠状病毒结构蛋白的区域包括刺突糖蛋白、核衣壳蛋白、包膜糖蛋白或膜糖蛋白或其组合。
核酸测序
由于使用相对短的DNA序列作为条形码可产生大量独特的标记,因此所公开的组合物和方法实现极高程度的测定或样品多路复用。此外,实施所公开的条形码化锁式探针或分子倒置探针测定所需的相对短的测序读段导致周转时间快且测定成本较低。DNA条形码化的现有方法依赖于标准测序运行来鉴定条形码,然后将它们映射至已知清单上,例如在空间转录组学应用、合成的长读段或Swab Seq中。虽然有效,但这些方法可能是冗长的,因为必须完成整个测序运行,包括聚类。它们也可能成本过高,除非多路复用非常大量的样品以摊销测序试剂盒的成本。
尽管可以使用多种商业核酸测序方法和平台中的任一种来对条形码化RCA扩增产物进行测序,以解复用测定和样品数据,但在一些实施方案中,可采用“纳米球”测序。纳米球测序是高通量测序方法,其使用滚环复制来扩增短模板核酸序列并产生多联体,然后将多联体缩合以形成纳米球。随后可将纳米球栓系至测序表面,例如,测序流动池的内表面,并进行迭代系列的例如合成测序反应,以确定短模板核酸序列的序列。与其他下一代测序技术相比,大量纳米球可以与测序表面上的衔接子杂交或以其他方式栓系至测序表面上,以使得能够以较低的试剂成本进行大规模并行测序。
在一些情况下,使用所公开的组合物和方法产生的多联体序列或已经缩合形成纳米球的多联体序列的测序可包括使用现有掺入测序(合成测序TM)化学和市售平台,例如购自Illumina(San Diego,CA)的那些。在一些情况下,测序可包括使用单分子测序化学和市售仪器,例如购自Pacific Biosciences(Menlo Park,CA)的那些。在一些情况下,测序可包括使用纳米孔测序技术和市售仪器,例如购自Oxford Nanopore(Oxford,United Kingdom)的那些。在一些情况下,所公开的组合物和方法可包括使用通过结合技术的测序和市售仪器,例如购自Omniome(OmniomeTM,San Diego,CA)的那些。在一些情况下,所公开的测序包括无亚硫酸氢盐测序、亚硫酸氢盐测序、TET辅助亚硫酸氢盐(TAB)测序、ACE测序、高通量测序、Maxam-Gilbert测序、大规模并行签名测序、聚合酶克隆测序、454焦磷酸测序、Sanger测序、Illumina测序、SOLiD测序、Ion Torrent半导体测序、DNA纳米球测序、Heliscope单分子测序、单分子实时(SMRT)测序、纳米孔DNA测序、鸟枪测序、RNA测序、Enigma测序或其任何组合。
在一些情况下,使用所公开的组合物和方法产生的多联体序列或已经缩合形成纳米球的多联体序列的测序可包括使用新型聚合物-核苷酸缀合物(和相关组合物),其使得能够进行如同时待审的美国专利申请系列第16/579,794号和国际专利申请系列第PCT/US2020/034409号中所述的“捕获测序”方法,这两个申请以其整体并入本文。简言之,这些方法包括使用包括核结构的聚合物-核苷酸缀合物(或更一般来说是多价结合组合物),该核结构附着有多个已知核苷酸部分、核苷酸类似物部分或其他结合元件,并且任选地包括多个荧光团或其他可检测标签,在聚合酶的存在下,在促进聚合物-核苷酸缀合物的两个或更多个核苷酸部分与两个或更多个拷贝的靶序列(例如,栓系至表面的复制靶核酸分子克隆簇内的两个或更多个拷贝,或栓系至表面的多联体中的两个或更多个拷贝的靶核酸序列)杂交的条件下,与引发的靶核酸分子接触,以形成多价结合复合物,其可例如使用荧光标记作为可检测标签并荧光成像作为用于检测复合物的读出来检测,以确定靶核酸序列中核苷酸的身份。图6提供了在包括多个核苷酸部分和荧光团的聚合物核苷酸缀合物与栓系至测序流动池表面的多个靶核酸序列之间形成的多价结合复合物的示意图。在一些情况下,附着于聚合物-核苷酸缀合物的核苷酸部分不掺入引发的靶核酸链中。相反,破坏多价结合复合物,并且在重复与包括另一种或不同的已知核苷酸部分的另一聚合物-核苷酸缀合物(或其混合物)接触的循环之前进行单核苷酸延伸反应。
在一些情况下,多价结合组合物可包括多个与颗粒(例如,聚合物、支化聚合物、树枝状大分子或等同结构)或其他核结构缀合的核苷酸。使多价结合组合物与聚合酶与多个拷贝的引发的靶核酸接触可导致形成三元复合物,该三元复合物可被检测并进而实现靶核酸碱基的更准确确定。
本文公开了制备多价结合或掺入组合物的方法,其包括:a)聚合物核;和b)与聚合物核连接的两个或更多个核苷酸、核苷酸类似物、核苷或核苷类似物部分;其中接头的长度取决于与聚合物核连接的核苷酸、核苷酸类似物、核苷或核苷类似物部分。本文还公开了制备多价结合组合物的方法,其包括:a)聚合物-核苷酸缀合物的混合物,其中每个聚合物-核苷酸缀合物包括:i)聚合物核;和ii)连接至聚合物核的两个或更多个核苷酸、核苷酸类似物、核苷或核苷类似物部分,其中接头的长度取决于连接至聚合物核的核苷酸、核苷酸类似物、核苷或核苷类似物部分;并且其中混合物包括具有至少两种不同类型的连接的核苷酸、核苷酸类似物、核苷或核苷类似物部分的聚合物-核苷酸缀合物。在一些实施方案中,聚合物核包括具有多个分支的聚合物,并且两个或更多个核苷酸、核苷酸类似物、核苷或核苷类似物部分连接至所述分支。在一些实施方案中,聚合物具有星形、梳形、交联、瓶刷或树枝状大分子构型。在一些实施方案中,聚合物-核苷酸缀合物包括一个或多个结合基团,结合基团选自抗生物素蛋白、生物素、亲和标签及其组合。在一些实施方案中,聚合物核包括支化聚乙二醇(PEG)分子。在一些实施方案中,聚合物-核苷酸缀合物包括封端的核苷酸部分。在一些实施方案中,封端的核苷酸是3’-O-叠氮基甲基核苷酸、3’-O-甲基核苷酸或3’-O-烷基羟胺核苷酸。在一些实施方案中,聚合物-核苷酸缀合物进一步包括一种或多种荧光标记。
本文公开了制备多价结合组合物和分析核酸分子的方法,包括测序或其他生物测定应用。可通过增加核苷酸的有效浓度来影响核苷酸与酶(例如,聚合酶)或酶复合物的结合或并入的增加。增加可以通过增加游离溶液中核苷酸的浓度,或通过增加邻近相关结合或掺入位点的核苷酸的量来实现。该增加还可以通过将核苷酸的数目物理限制在有限的体积中从而导致浓度的局部增加来实现,并且这种结构因此可以结合或掺入结合或掺入位点,其具有比用未缀合的,未栓系的或以其他方式不受限制的单个核苷酸所观察到的更高的表观亲合力。实现这种限制的一种非限制性机制是通过提供多价结合或掺入组合物,其中多个核苷酸与颗粒如聚合物、支化聚合物、树枝状大分子、胶束、脂质体、微粒、纳米颗粒、量子点或其他合适的颗粒结合。
当在测序反应中使用多价结合组合物(代替单个未缀合的或未栓系的核苷酸)以与聚合酶和两个或更多个的拷贝靶核酸序列形成多价结合复合物时,核苷酸的有效局部浓度以及复合物的结合亲和力增加许多倍,这进而增强复合物的持续时间(如图7所示),增加信噪比和差异信号强度(例如,正确碱基配对对比错配的信号强度),使得能够使用更短的成像步骤,并提高碱基判定准确度。本文描述的多价结合组合物可包括至少一种颗粒-核苷酸缀合物(每种颗粒-核苷酸缀合物包括多个拷贝的单核苷酸部分),用于与靶核酸相互作用。多价组合物还可包括两种、三种或四种不同的颗粒-核苷酸缀合物,每种具有与颗粒缀合的不同核苷酸。
本公开提供了使用包括颗粒(例如,纳米颗粒或聚合物核)的组合物的方法,所述颗粒包括多种酶或蛋白结合或掺入基底,其中酶或蛋白结合或掺入基底与一种或多种酶或蛋白结合以形成一种或多种结合或掺入复合物(例如,多价结合或掺入复合物),并且其中所述结合或掺入可通过观察一种或多种结合或掺入复合物的位置、存在或持续性来监测或鉴定。在一些实施方案中,所述颗粒可包括聚合物、支化聚合物、树枝状大分子、脂质体、胶束、纳米颗粒或量子点。在一些实施方案中,所述基底可包括核苷酸、核苷、核苷酸类似物或核苷类似物。在一些实施方案中,酶或蛋白质结合或掺入基底可包括可与聚合酶结合的试剂。在一些实施方案中,酶或蛋白质可包括聚合酶。在一些实施方案中,所述观察一种或多种结合或掺入复合物的位置、存在或持续性可包括荧光检测。
多价结合或掺入组合物可包括1、2、3、4或更多种类型的颗粒-核苷酸缀合物,其中每种颗粒-核苷酸缀合物包括不同类型的核苷酸。第一种类型的颗粒-核苷酸缀合物可包括选自ATP、ADP、AMP、dATP、dADP和dAMP的核苷酸。第二种类型的颗粒-核苷酸缀合物可包括选自TTP、TDP、Tl\1P、dTTP、dTDP、dTNIP、UTP、UDP、UNIP、dUTP、dUDP和dUMP的核苷酸。第三种类型的颗粒-核苷酸缀合物可包括选自CTP、CDP、C1\1P、dCTP、dCDP和dCMP的核苷酸。第四种类型的颗粒-核苷酸缀合物可包括选自GTP、GDP、G1\1P、dGTP、dGDP和dGMP的核苷酸。在一些实施方案中,每种颗粒-核苷酸缀合物包括分别对应于选自ATP、ADP、AMP、dATP、dADP、dAMP、TTP、TDP、TMP、dTTP、dTDP、dTMP、UTP、UDP、UMP、dUTP、dUDP、dUMP、CTP、CDP、CMP、dCTP、dCDP、dCMP、GTP、GDP、GMP、dGTP、dGDP和dGMP的一种或多种核苷酸的单一类型的核苷酸。
每个多价结合或掺入组合物可进一步包括对应于与每个相应缀合物缀合的特定核苷酸的一个或多个标记。标记的非限制性实例包括荧光标记(例如,花菁染料3(Cy3)、花菁染料3.5(Cy3.5)、花菁染料5(Cy5)和花菁染料5.5(Cy5.5))、比色标记、电化学标记(例如,葡萄糖或其他还原糖,或者硫醇或其他氧化还原活性部分)、发光标记、化学发光标记、自旋标记、放射性标记、空间标记、亲和标签等。
在一些实施方案中,在一些实施方案中,本公开提供了制备和使用所述组合物的方法,其中一种或多种标记物包括荧光标记物,FRET供体或FRET受体。在一些实施方案中,本公开提供了制备和使用所述组合物的方法,其中基底(例如,核苷酸、核苷酸类似物、核苷或核苷类似物)通过接头连接至颗粒。在一些实施方案中,本公开提供了制备和使用所述组合物的方法,其中至少一种核苷酸或核苷酸类似物是已被修饰以在聚合酶反应或测序反应期间抑制延伸的核苷酸,例如,缺乏3’羟基的核苷酸;经修饰以在3’位含有保护基团的核苷酸;用3’-O-叠氮基、3’-O-叠氮甲基、3’-O-烷基羟氨基、3’-硫代磷酸酯基、3’-O-丙二酰基或3’-O-苄基修饰的核苷酸;或在3’位未被修饰的核苷酸。
颗粒-核苷酸缀合物的一个非限制性实例是包括聚合物核的聚合物-核苷酸缀合物,其中多个核苷酸部分、核苷酸类似物部分、其他结合元件、接头或可检测标记可栓系至该聚合物核。在一些情况下,聚合物核可包括线性或支化聚合物。线性或支化聚合物的实例包括线性或支化聚(乙二醇)(PEG)、线性或支化聚(丙二醇)、线性或支化聚(乙烯醇)、线性或支化聚乳酸、线性或支化聚(乙醇酸)、线性或支化聚甘氨酸、线性或支化聚(乙酸乙烯酯)、葡聚糖,或其他这种聚合物,或掺入前述任何两种或更多种或掺入其他聚合物的共聚物。在一个实施方案中,聚合物是PEG。在另一实施方案中,聚合物可具有PEG分支。
聚合物的特征可在于掺入用于衍生化的官能团(例如胺、羟基、羰基或烯丙基)的重复单元。聚合物还可以具有一个或多个预衍生化的取代基,使得一个或多个特定亚单元将掺入衍生化位点或分支位点,无论其他亚单元是否掺入相同的位点、取代基或部分。预衍生化的取代基可包括或可进一步包括例如核苷酸、核苷、核苷酸类似物、标记(例如荧光标记、放射性标记或自旋标记)、相互作用部分、额外的聚合物部分等,或前述的任何组合。
在聚合物-核苷酸缀合物中,聚合物可具有多个分支。支化聚合物可具有各种构型,包括但不限于星状(“星放射状”)形式、聚集星状(“螺旋滑梯”)形式、瓶刷或树枝状大分子。支化聚合物可以从中心附着点或中心部分辐射,或者可掺入多个分支点,例如,2、3、4、5、6、7、8、9、10或更多个分支点。在一些实施方案中,聚合物的每个亚单元可以任选地构成单独的分支点。
支链的长度和大小可以根据聚合物的类型而不同。在一些支化聚合物中,支链的长度可以为1至1,000nm、1至100nm、1至200nm、1至300nm、1至400nm、1至500nm、1至600nm、1至700nm、1至800nm,或1至900nm或更多,或者长度落入本文公开的值中的任一个之内或之间。
在一些聚合物-核苷酸缀合物中,聚合物核的大小可以对应于1kDa、2kDa、3kDa、4kDa、5kDa、10kDa、15kDa、20kDa、30kDa、50kDa、80kDa、100kDa的表观分子量,或在由前述中的任两个限定的范围内的任何值。聚合物的表观分子量可以由代表性数量的亚单元的已知分子量计算,如通过尺寸排阻色谱法测定,如通过质谱法测定,或如通过任何其他现有方法测定。
在一些支化聚合物中,支链的大小可以对应于1kDa、2kDa、3kDa、4kDa、5kDa、10kDa、15kDa、20kDa、30kDa、50kDa、80kDa、100kDa的表观分子量,或在由前述中的任两个限定的范围内的任何值。聚合物的表观分子量可以由代表性数量的亚单元的已知分子量计算,如通过尺寸排阻色谱法测定,如通过质谱法测定,或如通过本领域已知的任何其他方法测定。聚合物可具有多个分支。聚合物中支链的数目可以为2、3、4、5、6、7、8、12、16、24、32、64、128或更多,或落入由这些值中的任何两个限定的范围内的数目。
对于包括例如包括4、8、16、32或64个分支的支化PEG的支化聚合物的聚合物-核苷酸缀合物,聚合物核苷酸缀合物可具有连接至PEG分支末端的核苷酸,使得每个末端具有连接至其的0、1、2、3、4、5、6或更多个核苷酸。在一个非限制性实例中,3至128个PEG臂的支化PEG聚合物可具有连接至聚合物分支的末端的一个或多个核苷酸,使得每个末端具有连接至其的0、1、2、3、4、5、6个或更多个核苷酸或核苷酸类似物。在一些实施方案中,支化聚合物或树枝状大分子具有偶数个臂。在一些实施方案中,支化聚合物或树枝状大分子具有奇数个臂。
在一些情况下,接头(例如,PEG接头)的长度可以在约1nm至约1,000nm的范围内。在一些情况下,接头的长度可以为至少1nm、至少10nm、至少25nm、至少50nm、至少75nm、至少100nm、至少200nm、至少300nm、至少400nm、至少500nm、至少600nm、至少700nm、至少800nm、至少900nm或至少1,000nm。在一些情况下,接头的长度可以在本段中的任何两个值之间。例如,在一些情况下,接头的长度可以在约75nm至约400nm的范围内。在一些情况下,接头的长度可以具有在本段中的值的范围内的任何值,例如,834nm。
在一些情况下,接头的长度对于不同的核苷酸(包括脱氧核糖核苷酸和核糖核苷酸)、核苷酸类似物(包括脱氧核糖核苷酸类似物和核糖核苷酸类似物)、核苷(包括脱氧核糖核苷或核糖核苷)或核苷类似物(包括脱氧核糖核苷类似物或核糖核苷类似物)是不同的。在一些情况下,核苷酸、核苷酸类似物、核苷或核苷类似物中的一个包括例如脱氧腺苷,并且接头的长度在1nm和1,000nm之间。在一些情况下,核苷酸、核苷酸类似物、核苷或核苷类似物中的一个包括例如脱氧鸟苷,并且接头的长度在1nm和1,000nm之间。在一些情况下,核苷酸、核苷酸类似物、核苷或核苷类似物中的一个包括例如胸苷,并且接头的长度在1nm和1,000nm之间。在一些情况下,核苷酸、核苷酸类似物、核苷或核苷类似物中的一个包括例如脱氧尿苷,并且接头的长度在1nm和1,000nm之间。在一些情况下,核苷酸、核苷酸类似物、核苷或核苷类似物中的一个包括例如脱氧胞苷,并且接头的长度在1nm和1,000nm之间。在一些情况下,核苷酸、核苷酸类似物、核苷或核苷类似物中的一个包括例如腺苷,并且接头的长度在1nm和1,000nm之间。在一些情况下,核苷酸、核苷酸类似物、核苷或核苷类似物中的一种包括例如鸟苷,并且接头的长度在1nm与1,000nm之间。在一些情况下,核苷酸、核苷酸类似物、核苷或核苷类似物中的一个包括例如5-甲基-尿苷,并且接头的长度在1nm和1,000nm之间。在一些情况下,核苷酸、核苷酸类似物、核苷或核苷类似物中的一个包括例如尿苷,并且接头的长度在1nm和1,000nm之间。在一些情况下,核苷酸、核苷酸类似物、核苷或核苷类似物中的一个包括例如胞苷,并且接头的长度在1nm和1,000nm之间。
在聚合物-核苷酸缀合物中,聚合物的每个分支或分支的子集可具有与其连接的包括核苷酸的部分(例如,腺嘌呤、胸腺嘧啶、尿嘧啶、胞嘧啶或鸟嘌呤残基或其衍生物或模拟物),并且部分能够结合或掺入聚合酶、逆转录酶或其他核苷酸结合或掺入结构域。任选地,部分能够在聚合酶反应期间掺入到延伸的核酸链中。在一些情况下,所述部分可被封端,使得其在聚合酶反应期间不能掺入到延伸的核酸链中。在一些其他情况下,所述部分可以被可逆地封端,使得它不能在聚合酶反应期间掺入到延伸的核酸链中,直到这种封端被去除,此后所述部分然后能够在聚合酶反应期间掺入到延伸的核酸链中。
核苷酸可以通过核苷酸的5’端缀合至聚合物分支。在一些情况下,可以修饰核苷酸以便在聚合酶反应期间抑制或防止核苷酸掺入到延伸的核酸链中。作为实例,核苷酸可包括3’脱氧核糖核苷酸、3’叠氮核苷酸、3’-甲基叠氮核苷酸,或本领域已知或可能已知的其他此类核苷酸,以便在聚合酶反应期间不能掺入到延伸的核酸链中。在一些实施方案中,核苷酸可包括3’-O-叠氮基、3’-O-叠氮甲基、3’-硫代磷酸酯基、3’-O-丙二酰基、3’-O-烷基羟氨基或3’-O-苄基。在一些实施方案中,核苷酸缺乏3’羟基。
聚合物可以进一步在每个分支或分支的子集中具有结合或并入部分。结合或掺入部分的一些实例包括但不限于生物素、抗生物素蛋白、链霉亲和素等、多组氨酸结构域、互补配对核酸结构域、G-四重峰形成核酸结构域、钙调蛋白、麦芽糖结合蛋白、纤维素酶、麦芽糖、蔗糖、谷胱甘肽-S-转移酶、谷胱甘肽、O-6-甲基鸟嘌呤-DNA甲基转移酶、苄基鸟嘌呤及其衍生物、苄基半胱氨酸及其衍生物、抗体、表位、蛋白A、蛋白G。结合或掺入部分可以是本领域已知的任何相互作用分子或其片段,以结合或促进蛋白质之间、蛋白质和配体之间、蛋白质和核酸之间、核酸之间或小分子相互作用结构域或部分之间的相互作用。
不希望受任何特定理论的束缚,已观察到本文公开的多价结合组合物与聚合酶核苷酸复合物缔合,以便以时间依赖性的速率形成三元结合复合物,尽管基本上比游离溶液中的核苷酸可获得的缔合速率慢。因此,开启速率(Kon)比单个核苷酸或未与多价配体复合物连接的核苷酸的开启速率显著且令人惊奇地慢。然而,重要的是,多价配体复合物的解离速率(Koff)比游离溶液中核苷酸的解离速率(Koff)慢得多。因此,本公开的多价配体复合物提供了三元聚合酶-多核苷酸-核苷酸复合物(尤其是与游离核苷酸形成的此类复合物相比)的持续性的令人惊讶且有益的改善,从而允许例如,相对于当前可用的方法和试剂显著改善核酸测序应用的成像质量。重要的是,本文公开的多价结合组合物的这种性质使得可见三元复合物的形成是可控的,使得随后的可视化、修饰或加工操作可以基本上不考虑复合物的解离而进行——即,复合物可以以其他方式形成、成像、修饰或使用,并且将保持稳定直至用户进行肯定的解离操作,例如将复合物暴露于解离缓冲液。
在一些情况下,在多价结合组合物(低有效核苷酸浓度下)(例如聚合物-核苷酸缀合物)、聚合酶和两个或更多个拷贝的靶核酸序列之间形成的多价结合复合物的持续时间在非去稳定条件下可以在约0.1秒至约600秒的范围内。在一些情况下,持续时间可以为至少0.1秒、至少1秒、至少2秒、至少3秒、至少4秒、至少5秒、至少6秒、至少7秒、至少8秒、至少9秒、至少10秒、至少20秒、至少30秒、至少40秒、至少50秒、至少60秒、至少120秒、至少180秒、至少240秒、至少300秒、至少360秒、至少420秒、至少480秒、至少540秒或至少600秒。在一些情况下,持续时间可以在本段中指定的任何两个值之间变化。例如,在一些情况下,持续时间可以在约10秒至约360秒的范围内。在一些情况下,持续时间可以具有在本段中指定的值的范围内的任何值,例如,78秒。
在一些情况下,当使用多价结合组合物(例如,聚合物-核苷酸缀合物)进行捕获测序反应时,使用小于1,000nM、小于500nM、小于400nM、小于300nM、小于200nM、小于150nM、小于100nM、小于90nM、小于80nM、小于70nM、小于60nM、小于50nM、小于40nM、小于30nM、小于20nM、小于15nM、小于10nM、小于9nM、小于8nM、小于7nM、小于6nM、小于5nM、小于4nM、小于3nM、小于2nM或小于1nM的有效核苷酸浓度,可以实现上述持续时间。
用于多价结合复合物的聚合酶
在各种实施方案中,适用于本文的结合或掺入相互作用的聚合酶可包括本领域已知或可能已知的任何聚合酶。聚合酶的实例可包括但不限于:Klenow DNA聚合酶、水生栖热菌DNA聚合酶I(Taq聚合酶)、KlenTaq聚合酶和噬菌体T7 DNA聚合酶;人α、δ和εDNA聚合酶;噬菌体聚合酶如T4、RB69和phi29噬菌体DNA聚合酶,强烈火球菌DNA聚合酶(Pfu聚合酶);枯草芽孢杆菌DNA聚合酶III,和大肠杆菌DNA聚合酶IIIα和ε;9度N聚合酶,逆转录酶如HIV M型或O型逆转录酶、禽成髓细胞瘤病毒逆转录酶,或莫洛尼鼠白血病病毒(MMLV)逆转录酶或端粒酶。DNA聚合酶的其他非限制性实例可包括来源于各种古细菌属的那些,例如气火菌属(Aeropyrum)、古丸菌属(Archaeglobus)、除硫球菌属(Desulfurococcus)、火棒菌属(Pyrobaculum)、火球菌属(Pyrococcus)、火叶菌属(Pyrolobus)、热网菌属(Pyrodictium)、葡萄热菌属(Staphylothermus)、施铁特菌属(Stetteria)、硫化叶菌属(Sulfolobus)、高温球菌属(Thermococcus)和火山鬃菌属(Vulcanisaeta)等或其变体,包括聚合酶如VentTM、Deep VentTM、Pfu、KOD、Pfx、TherminatorTM和Tgo聚合酶。在一些实施方案中,聚合酶是klenow聚合酶。
当聚合物-核苷酸缀合物上的核苷酸与靶核酸互补时,三元复合物具有比非互补核苷酸更长的持续时间。当聚合物-核苷酸缀合物上的核苷酸与靶核酸互补时,三元复合物还具有比未缀合或栓系的互补核苷酸更长的持续时间。例如,在一些实施方案中,所述三元复合物可具有小于1s、大于1s、大于2s、大于3s、大于5s、大于10s、大于15s、大于20s、大于30s、大于60s、大于120s、大于360s、大于3600s或更大的持续时间,或在由这些值中的任何两个或更多个限定的范围内的持续时间。
例如,通过观察结合复合物的开始或持续时间,例如通过观察来源于结合复合物的标记组分的信号,可以测量持续时间。例如,标记的核苷酸或包括一个或多个核苷酸的标记的试剂可以存在于结合复合物中,从而允许在结合复合物的存留期间检测来源于标记的信号。
已经观察到,用不同的盐或离子可实现不同范围的持续时间,这表明例如在镁离子(Mg2+)存在下形成的复合物比用其他离子形成的复合物形成得更快。还已经观察到,在例如锶离子(Sr2+)的存在下形成的复合物,在取出离子时或在用缺乏本公开组合物的一种或多种组分的缓冲液如(例如,聚合物或一种或多种核苷酸,或一种或多种相互作用部分,或含有例如可引起或加速从含多价试剂的复合物中去除二价阳离子的螯合剂的缓冲液)洗涤时,容易地形成并完全或基本上完全解离。因此,在一些实施方案中,本公开的组合物包括Mg2+。在一些实施方案中,本公开的组合物包括Ca2+。在一些实施方案中,本公开的组合物包括Sr2+。在一些实施方案中,本公开的组合物包括钴离子(Co2+)。在一些实施方案中,本公开的组合物包括MgCl2。在一些实施方案中,本公开的组合物包括CaCl2。在一些实施方案中,本公开的组合物包括SrCl2。在一些实施方案中,本公开的组合物包括CoCl2。在一些实施方案中,组合物不包括或基本上不包括镁。在一些实施方案中,组合物不包括或基本上不包括钙。在一些实施方案中,本公开的方法提供一种或多种核酸与一种或多种本文公开的组合物的接触,其中所述组合物缺乏钙或镁中的任一种或缺乏钙或镁两者。
可以通过改变缓冲液条件来控制三元复合物的解离。在成像操作之后,使用具有增加的盐含量的缓冲液来引起三元复合物的解离,使得标记的聚合物-核苷酸缀合物可以被洗出,从而提供信号可以被衰减或终止的机制,例如在一个测序循环与下一个测序循环之间的过渡中。在一些实施方案中,这种解离可以通过用缺乏金属或辅因子的缓冲液洗涤复合物来实现。在一些实施方案中,洗涤缓冲液可包括一种或多种组合物以维持pH控制。在一些实施方案中,洗涤缓冲液可包括一种或多种一价阳离子,例如钠。在一些实施方案中,洗涤缓冲液缺少或基本上缺少二价阳离子,例如,没有或基本上没有锶、钙、镁或锰。在一些实施方案中,洗涤缓冲液进一步包括螯合剂,例如,EDTA、EGTA、次氮基三乙酸、聚组氨酸、咪唑等。在一些实施方案中,洗涤缓冲液可以将环境的pH保持在与结合的复合物相同的水平。在一些实施方案中,相对于结合的复合物所见的水平,洗涤缓冲液可以升高或降低环境的pH。在一些实施方案中,pH可以在2-4、2-7、5-8、7-9、7-10的范围内,或低于2,或高于10,或由本文提供的任何两个值限定的范围内。
特定离子的加入可影响聚合酶与引发的靶核酸的结合,三元复合物的形成,三元复合物的解离,或例如在聚合酶反应期间将一个或多个核苷酸掺入到延伸的核酸中。在一些实施方案中,相关阴离子可包括氯离子、乙酸根、葡糖酸根、硫酸根、磷酸根等。在一些实施方案中,可通过添加一种或多种酸、碱或盐(例如NiCl2、CoCl2、MgCl2、MnCl2、SrCl2、CaCl2、CaSO4、SrCO3、BaCl2等)将离子并入本公开的组合物中。代表性的盐、离子、溶液和条件可以在Remington:The Science and Practice of Pharmacy,第20版,Gennaro,A.R.,Ed.(2000)中找到,其通过引用整体并入本文,特别是关于第17章和盐、离子、盐溶液和离子溶液的相关公开内容。
本公开考虑将包括至少一种颗粒-核苷酸缀合物的多价结合或掺入组合物与一种或多种聚合酶接触。接触可以任选地在一种或多种靶核酸的存在下进行。在一些实施方案中,所述靶核酸是单链核酸。在一些实施方案中,所述靶核酸是引发的单链核酸。在一些实施方案中,所述靶核酸是双链核酸。在一些实施方案中,所述接触包括使多价结合或掺入组合物与一种聚合酶接触。在一些实施方案中,所述接触包括使包括一种或多种核苷酸的组合物与多种聚合酶接触。聚合酶可以与单个核酸分子结合。
靶核酸可以指具有一个或多个核酸分子的靶核酸样品。在一些实施方案中,靶核酸可包括多个核酸分子。在一些实施方案中,靶核酸可包括两个或更多个核酸分子。在一些实施方案中,靶核酸可包括具有相同序列的两个或更多个核酸分子。
靶核酸和多价结合组合物之间的结合可以在聚合酶的存在下提供,聚合酶已无催化活性。在一个实施方案中,可以通过突变使聚合酶失去催化活性。在一个实施方案中,聚合酶可以通过化学修饰而变得无催化活性。在一些实施方案中,聚合酶可以通过不存在基底、离子或辅因子而变得无催化活性。在一些实施方案中,聚合酶可能由于不存在镁离子而变得无催化活性。
靶核酸和多价结合组合物之间的结合在聚合酶的存在下发生,其中结合溶液、反应溶液或缓冲液缺乏镁或锰。或者,靶核酸与多价结合组合物之间的结合在聚合酶存在下发生,其中结合溶液、反应溶液或缓冲液包括钙或锶。
当使用无催化活性的聚合酶帮助核酸与多价结合组合物相互作用时,所述组合物和所述聚合酶之间的相互作用使三元复合物稳定,从而使复合物可通过荧光或通过本文公开的或本领域已知的其他方法检测。在检测三元结合复合物之前,可以任选地洗去未结合的聚合物-核苷酸缀合物。
使一种或多种核酸与本文公开的聚合物-核苷酸缀合物在含有钙或镁中的一个或含有钙和镁两者的溶液中接触。或者,使一种或多种核酸与本文公开的聚合物-核苷酸缀合物在缺乏钙或镁中的一个或缺乏钙或镁两者的溶液中接触,并且在单独的操作中,不考虑操作的顺序,向溶液中加入钙或镁中的一个或钙和镁两者。在一些实施方案中,一种或多种核酸与本文公开的聚合物-核苷酸缀合物在缺乏锶的溶液中接触,并且包括在单独的操作中,不考虑操作的顺序,向溶液中加入锶。
测序系统
本文还公开了测序系统,其配置为进行所公开的条形码化锁式探针和分子倒置探针测定。所公开的测序系统可包括新型测序化学、测序流动池、成像模块、流体流动控制器或流体分配系统、处理器或计算机系统,或其任何组合。申请人正在开发专有测序化学(例如,“捕获测序”化学)、测序流动池和测序系统,其以紧凑、模块化形式提供高通量、低成本的高质量核酸序列数据。测序平台(和相关的耗材试剂盒)将配置为高度多路复用条形码读取器,其使试剂消耗和测定成本最小化,同时提供在常规分子诊断测试中空前的条形码读取效率。所公开的锁式探针或分子倒置探针测定和随后的RCA扩增的实施产生大量的数据点,其中产生的每个多联体对应于独特的测定复制品。所公开的测序平台和测序耗材允许人们辨别数亿个这些多联体。因此,所涉及的大量复制品将产生非常准确的测定,并且还将提供关于病毒载量的信息,因为产生的多联体数将与样品中最初存在的病毒拷贝成比例。
测序流动池
在一些情况下,所公开的系统的测序流动池的一个或多个内表面可包括新型低非特异性结合表面化学,其已经针对低背景/高前景荧光信号进行优化,该低背景/高前景荧光信号产生栓系至流动池表面的荧光标记分子的高对比度-噪声比图像。在一些情况下,一个或多个测序流动池可以是测序系统的固定组件。在一些情况下,一个或多个测序流动池可以是测序系统的可拆卸或一次性组件。
在一些情况下,测序流动池可以由现成组件制造,例如玻璃毛细管、熔融二氧化硅毛细管或聚合物毛细管。材料的实例包括但不限于玻璃、熔融二氧化硅、硅、聚合物(例如,聚苯乙烯(PS)、微孔聚苯乙烯(MPPS)、聚(甲基丙烯酸甲酯)(PMMA)、聚碳酸酯(PC)、聚丙烯(PP)、聚乙烯(PE)、高密度聚乙烯(HDPE)、环烯烃聚合物(COP)、环烯烃共聚物(COC)、聚(对苯二甲酸乙二醇酯)(PET))或其任何组合。考虑了由玻璃和聚合物组件构成的各种流动池设计。
在一些情况下,测序流动池的一个或多个内表面可包括一层或多层共价或非共价连接的低结合性化学修饰层(例如,硅烷层)、聚合物膜,以及一种或多种共价或非共价连接的引物序列,引物序列可以用于将单链靶核酸栓系至支持体表面。在一些情况下,表面的制剂,例如,一层或多层的化学组成,用于使一层或多层与支持体表面交联或彼此交联的偶联化学,以及层的总数可以变化,使得蛋白质、核酸分子和其他杂交和扩增反应组分与支持体表面的非特异性结合相对于可比较的单层被最小化或减少。通常,可以改变表面的制剂,使得支持体表面上的非特异性杂交相对于可比较的单层被最小化或减少。可以改变表面的制剂,使得支持体表面上的非特异性扩增相对于可比较的单层或未修饰的表面被最小化或减少。可以改变表面的制剂,使得在固相扩增步骤并入测定中的那些情况下,支持体表面上的比扩增速率或产率最大化。
在一些情况下,低非特异性结合表面可包括1、2、3、4、5、6、7、8、9、10或多于10层亲水性聚合物涂层。聚合物的实例包括但不限于聚(乙二醇)(PEG)、聚(乙烯醇)(PVA)、聚(乙烯基吡啶)、聚(乙烯基吡咯烷酮)(PVP)、聚(丙烯酸)(PAA)、聚丙烯酰胺、聚(N-异丙基丙烯酰胺)(PNIPAM)、聚(甲基丙烯酸甲酯)(PMA)、聚(甲基丙烯酸羟乙基酯)(PHEMA)、聚(低聚(乙二醇)甲基醚甲基丙烯酸酯)(POEGMA)、聚谷氨酸(PGA)、聚赖氨酸、聚葡糖苷、链霉亲和素和葡聚糖。
在一些情况下,一个或多个聚合物涂层可包括支化或多支化聚合物。支化聚合物的实例包括但不限于支化PEG、支化聚(乙烯醇)(支化PVA)、支化聚(乙烯基吡啶)、支化聚(乙烯基吡咯烷酮)(支化PVP)、支化聚(丙烯酸)(支化PAA)、支化聚丙烯酰胺、支化聚(N-异丙基丙烯酰胺)(支化PNIPAM)、支化聚(甲基丙烯酸甲酯)(支化PMA)、支化聚(甲基丙烯酸羟乙基酯)(支化PHEMA)、支化聚(低聚(乙二醇)甲基醚甲基丙烯酸酯)(支化POEGMA)、支化聚(谷氨酸)(支化PGA)、支化聚赖氨酸、支化聚葡糖苷和葡聚糖。
在一些情况下,用于产生本文公开的多层表面中的任一个的一层或多层的支化聚合物可包括至少4个分支、至少5个分支、至少6个分支、至少7个分支、至少8个分支、至少9个分支、至少10个分支、至少12个分支、至少14个分支、至少16个分支、至少18个分支、至少20个分支、至少22个分支、至少24个分支、至少26个分支、至少28个分支、至少30个分支、至少32个分支、至少34个分支、至少36个分支、至少38个分支或至少40个分支。分子通常表现出“2的幂”数的分支,例如2、4、8、16、32、64或128个分支。
在一些情况下,用于产生本文公开的低非特异性结合表面中的任一个的一层或多层的线性、支化或多支化聚合物的分子量可以为至少500Da、至少1,000Da、至少2,000Da、至少3,000Da、至少4,000Da、至少5,000Da、至少10,000Da、至少15,000Da、至少20,000Da、至少25,000Da、至少30,000Da、至少35,000Da、至少40,000Da、至少45,000Da或至少50,000Da。
在一些情况下,低非特异性结合表面的1、2、3、4或多于4个聚合物涂层可包括多个附着或栓系至其上的栓系寡核苷酸引物或衔接子序列。一种或多种类型的寡核苷酸引物或衔接子序列可以附着在表面上的一个或多个聚合物涂层。在一些情况下,一种或多种类型的寡核苷酸衔接子或引物可包括间隔序列、用于与衔接子连接的模板文库核酸序列杂交的衔接子序列、正向扩增引物、反向扩增引物、测序引物或分子条形码序列,或其任何组合。在一些情况下,可将1种引物或衔接子序列栓系至表面的至少一层。在一些情况下,至少2、3、4、5、6、7、8、9、10或多于10个不同的引物或衔接子序列可以栓系至表面的至少一层上。
在一些情况下,栓系的寡核苷酸衔接子或引物序列的长度可以在约10个核苷酸至约100个核苷酸的范围内。在一些情况下,栓系的寡核苷酸衔接子或引物序列的长度可以为至少10、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90或至少100个核苷酸。在一些情况下,栓系的寡核苷酸衔接子或引物序列的长度可以为至多100、至多90、至多80、至多70、至多60、至多50、至多40、至多30、至多20或至多10个核苷酸。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本公开内的范围,例如,在一些情况下,栓系的寡核苷酸衔接子或引物序列的长度可以在约20个核苷酸至约80个核苷酸的范围内。栓系的寡核苷酸衔接子或引物序列的长度可具有此范围内的任何值,例如,约24个核苷酸。
在一些情况下,低非特异性结合表面上的寡核苷酸衔接子或引物序列的有效表面密度可以在约100个分子/μm2至约100,000个分子/μm2的范围内。在一些情况下,寡核苷酸衔接子或引物序列的有效表面密度可以在约1,000个分子/μm2至约1,000,000个分子/μm2的范围内。在一些情况下,寡核苷酸衔接子或引物序列的有效表面密度可以为至少100、至少1,000、至少10,000、至少100,000或至少1,000,000个分子/μm2。在一些情况下,寡核苷酸衔接子或引物序列的有效表面密度可以为至多1,000,000、至多100,000、至多10,000、至多1,000个分子或至多100个分子/μm2。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本公开内的范围,例如,在一些情况下,寡核苷酸衔接子或引物序列的有效表面密度可以在约10,000个分子/μm2至约100,000个分子/μm2的范围内。引物分子的表面密度可具有此范围内的任何值,例如,约455,000个分子/μm2。在一些情况下,最初与表面上的引物或衔接子杂交的靶核酸序列(例如,多联体或纳米球序列)的有效表面密度可以小于或等于寡核苷酸引物或衔接子的有效表面密度所指示的。在一些情况下,杂交的多联体或纳米球序列的表面密度,或与表面上的引物或衔接子序列杂交的克隆扩增的靶核酸序列的表面密度可以跨越与寡核苷酸引物或衔接子序列的有效表面密度所指示的范围相同的范围。如上所列的局部表面密度不排除表面上的表面密度变化,使得表面可包括具有例如50,000个分子/μm2的寡核苷酸引物或衔接子序列表面密度的区域,同时还包括具有基本上不同的局部表面密度的至少第二区域。
在一些情况下,所公开的支持体表面的亲水性程度(或与水溶液的“润湿性”)可以例如通过测量水接触角来评估,其中将小水滴置于表面上并且使用例如光学张力计测量其与表面的接触角。在一些情况下,可以确定静态接触角。在一些情况下,可以确定前进接触角或后退接触角。在一些情况下,本文公开的亲水性低结合支持体表面的水接触角可在约0度至约50度的范围内。在一些情况下,本文公开的亲水性低结合支持体表面的水接触角可小于50度、小于40度、小于30度、小于25度、小于20度、小于18度、小于16度、小于14度、小于12度、小于10度、小于8度、小于6度、小于4度、小于2度或小于1度。在一些情况下,接触角不大于40度。本公开的给定亲水性低结合支持体表面可表现出具有0度至50度范围内的任何值的水接触角。
支持体表面的荧光成像
所公开的固相核酸扩增反应制剂和低结合支持体可用于多种核酸分析应用中的任一种,例如,核酸碱基辨别、核酸碱基分类、核酸碱基判定、核酸检测应用、核酸测序应用和基于核酸的(基因和基因组)诊断应用。在许多这些应用中,荧光成像技术可用于监测在低非特异性结合支持体上进行的杂交、扩增或测序反应。
可以使用多种荧光团、荧光成像技术和荧光成像仪器中的任一种来进行荧光成像。可使用(例如,通过与核苷酸、寡核苷酸或蛋白质缀合)的荧光染料的实例包括但不限于荧光素、罗丹明、香豆素、花菁及其衍生物,包括花菁衍生物花菁染料-3(Cy3)、花菁染料-5(Cy5)、花菁染料-7(Cy7)等。可使用的荧光成像技术的实例包括但不限于宽场荧光显微镜荧光显微镜成像、荧光共焦成像、双光子荧光等。可以使用的荧光成像仪器的实例包括但不限于配备有图像传感器或相机的荧光显微镜、宽场荧光显微镜、共焦荧光显微镜、双光子荧光显微镜,或包括选择的光源、透镜、反射镜、棱镜、二向色反射器、光圈和图像传感器或相机等的定制仪器。配备用于获取所公开的低结合支持体表面和杂交于其上的靶核酸序列的克隆扩增群落(或簇)的图像的荧光显微镜的非限制性实例是Olympus IX83倒置荧光显微镜,其配备有:20×,0.75NA,532nm光源,针对532nm长通激发优化的带通和二向色镜滤光器组、和Cy3荧光发射滤光器、Semrock 532nm二向色反射器和相机(Andor sCMOS,Zyla 4.2),其中调节激发光强度以避免信号饱和。通常,支持体表面可浸入缓冲液(例如,25mM ACES,pH 7.4缓冲液)中,同时获取图像。
在一些情况下,低非特异性结合表面表现出用于将靶核酸序列(例如,多联体或纳米球序列)栓系至表面或用于进行固相核酸扩增的杂交或扩增制剂的蛋白质、核酸和其他组分的非特异性结合降低。可以定性或定量评估给定支持体表面表现出的非特异性结合的程度。例如,在一些情况下,在一组标准化条件下,将表面暴露于荧光染料(例如,Cy3、Cy5等)、荧光标记的核苷酸、荧光标记的寡核苷酸或荧光标记的蛋白质(例如聚合酶),随后进行指定的冲洗方案,并且荧光成像可以用作定性或定量工具,用于比较在包括不同表面制剂的表面上的非特异性结合—条件是已经小心以确保荧光成像在荧光信号与支持体表面上的荧光团数量线性相关(或以可预测的方式相关)的条件下(例如,在荧光团的信号饱和或自猝灭不是问题的条件下)进行,并使用校准标准。在一些情况下,可以使用其他现有技术(例如,放射性同位素标记和计数方法)来定量评估不同表面制剂表现出的非特异性结合的程度。在一些情况下,本公开的低非特异性结合表面可表现出小于0.001个分子/μm2、小于0.01个分子/μm2、小于0.1个分子/μm2、小于0.25个分子/μm2、小于0.5个分子/μm2、小于1个分子/μm2、小于10个分子/μm2、小于100个分子/μm2或小于1,000个分子/μm2的非特异性蛋白质结合(或其他指定分子的非特异性结合,例如,Cy3染料)。给定表面可表现出落入此范围内任何地方的非特异性结合,例如,小于86个分子/μm2
在一些情况下,可以使用荧光成像技术来评估使用所公开的低非特异性结合表面的核酸杂交或扩增反应的性能,其中图像的对比度-噪声比(CNR)提供了评估例如支持体上的扩增特异性或非特异性结合的关键度量。CNR通常定义为:CNR=(信号-背景)/噪声。背景项通常被认为是对特定目的区域(ROI)中的特定特征(衍射斑点,DLS)周围的间质区域测量的信号。虽然信噪比(SNR)通常被认为是总信号质量的基准,但是可以看出,在需要快速图像捕获的应用(例如,可以实现最小化循环时间的测序应用)中,改善的CNR可以提供优于作为信号质量基准的SNR的显著优点。在高CNR下,达到准确辨别(并因此在测序应用的情况下达到准确碱基判定)所需的成像时间可显著减少,即使CNR有适度改进。
在大多数基于ensemble的测序(ensemble-based sequencing)方法中,背景项被测量为与“间质”区域相关联的信号。除了“间质”背景(Binter)、“细胞内”背景(Bintra)存在于扩增的DNA群落占据的区域内。这两种背景信号的组合决定了可实现的CNR,并且随后直接影响光学仪器要求、架构成本、试剂成本、运行时间、成本/基因组,并且最终影响基于循环阵列的测序应用的准确度和数据质量。Binter背景信号产生于多种源;一些实例包括来源于消耗性流动池的自发荧光,产生可能遮蔽来源于ROI的信号的假荧光信号的检测分子的非特异性吸附,非特异性DNA扩增产物(例如,由引物二聚体产生的那些)的存在。在下一代测序(NGS)应用中,当前视野(FOV)中的此背景信号在时间上被平均并减去。由单个DNA群落产生的信号(即,FOV中的(S)-Binter)产生可被分类的可辨别的特征。在一些情况下,Bintra可以贡献混杂的荧光信号,该混杂的荧光信号对于目的靶不是特异性的,但是存在于相同的ROI中,因此使得平均和减去更加困难。因此,CNR更准确的计算由公式CNR=(信号-背景)/噪声提供,其中背景=Binter+Bintra
在一些情况下,由于在所公开的表面上可实现极低非特异性结合(低背景信号)和致密、紧密堆积的纳米球序列(或克隆扩增的靶核酸簇),因此所述表面的荧光图像可表现出CNR比使用常规支持体表面实现的CNR提高至2、5、10、100或1000倍。在一些情况下,当用于核酸杂交或扩增应用以产生杂交或克隆扩增的核酸分子(例如,已经用荧光团直接或间接标记的核酸分子)的簇时或当用于对所公开的条形码化锁式探针和分子倒置探针测定进行测序时,当在一组限定条件下获取图像时,例如,当核酸分子或其互补序列用Cy3荧光团标记时,以及当在非信号饱和条件下,同时表面浸入25mM ACES,pH 7.4缓冲液中,使用配备有全内反射荧光(TIRF)100x、1.5NA物镜、100W汞灯、532nm长通激发滤光器、Semrock 532nm二向色反射器和Olympus EM-CCD相机的Olympus IX83倒置荧光显微镜获取荧光图像时,本文公开的测序流动池的一个或多个内表面的荧光图像可表现出至少10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、20、210、220、230、240、250或大于250的对比度-噪声比(CNR)。
在一些实施方案中,利用本文公开的组合物和方法的测序方法可并入能够碱基判定,以揭示靶核酸的序列的检测方法。在一些实施方案中,这些检测方法可包括用于核酸检测和/或核酸测序的任何方法。在一些实施方案中,本文描述的系统用于执行碱基判定过程。在一些实施方案中,所述检测方法可包括例如,荧光检测、比色检测、发光(例如生物发光的化学发光)检测、干涉检测、基于共振的检测例如拉曼检测、基于自旋共振的检测、基于NMR的检测等、以及其他方法例如,电检测例如基于电容的检测、基于阻抗的检测,或电化学检测例如,由化学反应产生或在化学反应内产生的电子的检测,或电检测例如,阻抗测量与其他例如,光学测量的组合。
提供与其他元件组合的多价结合组合物可能是有利的,例如提供优化的信号,例如,提供核酸序列中特定位置的核苷酸的鉴定。在一些实施方案中,本文公开的组合物与提供低背景结合或低水平的蛋白质结合的表面组合提供,特别是亲水性或聚合物涂覆的表面。代表性的表面可以在例如,美国专利申请16/363,842号中找到,其全部内容通过引用并入本文。
成像模块
在一些情况下,所公开的系统可包括一个或多个成像模块,其中成像模块包括例如一个或多个光源(例如,激光器、激光二极管、弧光灯、钨-卤素灯等)、一个或多个光学组件(例如,透镜、反射镜、棱镜、滤光器、彩色玻璃滤光器、窄带干涉滤光器、宽带干涉滤光器、二向色反射器、衍射光栅、光圈、光纤或光波导等),以及一个或多个图像传感器(例如,电荷耦合器件(CCD)传感器或相机、互补金属氧化物半导体(CMOS)图像传感器或相机),或负通道金属氧化物半导体(NMOS)图像传感器或相机),其配置用于对测序流动池的一个或多个内表面成像或检测所公开的多价结合组合物与栓系至测序流动池内部表面上的靶(或模板)核酸序列的结合。
流体流动控制器或流体分配系统
在一些情况下,系统可进一步包括一个或多个流体流动控制器或流体分配模块,其配置为使与流动池内表面上的衔接子或引物序列杂交(或以其他方式栓系至流动池上)的模板核酸序列与所公开的多价结合组合物或试剂顺序地且迭代地接触。在一些情况下,所述接触可以在一个或多个流动池内进行。在一些情况下,所述一个或多个流动池可以是系统的固定组件。在一些情况下,所述一个或多个流动池可以是系统的可拆卸或一次性组件。
计算机控制系统
本公开提供了经编程或以其他方式配置以实施本文提供的方法的计算机系统,方法例如如本文描述的用于核酸测序、存储参考核酸序列、进行序列分析或比较样品和参考核酸序列的方法。图10中示出了这种计算机系统的实例。计算机系统1001包括中央处理单元(CPU,本文也称为“处理器”和“计算机处理器”)1005,其可以是单核或多核处理器,或用于并行处理的多个处理器。计算机系统1001还包括存储器或存储位置1010(例如,随机存取存储器、只读存储器、闪存)、电子存储单元1015(例如,硬盘)、用于与一个或多个其他系统通信的通信接口1020(例如,网络适配器)、以及外围设备1025,例如高速缓存、其他存储器、数据存储或电子显示适配器。存储器1010、存储单元1015、接口1020和外围设备1025通过例如主板的通信总线(实线)与CPU 1005通信。存储单元1015可以是用于存储数据的数据存储单元(或数据储存库)。计算机系统1001可以借助于通信接口1020可操作地耦合至计算机网络(“网络”)1030。网络1030可以是因特网、因特网或外联网,或与因特网通信的内联网或外联网。在一些情况下,网络1030是电信或数据网络。网络1030可包括一个或多个计算机服务器,其可以实现分布式计算,例如云计算。在一些情况下,借助于计算机系统1001,网络1030可以实现对等网络,该对等网络可以使耦合至计算机系统1001的设备能够表现为客户端或服务器。
CPU 1005可以执行机器可读指令序列,其可包括在程序或软件中。指令可存储在存储位置(例如存储器1010)中。由CPU 1005执行的操作的实例可包括提取、解码、执行和回写。
存储单元1015可以存储文件,例如驱动器、库和保存的程序。存储单元1015可以存储用户数据,例如,用户偏好和用户程序。在一些情况下,计算机系统1001可包括在计算机系统1001外部的一个或多个附加数据存储单元,例如位于通过内联网或因特网与计算机系统1001通信的远程服务器上。
计算机系统1001可以通过网络1030与一个或多个远程计算机系统通信。例如,计算机系统1001可以与用户(例如,操作者)的远程计算机系统通信。远程计算机系统的实例包括个人计算机(例如,便携式PC)、平板或平板PC(例如,
Figure BDA0004151510670000812
iPad、/>
Figure BDA0004151510670000811
Galaxy Tab)、电话、智能电话(例如,/>
Figure BDA0004151510670000814
iPhone、支持Android的设备、
Figure BDA0004151510670000813
)或个人数字助理。用户可以通过网络1030访问计算机系统1001。
可以通过存储在计算机系统1001的电子存储位置(例如,存储器1010或电子存储单元1015)上的机器(例如,计算机处理器)可执行代码来实现如本文描述的方法。可以以软件的形式提供机器可执行或机器可读代码。在使用期间,代码可由处理器1005执行。在一些情况下,可从存储单元1015中检索代码并将其存储在存储器1010上以供处理器1005随时访问。在一些情况下,可以排除电子存储单元1015,并且将机器可执行指令存储在存储器1010上。
代码可以被预编译和配置为与具有适于执行该代码的处理器的机器一起使用,或者可以在运行时期间被编译。代码可以以编程语言提供,该编程语言可以被选择为使得该代码能够以预编译或编译时的方式执行。
本文提供的系统的各方面,例如计算机系统1001,可以在编程中实现。该技术的各个方面可以被认为是以机器(或处理器)可执行代码或相关联的数据的形式的“产品”或“制品”,该机器可执行代码或相关联的数据在一种类型的机器可读介质上携带或体现。机器可执行代码可以存储在例如存储器(例如,只读存储器、随机存取存储器、闪存)或硬盘的电子存储单元上。“存储”型介质可包括计算机,处理器等的任何或所有有形存储器,或其相关联的模块,例如各种半导体存储器、磁带驱动器、磁盘驱动器等,其可在任何时间为软件编程提供非暂时性存储。软件的全部或部分有时可以通过因特网或各种其他电信网络进行通信。这种通信例如可以使得能够将软件从一个计算机或处理器装载至另一个计算机或处理器中,例如,从管理服务器或主机计算机装载至应用服务器的计算机平台中。因此,可以承载软件元素的另一类型的介质包括光、电和电磁波,例如通过有线和光陆线网络以及通过各种空中链路在本地设备之间的物理接口上使用的。承载这种波的物理元件,例如有线或无线链路、光链路等,也可以被认为是承载软件的介质。如本文所用,除非限制为非暂时性的,有形的“存储”介质,例如计算机或机器的术语“可读介质”是指参与向处理器提供指令以供执行的任何介质。
因此,例如计算机可执行代码的机器可读介质可以采取多种形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如,光盘或磁盘,例如可用于实现图中所示的数据库等的任何计算机等中的任何存储设备。易失性存储介质包括动态存储器,例如这种计算机平台的主存储器。有形传输介质包括同轴电缆;铜线和光纤,包含包括计算机系统内的总线的线。载波传输介质可以采用电信号或电磁信号,或者声波或光波的形式,例如在射频(RF)和红外(IR)数据通信期间产生的那些。计算机可读介质的常见形式因此包括例如:软盘、软磁盘、硬盘、磁带、任何其他磁性介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、穿孔卡纸带、具有孔图案的任何其他物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何他存储器芯片或盒、传输数据或指令的载波、传输这种载波的电缆或链路,或计算机可从其读取编程代码或数据的任何其他介质。这些形式的计算机可读介质中的许多可涉及将一个或多个指令的一个或多个序列携带到处理器以供执行。计算机系统1001可包括电子显示器1035或与电子显示器1035通信,电子显示器1035包括用户接口(UI),用于提供例如,耦合至计算机系统1001的核酸测序仪器的输出或读出。这种读出可包括核酸测序读出,例如包括给定核酸样品的核酸碱基序列。UI还可用于显示利用这种读出的分析结果。UI的实例包括但不限于图形用户界面(GUI)和基于web的用户界面。电子显示器1035可以是计算机监视器,或电容或电阻触摸屏。
处理器和计算机系统
一个或多个处理器可用于实施本文公开的用于核酸测序或其他核酸检测和分析方法的系统。一个或多个处理器可包括硬件处理器,例如中央处理单元(CPU)、图形处理单元(GPU)、通用处理单元或计算平台。一个或多个处理器可包括多种集成电路(例如,专门设计用于实施深度学习网络架构的专用集成电路(ASIC),或加速计算时间等或便于部署的现场可编程门阵列(FPGA)、微处理器、新兴的下一代微处理器设计(例如,基于忆阻器的处理器)、逻辑设备等中的任一种。尽管参考处理器来描述本公开,但其他类型的集成电路和逻辑设备也是适用的。处理器可以具有任何数据操作能力。例如,处理器可执行512位、256位、128位、64位、32位或16位数据操作。一个或多个处理器可以是单核或多核处理器,或配置用于并行处理的多个处理器。
用于实施所公开的方法的一个或多个处理器或计算机可以是较大计算机系统的一部分,或者可以借助于通信接口可操作地耦合至计算机网络(“网络”),以便于数据的传输和共享。网络可以是局域网、内联网或外联网、与因特网通信的内联网或外联网,或因特网。在一些情况下,网络是电信或数据网络。网络可包括一个或多个计算机服务器,其在一些情况下实现分布式计算,例如云计算。在一些情况下,借助于计算机系统,网络可以实现对等网络,该对等网络可以使耦合至计算机系统的设备能够表现为客户机或服务器。
计算机系统还可包括存储器或存储位置(例如,随机存取存储器、只读存储器、闪存、
Figure BDA0004151510670000841
OptaneTM技术)、电子存储单元(例如,硬盘)、用于与一个或多个其他系统通信的通信接口(例如,网络适配器),以及外围设备,例如高速缓存、其他存储器、数据存储器或电子显示适配器。存储器、存储单元、接口和外围设备可以通过通信总线与一个或多个处理器(例如,CPU)通信,例如,如主板上发现的。存储单元可以是用于存储数据的数据存储单元(或数据储存库)。
一个或多个处理器(例如,CPU)执行机器可读指令序列,其包括在程序(或软件)中。指令存储在存储位置中。指令被引导至CPU,其随后对CPU进行编程或以其他方式配置,以实施本公开的方法。由CPU执行的操作的实例包括提取、解码、执行和回写。CPU可以是电路(例如集成电路)的一部分。系统的一个或多个组件可包括在电路中。在一些情况下,电路是专用集成电路(ASIC)。
存储单元存储文件,例如驱动器、库和保存的程序。存储单元存储用户数据,例如,用户指定的偏好和用户指定的程序。在一些情况下,计算机系统可包括在计算机系统外部的一个或多个附加数据存储单元,例如位于通过内联网或因特网与计算机系统通信的远程服务器上。
本文提供的方法和系统的一些方面可以通过存储在计算机系统的电子存储位置(例如,存储器或电子存储单元)中的机器(例如,处理器)可执行代码来实现。可以以软件的形式提供机器可执行或机器可读代码。在使用期间,代码由一个或多个处理器执行。在一些情况下,从存储单元中检索代码并将其存储在存储器中,以供由一个或多个处理器随时访问。在一些情况下,排除电子存储单元,并且将机器可执行指令存储在存储器中。代码可以被预编译和配置为与具有适于执行该代码的一个或多个处理器的机器一起使用,或者可以在运行时被编译。代码可以以编程语言提供,该编程语言被选择为使得该代码能够以预编译或编译时的方式执行。
该技术的各个方面可以被认为是“产品”或“制品”,例如,“计算机程序或软件产品”,通常是存储在一种机器可读介质中的机器(或处理器)可执行代码或相关数据的形式,其中可执行代码包括用于在执行本文公开的方法中的一种或多种时控制计算机或计算机系统的多个指令。机器可执行代码可以存储在包括光学可读介质(例如光盘、CD-ROM、DVD或蓝光光盘)的光学存储单元中。机器可执行代码可以存储在例如存储器(例如,只读存储器、随机存取存储器、闪存)的电子存储单元中或硬盘上。“存储”型介质包括计算机、处理器等的任何或所有有形存储器,或其相关联的模块,例如各种半导体存储器芯片、光驱动器、磁带驱动器、磁盘驱动器等,其可在任何时间为编码本文公开的方法和算法的软件提供非暂时性存储。
软件代码的全部或部分有时可以经由因特网或各种其他电信网络进行通信。这种通信例如使得能够将软件从一个计算机或处理器装载至另一个计算机或处理器中,例如,从管理服务器或主机计算机装载至应用服务器的计算机平台中。因此,用于传送软件编码指令的其他类型的介质包括光、电和电磁波,例如通过有线和光陆线网络以及通过各种大气链路在本地设备之间的物理接口上使用的那些。承载这种波的物理元件(例如有线或无线链路、光链路等)也被认为是传送用于执行本文公开的方法的软件编码指令的介质。如本文所用,除非限制为非暂时性的,有形的“存储”介质,例如计算机或机器的术语“可读介质”是指参与向处理器提供指令以供执行的任何介质。
计算机系统通常包括用于提供例如由机器视觉系统捕获的图像的电子显示器,或可以与该电子显示器通信。显示器通常还能够提供用户界面(UI)。UI的实例包括但不限于图形用户界面(GUI)、基于web的用户界面等。
系统控制软件
在一些情况下,所公开的系统可包括计算机(或处理器)和计算机可读介质,该计算机可读介质包括用于提供用户界面以及手动、半自动或全自动控制所有系统功能的代码,例如控制流体流动控制器或流体分配系统(或子系统)、温度控制系统(或子系统)、成像系统(或子系统)等。在一些情况下,系统计算机或处理器可以是仪器系统的集成组件(例如嵌入在仪器内的微处理器或主板)。在一些情况下,系统计算机或处理器可以是独立模块,例如,个人计算机或膝上型计算机。可由仪器控制软件提供的流体流动控制功能的实例包括但不限于体积流体流速、流体流速、样品和试剂添加的定时和持续时间、冲洗步骤等。可由仪器控制软件提供的温度控制功能的实例包括但不限于指定温度设定点和控制温度变化的定时、持续时间和斜坡率。可由仪器控制软件提供的成像系统控制功能的实例包括但不限于自动聚焦能力、照明或激发光暴露时间和强度的控制、图像获取速率的控制、暴露时间、数据存储选项等。
图像处理软件
在所公开的系统的一些情况下,系统可进一步包括计算机可读介质,其包括用于提供图像处理和分析能力的代码。可由软件提供的图像处理和分析能力的实例包括但不限于手动、半自动或全自动图像暴露调整(例如白平衡、对比度调整、信号平均和其他降噪能力等)、手动、半自动或全自动边缘检测和对象识别(例如,用于识别基底表面上的扩增模板核酸分子的簇)、手动、半自动或全自动信号强度测量或一个或多个检测通道(例如,一个或多个荧光发射通道)中的阈值处理、手动、半自动或全自动统计分析(例如,用于将信号强度与用于碱基判定的参考值进行比较)。
在一些情况下,系统软件可以提供集成的实时图像分析和仪器控制,使得可以延长、修改或重复样品装载、试剂添加、冲洗或成像/碱基判定步骤,直到例如实现最佳碱基判定结果。可以使用多种现有图像处理和分析算法中的任一种来实施实时或后处理图像分析能力。实例包括但不限于Canny边缘检测方法、Canny-Deriche边缘检测方法、一阶梯度边缘检测方法(例如Sobel算子)、二阶微分边缘检测方法、相位一致性(相位相干性)边缘检测方法、其他图像分割算法(例如强度阈值处理、强度聚类方法、基于强度直方图的方法等)、特征和模式识别算法(例如用于检测任意形状的广义Hough变换、圆形Hough变换等)和数学分析算法(例如傅立叶变换、快速傅立叶变换、小波分析、自相关等),或其组合。
在一些情况下,系统控制和图像处理/分析软件可以作为单独的软件模块来编写。在一些情况下,系统控制和图像处理/分析软件可以并入集成软件包中。
数据分析软件
在所公开的系统的一些情况下,系统可进一步包括计算机可读介质,该计算机可读介质包括用于执行数据分析的代码,例如,用于探针条形码的解码、样品解复用、对给定样品条形码检测的探针条形码序列的分箱、条形码测序的计数等的软件。在一些情况下,数据分析软件可进一步包括数据分析(例如,统计分析)和数据显示能力。在一些情况下,数据分析软件可包括用于执行测定特异性的初步评估或用于确定其他测定性能质量度量的工具。
用于检测病原体核酸的试剂盒
本文公开了试剂盒。在一些情况下,本公开的试剂盒可包括进行样品纯化、核酸提取、杂交、连接、扩增(包括RCA)和测序(包括本文公开的多价结合组合物的任何组合)所需的一组或多组条形码化锁式探针或分子倒置探针、一组或多组样品索引扩增引物、测定缓冲液和试剂、一个或多个测序流动池或其任何组合。
在一些实施方案中,本文公开了使用本文公开的组合物、方法或系统制备核酸测序文库的试剂盒。在一些实施方案中,试剂盒包括本文描述的组合物,例如用于检测多个样品中的一个或多个样品的靶核酸序列的存在的试剂和基底。
本文公开的试剂盒包括酶、核酸、核苷酸、具有官能化表面的支持体、聚合物-核苷酸组合物、缓冲体系或说明书。在一些实施方案中,本文公开的试剂盒可包括溶液,该溶液包括在促进互补序列杂交的条件下用线性核酸探针分子从多个样品中的样品提取的核酸分子。在一些实施方案中,线性核酸探针分子包括与靶核酸序列的第一区域互补的靶特异性5’区域、扩增引物结合区域、探针条形码序列和与靶核酸序列的第二区域互补的靶特异性2’区域。在一些实施方案中,线性核酸探针分子包括与靶核酸序列的第一区域互补的靶特异性5’区域、扩增引物结合区域、样品条形码序列、探针条形码序列和与靶核酸序列的第二区域互补的靶特异性2’区域。在一些实施方案中,样品条形码序列对于多个样品中的每个样品是独特的。在一些实施方案中,探针条形码序列对于每对靶特异性5’区域和靶特异性3’区域是独特的。在一些实施方案中,靶核酸序列的第一区域和靶核酸序列的第二区域是靶核酸分子中的连续序列。在一些实施方案中,扩增引物与扩增引物结合区域互补。在一些实施方案中,酶可以是连接酶、蛋白酶、转座酶、本文描述的任何一种酶及其组合。在一些实施方案中,核酸可以是寡核苷酸、夹板寡核苷酸、本文描述的任何寡核苷酸或核酸,或其任何组合。在一些实施方案中,核苷酸可包括具有封闭部分的核苷酸。在一些实施方案中,核苷酸可包括聚合物-核苷酸缀合物。在一些实施方案中,核苷酸可包括检测部分。在一些实施方案中,具有官能化表面的支持体可包括用于支持体的塑料、金属、玻璃或其任何组合。在一些实施方案中,具有官能化表面的支持体可包括用于官能化的亲水性、疏水性、聚合性、引发的或其任何组合。
在一些实施方案中,说明书可包括对使单链核酸、单链DNA、单链RNA、双链核酸、双链DNA、双链RNA或本文描述的任何核酸及其组合环化的方法的描述。在一些实施方案中,说明书可进一步包括在环化之前、环化同时或环化之后连接核酸衔接子或引物的方法的描述。在一些实施方案中,说明书可进一步包括用于处理来源于生物来源的遗传物质的说明书。在一些实施方案中,说明书可包括检测核酸序列的描述。在一些实施方案中,这些说明书可包括用于规划多个阶段的描述,每个阶段采用本文描述的方法中的一个。例如,这种描述的一个实施方案可以描述以下操作,包括a)在促进互补序列杂交的条件下,将包括从多个样品中的样品提取的核酸分子的溶液与线性核酸探针分子一起孵育;b)使溶液经受用于进行连接反应的条件,以从杂交的线性核酸探针分子产生环状核酸探针分子;c)使溶液经受用于使用与扩增引物结合区域互补的扩增引物扩增环状线性核酸探针分子的条件,从而产生针对样品的扩增产物;d)合并针对多个样品中的每个样品的扩增产物或其衍生物;以及e)检测合并的扩增产物或其衍生物中一个或多个样品条形码序列的存在,从而检测多个样品中的一个或多个样品中靶核酸的存在。在一些实施方案中,e)中的检测包括测序。
在一些实施方案中,本文公开了使用本文公开的组合物、方法或系统进行核酸测序的试剂盒。在一些实施方案中,试剂盒包括本文描述的组合物,例如用于使用本文公开的组合物、方法或系统进行核酸测序的试剂和基底。
在一些实施方案中,聚合物-核苷酸组合物可包括聚合物核和与其偶联的多个核苷酸部分。在一些实施方案中,表面可包括与其偶联的引发的核酸序列和亲水性聚合物层。在一些实施方案中,水性聚合物层包括聚合物,聚合物包括选自聚(乙二醇)(PEG)、聚(乙烯醇)(PVA)、聚(乙烯基吡啶)、聚(乙烯基吡咯烷酮)(PVP)、聚(丙烯酸)(PAA)、聚丙烯酰胺、聚(N-异丙基丙烯酰胺)(PNIPAM)、聚(甲基丙烯酸甲酯)(PMA)、聚(甲基丙烯酸2-羟乙基酯)(PHEMA)、聚(低聚(乙二醇)甲基醚甲基丙烯酸酯)(POEGMA)、聚(谷氨酸)(PGA)、聚赖氨酸、聚葡糖苷、链霉亲和素或葡聚糖,或其组合的聚合物。在一些实施方案中,表面可包括流动池的一个或多个内表面。在一些实施方案中,试剂盒可进一步包括至少两种类型的核苷酸-聚合物缀合物。在一些实施方案中,试剂盒可进一步包括至少三种类型的核苷酸-聚合物缀合物。在一些实施方案中,试剂盒可进一步包括至少四种类型的核苷酸-聚合物缀合物。在一些实施方案中,试剂盒可进一步包括多种类型的核苷酸-聚合物缀合物,并且其中多种类型中的每一种包括具有不同核碱基的核苷酸部分。在一些实施方案中,试剂盒可进一步包括多种类型的核苷酸-聚合物缀合物,并且其中多种类型中的每一种包括具有不同核碱基的核苷酸部分。
在一些实施方案中,试剂盒可进一步包括多种类型的核苷酸-聚合物缀合物,并且其中多种类型中的每一种包括偶联至聚合物核的不同的可检测标记。在一些实施方案中,可检测标记包括荧光标记。在一些实施方案中,聚合物核可包括选自以下的聚合物:聚(乙二醇)(PEG)、聚(乙烯醇)(PVA)、聚(乙烯基吡啶)、聚(乙烯基吡咯烷酮)(PVP)、聚(丙烯酸)(PAA)、聚丙烯酰胺、聚(N-异丙基丙烯酰胺)(PNIPAM)、聚(甲基丙烯酸甲酯)(PMA)、聚(甲基丙烯酸2-羟乙基酯)(PHEMA)、聚(低聚(乙二醇)甲基醚甲基丙烯酸酯)(POEGMA)、聚(谷氨酸)(PGA)、聚赖氨酸、聚葡糖苷、链霉亲和素和葡聚糖。
在一些实施方案中,试剂盒可进一步包括一个或多个未标记的核苷酸,一个或多个未标记的核苷酸包括在一个或多个未标记的核苷酸的糖的3’位的保护基团。在一些实施方案中,保护基团可包括3’-O-甲基核苷酸或3’-O-烷基羟胺核苷酸、3’-O-叠氮甲基核苷酸、3’-硫代磷酸酯基团、3’-O-丙二酰基、3’-O-苄基、3’-O-氨基或其衍生物。在一些实施方案中,试剂盒可包括缓冲体系,缓冲体系包括锶离子、镁离子、钙离子或其任何组合。
在一些实施方案中,试剂盒可包括说明书,该说明书包括对通过以下步骤鉴定引发的核酸序列中的核苷酸的描述:a)在促进互补序列杂交的条件下,将包括从多个样品中的样品提取的核酸分子的溶液与线性核酸探针分子一起孵育,其中:i)线性核酸探针分子包括与靶核酸序列的第一区域互补的靶特异性5’区域、扩增引物结合区域、探针条形码序列和与靶核酸序列的第二区域互补的靶特异性3’区域;ii)探针条形码序列对于每对靶特异性5’区域和靶特异性3’区域是独特的;以及iii)靶核酸序列的第一区域和靶核酸序列的第二区域是靶核酸分子中的连续序列;b)使溶液经受用于进行连接反应的条件,以从杂交的线性核酸探针分子产生环状核酸探针分子;c)使溶液经受用于使用与扩增引物结合区域互补的扩增引物扩增环状线性核酸探针分子的条件,从而产生针对样品的扩增产物;d)合并针对多个样品中的每个样品的扩增产物或其衍生物;以及e)检测合并的扩增产物或其衍生物中一个或多个样品条形码序列的存在,从而检测多个样品中的一个或多个样品中靶核酸的存在;该引发的核酸序列来源于患有或疑似患有由SARS-CoV-2病毒或其变体引起的疾病的对象样品。在一些实施方案中,试剂盒可包括说明书,该说明书包括对通过以下步骤鉴定引发的核酸序列中的核苷酸的描述:a)在促进互补序列杂交的条件下,将包括从多个样品中的样品提取的核酸分子的溶液与线性核酸探针分子一起孵育,其中:i)线性核酸探针分子包括与靶核酸序列的第一区域互补的靶特异性5’区域、扩增引物结合区域、样品条形码序列、探针条形码序列和与靶核酸序列的第二区域互补的靶特异性3’区域;ii)样品条形码序列对于多个样品中的每个样品是独特的;iii)探针条形码序列对于每对靶特异性5’区域和靶特异性3’区域是独特的;以及iv)靶核酸序列的第一区域和靶核酸序列的第二区域是靶核酸分子中的连续序列;b)使溶液经受用于进行连接反应的条件,以从杂交的线性核酸探针分子产生环状核酸探针分子;c)使溶液经受用于使用与扩增引物结合区域互补的扩增引物扩增环状线性核酸探针分子的条件,从而产生针对样品的扩增产物;d)合并针对多个样品中的每个样品的扩增产物或其衍生物;以及e)检测合并的扩增产物或其衍生物中一个或多个样品条形码序列的存在,从而检测多个样品中的一个或多个样品中靶核酸的存在;该引发的核酸序列来源于患有或疑似患有SARS-CoV-2病毒或其变体引起的疾病的对象样品。在一些实施方案中,e)中的检测包括测序。在一些实施方案中,靶核酸分子包括RNA分子。在一些实施方案中,靶核酸分子包括病毒和核酸分子。在一些实施方案中,病毒RNA分子包括COVID-19RNA分子。在一些实施方案中,一个或多个线性核酸探针分子的靶特异性5’区域和靶特异性3’区域包括与COVID-19S基因或其片段、COVID-19Orflab基因或其片段、COVID-19N基因或其片段或其任何组合互补的序列。在一些实施方案中,一个或多个线性核酸探针分子的靶特异性5’区域和靶特异性3’区域包括与Ca-Y132H序列互补的序列。在一些实施方案中,多个样品包括鼻咽拭子样品、痰样品、支气管肺泡灌洗液样品、血液样品、尿液样品、粪便样品或其任何组合。
分析和测序系统性能
为了说明所公开的方法和系统的预计性能,假定一种配置,其中单个仪器每次运行处理384个样品,每2小时进行一次运行。假定系统工作周期(或正常运行时间)为80%且操作时间为24/7,则单个仪器将每天执行10次运行,对应于每天处理3,840个样品或每年每个仪器处理1.4M个样品。采用1,536个样品形式有效地将该通量四倍化为每年每个仪器5.6M个样品,这提供了比任何当前现有平台大一个数量级的样品处理通量。由于短条形码序列(例如,15个碱基)的基本测序要求,测序试剂盒的使用将是最少的,并且通过将试剂盒成本分散在所有样品,每个样品的成本将进一步降低。结果是可以以少于$10一个样品的价格有利地商业化的测定。
在一些情况下,用于捕获测序的多价结合组合物的使用有效地缩短了测序时间。在一些情况下,包括接触、检测和掺入步骤的测序反应循环可以在约5分钟至约60分钟的总时间范围内进行。在一些情况下,测序反应循环时间可以为至少5分钟、至少10分钟、至少20分钟、至少30分钟、至少40分钟、至少50分钟或至少60分钟。在一些情况下,测序反应循环时间可以为至多60分钟、至多50分钟、至多40分钟、至多30分钟、至多20分钟、至多10分钟或至多5分钟。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本公开内的范围,例如,在一些情况下,每个循环的测序反应时间可以在约10分钟至约30分钟的范围内。测序反应循环时间可具有此范围内的任何值,例如,约16分钟。
在一些情况下,所公开的用于核酸测序的多价结合组合物和方法将在测序运行过程中提供至少80%、至少85%、至少90%至少92%、至少94%、至少96%、至少98%、至少99%、至少99.5%、至少99.8%或至少99.9%正确的平均碱基判定准确度。在一些情况下,所公开的用于核酸测序的多价结合组合物和方法将提供判定的每1,000个碱基、10,0000个碱基、25,000个碱基、50,000个碱基、75,000个碱基或100,000个碱基至少80%、至少85%、至少90%、至少92%、至少94%、至少96%、至少98%、至少99%、至少99.5%、至少99.8%或至少99.9%正确的平均碱基判定准确度。
在一些情况下,用于测序的多价结合组合物的使用提供了更准确的碱基读出。在一些情况下,所公开的用于核酸测序的组合物和方法可提供在约20至约50范围内的测序运行中碱基判定准确度的平均Q评分。在一些情况下,平均Q评分为至少20、至少25、至少30、至少35、至少40、至少45或至少50。平均Q评分可具有此范围内的任何值,例如,约32。
在一些情况下,所公开的用于核酸测序的多价结合组合物和方法对于鉴定的末端(或N+1)核苷酸的至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%可提供大于30的Q评分。在一些情况下,所公开的用于核酸测序的组合物和方法对于鉴定的末端(或N+1)核苷酸的至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%可提供大于35的Q评分。在一些情况下,所公开的用于核酸测序的组合物和方法对于鉴定的末端(或N+1)核苷酸的至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%可提供大于40的Q评分。在一些情况下,所公开的用于核酸测序的组合物和方法对于鉴定的末端(或N+1)核苷酸的至少50%、至少60%、至少70%、至少80%、至少85%、至少90%\至少95%、至少98%或至少99%可提供大于45的Q评分。在一些情况下,所公开的用于核酸测序的组合物和方法对于鉴定的末端(或N+1)核苷酸的至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%可提供大于50的Q评分。
在一些情况下,并行(在单个仪器上)处理或测序的样品数可以在每次运行约8至约1,536个样品的范围内。在一些情况下,每次运行处理或测序的样品数可以为至少8、至少12、至少24、至少48、至少96、至少192、至少384、至少768或至少1,536。在一些情况下,每次运行处理或测序的样品数可以为至多1,536、至多768、至多384、至多192、至多96、至多48、至多24、至多12或至多8。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本公开内的范围,例如,在一些情况下,每次运行处理或测序的样品数可以在约96至约1,536的范围内。每次运行处理或测序的样品数可具有此范围内的任何值,例如,约100。
通常,测定读出所需的测序循环数将取决于所用探针或样品条形码的长度。在一些情况下,所需的测序循环数可以在约3至约30的范围内。在一些情况下,测序循环数可以为至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少15、至少20、至少25或至少30。在一些情况下,所需的测序循环数可以为至多30、至多25、至多20、至多15、至多10、至多9、至多8、至多7、至多6、至多5、至多4或至多3。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本公开内的范围,例如,在一些情况下,所需的测序循环数可以在约6至约20的范围内。所需的测序循环数可具有此范围内的任何值,例如,约16。
在一些情况下,通过所公开的方法和系统实现的测定灵敏度(或真阳性率)可以在约90%至约100%的范围内。在一些情况下,测定灵敏度可以为至少90%,至少91%,至少92%,至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%。在一些情况下,测定灵敏度可以为至多100%、至多99%、至多98%、至多97%、至多96%、至多95%、至多94%、至多93%、至多92%、至多91%或至多90%。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本公开内的范围,例如,在一些情况下,测定灵敏度可以在约92%至约98%的范围内。测定灵敏度可具有此范围内的任何值,例如,约95.6%。
在一些情况下,通过所公开的方法和系统实现的测定特异性(或真阴性率)可以在约90%至约100%的范围内。在一些情况下,测定特异性可以为至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%。在一些情况下,测定特异性可以为至多100%、至多99%、至多98%、至多97%、至多96%、至多95%、至多94%、至多93%、至多92%、至多91%或至多90%。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本公开内的范围,例如,在一些情况下,测定特异性可以在约94%至约99%的范围内。测定灵敏度可具有此范围内的任何值,例如,约97.2%。
在一些情况下,通过所公开的方法和系统实现的测定检测极限(LoD)可以在约1个靶核酸序列/μL至约20个靶核酸序列拷贝/μL的范围内。在一些情况下,检测极限可以为至少1、至少2、至少3、至少4、至少5、至少10、至少15或至少20个靶核酸序列拷贝/μL。在一些情况下,检测极限可以为至多20、至多15、至多10、至多5、至多4、至多3、至多2或至多1个靶核酸序列拷贝/μL。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本公开内的范围,例如,在一些情况下,检测极限可以在约3至约15个靶核酸序列拷贝/μL的范围内。检测极限可具有此范围内的任何值,例如,约9个靶核酸序列拷贝/μL。
在一些情况下,所公开的方法和系统可以实现约10至约1,000个样品/小时范围内的样品处理通量。在一些情况下,样品处理通量可以为至少10、至少20、至少30、至少40、至少50、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900或至少1,000个样品/小时。在一些情况下,样品处理通量可以为至多1,000、至多900、至多800、至多700、至多600、至多500、至多400、至多300、至多200、至多100、至多50、至多40、至多30、至多20或至多10个样品/小时。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本公开内的范围,例如,在一些情况下,样品处理通量可以在约50至约500个样品/小时的范围内。样品处理通量可具有此范围内的任何值,例如,约465个样品/小时。
在一些情况下,使用所公开的方法和系统实现的采样到回复时间可以在约30分钟至约4小时的范围内。在一些情况下,采样到回复时间可以为至少30分钟、至少1小时、至少1.5小时、至少2小时、至少2.5小时、至少3小时、至少3.5小时或至少4小时。在一些情况下,采样到回复时间可以为至多4小时、至多3.5小时、至多3小时、至多2.5小时、至多2小时、至多1.5小时、至多1小时或至多30分钟。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本公开内的范围,例如,在一些情况下,采样到回复时间可以在约1小时至约3.5小时的范围内。采样到回复时间可具有此范围内的任何值,例如,约2小时20分钟。
在一些情况下,使用所公开的方法和系统实现的每个样品的测试成本可以在每个样品约$1至约$15的范围内。在一些情况下,每个样品的成本可以为至少$1、至少$2、至少$3、至少$4、至少$5、至少$6、至少$7、至少$8、至少$9、至少$10、至少$11、至少$12、至少$13、至少$14或至少$15。在一些情况下,每个样品的成本可以为至多$15、至多$14、至多$13、至多$12、至多$11、至多$10、至多$9、至多$8、至多$7、至多$6、至多$5、至多$4、至多$3、至多$2或至多$1。在本段落中描述的下限和上限值中的任一个可以组合以形成包括在本公开内的范围,例如,在一些情况下,每个样品的成本可以在约$2至约$12的范围内。每个样品的成本可具有此范围内的任何值,例如,约$9.55。
应用
本文描述了分析来源于例如流动池中扩增的核酸阵列或来源于固定化核酸阵列的大量不同核酸序列的方法。本文描述的方法还可用于例如用于比较基因组学的测序、追踪基因表达、微RNA序列分析、表观基因组学以及适体和噬菌体展示文库表征和其他测序应用。本文描述的方法包括光学、机械、流体、热、电和计算设备/方面的各种组合。由包括流动池设备、盒和系统的方法赋予的优点包括但不限于:(i)降低的设备和系统制造复杂性和成本,(ii)显著降低的消耗成本(例如,与当前可用的核酸测序系统的消耗成本相比),(iii)与流动池表面官能化方法的相容性,(iv)当与微流体组件(例如,注射泵和隔膜阀等)组合时的灵活的流量控制,和(v)灵活的系统通量。
病原体相关疾病的诊断或预后
在一些实施方案中,本文公开了用于诊断或预后与本文公开的病原体感染相关或由其引起的疾病或病症的系统、试剂盒和方法,其至少部分地基于来源于本文描述的病原体的核酸序列的鉴定。本文描述的系统、试剂盒和方法可用于诊断或预测由病毒感染引起的疾病或病症,例如严重呼吸综合征2(SARS-CoV-2)病毒或其变体。
在一些实施方案中,对象表现出包括以下的体征或症状:发烧、寒战、咳嗽、呼吸短促或呼吸困难、疲劳、胸部持续疼痛或压力、不能醒来或保持清醒;皮肤、嘴唇或甲床发白、发灰或发青;肌肉或身体疼痛、头痛、味觉或嗅觉丧失、喉咙痛、充血或流涕、恶心、呕吐或腹泻或其任何组合。
在一些实施方案中,本文描述的方法包括:(a)提供从疑似患有与病原体感染相关的疾病或病症的对象获得的生物样品;(b)测序来源于生物样品的遗传信息;(c)从遗传信息鉴定来源于病原体的核酸序列;和(d)诊断患有与病原体感染相关的疾病或病症的对象。
在一些实施方案中,生物样品获自本文描述的对象。在一些实施方案中,对象是哺乳动物,例如小鼠、大鼠、豚鼠、兔、非人灵长类动物或农场动物。在一些实施方案中,对象是人。在一些实施方案中,对象表现出与本文公开的疾病或病症相关的症状(例如,发热、寒战、咳嗽、呼吸短促或呼吸困难、疲劳、胸部持续疼痛或压力、不能醒来或保持清醒、皮肤、嘴唇或甲床发白、发灰或发青、肌肉或身体疼痛、头痛、味觉或嗅觉丧失、喉咙痛、充血或流涕、恶心、呕吐或腹泻、瘀点或其任何组合)。在一些实施方案中,对象至少10岁。在一些实施方案中,对象至少55岁。在一些实施方案中,对象为0-10、11-19、20-39、40-59、60-75或76-100岁。在一些实施方案中,对象具有影响本文描述的疾病预后的前提条件。在一些实施方案中,前提条件包括肥胖症、糖尿病、凝血障碍、并发呼吸病症(例如,支气管炎或肺炎)、癌症、免疫缺陷障碍或病症(包括治疗性或医学诱导的免疫缺陷,例如在移植或癌症疗法之后),或其任何组合。
在一些实施方案中,生物样品包括血液、血清、血浆、汗液、毛发、眼泪、尿液、粪便、粘液(包括鼻、肺、胃或泌尿生殖粘液)、脑脊液、淋巴液、唾液或本文公开的任何其他生物样品。在一些实施方案中,生物样品直接或间接从对象获得。
在一些实施方案中,使用本文描述的方法、试剂盒或系统进行遗传信息的测序。在非限制性实例中,遗传信息可如下测序:(a)在足以在聚合酶、一个或多个核苷酸部分和引发的核酸序列的核苷酸之间形成结合复合物而不将一个或多个核苷酸部分掺入引发的核酸序列的条件下,使来源于获自对象的生物样品的引发的核酸序列与聚合酶和一个或多个核苷酸部分接触,其中对象患有或疑似患有由本文公开的病原体引起的疾病或病症;以及(b)检测所述结合复合物以鉴定所述引发的核酸序列中的所述核苷酸。在一些实施方案中,病原体是严重呼吸综合征2(SARS-CoV-2)病毒或其变体。
在一些实施方案中,诊断对象包括诊断患有由病原体感染引起的疾病或病症的对象。在一些实施方案中,疾病或病症由2019冠状病毒病(COVID-19)引起。在一些实施方案中,诊断包括诊断疾病的严重性,例如通过定量生物样品中病原体的相对量或持续性。在一些实施方案中,感染阶段可通过本文描述的系统的方法预测。
病原体追踪
本文描述的方法、系统和试剂盒可用于检测新的病原体感染和/或至少部分基于本文公开的病原体的核酸序列的鉴定使感染的进一步传播最小化。迫切而未满足的需求是追踪病原体感染的传播,特别是那些未检测到传播的病原体,例如SARS-CoV-2病毒。SARS-CoV-2感染的每个阶段的持续时间和严重程度至少部分取决于感染被控制得多快,考虑到大量感染SARS-CoV-2的人没有表现出症状,这是特别具有挑战性的。
在一些实施方案中,本文描述的方法、系统和试剂盒可用于监测地理空间内由本文公开的病原体(例如,SARS-CoV-2)引起的感染的出现或传播。在一些实施方案中,地理空间包括村庄或城镇。在一些实施方案中,地理空间包括农村或城市区域。在一些实施方案中,地理空间包括城市、国家、州或国家。
在一些实施方案中,本文描述的方法包括:(a)提供从多个对象获得的多个生物样品;(b)测序来源于多个生物样品的遗传信息;(c)从遗传信息鉴定来源于病原体的核酸序列;以及(d)将核酸序列的存在与病原体引起的感染的出现或传播相关联。
在一些实施方案中,多个生物样品获自本文描述的多个对象。在一些实施方案中,多个对象是哺乳动物,例如小鼠、大鼠、豚鼠、兔、非人灵长类动物或农场动物。在一些实施方案中,多个对象是人。在一些实施方案中,多个对象表现出与本文公开的疾病或病症相关的症状(例如,发热、寒战、咳嗽、呼吸短促或呼吸困难、疲劳、胸部持续疼痛或压力、不能醒来或保持清醒;皮肤、嘴唇或甲床发白、发灰或发青;肌肉或身体疼痛、头痛、味觉或嗅觉丧失、喉咙痛、充血或流涕、恶心、呕吐或腹泻、瘀点或其任何组合)。在一些实施方案中,对象至少10岁。在一些实施方案中,对象至少55岁。在一些实施方案中,对象为0-10、11-19、20-39、40-59、60-75或76-100岁。在一些实施方案中,对象具有影响本文描述的疾病预后的前提条件。在一些实施方案中,前提条件包括肥胖症、糖尿病、凝血障碍、并发呼吸病症(例如,支气管炎或肺炎)、癌症、免疫缺陷障碍或病症(包括治疗性或医学诱导的免疫缺陷,例如在移植或癌症疗法之后),或其任何组合。
在一些实施方案中,生物样品包括血液、血清、血浆、汗液、毛发、眼泪、尿液、粪便、粘液(包括鼻、肺、胃或泌尿生殖粘液)、脑脊液、淋巴液、唾液或本文公开的任何其他生物样品。在一些实施方案中,生物样品直接或间接从对象获得。
在一些实施方案中,(d)中的关联包括将对象引导至自我隔离的或联系的医学专业人员,例如医师。如果该方法显示阳性测试结果,医学专业人员可以进一步进行PCR测试以确认病原体的感染原因。如果对象没有本文公开的症状,则阴性测试使对象极不可能被感染。然而,对象需要继续遵循标准预防策略。
在一些实施方案中,检测病原体感染并使感染的进一步传播最小化包括诊断患有由病原体感染引起的疾病或病症的对象。在一些实施方案中,疾病或病症由2019冠状病毒病(COVID-19)引起。在一些实施方案中,检测病原体感染和最小化感染的进一步传播包括诊断疾病的严重性,例如通过定量生物样品中病原体的相对量或持续性。在一些实施方案中,感染阶段可通过本文描述的系统的方法预测。
编号的实施方案
实施方案1.一种用于检测多个样品中的一个或多个样品中靶核酸序列的存在的方法,该方法包括:a)在促进互补序列杂交的条件下,将包括从多个样品中的样品提取的核酸分子的溶液与线性核酸探针分子一起孵育,其中:i)线性核酸探针分子包括与靶核酸序列的第一区域互补的靶特异性5’区域、扩增引物结合区域、探针条形码序列和与靶核酸序列的第二区域互补的靶特异性3’区域;ii)探针条形码序列对于每对靶特异性5’区域和靶特异性3’区域是独特的;以及iii)靶核酸序列的第一区域和靶核酸序列的第二区域是靶核酸分子中的连续序列;b)使溶液经受足以进行连接反应的条件,以从杂交的线性核酸探针分子产生环状核酸探针分子;c)使溶液经受足以使用扩增引物扩增环状线性核酸探针分子的条件,该扩增引物与扩增引物结合区域互补并且包括对于多个样品中的样品是独特的样品条形码,从而产生针对样品的扩增产物;d)合并针对多个样品中的每个样品的扩增产物或其衍生物;以及e)检测合并的扩增产物或其衍生物中一个或多个样品条形码序列的存在,从而检测多个样品中的一个或多个样品中靶核酸的存在。
实施方案2.一种用于检测多个样品中的一个或多个样品中靶核酸序列的存在的方法,该方法包括:a)在促进互补序列杂交的条件下,将包括从多个样品中的样品提取的核酸分子的溶液与线性核酸探针分子一起孵育,其中:i)线性核酸探针分子包括与靶核酸序列的第一区域互补的靶特异性5’区域、扩增引物结合区域、样品条形码序列、探针条形码序列和与靶核酸序列的第二区域互补的靶特异性3’区域;ii)样品条形码序列对于多个样品中的每个样品是独特的;iii)探针条形码序列对于每对靶特异性5’区域和靶特异性3’区域是独特的;以及iv)靶核酸序列的第一区域和靶核酸序列的第二区域是靶核酸分子中的连续序列;b)使溶液经受足以进行连接反应的条件,以由杂交产生环状核酸探针分子;c)使溶液经受足以使用与扩增引物结合区域互补的扩增引物扩增环状线性核酸探针分子的条件,从而产生针对样品的扩增产物;d)合并针对多个样品中的每个样品的扩增产物或其衍生物;以及e)检测合并的扩增产物或其衍生物中一个或多个样品条形码序列的存在,从而检测多个样品中的一个或多个样品中靶核酸的存在。
实施方案3.根据实施方案1或实施方案2的方法,其中(e)中的检测包括测序。实施方案4.根据实施方案1至3中任一项的方法,其中将两种或更多种不同的线性核酸探针分子与(a)中的靶核酸分子一起孵育,并且两种或更多种不同的线性核酸探针中的每一种包括不同对的靶特异性5’区域和靶特异性3’区域。实施方案5.根据实施方案1至4中任一项的方法,进一步包括确定合并的扩增产物或其衍生物中每个独特样品条形码的一个或多个独特探针条形码的拷贝数,从而确定多个样品中的每个样品中存在的靶核酸分子数。实施方案6.根据实施方案1至5中任一项的方法,进一步包括在(b)中的连接之后,用核酸外切酶消化从样品中提取的靶核酸分子。实施方案7.根据实施方案1至6中任一项的方法,其中靶核酸分子包括RNA分子。实施方案8.根据实施方案1至7中任一项的方法,其中靶核酸分子包括病毒核酸分子。实施方案9.根据实施方案1至8中任一项的方法,其中靶核酸分子包括病毒RNA分子。实施方案10.根据实施方案9的方法,其中病毒RNA分子包括Covid-19 RNA分子。实施方案11.根据实施方案9或实施方案10的方法,其中一个或多个线性核酸探针分子的靶特异性5’区域和靶特异性3’区域包括与Covid-19 S基因或其片段、Covid-19 Orflab基因或其片段、Covid-19 N基因或其片段或其任何组合互补的序列。实施方案12.根据实施方案9或实施方案10的方法,其中一个或多个线性核酸探针分子的靶特异性5’区域和靶特异性3’区域包括与Ca-Y132H序列互补的序列。实施方案13.根据实施方案1至12中任一项的方法,其中多个样品包括鼻咽拭子样品、痰样品、支气管肺泡灌洗液样品、血液样品、尿液样品、粪便样品或其任何组合。实施方案14.根据实施方案1至13中任一项的方法,其中一个或多个线性核酸探针分子的靶特异性5’区域和靶特异性3’区域包括分子倒置探针,并且在(b)中进行的连接反应进一步包括缺口填补步骤。实施方案15.根据实施方案1至14中任一项的方法,其中样品条形码序列的长度在约10至约12个核苷酸的范围内。实施方案16.根据实施方案1至15中任一项的方法,其中探针条形码序列的长度在约6至约10个核苷酸的范围内。实施方案17.根据实施方案1至16中任一项的方法,其中样品条形码序列和探针条形码序列的总长度一共在约16至约22个核苷酸的范围内。实施方案18.根据实施方案1至17中任一项的方法,其中选择条形码序列的长度来维持至少2的汉明距离,以提供测序错误的校正。实施方案19.根据实施方案1至18中任一项的方法,其中选择条形码序列的长度来维持至少5的汉明距离,从而使得能够检测和校正多达2个测序错误。实施方案20.根据实施方案1至19中任一项的方法,其中选择条形码序列的长度来维持至少7的汉明距离,从而使得能够检测和校正多达3个测序错误。实施方案21.根据实施方案1至20中任一项的方法,其中使用滚环扩增(RCA)进行(c)中的扩增,以针对多个样品中的每个样品产生包括多个拷贝的环状核酸探针分子的多联体。实施方案22.根据实施方案21的方法,其中(e)中的检测包括测序,并且测序包括使多联体与测序流动池内表面结合的衔接子序列杂交,并将它们缩合成可单独寻址的纳米球序列。实施方案23.根据实施方案22的方法,其中测序流动池内表面结合的衔接子序列结合至包括至少一个亲水性聚合物层的低非特异性结合表面。实施方案24.根据实施方案23的方法,其中可单独寻址的纳米球序列以大于1,000个纳米球序列/mm2的表面密度栓系至低非特异性结合表面。实施方案25.根据实施方案24的方法,其中纳米球序列用荧光团标记。实施方案26.根据实施方案25的方法,其中荧光团是花菁染料-3(Cy3),并且当在非信号饱和条件下,同时表面浸入25mM ACES,pH 7.4缓冲液中,使用配备有20X物镜、NA=0.75、针对532nm光优化的二向色镜、针对花菁染料-3发射优化的带通滤波器和相机的倒置荧光显微镜获取荧光图像时,测序流动池内表面的荧光图像表现出大于20的对比度-噪声比(CNR)。实施方案27.根据实施方案3至26中任一项的方法,其中测序包括:i)用两个或更多个拷贝的测序引物和聚合酶引发栓系至测序流动池内表面的纳米球序列;ii)使引发的纳米球序列与包括两个或更多个拷贝的核苷酸部分的聚合物-核苷酸缀合物在促进互补核苷酸碱基杂交的条件下接触,以在聚合物-核苷酸缀合物与两个或更多个引发的纳米球序列之间,或在聚合物-核苷酸缀合物与单个引发的“纳米球”序列内的两个或更多个相同序列之间形成多价结合复合物;iii)检测测序流动池内表面上的多价结合复合物,从而确定纳米球序列的样品条形码序列或探针条形码序列内核苷酸的身份;以及iv)重复步骤(ii)至(iii),以确定纳米球序列的样品条形码和探针条形码序列。实施方案28.根据实施方案27的方法,其中聚合物-核苷酸缀合物的两个或更多个核苷酸部分在接触或检测步骤期间不掺入。实施方案29.根据实施方案1至28中任一项的方法,其中(e)中的检测包括对一共包括总共30个或更少碱基判定的样品条形码序列和探针条形码序列进行测序。实施方案30.根据实施方案1至29中任一项的方法,其中(e)中的检测包括对一共包括总共20个或更少碱基判定的样品条形码序列和探针条形码序列进行测序。实施方案31.根据实施方案1至30中任一项的方法,其中从样品中提取靶核酸分子、进行方法以及检测样品中靶核酸的存在所需的总时间少于4小时。实施方案32.根据实施方案1至31中任一项的方法,其中从样品中提取靶核酸分子、进行方法以及检测样品中靶核酸的存在所需的总时间少于3小时。实施方案33.根据实施方案1至32中任一项的方法,其中步骤(a)至(c)并行进行,并且多个样品包括每次实验运行至少96个样品。实施方案34.根据实施方案1至33中任一项的方法,其中步骤(a)至(c)并行进行,并且多个样品包括每次实验运行至少384个样品。实施方案35.根据实施方案1至34中任一项的方法,其中步骤(a)至(c)并行进行,并且多个样品包括每次实验运行至少1,536个样品。实施方案36.根据实施方案1至35中任一项的方法,其中独特的样品条形码数为至少1,000。实施方案37.根据实施方案1至36中任一项的方法,其中独特的样品条形码数为至少5,000。实施方案38.根据实施方案1至37中任一项的方法,其中独特的样品条形码数为至少10,000。
进一步的实施方案
1.一种用于检测样品中来源于严重急性呼吸综合征(SARS)-冠状病毒(CoV)的核酸序列的存在的方法,其包括:
(a)使所述核酸序列或其衍生物与包括远端和近端的核酸探针分子在足以使所述核酸探针分子的所述远端和所述核酸探针分子的所述近端偶联以与所述核酸序列偶联的条件下接触,从而形成环状核酸探针分子;以及
(b)鉴定所述环状核酸探针分子的核酸序列,从而检测所述样品中来源于所述SARS-CoV的所述核酸序列的存在。
2.根据实施方案1的方法,其中所述环状核酸探针在其核酸序列中包括缺口。
3.根据实施方案2的方法,进一步包括使所述核酸探针分子与聚合酶在足以进行延伸反应的条件下接触,从而用来源于所述SARS-CoV的所述核酸序列的一部分的拷贝填补所述缺口。
4.根据实施方案3的方法,其中(b)中鉴定的所述环状核酸探针分子的所述核酸序列包括来源于所述SARS-CoV的所述核酸序列的所述部分的所述拷贝。
5.根据实施方案3的方法,进一步包括在所述延伸反应后,使所述核酸探针分子与连接酶在足以将所述核酸探针分子的所述远端连接至所述核酸探针分子的所述近端的条件下接触。
6.根据实施方案2的方法,其中所述缺口的长度包括1至200个连续核苷酸。
7.根据实施方案1的方法,进一步包括使所述核酸探针分子与连接酶在足以将所述核酸探针分子的所述远端连接至所述核酸探针分子的所述近端的条件下接触,从而形成所述环状核酸探针分子。
8.根据实施方案1的方法,其中所述核酸探针分子在未杂交时是线性的。
9.根据实施方案1的方法,其中(b)中鉴定的所述环状核酸探针分子的所述核酸序列包括条形码序列,该条形码序列在被鉴定时独特地鉴定来源于所述SARS-CoV的所述核酸序列的所述存在。
10.根据实施方案1的方法,进一步包括:
(c)重复(a)至(b),以鉴定所述样品中多个所述环状核酸探针分子的多个所述核酸序列;以及
(d)对(c)中鉴定到所述多个所述核酸序列中的每个核酸序列的次数进行计数。
11.根据实施方案10的方法,进一步包括确定所述样品中来源于所述SARS-CoV的所述核酸序列的拷贝数,其中所述样品中来源于所述SARS-CoV的所述核酸序列的所述拷贝数与(d)中计数到每个核酸序列的所述次数成比例。
12.根据实施方案1的方法,进一步包括多路复用所述方法,包括:
(c)重复(a)至(b),以鉴定所述样品中多个所述环状核酸探针分子的多个核酸序列,其中所述多个所述环状核酸探针分子的第一子集不同于所述多个所述环状核酸分子的第二子集;以及
(d)对(c)中鉴定到所述第一子集的第一核酸序列和所述第二子集的第二核酸序列的次数进行计数。
13.根据实施方案12的方法,进一步包括确定所述样品中所述SARS-CoV的拷贝数,其中所述样品中所述SARS-CoV的所述拷贝数与(d)中计数到所述第一核酸序列或所述第二核酸序列的所述次数成比例。
14.根据实施方案12的方法,其中所述多个所述环状核酸探针分子的所述第一子集与所述多个所述环状核酸分子的所述第二子集的不同之处在于:
(i)所述第一子集包括与所述第二子集不同的条形码;
(ii)所述第一子集包括与所述第二子集不同的远端或近端;或
(iii)(i)和(ii)的组合。
15.根据实施方案1的方法,进一步包括检测所述样品中来源于除了所述SARS-CoV之外的病原体的第二核酸序列的存在,包括:
(c)使来源于所述病原体的所述样品中的所述第二核酸序列与第二核酸探针分子在足以使所述第二核酸序列与所述第二核酸探针分子偶联的条件下接触,从而形成第二环状核酸探针分子;以及
(d)鉴定所述第二环状核酸探针分子的核酸序列,从而检测所述样品中来源于所述病原体的所述第二核酸序列的存在。
16.根据实施方案1的方法,进一步包括检测第二样品中来源于所述SARS-CoV的第二核酸序列的存在,包括:
(c)使来源于所述SARS-CoV的所述第二样品中的所述第二核酸序列与第二核酸探针分子在足以使所述第二核酸序列与所述第二核酸探针分子偶联的条件下接触,从而形成第二环状核酸探针分子;以及
(d)鉴定所述第二环状核酸探针分子的核酸序列,从而检测所述第二样品中来源于所述SARS-CoV的所述第二核酸序列的所述存在。
17.根据实施方案16的方法,其中所述第二样品获自与所述样品不同的来源。
18.根据实施方案16的方法,进一步包括追踪所述SARS-CoV的病原体感染,包括将收集所述样品的位置或时间与收集所述第二样品的位置或时间进行比较。
19.根据权利要求1至18中任一项的方法,其中所述样品获自包括以
下项的来源:
(i)土壤;
(ii)污水;
(iii)生物组织;
(iv)食品;
(v)与(i)至(iv)中的一个或多个接触的物体表面;或
(vi)(i)至(v)的任何组合。
20.根据实施方案1至19中任一项的方法,其中所述SARS-CoV包括SARS-CoV-2或其变体。
21.根据实施方案20的方法,其中所述SARS-CoV-2或其变体由与SEQ ID NO:1具有至少约99%序列同一性的序列编码。
22.根据实施方案20的方法,其中所述SARS-CoV-2或其变体由包括SEQ ID NO:1-4中的任一个的序列编码。
23.一种用于核酸处理的系统:
核酸探针分子,其包括(i)包括与来源于严重急性呼吸综合征(SARS)-冠状病毒(CoV)的核酸序列的第一部分互补的第一核酸序列的近端,和(ii)包括与来源于SARS-CoV的所述核酸序列的第二部分互补的第二核酸序列的远端;以及
一个或多个计算机处理器,其单独地或共同地经编程以执行方法,包括:
(a)使所述核酸探针分子与来源于SARS-CoV的所述核酸序列在足以引起(i)所述核酸探针分子的所述近端与来源于SARS-CoV的所述核酸序列的所述第一部分偶联和(ii)所述核酸探针分子的所述远端与来源于SARS-CoV的所述核酸序列的所述第二部分偶联的条件下接触,从而形成环状核酸探针分子;
(b)鉴定所述环状核酸探针分子的核酸序列,从而检测来源于所述SARS-CoV的所述核酸序列的存在。
24.根据实施方案23的系统,进一步包括具有表面的基底,该表面包括与其偶联的聚合物层,其中所述核酸探针分子与所述聚合物层偶联。
25.根据实施方案24的系统,其中所述表面包括流动池的两个或更多个内表面。
26.根据实施方案24的系统,其中所述聚合物层包括亲水性聚合物。
27.根据实施方案26的系统,其中所述亲水性聚合物包括聚(乙二醇)(PEG)、聚(乙烯醇)(PVA)、聚(乙烯基吡啶)、聚(乙烯基吡咯烷酮)(PVP)、聚(丙烯酸)(PAA)、聚丙烯酰胺、聚(N-异丙基丙烯酰胺)(PNIPAM)、聚(甲基丙烯酸甲酯)(PMA)、聚(甲基丙烯酸2-羟乙基酯)(PHEMA)、聚(低聚(乙二醇)甲基醚甲基丙烯酸酯)(POEGMA)、聚谷氨酸(PGA)、聚赖氨酸、聚葡糖苷、链霉亲和素、葡聚糖或其任何组合。
28.根据实施方案23的系统,进一步包括连接酶或其催化活性片段,所述连接酶或其催化活性片段配置为连接所述核酸探针分子的所述近端和所述核酸探针分子的所述远端,以形成所述环状核酸探针分子。
29.根据实施方案23的系统,其中所述环状核酸探针分子在其核酸序列中包括缺口。
30.根据实施方案29的系统,进一步包括聚合酶,其配置为进行所述环状核酸探针分子的延伸反应,从而用来源于所述SARS-CoV的所述核酸序列的第三部分的拷贝填补所述缺口。
31.根据实施方案30的系统,其中(b)中鉴定的所述环状核酸探针分子的所述核酸序列包括来源于所述SARS-CoV的所述核酸序列的所述第三部分。
32.根据实施方案29的系统,其中所述缺口的长度包括1至200个连续核苷酸。
33.根据实施方案23的系统,其中所述核酸探针分子在未杂交时是线性的。
34.根据实施方案23的系统,其中(b)中鉴定的所述环状核酸探针分子的所述核酸序列包括条形码序列,该条形码序列在被鉴定时独特地鉴定来源于所述SARS-CoV的所述核酸序列的所述存在。
35.根据实施方案23的系统,其中所述方法进一步包括:
(c)重复(a)至(b),以鉴定所述样品中所述环状核酸探针分子的多个所述核酸序列;以及
(d)对(c)中鉴定到所述环状核酸探针分子的所述多个所述核酸序列中的每个核酸序列的次数进行计数。
36.根据实施方案35的系统,其中所述方法进一步包括确定所述样品中所述SARS-CoV的拷贝数,其中所述样品中所述SARS-CoV的所述拷贝数与(d)中计数到每个核酸序列的所述次数成比例。
37.根据实施方案23的系统,进一步包括多个所述环状核酸探针分子,其包括所述多个所述环状核酸探针分子的第一子集和所述多个所述环状核酸探针分子的第二子集,其中所述第一子集不同于所述第二子集。
38.根据实施方案37的系统,其中所述方法是多路复用方法,进一步包括:
(c)重复(a)至(b),以鉴定所述样品中多个所述环状核酸探针分子的多个核酸序列;以及
(d)对(c)中鉴定到所述第一子集的第一核酸序列和所述第二子集的第二核酸序列的次数进行计数。
39.根据实施方案38的系统,其中所述方法进一步包括确定所述样品中来源于所述SARS-CoV的所述核酸序列的拷贝数,其中所述样品中来源于所述SARS-CoV的所述核酸序列的所述拷贝数与(d)中计数到所述第一核酸序列或所述第二核酸序列的所述次数成比例。
40.根据实施方案38的系统,其中所述多个所述环状核酸探针分子的所述第一子集与所述多个所述环状核酸分子的所述第二子集的不同之处在于:
(i)所述第一子集包括与所述第二子集不同的条形码;
(ii)所述第一子集包括与所述第二子集不同的远端或近端;或
(iii)(i)和(ii)的组合。
41.根据实施方案23的系统,进一步包括第二核酸探针分子,其中所述第二核酸探针分子配置为与来源于除了所述SARS-CoV之外的病原体的核酸序列偶联。
42.根据实施方案41的系统,其中所述方法进一步包括检测所述样品中来源于除了所述SARS-CoV之外的病原体的所述核酸序列的存在,包括:
(c)使所述样品中的所述第二核酸序列与所述第二核酸探针分子在足以使所述第二核酸序列与所述第二核酸探针分子偶联的条件下接触,从而形成第二环状核酸探针分子;以及
(d)鉴定所述第二环状核酸探针分子的核酸序列,从而检测所述样品中来源于所述病原体的所述第二核酸序列的所述存在。
43.根据实施方案23的系统,其中所述方法进一步包括检测第二样品中来源于所述SARS-CoV的第二核酸序列的存在,包括:
(c)使来源于所述SARS-CoV的所述第二样品中的所述第二核酸序列与第二核酸探针分子在足以使所述第二核酸序列与所述第二核酸探针分子偶联的条件下接触,从而形成第二环状核酸探针分子;以及
(b)鉴定所述第二环状核酸探针分子的核酸序列,从而检测所述第二样品中来源于所述SARS-CoV的所述第二核酸序列的所述存在。
44.根据实施方案43的系统,其中所述第二样品获自与所述样品不同的来源。
45.根据实施方案43的系统,其中所述方法进一步包括追踪所述SARS-CoV的病原体感染,包括将收集所述样品的位置或时间与收集所述第二样品的位置或时间进行比较。
46.根据实施方案23至45中任一项的系统,其中所述样品获自包括以下项的来源:
(i)土壤;
(ii)污水;
(iii)生物组织;
(iv)食品;
(v)与(i)至(iv)中的一个或多个接触的物体表面;或
(vi)(i)至(v)的任何组合。
47.根据实施方案23至46中任一项的系统,其中所述SARS-CoV包括SARS-CoV-2或其变体。
48.根据实施方案47的系统,其中所述SARS-CoV-2或其变体由与SEQ ID NO:1具有至少约99%序列同一性的序列编码。
49.根据实施方案47的系统,其中所述SARS-CoV-2或其变体由包括SEQ ID NO:1-4中的任一个的序列编码。
定义
除非另有定义,本文使用的所有技术术语具有与本公开所属领域的普通技术人员通常理解的相同含义。
如在本说明书和所附权利要求中所使用的,单数形式“一个”、“一种”和“该”包括复数引用,除非上下文另外明确指出。本文中对“或”的任何引用旨在涵盖“和/或”,除非另有说明。
如本文所用,在系列的上下文中短语“中的至少一个”包括单独或在一些情况下与未列出的组分组合的列表,该列表包括系列的单个成员、系列的两个成员,直至并包括系列的所有成员。
如本文所用,术语“包含(comprising)”(以及“包含”的任何形式或变体,例如“包含(comprise)”和“包含(comprises)”)、“具有(having)”(以及“具有”的任何形式,例如“具有(have)”和“具有(has)”)、“包括(including)”(以及“包括”的任何形式,例如“包括(includes)”和“包括(include)”)或“含有(containing)”(以及“含有”的任何形式,例如“含有(contains)”和“含有(contain)”)是包括性的或开放式的,并且不排除附加的、未列举的添加物、组件、整数、元件或方法步骤。
如本文所用,术语“约”数字是指该数字加上或减去数字的10%。当在范围的上下文中使用时,术语“约”是指范围减去其最低值的10%并加上其最大值的10%。
如本文所用,“核酸”(也称为“多核苷酸”、“寡核苷酸”、核糖核酸(RNA)或脱氧核糖核酸(DNA))是通过共价核苷间键连接的两个或更多个核苷酸的线性聚合物,或其变体或功能片段。在核酸的天然存在的实例中,核苷间键是磷酸二酯键。然而,其他实例任选地包括其他核苷间键,例如硫代磷酸酯键,并且可包括或不包括磷酸酯基团。核酸包括双链和单链DNA、以及双链和单链RNA、DNA/RNA杂合体、肽-核酸(PNA)、PNA与DNA或RNA之间的杂合体,并且还可包括其他类型的核酸修饰。
如本文所用,“核苷酸”是指核苷酸、核苷或其类似物。核苷酸是指天然存在的和化学修饰的核苷酸,并且可包括但不限于核苷、核糖核苷酸、脱氧核糖核苷酸、蛋白质-核酸残基或衍生物。核苷酸的实例包括腺嘌呤、胸腺嘧啶、尿嘧啶、胞嘧啶、鸟嘌呤或其残基;脱氧腺嘌呤、脱氧胸腺嘧啶、脱氧尿嘧啶、脱氧胞嘧啶、脱氧鸟嘌呤或其残基;腺嘌呤PNA、胸腺嘧啶PNA、尿嘧啶PNA、胞嘧啶PNA、鸟嘌呤PNA或其残基或等同物、嘌呤或嘧啶碱基的N-或C-糖苷(例如,含有2-脱氧-D-核糖的脱氧核糖核苷或含有D-核糖的核糖核苷)。
如本文所用的术语“条形码”是指多核苷酸所包括的天然或合成的核酸序列,其允许明确鉴定多核苷酸和具有所述条形码序列的多核苷酸所包括的其他序列。理论上可能的不同条形码序列数可以直接取决于该条形码序列的长度;例如,如果可以使用具有随机组装的腺嘌呤、胸腺嘧啶、鸟苷和胞苷核苷酸的DNA条形码,则对于10个核苷酸的长度,理论上可能的条形码序列的最大数可以为1,048,576,对于15个核苷酸的长度,可以为1,073,741,824。
如本文所用,术语“等温”是指其中温度保持基本上恒定的条件。“基本上恒定”的温度可在一段时间内偏离(例如,增加或减少)不多于0.25度、0.50度、0.75度或1.0度。
术语“退火”或“杂交”在本文中可互换使用,是指两个核酸分子结合在一起的能力。在一些情况下,“结合”是指两个核酸分子中每一个的碱基之间的沃森-克里克碱基配对(Watson-Crick base pairing)。
如本文所用,除非另有说明,术语“分离”和“纯化”在本文中可互换使用。
如本文所用,除非另有说明,术语“DNA杂交”和“核酸杂交”可互换使用,并且旨在涵盖任何类型的核酸杂交,例如,DNA杂交、RNA杂交。杂交可通过沃森-克里克碱基配对、Hoogsteen配对、G-环配对,或者两条或更多条核酸链内碱基的特异性或有序非共价相互作用的任何机制发生。“杂交”可包括核酸的单个分子、两个分子或多于两个分子的片段之间的相互作用。
如本文所用,“杂交特异性”是指核酸分子(例如,衔接子序列、引物序列或寡核苷酸序列)与靶核酸分子的区域正确杂交的能力的量度,该靶核酸分子具有与核酸分子完全互补的核酸序列。
如本文所用,术语“杂交严格性”是指经历通过标准沃森-克里克碱基配对互补的杂交(例如,杂交区域)反应的核酸序列的至少一部分内核苷酸碱基的百分比。在非限制性实例中,80%的杂交严格性意味着可形成稳定的双链体,其中80%的杂交区域经历沃森-克里克碱基配对。较高的杂交严格性意味着在给定的杂交反应中需要较高程度的沃森-克里克碱基配对以形成稳定的双链体。
如本文所用,“杂交灵敏度”是指样品(或靶)核酸分子的浓度范围,其中杂交以高特异性发生。在一些情况下,用本文描述的方法、组合物、系统和试剂盒实现了其中高特异性杂交的低至50皮摩尔浓度的样品核酸分子。在一些情况下,该范围为约1纳摩尔至约50皮摩尔浓度的样品核酸分子。
如本文所用,“杂交效率”是指总可用核酸分子(例如,衔接子序列、引物序列或寡核苷酸序列)的百分比的量度,该核酸分子与具有与核酸分子完全互补的核酸序列的靶核酸分子的区域杂交。
如本文所用,“互补”是指配体分子与其受体的相互作用表面的拓扑相容性或匹配在一起。因此,受体及其配体可描述为互补的,此外,接触表面特征彼此互补。
如本文所用,“支化聚合物”是指具有有助于缀合生物活性分子(例如核苷酸)的多个官能团的聚合物,并且官能团可在聚合物的侧链上或直接附接到聚合物的中心核或中心主链。支化聚合物可具有线性主链,其中一个或多个官能团离开主链用于缀合。支化聚合物也可以是具有一个或多个侧链的聚合物,其中侧链具有用于缀合的位点。官能团的实例包括但不限于羟基、酯、胺、碳酸酯、缩醛、醛、醛水合物、烯基、丙烯酸酯、甲基丙烯酸酯、丙烯酰胺、活性砜、酰肼、硫醇、链烷酸、酰基卤、异氰酸酯、异硫氰酸酯、马来酰亚胺、乙烯基砜、二硫代吡啶、乙烯基吡啶、碘乙酰胺、环氧化物、乙二醛、二酮、甲磺酸盐、甲苯磺酸盐和三氟乙基磺酸酯(tresylate)。
如本文所用,“聚合酶”是指含有核苷酸结合部分并有助于在靶核酸和互补核苷酸之间形成结合复合物的酶。聚合酶可具有一种或多种活性,包括但不限于碱基类似物检测活性、DNA聚合活性、逆转录酶活性、DNA结合或掺入、链置换活性和核苷酸结合或掺入和识别。聚合酶可包括无催化活性的聚合酶、催化活性的聚合酶、逆转录酶和其他含有核苷酸结合或掺入部分的酶。
如本文所用,“持续时间”是指在靶核酸,聚合酶,缀合的或非缀合的核苷酸之间形成的结合复合物保持稳定而没有任何结合组分从结合复合物解离的时间长度。持续时间表示结合复合物的稳定性和结合相互作用的强度。可以通过观察结合复合物的开始或持续时间,例如通过观察来源于结合复合物的标记组分的信号来测量余辉时间。例如,标记的核苷酸或包括一个或多个核苷酸的标记的试剂可以存在于结合复合物中,从而允许在结合复合物的存留期间检测来源于标记的信号。标记的一个非限制性实例是荧光标记。
在一些实施方案中,本公开的方法和组合物包括标记,例如荧光标记或荧光团。在一些实施方案中,标记是荧光团。可用作荧光标记或荧光团的荧光部分包括但不限于荧光素及荧光素衍生物(例如羧基荧光素、四氯荧光素、六氯荧光素、羧基萘荧光素、异硫氰酸荧光素、NHS-荧光素、碘乙酰氨基荧光素、荧光素马来酰亚胺、SAMSA-荧光素、荧光素氨基硫脲、碳肼甲基硫代乙酰氨基荧光素)、罗丹明及罗丹明衍生物(例如TRITC、TMR、丽丝胺罗丹明、德克萨斯红(Texas Red)、罗丹明B、罗丹明6G、罗丹明10、NHS-罗丹明、TMR-碘乙酰胺、丽丝胺罗丹明B磺酰氯、丽丝胺罗丹明B磺酰肼、德克萨斯红磺酰氯、德克萨斯红酰肼)、香豆素及香豆素衍生物(例如AMCA、AMCA-NHS、AMCA-磺基-NHS、AMCA-HPDP、DCIA、AMCE-酰肼)、BODIPY及衍生物(例如BODIPY FL C3-SE、BODIPY 530/550 C3、BODIPY 530/550 C3-SE、BODIPY 530/550 C3酰肼、BODIPY 493/503 C3酰肼、BODIPY FL C3酰肼、BODIPY FL IA、BODIPY 530/551 IA、Br-BODIPY 493/503、瀑布蓝(Cascade Blue)及衍生物(例如瀑布蓝乙酰叠氮化物、瀑布蓝尸胺、瀑布蓝乙二胺、瀑布蓝酰肼)、荧光黄(Lucifer Yellow)及衍生物(例如荧光黄碘乙酰胺、荧光黄CH)、花菁及衍生物(例如吲哚鎓基花菁染料、苯并吲哚鎓基花菁染料、吡啶鎓基花菁染料、噻唑鎓基花菁染料、喹啉鎓基花菁染料、咪唑鎓基花菁染料、Cy3、Cy5)、镧系元素螯合物及衍生物(例如BCPDA、TBP、TMT、BHHCT、BCOT、铕螯合物、铽螯合物、Alexa Fluor染料、DyLight染料、Atto染料、LightCycler Red染料、CAL Flour染料)、JOE及其衍生物、俄勒冈绿(Oregon Green)染料、WellRED染料、IRD染料、藻红蛋白和藻胆色素染料、孔雀石绿、均二苯代乙烯、DEG染料、NR染料、近红外染料和其他例如Haugland,Molecular Probes Handbook,(Eugene,Oreg.)第6版;Lakowicz,Principles ofFluorescence Spectroscopy,第2版,Plenum Press New York(1999)或Hermanson,Bioconjugate Techniques,第2版中描述的那些,或其衍生物,或其任何组合。花菁染料可以以磺化或非磺化形式存在,并且包括由两个氮原子之间的聚甲炔桥分开的两个假吲哚、苯并吲哚鎓、吡啶鎓、噻唑鎓或喹啉鎓基团。市售花菁荧光团包括例如Cy3(其可包括1-[6-(2,5-二氧吡咯烷-1-基氧基)-6-氧代己基]-2-(3-{1-[6-(2,5-二氧吡咯烷-1-基氧基)-6-氧代己基]-3,3-二甲基-1,3-二氢-2H-吲哚-2-基亚基}丙-1-烯-1-基)-3,3-二甲基-3H-吲哚鎓或1-[6-(2,5-二氧吡咯烷-1-基氧基)-6-氧代己基]-2-(3-{1-[6-(2,5-二氧吡咯烷-1-基氧基)-6-氧代己基]-3,3-二甲基-5-磺基-1,3-二氢-2H-吲哚-2-亚基}丙-1-烯-1-基)-3,3-二甲基-3H-吲哚鎓-5-磺酸酯)、Cy5(其可包括1-(6-((2,5-二氧吡咯烷-1-基)氧基)-6-氧代己基)-2-((1E,3E)-5-((E)-1-(6-(2,5-二氧吡咯烷-1-基)氧基)-6-氧代己基)-3,3-二甲基-5-吲哚-2-亚基)戊-1,3-二烯-1-基)-3,3二甲基-3H-吲哚-1-鎓或1-(6-((2,5-二氧吡咯烷-1-基)氧基)-6-氧代己基)-2-((1E,3E)-5-((E)-1-(6-(2,5-二氧吡咯烷-1-基)氧基)-6-氧代己基)-3,3-二甲基-5-磺基吲哚-2-亚基)戊-1,3-二烯-1-基)-3,3-二甲基-3H-吲哚-1-鎓-5-磺酸酯)和Cy7(其可包括1-(5-羧基戊基)-2-[(1E,3E,5E,7Z)-7-(1-乙基-1,3-二氢-2H-吲哚-2-亚基)庚-1,3,5-三烯-1-基]-3H-吲哚鎓或1-(5-羧基戊基)-2-[(1E,3E,5E,7Z)-7-(1-乙基-5-磺基-1,3-二氢-2H-吲哚-2-亚基)庚-1,3,5-三烯-1-基]-3H-吲哚鎓-5-磺酸酯),其中“Cy”代表“花菁”,第一个数字表示两个假吲哚基团之间的碳原子数。Cy2是恶唑衍生物而非假吲哚,并且苯衍生的Cy3.5、Cy5.5和Cy7.5是该规则的例外。
如本文所用的“有机溶剂”是指能够溶解或分散其他物质的包括碳基或含碳物质的溶剂或溶剂体系。有机溶剂可以与水混溶或不混溶。
术语“支持体”包括其上可以固定试剂(例如核酸)的任何固体或半固体制品。可以通过任何方法将核酸固定在固体支持体上,包括但不限于物理吸附、通过离子或共价键形成,或其组合。固体支持体可包括聚合物、玻璃或金属材料。固体支持体的实例包括膜、平坦表面、微量滴定板、珠、滤光器、测试条、载玻片、盖玻片和试管,是指在其上合成、附着、连接或以其他方式固定寡聚物的任何固相材料。支持体可包括“树脂”、“相”、“表面”、“基底”、“涂层”或“支持体”。支持体可包括有机聚合物,例如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚乙烯氧基和聚丙烯酰胺,以及它们的共聚物和接枝物。支持体也可以是无机的,例如玻璃、二氧化硅、可控孔度玻璃(CPG)或反相二氧化硅。支持体的构型可以是珠、球、粒子、颗粒、凝胶或表面的形式。表面可以是平坦的、基本上平坦的或不平坦的。支持体可以是多孔的或非多孔的,并且可以具有溶胀或非溶胀特性。支持体可以成形为包括一个或多个孔、凹陷或其他容器、器皿、特征或位置。多个支持体可在不同位置处配置在阵列中。支持体可以是可寻址的(例如,用于试剂的机器人递送),或通过检测方法,包括通过激光照射和共焦或偏转光聚集进行扫描。扩增支持体(例如,珠)可置于另一支持体内或另一支持体上(例如,置于第二支持体的孔内)。
如本文所用,“可检测标记”是指有助于检测另一生物分子的任何分子。实例包括但不限于发色团、荧光团、量子点、上转换磷光体、发光或化学发光分子、放射性同位素、磁性纳米颗粒、质量标签等。在一些情况下,优选的标记可包括荧光团。
如本文所用,如果荧光来源于与表面退火或以其他方式栓系的荧光团,例如通过具有与表面上的寡核苷酸的相应片段反向互补的区域并与所述相应片段退火的核酸,则荧光是“特异性的”。该荧光与由未通过这种退火过程栓系于表面的荧光团产生的荧光形成对比,或者在一些情况下与表面的背景荧光形成对比。
如本文所用,术语“检测通道”是指光学系统内的光路(和/或其中的光学组件),该光学系统配置为将从样品产生的光信号递送至检测器。在一些情况下,检测通道可配置用于执行分光测量,例如,使用检测器(例如光电倍增管)来监测荧光信号或其他光信号。在一些情况下,“检测通道”可以是“成像通道”,即,光学系统内的光路(和/或其中的光学组件),该光学系统配置为捕获图像并将图像递送至图像传感器。
如本文所用,短语“成像模块”、“成像单元”、“成像系统”、“光学成像模块”、“光学成像单元”和“光学成像系统”可互换使用,并且可包括较大系统的组件或子系统,该较大系统还可包括例如流体学模块、温度控制模块、平移台、机器人流体分配和/或微孔板处理、处理器或计算机、仪器控制软件、数据分析和显示软件等。
如本文所用,术语“激发波长”是指用于激发荧光指示剂(例如,荧光团或染料分子)并产生荧光的光的波长。尽管激发波长通常指定为单个波长,例如,620nm,但其可以指以指定波长为中心的波长范围或激发滤波器带通。例如,在一些情况下,指定激发波长的光包括指定波长±2nm、±5nm、±10nm、±20nm、±40nm、±80nm或更大的光。在一些情况下,所用的激发波长可以与荧光指示剂的吸收峰最大值一致或不一致。
如本文所用,术语“发射波长”是指荧光指示剂(例如,荧光团或染料分子)在被合适波长的光激发后发射的光的波长。尽管发射波长通常指定为单个波长,例如,670nm,但本说明书可以指以指定波长为中心的波长范围或发射滤波器带通。在一些情况下,指定发射波长的光包括指定波长±2nm、±5nm、±10nm、±20nm、±40nm、±80nm或更大的光。在一些情况下,所用的发射波长可以与荧光指示剂的发射峰最大值一致或不一致。
实施例
提供这些实施例仅用于说明目的,而不是限制本文提供的权利要求的范围。
实施例1-亲水性基底
可以产生用于进行固相核酸扩增和测序化学的低NSB/低背景基底表面,其提供显著改善的核酸扩增,使得可以调节信号-背景比,以满足特定测序应用的需要。图11提供了来自确定绿色荧光染料与根据不同表面修饰方案处理的玻璃基底表面非特异性结合的相对水平的研究的图像数据的实例。图12提供了来自确定红色荧光染料与根据不同表面修饰方案处理的玻璃基底表面非特异性结合的相对水平的研究的图像数据的实例。图13提供了根据不同表面修饰方案处理的基底表面的寡核苷酸引物接枝数据的实例。
实施例2-用NHS酯-胺化学制备多层PEG表面的方法
在室温下,用30min的2M KOH处理来清洁载玻片,洗涤,然后使用氧等离子体活化表面硅烷醇基团。硅烷-PEG2K-胺(Nanocs,Inc.,New York,NY)在乙醇溶液中以0.5%的浓度施加。2小时涂覆反应后,用乙醇和水彻底洗涤载玻片。在室温下,将100uM的8臂PEG NHS(MW=10K,Creative PEGWorks,Inc.,Durham,NC)引入溶剂组合物中20分钟,该溶剂组合物可包括5%、10%、20%、30%、40%、50%、60%、70%、80%或90%有机溶剂和5%、10%、20%、30%、40%、50%、60%、70%、80%或90%低离子强度缓冲液。洗涤所得表面,并与20μM多臂PEG胺(MW=10K,Creative PEGWorks,Inc.,Durham,NC)反应2小时。然后使所得胺-PEG表面与不同浓度的多臂PEG-NHS和胺标记的寡核苷酸引物的混合物反应。可重复该过程,以在表面上产生另外的PEG层。
实施例3-改进的滚环多重置换扩增(改进的RCA-MDA)
RCA-MDA群落中的拷贝数由引物表面密度决定,其决定了初始多联体或置换的多联体与正向和反向引物杂交的频率和成功率。已证明,低结合表面上引物密度的增加在这些簇中产生了更高的扩增拷贝数(图14)。可以使用以下方法中的一种或组合来增加低结合表面上的拷贝数或特异性扩增并减少非特异性扩增:(i)可通过制剂改变来提高引物模板杂交的效率来增加特定拷贝数(图16),(ii)可通过增加低结合基底上的引物密度来增加特定拷贝数(图15和图14),(iii)可通过使用上述添加剂来减少引物二聚体的非特异性扩增或嵌合DNA产生,(iv)可使用热稳定酶结合如前所述的制剂改变来提高扩增孵育温度,以减少非特异性扩增,和(v)包括非自杂交引物序列的引物组合物可与添加剂或提高的扩增孵育温度组合使用,以减少非特异性引物二聚体扩增。
实施例4-在簇数据上计算CNR
图18-20提供了用于计算核酸扩增方法和本文描述的低结合支持体的不同组合的CNR的原始图像数据和强度数据直方图的实例。在这些实例中的每一个中,上面的直方图是背景像素强度直方图,下面的直方图是前景斑点强度直方图,并且还包括原始图像的一部分。
这些实验中的每一个的表面密度估计为约100K引物/μm2。使用以下方法估计引物表面密度:(i)使用GE Typhoon(GE Healthcare Lifesciences,Pittsburgh,PA)以及含有已知浓度的Cy3-dCTP的已知面积(40mm2)、高度(0.5mm)和体积(200μl)的毛细管流动池制备荧光滴定曲线,(ii)使用常规杂交方案(37℃或室温(RT)下,3X盐水柠檬酸钠(SSC);为了完成,可以表征杂交条件),使接枝至低结合支持体的引物与Cy3标记的互补寡核苷酸杂交,使用用于产生校准曲线的相同GE Typhoon仪器测量表面上所得信号的荧光强度,(iii)并且基于所测量的表面信号与校准曲线的比较来计算每单位面积表面栓系的引物分子数。
然后使DNA文库序列与栓系的引物杂交。用于文库杂交步骤的杂交方案可根据表面性质而变化,但需要控制文库输入,以产生可分辨的DNA扩增群落。
对于该实施例,使用以下方案进行DNA扩增:(i)以约1K引物/um2的引物密度进行28个循环的桥式扩增,(ii)以>5K引物/um2的较高引物密度进行28个循环的桥式扩增,和(iii)以约2-4K引物/um2的引物密度进行90分钟的滚环扩增(RCA)。
扩增后,使扩增的DNA与互补“测序”引物杂交,并加入包括Cy3标记的dNTP的测序反应混合物(“第一碱基”测定),以确定每种相应方法的第一碱基CNR。在第一碱基掺入后,用缓冲液交换测序反应混合物,使用相同的GET Typhoon仪器进行成像,并在所得图像上计算CNR。
图17提供了本公开的低结合支持体的荧光图像和强度数据的实例,在该低结合支持体上使用28个循环的桥式扩增以约2K引物/um2的引物密度进行固相核酸扩增,以产生模板寡核苷酸序列的克隆扩增簇。在该实施例中,背景强度为592个计数(标准偏差为66.5个计数),前景强度为1047.3个计数,并且计算的CNR=(1047.3-592)/66.5=455.3/66.5=6.8。估计的非特异性噪声=(592-100)/(1047-100)=52%。
图18提供了本公开的低结合支持体的荧光图像和强度数据的第二实例,在该低结合支持体上使用28个循环的桥式扩增以>5K引物/um2的较高引物密度进行固相核酸扩增,以产生模板寡核苷酸序列的克隆扩增簇。在该实施例中,背景强度为680个计数(标准偏差为118.2个计数),前景强度为1773个计数,并且计算的CNR=(1773-680)/118.2=1093/118.2=9.2。估计的非特异性噪声=(680-100)/(1773-100)=35%。
图19提供了本公开的低结合支持体的荧光图像和强度数据的实例,在该低结合支持体上使用90分钟的滚环扩增(RCA)以约100K引物/um2的引物密度进行固相核酸扩增,以产生模板寡核苷酸序列的克隆扩增簇。在这些实施例中,背景强度为254个计数(标准偏差为22.7个计数),前景强度为6161个计数,计算的CNR=(6161-254)/22.7=5907/22.7=260。注意到通过使用低结合表面和扩增方案的这种组合实现了CNR的显著改善。估计的非特异性噪声=(254-100)/(6161-100)=3%。
实施例5-低非特异性结合表面上的DNA杂交
图20A和20B提供了使用所公开的杂交方法在低结合表面上实现的优化杂交的实例(图20A),与使用传统杂交方案在相同低结合表面上实现的结果(图20B)相比,杂交报告探针浓度降低并且杂交时间缩短。
图20A示出了根据本文描述的实施方案的低结合表面上的杂交反应。行提供了两种测试杂交条件:杂交条件1(“Hyb 1”)和杂交条件2(“Hyb 2”)。Hyb 1是指来自表2的杂交缓冲液组合物C10。Hyb 2是指来自表2的杂交缓冲液组合物D18。在60摄氏度下,使图20A中报告的浓度(10nM、1nM、250pM、100pM和50pM)的杂交报告探针(在5’端用CyTM3荧光团标记的互补寡核苷酸序列)在缓冲液组合物中杂交2分钟。
表2.用于测试靶核酸与表面结合核酸杂交的缓冲液组合物
Figure BDA0004151510670001211
/>
Figure BDA0004151510670001221
/>
Figure BDA0004151510670001231
图20B示出了根据具有标准杂交条件(“标准Hyb条件”)的标准杂交方案的低结合表面上的杂交反应。如图20A所示,2X-5X盐水-柠檬酸钠(SSC)的标准杂交缓冲液与上述相同的杂交报告探针以上述相同的浓度一起使用。标准杂交反应在90摄氏度下进行,并伴随缓慢冷却过程(2小时)以达到37摄氏度。
对于图20A和图20B中提供的每个杂交反应,每个杂交反应的顶行是测试(“T”),其是互补寡核苷酸(例如,CY3TM-5’-ACCCTGAAAGTACGTGCATTACATG-3’(SEQ ID NO:5)),并且每个杂交反应的底行是对照(“C”),其是非互补的(例如,CY3TM-5’-ATGTCTATTACGTCACACTATTATG-3’(SEQ ID NO:6))。
用于所有测试条件的表面是超低非特异性结合表面,其非特异性Cy3染料吸收水平对应于小于或等于约0.25个分子/μm2。在该实施例中,所用的低非特异性结合表面是用硅烷-PEG-5K-COOH(Nanocs Inc.)官能化的玻璃基底。在杂交反应完成后,用50mM Tris pH8.0;50mM NaCl洗涤孔。
在非信号饱和条件下,当样品浸入缓冲液(25mM ACES,pH 7.4缓冲液)中时,使用配备有100X TIRF物镜、NA=1.4(Olympus)、针对532nm光优化的二向色镜(Semrock,Di03-R532-t1-25x36)、针对Cy3发射优化的带通滤波器(Semrock,FF01-562/40-25)和相机(sCMOS,Andor Zyla)的倒置显微镜(Olympus IX83)获取图像1s(Laser Quantum,Gem 532,在样品处<1W/cm2)。如上所述收集图像,结果示于图20A(优化)和图20B(标准)中。
与阴性对照相比,在Hyb 1和Hyb 2杂交反应中均观察到250皮摩尔(pM)反应的显著信号(图20A)。相反,与阴性对照相比,在标准Hyb条件下未观察到250pM反应的信号。对于较低输入浓度(例如,100pM、50pM)的杂交报告探针观察到相同的结果。与相同低非特异性结合基底上的标准杂交方法和试剂(图20B)相比,图20A示出了在测试的低非特异性结合表面上特异性DNA捕获所需的输入DNA(标记的寡核苷酸)减少至低于200分之一,杂交时间减少至50分之一,杂交温度降低一半。
实施例6-三元复合物的检测
对使用具有PEG聚合物-核苷酸缀合物的多价结合组合物的结合反应进行分析,以检测三元结合复合物的可能形成,图21示出了各个步骤的荧光图像。在图21A中,在含有20nM Klenow聚合酶和2.5mM Sr+2的暴露缓冲液中将DNA滚环应用(RCA)模板(G和A第一碱基)暴露于500nM经碱基标记的核苷酸(A-Cy3和G-Cy5)后的红色和绿色荧光图像。使用不同比例的4臂PEG-胺(4ArmPEG-NH)、生物素-PEG-胺(生物素-PEG-NH)和核苷酸(Nuc)来制备多价PEG-基底组合物,如下:样品PB1和PB5,4ArmPEG-NH∶生物素-PEG-NH∶Nuc=0.25∶1∶0.5;样品PB2,4ArmPEG-NH∶生物素-PEG-NH∶Nuc=0.125∶0.5∶0.25;样品PB3,4ArmPEG-NH∶生物素-PEG-NH∶Nuc=0.25∶1∶0.5。在用与暴露缓冲液组成相同但不含核苷酸或聚合酶的成像缓冲液洗涤后,收集图像。
缩放对比度,以使最微弱信号的可视化最大化,但在用成像缓冲液洗涤后无信号持续(图21A,小图)。在图21B-图21E中,显示如上所述在暴露缓冲液中混合并在成像缓冲液中成像后的500nM的多价PEG-核苷酸(碱基标记的)配体的荧光图像(图21B:PB1;图21C:PB2;图21D:PB3;图21E:PB5)。图21F:显示如上所述在暴露缓冲液中混合并在成像缓冲液中成像后的2.5uM的多价PEG-核苷酸(碱基标记的)配体PB5的荧光图像。图21G-22I:显示通过将多价配体暴露于klenow聚合酶的非活性突变体(图21G:D882;图21H:D882E;图21I:HD882A,和图21J示出的野生型Klenow(对照)酶)来进一步碱基辨别的荧光图像。
实施例7-使用三元复合物测序靶核酸分子
使用RCA方法在低结合基底上扩增四种已知的模板。将连续循环暴露于含有20nMKlenow聚合酶和2.5mM Sr+2的暴露缓冲液中,并用成像缓冲液洗涤和成像。成像后,用洗涤缓冲液(EDTA和高盐)洗涤基底,并添加封端核苷酸以继续到下一个碱基。该循环重复5个循环。使用标准成像处理和斑点检测来检测斑点,并使用绿色和红色双色方案(G-Cy3和A-Cy5)判定序列,以鉴定循环的模板。
实施例8-用亲水性聚合物涂层涂覆流动池表面
通过用KOH洗涤制备的玻璃通道,随后用乙醇冲洗,然后在65℃下硅烷化30分钟来涂覆玻璃流动池设备。用EDC-NHS将流体通道表面活化30min,随后通过将活化的表面与5μm引物一起孵育20min来接枝寡核苷酸引物,然后用30μm的氨基封端聚乙二醇(PEG-NH2)进行钝化。
实施例9-毛细管流动池中核酸簇的成像
在毛细管内建立核酸簇,并进行荧光成像。具有毛细管的流动设备用于测试。所得的簇图像的实例呈现在图22中,其证明了通过在如本文公开的毛细管流动池设备的腔内扩增形成的核酸簇可以可靠地形成和可视化。
预示性实施例-多路复用COVID-19测定
亲水性表面:在室温下,用30min的2M KOH处理来清洁载玻片,洗涤,然后用氧等离子体活化表面硅烷醇基团。硅烷-PEG2K-胺(Nanocs,Inc.,New York,NY)在乙醇溶液中以0.5%的浓度施加。2h涂覆反应后,用乙醇和水彻底洗涤载玻片。在室温下,将100μM的8臂PEG NHS(MW=10K,Creative PEGWorks,Inc.,Durham,NC)引入溶剂组合物中20min,该溶剂组合物包括5%、10%、20%、30%、40%、50%、60%、70%、80%或90%有机溶剂和5%、10%、20%、30%、40%、50%、60%、70%、80%或90%低离子强度缓冲液。洗涤所得表面,并与20μM多臂PEG胺(MW=10K,Creative PEGWorks,Inc.,Durham,NC)反应2h。然后使所得的胺-PEG表面与不同浓度的多臂PEG-NHS和胺标记的寡核苷酸引物的混合物反应。重复该过程,以在表面上产生另外的PEG层。在该实施例中,如根据本文描述的实施例4所测量的,亲水性表面表现出至少约10的对比度-噪声比。
探针设计:四个锁式探针设计为靶向SARS-CoV-2(COVID-19)病毒基因组的保守区域(2个探针)、加标对照(1个探针)和阴性对照(1个探针),该阴性对照设计为与病毒基因组具有一些互补性,但在3’端含有错配以防止连接。锁式探针经由5’和3’端与靶序列杂交。在探针的非互补区域内,存在RCA引发位点、探针条形码和便于环化所需的任何额外的随机序列。
靶序列来源于美国疾病控制和预防中心(CDC)推荐的COVID-19基因座,并通过COVID-19基因组的保守区域和可变区域的生物信息学评估。另外的阳性(加标)对照和阴性对照也设计并包括在测定中。可以实施多个条形码化锁式探针来靶向多个COVID-19基因座,并且可以通过相关探针条形码来鉴定,从而允许评估给定样品中COVID-19靶的存在/不存在,并且还提供关于特定菌株的信息。例如,条形码化锁式探针可以设计为靶向用于高水平存在/不存在确定的保守区域和评估特定COVID-19菌株存在或不存在的可变区域。创建条形码化锁式探针池的灵活性,与通过使用用于读出的测序平台可获得的大数据输出相结合,允许靶探针板不断更新以包括新的突变菌株并且不断提高测定精确性。
使用相似的靶序列作为对照,测试探针与靶杂交的特异性。检测极限(LoD)也通过监测存在的靶序列拷贝数减少的连接来确定。对于测定开发的这个阶段,使用简单的技术(例如凝胶电泳)来评估环化,并鉴定该测定最合适的寡核苷酸探针组。重要的是要注意,测定还可以配置为分子倒置探针(MIP)测定,其中用缺口填补连接事件代替连接事件,为可直接在所公开的测序平台上执行的高度多路复用基因分型测定铺平了道路。
测定工作流:环状探针是所公开方法的核心处基于测序的读出的输入。探针与单个样品中的病毒RNA序列杂交(如果存在)并连接后,任何剩余的未反应探针分子或靶核酸可任选地使用核酸外切酶消化,并从系统中去除。在RCA步骤期间,将样品索引添加至孔中的所有探针(每孔一个样品)。使用样品索引引物对环状锁式探针进行RCA扩增,以产生与测序平台完全兼容的多联体。在该实施例中,将多联体装载在测序流动池上,并通过与如上所述的共价栓系至内表面的寡核苷酸引物杂交而固定至流动池的内表面。在其他实施例中,通过与共价附着于流动池内表面的寡核苷酸引物杂交,将靶核酸(在RCA扩增之前)固定至流动池的内表面,线性探针与靶核酸退火,随后连接,并任选地消化流通池内表面上未反应的探针或靶核酸。在这种实施例中,在流动池的内表面上进行探针环化,随后扩增(例如,RCA),以形成适于测序的多联体。在任一情况下,几个测序循环提供了探针条形码解码以及样品索引解复用所需的序列数据。使用二次分析来将属于特定样品的所有探针条形码序列(包括阳性和阴性对照的那些)分箱,并且针对给定样品计数的病毒特异性探针条形码以及阳性和阴性对照的那些条形码的相对数提供了对样品病毒载量存在/不存在和滴度的确定。
该COVID-19锁式探针+RCA测定系统使用测序用于读出的优点包括但不限于(i)条形码化锁式探针分子直接靶向病毒RNA而不需要转录成cDNA;(ii)测定是等温且快速的;(iii)可重复多轮RCA、单体化和RCA,以提高测定灵敏度(其他方法也可用于提高该测定的灵敏度);以及(iv)可以在RCA步骤期间使用包括样品特异性条形码的引物引入样品索引序列(尽管在一些情况下,每个锁式探针分子也可包括样品条形码,但实际上更通用的是在RCA期间引入样品索引)。
样品索引:评估用于产生多联体的几种样品索引方法对工作流的影响、赋予测定设计另外的灵活性的能力以及与测序平台的兼容性。也在进行RCA反应条件的优化,以使测定灵敏度最大化。可以通过用含有荧光团的靶寡核苷酸或使用染料简单染色来定性地评估多联体的形成。产生纳米球的多联体缩合与现有测序平台完全兼容,因此,在测序流动池内捕获后,可以使用现有成像系统执行RCA和多联体形成的定量评估。进行测序以解码基因座特异性ID(例如,探针条形码),并解复用样品索引。根据所采用的索引策略,可能需要两个分开的引发事件。因为探针条形码和样品索引设计为提供条形码序列之间的高度差异,所以即使在测序错误率提高的情况下,探针解码和样品解复用也是准确的,从而允许关注解码和解复用的速度,同时仍保持条形码分类的准确度。由这些测序运行产生的数据最初进行定性地评估,但最终将成为用于下文描述的数据分析流水线的数据输入。
测序:将由样品索引RCA产生的多联体固定至测序流动池的内表面,在那里它们缩合成可单独寻址的纳米球。每个纳米球含有多个拷贝的样品索引和探针ID,这两个都可以用约15个测序循环快速测序,使得解复用和基因座ID确定非常快(<2h)。由于纳米球数与病毒拷贝数成比例,因此计数索引序列和探针ID导致精确评估滴度,因为其解决了每个测定数万或甚至数十万个读段。在该实施例中,测序反应包括引发多联体,使引发的多联体(用作模板)与标记的核苷酸部分在聚合酶存在下,在足以引起标记的核苷酸部分和多联体之间的核苷酸结合反应的条件下接触(例如,与聚合物核缀合以形成聚合物-核苷酸缀合物),使得标记的核苷酸部分不掺入与多联体退火的生长的引物中。当标记的核苷酸部分和待测序的下一个核苷酸在引发的多联体模板碱基对中时,在标记的核苷酸部分和引发的多联体之间形成结合复合物。在一些情况下,结合复合物是本文描述的三元复合物,其包括标记的核苷酸部分、引发的多联体和聚合酶。检测引发的多联体模板中每个后续核苷酸的结合复合物。在例如图6所示的聚合物-核苷酸缀合物的情况下,多个引发的多联体可与单个聚合物-核苷酸缀合物结合,以形成多价结合复合物。
在所公开的设计用于基因组应用的平台中,可用的数据输出非常大,并且原则上,还可以容纳非常大量的样品。然而,理想的配置是用于介质多路复用(每次运行384至1536个样品),因为这有助于更好地去中心化和更接近的样品批量大小。由于所需测序的量有限,预期运行在少于2h内完成,并且每个样品少于$10。此外,测试的去中心化与单个仪器的超过几百万个样品/年的通量相结合,将会允许部署基于云的数据分析基础设施,用于实时监测疫情演变。
探针条形码和样品索引鉴定:测序完成后,将测序的样品索引和探针条形码与一组已知的索引和探针条形码匹配。在大多数情况下,序列与预期序列中的一个完全匹配。当不是这种情况时,计算序列和已知条形码序列之间的汉明距离。如果序列在预期序列的足够小的汉明距离内,则指配为匹配。否则,丢弃该测序读段。为了质量控制,追踪所指配的读出占读段总量的分数,这产生许多定期追踪的质量度量。如果样品索引序列和探针条形码序列都匹配,则保留读段,用于后面的数据解释。
数据解释:对于每个样品,质量控制步骤验证阳性对照的探针条形码数在指定范围内,并且阴性对照的探针条形码数低于某一指定阈值。这些值通过对包括已知病毒RNA拷贝数的已知样品进行的受控实验根据经验定义。样品中的病毒拷贝数与病毒特异性探针和阳性对照的比相关。根据病毒特异性探针中的每一个进行病毒拷贝数的估计,然后如果两个估计值是相当的,则进行平均(否则认为测试失败)。为了评估定量测定的程度,使用不同浓度的加标对照。所公开的测序平台以成本有效的方式产生数亿个读段(或单个测定)。因此,通过增加流动池上读段的密度来调节LoD、病毒载量和准确度。阳性样品产生的计数数高于阳性对照和COVID特异性位点的阈值。计数数与原始样品中存在的RNA拷贝量成比例,较少的拷贝导致较低的计数数。阴性样品显示出阳性对照的计数。
通过进行试验测序运行来确定每个样品满足靶测定灵敏度所需的测序读段数。例如,对于在重复研究中鉴定到>95%真阳性,COVID-19的当前CDC标准为10个RNA拷贝/uL。进行研究以确定实际测定灵敏度、精确性、假阳性率、假阴性率和其他质量度量。通过与金标准方法(例如RT-PCR)比较进行初步测定验证。
数据汇总和疫情监测:参与的实验室可以选择自动地将匿名结果传送至集中的基于云的数据库中,该数据库可用于检测疫情进展和识别潜在的新热点。传送的数据被去身份化,并且基于一般位置和样品收集日期的汇总统计可公开访问。开发了允许研究者查询和可视化汇总统计的门户。图23示出了基于云的监测全球疫情的方法的示意图。虽然这种方法的优势在于去中心化测试的机会,但对于集中测试服务提供商也具有吸引力,可以立即获得非常大的样品处理能力,并且处理这些大量样品的自动化和后勤基础设施已经到位。
驱动该测定商业成功的关键属性是快速的周转时间(与当前PCR测定相当)和便于使用。该方法可能在每个样品的低成本、测定精确性、样品通量和设置成本的所有测定维度上提供空前水平的性能。预期的采样到回复时间少于3小时,所需的操作时间最少。工作流和测序平台性能的优化加速了该方法的测定和读出组件。需要调节测序平台的性能,因为对于现有的基因组学应用,在错误率非常低的情况下,测序速度是有价值的。对于其中读取预定义的探针条形码和样品索引序列的这种应用,错误率较不重要,并且高于现有系统的那些速率的测序速度可能是可接受的。
虽然本文已经示出和描述了本发明的优选实施方案,但是对于本领域的技术人员显而易见的是,这些实施方案仅作为示例提供。在不脱离本发明的情况下,本领域的技术人员将想到许多变化、改变和替换。应理解,在实施本发明时,可以用本文描述的本发明实施方案的各种替代方案。以下权利要求旨在限定本发明的范围,并且这些权利要求及其等同物的范围内的方法和结构将由此被涵盖。
序列表
<110> 元素生物科学公司
<120> 多路复用COVID-19锁式测定
<130> 52933-732.601
<140>
<141>
<150> 63/059,723
<151> 2020-07-31
<160> 9
<170> PatentIn版本 3.5
<210> 1
<211> 29903
<212> DNA
<213> 严重急性呼吸综合征冠状病毒2
<400> 1
attaaaggtt tataccttcc caggtaacaa accaaccaac tttcgatctc ttgtagatct 60
gttctctaaa cgaactttaa aatctgtgtg gctgtcactc ggctgcatgc ttagtgcact 120
cacgcagtat aattaataac taattactgt cgttgacagg acacgagtaa ctcgtctatc 180
ttctgcaggc tgcttacggt ttcgtccgtg ttgcagccga tcatcagcac atctaggttt 240
cgtccgggtg tgaccgaaag gtaagatgga gagccttgtc cctggtttca acgagaaaac 300
acacgtccaa ctcagtttgc ctgttttaca ggttcgcgac gtgctcgtac gtggctttgg 360
agactccgtg gaggaggtct tatcagaggc acgtcaacat cttaaagatg gcacttgtgg 420
cttagtagaa gttgaaaaag gcgttttgcc tcaacttgaa cagccctatg tgttcatcaa 480
acgttcggat gctcgaactg cacctcatgg tcatgttatg gttgagctgg tagcagaact 540
cgaaggcatt cagtacggtc gtagtggtga gacacttggt gtccttgtcc ctcatgtggg 600
cgaaatacca gtggcttacc gcaaggttct tcttcgtaag aacggtaata aaggagctgg 660
tggccatagt tacggcgccg atctaaagtc atttgactta ggcgacgagc ttggcactga 720
tccttatgaa gattttcaag aaaactggaa cactaaacat agcagtggtg ttacccgtga 780
actcatgcgt gagcttaacg gaggggcata cactcgctat gtcgataaca acttctgtgg 840
ccctgatggc taccctcttg agtgcattaa agaccttcta gcacgtgctg gtaaagcttc 900
atgcactttg tccgaacaac tggactttat tgacactaag aggggtgtat actgctgccg 960
tgaacatgag catgaaattg cttggtacac ggaacgttct gaaaagagct atgaattgca 1020
gacacctttt gaaattaaat tggcaaagaa atttgacacc ttcaatgggg aatgtccaaa 1080
ttttgtattt cccttaaatt ccataatcaa gactattcaa ccaagggttg aaaagaaaaa 1140
gcttgatggc tttatgggta gaattcgatc tgtctatcca gttgcgtcac caaatgaatg 1200
caaccaaatg tgcctttcaa ctctcatgaa gtgtgatcat tgtggtgaaa cttcatggca 1260
gacgggcgat tttgttaaag ccacttgcga attttgtggc actgagaatt tgactaaaga 1320
aggtgccact acttgtggtt acttacccca aaatgctgtt gttaaaattt attgtccagc 1380
atgtcacaat tcagaagtag gacctgagca tagtcttgcc gaataccata atgaatctgg 1440
cttgaaaacc attcttcgta agggtggtcg cactattgcc tttggaggct gtgtgttctc 1500
ttatgttggt tgccataaca agtgtgccta ttgggttcca cgtgctagcg ctaacatagg 1560
ttgtaaccat acaggtgttg ttggagaagg ttccgaaggt cttaatgaca accttcttga 1620
aatactccaa aaagagaaag tcaacatcaa tattgttggt gactttaaac ttaatgaaga 1680
gatcgccatt attttggcat ctttttctgc ttccacaagt gcttttgtgg aaactgtgaa 1740
aggtttggat tataaagcat tcaaacaaat tgttgaatcc tgtggtaatt ttaaagttac 1800
aaaaggaaaa gctaaaaaag gtgcctggaa tattggtgaa cagaaatcaa tactgagtcc 1860
tctttatgca tttgcatcag aggctgctcg tgttgtacga tcaattttct cccgcactct 1920
tgaaactgct caaaattctg tgcgtgtttt acagaaggcc gctataacaa tactagatgg 1980
aatttcacag tattcactga gactcattga tgctatgatg ttcacatctg atttggctac 2040
taacaatcta gttgtaatgg cctacattac aggtggtgtt gttcagttga cttcgcagtg 2100
gctaactaac atctttggca ctgtttatga aaaactcaaa cccgtccttg attggcttga 2160
agagaagttt aaggaaggtg tagagtttct tagagacggt tgggaaattg ttaaatttat 2220
ctcaacctgt gcttgtgaaa ttgtcggtgg acaaattgtc acctgtgcaa aggaaattaa 2280
ggagagtgtt cagacattct ttaagcttgt aaataaattt ttggctttgt gtgctgactc 2340
tatcattatt ggtggagcta aacttaaagc cttgaattta ggtgaaacat ttgtcacgca 2400
ctcaaaggga ttgtacagaa agtgtgttaa atccagagaa gaaactggcc tactcatgcc 2460
tctaaaagcc ccaaaagaaa ttatcttctt agagggagaa acacttccca cagaagtgtt 2520
aacagaggaa gttgtcttga aaactggtga tttacaacca ttagaacaac ctactagtga 2580
agctgttgaa gctccattgg ttggtacacc agtttgtatt aacgggctta tgttgctcga 2640
aatcaaagac acagaaaagt actgtgccct tgcacctaat atgatggtaa caaacaatac 2700
cttcacactc aaaggcggtg caccaacaaa ggttactttt ggtgatgaca ctgtgataga 2760
agtgcaaggt tacaagagtg tgaatatcac ttttgaactt gatgaaagga ttgataaagt 2820
acttaatgag aagtgctctg cctatacagt tgaactcggt acagaagtaa atgagttcgc 2880
ctgtgttgtg gcagatgctg tcataaaaac tttgcaacca gtatctgaat tacttacacc 2940
actgggcatt gatttagatg agtggagtat ggctacatac tacttatttg atgagtctgg 3000
tgagtttaaa ttggcttcac atatgtattg ttctttctac cctccagatg aggatgaaga 3060
agaaggtgat tgtgaagaag aagagtttga gccatcaact caatatgagt atggtactga 3120
agatgattac caaggtaaac ctttggaatt tggtgccact tctgctgctc ttcaacctga 3180
agaagagcaa gaagaagatt ggttagatga tgatagtcaa caaactgttg gtcaacaaga 3240
cggcagtgag gacaatcaga caactactat tcaaacaatt gttgaggttc aacctcaatt 3300
agagatggaa cttacaccag ttgttcagac tattgaagtg aatagtttta gtggttattt 3360
aaaacttact gacaatgtat acattaaaaa tgcagacatt gtggaagaag ctaaaaaggt 3420
aaaaccaaca gtggttgtta atgcagccaa tgtttacctt aaacatggag gaggtgttgc 3480
aggagcctta aataaggcta ctaacaatgc catgcaagtt gaatctgatg attacatagc 3540
tactaatgga ccacttaaag tgggtggtag ttgtgtttta agcggacaca atcttgctaa 3600
acactgtctt catgttgtcg gcccaaatgt taacaaaggt gaagacattc aacttcttaa 3660
gagtgcttat gaaaatttta atcagcacga agttctactt gcaccattat tatcagctgg 3720
tatttttggt gctgacccta tacattcttt aagagtttgt gtagatactg ttcgcacaaa 3780
tgtctactta gctgtctttg ataaaaatct ctatgacaaa cttgtttcaa gctttttgga 3840
aatgaagagt gaaaagcaag ttgaacaaaa gatcgctgag attcctaaag aggaagttaa 3900
gccatttata actgaaagta aaccttcagt tgaacagaga aaacaagatg ataagaaaat 3960
caaagcttgt gttgaagaag ttacaacaac tctggaagaa actaagttcc tcacagaaaa 4020
cttgttactt tatattgaca ttaatggcaa tcttcatcca gattctgcca ctcttgttag 4080
tgacattgac atcactttct taaagaaaga tgctccatat atagtgggtg atgttgttca 4140
agagggtgtt ttaactgctg tggttatacc tactaaaaag gctggtggca ctactgaaat 4200
gctagcgaaa gctttgagaa aagtgccaac agacaattat ataaccactt acccgggtca 4260
gggtttaaat ggttacactg tagaggaggc aaagacagtg cttaaaaagt gtaaaagtgc 4320
cttttacatt ctaccatcta ttatctctaa tgagaagcaa gaaattcttg gaactgtttc 4380
ttggaatttg cgagaaatgc ttgcacatgc agaagaaaca cgcaaattaa tgcctgtctg 4440
tgtggaaact aaagccatag tttcaactat acagcgtaaa tataagggta ttaaaataca 4500
agagggtgtg gttgattatg gtgctagatt ttacttttac accagtaaaa caactgtagc 4560
gtcacttatc aacacactta acgatctaaa tgaaactctt gttacaatgc cacttggcta 4620
tgtaacacat ggcttaaatt tggaagaagc tgctcggtat atgagatctc tcaaagtgcc 4680
agctacagtt tctgtttctt cacctgatgc tgttacagcg tataatggtt atcttacttc 4740
ttcttctaaa acacctgaag aacattttat tgaaaccatc tcacttgctg gttcctataa 4800
agattggtcc tattctggac aatctacaca actaggtata gaatttctta agagaggtga 4860
taaaagtgta tattacacta gtaatcctac cacattccac ctagatggtg aagttatcac 4920
ctttgacaat cttaagacac ttctttcttt gagagaagtg aggactatta aggtgtttac 4980
aacagtagac aacattaacc tccacacgca agttgtggac atgtcaatga catatggaca 5040
acagtttggt ccaacttatt tggatggagc tgatgttact aaaataaaac ctcataattc 5100
acatgaaggt aaaacatttt atgttttacc taatgatgac actctacgtg ttgaggcttt 5160
tgagtactac cacacaactg atcctagttt tctgggtagg tacatgtcag cattaaatca 5220
cactaaaaag tggaaatacc cacaagttaa tggtttaact tctattaaat gggcagataa 5280
caactgttat cttgccactg cattgttaac actccaacaa atagagttga agtttaatcc 5340
acctgctcta caagatgctt attacagagc aagggctggt gaagctgcta acttttgtgc 5400
acttatctta gcctactgta ataagacagt aggtgagtta ggtgatgtta gagaaacaat 5460
gagttacttg tttcaacatg ccaatttaga ttcttgcaaa agagtcttga acgtggtgtg 5520
taaaacttgt ggacaacagc agacaaccct taagggtgta gaagctgtta tgtacatggg 5580
cacactttct tatgaacaat ttaagaaagg tgttcagata ccttgtacgt gtggtaaaca 5640
agctacaaaa tatctagtac aacaggagtc accttttgtt atgatgtcag caccacctgc 5700
tcagtatgaa cttaagcatg gtacatttac ttgtgctagt gagtacactg gtaattacca 5760
gtgtggtcac tataaacata taacttctaa agaaactttg tattgcatag acggtgcttt 5820
acttacaaag tcctcagaat acaaaggtcc tattacggat gttttctaca aagaaaacag 5880
ttacacaaca accataaaac cagttactta taaattggat ggtgttgttt gtacagaaat 5940
tgaccctaag ttggacaatt attataagaa agacaattct tatttcacag agcaaccaat 6000
tgatcttgta ccaaaccaac catatccaaa cgcaagcttc gataatttta agtttgtatg 6060
tgataatatc aaatttgctg atgatttaaa ccagttaact ggttataaga aacctgcttc 6120
aagagagctt aaagttacat ttttccctga cttaaatggt gatgtggtgg ctattgatta 6180
taaacactac acaccctctt ttaagaaagg agctaaattg ttacataaac ctattgtttg 6240
gcatgttaac aatgcaacta ataaagccac gtataaacca aatacctggt gtatacgttg 6300
tctttggagc acaaaaccag ttgaaacatc aaattcgttt gatgtactga agtcagagga 6360
cgcgcaggga atggataatc ttgcctgcga agatctaaaa ccagtctctg aagaagtagt 6420
ggaaaatcct accatacaga aagacgttct tgagtgtaat gtgaaaacta ccgaagttgt 6480
aggagacatt atacttaaac cagcaaataa tagtttaaaa attacagaag aggttggcca 6540
cacagatcta atggctgctt atgtagacaa ttctagtctt actattaaga aacctaatga 6600
attatctaga gtattaggtt tgaaaaccct tgctactcat ggtttagctg ctgttaatag 6660
tgtcccttgg gatactatag ctaattatgc taagcctttt cttaacaaag ttgttagtac 6720
aactactaac atagttacac ggtgtttaaa ccgtgtttgt actaattata tgccttattt 6780
ctttacttta ttgctacaat tgtgtacttt tactagaagt acaaattcta gaattaaagc 6840
atctatgccg actactatag caaagaatac tgttaagagt gtcggtaaat tttgtctaga 6900
ggcttcattt aattatttga agtcacctaa tttttctaaa ctgataaata ttataatttg 6960
gtttttacta ttaagtgttt gcctaggttc tttaatctac tcaaccgctg ctttaggtgt 7020
tttaatgtct aatttaggca tgccttctta ctgtactggt tacagagaag gctatttgaa 7080
ctctactaat gtcactattg caacctactg tactggttct ataccttgta gtgtttgtct 7140
tagtggttta gattctttag acacctatcc ttctttagaa actatacaaa ttaccatttc 7200
atcttttaaa tgggatttaa ctgcttttgg cttagttgca gagtggtttt tggcatatat 7260
tcttttcact aggtttttct atgtacttgg attggctgca atcatgcaat tgtttttcag 7320
ctattttgca gtacatttta ttagtaattc ttggcttatg tggttaataa ttaatcttgt 7380
acaaatggcc ccgatttcag ctatggttag aatgtacatc ttctttgcat cattttatta 7440
tgtatggaaa agttatgtgc atgttgtaga cggttgtaat tcatcaactt gtatgatgtg 7500
ttacaaacgt aatagagcaa caagagtcga atgtacaact attgttaatg gtgttagaag 7560
gtccttttat gtctatgcta atggaggtaa aggcttttgc aaactacaca attggaattg 7620
tgttaattgt gatacattct gtgctggtag tacatttatt agtgatgaag ttgcgagaga 7680
cttgtcacta cagtttaaaa gaccaataaa tcctactgac cagtcttctt acatcgttga 7740
tagtgttaca gtgaagaatg gttccatcca tctttacttt gataaagctg gtcaaaagac 7800
ttatgaaaga cattctctct ctcattttgt taacttagac aacctgagag ctaataacac 7860
taaaggttca ttgcctatta atgttatagt ttttgatggt aaatcaaaat gtgaagaatc 7920
atctgcaaaa tcagcgtctg tttactacag tcagcttatg tgtcaaccta tactgttact 7980
agatcaggca ttagtgtctg atgttggtga tagtgcggaa gttgcagtta aaatgtttga 8040
tgcttacgtt aatacgtttt catcaacttt taacgtacca atggaaaaac tcaaaacact 8100
agttgcaact gcagaagctg aacttgcaaa gaatgtgtcc ttagacaatg tcttatctac 8160
ttttatttca gcagctcggc aagggtttgt tgattcagat gtagaaacta aagatgttgt 8220
tgaatgtctt aaattgtcac atcaatctga catagaagtt actggcgata gttgtaataa 8280
ctatatgctc acctataaca aagttgaaaa catgacaccc cgtgaccttg gtgcttgtat 8340
tgactgtagt gcgcgtcata ttaatgcgca ggtagcaaaa agtcacaaca ttgctttgat 8400
atggaacgtt aaagatttca tgtcattgtc tgaacaacta cgaaaacaaa tacgtagtgc 8460
tgctaaaaag aataacttac cttttaagtt gacatgtgca actactagac aagttgttaa 8520
tgttgtaaca acaaagatag cacttaaggg tggtaaaatt gttaataatt ggttgaagca 8580
gttaattaaa gttacacttg tgttcctttt tgttgctgct attttctatt taataacacc 8640
tgttcatgtc atgtctaaac atactgactt ttcaagtgaa atcataggat acaaggctat 8700
tgatggtggt gtcactcgtg acatagcatc tacagatact tgttttgcta acaaacatgc 8760
tgattttgac acatggttta gccagcgtgg tggtagttat actaatgaca aagcttgccc 8820
attgattgct gcagtcataa caagagaagt gggttttgtc gtgcctggtt tgcctggcac 8880
gatattacgc acaactaatg gtgacttttt gcatttctta cctagagttt ttagtgcagt 8940
tggtaacatc tgttacacac catcaaaact tatagagtac actgactttg caacatcagc 9000
ttgtgttttg gctgctgaat gtacaatttt taaagatgct tctggtaagc cagtaccata 9060
ttgttatgat accaatgtac tagaaggttc tgttgcttat gaaagtttac gccctgacac 9120
acgttatgtg ctcatggatg gctctattat tcaatttcct aacacctacc ttgaaggttc 9180
tgttagagtg gtaacaactt ttgattctga gtactgtagg cacggcactt gtgaaagatc 9240
agaagctggt gtttgtgtat ctactagtgg tagatgggta cttaacaatg attattacag 9300
atctttacca ggagttttct gtggtgtaga tgctgtaaat ttacttacta atatgtttac 9360
accactaatt caacctattg gtgctttgga catatcagca tctatagtag ctggtggtat 9420
tgtagctatc gtagtaacat gccttgccta ctattttatg aggtttagaa gagcttttgg 9480
tgaatacagt catgtagttg cctttaatac tttactattc cttatgtcat tcactgtact 9540
ctgtttaaca ccagtttact cattcttacc tggtgtttat tctgttattt acttgtactt 9600
gacattttat cttactaatg atgtttcttt tttagcacat attcagtgga tggttatgtt 9660
cacaccttta gtacctttct ggataacaat tgcttatatc atttgtattt ccacaaagca 9720
tttctattgg ttctttagta attacctaaa gagacgtgta gtctttaatg gtgtttcctt 9780
tagtactttt gaagaagctg cgctgtgcac ctttttgtta aataaagaaa tgtatctaaa 9840
gttgcgtagt gatgtgctat tacctcttac gcaatataat agatacttag ctctttataa 9900
taagtacaag tattttagtg gagcaatgga tacaactagc tacagagaag ctgcttgttg 9960
tcatctcgca aaggctctca atgacttcag taactcaggt tctgatgttc tttaccaacc 10020
accacaaacc tctatcacct cagctgtttt gcagagtggt tttagaaaaa tggcattccc 10080
atctggtaaa gttgagggtt gtatggtaca agtaacttgt ggtacaacta cacttaacgg 10140
tctttggctt gatgacgtag tttactgtcc aagacatgtg atctgcacct ctgaagacat 10200
gcttaaccct aattatgaag atttactcat tcgtaagtct aatcataatt tcttggtaca 10260
ggctggtaat gttcaactca gggttattgg acattctatg caaaattgtg tacttaagct 10320
taaggttgat acagccaatc ctaagacacc taagtataag tttgttcgca ttcaaccagg 10380
acagactttt tcagtgttag cttgttacaa tggttcacca tctggtgttt accaatgtgc 10440
tatgaggccc aatttcacta ttaagggttc attccttaat ggttcatgtg gtagtgttgg 10500
ttttaacata gattatgact gtgtctcttt ttgttacatg caccatatgg aattaccaac 10560
tggagttcat gctggcacag acttagaagg taacttttat ggaccttttg ttgacaggca 10620
aacagcacaa gcagctggta cggacacaac tattacagtt aatgttttag cttggttgta 10680
cgctgctgtt ataaatggag acaggtggtt tctcaatcga tttaccacaa ctcttaatga 10740
ctttaacctt gtggctatga agtacaatta tgaacctcta acacaagacc atgttgacat 10800
actaggacct ctttctgctc aaactggaat tgccgtttta gatatgtgtg cttcattaaa 10860
agaattactg caaaatggta tgaatggacg taccatattg ggtagtgctt tattagaaga 10920
tgaatttaca ccttttgatg ttgttagaca atgctcaggt gttactttcc aaagtgcagt 10980
gaaaagaaca atcaagggta cacaccactg gttgttactc acaattttga cttcactttt 11040
agttttagtc cagagtactc aatggtcttt gttctttttt ttgtatgaaa atgccttttt 11100
accttttgct atgggtatta ttgctatgtc tgcttttgca atgatgtttg tcaaacataa 11160
gcatgcattt ctctgtttgt ttttgttacc ttctcttgcc actgtagctt attttaatat 11220
ggtctatatg cctgctagtt gggtgatgcg tattatgaca tggttggata tggttgatac 11280
tagtttgtct ggttttaagc taaaagactg tgttatgtat gcatcagctg tagtgttact 11340
aatccttatg acagcaagaa ctgtgtatga tgatggtgct aggagagtgt ggacacttat 11400
gaatgtcttg acactcgttt ataaagttta ttatggtaat gctttagatc aagccatttc 11460
catgtgggct cttataatct ctgttacttc taactactca ggtgtagtta caactgtcat 11520
gtttttggcc agaggtattg tttttatgtg tgttgagtat tgccctattt tcttcataac 11580
tggtaataca cttcagtgta taatgctagt ttattgtttc ttaggctatt tttgtacttg 11640
ttactttggc ctcttttgtt tactcaaccg ctactttaga ctgactcttg gtgtttatga 11700
ttacttagtt tctacacagg agtttagata tatgaattca cagggactac tcccacccaa 11760
gaatagcata gatgccttca aactcaacat taaattgttg ggtgttggtg gcaaaccttg 11820
tatcaaagta gccactgtac agtctaaaat gtcagatgta aagtgcacat cagtagtctt 11880
actctcagtt ttgcaacaac tcagagtaga atcatcatct aaattgtggg ctcaatgtgt 11940
ccagttacac aatgacattc tcttagctaa agatactact gaagcctttg aaaaaatggt 12000
ttcactactt tctgttttgc tttccatgca gggtgctgta gacataaaca agctttgtga 12060
agaaatgctg gacaacaggg caaccttaca agctatagcc tcagagttta gttcccttcc 12120
atcatatgca gcttttgcta ctgctcaaga agcttatgag caggctgttg ctaatggtga 12180
ttctgaagtt gttcttaaaa agttgaagaa gtctttgaat gtggctaaat ctgaatttga 12240
ccgtgatgca gccatgcaac gtaagttgga aaagatggct gatcaagcta tgacccaaat 12300
gtataaacag gctagatctg aggacaagag ggcaaaagtt actagtgcta tgcagacaat 12360
gcttttcact atgcttagaa agttggataa tgatgcactc aacaacatta tcaacaatgc 12420
aagagatggt tgtgttccct tgaacataat acctcttaca acagcagcca aactaatggt 12480
tgtcatacca gactataaca catataaaaa tacgtgtgat ggtacaacat ttacttatgc 12540
atcagcattg tgggaaatcc aacaggttgt agatgcagat agtaaaattg ttcaacttag 12600
tgaaattagt atggacaatt cacctaattt agcatggcct cttattgtaa cagctttaag 12660
ggccaattct gctgtcaaat tacagaataa tgagcttagt cctgttgcac tacgacagat 12720
gtcttgtgct gccggtacta cacaaactgc ttgcactgat gacaatgcgt tagcttacta 12780
caacacaaca aagggaggta ggtttgtact tgcactgtta tccgatttac aggatttgaa 12840
atgggctaga ttccctaaga gtgatggaac tggtactatc tatacagaac tggaaccacc 12900
ttgtaggttt gttacagaca cacctaaagg tcctaaagtg aagtatttat actttattaa 12960
aggattaaac aacctaaata gaggtatggt acttggtagt ttagctgcca cagtacgtct 13020
acaagctggt aatgcaacag aagtgcctgc caattcaact gtattatctt tctgtgcttt 13080
tgctgtagat gctgctaaag cttacaaaga ttatctagct agtgggggac aaccaatcac 13140
taattgtgtt aagatgttgt gtacacacac tggtactggt caggcaataa cagttacacc 13200
ggaagccaat atggatcaag aatcctttgg tggtgcatcg tgttgtctgt actgccgttg 13260
ccacatagat catccaaatc ctaaaggatt ttgtgactta aaaggtaagt atgtacaaat 13320
acctacaact tgtgctaatg accctgtggg ttttacactt aaaaacacag tctgtaccgt 13380
ctgcggtatg tggaaaggtt atggctgtag ttgtgatcaa ctccgcgaac ccatgcttca 13440
gtcagctgat gcacaatcgt ttttaaacgg gtttgcggtg taagtgcagc ccgtcttaca 13500
ccgtgcggca caggcactag tactgatgtc gtatacaggg cttttgacat ctacaatgat 13560
aaagtagctg gttttgctaa attcctaaaa actaattgtt gtcgcttcca agaaaaggac 13620
gaagatgaca atttaattga ttcttacttt gtagttaaga gacacacttt ctctaactac 13680
caacatgaag aaacaattta taatttactt aaggattgtc cagctgttgc taaacatgac 13740
ttctttaagt ttagaataga cggtgacatg gtaccacata tatcacgtca acgtcttact 13800
aaatacacaa tggcagacct cgtctatgct ttaaggcatt ttgatgaagg taattgtgac 13860
acattaaaag aaatacttgt cacatacaat tgttgtgatg atgattattt caataaaaag 13920
gactggtatg attttgtaga aaacccagat atattacgcg tatacgccaa cttaggtgaa 13980
cgtgtacgcc aagctttgtt aaaaacagta caattctgtg atgccatgcg aaatgctggt 14040
attgttggtg tactgacatt agataatcaa gatctcaatg gtaactggta tgatttcggt 14100
gatttcatac aaaccacgcc aggtagtgga gttcctgttg tagattctta ttattcattg 14160
ttaatgccta tattaacctt gaccagggct ttaactgcag agtcacatgt tgacactgac 14220
ttaacaaagc cttacattaa gtgggatttg ttaaaatatg acttcacgga agagaggtta 14280
aaactctttg accgttattt taaatattgg gatcagacat accacccaaa ttgtgttaac 14340
tgtttggatg acagatgcat tctgcattgt gcaaacttta atgttttatt ctctacagtg 14400
ttcccaccta caagttttgg accactagtg agaaaaatat ttgttgatgg tgttccattt 14460
gtagtttcaa ctggatacca cttcagagag ctaggtgttg tacataatca ggatgtaaac 14520
ttacatagct ctagacttag ttttaaggaa ttacttgtgt atgctgctga ccctgctatg 14580
cacgctgctt ctggtaatct attactagat aaacgcacta cgtgcttttc agtagctgca 14640
cttactaaca atgttgcttt tcaaactgtc aaacccggta attttaacaa agacttctat 14700
gactttgctg tgtctaaggg tttctttaag gaaggaagtt ctgttgaatt aaaacacttc 14760
ttctttgctc aggatggtaa tgctgctatc agcgattatg actactatcg ttataatcta 14820
ccaacaatgt gtgatatcag acaactacta tttgtagttg aagttgttga taagtacttt 14880
gattgttacg atggtggctg tattaatgct aaccaagtca tcgtcaacaa cctagacaaa 14940
tcagctggtt ttccatttaa taaatggggt aaggctagac tttattatga ttcaatgagt 15000
tatgaggatc aagatgcact tttcgcatat acaaaacgta atgtcatccc tactataact 15060
caaatgaatc ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc 15120
tctatctgta gtactatgac caatagacag tttcatcaaa aattattgaa atcaatagcc 15180
gccactagag gagctactgt agtaattgga acaagcaaat tctatggtgg ttggcacaac 15240
atgttaaaaa ctgtttatag tgatgtagaa aaccctcacc ttatgggttg ggattatcct 15300
aaatgtgata gagccatgcc taacatgctt agaattatgg cctcacttgt tcttgctcgc 15360
aaacatacaa cgtgttgtag cttgtcacac cgtttctata gattagctaa tgagtgtgct 15420
caagtattga gtgaaatggt catgtgtggc ggttcactat atgttaaacc aggtggaacc 15480
tcatcaggag atgccacaac tgcttatgct aatagtgttt ttaacatttg tcaagctgtc 15540
acggccaatg ttaatgcact tttatctact gatggtaaca aaattgccga taagtatgtc 15600
cgcaatttac aacacagact ttatgagtgt ctctatagaa atagagatgt tgacacagac 15660
tttgtgaatg agttttacgc atatttgcgt aaacatttct caatgatgat actctctgac 15720
gatgctgttg tgtgtttcaa tagcacttat gcatctcaag gtctagtggc tagcataaag 15780
aactttaagt cagttcttta ttatcaaaac aatgttttta tgtctgaagc aaaatgttgg 15840
actgagactg accttactaa aggacctcat gaattttgct ctcaacatac aatgctagtt 15900
aaacagggtg atgattatgt gtaccttcct tacccagatc catcaagaat cctaggggcc 15960
ggctgttttg tagatgatat cgtaaaaaca gatggtacac ttatgattga acggttcgtg 16020
tctttagcta tagatgctta cccacttact aaacatccta atcaggagta tgctgatgtc 16080
tttcatttgt acttacaata cataagaaag ctacatgatg agttaacagg acacatgtta 16140
gacatgtatt ctgttatgct tactaatgat aacacttcaa ggtattggga acctgagttt 16200
tatgaggcta tgtacacacc gcatacagtc ttacaggctg ttggggcttg tgttctttgc 16260
aattcacaga cttcattaag atgtggtgct tgcatacgta gaccattctt atgttgtaaa 16320
tgctgttacg accatgtcat atcaacatca cataaattag tcttgtctgt taatccgtat 16380
gtttgcaatg ctccaggttg tgatgtcaca gatgtgactc aactttactt aggaggtatg 16440
agctattatt gtaaatcaca taaaccaccc attagttttc cattgtgtgc taatggacaa 16500
gtttttggtt tatataaaaa tacatgtgtt ggtagcgata atgttactga ctttaatgca 16560
attgcaacat gtgactggac aaatgctggt gattacattt tagctaacac ctgtactgaa 16620
agactcaagc tttttgcagc agaaacgctc aaagctactg aggagacatt taaactgtct 16680
tatggtattg ctactgtacg tgaagtgctg tctgacagag aattacatct ttcatgggaa 16740
gttggtaaac ctagaccacc acttaaccga aattatgtct ttactggtta tcgtgtaact 16800
aaaaacagta aagtacaaat aggagagtac acctttgaaa aaggtgacta tggtgatgct 16860
gttgtttacc gaggtacaac aacttacaaa ttaaatgttg gtgattattt tgtgctgaca 16920
tcacatacag taatgccatt aagtgcacct acactagtgc cacaagagca ctatgttaga 16980
attactggct tatacccaac actcaatatc tcagatgagt tttctagcaa tgttgcaaat 17040
tatcaaaagg ttggtatgca aaagtattct acactccagg gaccacctgg tactggtaag 17100
agtcattttg ctattggcct agctctctac tacccttctg ctcgcatagt gtatacagct 17160
tgctctcatg ccgctgttga tgcactatgt gagaaggcat taaaatattt gcctatagat 17220
aaatgtagta gaattatacc tgcacgtgct cgtgtagagt gttttgataa attcaaagtg 17280
aattcaacat tagaacagta tgtcttttgt actgtaaatg cattgcctga gacgacagca 17340
gatatagttg tctttgatga aatttcaatg gccacaaatt atgatttgag tgttgtcaat 17400
gccagattac gtgctaagca ctatgtgtac attggcgacc ctgctcaatt acctgcacca 17460
cgcacattgc taactaaggg cacactagaa ccagaatatt tcaattcagt gtgtagactt 17520
atgaaaacta taggtccaga catgttcctc ggaacttgtc ggcgttgtcc tgctgaaatt 17580
gttgacactg tgagtgcttt ggtttatgat aataagctta aagcacataa agacaaatca 17640
gctcaatgct ttaaaatgtt ttataagggt gttatcacgc atgatgtttc atctgcaatt 17700
aacaggccac aaataggcgt ggtaagagaa ttccttacac gtaaccctgc ttggagaaaa 17760
gctgtcttta tttcacctta taattcacag aatgctgtag cctcaaagat tttgggacta 17820
ccaactcaaa ctgttgattc atcacagggc tcagaatatg actatgtcat attcactcaa 17880
accactgaaa cagctcactc ttgtaatgta aacagattta atgttgctat taccagagca 17940
aaagtaggca tactttgcat aatgtctgat agagaccttt atgacaagtt gcaatttaca 18000
agtcttgaaa ttccacgtag gaatgtggca actttacaag ctgaaaatgt aacaggactc 18060
tttaaagatt gtagtaaggt aatcactggg ttacatccta cacaggcacc tacacacctc 18120
agtgttgaca ctaaattcaa aactgaaggt ttatgtgttg acatacctgg catacctaag 18180
gacatgacct atagaagact catctctatg atgggtttta aaatgaatta tcaagttaat 18240
ggttacccta acatgtttat cacccgcgaa gaagctataa gacatgtacg tgcatggatt 18300
ggcttcgatg tcgaggggtg tcatgctact agagaagctg ttggtaccaa tttaccttta 18360
cagctaggtt tttctacagg tgttaaccta gttgctgtac ctacaggtta tgttgataca 18420
cctaataata cagatttttc cagagttagt gctaaaccac cgcctggaga tcaatttaaa 18480
cacctcatac cacttatgta caaaggactt ccttggaatg tagtgcgtat aaagattgta 18540
caaatgttaa gtgacacact taaaaatctc tctgacagag tcgtatttgt cttatgggca 18600
catggctttg agttgacatc tatgaagtat tttgtgaaaa taggacctga gcgcacctgt 18660
tgtctatgtg atagacgtgc cacatgcttt tccactgctt cagacactta tgcctgttgg 18720
catcattcta ttggatttga ttacgtctat aatccgttta tgattgatgt tcaacaatgg 18780
ggttttacag gtaacctaca aagcaaccat gatctgtatt gtcaagtcca tggtaatgca 18840
catgtagcta gttgtgatgc aatcatgact aggtgtctag ctgtccacga gtgctttgtt 18900
aagcgtgttg actggactat tgaatatcct ataattggtg atgaactgaa gattaatgcg 18960
gcttgtagaa aggttcaaca catggttgtt aaagctgcat tattagcaga caaattccca 19020
gttcttcacg acattggtaa ccctaaagct attaagtgtg tacctcaagc tgatgtagaa 19080
tggaagttct atgatgcaca gccttgtagt gacaaagctt ataaaataga agaattattc 19140
tattcttatg ccacacattc tgacaaattc acagatggtg tatgcctatt ttggaattgc 19200
aatgtcgata gatatcctgc taattccatt gtttgtagat ttgacactag agtgctatct 19260
aaccttaact tgcctggttg tgatggtggc agtttgtatg taaataaaca tgcattccac 19320
acaccagctt ttgataaaag tgcttttgtt aatttaaaac aattaccatt tttctattac 19380
tctgacagtc catgtgagtc tcatggaaaa caagtagtgt cagatataga ttatgtacca 19440
ctaaagtctg ctacgtgtat aacacgttgc aatttaggtg gtgctgtctg tagacatcat 19500
gctaatgagt acagattgta tctcgatgct tataacatga tgatctcagc tggctttagc 19560
ttgtgggttt acaaacaatt tgatacttat aacctctgga acacttttac aagacttcag 19620
agtttagaaa atgtggcttt taatgttgta aataagggac actttgatgg acaacagggt 19680
gaagtaccag tttctatcat taataacact gtttacacaa aagttgatgg tgttgatgta 19740
gaattgtttg aaaataaaac aacattacct gttaatgtag catttgagct ttgggctaag 19800
cgcaacatta aaccagtacc agaggtgaaa atactcaata atttgggtgt ggacattgct 19860
gctaatactg tgatctggga ctacaaaaga gatgctccag cacatatatc tactattggt 19920
gtttgttcta tgactgacat agccaagaaa ccaactgaaa cgatttgtgc accactcact 19980
gtcttttttg atggtagagt tgatggtcaa gtagacttat ttagaaatgc ccgtaatggt 20040
gttcttatta cagaaggtag tgttaaaggt ttacaaccat ctgtaggtcc caaacaagct 20100
agtcttaatg gagtcacatt aattggagaa gccgtaaaaa cacagttcaa ttattataag 20160
aaagttgatg gtgttgtcca acaattacct gaaacttact ttactcagag tagaaattta 20220
caagaattta aacccaggag tcaaatggaa attgatttct tagaattagc tatggatgaa 20280
ttcattgaac ggtataaatt agaaggctat gccttcgaac atatcgttta tggagatttt 20340
agtcatagtc agttaggtgg tttacatcta ctgattggac tagctaaacg ttttaaggaa 20400
tcaccttttg aattagaaga ttttattcct atggacagta cagttaaaaa ctatttcata 20460
acagatgcgc aaacaggttc atctaagtgt gtgtgttctg ttattgattt attacttgat 20520
gattttgttg aaataataaa atcccaagat ttatctgtag tttctaaggt tgtcaaagtg 20580
actattgact atacagaaat ttcatttatg ctttggtgta aagatggcca tgtagaaaca 20640
ttttacccaa aattacaatc tagtcaagcg tggcaaccgg gtgttgctat gcctaatctt 20700
tacaaaatgc aaagaatgct attagaaaag tgtgaccttc aaaattatgg tgatagtgca 20760
acattaccta aaggcataat gatgaatgtc gcaaaatata ctcaactgtg tcaatattta 20820
aacacattaa cattagctgt accctataat atgagagtta tacattttgg tgctggttct 20880
gataaaggag ttgcaccagg tacagctgtt ttaagacagt ggttgcctac gggtacgctg 20940
cttgtcgatt cagatcttaa tgactttgtc tctgatgcag attcaacttt gattggtgat 21000
tgtgcaactg tacatacagc taataaatgg gatctcatta ttagtgatat gtacgaccct 21060
aagactaaaa atgttacaaa agaaaatgac tctaaagagg gttttttcac ttacatttgt 21120
gggtttatac aacaaaagct agctcttgga ggttccgtgg ctataaagat aacagaacat 21180
tcttggaatg ctgatcttta taagctcatg ggacacttcg catggtggac agcctttgtt 21240
actaatgtga atgcgtcatc atctgaagca tttttaattg gatgtaatta tcttggcaaa 21300
ccacgcgaac aaatagatgg ttatgtcatg catgcaaatt acatattttg gaggaataca 21360
aatccaattc agttgtcttc ctattcttta tttgacatga gtaaatttcc ccttaaatta 21420
aggggtactg ctgttatgtc tttaaaagaa ggtcaaatca atgatatgat tttatctctt 21480
cttagtaaag gtagacttat aattagagaa aacaacagag ttgttatttc tagtgatgtt 21540
cttgttaaca actaaacgaa caatgtttgt ttttcttgtt ttattgccac tagtctctag 21600
tcagtgtgtt aatcttacaa ccagaactca attaccccct gcatacacta attctttcac 21660
acgtggtgtt tattaccctg acaaagtttt cagatcctca gttttacatt caactcagga 21720
cttgttctta cctttctttt ccaatgttac ttggttccat gctatacatg tctctgggac 21780
caatggtact aagaggtttg ataaccctgt cctaccattt aatgatggtg tttattttgc 21840
ttccactgag aagtctaaca taataagagg ctggattttt ggtactactt tagattcgaa 21900
gacccagtcc ctacttattg ttaataacgc tactaatgtt gttattaaag tctgtgaatt 21960
tcaattttgt aatgatccat ttttgggtgt ttattaccac aaaaacaaca aaagttggat 22020
ggaaagtgag ttcagagttt attctagtgc gaataattgc acttttgaat atgtctctca 22080
gccttttctt atggaccttg aaggaaaaca gggtaatttc aaaaatctta gggaatttgt 22140
gtttaagaat attgatggtt attttaaaat atattctaag cacacgccta ttaatttagt 22200
gcgtgatctc cctcagggtt tttcggcttt agaaccattg gtagatttgc caataggtat 22260
taacatcact aggtttcaaa ctttacttgc tttacataga agttatttga ctcctggtga 22320
ttcttcttca ggttggacag ctggtgctgc agcttattat gtgggttatc ttcaacctag 22380
gacttttcta ttaaaatata atgaaaatgg aaccattaca gatgctgtag actgtgcact 22440
tgaccctctc tcagaaacaa agtgtacgtt gaaatccttc actgtagaaa aaggaatcta 22500
tcaaacttct aactttagag tccaaccaac agaatctatt gttagatttc ctaatattac 22560
aaacttgtgc ccttttggtg aagtttttaa cgccaccaga tttgcatctg tttatgcttg 22620
gaacaggaag agaatcagca actgtgttgc tgattattct gtcctatata attccgcatc 22680
attttccact tttaagtgtt atggagtgtc tcctactaaa ttaaatgatc tctgctttac 22740
taatgtctat gcagattcat ttgtaattag aggtgatgaa gtcagacaaa tcgctccagg 22800
gcaaactgga aagattgctg attataatta taaattacca gatgatttta caggctgcgt 22860
tatagcttgg aattctaaca atcttgattc taaggttggt ggtaattata attacctgta 22920
tagattgttt aggaagtcta atctcaaacc ttttgagaga gatatttcaa ctgaaatcta 22980
tcaggccggt agcacacctt gtaatggtgt tgaaggtttt aattgttact ttcctttaca 23040
atcatatggt ttccaaccca ctaatggtgt tggttaccaa ccatacagag tagtagtact 23100
ttcttttgaa cttctacatg caccagcaac tgtttgtgga cctaaaaagt ctactaattt 23160
ggttaaaaac aaatgtgtca atttcaactt caatggttta acaggcacag gtgttcttac 23220
tgagtctaac aaaaagtttc tgcctttcca acaatttggc agagacattg ctgacactac 23280
tgatgctgtc cgtgatccac agacacttga gattcttgac attacaccat gttcttttgg 23340
tggtgtcagt gttataacac caggaacaaa tacttctaac caggttgctg ttctttatca 23400
ggatgttaac tgcacagaag tccctgttgc tattcatgca gatcaactta ctcctacttg 23460
gcgtgtttat tctacaggtt ctaatgtttt tcaaacacgt gcaggctgtt taataggggc 23520
tgaacatgtc aacaactcat atgagtgtga catacccatt ggtgcaggta tatgcgctag 23580
ttatcagact cagactaatt ctcctcggcg ggcacgtagt gtagctagtc aatccatcat 23640
tgcctacact atgtcacttg gtgcagaaaa ttcagttgct tactctaata actctattgc 23700
catacccaca aattttacta ttagtgttac cacagaaatt ctaccagtgt ctatgaccaa 23760
gacatcagta gattgtacaa tgtacatttg tggtgattca actgaatgca gcaatctttt 23820
gttgcaatat ggcagttttt gtacacaatt aaaccgtgct ttaactggaa tagctgttga 23880
acaagacaaa aacacccaag aagtttttgc acaagtcaaa caaatttaca aaacaccacc 23940
aattaaagat tttggtggtt ttaatttttc acaaatatta ccagatccat caaaaccaag 24000
caagaggtca tttattgaag atctactttt caacaaagtg acacttgcag atgctggctt 24060
catcaaacaa tatggtgatt gccttggtga tattgctgct agagacctca tttgtgcaca 24120
aaagtttaac ggccttactg ttttgccacc tttgctcaca gatgaaatga ttgctcaata 24180
cacttctgca ctgttagcgg gtacaatcac ttctggttgg acctttggtg caggtgctgc 24240
attacaaata ccatttgcta tgcaaatggc ttataggttt aatggtattg gagttacaca 24300
gaatgttctc tatgagaacc aaaaattgat tgccaaccaa tttaatagtg ctattggcaa 24360
aattcaagac tcactttctt ccacagcaag tgcacttgga aaacttcaag atgtggtcaa 24420
ccaaaatgca caagctttaa acacgcttgt taaacaactt agctccaatt ttggtgcaat 24480
ttcaagtgtt ttaaatgata tcctttcacg tcttgacaaa gttgaggctg aagtgcaaat 24540
tgataggttg atcacaggca gacttcaaag tttgcagaca tatgtgactc aacaattaat 24600
tagagctgca gaaatcagag cttctgctaa tcttgctgct actaaaatgt cagagtgtgt 24660
acttggacaa tcaaaaagag ttgatttttg tggaaagggc tatcatctta tgtccttccc 24720
tcagtcagca cctcatggtg tagtcttctt gcatgtgact tatgtccctg cacaagaaaa 24780
gaacttcaca actgctcctg ccatttgtca tgatggaaaa gcacactttc ctcgtgaagg 24840
tgtctttgtt tcaaatggca cacactggtt tgtaacacaa aggaattttt atgaaccaca 24900
aatcattact acagacaaca catttgtgtc tggtaactgt gatgttgtaa taggaattgt 24960
caacaacaca gtttatgatc ctttgcaacc tgaattagac tcattcaagg aggagttaga 25020
taaatatttt aagaatcata catcaccaga tgttgattta ggtgacatct ctggcattaa 25080
tgcttcagtt gtaaacattc aaaaagaaat tgaccgcctc aatgaggttg ccaagaattt 25140
aaatgaatct ctcatcgatc tccaagaact tggaaagtat gagcagtata taaaatggcc 25200
atggtacatt tggctaggtt ttatagctgg cttgattgcc atagtaatgg tgacaattat 25260
gctttgctgt atgaccagtt gctgtagttg tctcaagggc tgttgttctt gtggatcctg 25320
ctgcaaattt gatgaagacg actctgagcc agtgctcaaa ggagtcaaat tacattacac 25380
ataaacgaac ttatggattt gtttatgaga atcttcacaa ttggaactgt aactttgaag 25440
caaggtgaaa tcaaggatgc tactccttca gattttgttc gcgctactgc aacgataccg 25500
atacaagcct cactcccttt cggatggctt attgttggcg ttgcacttct tgctgttttt 25560
cagagcgctt ccaaaatcat aaccctcaaa aagagatggc aactagcact ctccaagggt 25620
gttcactttg tttgcaactt gctgttgttg tttgtaacag tttactcaca ccttttgctc 25680
gttgctgctg gccttgaagc cccttttctc tatctttatg ctttagtcta cttcttgcag 25740
agtataaact ttgtaagaat aataatgagg ctttggcttt gctggaaatg ccgttccaaa 25800
aacccattac tttatgatgc caactatttt ctttgctggc atactaattg ttacgactat 25860
tgtatacctt acaatagtgt aacttcttca attgtcatta cttcaggtga tggcacaaca 25920
agtcctattt ctgaacatga ctaccagatt ggtggttata ctgaaaaatg ggaatctgga 25980
gtaaaagact gtgttgtatt acacagttac ttcacttcag actattacca gctgtactca 26040
actcaattga gtacagacac tggtgttgaa catgttacct tcttcatcta caataaaatt 26100
gttgatgagc ctgaagaaca tgtccaaatt cacacaatcg acggttcatc cggagttgtt 26160
aatccagtaa tggaaccaat ttatgatgaa ccgacgacga ctactagcgt gcctttgtaa 26220
gcacaagctg atgagtacga acttatgtac tcattcgttt cggaagagac aggtacgtta 26280
atagttaata gcgtacttct ttttcttgct ttcgtggtat tcttgctagt tacactagcc 26340
atccttactg cgcttcgatt gtgtgcgtac tgctgcaata ttgttaacgt gagtcttgta 26400
aaaccttctt tttacgttta ctctcgtgtt aaaaatctga attcttctag agttcctgat 26460
cttctggtct aaacgaacta aatattatat tagtttttct gtttggaact ttaattttag 26520
ccatggcaga ttccaacggt actattaccg ttgaagagct taaaaagctc cttgaacaat 26580
ggaacctagt aataggtttc ctattcctta catggatttg tcttctacaa tttgcctatg 26640
ccaacaggaa taggtttttg tatataatta agttaatttt cctctggctg ttatggccag 26700
taactttagc ttgttttgtg cttgctgctg tttacagaat aaattggatc accggtggaa 26760
ttgctatcgc aatggcttgt cttgtaggct tgatgtggct cagctacttc attgcttctt 26820
tcagactgtt tgcgcgtacg cgttccatgt ggtcattcaa tccagaaact aacattcttc 26880
tcaacgtgcc actccatggc actattctga ccagaccgct tctagaaagt gaactcgtaa 26940
tcggagctgt gatccttcgt ggacatcttc gtattgctgg acaccatcta ggacgctgtg 27000
acatcaagga cctgcctaaa gaaatcactg ttgctacatc acgaacgctt tcttattaca 27060
aattgggagc ttcgcagcgt gtagcaggtg actcaggttt tgctgcatac agtcgctaca 27120
ggattggcaa ctataaatta aacacagacc attccagtag cagtgacaat attgctttgc 27180
ttgtacagta agtgacaaca gatgtttcat ctcgttgact ttcaggttac tatagcagag 27240
atattactaa ttattatgag gacttttaaa gtttccattt ggaatcttga ttacatcata 27300
aacctcataa ttaaaaattt atctaagtca ctaactgaga ataaatattc tcaattagat 27360
gaagagcaac caatggagat tgattaaacg aacatgaaaa ttattctttt cttggcactg 27420
ataacactcg ctacttgtga gctttatcac taccaagagt gtgttagagg tacaacagta 27480
cttttaaaag aaccttgctc ttctggaaca tacgagggca attcaccatt tcatcctcta 27540
gctgataaca aatttgcact gacttgcttt agcactcaat ttgcttttgc ttgtcctgac 27600
ggcgtaaaac acgtctatca gttacgtgcc agatcagttt cacctaaact gttcatcaga 27660
caagaggaag ttcaagaact ttactctcca atttttctta ttgttgcggc aatagtgttt 27720
ataacacttt gcttcacact caaaagaaag acagaatgat tgaactttca ttaattgact 27780
tctatttgtg ctttttagcc tttctgctat tccttgtttt aattatgctt attatctttt 27840
ggttctcact tgaactgcaa gatcataatg aaacttgtca cgcctaaacg aacatgaaat 27900
ttcttgtttt cttaggaatc atcacaactg tagctgcatt tcaccaagaa tgtagtttac 27960
agtcatgtac tcaacatcaa ccatatgtag ttgatgaccc gtgtcctatt cacttctatt 28020
ctaaatggta tattagagta ggagctagaa aatcagcacc tttaattgaa ttgtgcgtgg 28080
atgaggctgg ttctaaatca cccattcagt acatcgatat cggtaattat acagtttcct 28140
gtttaccttt tacaattaat tgccaggaac ctaaattggg tagtcttgta gtgcgttgtt 28200
cgttctatga agacttttta gagtatcatg acgttcgtgt tgttttagat ttcatctaaa 28260
cgaacaaact aaaatgtctg ataatggacc ccaaaatcag cgaaatgcac cccgcattac 28320
gtttggtgga ccctcagatt caactggcag taaccagaat ggagaacgca gtggggcgcg 28380
atcaaaacaa cgtcggcccc aaggtttacc caataatact gcgtcttggt tcaccgctct 28440
cactcaacat ggcaaggaag accttaaatt ccctcgagga caaggcgttc caattaacac 28500
caatagcagt ccagatgacc aaattggcta ctaccgaaga gctaccagac gaattcgtgg 28560
tggtgacggt aaaatgaaag atctcagtcc aagatggtat ttctactacc taggaactgg 28620
gccagaagct ggacttccct atggtgctaa caaagacggc atcatatggg ttgcaactga 28680
gggagccttg aatacaccaa aagatcacat tggcacccgc aatcctgcta acaatgctgc 28740
aatcgtgcta caacttcctc aaggaacaac attgccaaaa ggcttctacg cagaagggag 28800
cagaggcggc agtcaagcct cttctcgttc ctcatcacgt agtcgcaaca gttcaagaaa 28860
ttcaactcca ggcagcagta ggggaacttc tcctgctaga atggctggca atggcggtga 28920
tgctgctctt gctttgctgc tgcttgacag attgaaccag cttgagagca aaatgtctgg 28980
taaaggccaa caacaacaag gccaaactgt cactaagaaa tctgctgctg aggcttctaa 29040
gaagcctcgg caaaaacgta ctgccactaa agcatacaat gtaacacaag ctttcggcag 29100
acgtggtcca gaacaaaccc aaggaaattt tggggaccag gaactaatca gacaaggaac 29160
tgattacaaa cattggccgc aaattgcaca atttgccccc agcgcttcag cgttcttcgg 29220
aatgtcgcgc attggcatgg aagtcacacc ttcgggaacg tggttgacct acacaggtgc 29280
catcaaattg gatgacaaag atccaaattt caaagatcaa gtcattttgc tgaataagca 29340
tattgacgca tacaaaacat tcccaccaac agagcctaaa aaggacaaaa agaagaaggc 29400
tgatgaaact caagccttac cgcagagaca gaagaaacag caaactgtga ctcttcttcc 29460
tgctgcagat ttggatgatt tctccaaaca attgcaacaa tccatgagca gtgctgactc 29520
aactcaggcc taaactcatg cagaccacac aaggcagatg ggctatataa acgttttcgc 29580
ttttccgttt acgatatata gtctactctt gtgcagaatg aattctcgta actacatagc 29640
acaagtagat gtagttaact ttaatctcac atagcaatct ttaatcagtg tgtaacatta 29700
gggaggactt gaaagagcca ccacattttc accgaggcca cgcggagtac gatcgagtgt 29760
acagtgaaca atgctaggga gagctgccta tatggaagag ccctaatgtg taaaattaat 29820
tttagtagtg ctatccccat gtgattttaa tagcttctta ggagaatgac aaaaaaaaaa 29880
aaaaaaaaaa aaaaaaaaaa aaa 29903
<210> 2
<211> 21282
<212> DNA
<213> 严重急性呼吸综合征冠状病毒2
<400> 2
atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60
ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120
gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180
ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240
catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300
ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360
gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420
aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480
tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540
gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600
attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtctga acaactggac 660
tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720
tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780
aagaaatttg acaccttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840
atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900
cgatctgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960
atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020
tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080
ccccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140
gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200
ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260
gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320
gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380
atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440
tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500
caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560
tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620
gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680
gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740
attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800
attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860
tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920
tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980
ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040
cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100
aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160
gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220
ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280
ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340
acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400
gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460
acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520
atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580
acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640
aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700
agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760
tattgttctt tttaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820
tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880
gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940
gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000
attattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060
cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120
aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180
gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240
aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300
ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360
aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420
cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480
tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540
aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600
caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660
tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720
acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780
ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840
aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900
atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960
ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020
gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080
tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140
catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200
actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260
agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320
ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380
gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440
gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500
tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560
acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620
cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680
tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740
acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800
ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860
ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920
agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980
gttaatggtt taacttctat aaaatgggca gataacaact gttatcttgc cactgcattg 5040
ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100
agagcaaggg ctggtgaagc tgataacttt tgtgcactta tcttagccta ctgtaataag 5160
acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220
ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280
acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340
aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400
gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460
tttacttgtg ctagtgagta cactggtaat taccagtgtg gtcactataa acatataact 5520
tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580
ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640
acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700
aagaaagaca attcttattt tacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760
ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820
ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880
cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940
aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000
gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060
acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120
tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180
gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240
aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300
gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360
acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420
tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480
ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540
acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600
aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660
cctaattttt ctaaactgat aaatattaca atttggtttt tactattaag tgtttgccta 6720
ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780
tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840
tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900
tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960
tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020
cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080
aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140
gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200
gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260
gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320
ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380
ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440
ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500
atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560
tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620
atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680
tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740
ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800
acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860
gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920
tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980
tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040
gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100
gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160
ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220
aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280
aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340
ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400
gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460
gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520
cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580
gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640
tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700
aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760
atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820
ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880
attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940
tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000
agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060
gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120
ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180
gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240
aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300
ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360
tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420
acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480
ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540
tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600
cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660
atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720
ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780
gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840
gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900
tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960
ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020
attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080
acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140
tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200
ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260
tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320
gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380
acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440
tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500
aattatgaac ctctaacaca agaccatgtt gacatactag gacctctttc tgctcaaact 10560
ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620
ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680
agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740
cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800
tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860
atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920
ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980
atgcgtatta tgacatggtt ggatatggtt gatactagtt tgaagctaaa agactgtgtt 11040
atgtatgcat cagctgtagt gttactaatc cttatgacag caagaactgt gtatgatgat 11100
ggtgctagga gagtgtggac acttatgaat gtcttgacac tcgtttataa agtttattat 11160
ggtaatgctt tagatcaagc catttccatg tgggctctta taatctctgt tacttctaac 11220
tactcaggtg tagttacaac tgtcatgttt ttggccagag gtattgtttt tatgtgtgtt 11280
gagtattgcc ctattttctt cataactggt aatacacttc agtgtataat gctagtttat 11340
tgtttcttag gctatttttg tacttgttac tttggcctct tttgtttact caaccgctac 11400
tttagactga ctcttggtgt ttatgattac ttagtttcta cacaggagtt tagatatatg 11460
aattcacagg gactactccc acccaagaat agcatagatg ccttcaaact caacattaaa 11520
ttgttgggtg ttggtggcaa accttgtatc aaagtagcca ctgtacagtc taaaatgtca 11580
gatgtaaagt gcacatcagt agtcttactc tcagttttgc aacaactcag agtagaatca 11640
tcatctaaat tgtgggctca atgtgtccag ttacacaatg acattctctt agctaaagat 11700
actactgaag cctttgaaaa aatggtttca ctactttctg ttttgctttc catgcagggt 11760
gctgtagaca taaacaagct ttgtgaagaa atgctggaca acagggcaac cttacaagct 11820
atagcctcag agtttagttc ccttccatca tatgcagctt ttgctactgc tcaagaagct 11880
tatgagcagg ctgttgctaa tggtgattct gaagttgttc ttaaaaagtt gaagaagtct 11940
ttgaatgtgg ctaaatctga atttgaccgt gatgcagcca tgcaacgtaa gttggaaaag 12000
atggctgatc aagctatgac ccaaatgtat aaacaggcta gatctgagga caagagggca 12060
aaagttacta gtgctatgca gacaatgctt ttcactatgc ttagaaagtt ggataatgat 12120
gcactcaaca acattatcaa caatgcaaga gatggttgtg ttcccttgaa cataatacct 12180
cttacaacag cagccaaact aatggttgtc ataccagact ataacacata taaaaatacg 12240
tgtgatggta caacatttac ttatgcatca gcattgtggg aaatccaaca ggttgtagat 12300
gcagatagta aaattgttca acttagtgaa attagtatgg acaattcacc taatttagca 12360
tggcctctta ttgtaacagc tttaagggcc aattctgctg tcaaattaca gaataatgag 12420
cttagtcctg ttgcactacg acagatgtct tgtgctgccg gtactacaca aactgcttgc 12480
actgatgaca atgcgttagc ttactacaac acaacaaagg gaggtaggtt tgtacttgca 12540
ctgttatccg atttacagga tttgaaatgg gctagattcc ctaagagtga tggaactggt 12600
actatctata cagaactgga accaccttgt aggtttgtta cagacacacc taaaggtcct 12660
aaagtgaagt atttatactt tattaaagga ttaaacaacc taaatagagg tatggtactt 12720
ggtagtttag ctgccacagt acgtctacaa gctggtaatg caacagaagt gcctgccaat 12780
tcaactgtat tatctttctg tgcttttgct gtagatgctg ctaaagctta caaagattat 12840
ctagctagtg ggggacaacc aatcactaat tgtgttaaga tgttgtgtac acacactggt 12900
actggtcagg caataacagt tacaccggaa gccaatatgg atcaagaatc ctttggtggt 12960
gcatcgtgtt gtctgtactg ccgttgccac atagatcatc caaatcctaa aggattttgt 13020
gacttaaaag gtaagtatgt acaaatacct acaacttgtg ctaatgaccc tgtgggtttt 13080
acacttaaaa acacagtctg taccgtctgc ggtatgtgga aaggttatgg ctgtagttgt 13140
gatcaactcc gcgaacccat gcttcagtca gctgatgcac aatcgttttt aaaccgggtt 13200
tgcggtgtaa gtgcagcccg tcttacaccg tgcggcacag gcactagtac tgatgtcgta 13260
tacagggctt ttgacatcta caatgataaa gtagctggtt ttgctaaatt cctaaaaact 13320
aattgttgtc gcttccaaga aaaggacgaa gatgacaatt taattgattc ttactttgta 13380
gttaagagac acactttctc taactaccaa catgaagaaa caatttataa tttacttaag 13440
gattgtccag ctgttgctaa acatgacttc tttaagttta gaatagacgg tgacatggta 13500
ccacatatat cacgtcaacg tcttactaaa tacacaatgg cagacctcgt ctatgcttta 13560
aggcattttg atgaaggtaa ttgtgacaca ttaaaagaaa tacttgtcac atacaattgt 13620
tgtgatgatg attatttcaa taaaaaggac tggtatgatt ttgtagaaaa cccagatata 13680
ttacgcgtat acgccaactt aggtgaacgt gtacgccaag ctttgttaaa aacagtacaa 13740
ttctgtgatg ccatgcgaaa tgctggtatt gttggtgtac tgacattaga taatcaagat 13800
ctcaatggta actggtatga tttcggtgat ttcatacaaa ccacgccagg tagtggagtt 13860
cctgttgtag attcttatta ttcattgtta atgcctatat taaccttgac cagggcttta 13920
actgcagagt cacatgttga cactgactta acaaagcctt acattaagtg ggatttgtta 13980
aaatatgact tcacggaaga gaggttaaaa ctctttgacc gttattttaa atattgggat 14040
cagacatacc acccaaattg tgttaactgt ttggatgaca gatgcattct gcattgtgca 14100
aactttaatg ttttattctc tacagtgttc ccacttacaa gttttggacc actagtgaga 14160
aaaatatttg ttgatggtgt tccatttgta gtttcaactg gataccactt cagagagcta 14220
ggtgttgtac ataatcagga tgtaaactta catagctcta gacttagttt taaggaatta 14280
cttgtgtatg ctgctgaccc tgctatgcac gctgcttctg gtaatctatt actagataaa 14340
cgcactacgt gcttttcagt agctgcactt actaacaatg ttgcttttca aactgtcaaa 14400
cctggtaatt ttaacaaaga cttctatgac tttgctgtgt ctaagggttt ctttaaggaa 14460
ggaagttctg ttgaattaaa acacttcttc tttgctcagg atggtaatgc tgctatcagc 14520
gattatgact actatcgtta taatctacca acaatgtgtg atatcagaca actactattt 14580
gtagttgaag ttgttgataa gtactttgat tgttacgatg gtggctgtat taatgctaac 14640
caagtcatcg tcaacaacct agacaaatca gctggttttc catttaataa atggggtaag 14700
gctagacttt attatgattc aatgagttat gaggatcaag atgcactttt cgcatataca 14760
aaacgtaatg tcatccctac tataactcaa atgaatctta agtatgccat tagtgcaaag 14820
aatagagctc gcaccgtagc tggtgtctct atctgtagta ctatgaccaa tagacagttt 14880
catcaaaaat tattgaaatc aatagccgcc actagaggag ctactgtagt aattggaaca 14940
agcaaattct atggtggttg gcacaacatg ttaaaaactg tttatagtga tgtagaaaac 15000
cctcatctta tgggttggga ttatcctaaa tgtgatagag ccatgcctaa catgcttaga 15060
attatggcct cacttgttct tgctcgcaaa catacaacgt gttgtagctt gtcacaccgt 15120
ttctatagat tagctaatga gtgtgctcaa gtattgagtg aaatggtcat gtgtggcggt 15180
tcactatatg ttaaaccagg tggaacctca tcaggagatg ccacaactgc ttatgctaat 15240
agtgttttta acatttgtca agctgtcacg gccaatgtta atgcactttt atctactgat 15300
ggtaacaaaa ttgccgataa gtatgtccgc aatttacaac acagacttta tgagtgtctc 15360
tatagaaata gagatgttga cacagacttt gtgaatgagt tttacgcata tttgcgtaaa 15420
catttctcaa tgatgatact ctctgacgat gctgttgtgt gtttcaatag cacttatgca 15480
tctcaaggtc tagtggctag cataaagaac tttaagtcag ttctttatta tcaaaacaat 15540
gtttttatgt ctgaagcaaa atgttggact gagactgacc ttactaaagg acctcatgaa 15600
ttttgctctc aacatacaat gctagttaaa cagggtgatg attatgtgta ccttccttac 15660
ccagatccat caagaatcct aggggccggc tgttttgtag atgatatcgt aaaaacagat 15720
ggtacactta tgattgaacg gttcgtgtct ttagctatag atgcttaccc acttactaaa 15780
catcctaatc aggagtatgc tgatgtcttt catttgtact tacaatacat aagaaagcta 15840
catgatgagt taacaggaca catgttagac atgtattctg ttatgcttac taatgataac 15900
acctcaaggt attgggaacc tgagttttat gaggctatgt acacaccgca tacagtctta 15960
caggctgttg gggcttgtgt tctttgcaat tcacagactt cattaagatg tggtgcttgc 16020
atacgtagac cattcttatg ttgtaaatgc tgttacgacc atgtcatatc aacatcacat 16080
aaattagtct tgtctgttaa tccgtatgtt tgcaatgctc caggttgtga tgtcacagat 16140
gtgactcaac tttacttagg aggtatgagc tattattgta aatcacataa accatccatt 16200
agttttccat tgtgtgctaa tggacaagtt tttggtttat ataaaaatac atgtgttggt 16260
agcgataatg ttactgactt taatgcaatt gcaacatgtg actggacaaa tgctggtgat 16320
tacattttag ctaacacctg tactgaaaga ctcaagcttt ttgcagcaga aacgctcaaa 16380
gctactgagg agacatttaa actgtcttat ggtattgcta ctgtacgtga agtgctgtct 16440
gacagagaat tacatctttc atgggaagtt ggtaaaccta gaccaccact taaccgaaat 16500
tatgtcttta ctggttatcg tgtaactaaa aacagtaaag tacaaatagg agagtacacc 16560
tttgaaaaag gtgactatgg tgatgctgtt gtttaccgag gtacaacaac ttacaaatta 16620
aatgttggtg attattttgt gctgacatca catacagtaa tgccattaag tgcacctaca 16680
ctagtgccac aagagcacta tgttagaatt actggcttat acccaacact caatatctca 16740
gatgagtttt ctagcaatgt tgcaaattat caaaaggttg gtatgcaaaa gtattctaca 16800
ctccagggac cacctggtac tggtaagagt cattttgcta ttggcctagc tctctactac 16860
ccttctgctc gcatagtgta tacagcttgc tctcatgccg ctgttgatgc actatgtgag 16920
aaggcattaa aatatttgcc tatagataaa tgtagtagaa ttatacctgc acgtgctcgt 16980
gtagagtgtt ttgataaatt caaagtgaat tcaacattag aacagtatgt cttttgtact 17040
gtaaatgcat tgcctgagac gacagcagat atagttgtct ttgatgaaat ttcaatggcc 17100
acaaattatg atttgagtgt tgtcaatgcc agattacgtg ctaagcacta tgtgtacatt 17160
ggcgaccctg ctcaattacc tgcaccacgc acattgctaa ctaagggcac actagaacca 17220
gaatatttca attcagtgtg tagacttatg aaaactatag gtccagacat gttcctcgga 17280
acttgtcggc gttgtcctgc tgaaattgtt gacactgtga gtgctttggt ttatgataat 17340
aggcttaaag cacataaaga caaatcagct caatgcttta aaatgtttta taagggtgtt 17400
atcacgcatg atgtttcatc tgcaattaac aggccacaaa taggcgtggt aagagaattc 17460
cttacacgta accctgcttg gagaaaagct gtctttattt caccttataa ttcacagaat 17520
gctgtagcct caaagatttt gggactacca actcaaactg ttgattcatc acagggctca 17580
gaatatgact atgtcatatt cactcaaacc actgaaacag ctcactcttg taatgtaaac 17640
agatttaatg ttgctattac cagagcaaaa gtaggcatac tttgcataat gtctgataga 17700
gacctttatg acaagttgca atttacaagt cttgaaattc cacgtaggaa tgtggcaact 17760
ttacaagctg aaaatgtaac aggactcttt aaagattgta gtaaggtaat cactgggtta 17820
catcctacac aggcacctac acacctcagt gttgacacta aattcaaaac tgaaggttta 17880
tgtgttgaca tacctggcat acctaaggac atgacctata gaagactcat ctctatgatg 17940
ggttttaaaa tgaattatca agttaatggt taccctaaca tgtttatcac ccgcgaagaa 18000
gctataagac atgtacgtgc atggattggc ttcgatgtcg aggggtgtca tgctactaga 18060
gaagctgttg gtaccaattt acctttacag ctaggttttt ctacaggtgt taacctagtt 18120
gctgtaccta caggttatgt tgatacacct aataatacag atttttccag agttagtgct 18180
aaaccaccgc ctggagatca atttaaacac ctcataccac ttatgtacaa aggacttcct 18240
tggaatgtag tgcgtataaa gattgtacaa atgttaagtg acacacttaa aaatctctct 18300
gacagagtcg tatttgtctt atgggcacat ggctttgagt tgacatctat gaagtatttt 18360
gtgaaaatag gacctgagcg cacctgttgt ctatgtgata gacgtgccac atgcttttcc 18420
actgcttcag acacttatgc ctgttggcat cattctattg gatttgatta cgtctataat 18480
ccgtttatga ttgatgttca acaatggggt tttacaggta acctacaaag caaccatgat 18540
ctgtattgtc aagtccatgg taatgcacat gtagctagtt gtgatgcaat catgactagg 18600
tgtctagctg tccacgagtg ctttgttaag cgtgttgact ggactattga atatcctata 18660
attggtgatg aactgaagat taatgcggct tgtagaaagg ttcaacacat ggttgttaaa 18720
gctgcattat tagcagacaa attcccagtt cttcacgaca ttggtaaccc taaagctatt 18780
aagtgtgtac ctcaagctga tgtagaatgg aagttctatg atgcacagcc ttgtagtgac 18840
aaagcttata aaatagaaga attattctat tcttatgcca cacattctga caaattcaca 18900
gatggtgtat gcctattttg gaattgcaat gtcgatagat atcctgctaa ttccattgtt 18960
tgtagatttg acactagagt gctatctaac cttaacttgc ctggttgtga tggtggcagt 19020
ttgtatgtaa ataaacatgc attccacaca ccagcttttg ataaaagtgc ttttgttaat 19080
ttaaaacaat taccattttt ctattactct gacagtccat gtgagtctca tggaaaacaa 19140
gtagtgtcag atatagatta tgtaccacta aagtctgcta cgtgtataac acgttgcaat 19200
ttaggtggtg ctgtctgtag acatcatgct aatgagtaca gattgtatct cgatgcttat 19260
aacatgatga tctcagctgg ctttagcttg tgggtttaca aacaatttga tacttataac 19320
ctctggaaca cttttacaag acttcagagt ttagaaaatg tggcttttaa tgttgtaaat 19380
aagggacact ttgatggaca acagggtgaa gtaccagttt ctatcattaa taacactgtt 19440
tacacaaaag ttgatggtgt tgatgtagaa ttgtttgaaa ataaaacaac attacctgtt 19500
aatgtagcat ttgagctttg ggctaagcgc aacattaaac cagtaccaga ggtgaaaata 19560
ctcaataatt tgggtgtgga cattgctgct aatactgtga tctgggacta caaaagagat 19620
gctccagcac atatatctac tattggtgtt tgttctatga ctgacatagc caagaaacca 19680
actgaaacga tttgtgcacc actcactgtc ttttttgatg gtagagttga tggtcaagta 19740
gacttattta gaaatgcccg taatggtgtt cttattacag aaggtagtgt taaaggttta 19800
caaccatctg taggtcccaa acaagctagt cttaatggag tcacattaat tggagaagcc 19860
gtaaaaacac agttcaatta ttataagaaa gttgatggtg ttgtccaaca attacctgaa 19920
acttacttta ctcagagtag aaatttacaa gaatttaaac ccaggagtca aatggaaatt 19980
gatttcttag aattagctat ggatgaattc attgaacggt ataaattaga aggctatgcc 20040
ttcgaacata tcgtttatgg agattttagt catagtcagt taggtggttt acatctactg 20100
attggactag ctaaacgttt taaggaatca ccttttgaat tagaagattt tattcctatg 20160
gacagtacag ttaaaaacta tttcataaca gatgcgcaaa caggttcatc taagtgtgtg 20220
tgttctgtta ttgatttatt acttgatgat tttgttgaaa taataaaatc ccaagattta 20280
tctgtagttt ctaaggttgt caaagtgact attgactata cagaaatttc atttatgctt 20340
tggtgtaaag atggccatgt agaaacattt tacccaaaat tacaatctag tcaagcgtgg 20400
caaccgggtg ttgctatgcc taatctttac aaaatgcaaa gaatgctatt agaaaagtgt 20460
gaccttcaaa attatggtga tagtgcaaca ttacctaaag gcataatgat gaatgtcgca 20520
aaatatactc aactgtgtca atatttaaac acattaacat tagctgtacc ctataatatg 20580
agagttatac attttggtgc tggttctgat aaaggagttg caccaggtac agctgtttta 20640
agacagtggt tgcctacggg tacgctgctt gtcgattcag atcttaatga ctttgtctct 20700
gatgcagatt caactttgat tggtgattgt gcaactgtac atacagctaa taaatgggat 20760
ctcattatta gtgatatgta cgaccctaag actaaaaatg ttacaaaaga aaatgactct 20820
aaagagggtt ttttcactta catttgtggg tttatacaac aaaagctagc tcttggaggt 20880
tccgtggcta taaagataac agaacattct tggaatgctg atctttataa gctcatggga 20940
cacttcgcat ggtggacagc ctttgttact aatgtgaatg cgtcatcatc tgaagcattt 21000
ttaattggat gtaattatct tggcaaacca cgcgaacaaa tagatggtta tgtcatgcat 21060
gcaaattaca tattttggag gaatacaaat ccaattcagt tgtcttccta ttctttattt 21120
gacatgagta aatttcccct taaattaagg ggtactgctg ttatgtcttt aaaagaaggt 21180
caaatcaatg atatgatttt atctcttctt agtaaaggta gacttataat tagagaaaac 21240
aacagagttg ttatttctag tgatgttctt gttaacaact aa 21282
<210> 3
<211> 21291
<212> DNA
<213> 严重急性呼吸综合征冠状病毒2
<400> 3
atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60
ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120
gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180
ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240
catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300
ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360
gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420
aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480
tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540
gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600
attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtccga acaactggac 660
tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720
tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780
aagaaatttg acaccttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840
atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900
cgatctgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960
atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020
tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080
ccccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140
gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200
ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260
gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320
gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380
atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440
tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500
caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560
tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620
gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680
gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740
attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800
attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860
tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920
tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980
ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040
cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100
aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160
gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220
ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280
ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340
acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400
gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460
acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520
atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580
acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640
aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700
agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760
tattgttctt tttaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820
tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880
gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940
gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000
actattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060
cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120
aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180
gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240
aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300
ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360
aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420
cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480
tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540
aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600
caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660
tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720
acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780
ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840
aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900
atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960
ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020
gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080
tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140
catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200
actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260
agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320
ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380
gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440
gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500
tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560
acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620
cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680
tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740
acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800
ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860
ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920
agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980
gttaatggtt taacttctat taaatgggca gataacaact gttatcttgc cactgcattg 5040
ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100
agagcaaggg ctggtgaagc tgctaacttt tgtgcactta tcttagccta ctgtaataag 5160
acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220
ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280
acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340
aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400
gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460
tttacttgtg ctagtgagta cactggtaat taccagtgtg gtcactataa acatataact 5520
tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580
ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640
acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700
aagaaagaca attcttattt cacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760
ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820
ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880
cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940
aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000
gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060
acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120
tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180
gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240
aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300
gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360
acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420
tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480
ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540
acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600
aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660
cctaattttt ctaaactgat aaatattata atttggtttt tactattaag tgtttgccta 6720
ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780
tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840
tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900
tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960
tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020
cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080
aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140
gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200
gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260
gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320
ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380
ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440
ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500
atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560
tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620
atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680
tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740
ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800
acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860
gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920
tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980
tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040
gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100
gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160
ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220
aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280
aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340
ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400
gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460
gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520
cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580
gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640
tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700
aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760
atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820
ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880
attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940
tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000
agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060
gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120
ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180
gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240
aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300
ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360
tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420
acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480
ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540
tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600
cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660
atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720
ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780
gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840
gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900
tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960
ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020
attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080
acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140
tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200
ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260
tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320
gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380
acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440
tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500
aattatgaac ctctaacaca agaccatgtt gacatactag gacctctttc tgctcaaact 10560
ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620
ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680
agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740
cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800
tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860
atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920
ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980
atgcgtatta tgacatggtt ggatatggtt gatactagtt tgtctggttt taagctaaaa 11040
gactgtgtta tgtatgcatc agctgtagtg ttactaatcc ttatgacagc aagaactgtg 11100
tatgatgatg gtgctaggag agtgtggaca cttatgaatg tcttgacact cgtttataaa 11160
gtttattatg gtaatgcttt agatcaagcc atttccatgt gggctcttat aatctctgtt 11220
acttctaact actcaggtgt agttacaact gtcatgtttt tggccagagg tattgttttt 11280
atgtgtgttg agtattgccc tattttcttc ataactggta atacacttca gtgtataatg 11340
ctagtttatt gtttcttagg ctatttttgt acttgttact ttggcctctt ttgtttactc 11400
aaccgctact ttagactgac tcttggtgtt tatgattact tagtttctac acaggagttt 11460
agatatatga attcacaggg actactccca cccaagaata gcatagatgc cttcaaactc 11520
aacattaaat tgttgggtgt tggtggcaaa ccttgtatca aagtagccac tgtacagtct 11580
aaaatgtcag atgtaaagtg cacatcagta gtcttactct cagttttgca acaactcaga 11640
gtagaatcat catctaaatt gtgggctcaa tgtgtccagt tacacaatga cattctctta 11700
gctaaagata ctactgaagc ctttgaaaaa atggtttcac tactttctgt tttgctttcc 11760
atgcagggtg ctgtagacat aaacaagctt tgtgaagaaa tgctggacaa cagggcaacc 11820
ttacaagcta tagcctcaga gtttagttcc cttccatcat atgcagcttt tgctactgct 11880
caagaagctt atgagcaggc tgttgctaat ggtgattctg aagttgttct taaaaagttg 11940
aagaagtctt tgaatgtggc taaatctgaa tttgaccgtg atgcagccat gcaacgtaag 12000
ttggaaaaga tggctgatca agctatgacc caaatgtata aacaggctag atctgaggac 12060
aagagggcaa aagttactag tgctatgcag acaatgcttt tcactatgct tagaaagttg 12120
gataatgatg cactcaacaa cattatcaac aatgcaagag atggttgtgt tcccttgaac 12180
ataatacctc ttacaacagc agccaaacta atggttgtca taccagacta taacacatat 12240
aaaaatacgt gtgatggtac aacatttact tatgcatcag cattgtggga aatccaacag 12300
gttgtagatg cagatagtaa aattgttcaa cttagtgaaa ttagtatgga caattcacct 12360
aatttagcat ggcctcttat tgtaacagct ttaagggcca attctgctgt caaattacag 12420
aataatgagc ttagtcctgt tgcactacga cagatgtctt gtgctgccgg tactacacaa 12480
actgcttgca ctgatgacaa tgcgttagct tactacaaca caacaaaggg aggtaggttt 12540
gtacttgcac tgttatccga tttacaggat ttgaaatggg ctagattccc taagagtgat 12600
ggaactggta ctatctatac agaactggaa ccaccttgta ggtttgttac agacacacct 12660
aaaggtccta aagtgaagta tttatacttt attaaaggat taaacaacct aaatagaggt 12720
atggtacttg gtagtttagc tgccacagta cgtctacaag ctggtaatgc aacagaagtg 12780
cctgccaatt caactgtatt atctttctgt gcttttgctg tagatgctgc taaagcttac 12840
aaagattatc tagctagtgg gggacaacca atcactaatt gtgttaagat gttgtgtaca 12900
cacactggta ctggtcaggc aataacagtt acaccggaag ccaatatgga tcaagaatcc 12960
tttggtggtg catcgtgttg tctgtactgc cgttgccaca tagatcatcc aaatcctaaa 13020
ggattttgtg acttaaaagg taagtatgta caaataccta caacttgtgc taatgaccct 13080
gtgggtttta cacttaaaaa cacagtctgt accgtctgcg gtatgtggaa aggttatggc 13140
tgtagttgtg atcaactccg cgaacccatg cttcagtcag ctgatgcaca atcgttttta 13200
aaccgggttt gcggtgtaag tgcagcccgt cttacaccgt gcggcacagg cactagtact 13260
gatgtcgtat acagggcttt tgacatctac aatgataaag tagctggttt tgctaaattc 13320
ctaaaaacta attgttgtcg cttccaagaa aaggatgaag atgacaattt aattgattct 13380
tactttgtag ttaagagaca cactttctct aactaccaac atgaagaaac aatttataat 13440
ttacttaagg attgtccagc tgttgctaaa catgacttct ttaagtttag aatagacggt 13500
gacatggtac cacatatatc acgtcaacgt cttactaaat acacaatggc agacctcgtc 13560
tatgctttaa ggcattttga tgaaggtaat tgtgacacat taaaagaaat acttgtcaca 13620
tacaattgtt gtgatgatga ttatttcaat aaaaaggact ggtatgattt tgtagaaaac 13680
ccagatatat tacgcgtata cgccaactta ggtgaacgtg tacgccaagc tttgttaaaa 13740
acagtacaat tctgtgatgc catgcgaaat gctggtattg ttggtgtact gacattagat 13800
aatcaagatc tcaatggtaa ctggtatgat ttcggtgatt tcatacaaac cacgccaggt 13860
agtggagttc ctgttgtaga ttcttattat tcattgttaa tgcctatatt aaccttgacc 13920
agggctttaa ctgcagagtc acatgttgac actgacttaa caaagcctta cattaagtgg 13980
gatttgttaa aatatgactt cacggaagag aggttaaaac tctttgaccg ttattttaaa 14040
tattgggatc agacatacca cccaaattgt gttaactgtt tggatgacag atgcattctg 14100
cattgtgcaa actttaatgt tttattctct acagtgttcc cacttacaag ttttggacca 14160
ctagtgagaa aaatatttgt tgatggtgtt ccatttgtag tttcaactgg ataccacttc 14220
agagagctag gtgttgtaca taatcaggat gtaaacttac atagctctag acttagtttt 14280
aaggaattac ttgtgtatgc tgctgaccct gctatgcacg ctgcttctgg taatctatta 14340
ctagataaac gcactacgtg cttttcagta gctgcactta ctaacaatgt tgcttttcaa 14400
actgtcaaac ccggtaattt taacaaagac ttctatgact ttgctgtgtc taagggtttc 14460
tttaaggaag gaagttctgt tgaattaaaa cacttcttct ttgctcagga tggtaatgct 14520
gctatcagcg attatgacta ctatcgttat aatctaccaa caatgtgtga tatcagacaa 14580
ctactatttg tagttgaagt tgttgataag tactttgatt gttacgatgg tggctgtatt 14640
aatgctaacc aagtcatcgt caacaaccta gacaaatcag ctggttttcc atttaataaa 14700
tggggtaagg ctagacttta ttatgattca atgagttatg aggatcaaga tgcacttttc 14760
gcatatacaa aacgtaatgt catccctact ataactcaaa tgaatcttaa gtatgccatt 14820
agtgcaaaga atagagctcg caccgtagct ggtgtctcta tctgtagtac tatgaccaat 14880
agacagtttc atcaaaaatt attgaaatca atagccgcca ctagaggagc tactgtagta 14940
attggaacaa gcaaattcta tggtggttgg cacaacatgt taaaaactgt ttatagtgat 15000
gtagaaaacc ctcaccttat gggttgggat tatcctaaat gtgatagagc catgcctaac 15060
atgcttagaa ttatggcctc acttgttctt gctcgcaaac atacaacgtg ttgtagcttg 15120
tcacaccgtt tctatagatt agctaatgag tgtgctcaag tattgagtga aatggtcatg 15180
tgtggcggtt cactatatgt taaaccaggt ggaacctcat caggagatgc cacaactgct 15240
tatgctaata gtgtttttaa catttgtcaa gctgtcacgg ccaatgttaa tgcactttta 15300
tctactgatg gtaacaaaat tgccgataag tatgtccgca atttacaaca cagactttat 15360
gagtgtctct atagaaatag agatgttgac acagactttg tgaatgagtt ttacgcatat 15420
ttgcgtaaac atttctcaat gatgatactc tctgacgatg ctgttgtgtg tttcaatagc 15480
acttatgcat ctcaaggtct agtggctagc ataaagaact ttaagtcagt tctttattat 15540
caaaacaatg tttttatgtc tgaagcaaaa tgttggactg agactgacct tactaaagga 15600
cctcatgaat tttgctctca acatacaatg ctagttaaac agggtgatga ttatgtgtac 15660
cttccttacc cagatccatc aagaatccta ggggccggct gttttgtaga tgatatcgta 15720
aaaacagatg gtacacttat gattgaacgg ttcgtgtctt tagctataga tgcttaccca 15780
cttactaaac atcctaatca ggagtatgct gatgtctttc atttgtactt acaatacata 15840
agaaagctac atgatgagtt aacaggacac atgttagaca tgtattctgt tatgcttact 15900
aatgataaca cttcaaggta ttgggaacct gagttttatg aggctatgta cacaccgcat 15960
acagtcttac aggctgttgg ggcttgtgtt ctttgcaatt cacagacttc attaagatgt 16020
ggtgcttgca tacgtagacc attcttatgt tgtaaatgct gttacgacca tgtcatatca 16080
acatcacata aattagtctt gtctgttaat ccgtatgttt gcaatgctcc aggttgtgat 16140
gtcacagatg tgactcaact ttacttagga ggtatgagct attattgtaa atcacataaa 16200
ccacccatta gttttccatt gtgtgctaat ggacaagttt ttggtttata taaaaataca 16260
tgtgttggta gcgataatgt tactgacttt aatgcaattg caacatgtga ctggacaaat 16320
gctggtgatt acattttagc taacacctgt actgaaagac tcaagctttt tgcagcagaa 16380
acgctcaaag ctactgagga gacatttaaa ctgtcttatg gtattgctac tgtacgtgaa 16440
gtgctgtctg acagagaatt acatctttca tgggaagttg gtaaacctag accaccactt 16500
aaccgaaatt atgtctttac tggttatcgt gtaactaaaa acagtaaagt acaaatagga 16560
gagtacacct ttgaaaaagg tgactatggt gatgctgttg tttaccgagg tacaacaact 16620
tacaaattaa atgttggtga ttattttgtg ctgacatcac atacagtaat gccattaagt 16680
gcacctacac tagtgccaca agagcactat gttagaatta ctggcttata cccaacactc 16740
aatatctcag atgagttttc tagcaatgtt gcaaattatc aaaaggttgg tatgcaaaag 16800
tattctacac tccagggacc acctggtact ggtaagagtc attttgctat tggcctagct 16860
ctctactacc cttctgctcg catagtgtat acagcttgct ctcatgccgc tgttgatgca 16920
ctatgtgaga aggcattaaa atatttgcct atagataaat gtagtagaat tatacctgca 16980
cgtgctcgtg tagagtgttt tgataaattc aaagtgaatt caacattaga acagtatgtc 17040
ttttgtactg taaatgcatt gcctgagacg acagcagata tagttgtctt tgatgaaatt 17100
tcaatggcca caaattatga tttgagtgtt gtcaatgcca gattacgtgc taagcactat 17160
gtgtacattg gcgaccctgc tcaattacct gcaccacgca cattgctaac taagggcaca 17220
ctagaaccag aatatttcaa ttcagtgtgt agacttatga aaactatagg tccagacatg 17280
ttcctcggaa cttgtcggcg ttgtcctgct gaaattgttg acactgtgag tgctttggtt 17340
tatgataata agcttaaagc acataaagac aaatcagctc aatgctttaa aatgttttat 17400
aagggtgtta tcacgcatga tgtttcatct gcaattaaca ggccacaaat aggcgtggta 17460
agagaattcc ttacacgtaa ccctgcttgg agaaaagctg tctttatttc accttataat 17520
tcacagaatg ctgtagcctc aaagattttg ggactaccaa ctcaaactgt tgattcatca 17580
cagggctcag aatatgacta tgtcatattc actcaaacca ctgaaacagc tcactcttgt 17640
aatgtaaaca gatttaatgt tgctattacc agagcaaaag taggcatact ttgcataatg 17700
tctgatagag acctttatga caagttgcaa tttacaagtc ttgaaattcc acgtaggaat 17760
gtggcaactt tacaagctga aaatgtaaca ggactcttta aagattgtag taaggtaatc 17820
actgggttac atcctacaca ggcacctaca cacctcagtg ttgacactaa attcaaaact 17880
gaaggtttat gtgttgacat acctggcata cctaaggaca tgacctatag aagactcatc 17940
tctatgatgg gttttaaaat gaattatcaa gttaatggtt accctaacat gtttatcacc 18000
cgcgaagaag ctataagaca tgtacgtgca tggattggct tcgatgtcga ggggtgtcat 18060
gctactagag aagctgttgg taccaattta cctttacagc taggtttttc tacaggtgtt 18120
aacctagttg ctgtacctac aggttatgtt gatacaccta ataatacaga tttttccaga 18180
gttagtgcta aaccaccgcc tggagatcaa tttaaacacc tcataccact tatgtacaaa 18240
ggacttcctt ggaatgtagt gcgtataaag attgtacaaa tgttaagtga cacacttaaa 18300
aatctctctg acagagtcgt atttgtctta tgggcacatg gctttgagtt gacatctatg 18360
aagtattttg tgaaaatagg acctgagcgc acctgttgtc tatgtgatag acgtgccaca 18420
tgcttttcca ctgcttcaga cacttatgcc tgttggcatc attctattgg atttgattac 18480
gtctataatc cgtttatgat tgatgttcaa caatggggtt ttacaggtaa cctacaaagc 18540
aaccatgatc tgtattgtca agtccatggt aatgcacatg tagctagttg tgatgcaatc 18600
atgactaggt gtctagctgt ccacgagtgc tttgttaagc gtgttgactg gactattgaa 18660
tatcctataa ttggtgatga actgaagatt aatgcggctt gtagaaaggt tcaacacatg 18720
gttgttaaag ctgcattatt agcagacaaa ttcccagttc ttcacgacat tggtaaccct 18780
aaagctatta agtgtgtacc tcaagctgat gtagaatgga agttctatga tgcacagcct 18840
tgtagtgaca aagcttataa aatagaagaa ttattctatt cttatgccac acattctgac 18900
aaattcacag atggtgtatg cctattttgg aattgcaatg tcgatagata tcctgctaat 18960
tccattgttt gtagatttga cactagagtg ctatctaacc ttaacttgcc tggttgtgat 19020
ggtggcagtt tgtatgtaaa taaacatgca ttccacacac cagcttttga taaaagtgct 19080
tttgttaatt taaaacaatt accatttttc tattactctg acagtccatg tgagtctcat 19140
ggaaaacaag tagtgtcaga tatagattat gtaccactaa agtctgctac gtgtataaca 19200
cgttgcaatt taggtggtgc tgtctgtaga catcatgcta atgagtacag attgtatctc 19260
gatgcttata acatgatgat ctcagctggc tttagcttgt gggtttacaa acaatttgat 19320
acttataacc tctggaacac ttttacaaga cttcagagtt tagaaaatgt ggcttttaat 19380
gttgtaaata agggacactt tgatggacaa cagggtgaag taccagtttc tatcattaat 19440
aacactgttt acacaaaagt tgatggtgtt gatgtagaat tgtttgaaaa taaaacaaca 19500
ttacctgtta atgtagcatt tgagctttgg gctaagcgca acattaaacc agtaccagag 19560
gtgaaaatac tcaataattt gggtgtggac attgctgcta atactgtgat ctgggactac 19620
aaaagagatg ctccagcaca tatatctact attggtgttt gttctatgac tgacatagcc 19680
aagaaaccaa ctgaaacgat ttgtgcacca ctcactgtct tttttgatgg tagagttgat 19740
ggtcaagtag acttatttag aaatgcccgt aatggtgttc ttattacaga aggtagtgtt 19800
aaaggtttac aaccatctgt aggtcccaaa caagctagtc ttaatggagt cacattaatt 19860
ggagaagccg taaaaacaca gttcaattat tataagaaag ttgatggtgt tgtccaacaa 19920
ttacctgaaa cttactttac tcagagtaga aatttacaag aatttaaacc caggagtcaa 19980
atggaaattg atttcttaga attagctatg gatgaattca ttgaacggta taaattagaa 20040
ggctatgcct tcgaacatat cgtttatgga gattttagtc atagtcagtt aggtggttta 20100
catctactga ttggactagc taaacgtttt aaggaatcac cttttgaatt agaagatttt 20160
attcctatgg acagtacagt taaaaactat ttcataacag atgcgcaaac aggttcatct 20220
aagtgtgtgt gttctgttat tgatttatta cttgatgatt ttgttgaaat aataaaatcc 20280
caagatttat ctgtagtttc taaggttgtc aaagtgacta ttgactatac agaaatttca 20340
tttatgcttt ggtgtaaaga tggccatgta gaaacatttt acccaaaatt acaatctagt 20400
caagcgtggc aaccgggtgt tgctatgcct aatctttaca aaatgcaaag aatgctatta 20460
gaaaagtgtg accttcaaaa ttatggtgat agtgcaacat tacctaaagg cataatgatg 20520
aatgtcgcaa aatatactca actgtgtcaa tatttaaaca cattaacatt agctgtaccc 20580
tataatatga gagttataca ttttggtgct ggttctgata aaggagttgc accaggtaca 20640
gctgttttaa gacagtggtt gcctacgggt acgctgcttg tcgattcaga tcttaatgac 20700
tttgtctctg atgcagattc aactttgatt ggtgattgtg caactgtaca tacagctaat 20760
aaatgggatc tcattattag tgatatgtac gaccctaaga ctaaaaatgt tacaaaagaa 20820
aatgactcta aagagggttt tttcacttac atttgtgggt ttatacaaca aaagctagct 20880
cttggaggtt ccgtggctat aaagataaca gaacattctt ggaatgctga tctttataag 20940
ctcatgggac acttcgcatg gtggacagcc tttgttacta atgtgaatgc gtcatcatct 21000
gaagcatttt taattggatg taattatctt ggcaaaccac gcgaacaaat agatggttat 21060
gtcatgcatg caaattacat attttggagg aatacaaatc caattcagtt gtcttcctat 21120
tctttatttg acatgagtaa atttcccctt aaattaaggg gtactgctgt tatgtcttta 21180
aaagaaggtc aaatcaatga tatgatttta tctcttctta gtaaaggtag acttataatt 21240
agagaaaaca acagagttgt tatttctagt gatgttcttg ttaacaacta a 21291
<210> 4
<211> 21291
<212> DNA
<213> 严重急性呼吸综合征冠状病毒2
<400> 4
atggagagcc ttgtccctgg tttcaacgag aaaacacacg tccaactcag tttgcctgtt 60
ttacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 120
gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 180
ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 240
catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 300
ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 360
gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 420
aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 480
tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 540
gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 600
attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtccga acaactggac 660
tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 720
tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 780
aagaaatttg acaccttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 840
atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 900
cgatctgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 960
atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 1020
tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 1080
ccccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 1140
gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 1200
ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 1260
gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 1320
gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 1380
atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 1440
tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 1500
caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 1560
tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 1620
gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 1680
gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 1740
attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 1800
attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 1860
tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 1920
tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 1980
ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 2040
cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 2100
aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 2160
gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 2220
ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 2280
ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 2340
acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 2400
gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 2460
acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 2520
atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 2580
acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 2640
aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 2700
agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 2760
tattgttctt tttaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 2820
tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 2880
gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 2940
gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 3000
actattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 3060
cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 3120
aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 3180
gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 3240
aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 3300
ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 3360
aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 3420
cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 3480
tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 3540
aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 3600
caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 3660
tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 3720
acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 3780
ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 3840
aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 3900
atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 3960
ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 4020
gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 4080
tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 4140
catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 4200
actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 4260
agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 4320
ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 4380
gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 4440
gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 4500
tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 4560
acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 4620
cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 4680
tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 4740
acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 4800
ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 4860
ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 4920
agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 4980
gttaatggtt taacttctat taaatgggca gataacaact gttatcttgc cactgcattg 5040
ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 5100
agagcaaggg ctggtgaagc tgctaacttt tgtgcactta tcttagccta ctgtaataag 5160
acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 5220
ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 5280
acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 5340
aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 5400
gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 5460
tttacttgtg ctagtgagta cactggtaat taccagtgtg gtcactataa acatataact 5520
tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 5580
ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 5640
acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 5700
aagaaagaca attcttattt cacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 5760
ccaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 5820
ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 5880
cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 5940
aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 6000
gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 6060
acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 6120
tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 6180
gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 6240
aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 6300
gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 6360
acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 6420
tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 6480
ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 6540
acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 6600
aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 6660
cctaattttt ctaaactgat aaatattata atttggtttt tactattaag tgtttgccta 6720
ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 6780
tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 6840
tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 6900
tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 6960
tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 7020
cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 7080
aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 7140
gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 7200
gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 7260
gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 7320
ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 7380
ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 7440
ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 7500
atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 7560
tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 7620
atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 7680
tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 7740
ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 7800
acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 7860
gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 7920
tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 7980
tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 8040
gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 8100
gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 8160
ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 8220
aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 8280
aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 8340
ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 8400
gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 8460
gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 8520
cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 8580
gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 8640
tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 8700
aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 8760
atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 8820
ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 8880
attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 8940
tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 9000
agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 9060
gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 9120
ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 9180
gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 9240
aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 9300
ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 9360
tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 9420
acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 9480
ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 9540
tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 9600
cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 9660
atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 9720
ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 9780
gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 9840
gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 9900
tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 9960
ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 10020
attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 10080
acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 10140
tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 10200
ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 10260
tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 10320
gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 10380
acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 10440
tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 10500
aattatgaac ctctaacaca agaccatgtt gacatactag gacctctttc tgctcaaact 10560
ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 10620
ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 10680
agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 10740
cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 10800
tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 10860
atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 10920
ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 10980
atgcgtatta tgacatggtt ggatatggtt gatactagtt tgtctggttt taagctaaaa 11040
gactgtgtta tgtatgcatc agctgtagtg ttactaatcc ttatgacagc aagaactgtg 11100
tatgatgatg gtgctaggag agtgtggaca cttatgaatg tcttgacact cgtttataaa 11160
gtttattatg gtaatgcttt agatcaagcc atttccatgt gggctcttat aatctctgtt 11220
acttctaact actcaggtgt agttacaact gtcatgtttt tggccagagg tattgttttt 11280
atgtgtgttg agtattgccc tattttcttc ataactggta atacacttca gtgtataatg 11340
ctagtttatt gtttcttagg ctatttttgt acttgttact ttggcctctt ttgtttactc 11400
aaccgctact ttagactgac tcttggtgtt tatgattact tagtttctac acaggagttt 11460
agatatatga attcacaggg actactccca cccaagaata gcatagatgc cttcaaactc 11520
aacattaaat tgttgggtgt tggtggcaaa ccttgtatca aagtagccac tgtacagtct 11580
aaaatgtcag atgtaaagtg cacatcagta gtcttactct cagttttgca acaactcaga 11640
gtagaatcat catctaaatt gtgggctcaa tgtgtccagt tacacaatga cattctctta 11700
gctaaagata ctactgaagc ctttgaaaaa atggtttcac tactttctgt tttgctttcc 11760
atgcagggtg ctgtagacat aaacaagctt tgtgaagaaa tgctggacaa cagggcaacc 11820
ttacaagcta tagcctcaga gtttagttcc cttccatcat atgcagcttt tgctactgct 11880
caagaagctt atgagcaggc tgttgctaat ggtgattctg aagttgttct taaaaagttg 11940
aagaagtctt tgaatgtggc taaatctgaa tttgaccgtg atgcagccat gcaacgtaag 12000
ttggaaaaga tggctgatca agctatgacc caaatgtata aacaggctag atctgaggac 12060
aagagggcaa aagttactag tgctatgcag acaatgcttt tcactatgct tagaaagttg 12120
gataatgatg cactcaacaa cattatcaac aatgcaagag atggttgtgt tcccttgaac 12180
ataatacctc ttacaacagc agccaaacta atggttgtca taccagacta taacacatat 12240
aaaaatacgt gtgatggtac aacatttact tatgcatcag cattgtggga aatccaacag 12300
gttgtagatg cagatagtaa aattgttcaa cttagtgaaa ttagtatgga caattcacct 12360
aatttagcat ggcctcttat tgtaacagct ttaagggcca attctgctgt caaattacag 12420
aataatgagc ttagtcctgt tgcactacga cagatgtctt gtgctgccgg tactacacaa 12480
actgcttgca ctgatgacaa tgcgttagct tactacaaca caacaaaggg aggtaggttt 12540
gtacttgcac tgttatccga tttacaggat ttgaaatggg ctagattccc taagagtgat 12600
ggaactggta ctatctatac agaactggaa ccaccttgta ggtttgttac agacacacct 12660
aaaggtccta aagtgaagta tttatacttt attaaaggat taaacaacct aaatagaggt 12720
atggtacttg gtagtttagc tgccacagta cgtctacaag ctggtaatgc aacagaagtg 12780
cctgccaatt caactgtatt atctttctgt gcttttgctg tagatgctgc taaagcttac 12840
aaagattatc tagctagtgg gggacaacca atcactaatt gtgttaagat gttgtgtaca 12900
cacactggta ctggtcaggc aataacagtt acaccggaag ccaatatgga tcaagaatcc 12960
tttggtggtg catcgtgttg tctgtactgc cgttgccaca tagatcatcc aaatcctaaa 13020
ggattttgtg acttaaaagg taagtatgta caaataccta caacttgtgc taatgaccct 13080
gtgggtttta cacttaaaaa cacagtctgt accgtctgcg gtatgtggaa aggttatggc 13140
tgtagttgtg atcaactccg cgaacccatg cttcagtcag ctgatgcaca atcgttttta 13200
aaccgggttt gcggtgtaag tgcagcccgt cttacaccgt gcggcacagg cactagtact 13260
gatgtcgtat acagggcttt tgacatctac aatgataaag tagctggttt tgctaaattc 13320
ctaaaaacta attgttgtcg cttccaagaa aaggacgaag atgacaattt aattgattct 13380
tactttgtag ttaagagaca cactttctct aactaccaac atgaagaaac aatttataat 13440
ttacttaagg attgtccagc tgttgctaaa catgacttct ttaagtttag aatagacggt 13500
gacatggtac cacatatatc acgtcaacgt cttactaaat acacaatggc agacctcgtc 13560
tatgctttaa ggcattttga tgaaggtaat tgtgacacat taaaagaaat acttgtcaca 13620
tacaattgtt gtgatgatga ttatttcaat aaaaaggact ggtatgattt tgtagaaaac 13680
ccagatatat tacgcgtata cgccaactta ggtgaacgtg tacgccaagc tttgttaaaa 13740
acagtacaat tctgtgatgc catgcgaaat gctggtattg ttggtgtact gacattagat 13800
aatcaagatc tcaatggtaa ctggtatgat ttcggtgatt tcatacaaac cacgccaggt 13860
agtggagttc ctgttgtaga ttcttattat tcattgttaa tgcctatatt aaccttgacc 13920
agggctttaa ctgcagagtc acatgttgac actgacttaa caaagcctta cattaagtgg 13980
gatttgttaa aatatgactt cacggaagag aggttaaaac tctttgaccg ttattttaaa 14040
tattgggatc agacatacca cccaaattgt gttaactgtt tggatgacag atgcattctg 14100
cattgtgcaa actttaatgt tttattctct acagtgttcc cacttacaag ttttggacca 14160
ctagtgagaa aaatatttgt tgatggtgtt ccatttgtag tttcaactgg ataccacttc 14220
agagagctag gtgttgtaca taatcaggat gtaaacttac atagctctag acttagtttt 14280
aaggaattac ttgtgtatgc tgctgaccct gctatgcacg ctgcttctgg taatctatta 14340
ctagataaac gcactacgtg cttttcagta gctgcactta ctaacaatgt tgcttttcaa 14400
actgtcaaac ccggtaattt taacaaagac ttctatgact ttgctgtgtc taagggtttc 14460
tttaaggaag gaagttctgt tgaattaaaa cacttcttct ttgctcagga tggtaatgct 14520
gctatcagcg attatgacta ctatcgttat aatctaccaa caatgtgtga tatcagacaa 14580
ctactatttg tagttgaagt tgttgataag tactttgatt gttacgatgg tggctgtatt 14640
aatgctaacc aagtcatcgt caacaaccta gacaaatcag ctggttttcc atttaataaa 14700
tggggtaagg ctagacttta ttatgattca atgagttatg aggatcaaga tgcacttttc 14760
gcatatacaa aacgtaatgt catccctact ataactcaaa tgaatcttaa gtatgccatt 14820
agtgcaaaga atagagctcg caccgtagct ggtgtctcta tctgtagtac tatgaccaat 14880
agacagtttc atcaaaaatt attgaaatca atagccgcca ctagaggagc tactgtagta 14940
attggaacaa gcaaattcta tggtggttgg cacaacatgt taaaaactgt ttatagtgat 15000
gtagaaaacc ctcaccttat gggttgggat tatcctaaat gtgatagagc catgcctaac 15060
atgcttagaa ttatggcctc acttgttctt gctcgcaaac atacaacgtg ttgtagcttg 15120
tcacaccgtt tctatagatt agctaatgag tgtgctcaag tattgagtga aatggtcatg 15180
tgtggcggtt cactatatgt taaaccaggt ggaacctcat caggagatgc cacaactgct 15240
tatgctaata gtgtttttaa catttgtcaa gctgtcacgg ccaatgttaa tgcactttta 15300
tctactgatg gtaacaaaat tgccgataag tatgtccgca atttacaaca cagactttat 15360
gagtgtctct atagaaatag agatgttgac acagactttg tgaatgagtt ttacgcatat 15420
ttgcgtaaac atttctcaat gatgatactc tctgacgatg ctgttgtgtg tttcaatagc 15480
acttatgcat ctcaaggtct agtggctagc ataaagaact ttaagtcagt tctttattat 15540
caaaacaatg tttttatgtc tgaagcaaaa tgttggactg agactgacct tactaaagga 15600
cctcatgaat tttgctctca acatacaatg ctagttaaac agggtgatga ttatgtgtac 15660
cttccttacc cagatccatc aagaatccta ggggccggct gttttgtaga tgatatcgta 15720
aaaacagatg gtacacttat gattgaacgg ttcgtgtctt tagctataga tgcttaccca 15780
cttactaaac atcctaatca ggagtatgct gatgtctttc atttgtactt acaatacata 15840
agaaagctac atgatgagtt aacaggacac atgttagaca tgtattctgt tatgcttact 15900
aatgataaca cttcaaggta ttgggaacct gagttttatg aggctatgta cacaccgcat 15960
acagtcttac aggctgttgg ggcttgtgtt ctttgcaatt cacagacttc attaagatgt 16020
ggtgcttgca tacgtagacc attcttatgt tgtaaatgct gttacgacca tgtcatatca 16080
acatcacata aattagtctt gtctgttaat ccgtatgttt gcaatgctcc aggttgtgat 16140
gtcacagatg tgactcaact ttacttagga ggtatgagct attattgtaa atcacataaa 16200
ccacccatta gttttccatt gtgtgctaat ggacaagttt ttggtttata taaaaataca 16260
tgtgttggta gcgataatgt tactgacttt aatgcaattg caacatgtga ctggacaaat 16320
gctggtgatt acattttagc taacacctgt actgaaagac tcaagctttt tgcagcagaa 16380
acgctcaaag ctactgagga gacatttaaa ctgtcttatg gtattgctac tgtacgtgaa 16440
gtgctgtctg acagagaatt acatctttca tgggaagttg gtaaacctag accaccactt 16500
aaccgaaatt atgtctttac tggttatcgt gtaactaaaa acagtaaagt acaaatagga 16560
gagtacacct ttgaaaaagg tgactatggt gatgctgttg tttaccgagg tacaacaact 16620
tacaaattaa atgttggtga ttattttgtg ctgacatcac atacagtaat gccattaagt 16680
gcacctacac tagtgccaca agagcactat gttagaatta ctggcttata cccaacactc 16740
aatatctcag atgagttttc tagcaatgtt gcaaattatc aaaaggttgg tatgcaaaag 16800
tattctacac tccagggacc acctggtact ggtaagagtc attttgctat tggcctagct 16860
ctctactacc cttctgctcg catagtgtat acagcttgct ctcatgccgc tgttgatgca 16920
ctatgtgaga aggcattaaa atatttgcct atagataaat gtagtagaat tatacctgca 16980
cgtgctcgtg tagagtgttt tgataaattc aaagtgaatt caacattaga acagtatgtc 17040
ttttgtactg taaatgcatt gcctgagacg acagcagata tagttgtctt tgatgaaatt 17100
tcaatggcca caaattatga tttgagtgtt gtcaatgcca gattacgtgc taagcactat 17160
gtgtacattg gcgaccctgc tcaattacct gcaccacgca cattgctaac taagggcaca 17220
ctagaaccag aatatttcaa ttcagtgtgt agacttatga aaactatagg tccagacatg 17280
ttcctcggaa cttgtcggcg ttgtcctgct gaaattgttg acactgtgag tgctttggtt 17340
tatgataata agcttaaagc acataaagac aaatcagctc aatgctttaa aatgttttat 17400
aagggtgtta tcacgcatga tgtttcatct gcaattaaca ggccacaaat aggcgtggta 17460
agagaattcc ttacacgtaa ccctgcttgg agaaaagctg tctttatttc accttataat 17520
tcacagaatg ctgtagcctc aaagattttg ggactaccaa ctcaaactgt tgattcatca 17580
cagggctcag aatatgacta tgtcatattc actcaaacca ctgaaacagc tcactcttgt 17640
aatgtaaaca gatttaatgt tgctattacc agagcaaaag taggcatact ttgcataatg 17700
tctgatagag acctttatga caagttgcaa tttacaagtc ttgaaattcc acgtaggaat 17760
gtggcaactt tacaagctga aaatgtaaca ggactcttta aagattgtag taaggtaatc 17820
actgggttac atcctacaca ggcacctaca cacctcagtg ttgacactaa attcaaaact 17880
gaaggtttat gtgttgacat acctggcata cctaaggaca tgacctatag aagactcatc 17940
tctatgatgg gttttaaaat gaattatcaa gttaatggtt accctaacat gtttatcacc 18000
cgcgaagaag ctataagaca tgtacgtgca tggattggct tcgatgtcga ggggtgtcat 18060
gctactagag aagctgttgg taccaattta cctttacagc taggtttttc tacaggtgtt 18120
aacctagttg ctgtacctac aggttatgtt gatacaccta ataatacaga tttttccaga 18180
gttagtgcta aaccaccgcc tggagatcaa tttaaacacc tcataccact tatgtacaaa 18240
ggacttcctt ggaatgtagt gcgtataaag attgtacaaa tgttaagtga cacacttaaa 18300
aatctctctg acagagtcgt atttgtctta tgggcacatg gctttgagtt gacatctatg 18360
aagtattttg tgaaaatagg acctgagcgc acctgttgtc tatgtgatag acgtgccaca 18420
tgcttttcca ctgcttcaga cacttatgcc tgttggcatc attctattgg atttgattac 18480
gtctataatc cgtttatgat tgatgttcaa caatggggtt ttacaggtaa cctacaaagc 18540
aaccatgatc tgtattgtca agtccatggt aatgcacatg tagctagttg tgatgcaatc 18600
atgactaggt gtctagctgt ccacgagtgc tttgttaagc gtgttgactg gactattgaa 18660
tatcctataa ttggtgatga actgaagatt aatgcggctt gtagaaaggt tcaacacatg 18720
gttgttaaag ctgcattatt agcagacaaa ttcccagttc ttcacgacat tggtaaccct 18780
aaagctatta agtgtgtacc tcaagctgat gtagaatgga agttctatga tgcacagcct 18840
tgtagtgaca aagcttataa aatagaagaa ttattctatt cttatgccac acattctgac 18900
aaattcacag atggtgtatg cctattttgg aattgcaatg tcgatagata tcctgctaat 18960
tccattgttt gtagatttga cactagagtg ctatctaacc ttaacttgcc tggttgtgat 19020
ggtggcagtt tgtatgtaaa taaacatgca ttccacacac cagcttttga taaaagtgct 19080
tttgttaatt taaaacaatt accatttttc tattactctg acagtccatg tgagtctcat 19140
ggaaaacaag tagtgtcaga tatagattat gtaccactaa agtctgctac gtgtataaca 19200
cgttgcaatt taggtggtgc tgtctgtaga catcatgcta atgagtacag attgtatctc 19260
gatgcttata acatgatgat ctcagctggc tttagcttgt gggtttacaa acaatttgat 19320
acttataacc tctggaacac ttttacaaga cttcagagtt tagaaaatgt ggcttttaat 19380
gttgtaaata agggacactt tgatggacaa cagggtgaag taccagtttc tatcattaat 19440
aacactgttt acacaaaagt tgatggtgtt gatgtagaat tgtttgaaaa taaaacaaca 19500
ttacctgtta atgtagcatt tgagctttgg gctaagcgca acattaaacc agtaccagag 19560
gtgaaaatac tcaataattt gggtgtggac attgctgcta atactgtgat ctgggactac 19620
aaaagagatg ctccagcaca tatatctact attggtgttt gttctatgac tgacatagcc 19680
aagaaaccaa ctgaaacgat ttgtgcacca ctcactgtct tttttgatgg tagagttgat 19740
ggtcaagtag acttatttag aaatgcccgt aatggtgttc ttattacaga aggtagtgtt 19800
aaaggtttac aaccatctgt aggtcccaaa caagctagtc ttaatggagt cacattaatt 19860
ggagaagccg taaaaacaca gttcaattat tataagaaag ttgatggtgt tgtccaacaa 19920
ttacctgaaa cttactttac tcagagtaga aatttacaag aatttaaacc caggagtcaa 19980
atggaaattg atttcttaga attagctatg gatgaattca ttgaacggta taaattagaa 20040
ggctatgcct tcgaacatat cgtttatgga gattttagtc atagtcagtt aggtggttta 20100
catctactga ttggactagc taaacgtttt aaggaatcac cttttgaatt agaagatttt 20160
attcctatgg acagtacagt taaaaactat ttcataacag atgcgcaaac aggttcatct 20220
aagtgtgtgt gttctgttat tgatttatta cttgatgatt ttgttgaaat aataaaatcc 20280
caagatttat ctgtagtttc taaggttgtc aaagtgacta ttgactatac agaaatttca 20340
tttatgcttt ggtgtaaaga tggccatgta gaaacatttt acccaaaatt acaatctagt 20400
caagcgtggc aaccgggtgt tgctatgcct aatctttaca aaatgcaaag aatgctatta 20460
gaaaagtgtg accttcaaaa ttatggtgat agtgcaacat tacctaaagg cataatgatg 20520
aatgtcgcaa aatatactca actgtgtcaa tatttaaaca cattaacatt agctgtaccc 20580
tataatatga gagttataca ttttggtgct ggttctgata aaggagttgc accaggtaca 20640
gctgttttaa gacagtggtt gcctacgggt acgctgcttg tcgattcaga tcttaatgac 20700
tttgtctctg atgcagattc aactttgatt ggtgattgtg caactgtaca tacagctaat 20760
aaatgggatc tcattattag tgatatgtac gaccctaaga ctaaaaatgt tacaaaagaa 20820
aatgactcta aagagggttt tttcacttac atttgtgggt ttatacaaca aaagctagct 20880
cttggaggtt ccgtggctat aaagataaca gaacattctt ggaatgctga tctttataag 20940
ctcatgggac acttcgcatg gtggacagcc tttgttacta atgtgaatgc gtcatcatct 21000
gaagcatttt taattggatg taattatctt ggcaaaccac gcgaacaaat agatggttat 21060
gtcatgcatg caaattacat attttggagg aatacaaatc caattcagtt gtcttcctat 21120
tctttatttg acatgagtaa atttcccctt aaattaaggg gtactgctgt tatgtcttta 21180
aaagaaggtc aaatcaatga tatgatttta tctcttctta gtaaaggtag acttataatt 21240
agagaaaaca acagagttgt tatttctagt gatgttcttg ttaacaacta a 21291
<210> 5
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 5
accctgaaag tacgtgcatt acatg 25
<210> 6
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 6
atgtctatta cgtcacacta ttatg 25
<210> 7
<211> 106
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多核苷酸
<400> 7
aataacccct ttaccgaaaa ctgggatcat gcttcttcgg tgcccattac gaggtgcgga 60
tagctaccgc gcagacacga tagtctatag aatttggaca atcatg 106
<210> 8
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 8
ttaactactc cagttttcgg taaaggggtt att 33
<210> 9
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 9
catgattgtc caaattctag attaatg 27

Claims (48)

1.一种用于核酸检测的方法,所述方法包括:
(a)使获自样品的核酸序列与包括远端和近端的核酸探针分子在足以使所述核酸探针分子的所述远端和所述核酸探针分子的所述近端与所述核酸序列偶联的条件下接触,从而形成环状核酸探针分子;以及
(b)通过鉴定所述环状核酸探针分子的序列来检测所述核酸序列的存在,其中所述检测包括在聚合酶的存在下在(i)所述环状核酸探针分子或其衍生物与(ii)包括可检测标记的核苷酸部分之间进行核苷酸结合反应,其中所述核苷酸结合反应是在所述核苷酸部分未掺入所述环状核酸探针分子或其衍生物中的情况下进行的。
2.根据权利要求1所述的方法,其中所述环状核酸探针分子在其序列中包括缺口。
3.根据权利要求2所述的方法,进一步包括使所述核酸探针分子与聚合酶在足以进行延伸反应的条件下接触,从而用所述核酸序列的一部分的拷贝填补所述缺口。
4.根据权利要求3所述的方法,其中(b)中鉴定的所述环状核酸探针分子的所述序列包括所述核酸序列的所述部分。
5.根据权利要求3所述的方法,进一步包括在所述延伸反应后,使所述核酸探针分子与连接酶在足以将所述核酸探针分子的所述远端连接至所述核酸探针分子的所述近端的条件下接触。
6.根据权利要求2所述的方法,其中所述缺口的长度包括1至200个连续核苷酸。
7.根据权利要求1所述的方法,进一步包括使所述核酸探针分子与连接酶在足以将所述核酸探针分子的所述远端连接至所述核酸探针分子的所述近端的条件下接触,从而形成所述环状核酸探针分子。
8.根据权利要求1所述的方法,其中所述核酸探针分子在未杂交时是线性的。
9.根据权利要求1所述的方法,其中(b)中鉴定的所述环状核酸探针分子的所述核酸序列包括条形码序列,所述条形码序列在被鉴定时独特地鉴定所述核酸序列的所述存在。
10.根据权利要求1所述的方法,进一步包括:
(c)重复(a)至(b),以鉴定样品中多个所述环状核酸探针分子的多个所述核酸序列;以及
(d)对(c)中鉴定到所述多个所述核酸序列中的每个所述核酸序列的次数进行计数。
11.根据权利要求10所述的方法,进一步包括确定所述样品中所述核酸序列的拷贝数,其中所述样品中所述核酸序列的所述拷贝数与(d)中计数到所述每个所述核酸序列的所述次数成比例。
12.根据权利要求1所述的方法,进一步包括多路复用所述方法,包括:
(c)重复(a)至(b),以鉴定所述样品中多个所述环状核酸探针分子的多个所述核酸序列,其中所述多个所述环状核酸探针分子的第一子集不同于所述多个所述环状核酸分子的第二子集;以及
(d)对(c)中鉴定到所述第一子集的第一核酸序列和所述第二子集的第二核酸序列的次数进行计数。
13.根据权利要求12所述的方法,其中所述多个所述环状核酸探针分子的所述第一子集与所述多个所述环状核酸分子的所述第二子集的不同之处在于:
(i)所述第一子集包括与所述第二子集不同的条形码序列;
(ii)所述第一子集包括与所述第二子集不同的远端或近端;或
(iii)(i)和(ii)的组合。
14.根据权利要求1所述的方法,进一步包括检测所述样品中第二核酸序列的存在,包括:
(c)使所述样品中的所述第二核酸序列与第二核酸探针分子在足以使所述第二核酸序列与所述第二核酸探针分子偶联的条件下接触,从而形成第二环状核酸探针分子;以及
(d)使所述第二环状核酸探针分子或其衍生物与(i)第二聚合酶和(ii)包括第二可检测标记的第二核苷酸部分在足以引起所述第二环状核酸探针分子或其衍生物与所述第二核苷酸部分之间发生第二核苷酸结合反应的条件下、在所述第二核苷酸部分未掺入所述第二环状核酸探针分子或其衍生物中的情况下接触,其中所述第二核酸序列不同于(b)中检测到的所述核酸序列。
15.根据权利要求1所述的方法,进一步包括扩增所述环状核酸探针分子,以产生所述其衍生物。
16.根据权利要求15所述的方法,其中所述扩增包括进行滚环扩增。
17.根据权利要求1所述的方法,其中所述核苷酸部分与聚合物-核苷酸组合物中的聚合物核偶联,形成聚合物-核苷酸缀合物。
18.根据权利要求17所述的方法,其中所述可检测标记与所述聚合物-核苷酸组合物的所述聚合物核偶联。
19.根据权利要求1所述的方法,其中所述核苷酸结合反应包括所述核苷酸部分中的两个或更多个与所述核酸序列的两个或更多个拷贝之间的两个或更多个结合事件。
20.根据权利要求1所述的方法,其中所述可检测标记包括荧光标记。
21.根据权利要求1所述的方法,进一步包括检测来源于第二样品的第二核酸序列的存在,包括:
(c)使所述第二样品中的所述第二核酸序列与第二核酸探针分子在足以使所述第二核酸序列与所述第二核酸探针分子偶联的条件下接触,从而形成第二环状核酸探针分子;以及
(d)使所述第二环状核酸探针分子或其衍生物与(i)第二聚合酶和(ii)包括第二可检测标记的第二核苷酸部分在足以引起所述第二环状核酸探针分子或其衍生物与所述第二核苷酸部分之间发生第二核苷酸结合反应的条件下、在所述第二核苷酸部分未掺入所述第二环状核酸探针分子或其衍生物中的情况下接触,其中所述第二核酸序列不同于(b)中检测到的所述核酸序列,从而检测所述第二样品中所述第二核酸序列的存在。
22.根据权利要求21所述的方法,其中所述第二样品获自与所述样品不同的来源。
23.根据权利要求21所述的方法,进一步包括通过所述核酸序列和所述第二核酸序列的病原体来源追踪病原体感染,其中所述追踪包括将收集所述样品的第一位置或第一时间与收集所述第二样品的第二位置或第二时间进行比较。
24.根据权利要求1-23中任一项所述的方法,其中所述样品获自包括以下项的来源:
(i)土壤;
(ii)污水;
(iii)生物组织;
(iv)食品;
(v)与(i)至(iv)中的一个或多个接触的物体表面;或
(vi)(i)至(v)的任何组合。
25.一种用于核酸检测的系统,所述系统包括:
一个或多个计算机处理器,其单独地或共同地经编程以实施方法,包括:
(a)使核酸序列与核酸探针分子在足以引起(i)所述核酸探针分子的近端与所述核酸序列的第一部分偶联和(ii)所述核酸探针分子的远端与所述核酸序列的第二部分偶联的条件下接触,从而形成环状核酸探针分子;以及
(b)使所述环状核酸探针分子或其衍生物与(i)聚合酶和(ii)包括可检测标记的核苷酸部分在足以引起所述环状核酸探针分子或其衍生物与所述核苷酸部分之间发生核苷酸结合反应的条件下、在所述核苷酸部分未掺入所述环状核酸探针分子或其衍生物中的情况下接触。
26.根据权利要求25所述的系统,进一步包括所述核酸探针分子,其中所述核酸探针分子包括(i)包括与所述核酸序列的所述第一部分互补的第一核酸序列的所述近端和(ii)包括与所述核酸序列的所述第二部分互补的第二核酸序列的所述远端。
27.根据权利要求25所述的系统,进一步包括具有表面的基底,所述表面包括与其偶联的聚合物层,其中所述环状核酸探针分子与所述聚合物层偶联。
28.根据权利要求27所述的系统,其中所述聚合物层包括亲水性聚合物。
29.根据权利要求28所述的系统,其中所述亲水性聚合物包括聚(乙二醇)(PEG)、聚(乙烯醇)(PVA)、聚(乙烯基吡啶)、聚(乙烯基吡咯烷酮)(PVP)、聚(丙烯酸)(PAA)、聚丙烯酰胺、聚(N-异丙基丙烯酰胺)(PNIPAM)、聚(甲基丙烯酸甲酯)(PMA)、聚(甲基丙烯酸2-羟乙基酯)(PHEMA)、聚(低聚(乙二醇)甲基醚甲基丙烯酸酯)(POEGMA)、聚谷氨酸(PGA)、聚赖氨酸、聚葡糖苷、链霉亲和素、葡聚糖或其任何组合。
30.根据权利要求27所述的系统,其中所述表面包括流动池的两个或更多个内表面。
31.根据权利要求25所述的系统,进一步包括连接酶或其催化活性片段,所述连接酶或其催化活性片段配置为连接所述核酸探针分子的所述近端和所述核酸探针分子的所述远端,以形成所述环状核酸探针分子。
32.根据权利要求25所述的系统,其中所述环状核酸探针分子在其核酸序列中包括缺口。
33.根据权利要求32所述的系统,进一步包括聚合酶,其配置为进行所述环状核酸探针分子的延伸反应,从而填补所述缺口。
34.根据权利要求33所述的系统,其中所述缺口用所述核酸序列的第三部分的拷贝填补。
35.根据权利要求32所述的系统,其中所述缺口的长度包括1至200个连续核苷酸。
36.根据权利要求25所述的系统,其中所述核酸探针分子在未杂交时是线性的。
37.根据权利要求25所述的系统,其中所述方法进一步包括重复(a)和(b),以鉴定所述环状核酸探针分子或其衍生物的序列,其中所述序列包括独特地鉴定所述序列的条形码序列。
38.根据权利要求25所述的系统,其中所述方法进一步包括:
(c)重复(a)至(b),以鉴定所述样品中多个所述环状核酸探针分子的多个所述核酸序列;以及
(d)对(c)中鉴定到所述多个所述环状核酸探针分子的所述多个所述序列中的每个序列的次数进行计数。
39.根据权利要求25所述的系统,进一步包括多个所述环状核酸探针分子,其包括所述多个所述环状核酸探针分子的第一子集和所述多个所述环状核酸探针分子的第二子集,其中所述第一子集不同于所述第二子集。
40.根据权利要求39所述的系统,其中所述方法进一步包括:
(c)重复(a)至(b),以鉴定所述样品中多个所述环状核酸探针分子的多个所述核酸序列;以及
(d)对(c)中鉴定到所述第一子集的第一序列和所述第二子集的第二序列的次数进行计数。
41.根据权利要求39或权利要求40所述的系统,其中所述多个所述环状核酸探针分子的所述第一子集与所述多个所述环状核酸探针分子的所述第二子集的不同之处在于:
(i)所述第一子集包括与所述第二子集不同的条形码序列;
(ii)所述第一子集包括与所述第二子集不同的远端或近端;或
(iii)(i)和(ii)的组合。
42.根据权利要求25所述的系统,进一步包括第二核酸探针分子,其中所述第二核酸探针分子配置为与不同于所述核酸序列的第二核酸序列偶联。
43.根据权利要求42所述的系统,其中所述方法进一步包括检测所述样品中所述第二核酸的存在,包括:
(c)使所述样品中的所述第二核酸序列与所述第二核酸探针分子在足以使所述第二核酸序列与所述第二核酸探针分子偶联的条件下接触,从而形成第二环状核酸探针分子;以及
(b)使所述第二环状核酸探针分子或其衍生物与(i)第二聚合酶和(ii)包括第二可检测标记的第二核苷酸部分在足以引起所述第二环状核酸探针分子或其衍生物与所述第二核苷酸部分之间发生第二核苷酸结合反应的条件下、在所述第二核苷酸部分未掺入所述第二环状核酸探针分子或其衍生物中的情况下接触。
44.根据权利要求25所述的系统,其中所述核苷酸部分与聚合物-核苷酸组合物中的聚合物核偶联。
45.根据权利要求44所述的系统,其中所述可检测标记与所述聚合物-核苷酸组合物中的所述聚合物核偶联,形成聚合物-核苷酸缀合物。
46.根据权利要求25所述的系统,其中所述核苷酸结合反应包括所述核苷酸部分中的两个或更多个与两个或更多个拷贝的所述核酸序列之间的两个或更多个结合事件。
47.根据权利要求25所述的系统,其中所述可检测标记包括荧光标记。
48.根据权利要求25所述的系统,其中所述核酸序列获自包括以下项的样品:
(i)土壤;
(ii)污水;
(iii)生物组织;
(iv)食品;
(v)与(i)至(iv)中的一个或多个接触的物体表面;或
(vi)(i)至(v)的任何组合。
CN202180066938.1A 2020-07-31 2021-07-30 多路复用covid-19锁式测定 Pending CN116323974A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063059723P 2020-07-31 2020-07-31
US63/059,723 2020-07-31
PCT/US2021/044002 WO2022026891A1 (en) 2020-07-31 2021-07-30 Multiplexed covid-19 padlock assay

Publications (1)

Publication Number Publication Date
CN116323974A true CN116323974A (zh) 2023-06-23

Family

ID=80036181

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180066938.1A Pending CN116323974A (zh) 2020-07-31 2021-07-30 多路复用covid-19锁式测定

Country Status (7)

Country Link
US (1) US20230295692A1 (zh)
EP (1) EP4189108A1 (zh)
CN (1) CN116323974A (zh)
AU (1) AU2021318171A1 (zh)
CA (1) CA3187412A1 (zh)
GB (1) GB202302432D0 (zh)
WO (1) WO2022026891A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB202100997D0 (en) * 2021-01-25 2021-03-10 Primer Design Ltd Composition and method
WO2024059550A1 (en) * 2022-09-12 2024-03-21 Element Biosciences, Inc. Double-stranded splint adaptors with universal long splint strands and methods of use

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190234874A1 (en) * 2016-07-19 2019-08-01 Altius Institute For Biomedical Sciences Methods for fluorescence imaging microscopy
EP3668998A1 (en) * 2017-10-06 2020-06-24 Cartana AB Rna templated ligation
US10704094B1 (en) * 2018-11-14 2020-07-07 Element Biosciences, Inc. Multipart reagents having increased avidity for polymerase binding

Also Published As

Publication number Publication date
US20230295692A1 (en) 2023-09-21
AU2021318171A1 (en) 2023-03-23
WO2022026891A1 (en) 2022-02-03
GB202302432D0 (en) 2023-04-05
EP4189108A1 (en) 2023-06-07
CA3187412A1 (en) 2022-02-03

Similar Documents

Publication Publication Date Title
US11768200B2 (en) Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction
US7666593B2 (en) Single molecule sequencing of captured nucleic acids
JP6018092B2 (ja) 回転依存転写配列決定システムおよび使用方法
JP2014512176A (ja) マルチプレックス配列決定反応における核酸鋳型の同定
KR102607124B1 (ko) 핵산 분석을 위한 다가 결합 조성물
US20240043921A1 (en) Methods of sequencing with linked fragments
JP2020513741A (ja) 連結型ライゲーション
CN116194592A (zh) 流动池系统和装置
US20230295692A1 (en) Multiplexed covid-19 padlock assay
JP7332235B2 (ja) ポリヌクレオチドを配列決定する方法
US20210198731A1 (en) Linked target capture and ligation
WO2020227953A1 (zh) 一种基于自发光的单通道测序方法
RU2794177C1 (ru) Способ одноканального секвенирования на основе самолюминесценции
CN113748216B (zh) 一种基于自发光的单通道测序方法
WO2011108344A1 (ja) 基板上に固定化された複数の核酸検体の識別方法及び装置
JP2012191876A (ja) ポリヌクレオチドシーケンス法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40096585

Country of ref document: HK