CN102257162A - 保持序列的dna转化 - Google Patents

保持序列的dna转化 Download PDF

Info

Publication number
CN102257162A
CN102257162A CN2009801510704A CN200980151070A CN102257162A CN 102257162 A CN102257162 A CN 102257162A CN 2009801510704 A CN2009801510704 A CN 2009801510704A CN 200980151070 A CN200980151070 A CN 200980151070A CN 102257162 A CN102257162 A CN 102257162A
Authority
CN
China
Prior art keywords
nucleotide
probe
sequence
target ssdna
molecule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009801510704A
Other languages
English (en)
Inventor
A·梅勒
翁志萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BOSCHTON UNIV BOARDOF DIRECTORS
Original Assignee
BOSCHTON UNIV BOARDOF DIRECTORS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BOSCHTON UNIV BOARDOF DIRECTORS filed Critical BOSCHTON UNIV BOARDOF DIRECTORS
Publication of CN102257162A publication Critical patent/CN102257162A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本文描述了转化靶单链DNA(ssDNA)以便每个核苷酸(或碱基)腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和胞嘧啶(C)被转化成预定的寡核苷酸密码同时序列顺序在转化的ssDNA或RNA中得以保持的低成本高通量的方法。所述方法在循环过程中不需要使用DNA聚合酶并且涉及具有重复的连接和切割循环的寡核苷酸探针文库的用途。在每个循环中,切割例如ssDNA的靶的一端(例如,5′末端或3′末端)上的一个或多个核苷酸,然后将其与所述靶ssDNA的另一端上的相应寡核苷酸密码连接。

Description

保持序列的DNA转化
发明领域
本发明涉及按照预定的核苷酸密码转化靶核酸分子的方法。随后可将转化的核酸用于测定靶分子的核苷酸序列。
相关申请的交叉引用
本申请根据35U.S.C.119(e)的规定要求在2008年10月29日提交的美国临时专利申请系列No:61/109,298的权益,该专利申请的全部内容以引用的方式并入本文。
背景技术
第一参考人类基因组序列的开创性成就(国际人类基因组测序组织(International Human Genome Sequencing Consortium)Nature2001;490:860-921;Venter JC,Adams MD,Myers EW,Li PW,MuralRJ,Sutton GG等人Science 2001;291:1304-51)标志了其中基因组变异直接影响药物研发和药物治疗时代的开端。该新范例已滋生了对DNA测序的低成本且超快速的方法的需求。据认为,在不久的将来,执业医师将能够在开药方之前在临床环境下对个体患者的DNA进行常规分析。可对比其中记录了与任何药物相关的基因组信息的在线数据文库来检查获自个体的序列信息。
此外,可支付得起的测序技术将改观比较基因组学和分子生物学的研究,从而使得科学家快速测序来自细胞变异体的完整基因组。为了实现超快速且低成本的DNA测序,需要革命性的技术来取代基于Sanger的“双脱氧”方案(Shendure J,Mitra RD,Varma C,ChurchGM.Nat Rev Genet 2004;5:335-44)的经典方法。基于Sanger法的现代测序通常产生具有低质量的前15至40个碱基、不超过700至900个碱基的高质量区域和接着质量快速变差的余下序列的序列。
新型测序技术需要解决2个主要问题。第一,应当将样品大小减小至最小,从而使得能够从单个DNA分子或少量拷贝读出序列。第二,与现有最新技术相比,应当使读出速度增加数个数量级。近年来,纳米孔已被广泛用作灵敏的单生物分子检测器。已显示出,可电泳驱动单链DNA分子以单列的方式通过1.5-nm α-溶血素纳米孔。该方法称为DNA易位(Kasianowicz J,Brandin E,Branton D,Deamer D.ProcNatl Acad Sci USA 1996;93:13770-3;Akeson M,Branton D,Kasianowicz J,Brandin E,Deamer D.Biophys J 1999;77:3227-33;Meller A,Nivon L,Brandin E,Golovchenko J,Branton D.ProcNatl Acad Sci USA 2000;97:1079-84)。该领域中的推动理念之一是纳米孔可用于DNA序列的直接电子读出(Deamer DW,Akeson M.Tibtech 2000;18:147-50.)。然而,早期研究已指出,在纳米孔可被用于单分子测序之前必须解决若干突出的问题(Meller A等人(2000),同上Meller A,Nivon L,Branton D.Phys Rev Lett 2001;86:3435-8)。具体来讲,快速的DNA易位速度和4种碱基类型的电信号之间的低反差已阻碍了单个核苷酸的分化。
纳米孔测序的主要优势是可使用纳米孔直接探测单个DNA分子而无需DNA分子的扩增,所述DNA分子的扩增是易错的、低通量的并且成本高。然而,目前纳米孔测序技术不具有单核苷酸分辨率。虽然已经取得了很大的进展,但仍未明确地确定可通过纳米孔分辨的最少碱基数目。我们的方法已将核酸序列转化成可被转化的更长的序列,以便序列得到保持。然后,更长的序列可通过纳米孔直接地读取。因此,进行转化的方式必须是快速的、高度可靠的和低成本的,并且需要开发进行该类转化的新方法。
发明概述
本文描述了转化靶单链DNA(ssDNA)以便每个核苷酸(或碱基)腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和胞嘧啶(C)被转化成预定的寡核苷酸密码同时序列顺序在转化的ssDNA中得以保持的低成本高通量的方法。还可通过适当的改进以使得该方法适用于转化RNA。所述方法涉及具有重复的连接和切割循环的寡核苷酸探针文库的用途。在每个循环中,切割例如ssDNA的靶的一端(例如,5′末端或3′末端)上的一个或多个核苷酸,然后将其与该靶ssDNA的另一端上的相应寡核苷酸密码连接。所述方法在循环过程中不需要使用DNA聚合酶,这消除了通过聚合酶将错误引入序列中(参见例如,T.Sjoblom等人,Science 314,268(2006))。本发明的一个实施方案允许在相对短的时间内(例如,数天以内,在一些实施方案中1天以内)测定例如完整人类基因组的序列。
在一个实施方案中,通过可进一步结合分子信标的预定的寡核苷酸密码来分隔被转化的核苷酸。从而在一个实施方案中,可通过使用纳米孔测定转化的单链核酸分子(例如,ssDNA)的序列,其中当转化的ssDNA链移动通过纳米孔时每次除去一个结合的分子信标。除去分子信标产生闪光,该闪光翻译成靶单链核酸分子的序列。由于更长的预定的寡核苷酸密码(每个密码对应于在例如靶ssDNA中的每个核苷酸A、C、T或G)被整合入靶ssDNA分子,因此本文所描述的方法不需要在单个核苷酸水平上的检测,从而克服了基于纳米孔的测序的主要挑战之一。本文所描述的本发明的方法允许利用在单分子水平上有用的任何测序方法快速测序(即,测序不限于纳米孔测序)。
本文所描述的方法的一个方面涉及DNA转化。这涉及通过将双链或T形探针与靶ssDNA连接,利用II型限制性内切酶消化来形成包含靶单链DNA(ssDNA)的环状分子,其中所述消化导致从靶ssDNA除去被转化的碱基,同时加入代表所述转化的核苷酸的更长的寡核苷酸标签。此外,本文所描述的另一方面涉及寡核苷酸探针文库(包含T形探针)用于转化ssDNA分子的用途。
本文所公开的本发明的一个方面涉及一种用于始于其3′末端转化靶单链DNA(ssDNA)分子以便将靶ssDNA分子的核苷酸腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)转化成预定的寡核苷酸密码并且在转化过程中保持靶ssDNA的核苷酸顺序的方法。所述方法包括以下步骤:
(a)将在其5′-末端具有预先指定的序列5′-x0、S1、S2、S3、S4、S5-3′的靶ssDNA(其中x0可以是A、C、G或T并且S1、S2、S3、S4、S5是预定的寡核苷酸密码(Xx)的前5个位置中的序列)与包含多个寡核苷酸探针的探针文库接触,其中每个探针包含双链DNA部分以及第一和第二单链悬突,其中双链DNA部分包含IIS型限制性内切酶的识别序列(R′/R)和唯一地对应于靶ssDNA中的待转化的核苷酸(x)的预定的寡核苷酸密码(X′x/Xx),其中存在可特异性结合R′/R并且切割识别序列的外侧至探针的第二单链悬突的5′侧的IIS型限制性内切酶,其中第一单链悬突包含与预定的寡核苷酸密码的前5个位置中的序列(5′- S1、S2、S3、S4、S5-3′)互补的序列5′-S′5、S′4、S′3、S′2、S′1,紧接其后是由探针文库中全部4种核苷酸代表的位置(n);其中具有序列5′-x′、n、n、n、n、n-3′的第二单链悬突包含与待转化的核苷酸(x)互补的核苷酸(x′),紧接其后是由探针文库中全部4种核苷酸代表的5个位置,并且其中在允许文库中的多个探针之一结合靶ssDNA分子并且与其形成完全匹配的双链体的条件下进行接触;
(b)利用连接酶将步骤(a)中结合的探针的更短的链的两端与靶ssDNA连接,从而形成环状探针-靶ssDNA复合物;
(c)将步骤(b)中连接的分子与特异性识别存在于步骤(a)中探针的双链DNA部分的序列(R′/R)的IIS型限制性内切酶接触,其中所述酶切割待转化的靶ssDNA的靶分子的3′末端上的至少一个核苷酸,从而从该靶ssDNA分子的3′末端除去该核苷酸;和
(d)将在步骤(c)中被切割的探针-靶ssDNA复合物的双链部分分离,并且从探针的未连接链上洗去寡核苷酸;
其中步骤(a)-(d)产生在其5′末端包含5′-x、Xx、R-3′的转化的靶ssDNA分子,其中Xx是对应于靶ssDNA的被转化的核苷酸x的预定的寡核苷酸密码。
本文所公开的本发明的另一方面涉及一种用于始于其3′末端转化靶单链DNA(ssDNA)分子以便将靶ssDNA分子的核苷酸腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)转化成预定的寡核苷酸密码并且在转化过程中保持靶ssDNA的核苷酸顺序的方法。所述方法包括以下步骤,概述如下:
(a)将在其5′末端具有预先指定的核苷酸序列(例如,5′-S1、S2、S3、S4、S5-3′)的靶ssDNA分子与包含多个探针的寡核苷酸探针文库接触;其中每个探针包含双链DNA部分以及第一和第二单链悬突;其中双链DNA部分包含侧翼连接有第一和第二单链悬突的5′-3′核苷酸序列X′x和与核苷酸序列X′x互补的核苷酸序列Xx,其中Xx包含唯一地对应于核苷酸A、T、G或C的一组顺序的预定的寡核苷酸密码,并且代表待转化的核苷酸;并且其中探针的双链部分包含IIS型限制性内切酶识别位点(R),其切割位点在探针与靶ssDNA的3′末端连接后完成,所述靶ssDNA的至少一个核苷酸有待转化;其中第一单链悬突位于X′x的5′侧,并且第二单链悬突位于X′x的3′侧;其中Xx在其5′末端包含存在于靶ssDNA分子的5′末端上的预先指定的核苷酸序列,其中第二单链悬突在紧邻X′x的3′末端的位置上包含与待转化的靶ssDNA中的核苷酸互补的核苷酸并且还包含至少3个随机核苷酸;并且其中第一单链悬突在紧邻X′x的5′末端上的核苷酸的位置上包含至少一个随机核苷酸并且还包含与存在于靶ssDNA中的预先指定的序列互补的核苷酸序列;并且其中在允许多个探针之一与靶ssDNA分子结合并且与其形成双链体的条件下进行接触;
(b)将步骤(a)中结合的双链寡核苷酸的两端与靶ssDNA序列连接,从而形成环状分子;
(c)将步骤(b)中连接的分子与对应于存在于步骤(a)中的探针的双链DNA部分中的IIS型限制性内切酶识别位点的IIS型限制性内切酶接触,其中IIS型限制性内切酶在待转化的靶ssDNA的3′末端上的至少一个核苷酸之后切割,从而从靶ssDNA分子的3′末端除去待转化的核苷酸。
(d)将步骤(c)中连接的且被切割的探针的双链部分与靶ssDNA分离并且洗去探针的未连接的链;
其中步骤(a)-(d)产生转化的靶ssDNA分子,其在其5′末端包含对应于靶ssDNA的被转化的核苷酸(例如,x)的Xx预定的寡核苷酸密码(例如,x、Xx、R-3′),并且其中例如,Xx预定的寡核苷酸密码在存在于转化的靶ssDNA分子的5′末端上的被转化的核苷酸之前。
每次可转化一个或多个核苷酸(例如,可转化一个核苷酸x(其可以是A、T、G或C),或可转化代表A、T、C或G的任意组合的多个核苷酸(例如,ATG或GA等)。
在本文所描述的另一个实施方案中,探针的双链部分上的多个预定的寡核苷酸密码中的每一个唯一地对应于被转化的核苷酸(A、T、G或C)。
在本文所描述的另一个实施方案中,所述寡核苷酸文库包括T形探针。
本文所公开的另一个方面是一种用于始于其5′末端转化靶单链(ssDNA)靶分子以便将ssDNA分子的核苷酸腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)转化成预定的寡核苷酸密码并且在转化过程中保持靶ssDNA的核苷酸顺序的方法,所述方法包括以下步骤:
(a)将在其3′末端具有预先指定的核苷酸序列的靶ssDNA分子与包含多个探针的寡核苷酸探针文库接触;其中每个探针包含双链DNA部分以及第一和第二单链悬突,其中双链DNA部分包含侧翼连接有第一和第二单链悬突的5′-3′核苷酸序列Xx′和与核苷酸序列Xx′互补的互补3′-5′核苷酸序列Xx,其中Xx包含唯一地对应于核苷酸A、T、G或C的一组顺序的预定的寡核苷酸密码,并且代表待转化的核苷酸;并且其中探针的双链部分还包含IIS型限制性内切酶识别位点(R),其切割位点在探针与靶ssDNA的5′末端连接后完成,所述靶ssDNA的至少一个核苷酸有待转化;其中Xx在其3′末端包含存在于靶ssDNA分子的3′末端上的预先指定的核苷酸序列;其中第一单链悬突位于X′x的3′侧并且第二单链悬突位于X′x的5’末端,其中第二单链悬突在紧邻Xx′的5’末端上的核苷酸的位置上包含与待转化的靶ssDNA中的核苷酸互补的核苷酸并且还包含至少3个随机核苷酸;并且其中第一单链悬突在紧邻Xx′的3′末端上的核苷酸的位置上包含至少一个随机核苷酸并且还包含与存在于靶ssDNA中的预先指定的序列互补的核苷酸序列;并且其中在允许多个探针之一结合靶ssDNA分子的条件下进行接触,从而形成环状分子;
(b)将步骤(a)中结合的双链寡核苷酸的两端与靶ssDNA序列连接,从而形成环状分子;
(c)将步骤(b)中连接的分子与对应于存在于步骤(a)的双链DNA部分中的IIS型限制性内切酶识别位点的IIS型限制性内切酶接触,其中IIS型限制性内切酶在待转化的靶ssDNA的5′末端上的至少一个核苷酸之后切割,从而从靶ssDNA分子的5′末端除去待转化的核苷酸;和
(d)将步骤(c)中连接的且被切割的探针的双链部分与靶ssDNA分离,并且洗去探针的未连接的链;
其中步骤(a)-(d)产生转化的靶ssDNA分子,其在其3′末端包含对应于靶ssDNA的被转化的核苷酸的预定的寡核苷酸密码,并且其中预定的寡核苷酸密码在存在于转化的靶ssDNA分子的3′末端上的被转化的核苷酸之前。
在本文所公开的该方面和所有其它方面的一个实施方案中,重复步骤(a)-(d)不止一次。
在本文所公开的该方面和所有其它方面的另一个实施方案中,将靶ssDNA分子固定在固体载体上或通过任何其它方法确保靶ssDNA在上述步骤(d)中不被洗去。
在本文所公开的该方面和所有其它方面的另一个实施方案中,靶ssDNA分子上预先指定的序列还包括II型限制性内切酶识别位点(M)。
在本文所公开的该方面和所有其它方面的另一个实施方案中,靶ssDNA上预先指定的序列(M)在约3个核苷酸至约12个核苷酸的范围内。在一个实施方案中,悬突的长度根据在探针的第一悬突与靶ssDNA的一端之间形成特定的双链体的所需的长度来确定。
在本文所公开的该方面和所有其它方面的另一个实施方案中,IIS型限制性内切酶位点选自,但不限于:AlwI、BccI、BsmA1、EarI、MlyI、PleI、BmrI、BsaI、BsmB1、FauI、HpyAV、MnlI、SapI、BbsI、BciVI、HphI、MboII、BfuaI、BspMI、SfaNI、HgaI、BbvI、EciI、FokI、BceAI、BsmFI、BtgZI、BpmI、BpuEI、BsgI、AclWI、Alw26I、Bst6I、BstMAI、Eam1104I、Ksp632I、PpsI、SchI、BfiI、Bso31I、BspTNI、Eco31I、Esp3I、FauI、SmuI、BfuI、BpiI、BpuAI、BstV2I、AsuHPI、Acc36I、LweI、AarI、BseMII、TspDTI、TspGWI、BseXI、BstV1I、Eco57I、Eco57MI、GsuI、PsrI或MmeI位点。
在本文所公开的该方面和所有其它方面的另一个实施方案中,Xx包含第一核酸序列XxI和第二核酸序列XxII,其中XxI和XxII形成唯一地对应于任一核苷酸A、T、G或C的二进制的预先指定的寡核苷酸密码。
在本文所公开的该方面和所有其它方面的另一个实施方案中,限制性内切酶的识别序列(R)存在于5′-末端、3′末端或预定的寡核苷酸密码(Xx)内的期望位置上。
在本文所公开的该方面和所有其它方面的另一个实施方案中,XxI和XxII在长度上各自在约4个核苷酸至约30个核苷酸的范围内。
在本文所公开的该方面和所有其它方面的另一个实施方案中,XxI和XxII在长度上各自为12个核苷酸。
在一个实施方案中,每个悬突的长度根据在探针的悬突与靶ssDNA的一端之间形成特定双链体所必需的长度来确定,即,悬突可以是任何长度。
在本文所公开的该方面和所有其它方面的另一个实施方案中,第一悬突在长度上在约3个核苷酸至约12个核苷酸的范围内,或在长度上在例如4个核苷酸至12个核苷酸、4至11个核苷酸、或5至12个核苷酸、或5至11个核苷酸、或5至10个核苷酸等之间的任何范围内。
在本文所公开的该方面和所有其它方面的另一个实施方案中,第二悬突在长度上在约3个核苷酸至约12个核苷酸的范围内,或在长度上在例如4个核苷酸至12个核苷酸、4至11个核苷酸、或5至12个核苷酸、或5至11个核苷酸、或5至10个核苷酸等之间的任何范围内。
在本文所公开的该方面和所有其它方面的另一个实施方案中,靶ssDNA在长度上在约5个核苷酸至约3,000,000个核苷酸的范围内。
在本文所公开的该方面和所有其它方面的另一个实施方案中,同时转化多个靶ssDNA分子。
在本文所公开的该方面和所有其它方面的另一个实施方案中,在包含靶ssDN核酸的不均匀混合物的样品中进行转化。
在本文所公开的该方面和所有其它方面的另一个实施方案中,在该方法的任何步骤(a)-(d)中不使用聚合酶。
在本文所公开的该方面和所有其它方面的另一个实施方案中,探针文库具有在16至1,048,576种不同寡核苷酸的范围内的复杂度。
在本文所公开的该方面和所有其它方面的另一个实施方案中,靶ssDNA分子来源于哺乳动物。
在本文所公开的该方面和所有其它方面的另一个实施方案中,所述哺乳动物是人。
在本文所公开的该方面和所有其它方面的另一个实施方案中,在单分子水平上测定转化的ssDNA分子的序列。
在本文所公开的该方面和所有其它方面的另一个实施方案中,测序包括一个或多个标记的分子信标。
在本文所公开的该方面和所有其它方面的另一个实施方案中,标记的分子信标是荧光分子信标。
在本文所公开的该方面和所有其它方面的另一个实施方案中,荧光分子信标结合转化的ssDNA分子的Xx序列(例如,Xx、XxI或XxII)。
在本文所公开的该方面和所有其它方面的另一个实施方案中,引导具有结合的荧光分子信标的转化的ssDNA分子的Xx(例如,Xx、XxI、XxII)序列通过直径小于2nm的纳米孔,其中当转化的ssDNA分子通过纳米孔时,荧光分子信标被除去,其中荧光分子信标的除去产生闪光,其中闪光的顺序产生靶ssDNA序列的序列。
本文所描述的另一个方面是一种可用于本文所描述的DNA转化方法的包含T形探针的寡核苷酸探针文库。
本文所描述的另一个方面是用于始于其3′末端转化靶单链DNA(ssDNA)分子以便将靶ssDNA分子的核苷酸腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)转化成预定的寡核苷酸密码并且在转化过程中保持靶ssDNA的核苷酸顺序的方法。所述方法包括以下步骤:
(a)将在其5′末端具有预先指定的核苷酸序列的靶ssDNA分子与第一探针文库和第二探针文库接触,其中在允许第一文库中只有一种探针与靶ssDNA的5′末端杂交并且第二探针文库中只有一种探针与靶ssDNA分子的3′末端杂交的条件下进行接触;
(b)将步骤(a)中杂交的探针与靶ssDNA序列连接;
(c)将步骤(b)中连接的分子暴露于低解链温度,从而将封闭寡核苷酸(blocking oligonucleotide)与第二探针文库连接的探针分离;
(d)将来自第一探针文库的连接的探针的3′末端与第二探针文库的连接的探针的5′末端杂交,从而形成环状分子;
(e)将步骤(d)中连接的分子与IIS型限制性内切酶接触,其中IIS型限制性内切酶在待转化的靶ssDNA的3′末端上的至少一个核苷酸之后切割,从而从靶ssDNA分子的3′末端除去待转化的核苷酸;和
(f)将步骤(e)中每个连接的且被切割的探针的双链部分与靶ssDNA分离,并且洗去探针的未连接的链;
其中步骤(a)-(f)产生转化的靶ssDNA分子,其在其5′末端包含来自第二探针文库的探针的对应于靶ssDNA的被转化的核苷酸的预定的寡核苷酸密码和来自第一探针文库的探针的不变的序列,并且其中预定的寡核苷酸密码在存在于转化的靶ssDNA分子的5′末端上的被转化的核苷酸之前。
本文所描述的另一个方面涉及一种用于始于其5′末端转化靶单链DNA(ssDNA)分子以便将靶ssDNA分子的核苷酸腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)转化成预定的寡核苷酸密码并且在转化过程中保持靶ssDNA的核苷酸顺序的方法。所述方法包括以下步骤:
(a)将在其5′末端具有预先指定的核苷酸序列的靶ssDNA分子与第一探针文库和第二探针文库接触,其中在允许第一文库中只有一种探针与靶ssDNA的3′末端杂交并且第二探针文库中只有一种探针与靶ssDNA分子的5’末端杂交的条件下进行接触;
(b)将步骤(a)中杂交的探针与所述靶ssDNA序列连接;
(c)将步骤(b)中连接的分子暴露于低解链温度,从而将封闭寡核苷酸与第二探针文库的连接的探针分离;
(d)将来自第一探针文库的连接的探针的3′末端与第二探针文库的连接的探针的5′末端杂交,从而形成环状分子。
(e)将步骤(d)中连接的分子与IIS型限制性内切酶接触,其中IIS型限制性内切酶在待转化的靶ssDNA的5′末端上的至少一个核苷酸之后切割,从而从靶ssDNA分子的5′末端除去待转化的核苷酸;和
(f)将步骤(e)中每个连接的且被切割的探针的双链部分与靶ssDNA分离,并且将其洗去;
其中步骤(a)-(f)产生转化的靶ssDNA分子,其在其3′末端包含来自第二探针文库的探针的对应于靶ssDNA的被转化的核苷酸的预定的寡核苷酸密码和来自第一探针文库的探针的不变的序列,并且其中预定的寡核苷酸密码在存在于转化的靶ssDNA分子的3′末端上的被转化的核苷酸之前。
在本文所描述的该方面和所有其它方面的一个实施方案中,为了始于其3′末端转化靶单链DNA分子,第一探针文库包含多个由4种不同寡核苷酸探针组成的寡核苷酸探针,每个探针包含双链部分以及第一和第二单链悬突,其中双链部分包含其5′末端未磷酸化的预先指定的核苷酸间隔区序列(P′)和与间隔区序列互补的序列(P),其中第一单链悬突在紧邻P′的5′末端的位置上包含A、T、G或C并且在紧邻该位置的3′末端的位置上包含与存在于靶ssDNA分子上的预先指定的序列互补的核苷酸序列;并且其中第二单链悬突包含与第二探针文库的封闭寡核苷酸相同的第二预先指定的核苷酸序列并且被置于紧邻P的5′末端。
在本文所描述的该方面和所有其它方面的另一个实施方案中,为了始于其3′末端转化靶单链DNA分子,第二探针文库包含多个寡核苷酸探针,每个探针包含双链部分以及第一和第二单链悬突,其中双链部分包含侧翼连接有第一和第二单链悬突的5′-3′核苷酸序列X′x和互补核苷酸序列Xx,其中Xx包含唯一地对应于核苷酸A、T、G或C的一组顺序的预先指定的寡核苷酸密码,并且双链核苷酸序列还包含IIS型限制性内切酶识别位点,其相应的切割位点在探针与待转化的靶ssDNA分子的末端上的至少一个核苷酸连接后完成,其中Xx在其5′末端包含存在于靶ssDNA分子上的预先指定的序列;其中所述第一单链悬突包含与存在于靶ssDNA分子上的预先指定的序列互补的核苷酸序列;并且其中第二单链悬突在紧邻X′x的3′末端上的核苷酸的位置上包含与待转化的靶ssDNA中的核苷酸互补的核苷酸,并且还包含至少3个随机核苷酸,并且其中第二探针文库还包含含有与第一单链悬突互补的3′-5′序列的封闭寡核苷酸,其中封闭寡核苷酸的5′末端和第一单链悬突的5′末端未被磷酸化。
在本文所描述的该方面和所有其它方面的另一个实施方案中,为了始于其5′末端转化靶单链DNA分子,第一探针文库包含多个由4种不同寡核苷酸探针组成的寡核苷酸探针,每个探针包含双链部分以及第一和第二单链悬突,其中双链部分包含预先指定的核苷酸间隔区序列(P′)和与间隔区序列互补的序列(P),其中第一单链悬突在紧邻P′的3′末端的位置上包含A、T、G或C和与靶ssDNA分子上的预先指定的序列互补的核苷酸序列;并且其中第二单链悬突包含与第二探针文库的封闭寡核苷酸相同的第二预先指定的核苷酸序列并且被置于紧邻P的3′末端。
在本文所描述的该方面和所有其它方面的另一个实施方案中,为了始于其5′末端转化靶单链DNA分子,第二探针文库包含多个寡核苷酸探针,每个探针包含双链部分以及第一和第二单链悬突,其中双链部分包含侧翼连接有第一和第二单链悬突的5′-3′核苷酸序列X′x和互补核苷酸序列Xx,其中Xx包含唯一地对应于核苷酸A、T、G或C的一组顺序的预先指定的寡核苷酸密码,并且双链核苷酸序列还包含IIS型限制性内切酶识别位点,其相应的切割位点在探针与待转化的靶ssDNA分子的末端上的至少一个核苷酸连接后完成,其中Xx在其3′末端包含存在于靶ssDNA分子上的预先指定的序列;其中所述第一单链悬突包含与存在于靶ssDNA分子上的预先指定的序列互补的核苷酸序列;并且其中第二单链悬突在紧邻X′x的3′末端上的核苷酸的位置上包含与待转化的靶ssDNA中的核苷酸互补的核苷酸,并且还包含至少3个随机核苷酸,并且其中第二探针文库还包含含有与第一单链悬突互补的3′-5′序列的封闭寡核苷酸,其中封闭寡核苷酸的5′末端和第一单链悬突的5′末端未被磷酸化。
附图说明
图1.描述制备用于转化靶ssDNA的模型的图示。
图2.存在于用于I级转化的探针文库中的示例性寡核苷酸探针的图示。
图3A-3D.用于I级转化的步骤的示意图;(图3A)与其3′末端待转化的靶ssDNA分子特异性杂交的示例性探针,(图3B)在两个位置上的连接以形成环状分子并且洗去未结合的探针,(图3C)示例性IIS型限制性内切酶,其结合R/R′,并且在x1(核苷酸正在转化)的5′末端上精确地切割,(图3D)分离双链体并且洗去未结合的链。在该图示中所得到的靶ssDNA分子已在其5′末端延长了5′-x1、Xx、R-3′,并且在其3′末端缩短了一个核苷酸x1
图4A-4B.用于II级转化的存在于文库I中的示例性寡核苷酸探针(图4A)和存在于文库II中的示例性寡核苷酸探针(图4B)的图示。
图5A-5G.用于II级转化的步骤的示意图;(图5A)与一个靶ssDNA分子特异性杂交的两个探针,每端上有一个探针,(图5B)在两个位置上连接并且洗去未结合的探针,(图5C)低温解链,其仅移走封闭寡核苷酸但不分离探针-靶ssDNA复合物的其它双链部分,(图5D)在一个位置上的连接以产生环状分子,(图5E)示例性IIS型限制性内切酶特异性,其特异性地结合R′/R并且在x1(核苷酸正在转化)的5′末端上精确地切割,(图5F)分离双链体并且洗去未结合的链。所得到的靶ssDNA分子已在其5′末端延长了5′-x1、Xx、R、q′1、q′2、q′3、q′4、q′5、P-3’并且在其3′末端缩短了1个核苷酸x1,(图5G)第二转化循环中的第一步骤。
图6.描述制备始于其5′末端用于转化的靶ssDNA的模型的图示。
图7A-7C.图7A,显示通用探针与模板的结合的凝胶。凝胶在泳道2至4中分别显示上游和下游引物(TP和BP)以及ssDNA模板。泳道7显示杂交后连接的靶形成。在连接酶不存在的情况下,未形成靶(泳道5和6)。图7B,8%-尿素变性凝胶显示模板环化。8%-尿素变性凝胶显示通用探针连接的ssDNA模板(133个碱基)在PNK激酶和连接酶存在的情况下被有效地环化(泳道10)。与对照实验相比较,线性和环化的模板DNA的条带位置显示正确的DNA长度。使用TP20-20(作为引物)和相应的模板PP100和PP150的阳性对照实验(泳道1-6)在相同的条件下也环化。图7C,显示消化BseGl之后以形成具有连接至其3′末端的2位序列的线性ssDNA模板的环状DNA的线性化的凝胶。泳道1和2分别在消化之前和之后运行参照DNA,泳道4和5分别在消化之前和之后运行电泳样品。
图8A-8B.图8A,DNA转化的基于RCA的验证的示意图。转化的DNA用作相异于1个碱基的引物的锁式探针。(图8B)在30分钟的RCA后的0.8%琼脂糖凝胶。泳道1具有1kb DNA梯带。泳道2和3分别是在连接酶存在和不存在的情况下使用对照模板和Phi29 DNA聚合酶的阴性和阳性反应。泳道4-7分别是利用中心碱基为A、T、C和G的4种引物的RCA反应。仅对在连接的位点上具有正确碱基的引物看到产物(泳道7)。
发明详述
本文描述了一种用于将靶单链核酸,例如DNA或RNA的每个核苷酸顺序转化成预定的密码的方法,所述预定的密码代表靶核酸序列的核苷酸腺嘌呤(A),胸腺嘧啶(T)/尿嘧啶(U)鸟嘌呤(G)和胞嘧啶(C)的顺序。在转化后,利用可进一步结合分子信标的已知序列(即,预定的寡核苷酸密码序列)来分离靶序列(例如,靶ssDNA)的每个核苷酸。本文所描述的方法的一个方面涉及需要环状分子的形成并且导致被转化的碱基从ssDNA的一端移至另一端的DNA转化。此外,本文所描述的另一方面涉及将寡核苷酸探针文库(包含T形探针)用于转化ssDNA分子的用途。
在一个实施方案中,这样的转化允许通过使用钠米孔测序来测定转化的单链分子的序列。在该实施方案中,当转化的链移动通过纳米孔时,按序列顺序一次除去一个结合的分子信标。除去分子信标产生闪光,所述闪光代表预定的密码的顺序,并且也翻译成靶ssDNA中核苷酸的顺序。该系统具有若干优势:(a)靶ssDNA的序列可以是未知的;(b)聚合酶或扩增步骤不是必需的;(c)凝胶分离系统不是实施本文所描述的方法所需的;和(d)可将系统自动化以进行快速测序。本文所描述的靶ssDNA的转化方法允许在单分子水平上进行快速测序。在一个实施方案中,可在1周以内测定靶ssDNA的序列;优选地在72小时以内、48小时以内、24小时以内、12小时以内、6小时以内、2小时以内或甚至1小时以内(例如,45分钟、30分钟、15分钟等)测定靶ssDNA分子的序列。
为方便起见,此处汇集了本文说明书、实施例和所附权利要求书中所使用的某些术语。除非另有声明,或根据上下文暗示,否则下列术语和短语包括下文中提供的意义。除非另外明确地声明,或根据上下文是显而易见的,否则下文中的术语和短语不排除所述术语和短语在其所属领域内所获得的意义。提供定义以帮助描述具体的实施方案,并且无意于限定所要求保护的发明,因为本发明的范围仅由权利要求进行限定。随非另有定义,否则本文所用的全部技术和科学术语具有与本发明所属领域内的技术人员通常理解的意义相同的意义。
如本文所用,术语“转化”用于描述替换代表给定的核苷酸的寡核苷酸密码(例如以便所述密码可用于进行进一步测序,从而测序方法无需在单核苷酸水平上进行读取)的过程。术语“转化”也旨在包括一次超过1个核苷酸的转化(例如,一次转化至少2个、至少3个、至少4个、至少5个、至少6个或更多个核苷酸)。术语“转化的ssDNA”或“转化的靶ssDNA”用于描述已以经历至少一轮转化的DNA分子。用作转化的ssDNA中每个给定的核苷酸的代表性寡核苷酸密码在本文中也称为“预定的寡核苷酸密码”,其可包括本文中如在发明详述中说明的二进制码。“1级转化”在本文中用于指只使用一个探针文库的的转化方法,而“2级”转化在本文中用于指使用两个不同探针文库的转化方法。2级转化具有增加的转化效率的优势,因为其防止探针与靶ssDNA分子的每端的结合和在1级转化过程中可发生的减少的转化。
术语“探针”和“寡核苷酸探针”在本文中用于指合成地产生的寡核苷酸,其能够与包含与探针互补的序列的核酸退火或与其特异性杂交。探针的确切长度将取决于许多因素,包括温度、所使用的IIS型限制性内切酶、探针文库中每个探针的拷贝数和所使用的方法。用于本文所描述的用于1级转化的方法的寡核苷酸探针包括双链部分(两个侧翼单链悬突各自在一条链的两端)。此类探针在本文中也称为‘转化探针’。
如本文所使用的,术语“探针文库”是指混合在一起的多个不同寡核苷酸探针。探针文库具有一定的“复杂度”,其在本文中用于描述探针文库中不同寡核苷酸的数目。例如,具有为47的复杂度的文库包括47(即,16,384)种不同寡核苷酸探针。术语‘复杂度’并非描述每种不同寡核苷酸探针的超过1个拷贝的存在,而是描述文库中独特探针的数目。文库的复杂度根据使用期望的模板探针序列产生的随机(例如,简并)核苷酸组合的数目来确定,其中n或x0用于表示核苷酸A、T/U、C和G(注意,待转化的核苷酸x也可以是A、T/U、C或G)中的每一个。例如,如果在探针序列中存在2个随机核苷酸(称为n或x0)并且对于每个n存在4种可能的DNA核苷酸(例如,A、T、C和G),那么文库具有42或16种不同寡核苷酸的复杂度。因此,为了至少一个探针与靶ssDNA分子上的未知区域的特异性杂交(即,靶ssDNA序列的知识不是本文所描述的方法所必需的),对于探针的一组长度,文库包括A、T、C和G(和任选地不加区别的结合核苷酸,例如肌苷(I))的全部可能的组合。存在用于本文所描述的方法的3个探针文库:(a)用于1级转化的探针文库;(b)用于2级转化的两个文库(在本文中称为文库I和文库II;参见发明详述)。每个文库中的示例性探针示于图2和4中。应当指出,可从靶分子的3′末端或5′末端开始进行转化。用于每种类型的转化的示例性探针描述于关于1级转化的发明详述部分。应当理解,本领域的技术人员可改造用于1级(图2)和2级(图4)转化的探针文库以转化靶分子的5′末端。
术语“预先指定的核苷酸序列”用于描述被连接至待转化的靶单链核酸,例如ssDNA的一端的已知的核苷酸序列,其被连接至靶ssDNA分子的一端(例如,5′或3′末端)(例如,参见图1,其中将被指定为5′-x0、S1、S2、S3、S4、S5-3′的预先指定的序列连接至靶ssDNA的5′末端)。预先指定的核苷酸序列与整合入每个探针的核苷酸序列互补并且是第一轮保持序列的DNA转化所必需的。预先指定的核苷酸序列还可包括II型限制性内切酶识别位点(例如,参见图1,M)。
术语“靶ssDNA分子”在本文中用于描述待转化的单链DNA。靶ssDNA分子可来源于已从其天然双链体构象变性成单链构象的双链DNA分子(例如,基因组DNA样品)。术语“靶ssDNA分子”还包括ssDNA分子的片段或短ssDNA(例如,500bp、1Kb、2Kb、5Kb、16Kb等)。在本文中还考虑,可用本文所公开的方法转化靶单链核酸,例如RNA。术语“靶单链核酸”还包括单链RNA。为了举例说明的目的,在整个本说明书中将靶ssDNA分子用作本文所描述的方法的实例。如果需要,本领域的技术人员可容易地改造此类方法以用于RNA分子的转化。
术语“特异性杂交”是指在本领域通常使用的预定条件下允许这样的杂交的充分互补的序列的两条单链核酸分子之间的缔合(有时称为“大体上互补的”)。在一个实施方案中,使用至少中等的严格条件。在另一个实施方案中,使用高度的严格条件。特别地,所述术语是指寡核苷酸与本发明的单链DNA分子中包含的大体上互补的序列的杂交,是指基本上排除寡核苷酸与非互补序列的单链DNA的杂交。
“互补的”是指两个核酸链的区域之间或相同核酸链的两个区域之间的序列互补性的广义概念。例如,已知第一核酸区域的腺嘌呤残基能够与与第一区域反向平行的第二核酸区域的残基(如果残基是胸腺嘧啶或尿嘧啶)形成特定氢键(“碱基配对”)。类似地,已知第一核酸链的胞嘧啶残基能够与与第一链反向平行的第二核酸链的残基(如果残基是鸟嘌呤)碱基配对。核酸的第一区域与其第二区域或不同的核酸互补,如果当两个区域以反向平行的方式排列时,那么第一区域的至少一个核苷酸残基能够与第二区域的残基碱基配对。在一个实施方案中,第一区域包括第一部分并且第二区域包括第二部分,据此,当第一和第二部分以反向平行的方式排列时,那么第一部分的核苷酸残基的至少约50%,和至少约75%,至少约90%,或至少约95%,或至少约99%能够与第二部分中的核苷酸残基碱基配对。在一个实施方案中,第一部分的全部核苷酸残基(例如,100%)能够与第二部分中的核苷酸残基碱基配对。
如本文所使用的,短语“IIS型限制性内切酶切割位点在连接后完成”用于描述存在于寡核苷酸探针上的核苷酸的序列,其在IIS型酶的切割位点中缺失至少一个核苷酸,从而与IIS型限制性内切酶的接触不导致双链体DNA的切割。切割位点在寡核苷酸探针与其互补靶ssDNA(其提供了缺失的核苷酸,并且形成双链体DNA区域)结合后完成,从而允许切割在与IIS型限制性内切酶接触时发生。IIS型限制性内切酶是识别双链DNA分子上的不对称位点并且在远离其识别位点的位点上切割的限制性内切酶。
如本文所使用的,术语“不变序列”用于描述在每一轮转化中插入的并且不依赖于待转化的核苷酸x的核苷酸序列。将不变序列整合入本文所使用的探针,以便在每一轮转化后插入所述不变序列。不同的分子信标可结合不变序列,这允许在测序过程中评估预定的寡核苷酸密码的“读框(frame)”。这在其中将二进制码用于测序的实施方案中特别有用,从而不变序列用作允许每个读框与之前的读框分离的“逗号(comma)”。“读框”,例如,是指二进制码读出,其中对于每一轮转化读取两个分子信标,以便如果只有一个分子信标在一轮中被读取时,“移码(frame shift)”将发生。当在每一轮转化过程中整合不变序列时,读出可表明“移码”是否发生。例如,二进制码可以是00,11,01,01(注意,逗号用不变序列表示),然而如果在第3个位置发生移码,那么在不变序列存在的情况下读出将读取00,1,01,01。在不变序列不存在的情况下,读出将为00,10,10,1,这可将错误引入序列的顺序。因此,不变序列提供了减少转化序列的读出中的潜在错误的机制。
为了方便查考,根据DNA链上末端磷酸基团和末端羟基的位置来标示双链体DNA分子的链。DNA链称为5′-3′方向链并且利用5′磷酸基团和3′羟基来标示;该链在本文所示的图中被描述为由S′、x′或q标示的“上”或“上游”链。5′-3′方向链的互补链从左至右标示为3′-5′方向链并且在本文所示的图中被描述为由S、x或q′标示的“下”或“下游”链。
如本文所使用的,“严格条件”是允许大体上互补的寡核苷酸探针与待转化的靶ssDNA分子的特异性杂交,但不允许非互补寡核苷酸探针结合靶ssDNA分子的条件。杂交和洗涤缓冲液的严格度可通过改变温育温度或缓冲液组成(例如,盐浓度、去垢剂、pH等)来变更。根据寡核苷酸探针的长度和/或核酸组成,严格杂交条件可变化(例如,从小于约1M,更常见地小于约500mM和优选地小于约200mM的盐浓度),并且杂交温度可在一定的范围内变化(例如,从低至0℃至高于22℃,高于约30℃和(最常见地)超过约37℃)。严格度可以例如通过在更高的温度(例如,55℃或更优选地60℃)下使用适当地选择的钠浓度增加的洗涤介质(例如,1×SSPE,2×SSPE,5×SSPE等)进行洗涤来增加。如果交叉杂交问题仍然存在,那么还可选择进一步升高温度,例如通过在65℃、70℃、75℃或80℃下进行洗涤。更长的片段可能需要更高的杂交温度来进行特异性杂交。本领域的技术人员知道,可在杂交和洗涤过程中改变各种参数,这将维持或改变严格条件(参见,例如,Sambrook,J.,E.F.Fritsch等人1989″Molecular Cloning:a Laboratory Manual″,第2版,Cold Spring Harbor,NY,Cold SpringHarbor Laboratory Press,于11.45)。当几个因素影响杂交的严格度时,参数的组合比单个因素的绝对测量更重要。
如本文所使用的,术语“包含”或“包括”用于指组合物、方法和其各自成分,这些对于本发明是必要的,但仍然包括未指定的元素(无论是必要的还是非必要的)。
如本文所使用的,术语“基本上由......组成”是指给定的实施方案所需的那些元素。该术语允许对本发明的实施方案的基本和新型或功能特征没有实质影响的其它元素的存在。
术语“由......组成”是指如本文所述的组合物、方法和其各自成分,其不包括未在实施方案的描述中列举的任何元素。
如本说明书和所附权利要求中所使用的,除非上下文中明确地指出,否则单数形式“一个”、“一种”和“所述的”包括复数所指物。因此例如,提及“所述的方法”包括本文所述和或对阅读本公开的本领域的技术人员而言将是显而易见的一个或多个方法和/或步骤类型等等。
要理解,上述详细的说明和下列实施例仅是举例说明性的,并且不被用作对本发明的范围的限制。对本领域技术人员显而易见的是,在不脱离本发明的精神和范围的情况下,可对公开的实施方案做出各种改变和修改。此外,确定的全部专利、专利申请和出版物明确地以引用的方式并入本文,用于描述和公开例如这些出版物中描述的可与本发明结合使用的方法。这些出版物仅是为了公开在本申请的申请日之前的出版物而提供的。在这点上任何信息都不能被解释为本发明者因先前发明或任何其它原因而无权先于该公开的权利的认可。关于日期的所有声明或关于这些文件的内容的表述是基于申请者可获得的信息并且不构成对这些文件的日期或内容的正确性的任何承认。
靶核酸模板
来源
本文所描述的方法预期用于转化任何单链核酸分子包括,例如RNA和ssDNA。靶单链核酸可来源于多种来源,包括例如基因组DNA、双链DNA、cDNA、mRNA、tRNA、rRNA、siRNA、miRNA、shRNA或逆转录的DNA。单链DNA可从天然存在的双链DNA,例如基因组DNA来制备,或可选地可被工程改造,例如cDNA构建体。靶核酸分子不一定包含已知序列的区域,因为本文所描述的方法允许测定完全未知序列的序列。此外,靶核酸不必是完整的基因组序列或全长RNA分子,相反地靶核酸可以是更短的序列(即,500bp、1Kb、2Kb、16Kb)。然而,本文还涉及完整基因组以及片段化的基因组DNA的转化。可将本文所描述的转化方法用于,例如转化已被片段化成更小片段的完整基因组,以便从不同片段序列重建初始DNA序列。
可利用本领域技术人员已知的方法从任何物种分离靶核酸分子。靶核酸包括但不限于细菌、病毒、真菌、植物、动物等(包括人)包含的核酸。
核酸样品可来源于生物样品。生物样品的一些非限定性实例包括血液样品、尿样品、精液样品、淋巴液样品、脑脊液样品、血浆样品、血清样品、脓样品、羊膜液样品、体液样品、粪便样品、活组织检查样品、针吸活组织检查样品、拭子样品、漱口水样品、癌症样品、肿瘤样品、组织样品、细胞样品、细胞裂解物样品、粗制细胞裂解物样品、法医样品、环境样品、考古样品、感染样品、医院内感染样品、社区获得性感染样品、生物威胁样品、生产样品、药物制备样品、生物分子生产样品、蛋白质制备样品、脂质制备样品、碳水化合物制备样品或其任何组合。生物样品的其它非限定性实例包括细菌菌落、细菌细胞、噬菌斑、噬菌体、病毒蚀斑、病毒、酵母集落、酵母细胞、杆状病毒蚀斑、杆状病毒、生物制剂、传染性生物剂、真核细胞培养物、真核细胞、瞬时转染的真核细胞的培养物或瞬时转染的真核细胞。
在一个实施方案中,靶DNA分子来源于需要快速测序分析的个体,例如有待在临床医生开药之前进行遗传多态性预检的个体。
在一个实施方案中,靶DNA分子来源于被感染的个体,例如考虑进行抗病毒治疗的一个HIV阳性个体,对于所述治疗需要测定大量HIV基因组的序列。靶ssDNA的制备
在一个实施方案中,待转化的核酸是DNA分子。可以以多种方法制备用于转化的单链DNA分子。在当以双链形式获得(例如,从生物样品)靶DNA时的情况下,可将DNA片段化成更小的片段并且将其变性以产生单链片段。例如,可通过将靶ds DNA加热至约95℃来进行变性。此类技术对本领域技术人员来说是已知的。通过调整此类技术的参数,可能调整靶DNA片段的平均大小。此类方法就其切割/断裂DNA分子的位置而言是相对非特异性的,以便通常获得在完整序列各处被切割/断裂的DNA片段。
预先指定的序列是本文所描述的转化方法所必需的,并且在一个实施方案中可使用单链DNA连接酶诸如(图1),例如T4RNA连接酶1(NEB,Ipswich,MA)将其与靶ssDNA分子的任一末端连接。用于连接的方法对于本领域的技术人员来说是公知的。
在可选的实施方案中,通过机械方法或酶切割来剪切基因组以产生片段化的dsDNA。一些限制性内切酶诸如EcoRV(NEB,Ipswich,MA)切割产生平端。可选地,利用诸如大肠杆菌(E.coli)DNA聚合酶I大片段(Klenow片段)或T4DNA聚合酶的酶将dsDNA分子的末端转化成平端。可将磷酸酶用于阻止dsDNA的自身连接。然后使用T4DNA连接酶将其一端(非连接末端)可被生物素化的预先指定的寡核苷酸标签连接至靶dsDNA片段。然后处理(例如,通过加热)DNA以分离两条链并且产生具有生物素化末端的单链DNA片段。用于这些步骤的方法对于本领域的技术人员来说是公知的。
固体载体
在本发明的一个实施方案中,将靶核酸固定至固体载体。靶单链核酸的固定允许在转化过程中除去未整合的探针和将待进行的酶处理与发生于其间的洗涤步骤分离而无靶单链核酸片段的大量损失。固定具有促进单个靶ssDNA分子的空间分离以便单个探针与仅一个ssDNA分子杂交的额外优势。
在其最简单的形式中,固体载体包括与生物素化的靶核酸序列结合的载玻片。在本发明的一个实施方案中,将靶单链核酸锚定至固相载体,诸如磁性颗粒、聚合物微球、过滤材料等,所述固相载体允许连续应用试剂而无需复杂且费时的纯化步骤。
可使用许多种其它固体载体,包括但不限于下列固体载体:纤维素、硝酸纤维素、尼龙膜、可控孔度玻璃珠(controlled-pore glassbead)、丙烯酰胺凝胶、聚苯乙烯基质、活化葡聚糖、抗生物素蛋白/链霉抗生物素蛋白包被的聚苯乙烯珠、琼脂糖、聚乙烯、官能化塑料、玻璃、硅、铝、钢、铁、铜、镍和金、试管、孔、微量滴定板或孔、载玻片、圆盘、柱子、珠粒、膜、孔带(well strip)、薄膜、芯片和其复合材料(composite)。在一个实施方案中,一部分固体载体的表面用化学官能团来包被以允许例如靶ssDNA与固体载体的表面共价结合。具有已包含在表面上的官能团的固体载体是商购可得的。此外,可由从业人员将官能团加至固体基质。
许多方法可用于将例如靶ssDNA偶联至固体基质,包括但不限于:共价化学连接;生物素-抗生物素蛋白/链霉抗生物素蛋白;和紫外线照射(参见例如,Conner等人,Proc.Natl Acad.Sci.80(1):278-282(1983);Lockley等人,Nucleic Acids Res.25(6):1313-1314(1997),据此其全文通过引用并入本文)。
靶核酸/固体基质连接可包括但不限于下列连接类型:二硫化物、氨基甲酸酯、腙、酯、(N)-官能化硫脲、官能化马来酰亚胺、链霉抗生物素蛋白或抗生物素蛋白/生物素、硫化汞、硫化金、酰胺、硫酯、偶氮、醚和氨基。
如果固体基质由聚合体制造,那么其可从(不限于)任何下列单体:丙烯酸、甲基丙烯酸、乙烯基乙酸、4-乙烯苯甲酸、衣康酸、烯丙基胺、烯丙基乙胺、4-氨基苯乙烯、2-氨乙基甲基丙烯酸酯、丙烯酰氯、甲基丙烯酰氯、氯苯乙烯、二氯苯乙烯、4-羟基苯乙烯、羟甲基苯乙烯、乙烯基苯甲醇、丙烯醇、2-羟乙基甲基丙烯酸酯、聚(乙二醇)甲基丙烯酸酯及其混合物与下列单体之一一起产生:丙烯酸、丙烯酰胺、甲基丙烯酸、乙烯基乙酸、4-乙烯苯甲酸,衣康酸、烯丙基胺、烯丙基乙胺、4-氨基苯乙烯、2-氨乙基甲基丙烯酸酯、丙烯酰氯、甲基丙烯酰氯、氯苯乙烯、二氯苯乙烯、4-羟基苯乙烯、羟甲基苯乙烯、乙烯基苯甲醇、丙烯醇、甲基丙烯酸2-羟基乙酯、聚(乙二醇)甲基丙烯酸酯、丙烯酸甲酯、甲基丙烯酸甲酯、丙烯酸乙酯、甲基丙烯酸乙酯、苯乙烯、1-乙烯基咪唑、2-乙烯吡啶、A-乙烯吡啶、二乙烯苯、乙二醇二甲基丙烯酸酯、N,N′-亚甲基双丙烯酰胺、N,N′-亚苯基二丙烯酰胺、3,5-双(丙烯酰氨基)苯甲酸、季戊四醇三丙烯酸酯、三羟甲基丙烷三甲基丙烯酸酯、季戊四醇四丙烯酸酯、三甲醇丙烷乙氧酯(14/3EO/OH)三丙烯酸酯、三甲醇丙烷乙氧酯(7/3EO/OH)三丙烯酸酯、三甲醇丙烷乙氧酯(1PO/OH)三丙烯酸酯、三甲醇丙烷乙氧酯(2PO/OH)三丙烯酸酯及其混合物。
固体基质应当经受住本文所描述的方法所必需的温度变化以及酶促过程、缓冲系统和在方法中进行的反复洗涤步骤。
当将例如靶ssDNA序列固定至基质时,靶ssDNA分子应当在固体载体上彼此间隔充分远以防止单个探针与两个靶ssDNA片段的连接。每个分子之间的距离取决于每个片段的大致长度并且可在从1nm至1000nm的范围内变化。
1级探针文库
本文描述了一种用于将靶ssDNA分子中的每个核苷酸顺序转入转化的ssDNA分子的方法,其中每个被转化的核苷酸由代表该核苷酸的已知序列来分离。在一个实施方案中,转化方法包括下列步骤:(a)通过将预先指定的序列与分子的一端连接并且将靶ssDNA模板固定至固体载体上来制备片段化的靶模板;(b)在可允许特异性杂交的条件下将固定的靶ssDNA分子与包含多个不同寡核苷酸探针的寡核苷酸探针文库接触;(c)将杂交的靶ssDNA/探针复合物与DNA连接酶接触以形成靶ssDNA/探针反应环(reaction circle);(d)将靶ssDNA/探针环与期望的IIS型限制性内切酶接触;(e)分离和洗去结合的探针的双链部分,和(f)按要求重复步骤(a)-(e)。每个步骤由发生于其间的洗涤步骤分离。在本文更详细地描述了转化的示例性方法。
用于本文所描述的进行1级转化的方法的探针包含双链部分和两个单链悬突。“探针文库”包含多种不同的寡核苷酸,每种不同的寡核苷酸在一种混合物中具有多个拷贝。不同寡核苷酸的数目决定了文库的“复杂度”并且由每个探针中的随机(例如,简并)核苷酸的数目决定,以便在一个文库中容纳包含A、T/U、C和G的全部可能的组合的探针。
仅为了举例说明,参见图2,该图描述了用于1级转化的探针文库的示例性寡核苷酸探针。图2中描述的探针用于从其3′末端转化靶ssDNA分子,然而在本文中还预期利用类似的探针构型从其5′末端转化靶ssDNA分子。每个探针具有侧翼有两个单链悬突的双链区域。两个悬突都包含在相同链(5′-3′;即,上链)中,从而被探针的双链部分的5′-3′方向链分隔。在该实例中,存在于探针的第一单链悬突上的标记有5′-S′5、S′4、S′3、S′2、S′1-3′的核苷酸形成预先指定的序列,其与连接至靶ssDNA分子的一端的预先指定的序列互补。第一单链悬突还包含至少一个随机(例如,简并)核苷酸(注意,该悬突将具有4个不同的组合,每个核苷酸A、T/U、C或G一个组合)。探针的双链部分的3′末端上的悬突包含6个随机核苷酸(例如,对于给定的核苷酸序列,A、T/U、C、G的4096个可能的组合)。紧邻双链部分的核苷酸与待转化的靶ssDNA的核苷酸互补,并且在图2中被指定为x′。每个悬突的长度可从少至3个核苷酸至多至12个核苷酸内变化。重要地是要指出,随着探针上悬突长度的增加,探针文库的复杂也增加。例如,具有12个核苷酸的3′悬突的探针需要具有为413(即,11个简并核苷酸加上3′悬突上的x;加5′悬突上的至少一个简并核苷酸)的复杂度的文库。用于1级转化的寡核苷酸探针(图2)包括具有IIS型限制性内切酶的识别序列(R′/R)和预定的寡核苷酸密码(Xx)的双链DNA部分。在一个实施方案中,R′/R在X′X/XX内。
将图2显示的示例性探针与结合(R′/R)并且切割其识别序列的外侧至第二单链悬突的5′侧(图3c)的IIS型限制性内切酶接触。在该实例中,第一单链悬突包含与靶ssDNA的预定的寡核苷酸密码(5′-S1、S2、S3、S4、S5-3′)的位置2-6中的序列互补的序列5′-S′5、S′4、S′3、S′2、S′1-3′,其后是由探针文库中全部4种核苷酸代表的位置(n),所述4种核苷酸之一与靶ssDNA的预定的寡核苷酸的第一位置(x0)互补;第二单链悬突(5′-x′、n、n、n、n、n-3′)包含与待转化的核苷酸(x)互补的序列,其后是由探针文库中全部4种核苷酸代表的5个位置。图3a显示在允许文库中多个探针之一与靶ssDNA分子形成完全匹配的双链体的条件下(注意,该实例中x1是待转化的核苷酸)探针与靶ssDNA杂交的一个实施方案。
探针的双链部分包含预定的被指定为X′x的已知序列和互补链Xx,如图2中显示的。在一个实施方案中,已知序列的互补序列结合指定的分子信标。探针的双链部分还包含IIS型限制性内切酶识别位点。限制位点编码于区域中以便限制性内切酶识别所述位点并且从靶ssDNA切割至少一个核苷酸(在图3中指定为x1)(例如,待转化的核苷酸)。因此,对于图3中显示的实例,靶ssDNA分子的3′末端核苷酸提供了完成限制性内切酶切割位点所必需的核苷酸。重要地是要考虑,根据识别位点的位置来选择限制性内切酶的切割特征以便在每一轮中转换期望数目的核苷酸。因此,如果期望转化2个核苷酸,那么切割位点必需切割成以便将两端核苷酸从靶ssDNA分子的一端转移至另一端。因此,探针中识别位点的位置对于期望的酶应当具有适当的距离以获得正确的切割位点。例如,如果使用的限制性内切酶是Mmel(其切割3′-5′链(即,本文图中显示的下链)上其识别位点的下游18个核苷酸),那么将识别位点置于由探针的双链区包含的末端核苷酸的上游16个核苷酸序列,以同时转化2个核苷酸(参见图3)。在其识别位点与其切割位点之间具有短距离(例如,3个核苷酸)的IIS型限制性内切酶要求限制识别序列靠近探针的双链部分的3′末端。相反地,在其识别位点与切割位点之间具有非常长的距离的IIS型限制性内切酶要求识别位点离探针的双链部分的5′末端更近,并且在一些情况下,X′x/Xx的长度可能需要延长以确保正确数目的核苷酸存在于识别位点与切割位点之间。因此,利用的IIS型限制性内切酶可影响本文所描述的方法所需的探针的长度。
Xx的5′末端还包含预先指定的靶序列,该序列与连接至用于第一轮转化的靶ssDNA分子的预先指定的靶序列相同(参见例如图2,其中探针的下游链包含5′-S′1、S′2、S′3、S′4、S′5-3′序列,和图1,其中靶DNA包含5′-S1、S2、S3、S4、S5-3′序列)。这允许第二轮中第二寡核苷酸探针的结合和在每个相继的转化轮中其它的寡核苷酸探针的结合。重要地是要指出,结合的寡核苷酸在转化过程中被消耗,从而对于每个相继轮,必需使用新制备的等分试样的探针文库、酶混合物和洗涤缓冲液。可利用本领域技术人员已知的任何方法(例如,寡核苷酸合成器(oligosynthesizer))来合成探针,或可选地,可从商业来源例如IDT(可在因特网上在idtdna.com上获得)、Invitrogen(Carlsbad,CA)等来购买探针文库。
为了从其5′末端转化靶ssDNA,利用下列变化来合成探针:(1)互换第一和第二悬突以便探针以正确的取向转化5′末端,(2)反转IIS型限制性内切酶序列的识别位点序列(例如,在相反链上来编码识别位点;即3′-5′方向链)以便切割靶ssDNA分子上的至少一个5′末端核苷酸,和(3)将IIS型限制性内切酶识别位点设计成以便适当数目的核苷酸存在于期望的限制性内切酶3′识别位点与5′切割位点之间。
在一个实施方案中,如果期望将模板切离结构支持物,例如以进行进一步的基于纳米孔的测序,则其它的探针(在本文中也称为“洗脱探针”;未示出)是转化后必需的。例如,在一个实施方案中,使用还包含II型限制性内切酶识别位点的预先指定的序列(参见图3,M)来最初地标记靶ssDNA;然而靶ssDNA分子的单链性质不允许使用II型限制性内切酶的切割。因此,其它的单链探针是结合靶ssDNA分子的标记区域以完成双链识别/切割位点所必需的。与洗脱探针接触和进一步将系统与期望的II型限制性内切酶(例如,BamHI)的接触允许将靶ssDNA分子切离支持物以按要求进行进一步测序。
应当指出,除了核苷酸A、C、T和G外,探针的3′-末端中的核苷酸可以是肌苷(I)或与腺嘌呤、胸腺嘧啶或胞嘧啶无差别地配对的其它核苷酸。这样,可降低文库的复杂度,从而允许转化效率的增加。这些位置不应当离连接位点太近,否则它们可干扰连接反应,然而,其可离连接位点近至第6个位置(即,图3和图4b中举例说明的探针的3′末端位置可以是肌苷)。具有多个肌苷位置(例如,第6、第7、第8和第9位置)将不增加文库的复杂度但将为连接酶提供更大的足迹以更有效地工作。
本文所描述的方法的一个方面涉及包含T形探针的寡核苷酸探针文库,其用于本文所描述的DNA转化方法。
2级转化探针
存在两个用于2级转化的探针文库,在本文中称为文库I和文库II。
文库I包含对应于A、C、T和G的4种不同寡核苷酸探针(即,4的复杂度)。探针包含双链部分P′/P,其在本文中被称为“预先指定的核苷酸间隔区序列”。“预先指定的核苷酸间隔区序列”包含至少3个核苷酸,但在长度上可变化,由本领域的技术人员酌情决定(考虑诸如特定的杂交条件、解链温度、针对文库II的探针的非互补序列等的参数)。文库I的探针包含第一和第二悬突,其中第一单链悬突与靶ssDNA上的预先指定的核苷酸序列互补并且第二单链悬突与文库II的探针的一端互补。为了在靶分子的3′末端上的转化,第一单链悬突位于5′-3′上游链,而第二单链悬突位于3′-5′下游链。
图4a显示文库I的示例性探针,其中P′在其5′末端上包含与连接至待转化的靶ssDNA分子的预先指定的序列互补的序列和对应于A、C、T或G的位置(指定为n)。在该实例中,第二单链悬突位于P的5′末端上并且包含不变序列5′-q′1、q′2、q′3、q′4、q′5-3′。在该实例中,如本文所定义的不变序列包含P,和第二单链悬突。在一个实施方案中,R′/R在X′x/Xx内。
文库II包含与用于I级转化的探针相似的探针。然而,对第一单链悬突进行设计以结合文库I中的探针的第二单链悬突,而非直接结合靶核酸分子。图4b显示文库II的示例性探针,其中该序列是5′-q5、q4、q3、q2、q1-3′。探针包含双链部分(R′、X′x/Xx、R)和与待转化的靶ssDNA的末端结合的第二单链悬突;以与1级转化中使用的探针相似的方式设计探针的这些部分。此外,文库II还包含与第一ssDNA悬突互补的封闭寡核苷酸,其中5′末端未被磷酸化。
连接酶
可通过酶促或化学方法实现连接。化学连接法在本领域内是公知的,例如Ferris等人,Nucleosides & Nucleotides,8:407-414(1989);Shabarova等人,Nucleic Acids Research,19:4247-4251(1991);等。然而,优选地,在标准方案中使用连接酶来酶促进行连接。许多种连接酶是已知的并且适合用于本发明,例如Lehman,Science,186:790-797(1974);Engler等人,DNA Ligases,Boyer第3-30页,编者,The Enzymes,第15B卷(Academic Press,New York,1982)。优选的连接酶包括T4DNA连接酶、T7DNA连接酶、大肠杆菌DNA连接酶、Taq连接酶、Pfu连接酶和Tth连接酶。其使用方案是公知的,例如Sambrook等人;Barany,PCR Methods and Applications,1:5-16(1991);Marsh等人,Strategies,5:73-76(1992)。通常,连接酶要求存在5′磷酸基团以用于连接至邻接链的3′羟基。
本文所使用的“连接酶”是指催化两个核酸序列的糖-磷酸主链的连接的酶。因此,连接酶连接两个独立的DNA序列的主链以在该位点产生一个无缝DNA序列。两种类型的连接酶可用于实施本文所描述的方法:(a)RNA连接酶(例如,T4RNA连接酶)和(b)DNA连接酶(例如,T4DNA连接酶)。
也对单链DNA具有活性的RNA连接酶(例如,T4RNA连接酶)可用于将预先指定的序列标签连接至靶ssDNA分子的一端。该序列标签是在第一轮转化中与寡核苷酸探针杂交所必需的。因为大多数DNA连接酶只对双链DNA分子有活性,所以可通过使用RNA连接酶将预先指定的序列加至单链DNA分子。该连接酶也用于标记用于本文所描述的方法的靶RNA分子。该酶的对单链DNA分了的活性比对单链RNA分子的活性低,因此必需更长的温育时间来将标签连接至靶ssDNA分子上。
在可选的实施方案中,使用DNA连接酶将预先指定的核苷酸序列加至靶ssDNA分子的一端,然后将dsDNA变性成ssDNA,如在本文的“靶核酸模板”部分中所描述。
DNA连接酶在本文中还用于将一个具有悬突的双链DNA片段与一个单链DNA片段连接在一起,并且用于将寡核苷酸探针连接至靶ssDNA分子。基本上,将靶ssDNA与寡核苷酸连接在一起以形成在探针区域包含双链部分的连续环。由连接的寡核苷酸探针和靶ssDNA分子产生的该环在本文中称为“反应环”或“靶ssDNA/探针环”。
一般地,商业连接酶来源于T4噬菌体或大肠杆菌,然而也涉及来自其它来源的连接酶。在一个优选的实施方案中,可使用耐热连接酶,诸如Ampligase
Figure BDA0000069379270000301
耐热连接酶允许在更严格的温度下进行连接,必要时可进行定制来允许不同寡核苷酸探针的特异性杂交。
商业连接酶的反应条件可变化,并且使用方法由制造商提供。这些方法可由本领域的技术人员来进行,反应条件的改变(以提供用于本文所描述的方法的连接酶的最佳性能)完全在本领域的技术人员的能力范围内。
限制性内切酶
如本文所使用的,术语DNA的“限制性内切酶消化”是指利用只在DNA中的某些位置上起作用的酶(即,限制性内切酶)的DNA序列的催化切割,通常每个特异性的位点被称为限制位点。预期用于本文的各种限制性内切酶是商购可得的,并且使用由酶提供商确定的其反应条件、辅因子和其它要求。由制造商来指定用于特定限制性内切酶的适当的缓冲液和底物量。温育在37℃下通常采用为约1小时,但可按照提供商的说明书进行改变。两种类型的限制性内切酶用于实践本文所描述的方法:(a)IIS型和(b)II型限制性内切酶。
IIS型限制性内切酶用于切割待转化的靶ssDNA分子的末端核苷酸。IIS型限制性内切酶(例如,Fokl、AiwI、Mmel)切割其识别序列的外则至一侧。这些酶识别连续且不对称的序列。该切割模式通过酶上的两个不同结构域(一个用于DNA结合,另一个用于DNA切割)来实现。据认为,其通常以单体形式结合DNA,但通过邻近酶分子的切割域的二聚化来协同地切割DNA。IIS型限制性内切酶的实例是Mmel,其识别不对称序列TCCRAC并且切割5′-3′上游链上的下游20个核苷酸,从而在上游链上留下2个核苷酸的3′悬突。将IIS型限制性识别位点整合入用于本文所描述的方法的探针。
本质上,几乎任何IIS型限制性内切酶,包括留下平端的酶可用于本文所描述的方法。重要地是将具有一致切割性质的限制性内切酶用于本文所描述的方法(例如,特定的切割位点)。在一些情况下,从靶ssDNA分子的3′末端切割仅一个核苷酸,因而在其特定的切割位点上不一致地切割的酶将在转化和任何随后的测序过程中引起错误。重要地是还要考虑限制性内切酶用以大体上完成切割所耗费的时间长度。在一个实施方案中,选择具有相对短的切割时间的IIS型限制性内切酶,其允许相继的轮在相对短的时帧内发生(例如,以加速更长的靶ssDNA模板的转化速率)。IIS型限制性内切酶可以是如由Roberts,RJ等人(2003)Nucleic Acids Research 31(7):1805-1812(其通过引用全文引入本文)定义的任何IIS型限制性内切酶的任何公认的序列。此外,本文还预期,(a)自然界中新发现的;(b)重组产生的或(c)经修饰的新型IIS型限制性内切酶也可用于本文所描述的方法。
一些IIS型限制性内切酶在本文所描述的方法中是无用的,因此应当慎重选择IIS型限制性内切酶。例如,一些IIS型限制性内切酶在其识别序列(例如,PsrI、Ppil、Hin41、AIoI、BsaX、BcgI、CspCI、BaeI)的两侧切割DNA,从而应当避免用于本文描述的方法。如果未转化的靶核酸分子的一端不包含完整的双链切割位点,那么可能使用此类酶。
此外,一些IIS型限制性内切酶具有需要特定末端核苷酸(例如,腺嘌呤)而不是简并核苷酸(例如,n)以进行切割的切割位点。因此,这些类型的酶将只切割具有该特定末端核苷酸(例如,腺嘌呤)的靶ssDNA分子,因此具有其它末端核苷酸(例如,胸腺嘧啶、胞嘧啶、鸟嘌呤)的任何靶ssDNA分子不被切割。由于靶ssDNA的核苷酸序列是未知的,因此不可能使用此类酶进行转化过程。这些酶的一些实例包括BsmI、BbvCI、BssSI、BseYI、Bpu10I,本文不考虑使用所述酶。
为了从其固体载体切割转化的ssDNA分子以使用例如基于纳米孔的技术进一步测序,在本文所描述的方法中使用II型限制性内切酶。一些非限定性II型酶是在其回文识别序列内切割DNA的那些酶,诸如HhaI、HindIII、BamHI和NotI。切割在每个切口的一侧留下3′-羟基和在另一侧留下5′-磷酸。由于II型限制性识别位点和预先指定的标签序列一起被连接至靶ssDNA分子,因此靶ssDNA分子被切割的区域在所有靶ssDNA片段中是一致的。靶ssDNA分子只有在加入间隔探针以完成回文双链序列后才能被II型限制性内切酶切割。在本文涉及并且论述了设计用于该目的的洗脱探针。
杂交条件
核酸杂交涉及在其探针与其互补靶ssDNA可通过互补碱基配对形成稳定的杂交双链体的条件下将探针与靶ssDNA接触。然后洗去不形成杂交双链体的核酸,从而留下用于保持序列的DNA转化的杂交的寡核苷酸。最佳杂交条件将随探针的长度和适当的探针结合所需条件的严格度而变化。一般而言,更低的温度允许更大量的探针结合靶ssDNA(包括非特异性探针),而更高的温度由于严格度的增加而允许更少量的探针结合靶ssDNA(例如,只有特异性杂交的探针才被允许在严格条件下结合靶ssDNA)。
一般的杂交技术描述于Hames和Higgins(1985)Nucleic AcidHybridization,A Practical Approach,IRL Press;Gall和Pardue(1969)Proc.Natl.Acad.Sci.USA 63:378-383;以及John等人(1969)Nature 223:582-587中。优化杂交条件的方法描述于,例如Tijssen(1993)Laboratory Techniques in Biochemistry andMolecular Biology,第24卷:Hybridization With Nucleic AcidProbes,Elsevier,N.Y.。用于DNA组成的促进退火的条件对于本领域的技术人员来说是已知的并且描述于Sambrook等人,(1989),Molecular Cloning:A Laboratory Manual,第2版,Cold SpringHarbor,N.Y.。
二进制码
在本文所描述的方法的一个实施方案中,将靶ssDNA或靶RNA分子转换成二进制码。在该实施方案中,Xx包含第一核酸序列XxI和第二核酸序列XxII。将XxI和XxII的序列设计成以便XxI结合具有第一标记的分子信标,并且XxII结合具有第二不同标记的分子信标。XxI和XxII在大小上可根据本领域技术人员的需要在一定范围内,例如XxI和XxII在长度上各自可在约4个核苷酸至约25个核苷酸的范围内。在一个实施方案中,XxI和XxII在长度上各自为12个核苷酸。
靶ssDNA至二进制码的转化基于简单的想法:用通过“0”或“1”标识的2单元码(unit code)替代构成DNA分子(即,A、T、C、G)或RNA分子的4种不同核苷酸(即,A、U、C、G)中的每一个(参见,例如美国专利No.6,723,513,该专利的全文通过引用并入本文)。例如用2单元码(0,0)替代原始序列中的腺嘌呤,用(0,1)替代胞嘧啶,用(1,0)替代鸟嘌呤以及用(1,1)替代胸腺嘧啶。二进制码是反映原始DNA分子的碱基序列的2种类型的单元码的连续串接。在一个实施方案中,这些单元码被设计为4-25bp长的DNA区段(即,4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25)。例如,0单元码可以是ATT TAT TAG G,1单元码可以是CGG GCG GCA A,但也可使用单元码的任何其它序列。值得注意地,该转化导致,例如DNA长度增加约20倍,但不再需要分辨单个核苷酸。相反只需检测单元码的识别性(identity)(0或1)。因此该转化极大地简化了单分子(例如,基于纳米孔的)测序的读出过程。
利用由LingVitae AS(美国专利No.6,723,513)开发的生物化学转化法进行双链靶DNA分子的前述转化。然而,LingVitae的方法受限于靶DNA的可能的最大长度,其利用双链DNA靶,并且一些情况下需要聚合酶来扩增靶DNA分子。本文所描述的用于转化的方法不受这些约束的限制。
转化靶ssDNA分子的示例性1级方法
本文描述了用于将靶ssDNA分子的每个核苷酸顺序转入转化的ssDNA分子的方法,其中每个转化的核苷酸被代表该核苷酸的已知序列进行分离。所述已知序列本质上是包含预定的核苷酸组的密码,该密码代表每个核苷酸。该密码可以是二进制码。在本发明的方法中,靶ssDNA序列的顺序得到保持,然而其是用于分子的进一步测序而非单个核苷酸分辨率水平上的测序的已知序列。例如,使用来源于寡核苷酸探针的已知序列的12聚体替代转化的腺嘌呤核苷酸。
为了举例说明,下文描述了示例性方法,其中用预先指定的序列在5′末端上标记靶ssDNA分子,并且从3′末端来转化该分子。本文还预期,可在其5′末端转化靶ssDNA分子和在3′末端标记所述分子。
关于该转化方法,在允许不同探针(例如,在探针文库中的47种不同探针中,存在与靶ssDNA特异性杂交的探针;该不同的探针可存在,例如数千拷贝)的特异性杂交的条件下将片段化和固定的单链靶DNA分子与探针文库接触。优选地,不同探针的悬突区域以100%的互补性与待转化的靶ssDNA分子特异性杂交。在杂交后,用适当的洗涤缓冲液洗去未结合靶ssDNA分子的过量探针。通常,洗涤缓冲液包含具有最佳去垢剂或盐成分的特定pH的缓冲盐水溶液。具有更高盐或去垢剂浓度的洗涤缓冲液提高了洗涤的严格度,并将除去非特异性结合的探针。还可升高或降低pH以改变洗涤严格度。最佳条件将随具体的缓冲液而变化,并且本领域的技术人员完全有能力制备和改变这类洗涤缓冲液。
然后在可允许特异性杂交的探针与靶ssDNA的连接以形成环的条件下将固定的靶ssDNA与连接酶接触,其中探针用作靶ssDNA分子的两端之间的桥。图3b描述了利用连接酶将结合的探针的更短的链的两端与靶ssDNA连接,从而形成环状分子的实例。图3b中两个球标示了连接的位置。
在连接后,除去连接混合物,然后进行洗涤步骤。
将固定的靶ssDNA/探针环与IIS型限制性内切酶(例如,Mmel)接触,所述酶对应于探针的双链部分上的IIS型限制性内切酶识别位点。限制性内切酶在离其识别位点数个核苷酸远的位置上切割,以便将至少1个核苷酸(在图3中被指定为x1)切离靶ssDNA的3′末端并且保持该核苷酸被连接至在图3中被指定为Xx的核苷酸序列。在该过程中线性化靶ssDNA/探针复合物,并且暴露新的3′末端核苷酸。
图3c显示切割步骤的一个实施方案,其中将连接的分子与特异性识别存在于探针的双链DNA部分中的序列(R′/R)的IIS型限制性内切酶接触,其中所述酶切割待转化的靶ssDNA的3′末端上的至少一个核苷酸,从而从靶ssDNA分子的3′末端除去待转化的核苷酸。
为了除去剩余的结合探针并且使复合物返回单链分子,可加热(例如,95℃)和洗涤该系统。通过加热将探针的滞留链(linger strand)的片段与靶ssDNA分离,并且将其洗去;因此探针不能重新使用。现完成一轮转化方法。本实例中3′末端转化的靶ssDNA分子在其5′末端包含3′转化的核苷酸x,和包含5′-S1、S2、S3、S4、S5-3′预先指定的序列的Xx以及来自寡核苷酸探针的其余Xx序列。洗去剩余的探针片段和缓冲液混合物。
现可按要求将系统用于下一轮的转化。与第一轮相似地进行第二轮。重要地是要指出,将新制备的溶液等分试样用于各相继的轮,例如,在杂交阶段使用新制备的探针等分试样。在第二和随后的重复轮中,不同于靶ssDNA的新暴露的3′和5′末端的寡核苷酸探针以相似于第一探针的方式结合。第一单链悬突结合靶ssDNA的5′末端上的其互补链并且第二单链悬突结合靶ssDNA的3′末端。将系统在用于杂交的条件下进行温育,洗去过量的探针,并将系统与双链DNA连接酶(例如,T4DNA连接酶)接触以形成靶ssDNA/探针环。再次洗涤该系统,将其与IIS型限制性内切酶(例如,Mmel)接触以线性化该分子并且将末端3′核苷酸转移至正在生长的5′末端。加热系统以使双链区变性,并完成第二轮。以相似的方式进行更多轮直至完成基本上全部的靶ssDNA片段的转化的长度(或基本上完成靶ssDNA分子的期望部分的转化)。
本文还预期同时转化多个核苷酸(例如,一次转化至少2个、至少3个、至少4个、至少5个、至少6个或更多个核苷酸)。这不改变文库的复杂度,但将减少给定的靶的循环次数。将限制性内切酶识别位点R移至离切割位点所需的距离以允许在每轮转化中切割期望数目的核苷酸。
本文所描述的方法用于在1周内转化靶ssDNA分子并随后测定靶ssDNA分子的序列。在一个实施方案中,本文所描述的方法可在1天内(例如,16小时、12小时、8小时、4小时、2小时、1小时、30分钟、15分钟或其之间的任何整数)转化靶ssDNA分子。
2级方法
在本文所描述的DNA转化的基本方法(称为1级转化)中,两个独立的探针可能同时结合一个靶ssDNA分子,其中一个探针结合靶ssDNA的5′末端并且第二探针结合其3′末端。这可导致测序效率的降低。因此,在本文中还描述了更复杂的方法,称为“2级DNA转化”。该方法还提供了在每个转化循环之间加入预先指定的核苷酸间隔区序列(例如,12聚体)的优势。该序列可用于杂交与已使用的颜色信标不同的颜色编码的分子信标,以高度促进读出过程并且避免潜在移码错误。
2级DNA转化利用两个探针文库(例如,图4),其中一个包含封闭寡核苷酸(例如,5′-q1′、q2′、q3′、q4′、q5′-3′)。为了举例说明,本文描述了用于转化靶ssDNA分子的3′末端的方法,然而,本文还预期也可从5′末端转化靶ssDNA分子。
文库1包含4种不同的探针。示例性探针示于图4a中,其包含双链区以及第一和第二单链悬突,其中双链区是预先指定的寡核苷酸间隔区(P′/P);其中第一单链悬突具有与用于1级转化的文库中的探针的第一单链悬突(示于图2中)相同的组成。在该实例中,第一悬突具有序列5′-S′5、S′4、5′3、5′2、S′1、n-3′并且第二单链悬突具有预先指定的序列5′-q′1、q′2、q′3、q′4、q′5-3′,其与文库II中的封闭寡核苷酸相同,并且其中选择P′/P、5′-q′1、q′2、q′3、q′4、q′5-3′和5′-S′5、S′4、S′3、S′2、S′1、n-3′的序列以便没有两个序列或其互补序列可以以任何可观察到的强度彼此杂交。
文库II的一个实施方案示于图4b中,并且包含46或4096种不同的探针,每个探针具有双链区以及第一和第二单链悬突。在该实例中,双链区具有与I级转化文库中的探针的双链区(示于图2中)相同的组成,并且具有序列R′、X′x/Xx、R,而第一单链悬突具有例如预先指定的序列5′-q5、q4、q3、q2、q1-3′,其与封闭寡核苷酸5′-q′1、q′2、q′3、q′4、q′5-3′互补并且被其封闭。在该实施方案中,第二单链悬突具有与1级转化文库中的探针的第二单链悬突相同的组成并且具有序列(5′-x′、n、n、n、n、n-3′),其中封闭寡核苷酸的5′末端未被磷酸化,这阻止了通过连接酶将其与双链区中的R的3′末端连接,其中可以不磷酸化第一单链悬突的5′末端以阻止连接,但这不是必需的。
关于纳米孔测序的具体应用,对于每轮转化,可将不变序列(例如,5′-R、q′1、q′2、q′3、q′4、q′5、P-3′)整合入靶ssDNA。这可用于结合独特的分子信标,其用作每个转化的碱基之间的“逗号”,以便将其置于每个转化的核苷酸之间(例如,和二制码一起)。关于对应于A、C、G和T的4种寡核苷酸密码以两位格式(two bit format):XxI、XxII(XxI和XxII为两个预先指定的序列并且每个可通过经标记以特定的频率发射光的分子信标进行结合)存在的实施方案,如果经标记以第三频率发光,那么该信标可用于在读出过程(例如,二进制码的读出)中避免移码。
在本文所公开的该方面和所有其它方面的一个实施方案中,用于I级转化的文库的第一单链悬突的5′-S′5、S′4、S′3、S′2、S′1-3′序列和用于II级转化的文库I的第一单链悬突可具有不止1个预先指定的序列。在一个实施方案中,5′-S′5、S′4、S′3、S′2、S′1-3′可以是4种不同的预选指定的序列,对应于A、C、G和T。在另一个实施方案中,其中寡核苷酸密码以两位格式(例如,XxI、XxII)存在,5′-S′5、S′4、S′3、S′2、S′1-3′可以是两个不同的预先指定的序列,每个对应于两种类型的核苷酸。这两个实施方案可分别使对应文库的复杂度增加4和2倍。
代表2级转化方法的一个实施方案的示意图示于图5中。图5所描述的示例性方法包括下列步骤:
(a)以与上述1级转化相同的方式制备靶ssDNA,然而将其与来自文库I和文库II的探针(图4)的混合物接触,其中文库I中仅有一个具有与靶ssDNA分子的5′末端互补的序列的探针可与其杂交并且来自完整的双链体,其中文库II中仅有一个具有与靶ssDNA分子的3′末端互补的序列的探针可与其杂交并且来自完整的双链体(图5a);
(b)利用连接酶将文库I探针与靶ssDNA的5′末端连接并将文库II探针与靶ssDNA的3′末端连接,然后洗去未结合的探针(图5b);
(c)分离封闭寡核苷酸(例如,通过低温解链)而不分离探针-靶ssDNA复合物的其它双链区,并洗去封闭寡核苷酸(图5c);
(d)让文库I探针的第二单链悬突与文库II探针的第一单链悬突杂交以形成完整的双链体(例如,通过冷却),并且利用连接酶连接两个探针;从而形成环状分子(图5d);
(e)用特异性识别序列(R′/R)的IIS型限制性内切酶切割探针-靶ssDNA,其中所述酶在待转化的靶ssDNA的3′末端上的至少一个核苷酸的5′末端处切割(图5e);
(f)分离所有双链区(例如,通过高温解链)并且洗去未与靶ssDNA连接的探针的所有部分(图5f);其中步骤(a)-(f)产生在其5′末端包含5′-x1、Xx1、q′1、q′2、q′3、q′4、q′5、P-3′的转化的靶ssDNA分子,其中Xx1是对应于靶ssDNA的被转化的核苷酸(图5中的x1)的预先指定的寡核苷酸密码。
在本文所公开的该方面和所有其它方面的一个实施方案中,重复步骤(a)-(f)多于1次。图5g举例说明了第二循环的步骤(a)。
重要地是要指出,文库I对于本文所描述的2级转化不是绝对必需的,即可利用用于1级转化的文库和4种封闭探针(例如,5′-A、S1、S2、S3、S4、S5-3′、5′-T、S1、S3、S3、S4、S5-3′、5′-C、S1、S2、S3、S4、S5-3′和5′-G、S1、S2、S3、S4、S5-3′)来进行2级转化,所述封闭探针的5′末端未被磷酸化。
由于在转化后一部分文库I探针被整合入靶ssDNA分子,因此如果需要基于纳米孔的测序,重要地是要考虑该整合的区域的长度。由于文库I探针可将例如12个碱基加入DNA分子,因此可能需要延长分子信标的长度以允许一个信标被其邻近信标完全猝灭。在适当长度的分子信标不存在的情况下,信噪比可减小。加入许多碱基对的能力在本文中预期用于代表转化的分子中的特定核苷酸的不同密码的设计,从而可增加DNA转化的应用。特别地,该不同序列可用于靶向第三颜色编码的分子信标,其在转化的DNA中每对密码信标之后标志“逗号”。该方法可用于在读出过程中避免潜在的“移码”,因为第三颜色将总是标志着新读框(或信标的两个色序(color sequence))的起始,其对应于靶DNA中的某一核苷酸。
本文还预期同时转化多个核苷酸(例如,一次转化至少2个、至少3个、至少4个、至少5个、至少6个或更多个核苷酸)。这不改变文库的复杂度,但将减少给定的靶的循环数。将限制性内切酶识别位点R移至离切割位点所需的距离以允许在每轮转化中切割期望数目的核苷酸。
将转化的ssDNA模板从载体切离
一旦靶ssDNA分子被转化,在一些实施方案中必需将固定的分子从其表面载体除去以便可使用纳米孔测序系统对其进一步测序。例如,预先指定的序列是(5′-x0、S1、S2、S3、S4、S5、M-3′)并且包括特异性地结合M并且在该识别序列内切割(从而释放已被转化的靶ssDNA)(参见图3和5)的II型限制性内切酶。
在靶ssDNA的制备过程中被连接至模板分子的预先指定的序列包含双链、回文、限制性内切酶识别序列(例如,Bam HI)的单链。将包含至少预先指定的标签序列的互补回文序列的单链寡核苷酸加至靶ssDNA片段并且在允许特异性杂交的条件下进行温育。优选地,洗脱探针包含互补回文序列和至少一部分预先指定的标签序列,以便洗脱探针在优选切割位点上而非在靶ssDNA分子的其它区域进行特异性杂交。洗去过量探针,将具有结合的寡核苷酸探针的靶ssDNA片段与特异于存在于预先指定的序列上的回文序列的限制性内切酶接触。可收集固定的片段以使用纳米孔进行测序。如果需要,可重复该过程以确保大体上所有靶ssDNA片段从载体完全洗脱。
纳米孔测序
在一个实施方案中,用纳米孔探测转化的单链核酸以允许快速测序。
纳米孔光学读出平台的概念详细地描述于美国专利No.6,362,002中,其以引用的方式全文并入本文。通过生物化学方法将靶ssDNA转化成二进制码,其中原始靶ssDNA序列中的每个碱基用2个二进制码单元(分别地,以开圆和实心圈标记的0和1)的独特组合来代表。将转化的靶ssDNA与2种类型的与2个编码单元互补的分子信标杂交。
分子信标是具有内部猝灭荧光团的发夹形分子,当其结合互补靶核酸序列时其荧光恢复。溶液中(Tyagi等人,″Molecular Beacons:Probes that Fluoresce upon Hybridization,″Nature Biotech.19:365-370(2001);Dubertret等人,″Single-mismatch DetectionUsing Gold-quenched Fluorescent Oligonucleotides,″NatureBiotech.19:365-370(2001))或固定在固体表面上(Fang等人,″Designing a Novel Molecular Bacon for Surface-Immobilized DNAHybridization Studies,″J.Am.Chem.Soc.121:2921-2922(1999);Wang等人,″Label Free Hybridization Detection of SingleNucleotide Mismatch by Immobilization of Molecular Beacons onAgorose Film,″Nucl.Acids.Res.30:61(2002);Du等人,″Hybridization-based Unquenching of DNA Hairpins on Au Surfaces:Prototypical″Molecular Beacon″Biosensors,″J.Am.Chem.Soc.125:4012:4013(2003);Fan等人,″Electrochemical Interrogationof Conformational Changes as a Reagentless Method for theSequence-specific Detection of DNA,″Proc.Natl.Acad.Sci.USA 100:9134-9137(2003))的DNA发夹作为“分子信标”的用途(Broude,″Stem-loop Oligonucleotides:a Robust Tool forMolecular Biology and Biotechnology,″Trends Biotechnol.20:249-256(2002)),已被证明是DNA片段的“无标记”检测的有用方法。分子信标由在一端用荧光基团并且在另一端具有猝灭剂官能化的DNA发夹组成。在其互补序列不存在的情况下,其以闭合的“暗(dark)”构象存在。当引入互补寡核苷酸时杂交发生,其伴随地用力打开发夹,并允许荧光处于“发光”状态。
用于基于纳米孔测序法的每个信标在其5′末端包含荧光基团并且在其3′末端包含猝灭剂或反之亦然,每组信标包含可区分的荧光基团(例如,结合二进制码的0构型的信标和结合二进制码的1构型的信标包含不同的荧光基团)。广谱猝灭剂分子猝灭两种荧光(例如,猝灭分子阻止茎环分子信标的荧光,或即使分子信标与其互补序列结合其仍可阻止相邻分子信标的荧光)。2种不同颜色的荧光基团使得其可能区分2个信标。
通常,分子信标在溶液中和在与其靶杂交后自猝灭,将分子信标设计成“照亮”(Tyagi S,Kramer FR.Nat Biotech 1996;14:303-8;Bonnet G,Tyagi S,Libchaber A,Kramer FR.Proc Natl Acad SciUSA 1999;96:6171-66)。然而,在基于纳米孔的测序方法中,这样排列分子信标以便信标彼此相邻,从而使邻近信标上的猝灭剂可猝灭其邻近信标的荧光发射,并且在连续地将单个编码单元从DNA除去(不包括第一信标)之前DNA将保持“暗”。该概念是纳米孔-光学读出法的主要特征;其显著地减小了来自相邻分子和来自溶液中游离信标的荧光背景,从而导致更高的信号背景比(Meller A,Mathe′J,Eid J.USA,2005)。当将分子引入纳米孔时,信标以约5至10毫秒的时间延迟逐个地连续剥落。通过电场强度调节该时间以优化信号-背景水平(Mathe′J,Visram H,Viasnoff V,Rabin Y,Meller A.Biophys J2004;87:3205-12;McNaIIy,B.,Wanunu,M.和Meller,A.NanoLetters 2008;8:3418-3422)。例如,每次除去新信标,新荧光基团被猝灭并且被定制的显微镜记录。通过设计,释放的信标被自动关闭,从而猝灭其自己的荧光,于是其扩散远离孔的附近。第1信标刚一释放,其相邻信标的荧光基团将照亮。读出时间据估计(单个孔)在约1毫秒/碱基至10毫秒/碱基,或100个单元/秒至1000个单元/秒的范围内或其之间的任何点,例如2、3、4、5、6、7、8、9或10毫秒/碱基或150、200、250、300、350、400、500、600、750、800、900或1000个单元/秒。
在一个实施方案中,可将分子信标连接至另一个分子或化学药品,这导致尺寸的增加,并且纳米孔的直径可大于2nm,只要其小至足以除去分子信标和连接的分子或化学药品,同时允许ssDNA通过。
DNA片段的序列组装
“序列组装”是指对齐(aligning)和合并(merging)很长的DNA序列的许多片段以重建原始序列。一旦已通过纳米孔测序积累了信号信息,可将计算机程序用于将序列片段组装成靶ssDNA分子的原始序列。由于模板的片段化对于每个基因组DNA分子是随机并且独立的,因此来自不同基因组DNA分子的序列产生交叠。可使用计算软件将这些交叠区域加在一起,所述软件分析每个片段的测序结果,检测来源于基因组DNA的区域的片段之间的交叠区域,并且提供来自获得的样品的基因组DNA的可能性高的序列。
用于片段序列的组装或重建的计算软件可获自多种来源。可在万维网上获得使用或购买的DNA组装软件的一些实例包括但不限于Sequencher(genecodes.com)、DNA baser aligner(dnabaser.com)、CAP3(pbil.univ_lyonl.fr.cap3.php;Huang,X.和Madan A.(1999)CAP3:A DNA sequence as sembly program Genome Research9:868-877)、AMOS(jcvs.org/cms/research/software/ttc614)、TIGRassembler(jcvs.org/cms/research/software/ttc614)、Celeraassembler(jcvs.org/cms/research/software/#c614)、Phrap(phrap.org)或CIc bio Advanced contig assembly(clcbio.com)。用于从片段进行DNA序列组装的方法对于本领域技术人员来说是已知的。
测序自动化
在一个实施方案中,使用自动化系统进行转化过程,所述自动化系统可进行洗涤步骤、温育步骤和转化方法所必需的温度的改变(例如,自动化系统可注射溶液,允许快速地进行多个转化步骤,减少来自外部DNA源的污染和改变如由用户输入计算机程序的温度)。所述系统可包括这样的组件,诸如计算机、信息存储装置、机器人组件、热循环仪、显微注射系统、缓冲液和酶溶液贮存器等。可由本领域的技术人员来设计和使用该类型的系统,并且这样的系统预期用于本文所描述的方法。
如本说明书和所附权利要求中所使用的,除非上下文明确地指出,否则单数形式“一个”、“一种”和“所述的”包括复数所指物。因此,例如,阅读本公开后对本领域的技术人员显而易见的是,提及的“所述的方法”包括本文所描述类型的和/或一个或多个方法和/或步骤,等等。
应理解,上述详细的说明和下列实施例仅是举例说明性的并且不应理解为对本发明的范围的限制。对本领域的技术人员显而易见的是,在不脱离本发明的精神和范围的情况下,可对本公开的实施方案做出各种改变和修改。此外,出于描述和公开的目的,确定的全部专利、专利申请和出版物明确地以引用的方式并入本文,例如,这些出版物中描述的方法可与本发明结合使用。这些出版物仅用于本申请的申请日之前的公开。在这点上任何信息都不能被解释为本发明者因先前发明或因任何其它原因而无权先于这些公开的权利的认可。关于日期的所有声明或关于这些文件的内容的表述基于申请者可获得的信息,并且不构成对这些文件的日期或内容的正确性的任何认可。
本发明可被定义为下列编号的段落的任一个。
段落1:一种用于始于其3′末端转化靶单链DNA(ssDNA)分子以便所述靶ssDNA分子的核苷酸腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)可被转化成预定的寡核苷酸密码并且在转化过程中保持所述靶ssDNA的核苷酸顺序的方法,所述方法包括步骤:(a)将在其5′-末端具有预先指定的序列5′-x0、S1、S2、S3、S4、S5-3′的靶ssDNA(其中所述x0可以是A、C、G或T并且S1、S2、S3、S4、S5是预定的寡核苷酸密码(Xx)的前5个位置中的序列)与包含多个寡核苷酸探针的探针文库接触,其中每个探针包含双链DNA部分以及第一和第二单链悬突,其中所述双链DNA部分包含IIS型限制性内切酶的识别序列(R′/R)和唯一地对应于靶ssDNA中的待转化的核苷酸(x)的所述预定的寡核苷酸密码(X′x/xx),其中存在可特异性结合R′/R并且切割所述第二单链悬突中的所述识别序列的外侧的IIS型限制性内切酶,其中所述第一单链悬突包含与预定的寡核苷酸密码的前5个位置中的序列(5′-S1、S2、S3、S4、S5-3′)互补的序列5′-S′5、S′4、S′3、S′2、S′1,其后是由探针文库中全部4种核苷酸代表的位置(n);其中具有序列5′-x′、n、n、n、n、n-3′的所述第二单链悬突包含与待转化的核苷酸(x)互补的核苷酸(x′),其后是由探针文库中全部4种核苷酸代表的5个位置,并且其中在允许文库中的多个探针之一结合所述靶ssDNA分子并且与其形成完全匹配的双链体的条件下进行接触,(b)利用连接酶将步骤(a)中所述结合的探针的更短的链的两端与靶ssDNA连接,从而形成环状分子,(c)将步骤(b)中的所述连接的分子与特异性识别存在于步骤(a)中的探针的所述双链DNA部分的序列(R′/R)的IIS型限制性内切酶接触,其中所述酶切割待转化的靶ssDNA的靶分子的3′末端上的至少一个核苷酸,从而从所述靶ssDNA分子的3′末端除去所述核苷酸;和(d)分离在步骤(c)中被切割的所述探针-靶ssDNA复合物的双链部分,并且洗去来自所述探针的未连接链的寡核苷酸;其中步骤(a)-(d)产生在其5′末端包含5′-x、Xx、R-3′的转化的靶ssDNA分子,其中所述Xx是对应于所述靶ssDNA的被转化的核苷酸x的预定的寡核苷酸密码。
段落2:一种用于始于其3′末端转化靶单链DNA(ssDNA)分子以便将所述靶ssDNA分子的核苷酸腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)转化成预定的寡核苷酸密码并且在转化过程中保持所述靶ssDNA的核苷酸顺序的方法,所述方法包括步骤:(a)将在其5′末端具有预先指定的核苷酸序列的靶ssDNA分子与包含多个探针的寡核苷酸探针文库接触;其中每个探针包含双链DNA部分以及第一和第二单链悬突;其中所述双链DNA部分包含侧翼有所述第一和第二单链悬突的5′-3′核苷酸序列X′x和与X′x核苷酸序列互补的互补3′-5′核苷酸序列Xx,其中所述Xx包含唯一地对应于核苷酸A、T、G或C的一组顺序的预定的寡核苷酸密码,并且代表待转化的所述核苷酸;并且其中所述探针的双链部分包含IIS型限制性内切酶识别位点(R),其切割位点在探针与所述靶ssDNA的3′末端连接后完成,所述靶ssDNA的至少一个核苷酸有待转化;其中所述第一单链悬突位于X′x的5′侧,并且所述第二单链悬突位于X′x的3′侧,其中所述Xx在其5′末端上包含存在于所述靶ssDNA分子的5′末端上的所述预先指定的核苷酸序列;其中所述第二单链悬突在X′x的3′末端并且所述第一单链悬突在X′x的5′之前;其中所述第二单链悬突在紧邻X′x的3′末端的位置上包含与待转化的所述靶ssDNA中的核苷酸互补的核苷酸并且还包含至少3个随机核苷酸;并且其中所述第一单链悬突在紧邻X′x的5′末端上的核苷酸的位置上包含至少一个随机核苷酸并且还包含与存在于所述靶ssDNA中的所述预先指定的序列互补的核苷酸序列;并且其中在允许多个探针之一与所述靶ssDNA分子结合并且与其形成双链体的条件下进行所述接触;(b)将步骤(a)中的结合的所述双链寡核苷酸的两端与所述靶ssDNA序列连接,从而形成环状分子;(c)将步骤(b)中的连接的分子与对应于存在于步骤(a)中的所述双链DNA部分中的所述IIS型限制性内切酶识别位点的IIS型限制性内切酶接触,其中所述IIS型限制性内切酶在待转化的所述靶ssDNA的3′末端上的至少一个核苷酸之后切割,从而从所述靶ssDNA分子的3′末端除去待转化的所述核苷酸。(d)将步骤(c)中的所述连接且被切割的探针的所述双链部分与所述靶ssDNA分离并且洗去所述探针的未连接的链;其中步骤(a)-(d)产生转化的靶ssDNA分子,其在其5′末端包含对应于所述靶ssDNA的被转化的核苷酸的所述Xx预定的寡核苷酸密码,并且其中所述Xx预定的寡核苷酸密码在存在于所述转化的靶ssDNA分子的5′末端上的所述转化的核苷酸之后。
段落3:一种用于始于其5′末端转化靶单链(ssDNA)靶分子以便将所述ssDNA分子的核苷酸腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)转化成预定的寡核苷酸密码并且在转化过程中保持所述靶ssDNA的核苷酸顺序的方法,所述方法包括步骤:(a)将在其3′末端具有预先指定的核苷酸序列的靶ssDNA分子与包含多个探针的寡核苷酸探针文库接触;其中每个探针包含双链DNA部分以及第一和第二单链悬突,其中所述双链DNA部分包含侧翼有所述第一和第二单链悬突的5′-3′核苷酸序列Xx′和与Xx′核苷酸序列互补的互补3′-5′核苷酸序列Xx,其中所述Xx包含唯一地对应于核苷酸A、T、G或C的一组顺序的预定的寡核苷酸密码,并且代表待转化的所述核苷酸;并且其中所述探针的双链部分还包含IIS型限制性内切酶识别位点(R),其切割位点在所述探针与所述靶ssDNA的5′末端连接后完成,所述靶ssDNA的至少一个核苷酸有待转化;其中所述Xx在其3′末端包含存在于所述靶ssDNA分子的3′末端上的所述预先指定的核苷酸序列;其中所述第一单链悬突位于X′x的3′侧并且所述第二单链悬突位于X′x的5’侧;其中所述第二单链悬突在紧邻X′x的5’末端上的所述核苷酸的位置上包含与待转化的所述靶ssDNA中的核苷酸互补的核苷酸并且还包含至少3个随机核苷酸;并且其中所述第一单链悬突在紧邻X′x的3′末端上的所述核苷酸的位置上包含至少一个随机核苷酸并且还包含与存在于所述靶ssDNA中的所述预先指定的序列互补的核苷酸序列;并且其中在允许所述多个双链寡核苷酸之一结合所述靶ssDNA分子的条件下进行所述接触,从而形成环状分子;(b)将步骤(a)中的所述结合的探针与所述靶ssDNA序列连接;(c)将步骤(b)中的所述连接的分子与对应于存在于步骤(a)中的所述双链DNA部分中的所述IIS型限制性内切酶识别位点的IIS型限制性内切酶接触,其中所述IIS型限制性内切酶在待转化的所述靶ssDNA的5′末端上的至少一个核苷酸之后切割,从而从所述靶ssDNA分子的5′末端除去待转化的所述核苷酸;和(d)将步骤(c)中的所述连接且被切割的探针的所述双链部分与所述靶ssDNA分离,并且洗去所述探针的未连接的链;其中步骤(a)-(d)产生转化的靶ssDNA分子,其在其3′末端包含对应于所述靶ssDNA的被转化的核苷酸的所述Xx预定的寡核苷酸密码,并且其中所述Xx预定的寡核苷酸密码在存在于转化的所述靶ssDNA分子的3′末端上的所述转化的核苷酸之前。
段落4:如段落1至3所述的方法,其中重复所述步骤a-d不止一次。
段落5:如段落1至4所述的方法,其中将所述靶ssDNA分子固定在固体载体上。
段落6:如段落1、2、4或5所述的方法,其中所述靶ssDNA分子上所述预先指定的序列还在其3′末端包含限制性内切酶识别位点。
段落7:如段落3至5所述的方法,其中所述靶ssDNA分子上所述预先指定的序列还在其5′末端包含限制性内切酶识别位点。
段落8:如段落1至7所述的方法,其中所述靶ssDNA上所述预先指定的序列M在约3个核苷酸至约12个核苷酸的范围内。
段落9:如段落1至8所述的方法,其中所述IIS型限制性内切酶选自:AlwI、BccI、BsmA1、EarI、MlyI、PleI、BmrI、BsaI、BsmB1、FauI、HpyAV、MnlI、SapI、BbsI、BciVI、HphI、MboII、BfuaI、BspMI、SfaNI、HgaI、BbvI、EciI、FokI、BceAI、BsmFI、BtgZI、BpmI、BpuEI、BsgI、AclWI、Alw26I、Bst6I、BstMAI、Eam1104I、Ksp632I、PpsI、SchI、BfiI、Bso31I、BspTNI、Eco31I、Esp3I、FauI、SmuI、BfuI、BpiI、BpuAI、BstV2I、AsuHPI、Acc36I、LweI、AarI、BseMII、TspDTI、TspGWI、BseXI、BstV1I、Eco57I、Eco57MI、GsuI、PsrI和MmeI。
段落10:如段落1至9所述的方法,其中所述I I S型限制性内切酶是MmeI。
段落11:如段落1至10所述的方法,其中所述Xx包含第一核酸序列XxI和第二核酸序列XxII,其中所述XxI和XxII形成唯一地对应于核苷酸A、T、G或C的二进制的预先指定的寡核苷酸密码。
段落12:如段落1至11所述的方法,其中所述XxI和XxII在长度上各自在约4个核苷酸至约30个核苷酸的范围内。
段落13:如段落1至12所述的方法,其中所述XxI和XxII在长度上各自为12个核苷酸。
段落14:如段落1至13所述的方法,其中所述第一悬突在长度上在约3个核苷酸至约12个核苷酸的范围内。
段落15:如段落1至14所述的方法,其中所述第二悬突在长度上在约3个核苷酸至约12个核苷酸的范围内。
段落16:如段落1至15所述的方法,其中所述靶ssDNA在长度上在约5个核苷酸至约3,000,000个核苷酸的范围内。
段落17:如段落1至16所述的方法,其中同时转化多个靶ssDNA分子。
段落18:如段落1至17所述的方法,其中在包含靶ssDNA核酸的不均匀混合物的样品中进行所述转化。
段落19:如段落1至18所述的方法,其中在所述方法的任何步骤中不使用聚合酶。
段落20:如段落1至19所述的方法,其中所述探针文库具有在16至1,048,576种不同寡核苷酸的范围内的复杂度。
段落21:如段落1至20所述的方法,其中所述靶ssDNA分子来源于哺乳动物。
段落22:如段落21所述的方法,其中所述哺乳动物是人。
段落23:如段落1至22所述的方法,其中在单分子水平上测定所述转化的ssDNA分子的序列。
段落24:如段落23所述的方法,其中所述测序包括标记的分子信标。
段落25:如段落24所述的方法,其中所述标记的分子信标是荧光分子信标。
段落26:如段落25所述的方法,其中所述荧光分子信标结合所述转化的ssDNA分子的Xx序列。
段落27:如段落26所述的方法,其中引导具有结合的荧光分子信标的所述转化的ssDNA分子的所述Xx序列通过直径小于2nm的纳米孔,其中当所述转化的ssDNA分子通过所述纳米孔时,所述荧光分子信标被除去,其中所述荧光分子信标的除去产生闪光,其中所述闪光的顺序产生所述靶ssDNA序列的所述序列。
段落28:一种用于始于其3′末端转化靶单链DNA(ssDNA)分子以便将所述靶ssDNA分子的所述核苷酸腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)转化成预定的寡核苷酸密码并且在转化过程中保持所述靶ssDNA的所述核苷酸顺序的方法,所述方法包括步骤:(a)将在其5′末端具有预先指定的核苷酸序列的靶ssDNA分子与第一探针文库和第二探针文库接触,其中在允许所述第一文库中只有一种探针与所述靶ssDNA的5′末端杂交并且所述第二探针文库中只有一种探针与所述靶ssDNA分子的3′末端杂交的条件下进行所述接触;(b)将步骤(a)中的所述杂交的探针与所述靶ssDNA序列连接;(c)将步骤(b)中的所述连接的分子暴露于低解链温度,从而将封闭寡核苷酸与所述第二探针文库的所述连接的探针分离;(d)将来自所述第一探针文库的所述连接的探针的3′末端与所述第二探针文库的连接的探针的5′末端杂交,从而形成环状分子。(e)将步骤(d)中的所述连接的分子与IIS型限制性内切酶接触,其中所述IIS型限制性内切酶在待转化的靶ssDNA的3′末端上的至少一个核苷酸之后切割,从而从所述靶ssDNA分子的3′末端除去待转化的所述核苷酸;和(f)将步骤(e)中的每个所述连接且被切割的探针的所述双链部分与所述靶ssDNA分离,并且洗去每个探针的所述未连接的链;其中步骤(a)-(f)产生转化的靶ssDNA分子,其在其5′末端包含来自所述第二探针文库的所述探针的对应于所述靶ssDNA的所述转化的核苷酸的预定的寡核苷酸密码,和来自所述第一探针文库的所述探针的不变序列,并且其中所述预定的寡核苷酸密码在存在于所述转化的靶ssDNA分子的5′末端上的所述转化的核苷酸之前。
段落29:一种用于始于其5′末端转化靶单链DNA(ssDNA)分子以便将所述靶ssDNA分子的所述核苷酸腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)转化成预定的寡核苷酸密码并且在转化过程中保持所述靶ssDNA的所述核苷酸顺序的方法,所述方法包括步骤:(a)将在其3′末端具有预先指定的核苷酸序列的靶ssDNA分子与第一探针文库和第二探针文库接触,其中在允许在所述第一文库中只有一种探针与所述靶ssDNA的3′末端杂交并且在所述第二探针文库中只有一种探针与所述靶ssDNA分子的5’末端杂交的条件下进行所述接触;(b)将步骤(a)中的所述杂交的探针与所述靶ssDNA序列连接;(c)将步骤(b)中的所述连接的分子暴露于低解链温度,从而将封闭寡核苷酸与所述第二探针文库的连接的探针分离;(d)将来自所述第一探针文库的连接的探针的3′末端与所述第二探针文库的连接的探针的5′末端杂交,从而形成环状分子(e)将步骤(d)中的所述连接的分子与IIS型限制性内切酶接触,其中所述IIS型限制性内切酶在待转化的所述靶ssDNA的5′末端上的至少一个核苷酸之后切割,从而从所述靶ssDNA分子的5′末端除去待转化的所述核苷酸;和(f)将步骤(e)中的每个所述连接且被切割的探针的所述双链部分与所述靶ssDNA分离,并且洗去每个探针的所述未连接的链;其中步骤(a)-(f)产生转化的靶ssDNA分子,其在其3′末端包含来自所述第二探针文库的所述探针的对应于所述靶ssDNA的所述转化的核苷酸的预定的寡核苷酸密码,和来自所述第一探针文库的所述探针的不变序列,并且其中所述预定的寡核苷酸密码在存在于所述转化的靶ssDNA分子的3′末端上的所述转化的核苷酸之前。
段落30:如段落28所述的方法,其中所述第一探针文库包含多个由4种不同寡核苷酸探针组成的寡核苷酸探针,每个探针包含双链部分以及第一和第二单链悬突,其中所述双链部分包含预先指定的核苷酸间隔区序列(P′)和与所述间隔区序列互补的序列(P),其中所述第一单链悬突在紧邻P′的5′末端的位置上包含A、T、G或C和与所述靶ssDNA分子上的所述预先指定的序列互补的核苷酸,并且其中所述第二单链悬突包含与所述第二探针文库的封闭寡核苷酸相同的第二预先指定的核苷酸序列并且被置于紧邻P的5′末端。
段落31:如段落28或30所述的方法,为了转化始于其3′末端的靶单链DNA分子,所述第二探针文库包含多个寡核苷酸探针,每个探针包含双链部分以及第一和第二单链悬突,其中所述双链部分包含侧翼接有所述第一和第二单链悬突的5′-3′核苷酸序列X′x和互补核苷酸序列Xx,其中Xx包含唯一地对应于核苷酸A、T、G或C的一组顺序的预定的寡核苷酸密码,其中所述探针的所述双链部分还包含IIS型限制性内切酶识别位点,其相应的切割位点在所述探针与待转化的所述靶ssDNA分子的末端上的至少一个核苷酸连接后完成,其中X在其5′末端上包含存在于所述靶ssDNA分子上的所述预先指定的序列;其中所述第一单链悬突包含与存在于所述靶ssDNA分子上的所述预先指定的序列互补的核苷酸序列;并且其中所述第二单链悬突在紧邻X′x的3′末端上的核苷酸的位置上包含与待转化的所述靶ssDNA中的所述核苷酸互补的核苷酸,并且还包含至少3个随机核苷酸,并且其中所述第二探针文库还包含含有与所述第一单链悬突互补的3′-5′序列的封闭寡核苷酸,其中所述封闭寡核苷酸的5′末端和所述第一单链悬突的5′末端未被磷酸化。
段落32:如段落29所述的方法,其中所述第一探针文库包含多个由4种不同寡核苷酸探针组成的寡核苷酸探针,每个探针包含双链部分以及第一和第二单链悬突,其中所述双链部分包含预先指定的核苷酸间隔区序列(P′)和与所述间隔区序列互补的序列(P),其中所述第一单链悬突在紧邻P′的3′末端的位置上包含A、T、G或C和与所述靶ssDNA分子上的所述预先指定的序列互补的核苷酸,并且其中所述第二单链悬突包含与所述第二探针文库的封闭寡核苷酸相同的第二预先指定的核苷酸序列并且被置于紧邻P的3′末端。
段落33:如段落29或32所述的方法,其中所述第二探针文库包含多个寡核苷酸探针,每个探针包含双链部分以及第一和第二单链悬突,其中所述双链部分包含侧翼有所述第一和第二单链悬突的5′-3′核苷酸序列X′x和互补核苷酸序列Xx,其中所述Xx包含唯一地对应于核苷酸A、T、G或C的一组顺序的预先指定的寡核苷酸密码,其中所述探针的所述双链部分还包含IIS型限制性内切酶识别位点,其相应的切割位点在所述探针与待转化的所述靶ssDNA分子的末端上的至少一个核苷酸连接后完成,其中所述X在其3′末端包含存在于所述靶ssDNA分子上的所述预先指定的序列;其中所述第一单链悬突包含与存在于所述靶ssDNA分子上的所述预先指定的序列互补的核苷酸序列;并且其中所述第二单链悬突在紧邻X′x的5′末端上的所述核苷酸的位置上包含与待转化的所述靶ssDNA中的核苷酸互补的核苷酸,并且还包含至少3个随机核苷酸,并且其中所述第二探针文库还包含含有与所述第一单链悬突互补的3′-5′序列的封闭寡核苷酸,其中所述封闭寡核苷酸的5′末端和所述第一单链悬突的5′末端未被磷酸化。
段落34:如段落28至33所述的方法,其中重复所述步骤a-f不止一次。
段落35:如段落28至34所述的方法,其中将所述靶ssDNA分子固定在固体载体上。
段落36:如段落28、30、31、34或35所述的方法,其中所述靶ssDNA分子上的所述预先指定的序列还在其3′末端包含限制性内切酶识别位点。
段落37:如段落29、30、33、34或35所述的方法,其中所述靶ssDNA分子上的所述预先指定的序列还在其5′末端包含限制性内切酶识别位点。
段落38:如段落28至37所述的方法,其中所述靶ssDNA上的所述预先指定的序列在约3个核苷酸至约12个核苷酸的范围内。
段落39:如段落28至38所述的方法,其中所述IIS型限制性内切酶位点选自:AlwI、BccI、BsmA1、EarI、MlyI、PleI、BmrI、BsaI、BsmB1、FauI、HpyAV、MnlI、SapI、BbsI、BciVI、HphI、MboII、BfuaI、BspMI、SfaNI、HgaI、BbvI、EciI、FokI、BceAI、BsmFI、BtgZI、BpmI、BpuEI、BsgI、AclWI、Alw26I、Bst6I、BstMAI、Eam1104I、Ksp632I、PpsI、SchI、BfiI、Bso31I、BspTNI、Eco31I、Esp3I、FauI、SmuI、BfuI、BpiI、BpuAI、BstV2I、AsuHPI、Acc36I、LweI、AarI、BseMII、TspDTI、TspGWI、BseXI、BstV1I、Eco57I、Eco57MI、GsuI、PsrI或MmeI位点。
段落40:如段落28至39所述的方法,其中所述IIS型限制性内切酶位点是MmeI位点。
段落41:如段落28至40所述的方法,其中所述Xx包含第一核酸序列XxI和第二核酸序列XxII,其中所述XxI和XxII形成唯一地对应于核苷酸A、T、G或C的二进制的预先指定的寡核苷酸密码。
段落42:如段落28至41所述的方法,其中所述XxI和XxII在长度上各自在约4个核苷酸至约25个核苷酸的范围内。
段落43:如段落28至42所述的方法,其中所述XxI和XxII在长度上各自为12个核苷酸。
段落44:如段落28至43所述的方法,其中所述第一悬突在长度上在约3个核苷酸至约12个核苷酸的范围内。
段落45:如段落28至44所述的方法,其中所述第二悬突在长度上在约3个核苷酸至约12个核苷酸的范围内。
段落46:如段落28至45所述的方法,其中所述靶ssDNA在长度上在约5个核苷酸至约3,000,000个核苷酸的范围内。
段落47:如段落28至46所述的方法,其中同时转化所述多个靶ssDNA分子。
段落48:如段落28至47所述的方法,其中在包含靶ssDNA核酸的不均匀混合物的样品中进行所述转化。
段落49:如段落28至48所述的方法,其中在所述方法中的任何步骤中不使用聚合酶。
段落50:如段落28至49所述的方法,其中所述探针文库具有在16至1,048,576种不同寡核苷酸的范围内的复杂度。
段落51:如段落28至50所述的方法,其中所述靶ssDNA分子来源于哺乳动物。
段落52:如段落49所述的方法,其中所述哺乳动物是人。
段落53:如段落28至52所述的方法,其中在单分子水平上测定所述转化的ssDNA分子的序列。
段落54:如段落51所述的方法,其中所述测序包括标记的分子信标。
段落55:如段落54所述的方法,其中所述标记的分子信标是荧光分子信标。
段落56:如段落55所述的方法,其中所述荧光分子信标结合所述转化的ssDNA分子的Xx序列。
段落57:如段落56所述的方法,其中引导具有结合的荧光分子信标的所述转化的ssDNA分子的所述Xx序列通过直径小于2nm的纳米孔,其中当所述转化的ssDNA分子通过所述纳米孔时,所述荧光分子信标被除去,其中所述荧光分子信标的除去产生闪光,其中所述闪光的顺序产生所述靶ssDNA序列的序列。
实施例
实施例1:环状DNA转化(CDC):靶ssDNA靶分子始于其5′末端的转化。
在本实施例中(1)我们利用100个碱基长的DNA模板,将一个碱基转化(胞嘧啶)显示为两位(0,1),(2)我们通过在探针文库中使用‘肌苷’用于替代碱基配对显示,探针文库减小一个数量级而转化的准确度或产率无损失,以及(3)我们不使用模板的表面固定或任何微流体方法显示1个碱基转化的高产率。由于本文所描述的方法与芯片实验室技术完全相容,因此这些方法将使转化的产率和效率增加许多数量级。
CDC原理:将三步法用于将模板DNA的核苷酸转化成其相应的2位序列,如图6中所举例说明的。最初通过在5′末的端磷酸化并且在3′末端连接至对应于IIS型限制性内切酶的识别位点的6碱基生物素化寡核苷酸来修饰模板DNA。这是以前的修饰步骤,可同时对数千个不同模板进行该步骤,并且其在所有随后的转化循环中得到自我保留。将模板DNA表面固定至抗生蛋白链菌素涂覆的磁珠,在珠粒上具有仔细选择的抗生蛋白链菌素浓度,以避免模板拥挤。
使用的通用探针:使用的通用探针是带有仔细选择的侧翼序列文库的一组4个2位组合(2-bit combinations)(2位组合:(0,0)、(0,1)、(1,0)和(1,1))的超集。通用探针的上游引物(TP,33聚体)包含位于3′末端具有IIS型限制位点的期望的2位组合(红色和蓝色区域)的序列。下游引物(BP,45聚体)包含互补序列以及在3′末端侧翼的6个碱基(5个对应于限制位点的碱基(用砖式框(brick stylebox)表示)和1个脱氧核糖-肌苷(dl)碱基(用空白框表示))。在5′末端,使用13个碱基悬突,其对应于限制位点(7个碱基)、一个特定的核苷酸(用正方形斑点框(square speckled box)表示的A、T、G或C)和5个随机核苷酸(n,利用波形线框表示)。对于邻近限制位点的每个特定的核苷酸,文库包含5′末端上的5个核苷酸的全部可能的45个组合。总文库大小将为下游引物的5′末端上6个碱基的46个组合。
成批次的步骤I-步骤II的成功执行:
在步骤I中,将修饰的模板DNA(100个碱基的ssDNA)与通用探针集杂交并且连接。模板DNA只与其中通用探针的特定核苷酸与模板的5′末端上的末端核苷酸互补的探针杂交和连接。利用连接酶对末端互补的该选择性来获得高特异性,以仅从文库中挑选出正确的通用探针并且洗去其它非特异性探针。我们发现,通过用肌苷碱基替代下游引物的5′上的5个随机碱基中的2个核苷酸(以“n-n-i-n-i”的形式),我们可将文库大小从46减小至44,仍然获得极高的特异性、效率和产率。模板在3′末端不与任何探针连接,因为通用探针的5′末端未被磷酸化。这确保了模板DNA不因与非特异性通用探针的连接而发生损失(结果示于图7A中)。
在步骤II中,选择的探针的5′被磷酸化并且连接以封闭环。使用T4多核苷酸激酶(T4PNK)来磷酸化上游引物的游离5′末端,然后连接酶将模板DNA的游离3′末端连接至通用探针,从而环化模板DNA(图7B)。
最后在步骤III中,与IIS型限制性内切酶的消化反应,接着dsDNA的解链,除去了下游引物,从而导致末端核苷酸从模板的5′末端的释放以及特异性选择的在其3′末端具有适当的2位的探针的连接。限制性消化酶保留消化磷酸化的5′末端(图7C)。在该步骤之后,模板再次准备好(无任何进一步的修饰)以经历下一轮结合如步骤I中的通用探针的新制备的缓冲液的转化。
正确CDC的证明:我们显示模板DNA上单个胞嘧啶碱基(图7)至其相应的为(0,1)的2位序列的高产率转化并且利用滚环扩增(RCA)测定对其进行确认。在完成步骤I至III后,将终产物分入4个试管并且与仅相异于1个碱基的4种RCA引物杂交。末端胞嘧啶的正确转化应当导致带有上游引物(具有正确的2位序列)的单链DNA模板连接至以末端胞嘧啶加帽的模板的3′末端(图8A)。
滚环扩增(RCA)测试测定:将4种只具有一个特定的碱基差异的寡核苷酸设计为环化终产物的引物。RCA引物的32个碱基的序列从5′至3′末端包含:8个与1位序列互补的碱基、8个与限制性内切酶识别位点互补的碱基、1个特定的碱基(A、T、G或C)和15个与原始100个碱基的模板的末端胞嘧啶之后的5′序列互补的碱基。将在中心具有1个碱基差异的4种RCA引物单独地与CDC转化的终产物混合,使用连接酶和进行性Phi29 DNA聚合酶进行连接和扩增。对于扩增,RCA对末端碱基特性非常敏感,因此在此用作我们转化方法的严格检验。如在图8B中0.8%琼脂糖凝胶中所看到的,只有在中心具有正确的特定碱基的引物才导致扩增的DNA,从而为我们提供了由我们的三步CDC转化法产生的胞嘧啶转化的明确证明。作为对照实验,与对照模板TP150完全互补的引物TP20-20,当与DNA聚合酶混合时,在连接酶存在的情况下(泳道3)显示为扩增,在利用连接酶的模板环化不存在的情况无扩增产物(泳道2)。

Claims (57)

1.一种用于始于其3′末端转化靶单链DNA(ssDNA)分子以便将所述靶ssDNA分子的核苷酸腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)转化成预定的寡核苷酸密码并且在转化过程中保持靶s sDNA的核苷酸顺序的方法。所述方法包括以下步骤:
(a)将在其5′-末端具有预先指定的序列5′-x0、S1、S2、S3、S4、S5-3′的靶ssDNA与包含多个寡核苷酸探针的探针文库接触,其中x0可以是A、C、G或T并且S1、S2、S3、S4、S5是预定的寡核苷酸密码(Xx)的前5个位置中的序列,其中每个探针包含双链DNA部分以及第一和第二单链悬突,其中所述双链DNA部分包含IIS型限制性内切酶的识别序列(R′/R)和唯一地对应于所述靶ssDNA中的待转化的核苷酸(x)的预定的寡核苷酸密码(X′x/Xx),其中存在可特异性结合R′/R并且切割所述第二单链悬突内的所述识别序列的外侧的IIS型限制性内切酶,其中所述第一单链悬突包含与预定的寡核苷酸密码的前5个位置中的序列(5′-S1、S2、S3、S4、S5-3′)互补的序列5′-S′5、S′4、S′3、S′2、S′1,紧接其后是由所述探针文库中全部4种核苷酸代表的位置(n);其中具有序列5′-x′、n、n、n、n、n-3′的所述第二单链悬突包含与待转化的核苷酸(x)互补的核苷酸(x′),紧接其后是由探针文库中全部4种核苷酸代表的5个位置,并且其中在允许所述文库中的多个探针之一结合所述靶ssDNA分子并且与其形成完全匹配的双链体的条件下进行接触;
(b)利用连接酶将步骤(a)中所述结合的探针的更短的链的两端与所述靶ssDNA连接,从而形成环状分子;
(c)将步骤(b)中所述连接的分子与特异性识别存在于步骤(a)中探针的所述双链DNA部分的序列(R′/R)的I I S型限制性内切酶接触,其中所述酶切割待转化的所述靶ssDNA的靶分子的3′末端上的至少一个核苷酸,从而从所述靶ssDNA分子的3′末端除去所述核苷酸;和
(d)将在步骤(c)中被切割的所述探针-靶ssDNA复合物的双链部分分离,并且从所述探针的未连接链上洗去所述寡核苷酸;
其中步骤(a)-(d)产生在其5′末端包含5′-x、Xx、R-3′的转化的靶ssDNA分子,其中Xx是对应于所述靶ssDNA的被转化的核苷酸x的预定的寡核苷酸密码。
2.一种用于始于其3′末端转化靶单链DNA(ssDNA)分子以便将所述靶ssDNA分子的核苷酸腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)转化成预定的寡核苷酸密码并且在转化过程中保持所述靶ssDNA的核苷酸顺序的方法。所述方法包括以下步骤:
(a)将在其5′末端具有预先指定的核苷酸序列的靶ssDNA分子与包含多个探针的寡核苷酸探针文库接触;其中每个探针包含双链DNA部分以及第一和第二单链悬突;其中所述双链DNA部分包含侧翼连接有所述第一和第二单链悬突的5′-3′核苷酸序列X′x和与核苷酸序列X′x互补的互补3′-5′核苷酸序列Xx,其中Xx包含唯一地对应于核苷酸A、T、G或C的一组顺序的预定的寡核苷酸密码,并且代表待转化的核苷酸;并且其中所述探针的双链部分包含IIS型限制性内切酶识别位点(R),其切割位点在所述探针与所述靶ssDNA的3′末端连接后完成,所述靶ssDNA的至少一个核苷酸有待转化;其中所述第一单链悬突位于X′x的5′侧,并且所述第二单链悬突位于X′x的3′侧;其中Xx在其5′末端包含存在于所述靶ssDNA分子的5′末端上的预先指定的核苷酸序列;其中所述第二单链悬突位于X′x的3′末端上并且所述第一单链悬突在X′x的5′末端之前;其中所述第二单链悬突在紧邻X′x的3′末端的位置上包含与待转化的所述靶ssDNA中的核苷酸互补的核苷酸并且还包含至少3个随机核苷酸;并且其中所述第一单链悬突在紧邻X′x的5′末端上的核苷酸的位置上包含至少一个随机核苷酸并且还包含与存在于所述靶ssDNA中的预先指定的序列互补的核苷酸序列;并且其中在允许多个探针之一与所述靶ssDNA分子结合并且与其形成双链体的条件下进行所述接触;
(b)将步骤(a)中所述结合的双链寡核苷酸的两端与所述靶ssDNA序列连接,从而形成环状分子;
(c)将步骤(b)中所述连接的分子与对应于存在于步骤(a)中的所述双链DNA部分中的IIS型限制性内切酶识别位点的IIS型限制性内切酶接触,其中所述IIS型限制性内切酶在待转化的所述靶ssDNA的3′末端上的至少一个核苷酸之后切割,从而从所述靶ssDNA分子的3′末端除去待转化的核苷酸;和
(d)将步骤(c)中所述连接的且被切割的探针的双链部分与所述靶ssDNA分离并且洗去所述探针的未连接的链;
其中步骤(a)-(d)产生转化的靶ssDNA分子,其在其5′末端包含对应于所述靶ssDNA的被转化的核苷酸的Xx预定的寡核苷酸密码,并且其中Xx预定的寡核苷酸密码在存在于所述转化的靶ssDNA分子的5′末端上的被转化的核苷酸之后。
3.一种用于始于其5′末端转化靶单链(ssDNA)靶分子以便将所述ssDNA分子的核苷酸腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)转化成预定的寡核苷酸密码并且在转化过程中保持所述靶ssDNA的核苷酸顺序的方法,所述方法包括以下步骤:
(a)将在其3′末端具有预先指定的核苷酸序列的靶ssDNA分子与包含多个探针的寡核苷酸探针文库接触;其中每个探针包含双链DNA部分以及第一和第二单链悬突,其中所述双链DNA部分包含侧翼连接有所述第一和第二单链悬突的5′-3′核苷酸序列Xx′和与核苷酸序列Xx′互补的互补3′-5′核苷酸序列Xx,其中Xx包含唯一地对应于核苷酸A、T、G或C的一组顺序的预定的寡核苷酸密码,并且代表待转化的核苷酸;并且其中所述探针的双链部分还包含IIS型限制性内切酶识别位点(R),其切割位点在所述探针与所述靶ssDNA的5′末端连接后完成,所述靶ssDNA的至少一个核苷酸有待转化;其中Xx在其3′末端包含存在于所述靶ssDNA分子的3′末端上的预先指定的核苷酸序列;其中所述第一单链悬突位于X′x的3′侧并且所述第二单链悬突位于X′x的5’侧;其中所述第二单链悬突在紧邻Xx′的5’末端上的核苷酸的位置上包含与待转化的所述靶ssDNA中的核苷酸互补的核苷酸并且还包含至少3个随机核苷酸;并且其中所述第一单链悬突在紧邻Xx′的3′末端上的核苷酸的位置上包含至少一个随机核苷酸并且还包含与存在于所述靶ssDNA中的预先指定的序列互补的核苷酸序列;并且其中在允许多个双链寡核苷酸之一结合所述靶ssDNA分子的条件下进行所述接触,从而形成环状分子;
(b)将步骤(a)中所述结合的探针与所述靶ssDNA序列连接;
(c)将步骤(b)中所述连接的分子与对应于存在于步骤(a)的双链DNA部分中的IIS型限制性内切酶识别位点的IIS型限制性内切酶接触,其中IIS型限制性内切酶在待转化的所述靶ssDNA的5′末端上的至少一个核苷酸之后切割,从而从所述靶ssDNA分子的5′末端除去待转化的核苷酸;和
(d)将步骤(c)中所述连接的且被切割的探针的双链部分与所述靶ssDNA分离,并且洗去所述探针的未连接的链;
其中步骤(a)-(d)产生转化的所述靶ssDNA分子,其在其3′末端包含对应于所述靶ssDNA的被转化的核苷酸的Xx预定的寡核苷酸密码,并且其中Xx预定的寡核苷酸密码在存在于所述转化的靶ssDNA分子的3′末端上的被转化的核苷酸之前。
4.如权利要求1至3中任一项所述的方法,其中重复步骤a-d不止一次。
5.如权利要求1至4中任一项所述的方法,其中将所述靶ssDNA分子固定在固体载体上。
6.如权利要求1、2、4或5中任一项所述的方法,其中所述靶ssDNA分子上所述预先指定的序列还在其3′末端包含限制性内切酶识别位点。
7.如权利要求3至5中任一项所述的方法,其中所述靶ssDNA分子上所述预先指定的序列还在其5′末端包含限制性内切酶识别位点。
8.如权利要求1至7中任一项所述的方法,其中所述靶ssDNA上所述预先指定的序列M在约3个核苷酸至约12个核苷酸的范围内。
9.如权利要求1至8中任一项所述的方法,其中所述IIS型限制性内切酶选自:AlwI、BccI、BsmA1、EarI、MlyI、PleI、BmrI、BsaI、BsmB1、FauI、HpyAV、MnlI、SapI、BbsI、BciVI、HphI、MboII、BfuaI、BspMI、SfaNI、HgaI、BbvI、EciI、FokI、BceAI、BsmFI、BtgZI、BpmI、BpuEI、BsgI、AclWI、Alw26I、Bst6I、BstMAI、Eam1104I、Ksp632I、PpsI、SchI、BfiI、Bso31I、BspTNI、Eco31I、Esp3I、FauI、SmuI、BfuI、BpiI、BpuAI、BstV2I、AsuHPI、Acc36I、LweI、AarI、BseMII、TspDTI、TspGWI、BseXI、BstV1I、Eco57I、Eco57MI、GsuI、PsrI和MmeI。
10.如权利要求1至9中任一项所述的方法,其中所述IIS型限制性内切酶是MmeI。
11.如权利要求1至10中任一项所述的方法,其中Xx包含第一核酸序列XxI和第二核酸序列XxII,其中XxI和XxII形成唯一地对应于核苷酸A、T、G或C的二进制的预先指定的寡核苷酸密码。
12.如权利要求1至11中任一项所述的方法,其中XxI和XxII在长度上各自在约4个核苷酸至约30个核苷酸的范围内。
13.如权利要求1至12中任一项所述的方法,其中XxI和XxII在长度上各自为12个核苷酸。
14.如权利要求1至13中任一项所述的方法,其中所述第一悬突在长度上在约3个核苷酸至约12个核苷酸的范围内。
15.如权利要求1至14中任一项所述的方法,其中所述第二悬突在长度上在约3个核苷酸至约12个核苷酸的范围内。
16.如权利要求1至15中任一项所述的方法,其中所述靶ssDNA在长度上在约5个核苷酸至约3,000,000个核苷酸的范围内。
17.权利要求1至16中任一项所述的方法,其中同时转化多个靶ssDNA分子。
18.如权利要求1至17中任一项所述的方法,其中在包含靶ssDN核酸的不均匀混合物的样品中进行所述转化。
19.如权利要求1至18中任一项所述的方法,其中在所述方法的任何步骤中不使用聚合酶。
20.如权利要求1至19中任一项所述的方法,其中所述探针文库具有在16至1,048,576种不同寡核苷酸的范围内的复杂度。
21.权利要求1至20中任一项所述的方法,其中所述靶ssDNA分子来源于哺乳动物。
22.如权利要求21所述的方法,其中所述哺乳动物是人。
23.如权利要求1至22中任一项所述的方法,其中在所述单分子水平上测定所述转化的ssDNA分子的序列。
24.如权利要求23所述的方法,其中所述测序包括标记的分子信标。
25.如权利要求24所述的方法,其中所述标记的分子信标是荧光分子信标。
26.如权利要求25所述的方法,其中所述荧光分子信标结合所述转化的ssDNA分子的Xx序列。
27.如权利要求26所述的方法,其中引导具有结合的荧光分子信标的所述转化的ssDNA分子的所述Xx序列通过直径小于2nm的纳米孔,其中当所述转化的ssDNA分子通过所述纳米孔时,所述荧光分子信标被除去,其中所述荧光分子信标的除去产生闪光,其中所述闪光的顺序产生所述靶ssDNA序列的序列。
28.一种用于始于其3′末端转化靶单链DNA(ssDNA)分子以便将所述靶ssDNA分子的核苷酸腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)转化成预定的寡核苷酸密码并且在转化过程中保持所述靶ssDNA的核苷酸顺序的方法,所述方法包括以下步骤:
(a)将在其5′末端具有预先指定的核苷酸序列的靶ssDNA分子与第一探针文库和第二探针文库接触,其中在允许所述第一文库中只有一种探针与所述靶ssDNA的5′末端杂交并且所述第二探针文库中只有一种探针与所述靶ssDNA分子的3′末端杂交的条件下进行所述接触;
(b)将步骤(a)中所述杂交的探针与所述靶ssDNA序列连接;
(c)将步骤(b)中所述连接的分子暴露于低解链温度,从而将封闭寡核苷酸与所述第二探针文库的连接的探针分离;
(d)将来自所述第一探针文库的连接的探针的3′末端与所述第二探针文库的连接的探针的5′末端杂交,从而形成环状分子;
(e)将步骤(d)中所述连接的分子与IIS型限制性内切酶接触,其中所述IIS型限制性内切酶在待转化的所述靶ssDNA的3′末端上的至少一个核苷酸之后切割,从而从所述靶ssDNA分子的3′末端除去待转化的核苷酸;和
(f)将步骤(e)中每个连接的且被切割的探针的双链部分与所述靶ssDNA分离,并且洗去每个探针的未连接的链;
其中步骤(a)-(f)产生转化的靶ssDNA分子,其在其5′末端包含来自所述第二探针文库的所述探针的对应于所述靶ssDNA的被转化的核苷酸的预定的寡核苷酸密码和来自所述第一探针文库的所述探针的不变的序列,并且其中所述预定的寡核苷酸密码在存在于所述转化的靶ssDNA分子的5′末端上的被转化的核苷酸之前。
29.一种用于始于其5′末端转化靶单链DNA(ssDNA)分子以便将所述靶ssDNA分子的核苷酸腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)转化成预定的寡核苷酸密码并且在转化过程中保持所述靶ssDNA的核苷酸顺序的方法。所述方法包括以下步骤:
(a)将在其3′末端具有预先指定的核苷酸序列的靶ssDNA分子与第一探针文库和第二探针文库接触,其中在允许所述第一文库中只有一种探针与所述靶ssDNA的3′末端杂交并且所述第二探针文库中只有一种探针与所述靶ssDNA分子的5’末端杂交的条件下进行所述接触;
(b)将步骤(a)中所述杂交的探针与所述靶ssDNA序列连接;
(c)将步骤(b)中所述连接的分子暴露于低解链温度,从而将封闭寡核苷酸与所述第二探针文库的连接的探针分离;
(d)将来自所述第一探针文库的连接的探针的3′末端与所述第二探针文库的连接的探针的5′末端杂交,从而形成环状分子;
(e)将步骤(d)中所述连接的分子与IIS型限制性内切酶接触,其中所述IIS型限制性内切酶在待转化的所述靶ssDNA的5′末端上的至少一个核苷酸之后切割,从而从所述靶ssDNA分子的5′末端除去待转化的核苷酸;和
(f)将步骤(e)中每个连接的且被切割的探针的双链部分与所述靶ssDNA分离,并且洗去每个探针的未连接的链;
其中步骤(a)-(f)产生转化的靶ssDNA分子,其在其3′末端包含来自所述第二探针文库的所述探针的对应于所述靶ssDNA的被转化的核苷酸的预定的寡核苷酸密码和来自所述第一探针文库的所述探针的不变的序列,并且其中所述预定的寡核苷酸密码在存在于所述转化的靶ssDNA分子的3′末端上的被转化的核苷酸之前。
30.如权利要求28所述的方法,其中所述第一探针文库包含多个由4种不同寡核苷酸探针组成的寡核苷酸探针,每个探针包含双链部分以及第一和第二单链悬突,其中所述双链部分包含预先指定的核苷酸间隔区序列(P′)和与所述间隔区序列互补的序列(P),其中所述第一单链悬突在紧邻P′的5′末端的位置上包含A、T、G或C和与所述靶ssDNA分子上的预先指定的序列互补的核苷酸,并且其中所述第二单链悬突包含与所述第二探针文库的封闭寡核苷酸相同的第二预先指定的核苷酸序列并且被置于紧邻P的5′末端。
31.如权利要求28或30所述的方法,为了始于其3′末端转化靶单链DNA分子,所述第二探针文库包含多个寡核苷酸探针,每个探针包含双链部分以及第一和第二单链悬突,其中所述双链部分包含侧翼连接有所述第一和第二单链悬突的5′-3′核苷酸序列X′x和互补核苷酸序列Xx,其中Xx包含唯一地对应于核苷酸A、T、G或C的一组顺序的预定的寡核苷酸密码,其中所述探针的双链部分还包含IIS型限制性内切酶识别位点,其相应的切割位点在所述探针与待转化的所述靶ssDNA分子的末端上的至少一个核苷酸连接后完成,其中X在其5′末端包含存在于所述靶ssDNA分子上的预先指定的序列;其中所述第一单链悬突包含与存在于所述靶ssDNA分子上的预先指定的序列互补的核苷酸序列;并且其中所述第二单链悬突在紧邻X′x的3′末端上的核苷酸的位置上包含与待转化的所述靶ssDNA中的核苷酸互补的核苷酸,并且还包含至少3个随机核苷酸,并且其中所述第二探针文库还包含含有与所述第一单链悬突互补的3′-5′序列的封闭寡核苷酸,其中所述封闭寡核苷酸的5′末端和所述第一单链悬突的5′末端未被磷酸化。
32.如权利要求29所述的方法,其中所述第一探针文库包含多个由4种不同寡核苷酸探针组成的寡核苷酸探针,每个探针包含双链部分以及第一和第二单链悬突,其中所述双链部分包含预先指定的核苷酸间隔区序列(P′)和与所述间隔区序列互补的序列(P),其中所述第一单链悬突在紧邻P′的3′末端的位置上包含A、T、G或C和与所述靶ssDNA分子上的预先指定的序列互补的核苷酸,并且其中所述第二单链悬突包含与所述第二探针文库的封闭寡核苷酸相同的第二预先指定的核苷酸序列并且被置于紧邻P的3′末端。
33.如权利要求29或32所述的方法,其中所述第二探针文库包含多个寡核苷酸探针,每个探针包含双链部分以及第一和第二单链悬突,其中所述双链部分包含侧翼连接有所述第一和第二单链悬突的5′-3′核苷酸序列X′x和互补核苷酸序列Xx,其中Xx包含唯一地对应于核苷酸A、T、G或C的一组顺序的预先指定的寡核苷酸密码,其中所述探针的双链部分还包含IIS型限制性内切酶识别位点,其相应的切割位点在所述探针与待转化的所述靶ssDNA分子的末端上的至少一个核苷酸连接后完成,其中X在其3′末端包含存在于所述靶ssDNA分子上的预先指定的序列;其中所述第一单链悬突包含与存在于所述靶ssDNA分子上的预先指定的序列互补的核苷酸序列;并且其中所述第二单链悬突在紧邻X′x的5′末端上的核苷酸的位置上包含与待转化的所述靶ssDNA中的核苷酸互补的核苷酸,并且还包含至少3个随机核苷酸,并且其中所述第二探针文库还包含含有与所述第一单链悬突互补的3′-5′序列的封闭寡核苷酸,其中所述封闭寡核苷酸的5′末端和所述第一单链悬突的5′末端未被磷酸化。
34.如权利要求28至33中任一项所述的方法,其中重复步骤a-f不止一次。
35.如权利要求28至34中任一项所述的方法,其中将所述靶ssDNA分子固定在固体载体上。
36.如权利要求28至35中任一项所述的方法,其中所述靶ssDNA分子上所述预先指定的序列还在其3′末端包含限制性内切酶识别位点。
37.如权利要求28至36中任一项所述的方法,其中所述靶ssDNA分子上所述预先指定的序列还在其5′末端包含限制性内切酶识别位点。
38.如权利要求28至37中任一项所述的方法,其中所述靶ssDNA上所述预先指定的序列在约3个核苷酸至约12个核苷酸的范围内。
39.如权利要求28至38中任一项所述的方法,其中所述IIS型限制性内切酶位点选自:AlwI、BccI、BsmA1、EarI、MlyI、PleI、BmrI、BsaI、BsmB1、FauI、HpyAV、MnlI、SapI、BbsI、BciVI、HphI、MboII、BfuaI、BspMI、SfaNI、HgaI、BbvI、EciI、FokI、BceAI、BsmFI、BtgZI、BpmI、BpuEI、BsgI、AclWI、Alw26I、Bst6I、BstMAI、Eam1104I、Ksp632I、PpsI、SchI、BfiI、Bso31I、BspTNI、Eco31I、Esp3I、FauI、SmuI、BfuI、BpiI、BpuAI、BstV2I、AsuHPI、Acc36I,LweI、AarI、BseMII、TspDTI、TspGWI、BseXI、BstV1I、Eco57I、Eco57MI、GsuI、PsrI或MmeI位点。
40.如权利要求28至39中任一项所述的方法,其中所述IIS型限制性内切酶位点是MmeI位点。
41.如权利要求28至40中任一项所述的方法,其中Xx包含第一核酸序列XxI和第二核酸序列XxII,其中XxI和XxII形成唯一地对应于核苷酸A、T、G或C的二进制的预先指定的寡核苷酸密码。
42.如权利要求28至41中任一项所述的方法,其中XxI和XxII在长度上各自在约4个核苷酸至约25个核苷酸的范围内。
43.如权利要求28至42中任一项所述的方法,其中XxI和XxII在长度上各自为12个核苷酸。
44.如权利要求28至43中任一项所述的方法,其中所述第一悬突在长度上在约3个核苷酸至约12个核苷酸的范围内。
45.如权利要求28至44中任一项所述的方法,其中所述第二悬突在长度上在约3个核苷酸至约12个核苷酸的范围内。
46.如权利要求28至45中任一项所述的方法,其中所述靶ssDNA在长度上在约5个核苷酸至约3,000,000个核苷酸的范围内。
47.如权利要求28至46中任一项所述的方法,其中同时转化多个靶ssDNA分子。
48.如权利要求28至47中任一项所述的方法,其中在包含靶ssDNA核酸的不均匀混合物的样品中进行所述转化。
49.如权利要求28至48中任一项所述的方法,其中在所述方法的任何步骤中不使用聚合酶。
50.如权利要求28至49中任一项所述的方法,其中所述探针文库具有在16至1,048,576种不同寡核苷酸的范围内的复杂度。
51.如权利要求28至50中任一项所述的方法,其中所述靶ssDNA分子来源于哺乳动物。
52.如权利要求49的方法,其中所述哺乳动物是人。
53.如权利要求28至52中任一项所述的方法,其中在所述单分子水平上测定所述转化的ssDNA分子的序列。
54.如权利要求51所述的方法,其中所述测序包括标记的分子信标。
55.如权利要求54所述的方法,其中所述标记的分子信标是荧光分子信标。
56.如权利要求55所述的方法,其中所述荧光分子信标结合所述转化的ssDNA分子的Xx序列。
57.如权利要求56所述的方法,其中引导具有结合的荧光分子信标的所述转化的ssDNA分子的所述Xx序列通过直径小于2nm的纳米孔,其中当所述转化的ssDNA分子通过所述纳米孔时,所述荧光分子信标被除去,其中所述荧光分子信标的除去产生闪光,其中所述闪光的顺序产生所述靶ssDNA序列的序列。
CN2009801510704A 2008-10-29 2009-10-29 保持序列的dna转化 Pending CN102257162A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10929808P 2008-10-29 2008-10-29
US61/109,298 2008-10-29
PCT/US2009/062464 WO2010053820A1 (en) 2008-10-29 2009-10-29 Sequence preserved dna conversion

Publications (1)

Publication Number Publication Date
CN102257162A true CN102257162A (zh) 2011-11-23

Family

ID=41604096

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801510704A Pending CN102257162A (zh) 2008-10-29 2009-10-29 保持序列的dna转化

Country Status (4)

Country Link
US (1) US20120040869A1 (zh)
CN (1) CN102257162A (zh)
CA (1) CA2741996A1 (zh)
WO (1) WO2010053820A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113015801A (zh) * 2018-09-20 2021-06-22 赛诺菲 基于内含子的通用克隆方法和组合物
CN113279067A (zh) * 2014-09-24 2021-08-20 赛科恩斯生物科学公司 生成双链衔接物的方法

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9678055B2 (en) 2010-02-08 2017-06-13 Genia Technologies, Inc. Methods for forming a nanopore in a lipid bilayer
US8324914B2 (en) * 2010-02-08 2012-12-04 Genia Technologies, Inc. Systems and methods for characterizing a molecule
US9605307B2 (en) 2010-02-08 2017-03-28 Genia Technologies, Inc. Systems and methods for forming a nanopore in a lipid bilayer
DE112011101618T5 (de) 2010-05-11 2013-03-21 Trustees Of Boston University Verwendung von Nanoporen-Arrays zur Multiplex-Sequenzierung von Nukleinsäuren
GB2500360B (en) 2010-12-22 2019-10-23 Genia Tech Inc Nanopore-based single DNA molecule characterization, identification and isolation using speed bumps
US9581563B2 (en) 2011-01-24 2017-02-28 Genia Technologies, Inc. System for communicating information from an array of sensors
US9110478B2 (en) 2011-01-27 2015-08-18 Genia Technologies, Inc. Temperature regulation of measurement arrays
WO2012135658A2 (en) * 2011-03-30 2012-10-04 Noblegen Biosciences, Inc. Sequence preserved dna conversion for optical nanopore sequencing
JP6457811B2 (ja) 2011-09-23 2019-01-23 オックスフォード ナノポール テクノロジーズ リミテッド ポリマー単位を含むポリマーの解析
JP2014176297A (ja) * 2011-11-11 2014-09-25 Nagayama Ip Holdings Llc 塩基対応標識方法、塩基配列情報取得方法及び塩基対応標識化一本鎖核酸
WO2013073610A1 (ja) * 2011-11-15 2013-05-23 ナガヤマ アイピー ホールディングス エルエルシー 塩基配列決定装置
KR102106499B1 (ko) 2012-02-16 2020-05-04 옥스포드 나노포어 테크놀로지즈 리미티드 폴리머의 측정의 분석
US8986629B2 (en) 2012-02-27 2015-03-24 Genia Technologies, Inc. Sensor circuit for controlling, detecting, and measuring a molecular complex
US9494554B2 (en) 2012-06-15 2016-11-15 Genia Technologies, Inc. Chip set-up and high-accuracy nucleic acid sequencing
GB201215435D0 (en) * 2012-08-30 2012-10-17 Geneseque As Sequencing method
US9605309B2 (en) 2012-11-09 2017-03-28 Genia Technologies, Inc. Nucleic acid sequencing using tags
GB201222928D0 (en) * 2012-12-19 2013-01-30 Oxford Nanopore Tech Ltd Analysis of a polynucleotide
US9759711B2 (en) 2013-02-05 2017-09-12 Genia Technologies, Inc. Nanopore arrays
US9551697B2 (en) 2013-10-17 2017-01-24 Genia Technologies, Inc. Non-faradaic, capacitively coupled measurement in a nanopore cell array
US9567630B2 (en) 2013-10-23 2017-02-14 Genia Technologies, Inc. Methods for forming lipid bilayers on biochips
EP3640349A3 (en) 2013-10-23 2020-07-29 Roche Sequencing Solutions, Inc. High speed molecular sensing with nanopores
WO2016059427A1 (en) 2014-10-16 2016-04-21 Oxford Nanopore Technologies Limited Analysis of a polymer
WO2022165024A1 (en) * 2021-01-27 2022-08-04 Beth Israel Deaconess Medical Center Electrophoretic mobility shift as a molecular beacon-based readout for mirna detection

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1252103A (zh) * 1997-04-21 2000-05-03 布拉克斯集团有限公司 分析dna特征的方法
CN1334879A (zh) * 1998-12-23 2002-02-06 普雷本·莱克索 使用放大标记的测序方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5710000A (en) * 1994-09-16 1998-01-20 Affymetrix, Inc. Capturing sequences adjacent to Type-IIs restriction sites for genomic library mapping

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1252103A (zh) * 1997-04-21 2000-05-03 布拉克斯集团有限公司 分析dna特征的方法
CN1334879A (zh) * 1998-12-23 2002-02-06 普雷本·莱克索 使用放大标记的测序方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113279067A (zh) * 2014-09-24 2021-08-20 赛科恩斯生物科学公司 生成双链衔接物的方法
CN113015801A (zh) * 2018-09-20 2021-06-22 赛诺菲 基于内含子的通用克隆方法和组合物

Also Published As

Publication number Publication date
CA2741996A1 (en) 2010-05-14
US20120040869A1 (en) 2012-02-16
WO2010053820A1 (en) 2010-05-14

Similar Documents

Publication Publication Date Title
CN102257162A (zh) 保持序列的dna转化
CN110997932B (zh) 用于甲基化测序的单细胞全基因组文库
CN114015755B (zh) 用于标记核酸分子的方法和试剂盒
US20190024141A1 (en) Direct Capture, Amplification and Sequencing of Target DNA Using Immobilized Primers
JP7416846B2 (ja) 連結型ライゲーション
US20220042090A1 (en) PROGRAMMABLE RNA-TEMPLATED SEQUENCING BY LIGATION (rSBL)
US10308979B2 (en) Target enrichment and labeling for multi-kilobase DNA
CN105121655B (zh) 新型连接酶活性
EP2929048B1 (en) Restriction enzyme-free target enrichment
KR102592367B1 (ko) 게놈 및 치료학적 적용을 위한 핵산 분자의 클론 복제 및 증폭을 위한 시스템 및 방법
US20100035249A1 (en) Rna sequencing and analysis using solid support
US20120316075A1 (en) Sequence preserved dna conversion for optical nanopore sequencing
CA2800637C (en) Method of dna sequencing by polymerisation
CN108611398A (zh) 通过新一代测序进行基因分型
EP2722401B1 (en) Addition of an adaptor by invasive cleavage
US20220364169A1 (en) Sequencing method for genomic rearrangement detection
Dilanyan Open-Source Custom Beads for Single-Cell Transcriptomics

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20111123