CN105026578A - 通过引物延伸合成探针库 - Google Patents

通过引物延伸合成探针库 Download PDF

Info

Publication number
CN105026578A
CN105026578A CN201380074318.8A CN201380074318A CN105026578A CN 105026578 A CN105026578 A CN 105026578A CN 201380074318 A CN201380074318 A CN 201380074318A CN 105026578 A CN105026578 A CN 105026578A
Authority
CN
China
Prior art keywords
colony
oligonucleotide
sequence
nucleotide
chain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380074318.8A
Other languages
English (en)
Other versions
CN105026578B (zh
Inventor
迈克尔·鲁沃洛
艾米丽·马林·勒普鲁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agilent Technologies Inc
Original Assignee
Agilent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agilent Technologies Inc filed Critical Agilent Technologies Inc
Publication of CN105026578A publication Critical patent/CN105026578A/zh
Application granted granted Critical
Publication of CN105026578B publication Critical patent/CN105026578B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6811Selection methods for production or design of target specific oligonucleotides or binding molecules
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes

Abstract

本文提供通过引物延伸产生探针库的方法。在某些实施方式中,所述方法包括:使包含具有下式V1-B-3’的顶链序列的第一寡核苷酸的群体与包含具有下式V2’-B’-3’的底链序列的第二寡核苷酸的群体杂交以提供双链体的群体。杂交之后,使双链体中寡核苷酸的3’末端延伸以产生双链产物的群体,所述双链产物包含具有下式V1-B-V2的顶链序列,其中V2与V2’互补。

Description

通过引物延伸合成探针库
背景
长期以来,已将染色体重排、缺失和其它畸变与遗传疾病相关。染色体结构异常通常起因于同源重组中的错误。结构异常可出现在配子中并因此将存在于受影响个体的所有细胞中,或者它们可在有丝分裂期间出现并产生具有一些正常细胞和一些异常细胞的遗传嵌合个体。
持续需要开发有效的方法以制造用于基因组学,特别是用于染色体异常的检测和分析的探针。
概述
本文提供通过引物延伸产生探针库的方法。在某些实施方式中,所述方法包括:使包含具有下式V1-B-3’的顶链(top strand)序列的第一寡核苷酸的群体与包含具有下式V2’-B’-3’的底链(bottom strand)序列的第二寡核苷酸的群体杂交以提供双链体的群体。在这些实施方式中,B和B’的核苷酸序列互补且它们的长度为至少15个核苷酸;第一群体的每种寡核苷酸的B的核苷酸序列相同;第二群体的每种寡核苷酸的B’的核苷酸序列相同;V1的核苷酸序列在第一群体的寡核苷酸之间是可变的;V2’的核苷酸序列在第二群体的寡核苷酸之间是可变的;且V1和V2’与参考基因组中的不同位点杂交。杂交之后,使双链体中寡核苷酸的3’末端延伸以产生双链产物的群体,所述双链产物包含具有下式V1-B-V2的顶链序列,其中V2与V2’互补。
附图简介
本领域技术人员将理解,下述附图仅用于阐释目的。附图不旨在以任何方式限制本教导的范围。
图1示意性阐释了本方法的一个实施方式的一些一般原理。
图2示意性阐释了本方法的一个实施方式的另一些原理。
图3示意性阐释了可如何应用本方法来制造单链探针。
图4示意性阐释了通过本方法产生的单链产物的一些特征。
图5示意性阐释了晕环(halo)探针的两种类型。
图6示意性阐释了可如何将本方法的产物用于基因组分析。
图7显示了可如何通过引物延伸来制造晕环探针。
图8显示了可如何扩展图7中所示的一般原理以制造多个晕环探针。
定义
在更详细描述示例性实施方式之前,给出下列定义以阐释和定义说明书中所用术语的含义和范围。
数值范围包括限定该范围的数值。除非另有说明,分别地,核酸是以5’到3’方向从左往右书写,氨基酸序列是以氨基到羧基方向从左往右书写。
除非另外定义,本文所使用的所有技术和科学术语具有本发明所属的领域的普通技术人员通常理解的相同含义。Singleton,等人,DICTIONARYOF MICROBIOLOGY AND MOLECULAR BIOLOGY,第2版,John Wileyand Sons,New York(1994),和Hale&Markham,THE HARPER COLLINSDICTIONARY OF BIOLOGY,Harper Perennial,N.Y.(1991)向技术人员提供了许多本文所用术语的一般含义。尽管如此,为了清楚和容易参考,下文对某些术语进行定义。
必须注意:当在本文和所附权利要求中使用时,除非上下文明确指出相反情况,否则不使用数量词时涵盖复数的指代物。例如,术语“引物”指一个/种或多个/种引物,即单个/种引物和多个/种引物。还应注意:权利要求可撰写成排除任何任选元素。因此,该陈述旨在作为使用与权利要求要素的引述相联系的这些排他性术语如“仅仅”、“仅”等或使用“否定性”限制的在先基础。
术语“核苷酸”旨在包括那些不仅含有已知嘌呤和嘧啶碱基还含有已被修饰的其它杂环碱基的部分(moiety)。这些修饰包括甲基化的嘌呤或嘧啶,酰基化的嘌呤或嘧啶,烷基化的核糖或其它杂环。此外,术语“核苷酸”包括那些包含半抗原或荧光标记以及可以不仅包含常规核糖和脱氧核糖,也可以包含其它糖的部分。经修饰的核苷或核苷酸也包括对糖部分的修饰,例如,其中一个或多个羟基被卤素原子或脂肪族基团取代,官能化为醚、胺等。
术语“核酸”和“多核苷酸”在本文中可以互换使用,其用于描述任意长度的由核苷酸例如脱氧核糖核苷酸或核糖核苷酸构成的聚合物,例如,多于约2个碱基,多于约10个碱基,多于约100个碱基,多于约500个碱基,多于1000个碱基,高达约10000个或更多碱基,并可酶促地或合成地生产(例如,如美国专利号5,948,902和其中所引用的参考文献中所述的PNA),其可以与天然存在的核酸以序列特异性的方式进行杂交,该方式与两种天然存在的核酸杂交类似,例如,能够参与沃森-克里克碱基配对相互作用。天然存在的核苷酸包括鸟嘌呤、胞嘧啶、腺嘌呤、胸腺嘧啶和尿嘧啶(分别为G、C、A、T和U)。DNA和RNA分别具有脱氧核糖和核糖骨架,但PNA的骨架由通过肽键相连的重复N-(2-氨乙基)-甘氨酸单元构成。在PNA中,多种嘌呤和嘧啶碱基通过亚甲基羰基键连接到骨架上。锁核酸(LNA)(通常被称为无法接近的RNA)是经修饰的RNA核苷酸。LNA核苷酸的核糖部分被连接2’氧和4’碳的额外桥修饰。所述桥将核糖“封锁”为3’-内(北(North))构象,这通常发现于A-型双链体(duplex)中。只要期望,可将LNA核苷酸与寡核苷酸中的DNA或RNA残基混合。术语“非结构化核酸”或“UNA”是含有相互之间结合的稳定性较低的非天然核苷酸的核酸。例如,非结构化核酸可含有G’残基和C’残基,其中这些残基对应于G和C的非天然存在形式(即类似物),它们稳定性较低地相互碱基配对,但保留分别与天然存在的C和G残基碱基配对的能力。US20050233340中描述了非结构化核酸,其中关于UNA的公开内容通过引用被并入本文。
本文所使用的术语“寡核苷酸”表示长度为约2-200个核苷酸,直至500个核苷酸的单链核苷酸多聚体。寡核苷酸可以是合成的或者可通过酶法制成,在一些实施方式中,其长度为30-150个核苷酸。寡核苷酸可含有核糖核苷酸单体(即,可以是寡核糖核苷酸)或脱氧核糖核苷酸单体。例如,寡核苷酸的长度可以为10-20、11-30、31-40、41-50、51-60、61-70、71-80、80-100、100-150或150-200个核苷酸。在某些情况下,可如下制得寡核苷酸的群体:利用原位合成方法制造寡核苷酸阵列,以及从基底切割寡核苷酸。所述方法的实例描述于例如Cleary等人(Nature Methods 20041:241-248)和LeProust等人(Nucleic Acids Research 201038:2522-2540)中。
本文所使用的术语“引物”指在纯化的限制消化物中天然存在的或者通过合成产生的寡核苷酸,当被放置在与核酸链互补的引物延伸产物的合成被诱导的条件下时,即存在核苷酸和诱导剂(例如DNA聚合酶)且处于合适的温度和pH时,其能够担当合成起始点。引物可以是单链的或双链的,但必须足够长以在诱导剂存在时启动期望延伸产物的合成。引物的确切长度将取决于许多因素,包括温度、引物来源和方法的使用。例如,对于诊断应用,取决于靶序列的复杂性,寡核苷酸引物典型地含有15-25个或更多核苷酸,尽管它可含有更少核苷酸。本文的引物被选择为与特定靶DNA序列的不同链基本上互补。这意味着:引物必需足够互补以与它们各自的链杂交。因此,引物序列不需要反映模板的确切序列。例如,非互补的核苷酸片段可被连接到引物的5’末端,而引物序列的其余部分与链互补。或者,非互补碱基或更长序列可散布在引物中,条件是:引物序列与链序列足够互补以与其杂交并从而形成合成延伸产物的模板。
术语“杂交”指的是下述过程,其中核酸链在正常杂交条件下与第二互补核酸链退火并形成稳定双链体(同双链体或异双链体),且在相同的正常杂交条件下不与无关的核酸分子形成稳定双链体。在杂交反应中,通过使两条互补的核酸链退火来实现双链体的形成。可通过调节杂交反应发生的杂交条件(通常被称为杂交严格性)使杂交反应高度特异,从而,除非两条核酸链含有基本上或完全互补的一定数目的特定序列核苷酸,否则两条核酸链之间的杂交将不形成稳定双链体,例如在正常严格性条件下保留双链性(double-strandedness)区域的双链体。对于任何给出的杂交反应,“正常杂交或正常严格性条件”易于确定。参见,例如,Ausubel等人,Current Protocols in Molecular Biology,John Wiley&Sons,Inc.,New York,或Sambrook等人,Molecular Cloning:A Laboratory Manual,Cold SpringHarbor Laboratory Press。本文使用的术语“杂交”指的是任何下述过程,通过所述过程核酸链通过碱基配对与互补链结合。
如果核酸与参考核酸序列在中度至高度严格性杂交和洗涤条件下特异性相互杂交,那么认为这两种序列“选择性可杂交”。中度和高度严格性杂交条件是已知的(参见,例如,Ausubel,等人,Short Protocols in MolecularBiology,第3版,Wiley&Sons 1995和Sambrook等人,Molecular Cloning:ALaboratory Manual,第3版,2001Cold Spring Harbor,N.Y.)。高度严格性条件的一个实例包括在约42C下在50%甲酰胺、5X SSC、5X Denhardt氏溶液、0.5%SDS和100μg/mL变性运载体DNA中杂交,随后在室温下在2X SSC和0.5%SDS中洗涤2次并在42℃下在0.1X SSC和0.5%SDS中额外洗涤2次。
本文所使用的术语“互补”表示两种核酸(例如,DNA或RNA)含有能够形成匹配的沃森-克里克碱基对从而产生双链区(除了在错配区)的一系列连续核苷酸。因此,一条核酸链中的腺嘌呤与相对的互补DNA链中的胸腺嘧啶或相对的互补RNA链中的尿嘧啶配对,一条核酸链中的鸟嘌呤与相对的核酸链中的胞嘧啶配对。配对区域被称为“双链体”。或者,如果两种核酸分子能够足够稳定地相互杂交以允许它们在至少常规“低严格性”条件下保持相互退火,则它们被称为“互补”。因此,两种互补的分子不需要展示出精确的互补性,而仅需序列足够互补以能形成稳定双链结构。因此,偏离完全互补性是可以允许的,只要这种偏离不足以完全阻碍杂交形成双链结构即可。
本文所使用的术语“双链体(duplex)”或“双链化的(duplexed)”描述了两个碱基配对(即,杂交在一起)的互补多核苷酸。
本文所使用的术语“扩增”指的是合成与模板核酸的一条链或两条链互补的核酸分子的过程。扩增核酸分子典型地包括:使模板核酸变性,使引物与模板核酸在低于引物熔解温度的温度下退火,以及酶促地从引物延伸以产生扩增产物。可进行一次变性、退火和延伸步骤中的每一个。然而,一般进行变性、退火和延伸步骤多次(例如,至少5或10次,多至30或40次或更多次)以使扩增产物的量增加,通常指数倍增加,尽管本发明的方法不需要指数扩增。扩增典型地需要脱氧核糖核苷三磷酸、DNA聚合酶和合适缓冲液和/或有利于聚合酶最佳活性的辅助因子的存在。术语“扩增产物”指的是由本文所定义的扩增过程产生的核酸序列。
本文所使用的术语“Tm”指的是寡核苷酸双链体中一半的双链体保持杂交且一半的双链体解离成单链时的熔解温度。寡核苷酸双链体的Tm可通过实验被测定或使用下式预测:Tm=81.5+16.6(log10[Na+])+0.41(G+C部分)-(60/N),其中N是链长,[Na+]小于1M。参见Sambrook和Russell(2001;Molecular Cloning:A Laboratory Manual,第3版,Cold Spring Harbor Press,Cold Spring Harbor N.Y.,第10章)。存在用于预测寡核苷酸双链体的Tm的其它公式,一个公式可以或多或少地适合于给定的条件或条件集合。
本文所使用的术语“游离于溶液(free in solution)”描述了未与另一分子结合或被其牵制的分子,例如多核苷酸。
本文所使用的术语“连接”指的是酶促催化地结合第一DNA分子5’末端的末端核苷酸与第二DNA分子3’末端的末端核苷酸。
术语“多个/种”、“群体”和“集合”在本文中可互换使用,其指的是包含至少2个/种成员的某物。在某些情况下,多个/种、群体或集合可具有至少10、至少100、至少1000、至少10000、至少100000、至少106、至少107、至少108或至少109或更多个/种成员。
如果两种核酸“互补”,那么它们在高度严格性条件下相互杂交。术语“完美互补”被用来描述下述双链体,其中一种核酸的每个碱基与另一种核酸中的互补核苷酸碱基配对。在许多情况下,互补的两种序列具有至少10(例如至少12或15)个互补的核苷酸。
术语“消化”旨在表示下述过程,通过所述过程核酸被限制酶切割。为了消化核酸,使限制酶与含有限制酶的识别位点的核酸在适合限制酶起作用的条件下接触。适合市售限制酶活性的条件是已知的并且购买后随这些酶被提供。
寡核苷酸“结合位点”指的是靶多核苷酸中与寡核苷酸杂交的位点。如果寡核苷酸“提供”引物的结合位点,那么引物可与该寡核苷酸或其互补物杂交。
本文所使用的术语“链”指的是由通过共价键(例如磷酸二酯键)共价连接在一起的核苷酸构成的核酸。
在细胞中,DNA通常以双链形式存在,并因而具有两条互补的核酸链,在本文中被称为“顶”和“底”链。在某些情况下,染色体区域的互补链可被称为“正”链和“负”链、“第一”链和“第二”链、“编码”链和“非编码”链、“Watson”链和“Crick”链或者“正义”链和“反义”链。链被分配成顶链或底链是任意的,并非暗示任何特定的方向、功能或结构。一些示例性的哺乳动物染色体区域(例如BAC、组装体、染色体等)的第一链的核苷酸序列是已知的,并且可在例如NCBI的Genbank数据库中找到。
本文所使用的术语“顶链”指的是核酸的任何一条链,但并非核酸的两条链。当寡核苷酸或引物“仅与顶链”结合或退火时,它仅与一条链结合而不与另一条链结合。本文所使用的术语“底链”指的是与“顶链”互补的链。当寡核苷酸“仅与一条链”结合或退火时,它仅与一条链(例如,第一链或第二链)结合而不与另一条链结合。
本文所使用的术语“变性”指的是通过将核酸双链体放置在合适的变性条件下来使所述双链体的至少部分碱基对分开。变性条件在本领域众所周知。在一种实施方式中,为了使核酸双链体变性,可将该双链体暴露于高于双链体的Tm的温度,从而使该双链体的一条链从另一条链释放。在某些实施方式中,可通过将核酸暴露于至少90℃的温度持续合适量的时间(例如,至少30秒,多达30分钟)来使其变性。在某些实施方式中,可使用完全变性条件来完全分开双链体的碱基对。在另一些实施方式中,可使用部分变性条件(例如,利用低于完全变性条件的温度)来分开双链体某些部分的碱基对(例如,富含A-T碱基对的区域可分开,而富含G-C碱基对的区域可保持配对)。核酸还可被化学变性(例如,使用尿素或NaOH)。
本文所使用的术语“延伸”指的是通过使用聚合酶添加核苷酸来延伸引物。如果与核酸退火的引物被延伸,那么所述核酸担当延伸反应的模板。
本文所使用的术语“环化”指的是连接一个或多个线性分子以产生无游离的3’或5’末端的闭环形式的链。
本文所使用的术语“特有(unique)序列”指的是这样的核苷酸序列,它们彼此或与它们的互补物不同。例如,第一特有序列具有不同于第二特有序列或其互补物的核苷酸序列。除非另有说明,在样品中,特有序列仅存在于一种多核苷酸中。
在不相互杂交的核酸的语境中,本文所使用的术语“不相互杂交”指的是这样的序列,其已被设计以使它们在严格条件下不相互退火。这类序列的例子在例如US20070259357和Brenner等人(Proc.Natl.Acad.Sci.199289:5381-3)中所述的某些出版物中被称为“序列记号”,上述通过引用被并入本文。
在彼此紧邻的两核苷酸的语境中,术语“紧邻”表示:所述两核苷酸之间没有插入的核苷酸。可使彼此紧邻的核苷酸彼此相连。
在多核苷酸或多肽的语境中,术语“彼此相似”表示彼此至少70%相同、至少80%相同、至少90%相同或至少95%相同的序列。
术语“单链”指的是以单链形式而非双链形式存在于组合物中的核酸链。在某些情况下,单链多核苷酸可在不存在任何互补多核苷酸时存在于组合物中。在另一些情况下,例如,在已变性的双链核酸未复性的情况下,单链多核苷酸可存在于还包含互补多核苷酸的组合物中。然而,在这些情况下,多核苷酸相互之间不碱基配对。
在相同的两种或多种序列的语境中,术语“相同”指的是具有相同核苷酸序列的两种或多种核酸。换言之,如果群体的所有多核苷酸具有相同的序列,则群体的所有多核苷酸分子具有相同的核苷酸序列。
术语“接触”表示放在一起。因此,当将第一物品与第二物品放在一起时,例如通过使它们相互触及或使它们在相同溶液中组合,这两个物品接触。因此,“接触的样品”是寡核苷酸探针已与其杂交的检测染色体。
本文所使用的术语“基因分型”指的是任何类型的核酸序列分析,其包括测序、多态性分析(例如,SNP分析)和鉴定重排的分析。
本文所使用的术语“测序”指的是下述方法,通过所述方法获得多核苷酸的至少10个连续核苷酸的鉴定(例如至少20个、至少50个、至少100个或至少200个或更多连续核苷酸的鉴定)。
术语“下一代测序”指的是Illumina、Life Technologies和Roche等目前采用的所谓并行化的边合成边测序或边连接边测序平台。下一代测序方法还可包括纳米孔测序方法或基于电子检测的方法例如被Life Technologies商业化的离子激流(Ion Torrent)技术。
本文所使用的术语“条码序列”或“分子条码”指的是特有的核苷酸序列,其被用来:a)鉴定和/或追踪反应中多核苷酸的来源,和/或b)计算初始分子被测序多少次(例如,在基本样品中的每个分子被不同序列标签化,然后扩增该样品的情况下)。条码序列可位于寡核苷酸的5’末端、3’末端或中间。条码序列的尺寸和组成可广泛变化;下列参考文献提供了选择适合特定实施方式的条码序列集合的指导:Brenner,美国专利号5,635,400;Brenner等人,Proc.Natl.Acad.Sci.,97:1665-1670(2000);Shoemake等人,Nature Genetics,14:450-456(1996);Morris等人,欧洲专利公开0799897A1;Wallace,美国专利号5,981,179;等等。在一个具体实施方式中,条码序列的长度可在4-36个核苷酸,或6-30个核苷酸,或8-20个核苷酸的范围内。
本文所使用的术语“PCR试剂”指的是在模板上进行聚合酶链式反应(PCR)所需的所有试剂。如本领域所知,PCR试剂基本上包括第一引物、第二引物、热稳定性聚合酶和核苷酸。取决于使用的聚合酶,离子(例如,Mg2+)也可存在。PCR试剂可任选地含有模板,靶标序列可从所述模板扩增。
在可变的两种或多种核酸序列的语境中,术语“可变的”指的是相对于彼此具有不同核苷酸序列的两种或多种核酸。换言之,如果群体的多核苷酸具有可变的序列,则群体的多核苷酸分子的核苷酸序列随分子而异。术语“可变的”不应被解读为需要群体中的每个分子具有不同于的群体中其它分子的序列。术语“可变的”表示:序列在群体的不同分子之间不同,且可以存在任何特定序列的重复。
本文所使用的术语“参考基因组”指的是可将获自检测基因组的结果与其比较的基因组。在某些情况下,所研究的区域可以是参考基因中的已知核苷酸序列,例如,序列可已被储存在例如NCBI的Genbank数据库或其它数据库中。在许多实施方式中,检测基因组和参考基因组是来自相同(例如,哺乳动物)物种的基因组。
本文所使用的术语“染色体重排”指的是这样的事件,其中染色体的一部分或更多部分在单个染色体之内或在染色体之间重排。在某些情况下,染色体重排可反映染色体结构的异常。染色体重排可以是例如,倒位、缺失、插入或易位。
在染色体重排的语境中,术语“断点”指的是通过染色体重排产生的结点。例如,如果1号染色体和2号染色体之间存在重排,则通过重排的染色体中来自1号染色体的序列和来自2号染色体的序列的结点来定义重排的断点。
以下说明解释了本公开中所使用的式。本文所述的某些多核苷酸可通过式(例如,“V1-B-3’”、“V2’-B’-3’”和“V1-B-V2”)来指代。所述式遵循已建立的规范:即它们描述了以5’到3’方向定向的多核苷酸。式的组分(例如,“V1”、“B”和“V2’”)指的是多核苷酸内可单独限定的核苷酸序列,其中所述序列共价连接在一起以使得由式描述的多核苷酸是单个分子。在所述单个分子中,式的组分可彼此紧邻或彼此隔开。按照惯例,利用上撇号(’)来表示式中所显示序列的互补物,因此序列“V2”的互补物为“V2’”。此外,除非另有说明(例如,如果式之后是“3’-”(例如在“V1-B-3’”或“V2’-B’-3’”的情况下)或者如果式之前是“5’-”),由式限定的多核苷酸可在其3’末端、其5’末端或3’和5’两末端具有额外序列。其它的术语定义可出现在说明书全文中。在式的语境中,术语核酸序列指的是式的组分的核苷酸序列。例如,短语“核酸序列B”指的是组分B的核苷酸序列。
示例性实施方式说明
在描述多种实施方式之前,应该理解:本公开的教导不限于所述特定实施方式,并因而当然可以变化。还应该理解:本文中所用术语仅为了描述具体实施方式,并没有意图是限制性的,因为本教导的范围将仅由所附的权利要求限定。
本文所使用的节标题仅为了组织目的,其不应以任何方式被解释为限制被描述的主题。虽然结合多种实施方式描述本教导,但这并不意味着本教导限于这些实施方式。相反地,本教导包含本领域技术人员理解的各种替代选择、改变和等价物。
除非另外定义,本发明使用的所有技术和科学术语具有与本公开所属的技术领域的普通技术人员通常理解的相同含义。尽管与本文描述的那些方法和材料相似或等同的任何方法和材料也能够用于本教导的实践或检测,但现在描述一些示例性的方法和材料。
对任何出版物的引用是其在申请日前的公开,并不应当解释为承认本权利要求无权凭借着在先发明早于这种公开。此外,所提供的出版物的日期可不同于实际公开日期,其可独立确认。
正如本领域技术人员在阅读该公开后显而易见的,本文描述的和示例的每个单独的实施方案有分离的组成和特征,其可以容易地与任何其它几种实施方案的特征分开或组合而不脱离本教导的范围或精神。任何记载的方法可以以记载的事件顺序进行或逻辑上可行的任何其它顺序进行。
本文引用的所有专利和出版物,包括这些专利和出版物中公开的所有序列,通过引用被清楚并入本文。
方法
图1中阐释了本方法的一般原理。在某些实施方式中,该方法包括:使包含具有下式V1-B-3’的顶链序列的寡核苷酸2的第一群体与包含具有下式V2’-B’-3’的底链序列的寡核苷酸4的第二群体杂交以提供双链体6的群体,其中,B和B’序列相互杂交且V1和V2’序列保持为单链。在该实施方式中,寡核苷酸的第一和第二群体的特征在于:i.B和B’的核苷酸序列互补且它们的长度为至少15个核苷酸(这允许寡核苷酸的第一和第二群体杂交);ii.第一群体的每种寡核苷酸的B的核苷酸序列是不可变的,即是相同的,第二群体的每种寡核苷酸的B’的核苷酸序列是不可变的,即是相同的;iii.V1的核苷酸序列在的第一群体的寡核苷酸之间是可变的;iv.V2’的核苷酸序列在的第二群体的寡核苷酸之间是可变的;和v.V1和V2’与参考基因组中的不同位点杂交。B和B’不与参考基因组杂交。双链体6产生之后,使双链体中寡核苷酸的3’末端延伸以产生包含具有下式V1-B-V2的顶链序列10的双链产物8的群体。将由图1显而易见的是:V1与V1’互补且V2与V2’互补。所得到的产物的群体具有下式V1-B-V2的顶链,其中,(i)每条顶链的核酸序列B是相同的;(ii)群体中的核酸序列V1随分子而异;(iii)群体中的核酸序列V2随分子而异;且(iv)在每种产物内,V1和V2序列与参考基因组中的不同位点杂交。在某些实施方式中,在延伸步骤中仅需要进行1轮引物延伸。在另一些实施方式中,可进行若干(例如,2、3、4或5或更多)轮引物延伸(其中,每轮引物延伸包括变性、引物再退火和引物延伸)。在一些情况下,延伸包括少于10轮引物延伸。
图2中显示了方法的一些原理。在该实施方式中,寡核苷酸2的第一群体包含两种寡核苷酸,所述两种寡核苷酸含有不同的V1序列(V1a和V1b)和相同的序列B;且寡核苷酸4的第二群体包含两种寡核苷酸,所述两种寡核苷酸含有不同的V2’序列(V2a’和V2b’)和相同的序列B’。以使得每种第一寡核苷酸与每种第二寡核苷酸成对组合的方式使寡核苷酸的第一和第二群体杂交在一起,从而产生双链体6的群体。如所示,双链体6的群体含有4种双链体,每种代表第一和第二寡核苷酸的不同组合,它们通过它们的B/B’序列杂交在一起。然后,使双链体延伸以产生双链产物8的群体,其中每种产物具有不同的顶链。具体地,如所示,第一双链产物8a具有含有V1a和V2a序列的组合的顶链,第二双链产物8b具有含有V1b和V2a序列的组合的顶链,第三双链产物8c具有含有V1a和V2b序列的组合的顶链,且第四双链产物8d具有含有V1b和V2b序列的组合的顶链。
在某些情况下,在产物分子内,V1和V2序列与参考基因组中相隔一定距离的位点杂交,所述距离使得很难或不可能通过聚合酶链式反应常规获得产物。在任何一种第一寡核苷酸分子中,V1和V2序列可分别与相同染色体的长臂和短臂杂交,或者相反。在另一些实施方式中,在任何一种产物分子中,V1和V2序列可与不同染色体杂交(例如,V1序列可与1号染色体杂交且V2序列可与2号染色体杂交)。在另一些情况下,与V1和V2杂交的位点在参考基因组中相距至少10kb,但在某些实施方式中,该距离可较短,例如,至少2kb或至少5kb。在某些情况下,在每种第一寡核苷酸内,与V1和V2杂交的序列可在参考基因组中相距至少20kb、至少50kb、至少100kb或至少500kb。
在某些情况下,V1和V2’序列可被设计以使得产物分子中的V1和V2序列紧挨着参考基因组中的限制位点杂交。序列V1、B和V2’各自的长度为至少15个核苷酸。在一些实施方式中,序列V1、B和V2’的长度可独立地为至少18个核苷酸、至少20个核苷酸、至少25个核苷酸、至少30个核苷酸、直至50个核苷酸或更多。将显而易见的是,V1和V2’的序列彼此独立地不同。
在某些实施方式中,第一寡核苷酸的群体的寡核苷酸可被设计以使得群体的V1序列与这样的位点杂交,所述位点全部在参考基因组的第一区域中的一条链中(例如,在贯穿50kb或100kb的区域分布(例如平铺(tiledthrough))的位点);且第二寡核苷酸的群体的寡核苷酸的V2’序列与这样的位点杂交,所述位点全部在参考基因组的第二区域中的一条链中(例如,在贯穿50kb或100kb的区域分布(例如平铺)的位点)。在某些情况下,第一和第二区域可已知在其它基因组中相互重排。
在一些实施方式中和如图3中所示,寡核苷酸12的第一群体可包含具有下式F-V1-B-3’的顶链序列,寡核苷酸14的第二群体可包含具有下式R’-V2’-B’-3’的底链序列,且双链产物的群体可包含具有下式F-V1-B-V2-R的顶链18,其中R和F的互补物(即,F’)提供正向引物20和反向引物22的结合位点。如所示,该方法还可包括:使用正向引物20和反向引物22,PCR扩增双链产物18的群体以产生双链PCR产物24的群体,所述双链PCR产物24包含具有式F-V1-B-V2-R的顶链的顶链26序列。
在使用之前,在某些情况下,双链PCR产物24的群体可被处理以产生式F-V1-B-V2-R的单链产物28的群体。例如,这可如下来实现:使用5’-磷酸化(通过反向引物22中的星号来指示)的反向引物和未5’磷酸化的正向引物,然后通过使用选择性降解5’-磷酸化核酸的核酸外切酶来降解双链产物的群体的底链以产生单链产物。λ核酸外切酶是这类酶的一个例子,但也存在其它这类酶。在一个替代性实施方式中,反向引物可被生物素化,双链PCR产物24的底链可例如通过使所述双链产物变性并使生物素化的底链与例如链霉亲和素结合而被除去。图4阐释了通过该方法产生的含有3种示例性单链产物(单链产物30a、30b和30c)的群体。如图4中所示,每种单链产物的核酸序列B是相同的且与一种或多种第二寡核苷酸杂交(未示出)。在所显示的分子中,单链产物30a、30b和30c的5’末端分别具有不同的序列V1a、V1b和V1c,且第一寡核苷酸30a、30b和30c的3’末端分别具有不同的序列V2a、V2b和V2c
寡核苷酸的第一和第二群体中各种寡核苷酸区域的长度可变化很大,这取决于期望的应用和寡核苷酸中含有多少载量(freight)(即,多少引物结合位点、分子条码等)。例如,如下文所述,在某些情况下,B区域可为至少一对PCR引物提供位点,并任选地提供一个或多个分子条码。在某些实施方式中,B的核苷酸序列的长度为至少15个碱基,例如20-100个碱基或30-60个碱基;且V1和V2’的序列的长度可为至少10个核苷酸,例如10-100个碱基或15-50个碱基。
寡核苷酸的第一和第二群体各自的成员数目可变化很大,这取决于如何实施方法。在一些实施方式中,寡核苷酸的第一和第二群体可含有至少10个、至少50个、至少100个、至少200个、至少500个或至少1000个以及多达10000个或更多个成员。此外,任何一种组装体可含有通过不同的B序列杂交的多对寡核苷酸的群体。例如,通过序列B2杂交的寡核苷酸第三和第四的群体可在与通过序列B1杂交的寡核苷酸的第一和第二群体相同的反应中组装。上述方法可使用至少1对、至少2对、至少5对、至少10对或至少100对或更多对寡核苷酸的群体来完成,其中每个群体与成对的另一群体杂交。
单链产物26的群体用作多重晕环试验中的第一寡核苷酸,其中,在本公开的语境中,多重晕环试验使用式V1-B-V2的第一寡核苷酸(任选地,其可包含V1区域的5’非杂交序列和V2区域的3’非杂交序列)的群体和与区域B杂交的一种或多种第二寡核苷酸。为了参考目的,图5中显示了晕环探针的两种实施方式:32和46。如图5中所示,晕环探针的两种实施方式32和46均包含:第一寡核苷酸34,其包含与片段靶DNA中的不同区域杂交的侧翼序列38和40,以及中心序列42。侧翼序列38对应于在本文中被称为“V1”的区域,侧翼序列40对应于在本文中被称为“V2”的区域,中心序列42对应于在本文中被称为“B”的区域。如所示,晕环探针还包含与第一寡核苷酸的中心序列42互补的一种或多种第二寡核苷酸。在本公开的语境中,这些寡核苷酸可被称为与核酸序列B杂交的一种或多种第二寡核苷酸。在实施方式32(显示于图A)中,一种或多种第二寡核苷酸可以是单个寡核苷酸44。在实施方式46(显示于图B)中,一种或多种第二寡核苷酸可以是两种寡核苷酸44a和44b,其中每种各含有与第一寡核苷酸杂交的区域、和不与第一寡核苷酸杂交的尾。在某些实施方式中,一种或多种第二寡核苷酸可提供扩增和/或测序引物结合位点和任选的分子条码序列。如果使用晕环探针46,则这些序列可存在于寡核苷酸44a和44b的尾中。
在某些实施方式中,第一寡核苷酸和一种或多种第二寡核苷酸使得它们能够与基因组的限制片段杂交从而产生这样的复合体,所述复合体中,一种或多种第二寡核苷酸中至少一种的至少一端与所述片段的一端可连接性邻近,如US7883849和Dahl等人(Nucl.Acids.Res.200533:e71)所述,其通过引用被并入本文。
与上述一致,晕环探针的双链区域的长度可以为15-100个碱基对(例如,30-60bp),且侧翼区域38和40(其与基因组中的靶序列特异性杂交)的序列长度可以为10-100个碱基(例如,12-50个碱基)。应该显而易见的是,晕环探针的双链区域的核苷酸序列应被设计以使得它不与所研究的基因组杂交。上述方法可用来生产可用于图5中所示的任一个实施方式中的第一寡核苷酸的群体。
图6阐释了示例性多重晕环试验,其中可使用本单链产物28的群体(如图3中所示)。所述方法的某些实施方式可包括:(a)使来自检测基因组的片段化基因组DNA50与第一寡核苷酸52的群体在一种或多种第二寡核苷酸54存在时杂交以产生杂交产物56。如所示,杂交产物包含一些复合体,例如,58、60和62。如所示,许多第一寡核苷酸(例如,复合体58和60中的那些)与两种不同的基因组片段杂交,这可预计是因为:在每种第一寡核苷酸分子内,V1和V2序列可与基因组中相距至少10kb的位点杂交。在某些情况下,相对于参考基因组,检测基因组可具有如下染色体重排:其将V1-互补序列有效移动至与V2-互补序列相同的链上接近V2-互补序列的位点。在这些情况下,如果第一寡核苷酸包含与通过重排移至接近的序列互补的V1和V2序列,那么将产生复合体62,其包含与第一寡核苷酸的两端杂交的单个基因组片段。如上所述,在某些实施方式中,第一寡核苷酸被设计以使V1和V2序列邻近参考基因组中限制酶的切割位点。在这些实施方式中,复合体62中片段的末端可与复合体的第二寡核苷酸的末端可连接性邻近。在另一些实施方式中,可使用例如核酸外切酶和/或瓣状核酸内切酶来削减(trimmed back)片段的末端以提供这样的复合体,其中片段的末端与该复合体中第二寡核苷酸的末端可连接性邻近。
杂交之后,使杂交产物56与连接酶接触以使片段化基因组DNA的末端与一种或多种第二寡核苷酸连接从而产生连接产物56。如所示,在含有与第一寡核苷酸的两端杂交的单个片段的复合体中,片段的两端与一种或多种第二寡核苷酸连接。在所显示的实施方式(其应用图1的图A中所示晕环探针)中,连接产生环状核酸分子66。在应用图5的图B中所示晕环探针的实施方式中,基因组片段与两种不同的寡核苷酸(例如,44a和44b,如图5的图B中所示)连接,这有效地将衔接子(adaptor)添加到基因组片段的两端。
连接之后,使用与一种或多种第二寡核苷酸所提供的位点杂交的扩增引物,使连接产物64经受聚合酶链式反应条件,其中如上所述,如果寡核苷酸提供引物结合位点,那么引物可与该寡核苷酸或其互补物杂交。图6中使用箭头来指示示例性的扩增引物的位点。等价结合位点可由图5的图B中所示替代性第二寡核苷酸来提供。通过扩增步骤产生产物68指示:相对于参考基因组,检测基因组包含染色体重排。如果不存在将V1-互补序列移至与V2-互补序列相同的链上接近V2-互补序列的位点的重排,则将不会得到扩增产物。
在某些实施方式中,所述方法还可包括对扩增产物68进行测序。所述测序可使用与一种或多种第二寡核苷酸的互补链杂交的引物。可分析该方法以鉴定染色体重排的断点。
将显而易见的是,在某些实施方式中,通过一种或多种第二寡核苷酸所添加的序列可含有适合用于下一代测序平台的序列,所述测序平台例如,Illumina的可逆性终止法、Roche的焦磷酸测序法(454)、Life Technologies的连接测序法(SOLiD平台)或Life Technologies的离子激流平台。下列参考文献中描述了这种方法的实例:Margulies等人(Nature 2005437:376-80);Ronaghi等人(Analytical Biochemistry 1996242:84-9);Shendure(Science2005309:1728);Imelfort等人(Brief Bioinform.200910:609-18);Fox等人(Methods Mol Biol.2009;553:79-108);Appleby等人(Methods Mol Biol.2009;513:19-39)和Morozova(Genomics.200892:255-64),其中关于方法和方法的具体步骤(包括每个步骤的起始产物、试剂和终产物全部)的一般描述的通过引用被并入本文。序列可存在于一种或多种第二寡核苷酸中(在它们的尾中或在与第一寡核苷酸杂交的序列中)。在某些情况下,一种或多种第二寡核苷酸可含有两组引物结合位点,一组用于通过反向PCR扩增环状DNA,另一组用于对所得产物进行测序。一种或多种第二寡核苷酸还可包含位于扩增和测序引物结合位点下游的分子条码,其可被用来鉴定序列来自哪个样品,或计算多少不同的起始分子已被测序。
在另一些实施方式中,可使用纳米孔测序对扩增子进行测序(例如,如Soni等人Clin Chem 53:1996-20012007中所述,或如Oxford NanoporeTechnologies所述)。纳米孔测序是单分子测序技术,其中单个DNA分子在通过纳米孔时被直接测序。纳米孔是小洞,其直径1nm左右。将纳米孔浸入传导流体并越过它应用电势(电压)导致微量电流,这是因为离子通过纳米孔被传导。流过的电流量对纳米孔的尺寸和形状敏感。当DNA分子穿过纳米孔时,DNA分子上的每个核苷酸不同程度阻塞纳米孔,从而不同程度改变通过纳米孔的电流的量级。因此,这种DNA分子穿过纳米孔时的电流改变代表DNA序列的读取。纳米孔测序技术在美国专利号5,795,782、6,015,714、6,627,067、7,238,485和7,258,838以及美国专利申请公开2006003171和20090029477中被描述。
在一些具体实施方式中,可通过使用限制酶(例如具有4个、5个或6个碱基对识别位点的一种或多种限制酶)消化基因组DNA来产生片段化基因组DNA。或者,可使用化学、物理或转座酶催化片段化方法从基因组DNA产生基因组DNA,参见,例如,Adey等人(Genome Biology2010,11:R119)。例如,物理片段化方法可以包括超声、雾化或剪切基因组DNA。在某些实施方式中,在进行所述方法之前,可将基因组DNA片段化至平均尺寸在100bp-10kb(例如200bp-1kb)范围内。
上述方法可被用来分析来自任何含核酸实体例如任何生物体、噬菌体或病毒等的基因组。在某些情况下,所述方法可被用来分析来自任何生物体(例如,植物、动物(例如,爬行动物、哺乳动物例如人类和小鼠、昆虫、蠕虫、鱼类、等)、组织样品、细菌、真菌(例如,酵母)、噬菌体、病毒、尸体组织、考古学/古代的样品等等的基因组。在某些实施方式中,所述方法中使用的初始DNA可来源于哺乳动物,其中在某些实施方式中,哺乳动物是人类。在一种实施方式中,检测基因组疑似含有染色体重排。
在某些实施方式中,被分析的初始DNA可来源于单一来源(例如,单一生物体、病毒、组织、细胞、对象等),然而在另一些实施方式中,核酸样品可以是从多个来源提取的核酸的库(例如来自多种生物体、组织、细胞、对象等的核酸的库),其中“多种”表示两种或更多种。因而,在某些实施方式中,核酸样品可含有来自2种或更多种来源,3种或更多种来源,5种或更多种来源,10种或更多种来源,50种或更多种来源,100种或更多种来源,500种或更多种来源,1000种或更多种来源,5000种或更多种来源,多达并包括约10000种或更多种来源的核酸。分子条码可允许来自不同来源的序列在分析之后被区分。此外,反应可以是多重的以在单个反应中靶向多个不同靶位点(例如,10-1000个)。
组合物
提供包含双链体的群体的组合物。在某些实施方式中,双链体包含:如上所述,包含具有下式V1-B-3’的顶链序列的第一寡核苷酸的群体;和包含具有下式V2’-B’-3’的底链序列的第二寡核苷酸的群体。在一些实施方式中,B和B’的核苷酸序列互补且它们的长度为至少15个核苷酸;第一群体的每种寡核苷酸的B的核苷酸序列相同;第二群体的每种寡核苷酸的B’的核苷酸序列相同;V1的核苷酸序列在第一群体的寡核苷酸之间是可变的;V2’的核苷酸序列在第二群体的寡核苷酸之间是可变的;且V1和V2’与参考基因组中的不同位点杂交。在一些实施方式中,B的核苷酸序列的长度为至少15个碱基,V1和V2’的核苷酸序列的长度为至少25个核苷酸且寡核苷酸的第一和第二群体各自可包含至少10种寡核苷酸。可存在于该组合物中的组分的更详细描述以及可存在于该组合物中的其它组分描述于上文所述的方法部分中。
试剂盒
本公开还提供用于实行如上所述本方法的试剂盒(kit)。本试剂盒可至少包含:如上所述,a)包含具有下式V1-B-3’的顶链序列的第一寡核苷酸的群体;和b)包含具有下式V2’-B’-3’的底链序列的第二寡核苷酸的群体。在一些实施方式中,B和B’的核苷酸序列互补且它们的长度为至少15个核苷酸;第一群体的每种寡核苷酸的B的核苷酸序列相同;第二群体的每种寡核苷酸的B’的核苷酸序列相同;V1的核苷酸序列在的第一群体的寡核苷酸之间是可变的;V2’的核苷酸序列在的第二群体的寡核苷酸之间是可变的;且V1和V2’与参考基因组中的不同位点杂交。在某些情况下,第一寡核苷酸的群体可包含具有下式F-V1-B-3’的顶链序列,第二寡核苷酸的群体包含具有下式R’-V2’-B’-3’的底链序列,其中序列R和F’的互补物提供正向引物和反向引物的结合位点。此外,试剂盒还包含与序列F和R’的互补物杂交的正向引物和反向引物。在某些情况下,正向引物和反向引物之一可包含5’磷酸或生物素。此外,试剂盒还可包含用于进行聚合酶链式组装的试剂(例如,聚合酶、核苷酸和缓冲液等)和用于进行所述方法的其它酶和/或试剂(例如,连接酶、λ核酸外切酶等)。根据期望,试剂盒的各种组分可出现在分开的容器中或者某些相容组分可被预先组合在单个容器中。
除了上述组分之外,本试剂盒还可包含关于使用所述试剂盒的组分来实行本方法的说明(即,提供样品分析说明)。实行本方法的说明通常记录在合适的记录介质上。例如,说明可被印刷在基质(例如纸或塑料,等)上。因而,说明可作为包装插入物(insert)出现在试剂盒中,在试剂盒或其组分的容器标记中(即,与包装或小包装相关)等。在另一些实施方式中,说明作为存在于合适的计算机可读存储介质(例如,CD-ROM、磁盘等)上的电子存储数据文件被呈现。在又一些实施方式中,实际说明未出现在试剂盒中,但从远程来源(例如,通过因特网)获得说明的方法被提供。这种实施方式的一个实例是包括网址的试剂盒,其中可在所述网址查看说明并/或可从所述网址下载说明。与说明一样,这种获得说明的方法被记录在合适基质上。
应用
上文所述的多重晕环试验可用于多种应用,其中所述应用通常包括可检测到给定样品中染色体重排存在的基因组DNA分析应用。本方法还可用于精细地确定染色体断点和其它畸变(例如,微-倒位、缺失和易位)的位置,在某些情况下没有用关于它们位置的现有知识。本方法可用于多种诊断和研究目的,因为染色体倒位和易位在与人类疾病相关的状况和许多生物体的基因组进化中发挥重要的作用。
特别地,上述方法可用于诊断或研究多种类型的遗传异常、癌症或其它哺乳动物疾病,包括但不限于:白血病;乳腺癌;前列腺癌;阿尔兹海默症;帕金森症;癫痫;肌萎缩性脊髓侧索硬化症;多发性硬化;中风;自闭症;猫叫综合症(5号染色体的短臂截短)、lp36缺失综合症(1号染色体的部分短臂缺失)、安格尔曼综合症(15号染色体的部分长臂缺失);普拉德-威利综合症(15号染色体的部分短臂缺失);急性淋巴细胞白血病和更特别地,慢性髓细胞性白血病(9号染色体和22号染色体之间易位);腭心面综合症(22号染色体的部分长臂缺失);特纳综合症(单个X染色体);克兰费尔特综合症(额外的X染色体);爱德华综合症(三体型18号染色体);唐氏综合症(三体型21号染色体);帕韬氏综合症(三体型13号染色体);和三体型8、9和16号,其通常无法存活至出生。
所述疾病可以是遗传的(生殖细胞突变)或偶发的(体细胞突变)。本文所述的许多示例性染色体重排与产生这些疾病的因素相关和被认为是产生这些疾病的因素。知晓染色体重排的类型和位置可大大有助于多种哺乳动物疾病的诊断、预后和理解。
某些上述方法还可用于检测患病细胞,其比需要分裂细胞并需要技术人员劳动和耗时的人工制备以及技术人员对载片的分析的标准细胞遗传学方法更为容易。
上述方法还可用于比较两个生物物种的基因组以推断进化关系。
基因组DNA可分离自多种来源,包括组织培养细胞和哺乳动物对象,例如,人类、灵长动物、小鼠或大鼠对象。例如,可由少于5毫升(mL)外周血分析染色体。白血细胞含有染色体而红血细胞不含染色体。可收集血液并将其与抗凝剂(例如,肝素钠)合并。还可由羊水(其含有胎儿细胞)分析基因组DNA。可使这类细胞在组织培养物中生长以使得在5-10天内能够获得用于染色体分析的分裂细胞。还可由骨髓分析基因组DNA,这有利于白血病或其它骨髓癌症的诊断。还可由固体组织样品分析基因组DNA。可无菌获得在约2-3mm范围内的皮肤或其它组织活检样本并将其转移至含有无菌盐水或组织转运介质的无菌小瓶中以提供用于染色体分析的材料。流产后获得的胎儿组织也可用于染色体分析,例如来自胎盘的胎儿侧、覆盖胸骨的骨膜或腹股沟韧带之上的筋膜,或来自绒膜绒毛。胎儿组织还可收集自多个位点,例如肾脏、胸腺、肺、隔膜、肌肉、腱和生殖腺。还可以进行羊膜穿刺术。
除了上述之外,本方法还可对例如骨髓涂片、血液涂片、石蜡包埋的组织制品、酶促分离的组织样品、非培养的骨髓、非培养羊水细胞和细胞离心制品进行。
实施例
在该实施例中,通过待被晕环探针靶向的基因特异序列是否与靶序列的5’或3’末端互补来鉴定它们并将它们分类。对于与5’末端互补的那些,将通用连接序列添加到探针的3’末端以产生含有基因特异序列和其后的连接序列的嵌合序列。对于靶向靶序列的3’末端的那些探针,生成探针序列的反向互补物并将连接序列的反向互补物添加到3’末端。
合成每种嵌合寡核苷酸,使它们汇集在一起并通过引物延伸来组装。然后,通过PCR选择性扩增延伸的探针。在使用该方法时,可通过用所使用5’引物的数目乘以所使用3’引物的数目来计算晕环探针的数目。例如,由200个寡核苷酸合成反应可生成10000个晕环探针。图7显示了可如何通过引物延伸制造一个晕环探针。图8显示了可如何扩展图7中所示一般原理以制造多个晕环探针。

Claims (20)

1.一种方法,其包括:
a)使包含具有下式:
V1-B-3’
的顶链序列的寡核苷酸的第一群体与包含具有下式:
V2’-B’-3’
的底链序列的寡核苷酸的第二群体杂交以提供双链体的群体;其中:
B和B’的核苷酸序列互补且它们的长度为至少15个核苷酸;
所述第一群体的每种寡核苷酸的B的核苷酸序列相同;
所述第二群体的每种寡核苷酸的B’的核苷酸序列相同;
V1的核苷酸序列在所述第一群体的寡核苷酸之间是可变的;
V2’的核苷酸序列在所述第二群体的寡核苷酸之间是可变的,且
V1和V2’与参考基因组中的位点杂交;和
b)使所述双链体中寡核苷酸的3’末端延伸以产生双链产物的群体,所述双链产物包含具有下式:
V1-B-V2
的顶链序列,其中V2与V2’互补。
2.权利要求1所述的方法,其中:
所述寡核苷酸的第一群体包含具有下式:
F-V1-B-3’
的顶链序列;所述寡核苷酸的第二群体包含具有下式:
R’-V2’-B’-3’
的底链序列;并且所述双链产物的群体包含具有下式:
F-V1-B-V2-R
的顶链序列,其中F的互补物和R提供正向和反向引物的结合位点,所述正向和反向引物能够被用于扩增所述双链产物的群体以产生PCR产物的群体。
3.权利要求2所述的方法,其还包括:
c)使用所述正向和反向引物PCR扩增所述双链产物的群体以产生所述PCR产物的群体。
4.权利要求4所述的方法,其还包括:
d)将所述PCR产物的群体的所述顶链与底链分离以产生与所述基因组中多个位点杂交的单链晕环探针的群体。
5.权利要求4所述的方法,其中所述反向引物是5’-磷酸化的且所述分离通过使用核酸外切酶降解所述双链产物的群体的底链来实现。
6.权利要求5所述的方法,其中所述核酸外切酶是λ核酸外切酶。
7.权利要求1所述的方法,其中所述基因组是哺乳动物基因组。
8.权利要求1所述的方法,其中B的核苷酸序列的长度为至少15个碱基。
9.权利要求1所述的方法,其中V1和V2’的核苷酸序列的长度为至少25个核苷酸。
10.权利要求1所述的方法,其中所述寡核苷酸的第一群体包含至少10种寡核苷酸且所述寡核苷酸的第二群体包含至少10种寡核苷酸。
11.权利要求1所述的方法,其中所述基因组中与V1和V2杂交的位点各包含限制位点。
12.物质的组合物,其包含:
双链体的群体,其中所述双链体包含:
包含具有下式:
V1-B-3’
的顶链序列的寡核苷酸的第一群体;和包含具有下式:
V2’-B’-3’
的底链序列的寡核苷酸的第二群体;其中:
B和B’的核苷酸序列互补且它们的长度为至少15个核苷酸;
所述第一群体的每种寡核苷酸的B的核苷酸序列相同;
所述第二群体的每种寡核苷酸的B’的核苷酸序列相同;
V1的核苷酸序列在所述第一群体的寡核苷酸之间是可变的;
V2’的核苷酸序列在所述第二群体的寡核苷酸之间是可变的,且
V1和V2’与参考基因组中的不同位点杂交。
13.权利要求12所述的物质的组合物,其中B的核苷酸序列的长度为至少15个碱基。
14.权利要求12所述的物质的组合物,其中V1和V2’的核苷酸序列的长度为至少25个核苷酸。
15.权利要求12所述的物质的组合物,其中所述寡核苷酸的第一群体包含至少10种寡核苷酸,且所述寡核苷酸的第二群体包含至少10种寡核苷酸。
16.试剂盒,其包含:
a)包含具有下式:
V1-B-3’
的顶链序列的寡核苷酸的第一群体;和
b)包含具有下式:
V2’-B’-3’
的底链序列的寡核苷酸的第二群体;其中:
B和B’的核苷酸序列互补且它们的长度为至少15个核苷酸;
所述第一群体的每种寡核苷酸的B的核苷酸序列相同;
所述第二群体的每种寡核苷酸的B’的核苷酸序列相同;
V1的核苷酸序列在所述第一群体的寡核苷酸之间是可变的;
V2’的核苷酸序列在所述第二群体的寡核苷酸之间是可变的,且
V1和V2’与参考基因组中的不同位点杂交。
17.权利要求16所述的试剂盒,其还包含用于实施权利要求1所述方法的说明。
18.权利要求16所述的试剂盒,其中所述寡核苷酸的第一群体包含具有下式:
F-V1-B-3’
的顶链序列;且所述寡核苷酸的第二群体包含具有下式:
R’-V2’-B’-3’
的底链序列;其中序列F和R’的互补物提供正向和反向引物的结合位点。
19.权利要求16所述的试剂盒,其还包含与序列F和R’的互补物杂交的正向和反向引物。
20.权利要求16所述的试剂盒,其中所述正向和反向引物之一包含5’磷酸或生物素。
CN201380074318.8A 2013-03-05 2013-03-05 通过引物延伸合成探针库 Active CN105026578B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2013/029168 WO2014137329A1 (en) 2013-03-05 2013-03-05 Synthesis of pools of probes by primer extension

Publications (2)

Publication Number Publication Date
CN105026578A true CN105026578A (zh) 2015-11-04
CN105026578B CN105026578B (zh) 2019-03-15

Family

ID=51491713

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380074318.8A Active CN105026578B (zh) 2013-03-05 2013-03-05 通过引物延伸合成探针库

Country Status (4)

Country Link
US (1) US11390907B2 (zh)
EP (1) EP2964777B1 (zh)
CN (1) CN105026578B (zh)
WO (1) WO2014137329A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107937389A (zh) * 2016-10-13 2018-04-20 安捷伦科技有限公司 阵列上连接组装
CN108841919A (zh) * 2018-06-12 2018-11-20 艾吉泰康生物科技(北京)有限公司 一种嵌合式sda法制备探针
CN113728114A (zh) * 2018-10-09 2021-11-30 台湾地区“中央研究院” 用于检测样本中的核酸的数位聚合酶连锁反应方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3947726A1 (en) * 2019-04-03 2022-02-09 Agilent Technologies, Inc. Compositions and methods for identifying and characterizing gene translocations, rearrangements and inversions
AU2021282588A1 (en) * 2020-06-05 2023-01-19 Sirona Genomics, Inc. Methods of identifying markers of graft rejection

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993009245A1 (en) * 1991-10-31 1993-05-13 University Of Pittsburgh Reverse dot blot hybridization using tandem head-to-tail monomers containing probes synthesized by staggered complementary primers
US5518900A (en) * 1993-01-15 1996-05-21 Molecular Tool, Inc. Method for generating single-stranded DNA molecules
CN101835903A (zh) * 2007-08-23 2010-09-15 诺瓦提斯公司 检测寡核苷酸的方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6558907B2 (en) * 2001-05-16 2003-05-06 Corning Incorporated Methods and compositions for arraying nucleic acids onto a solid support
US8058055B2 (en) * 2006-04-07 2011-11-15 Agilent Technologies, Inc. High resolution chromosomal mapping
US9074244B2 (en) 2008-03-11 2015-07-07 Affymetrix, Inc. Array-based translocation and rearrangement assays
US8034917B2 (en) 2008-08-28 2011-10-11 Agilent Technologies, Inc. Primer-directed chromosome painting
US20100068701A1 (en) 2008-09-12 2010-03-18 Yamada N Alice Chromosome labeling method
WO2011140187A2 (en) * 2010-05-04 2011-11-10 University Of Rochester Detecting chromosomal rearrangement

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993009245A1 (en) * 1991-10-31 1993-05-13 University Of Pittsburgh Reverse dot blot hybridization using tandem head-to-tail monomers containing probes synthesized by staggered complementary primers
US5518900A (en) * 1993-01-15 1996-05-21 Molecular Tool, Inc. Method for generating single-stranded DNA molecules
CN101835903A (zh) * 2007-08-23 2010-09-15 诺瓦提斯公司 检测寡核苷酸的方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107937389A (zh) * 2016-10-13 2018-04-20 安捷伦科技有限公司 阵列上连接组装
CN107937389B (zh) * 2016-10-13 2023-05-02 安捷伦科技有限公司 阵列上连接组装
CN108841919A (zh) * 2018-06-12 2018-11-20 艾吉泰康生物科技(北京)有限公司 一种嵌合式sda法制备探针
CN113728114A (zh) * 2018-10-09 2021-11-30 台湾地区“中央研究院” 用于检测样本中的核酸的数位聚合酶连锁反应方法

Also Published As

Publication number Publication date
EP2964777A4 (en) 2016-10-26
CN105026578B (zh) 2019-03-15
EP2964777B1 (en) 2018-05-02
US20160258002A1 (en) 2016-09-08
US11390907B2 (en) 2022-07-19
EP2964777A1 (en) 2016-01-13
WO2014137329A1 (en) 2014-09-12

Similar Documents

Publication Publication Date Title
CN105026577A (zh) 通过序列捕获检测基因组重排
CN104854246B (zh) 无限制酶的靶标富集
CN110191961B (zh) 制备经不对称标签化的测序文库的方法
US11414695B2 (en) Nucleic acid enrichment using Cas9
CN104619894B (zh) 用于非期望核酸序列的阴性选择的组合物和方法
US10308979B2 (en) Target enrichment and labeling for multi-kilobase DNA
US20120028310A1 (en) Isothermal nucleic acid amplification methods and compositions
CN104736722A (zh) 样品制备方法
EP2722401B1 (en) Addition of an adaptor by invasive cleavage
US20240117343A1 (en) Methods and compositions for preparing nucleic acid sequencing libraries
US20220364169A1 (en) Sequencing method for genomic rearrangement detection
CN105026578A (zh) 通过引物延伸合成探针库
US11680285B2 (en) Hooked probe, method for ligating nucleic acid and method for constructing sequencing library
CN115175985A (zh) 从未经处理的生物样本中提取单链dna和rna并测序的方法
Coral HIGH-RESOLUTION NUCLEIC ACID ANALYSIS WITH A DNA NANOTECHNOLOGY APPROACH

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant