CN114829368A - 通过使用连续标记方案的合成进行测序的方法 - Google Patents

通过使用连续标记方案的合成进行测序的方法 Download PDF

Info

Publication number
CN114829368A
CN114829368A CN202080087416.5A CN202080087416A CN114829368A CN 114829368 A CN114829368 A CN 114829368A CN 202080087416 A CN202080087416 A CN 202080087416A CN 114829368 A CN114829368 A CN 114829368A
Authority
CN
China
Prior art keywords
nucleotide
different
conjugate
group
groups
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080087416.5A
Other languages
English (en)
Inventor
Y·阿斯蒂尔
F·伯格曼
D·海因德尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of CN114829368A publication Critical patent/CN114829368A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/06Pyrimidine radicals
    • C07H19/10Pyrimidine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/24Heterocyclic radicals containing oxygen or sulfur as ring hetero atom
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6811Selection methods for production or design of target specific oligonucleotides or binding molecules
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/113Modifications characterised by incorporating modified backbone
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/117Modifications characterised by incorporating modified base
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2533/00Reactions characterised by the enzymatic reaction principle used
    • C12Q2533/10Reactions characterised by the enzymatic reaction principle used the purpose being to increase the length of an oligonucleotide strand
    • C12Q2533/101Primer extension
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/149Sequential reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/143Magnetism, e.g. magnetic label
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/155Particles of a defined size, e.g. nanoparticles

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)

Abstract

本公开提供了一种用于对靶多核苷酸分子进行测序的方法。在一些实施方案中,本公开提供了一种通过合成进行测序的方法,其中在多个新生核酸拷贝链的每次重复延伸期间顺序地形成并检测核苷酸‑缀合物复合物的不同子集,其中每个新生核酸拷贝链与多个靶多核苷酸分子中的一个互补。在一些实施方案中,所述多个靶多核苷酸分子排列在固体支持物上。

Description

通过使用连续标记方案的合成进行测序的方法
背景技术
从四十年前开始,DNA测序的重要性就已大大提高。它被认为是生物学和医学大多数领域的关键技术,也是个性化和精准医疗新典范的基础。有关个体基因组和表观基因组的信息可以帮助揭示他们的疾病倾向,临床预后以及对治疗方法的反应,但是基因组测序在医学中的常规应用需要及时且经济有效的方式提供全面的数据。
一种众所周知的测序方法是首先由R.Tsien描述的合成测序(SBS)方法(WO 91/06678)。该方法利用在其3′-OH基团处受到保护的可逆终止核苷酸。当前的测序系统利用包括荧光标记的可逆终止核苷酸。在将不同可逆终止核苷酸的混合物添加到流动池中后,DNA聚合酶将修饰的核苷酸并入到正在合成的DNA链中,对链进行成像,然后将并入的核苷酸在其3′-OH基团处去保护,允许另一个核苷酸并入到循环。
更具体地,可逆终止测序中的每个循环都包含三个步骤:(i)通过突变型DNA聚合酶将互补的可逆终止核苷酸并入到连接到流动池的DNA链中,(ii)检测不同可逆终止核苷酸的四种碱基的不同荧光信号,以及(iii)通过切割终止部分和荧光标记来恢复游离的3′-OH基团。在一些实施例中,通过激光激发和成像来识别荧光染料。该循环的重复导致DNA模板的测序。
发明内容
申请人已经开发了一种改进的合成测序方法,该方法利用磁性传感器阵列和并入了可检测磁性标记的试剂。申请人发现,使用这种磁性传感器阵列和包括可检测磁性标记的试剂进行合成测序显着提高了测序通量并降低了测序成本,同时消除了测序系统中对高功率激光器和高分辨率光学器件的需求。
在本公开的一个方面是一种对排列在固体支持物上的多个靶多核苷酸进行测序的方法,该方法包括:(a)将四种不同核苷酸中的一种并入到与多个靶多核苷酸中的每一个互补的新生核酸拷贝链中,其中四种不同核苷酸中的每种包含:(i)3′-羟基保护基团,和(ii)第一反应性基团,该第一反应性基团通过可切割接头与核碱基偶联,并且其中四种不同核苷酸中的每种不同核苷酸包含不同的核碱基和不同的第一反应性基团;(b)顺序形成核苷酸-缀合物复合物的不同子集,其中形成的核苷酸-缀合物复合物的每个不同子集中的每个核苷酸-缀合物复合物仅衍生自并入到新生核酸拷贝链中的不同核苷酸之一,其中核苷酸-缀合物复合物的每个不同子集的顺序形成包括:(i)引入包含可检测标记物且仅与并入到新生核酸拷贝链中的四种不同核苷酸之一正交反应的缀合物;(ii)通过检测每个引入的缀合物的标记物来检测子集内的每个核苷酸-缀合物复合物的形成;(iii)确定子集内的每个检测到的核苷酸-缀合物复合物在固体支持物内的位置;以及(iv)任选地从子集中每个形成的可检测核苷酸-缀合物复合物中至少切割可检测标记物。
在一些实施例中,四种不同核苷酸中的每种的不同第一反应性基团独立地选自能够参与“点击化学”反应的一对反应性官能团的第一成员、一对指定结合实体的第一成员、第一寡核苷酸和一对主体/客体分子的第一成员。在一些实施例中,引入的缀合物包含第二反应性基团,其选自能够参与“点击化学”反应的反应性官能团对的第二成员、指定结合实体对的第二成员、能够与第一寡核苷酸杂交的第二寡核苷酸、以及主体/客体分子对的第二成员。在一些实施例中,第一和第二反应性基团包括能够彼此杂交的第一和第二寡核苷酸。
在一些实施例中,四种不同核苷酸中的每种的不同第一反应性基团包括不同的第一寡核苷酸。在一些实施例中,不同的第一寡核苷酸可选自SEQ ID NO:1-58中的任何一个。在一些实施例中,每个不同的第一寡核苷酸包括第一LNA修饰的寡核苷酸。在一些实施例中,第一LNA修饰的寡核苷酸包括选自SEQ ID NO:1-22和29-50中任一个的序列。
在一些实施例中,引入的缀合物的第二反应性基团包括能够与第一寡核苷酸杂交的第二寡核苷酸。在一些实施例中,能够与第一寡核苷酸杂交的第二寡核苷酸选自SEQ IDNO:1-58中的任一个。在一些实施例中,能够与第一寡核苷酸杂交的第二寡核苷酸包括第二LNA修饰的寡核苷酸。在一些实施例中,第二LNA修饰的寡核苷酸包括3至12个聚体。在一些实施例中,第二LNA修饰的寡核苷酸包括5至10个聚体。在一些实施例中,第二LNA修饰的寡核苷酸包括选自SEQ ID NO:1-22和29-50中任一个的序列。在一些实施例中,能够与第一寡核苷酸杂交的第二寡核苷酸包括L-构型寡核苷酸。在一些实施例中,能够与第一寡核苷酸杂交的第二寡核苷酸包括β-L-LNA寡核苷酸。
在一些实施例中,可切割接头包括至少一个选自由二硫键基团、α-叠氮醚、基于硝基苄基的基团和苯甲酰基组成的组的可切割基团。在一些实施例中,将不同核苷酸并入到与存在于固体支持物上的多个靶多核苷酸中的每一个互补的新生核酸拷贝链中包括将四种不同核苷酸的混合物引入该固体支持物。在一些实施例中,核苷酸-缀合物复合物的不同子集的顺序形成进行三次,使得可检测的核苷酸-缀合物复合物的三个不同子集被形成和检测。
在一些实施例中,该方法进一步包括从并入到与多个靶多核苷酸中的每一个互补的新生核酸拷贝链的不同核苷酸中去除每一个3’-羟基保护基。在一些实施例中,3′-羟基保护基包括叠氮甲基。在一些实施例中,该方法进一步包括将四种不同核苷酸的混合物引入固体支持物以延伸与该固体支持物上的多个靶多核苷酸中的每一个互补的新生核酸链中的每一个。
在一些实施例中,四种不同的核苷酸具有式(IC)、(ID)、(IE)和(IF)中任一个的结构:
Figure BDA0003698524750000031
其中
WA是腺嘌呤核碱基,WG是鸟嘌呤核碱基;WC是胞嘧啶核碱基;WR是胸腺嘧啶核碱基或尿嘧啶核碱基中的一者;
Z1A、Z1B、Z1C和Z1D各自是不同的第一反应性基团;
Y是-O-P(O)(OH)[-O-P(O)(OH)]z-OH,其中z的范围是从2至约5;
PG是保护基团;并且
每个L1独立地是具有介于1个与约60个之间的碳原子并且任选地被一个或多个杂原子取代的直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分,前提条件是L1包括一个或多个可切割基团。
在一些实施例中,p为2。
在一些实施例中,每个引入的缀合物的可检测标记物包括磁性纳米粒子。在一些实施例中,磁性纳米粒子包括选自由FeO、Fe3O4、FePt、FePd和CoPt组成的组的材料。在一些实施例中,使用磁性传感器阵列检测磁性纳米粒子。
在一些实施例中,引入的缀合物具有式(IIA)和(IIB)中任一者的结构:
Figure BDA0003698524750000041
其中
D是可检测标记物或包括可检测标记物的缀合物;
L2为直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分,具有1至约60个碳原子,并且任选地包括一个或多个杂原子;
Z2是第二反应性基团;并且
P的范围是从2至约1000。
在一些实施例中,L2包括可切割基团。在一些实施例中,L2包括衍生自生物素的部分。
在一些实施例中,该方法进一步包括在核苷酸-缀合物复合物的不同子集的顺序形成之前去除未并入的核苷酸。
本公开的另一个方面是确定排列在固体支持物上的多个靶多核苷酸的序列的方法,该方法包括:(a)将四种不同核苷酸中的一种并入到与多个靶多核苷酸中的每一个互补的新生核酸链中,其中四种不同核苷酸中的每种包含通过可切割接头与核碱基偶联的第一反应性基团和3′-羟基保护基团,并且其中四种不同核苷酸中的每种不同核苷酸包含不同的核碱基和不同的第一反应性基团;(b)顺序地标记并入到新生核酸链中的四种不同核苷酸中的每一种,其中顺序标记包括:(i)引入包含可检测标记物并且仅与并入到新生核酸链中的四种不同核苷酸中的一种正交反应以提供一种或多种标记核苷酸的缀合物;(ii)检测一种或多种标记核苷酸的标记物;(iii)基于检测到的标记物,识别一种或多种标记核苷酸在固体支持物内的位置;和(iv)任选地从并入到新生核酸链中的一个或多个经标记的核苷酸切割至少一个可检测标记物。
在一些实施例中,四种不同核苷酸中的每种的不同第一反应性基团独立地选自由能够参与“点击化学”反应的一对反应性官能团的第一成员、一对指定结合实体的第一成员、第一寡核苷酸和一对主体/客体分子的第一成员组成的组。在一些实施例中,四种不同核苷酸中的每种的不同第一反应性基团包括不同的第一寡核苷酸。在一些实施例中,每个引入的缀合物包含与第一寡核苷酸之一互补的第二寡核苷酸。在一些实施例中,与第一寡核苷酸之一互补的第二寡核苷酸包括L-构型寡核苷酸。在一些实施例中,与第一寡核苷酸之一互补的第二寡核苷酸包括β-L-LNA寡核苷酸。在一些实施例中,与第一寡核苷酸之一互补的第二寡核苷酸包括一个或多个LNA单体。在一些实施例中,第二寡核苷酸具有选自由SEQ ID NO:1-22和29-50中的任一个组成的组的序列。在一些实施例中,与第一寡核苷酸之一互补的第二寡核苷酸包括一个或多个PNA单体。
在一些实施例中,可切割接头包括至少一个选自由二硫键基团、α-叠氮醚、基于硝基苄基的基团和苯甲酰基组成的组的可切割基团。在一些实施例中,将不同核苷酸并入到与存在于固体支持物上的多个靶多核苷酸中的每一个互补的新生核酸链中包括将四种不同核苷酸的混合物引入该固体支持物。
在一些实施例中,顺序标记被执行三次。在一些实施例中,顺序标记被执行四次。在一些实施例中,该方法进一步包括从并入到与多个靶多核苷酸中的每一个互补的新生核酸链的不同核苷酸中去除每一个3’-羟基保护基。在一些实施例中,3′-羟基保护基包括叠氮甲基。
在一些实施例中,该方法进一步包括将四种不同核苷酸的混合物引入固体支持物以延伸与该固体支持物上的多个靶多核苷酸中的每一个互补的新生核酸链中的每一个。在一些实施例中,该方法进一步包括在核苷酸-缀合物复合物的不同子集的顺序形成之前去除未并入的核苷酸。在一些实施例中,该方法还包括去除每个顺序标记之间的任何未反应的缀合物。
本公开的另一个方面是一种具有由式(IA)定义的结构的化合物或其盐:
Figure BDA0003698524750000061
其中
Y是-O-P(O)(OH)[-O-P(O)(OH)]z-OH或-O-P(O)(OH)-寡核苷酸,其中z是范围从2至约5;
PG是保护基团;
W是核碱基;
L1是直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分,具有1至约60个碳原子并且任选地包括一个或多个杂原子,条件是L1包括一个或多个可切割基团;并且
Z1是寡核苷酸。
在一些实施例中,p为2。
在一些实施例中,Z1包括LNA修饰的寡核苷酸。在一些实施例中,Z1包括PNA修饰的寡核苷酸。在一些实施例中,Z1包括L-构型单体,例如至少一种L-构型单体。在一些实施例中,L-构型单体是L-构型LNA单体。在一些实施例中,L-构型LNA单体是β-L-LNA单体。在一些实施例中,寡核苷酸包括4-12个聚体。在一些实施例中,寡核苷酸包括5-10个聚体。在一些实施例中,寡核苷酸包括选自SEQ ID NO:1-22或29-50中任一个的序列。在一些实施例中,该至少一个可切割基团选自由以下项组成的组:可化学切割基团、可酶促切割基团和可光切割基团。
本公开的另一个方面是一种核苷酸,其包括(i)3′-羟基保护基,和(ii)通过可切割接头与核碱基偶联的反应性基团,其中该反应性基团包括LNA修饰的寡核苷酸或β-L-LNA修饰的寡核苷酸。在一些实施例中,LNA修饰的寡核苷酸或β-L-LNA修饰的寡核苷酸包括具有SEQ ID NO:1-22或29-50中任一个的序列。
本公开的另一个方面是一种试剂盒,该试剂盒包含一种式(IC)的核苷酸、一种式(ID)的核苷酸、一种式(IE)的核苷酸和一种式(IF)的核苷酸:
Figure BDA0003698524750000071
Figure BDA0003698524750000081
其中
Y是-O-P(O)(OH)[-O-P(O)(OH)]z-OH,其中z是范围从2至约5的整数;
PG是保护基团;
WA是腺嘌呤核碱基;
WG是鸟嘌呤核碱基;
WC是胞嘧啶核碱基;
WR是胸腺嘧啶核碱基或尿嘧啶核碱基之一;
L1是直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分,具有1至约60个碳原子并且任选地包括一个或多个杂原子,条件是L1包括一个或多个可切割基团;并且
Z1A、Z1B、Z1C和Z1D各自包含不同的第一反应性基团。
在一些实施例中,p为2。
在一些实施例中,Z1A、Z1B、Z1C、和Z1D第一反应性基团独立地选自由能够参与“点击化学”反应的一对反应性官能团的第一成员、一对指定结合实体的第一成员、第一寡核苷酸和一对主体/客体分子的第一成员组成的组。在一些实施例中,Z1A、Z1B、Z1C、和Z1D第一反应性基团各自包含不同的第一寡核苷酸。在一些实施例中,Z1A、Z1B、Z1C、和Z1D第一反应性基团各自包含不同的LNA修饰的第一寡核苷酸。在一些实施例中,Z1A、Z1B、Z1C、和Z1D第一反应性基团各自包含不同的β-L-LNA修饰的第一寡核苷酸。
在一些实施例中,试剂盒进一步包括至少三种不同的缀合物,其中该至少三种不同的缀合物中的每一种包括不同的第二反应性基团,其与Z1A、Z1B、Z1C、和Z1D中的一个正交反应。在一些实施例中,每个不同的第二反应性基团与Z1A、Z1B、Z1C、和Z1D第一反应性基团中的一个正交反应。在一些实施例中,每个不同的第二反应性基团包括不同的第二寡核苷酸。在一些实施例中,每个不同的第二寡核苷酸包括至少一个LNA单体。在一些实施例中,每个不同的第二寡核苷酸包括至少一个β-L-LNA单体。
本公开的另一个方面是核苷酸-缀合物复合物,其中该核苷酸-缀合物复合物是通过包含以下项的方法产生的:使(i)具有式(IA)结构的核苷酸:
Figure BDA0003698524750000091
其中
Y是-O-P(O)(OH)-寡核苷酸;
PG是保护基团;
W是核碱基;
L1是具有介于1个与约60个之间的碳原子并且任选地被一个或多个杂原子取代的直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分,前提条件是L1包括一个或多个可切割基团;并且
Z1是第一反应性基团;
与(ii)具有式(IIA)或(IIB)中任一项的结构的缀合物反应:
Figure BDA0003698524750000092
Figure BDA0003698524750000101
其中
D是可检测标记物或包括可检测标记物的缀合物;
L2为直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分,具有1至约60个碳原子,并且任选地包括一个或多个杂原子;
Z2是与第一反应性基团Z1正交反应的第二反应性基团;并且
p是范围为2至约1000的整数。
在一些实施例中,L2包含生物素或衍生自生物素的部分。
在一些实施例中,缀合物具有式(IIA)的结构。在一些实施例中,缀合物具有式(IIB)的结构,并且其中p的范围从2至约100。
在一些实施例中,第一反应性基团包括能够参与“点击化学”反应的一对反应性官能团的第一成员。在一些实施例中,第一反应性基团包括一对特异性结合实体的第一成员。在一些实施例中,该对特异性结合实体的第一成员是半抗原。在一些实施例中,第一反应性基团包括一对主体/客体分子的第一成员。在一些实施例中,第一反应性基团包括第一寡核苷酸。在一些实施例中,修饰的寡核苷酸是LNA修饰的第一寡核苷酸。在一些实施例中,LNA修饰的第一寡核苷酸包括至少一个L-构型LNA单体。在一些实施例中,LNA修饰的第一寡核苷酸包括具有SEQ ID NO:1-22或29-50中任一个的序列。
在一些实施例中,第二反应性基团包括与第一寡核苷酸互补的第二寡核苷酸。在一些实施例中,第二寡核苷酸是LNA修饰的第二寡核苷酸或β-L-LNA修饰的第二寡核苷酸。在一些实施例中,LNA修饰的第二寡核苷酸包括具有SEQ ID NO:1-22或29-50中任一个的序列。
在一个实施例中,可检测标记物包括荧光分子。在一些实施例中,可检测标记物包括磁性纳米粒子。在一些实施例中,磁性纳米粒子包括铁磁材料。在一些实施例中,磁性纳米粒子包括选自由FeO、Fe3O4、FePt、FePd和CoPt组成的组的材料。
本公开的另一个方面是一种固体支持物,其包含与其间接偶联的多个新生核酸拷贝链,其中该多个新生核酸拷贝链各自包括具有式(IA)的并入的核苷酸:
Figure BDA0003698524750000111
其中
Y是-O-P(O)(OH)-O-寡核苷酸,其中
PG是保护基团;
W是核碱基;
L1是直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分,具有1至约60个碳原子并且任选地包括一个或多个杂原子,条件是L1包括一个或多个可切割基团;并且
Z1是第一寡核苷酸。
在一些实施例中,修饰的寡核苷酸是LNA修饰的第一寡核苷酸。在一些实施例中,LNA修饰的第一寡核苷酸包括至少一个L-构型LNA单体。在一些实施例中,LNA修饰的第一寡核苷酸包括3个聚体至12个聚体。在一些实施例中,LNA修饰的第一寡核苷酸包括具有SEQID NO:1-22或29-50中任一个的序列。
附图说明
有关对本公开特征的一般理解,请参考附图。在附图中,整个附图使用相同的附图标记来识别相同的元素。
图1A提供了一个流程图,其阐述了根据本公开的一个实施例的测序方法。
图1B提供了一个流程图,其说明了根据本公开的一个实施例的顺序形成核苷酸-缀合物复合物的不同子集的方法。
图2A提供了一个流程图,其阐述了根据本公开的一个实施例的测序方法。
图2B提供了一个流程图,其说明了根据本公开的一个实施例的顺序标记并入到核酸链中的核苷酸的方法。
图3提供了一个流程图,其描绘了根据本公开的一个实施例的测序方法。
图4A说明了将本公开的四种不同核苷酸并入到四种不同核酸链中,并且根据本公开的一个实施例然后顺序标记四种不同的并入的核苷酸中的每一种的方法。
图4B描绘了根据本公开的一个实施例,其中顺序检测核苷酸-缀合物复合物的顺序形成的子集的方法。
具体实施方式
还应该理解的是,除非指明是相反情况,否则在本文所要求保护的包括一个以上步骤或动作的任何方法中,所述方法的所述步骤或动作的顺序不必限于表述所述方法的所述步骤或动作的所述顺序。
如本文所用,除非上下文另有明确指示,否则单数形式“一(a/an)”和“该/所述”包括复数个指代物。同样,除非上下文另有明确指示,否则词语“或”旨在包括“和”。术语“包括”定义为包容性,如“包括A或B”是指包括A、B或A和B。
如本文在说明书和权利要求书中所用,“或”应理解为与上文定义的“和/或”具有相同的含义。例如,在分隔列表中的项目时,“或”或“和/或”应解释为具有包容性,即包含若干元素或元素列表中的至少一个元素,但也包含一个以上元素,以及任选地包含额外的未列出的项目。只有指明与之相反的术语,如“只有一个”或“恰好一个”,或者在权利要求中使用的“由...组成”,将指包含若干元素或元素列表中的恰好一个元素。一般来说,本文使用的术语“或者”只有在前面有“或”、“其中之一”、“只有一个”或“恰好一个”等排他性术语时,才应解释为表示排他性的替代选择(即“一个或另一个,但不是两个”)。在权利要求书中使用的“基本上由...组成”应具有在专利法领域使用的普通含义。
如本文所用,“包括”、“包含”、“具有”等术语可互换使用,且含义相同。类似地,“包括”、“包含”、“具有”等可互换使用并且具有相同的含义。具体而言,每个术语的定义都与普通美国专利法对“包括”的定义一致,因此每个术语都可理解为一个开放性术语,其含义为“至少以下”,并且也可理释为不排除额外的特征、限制、方面等。因此,例如“具有组件a、b和c的装置”是指所述装置至少包括组件a、b和c。同样,短语:“涉及步骤a、b和c的方法”是指所述方法至少包括步骤a、b和c。此外,尽管本文可以特定的顺序概述步骤和过程,但是本领域技术人员将认识到,所述顺序步骤和过程可能会有所不同。
如本文在说明书和权利要求书中所用,就一个或多个元素的列表而言,短语“至少一个”应理解为选自元素列表中任何一个或多个元素的至少一个元素,但不一定包括元素列表中具体列出的每个元素中的至少一个,也不排除元素列表中的任何元素组合。除了在短语“至少一个”所涉及的元素列表中具体确定的元素之外,该定义还允许其他元素任选地存在,无论这些元素与具体确定的元素相关与否。因此,作为一个非限制性实例,“A和B中的至少一个”(或者等效地,“A或B中的至少一个”,或者等效地,“A和/或B中的至少一个”)在一个实施例中可以指至少一个任选地包括一个以上的A,但没有B(以及任选地包括B以外的元素);在另一个实施例中,指至少一个任选地包括一个以上的B,但没有A(以及任选地包括A以外的元素);在又一个实施例中,指至少一个任选地包括一个以上的A,以及至少一个任选地包括一个以上的B(以及任选地包括其他元素)等。
贯穿本说明书的对“一个实施例”、“一种实施例”等的引用,意指结合该实施例描述的特定特征、结构或特性包括在至少一个实施例中。因此,在本说明书中的不同位置出现的短语“在一个实施例中”或“在一种实施例中”不一定都是指同一个实施例。此外,具体特征、结构或特性可在一个或多个实施例中以任何合适的方式组合。
如本文所用,术语“类似物”或“衍生物”根据其在化学与生物学领域的一般含义使用,是指在结构上与另一种化合物(即所谓的“参比”化合物)相似但组成有所不同(例如,一个原子被不同元素的原子替代,或存在特定的官能团,或一种官能团被另一官能团替代,或与参比化合物的一个或多个手性中心的绝对立体化学结构不同)的化合物。因此,类似物是功能和外观与参比化合物相似或相当但结构或来源不同的化合物。
如本文所用,术语“脂肪族的”是指直链或支链的烃链,其可以是饱和的或单不饱和或多不饱和的。不饱和脂肪族基团包含一个或多个双键和/或三键。烃链的分支可以包括直链以及非芳族环状元素。除非另有说明,否则烃链可以具有任何长度,并且可以包含任何数目的支链。主链和支链都可以进一步包含杂原子,例如B、N、O、P、S、Se或Si。
如本文所用,术语“烷基”包括饱和脂肪族基团,包括直链烷基基团(例如甲基、乙基、丙基、丁基、戊基、己基、庚基、辛基、壬基、癸基等)、支链烷基基团(异丙基、叔丁基、异丁基等)、环烷基(脂环)基团(环丙基、环戊基、环己基、环庚基、环辛基)、烷基取代的环烷基基团和环烷基取代的烷基基团。术语烷基进一步包括烷基基团,其可以进一步包括置换烃主链的一个或多个碳的氧、氮、硫或磷原子。在某些实施例中,直链或支链烷基在其主链中具有30个或更少的碳原子(例如,对于直链,C1-C30,对于支链,C1-C30)。此外,术语烷基包括“未取代的烷基”和“取代的烷基”两者,后者是指在烃骨架的一个或多个碳上具有置换氢的取代基的烷基部分。此类取代基可以包括例如烯基、炔基、卤素、羟基、烷基羰基氧基、芳基羰基氧基、烷氧基羰基氧基、芳氧基羰基氧基、羧基、烷基羰基、芳基羰基、烷氧基羰基、氨基羰基、烷基氨基羰基、二烷基氨基羰基、烷硫基羰基、烷氧基、磷酸基、膦酸酯基、膦基、氰基、氨基(包括烷基氨基、二烷基氨基、芳基氨基、二芳基氨基和烷基芳基氨基)、酰基氨基(包括烷基羰基氨基、芳基羰基氨基、氨基甲酰基和脲基)、脒基、亚氨基、巯基、烷硫基、芳硫基、硫代羧基、硫酸基、烷基亚磺酰基、磺酸基、氨磺酰基、磺酰氨基、硝基、三氟甲基、氰基、叠氮基、杂环基、烷基芳基或芳香族部分或杂芳香族部分。“烷基芳基”或“芳基烷基”部分是被芳基取代的烷基(例如苯甲基(苄基))。术语“烷基”还包括天然和非天然氨基酸的侧链。
如本文所用,术语“烯基”包括不饱和脂肪族基团,其长度和可能的取代与上述烷基相似,但是含有至少一个双键。例如,术语“烯基”包括直链烯基基团(例如,乙烯基、丙烯基、丁烯基、戊烯基、己烯基、庚烯基、辛烯基、壬烯基、癸烯基等)、支链烯基基团、环烯基(脂环)基团(环丙烯基、环戊烯基、环己烯基、环庚烯基、环辛烯基)、烷基或烯基取代的环烯基基团,以及环烷基或环烯基取代的烯基基团。术语烯基进一步包括烯基基团,其包括置换烃主链的一个或多个碳的氧、氮、硫或磷原子。在某些实施例中,直链或支链烯基基团在其主链中具有30个或更少的碳原子(例如,对于直链,C2-C30,对于支链,C3-C30)。此外,术语烯基包括“未取代的烯基”和“取代的烯基”两者,后者是指在烃骨架的一个或多个碳上具有置换氢的取代基的烯基部分。此类取代基可以包括例如烷基基团、烯基基团、炔基基团、卤素、羟基、烷基羰基氧基、芳基羰基氧基、烷氧基羰基氧基、芳氧基羰基氧基、羧基、烷基羰基、芳基羰基、烷氧基羰基、氨基羰基、烷基氨基羰基、二烷基氨基羰基、烷硫基羰基、烷氧基、磷酸基、膦酸酯基、膦基、氰基、氨基(包括烷基氨基、二烷基氨基、芳基氨基、二芳基氨基和烷基芳基氨基)、酰基氨基(包括烷基羰基氨基、芳基羰基氨基、氨基甲酰基和脲基)、脒基、亚氨基、巯基、烷硫基、芳硫基、硫代羧基、硫酸基、烷基亚磺酰基、磺酸基、氨磺酰基、磺酰氨基、硝基、三氟甲基、氰基、叠氮基、杂环基、烷基芳基或芳香族部分或杂芳香族部分。烯基基团的其他实例包括但不限于乙烯基、1-丙烯基、2-丙烯基、1-甲基-乙烯基、1-丁烯基、2-丁烯基、3-丁烯基、1-甲基-1-丙烯基、2-甲基-1-丙烯基、1-甲基-2-丙烯基、2-甲基-2-丙烯基;1-戊烯基、2-戊烯基、3-戊烯基、4-戊烯基、1-甲基-l-丁烯基、2-甲基-1-丁烯基、3-甲基-1-丁烯基、1-甲基-2-丁烯基、2-甲基-2-丁烯基、3-甲基-2-丁烯基、1-甲基-3-丁烯基、2-甲基-3-丁烯基、3-甲基-3-丁烯基、1,1-二甲基-2-丙烯基、1,2-二甲基-1-丙烯基、1,2-二甲基-2-丙烯基、1-乙基-1-丙烯基、1-乙基-2-丙烯基、1-己烯基、2-己烯基、3-己烯基、4-己烯基、5-己烯基、1-甲基-l-戊烯基、2-甲基-l-戊烯基、3-甲基-l-戊烯基、4-甲基-1-戊烯基、1-甲基-2-戊烯基、2-甲基-2-戊烯基、3-甲基-2-戊烯基、4-甲基-2-戊烯基、1-甲基-3-戊烯基、2-甲基-3-戊烯基、3-甲基-3-戊烯基、4-甲基-3-戊烯基、1-甲基-4-戊烯基、2-甲基-4-戊烯基、3-甲基-4-戊烯基、4-甲基-4-戊烯基、1,1-二甲基-2-丁烯基、1,1-二甲基-3-丁烯基、1,2-二甲基-1-丁烯基、1,2-二甲基-2-丁烯基、1,2-二甲基-3-丁烯基、1,3-二甲基-l-丁烯基、1,3-二甲基-2-丁烯基、1,3-二甲基-3-丁烯基、2,2-二甲基-3-丁烯基、2,3-二甲基-1-丁烯基、2,3-二甲基-2-丁烯基、2,3-二甲基-3-丁烯基、3,3-二甲基-l-丁烯基、3,3-二甲基-2-丁烯基、1-乙基-l-丁烯基、1-乙基-2-丁烯基、1-乙基-3-丁烯基、2-乙基-1-丁烯基、2-乙基-2-丁烯基、2-乙基-3-丁烯基、1,1,2-三甲基-2-丙烯基、1-乙基-1-甲基-2-丙烯基、1-乙基-2-甲基-1-丙烯基和1-乙基-2-甲基-2-丙烯基基团。含有多个双键的基团可以包括但不限于丁-1,3-二烯基、戊-1,3-二烯基或戊-1,4-二烯基。
如本文所用,术语“炔基”包括不饱和脂肪族基团,其长度和可能的取代与上述烷基相似,但是含有至少一个三键。例如,术语“炔基”包括直链炔基基团(例如乙炔基、丙炔基、丁炔基、戊炔基、己炔基、庚炔基、辛炔基、壬炔基、癸炔基等)、支链炔基基团和环烷基或环烯基取代的炔基。术语炔基进一步包括炔基基团,其包括置换烃主链的一个或多个碳的氧、氮、硫或磷原子。在某些实施例中,直链或支链炔基基团在其主链中具有30个或更少的碳原子(例如,对于直链,C2-C30,对于支链,C3-C30)。此外,术语炔基包括“未取代的炔基”和“取代的炔基”两者,后者是指在烃骨架的一个或多个碳上具有置换氢的取代基的炔基部分。此类取代基可以包括例如烷基基团、烯基基团、炔基基团、卤素、羟基、烷基羰基氧基、芳基羰基氧基、烷氧基羰基氧基、芳氧基羰基氧基、羧基、烷基羰基、芳基羰基、烷氧基羰基、氨基羰基、烷基氨基羰基、二烷基氨基羰基、烷硫基羰基、烷氧基、磷酸基、膦酸酯基、膦基、氰基、氨基(包括烷基氨基、二烷基氨基、芳基氨基、二芳基氨基和烷基芳基氨基)、酰基氨基(包括烷基羰基氨基、芳基羰基氨基、氨基甲酰基和脲基)、脒基、亚氨基、巯基、烷硫基、芳硫基、硫代羧基、硫酸基、烷基亚磺酰基、磺酸基、氨磺酰基、磺酰氨基、硝基、三氟甲基、氰基、叠氮基、杂环基、烷基芳基或芳香族部分或杂芳香族部分。含有多个三键的基团可以包括但不限于丁-1,3-二炔基、戊-1,3-二炔基或戊-1,4-二炔基。
如本文所用,除非另有说明,否则术语“芳香族”是指共轭双键的平面环状烃部分,其可以是单环或包括多个稠合或共价连接的环。除非另有说明,否则环状烃部分的主链可以是任意长度并且含有任意数量的杂原子,例如N、O和S。芳香族基团可以被烷基基团或杂原子例如O、S、N、P或Si取代。
如本文所用,除非另有说明,否则术语“杂烷基”本身或与另一术语结合使用时是指由至少一个碳原子和至少一个杂原子组成的稳定的直链或支化链,该至少一个杂原子选自由O、N、P、Si和S组成的组,并且其中氮、磷和硫原子可任选地发生氧化,并且氮杂原子可任选地发生季铵化。杂原子O、N、P、S和Si可位于杂烷基基团的任何内部位置,或位于烷基基团与分子其余部分相连的位置。杂烷基是未环化的。实例包括但不限于:-CH2-CH2-O-CH3、-CH2-CH2-NH-CH3、-CH2-CH2-N(CH3)-CH3、-CH2-S-CH2-CH3、-CH2-O-CH3、-S(O)-CH3、-CH2-CH2-S(O)2-CH3、-CH=CH-O-CH3、-Si(CH3)3、-CH2-CH=N-OCH3、-CH=CH-N(CH3)-CH3、-O-CH3、-O-CH2-CH3和-CN。至多两个杂原子可以是连续的,例如-CH2-NH-OCH3
如本文所用,除非另有说明,否则术语“环烷基”和“杂环烷基”本身或与其他术语结合使用时分别表示“烷基”和“杂烷基”的环状形式。环烷基和杂环烷基是非芳族基团。环烷基和杂环烷基可以例如被本文所述的任何取代基进一步取代。
上述术语(例如,“烷基”、“芳香族”、“杂烷基”、“环烷基”等)中的每一个均包括所示自由基的取代和未取代形式。就这一点而言,每当基团或部分被描述为“取代的”或“任选取代的”(或“任选地具有”或“任选地包含”)时,该基团可以未取代的或被一个或多个所示取代基取代。同样,当一个基团被描述为“取代的或未取代的”,如果被取代时,取代基可以选自一个或多个所示取代基。如果没有指示取代基,则是指所指示的“任选取代的”或“取代的”基团可以被一个或多个基团单独地并且独立地选自由以下项组成的组的基团取代:烷基、烯基、炔基、环烷基、环烯基、环炔基、芳基、杂芳基、杂脂环基、芳烷基、杂芳烷基、(杂脂环基)烷基、羟基、保护的羟基、烷氧基、芳氧基、酰基、巯基、烷硫基、芳硫基、氰基、氰酸酯、卤素、硫代羰基、O-氨基甲酰基、N-氨基甲酰基、O-硫代氨基甲酰基、N-硫代氨基甲酰基、C-酰胺基、N-酰胺基、S-磺酰胺基、N-磺酰胺基、C-羧基、保护的C-羧基、O-羧基、异氰硫基、氰硫基、异硫氰硫基、硝基、甲硅烷基、硫基、亚磺酰基、磺酰基、卤代烷基、卤代烷氧基、三卤代甲磺酰基、三卤代甲磺酰胺基、醚、氨基(例如单取代的氨基或二取代的氨基)及其保护的衍生物。上述任何基团可包括一个或多个杂原子,包括O、N或S。例如,当部分被烷基取代时,该烷基可包含选自O、N或S的杂原子(例如-(CH2-CH2-O-CH2-CH3))。
如本文所用,术语“抗体”是指免疫球蛋白或免疫球蛋白样分子,包括但不限于IgA、IgD、IgE、IgG和IgM、其组合,以及在任何脊椎动物(例如,在哺乳动物,例如人类、山羊、兔和小鼠)的免疫应答期间产生的类似分子和抗体片段(例如,本领域已知的F(ab′)2片段,Fab′片段、Fab′-SH片段和Fab片段、重组抗体片段(例如sFv片段、dsFv片段、双特异性sFv片段、双特异性dsFv片段、F(ab)′2片段、单链Fv蛋白(“scFv”)、二硫键稳定的Fv蛋白(“dsFv”)、糖尿病和三联体(本领域已知),和骆驼科动物抗体),它们特异性结合感兴趣的分子(或一组高度相似的感兴趣的分子),从而实质性地排除了与其他分子的结合。“抗体”进一步是指至少包含轻链或重链免疫球蛋白可变区的多肽配体,其特异性识别并结合抗原的表位。抗体可由重链和轻链组成,每条重链和轻链均具有可变区,称为可变重链(VH)区和可变轻链(VL)区。VH区和VL区共同负责结合由抗体识别的抗原。术语“抗体”还包括本领域中熟知的完整免疫球蛋白及其变体和部分。
如本文所用,术语“偶联”是指一个分子或原子与另一分子或原子的结合、键合(例如共价键合)或连接。
如本文所用,术语“互补”是指在适当的温度和离子缓冲条件下,在两个核苷酸的碱基之间形成有利的热力学稳定性和特异性配对的能力。互补性是通过核碱基腺嘌呤、胸腺嘧啶(RNA中的尿嘧啶)、鸟嘌呤和胞嘧啶之间的不同相互作用实现的,其中腺嘌呤与胸腺嘧啶或尿嘧啶配对,鸟嘌呤与胞嘧啶配对。
如本文所用,术语“杂原子”是指包括硼(B)、氧(O)、氮(N)、硫(S)、磷(P)和硅(Si)。在一些实施例中,“杂环”可包含一个或多个杂原子。在其他实施例中,脂肪族基团可以包含一个或多个杂原子或被一个或多个杂原子取代。
如本文所用,术语“杂交”是指不同核酸分子之间与其核苷酸序列一致的碱基配对。
如本文所用,术语“标记”是指可检测部分,其可以是原子或分子,或原子或分子的集合。标记可以提供可以被检测到的光学、电化学、磁性或静电(例如,感应、电容)标记。
如本文所用,核酸可包含一个或多个亚基(天然存在的、合成的或修饰的核碱基),包括但不限于腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)和尿嘧啶(U)。这些碱基的衍生物在PCR系统、试剂和消耗品(Perkin Elmer Catalogue 1996-1997,罗氏分子系统有限公司,美国新泽西州布兰斯堡)中举例说明,其通过引用整体并入本文。在一些示例中,核酸是脱氧核糖核酸(DNA)或核糖核酸(RNA),或其衍生物。核酸可以是单链的或双链的。核酸可以包括任何核酸分子,包括但不限于DNA、RNA以及它们的杂合物或变体。
如本文所用,术语“核酸模板”是指能够用作聚合酶催化复制的指导的核酸或其部分。核酸分子可以包括沿其长度的多个模板,或者,可替代地,在本文的特定实施例中可以仅使用单个模板。核酸模板也可以作为连接酶催化的引物延伸的指导。
如本文所用,术语“核碱基”是指能够与另一核碱基非共价配对的杂环部分。术语“核碱基”涵盖“未修饰的核碱基”和“修饰的核碱基”。“天然存在的核碱基”或“未修饰的核碱基”(可互换使用)是指相对于其天然存在的形式未修饰的核碱基。同样,“修饰的核碱基”是指与天然核碱基的任何取代和/或改变。核碱基(或碱基)修饰或取代在结构上与天然存在的或合成的未修饰核碱基可区分,但在功能上可互换。天然和修饰的核碱基均能够参与氢键。这样的核碱基修饰可以赋予寡核苷酸核酸酶稳定性、结合亲和力或一些其他有益的生物学特性。修饰的核碱基包括合成的和天然的核碱基,例如5-甲基胞嘧啶(5-me-C)。某些核碱基取代,包括5-甲基胞嘧啶取代,对于增加互补寡核苷酸对靶核酸的结合亲和力特别有用。例如,已显示5-甲基胞嘧啶取代可将核酸双链体稳定性提高约0.6至约1.2℃。(参见Sanghvi,Y.S.,Crooke,S.T.and Lebleu,B.,eds.,Antisense Research andApplications,CRC Press,Boca Raton,1993,pp.276-278,该文献的公开内容据此全文以引用方式并入本文)。
其他修饰的核碱基包括但不限于5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、7-甲基鸟嘌呤、2-氨基腺嘌呤、2-氨基嘌呤、异-C、异-G、硫代T、硫代G、5,6-二氢尿嘧啶、6-甲基腺嘌呤、2-丙基鸟嘌呤和腺嘌呤和鸟嘌呤的其他烷基衍生物、2-硫尿嘧啶、2-硫代胸腺嘧啶和2-硫胞嘧啶、5-卤尿嘧啶和胞嘧啶例如5-溴、5-三氟甲基等5-取代的尿嘧啶和胞嘧啶,5-丙炔基(-C≡C-CH3)尿嘧啶和胞嘧啶和嘧啶碱基的其他炔基衍生物、6-氮杂尿嘧啶、胞嘧啶和胸腺嘧啶、尿嘧啶-5-基(假尿嘧啶)、4-硫尿嘧啶、8-卤代、8-氨基、8-硫醇、8-硫代烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤、7-甲基鸟嘌呤和7-甲基腺嘌呤、2-F-腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-脱氮鸟嘌呤和7-脱氮杂腺嘌呤和3-脱氮鸟嘌呤和3-脱氮腺嘌呤,8-氮杂-7-脱氮鸟嘌呤和8-氮杂-7-脱氮腺嘌呤。以下文献中公开了另外的核碱基:Greco等人,Synthesis and site-specific incorporation of a simple fluorescentpyrimidine,Nature Protocols,第2卷,第2期,2007;Dien等人,Progress Toward a Semi-Synthetic Organism with an Unrestricted Expanded Genetic Alphabet,J.Am.Chem.Soc.2018,140,16115-16123;Zhang等人,Evolution of Functional Six-Nucleotide DNA,J.Am.Chem.Soc.2015,137,6734-6737;Biondi等人,ArtificiallyExpanded Genetic Information Systems for New Aptamer Technologies,Biomedicines 2018,6,53;Liu et.等人,Helix-Forming Properties of Size-ExpandedDNA,an Alternative Four-Base Genetic Form,J.Am.Chem.Soc.9 Vol.127,No.5,2005,1396-1402;Tor等人,Designing new isomorphic fluorescent nucleobase analogues:the thieno[3,2-d]pyrimidine core,Tetrahedron 63(2007)3608-3614;Laos等人,Directed Evolution of Polymerases to Accept Nucleotides with NonstandardHydrogen Bond Patterns,Biochemistry 2013,52,5288-5294;Krueger等人,Synthesisand Properties of Size-expanded DNAs:Toward Designed,Functional GeneticSystems,Acc Chem Res.2007年2月;40(2):141-150;Srivatsan等人,A highlyfluorescent nucleoside analog based on thieno[3,4-d]pyrimidine sensesmismatched pairing,Org.Biomol.Chem.,2008,6,1334-1338;Kim等人,Synthesis andProperties of 5-Cyano-Substituted Nucleoside Analog with a Donor-Donor-Acceptor Hydrogen-Bonding Pattern,J.Org.Chem.2012,77,3664-3669;以及Noe等人,Oligodeoxynucleotides Containing Multiple Thiophene-Modified IsomorphicFluorescent Nucleosides,J.Org.Chem.2013,78,8123-8128,其公开内容通过引用整体并入本文。
如本文所用,术语“核苷”是指共价连接糖,例如核糖或2′-脱氧核糖的核碱基。
如本文所用,术语“核苷酸”是指共价连接磷酸或多磷酸的核苷,例如腺苷5′-单磷酸(AMP)、腺苷5′-二磷酸(ADP)、腺苷5′-三磷酸(ATP)、腺苷5′-四磷酸或其2′-脱氧衍生物。
如本文所用,术语“寡核苷酸”是指核苷酸或核苷单体单元的寡聚物,其中该寡聚物任选地包括非核苷酸单体单元和/或在该寡聚物的内部和/或外部位置连接的其他化学基团。寡聚物可以是天然的或合成的,并且可以包括天然存在的寡核苷酸,或包括具有非天然存在(或修饰的)碱基、糖部分、磷酸二酯-类似物键和/或替代性单体单元手性和异构结构的核苷的寡聚物(例如5′-键至2′-键,L-核苷,α-异头物核苷、β-异构体核苷、锁核酸(LNA)、肽核酸(PNA))。
如本文所用,术语“聚合酶”是指能够催化聚合反应的任何酶。聚合酶的实例包括但不限于核酸聚合酶、转录酶或连接酶。聚合酶(polymerase)可以是聚合酶(polymerization enzyme)。“DNA聚合酶”催化脱氧核苷酸的聚合。“RNA聚合酶”催化核糖核苷酸的聚合。聚合物可以包括逆转录酶,一种用于从RNA模板生成互补DNA(cDNA)的酶。
如本文所用,“多核苷酸”是包含至少两个核苷酸的聚合物或低聚物。多核苷酸或寡核苷酸可包含DNA多核苷酸或寡核苷酸、RNA多核苷酸或寡核苷酸,或DNA多核苷酸或寡核苷酸和/或RNA多核苷酸或寡核苷酸的一个或多个部分。
如本文所用,术语“反应性基团”或“反应性官能团”是指能够与不同部分的官能团化学缔合、相互作用、杂交、氢键合或偶联的官能团。在一些实施例中,两个反应性基团或两个反应性官能团之间的“反应”可表示在两个反应性基团或两个反应性官能团之间形成共价键;或者可以表示两个反应性基团或两个反应性官能团彼此缔合、彼此相互作用、彼此杂交、彼此氢键合等。因此,在一些实施例中,“反应”包括结合事件,例如半抗原与抗半抗原抗体或与超分子宿主分子缔合的客体分子的结合。
如本文所用,术语“序列”在用于指核酸时是指核酸中核苷酸(或碱基)的顺序。在核酸中存在不同种类的核苷酸的情况下,序列包括在核酸中各个位置处的核苷酸的种类(或碱基)的鉴定。序列是全部或部分核酸分子的特性。该术语可以类似地用于描述其他聚合物中单体单元(例如蛋白质聚合物的氨基酸单体单元)的顺序和位置同一性。
如本文所用,术语“测序”是指确定核酸中碱基的顺序和位置。
如本文所用,术语“模板核酸”、“靶多核苷酸分子”和“靶核酸”可以互换使用,是指作为扩增反应对象的核酸分子,该扩增反应可以任选地通过测序反应进行质询以获取其序列信息。模板核酸可以是已经通过克隆扩增方法产生并且可以固定在固体支持物上,即固定在珠粒或阵列上的核酸。
本文提供的标题仅是为了方便,并不用于解释本发明所公开的实施例的范围或含义。
核苷酸、核苷、寡核苷酸、多核苷酸
本公开涉及核苷酸、核苷、寡核苷酸和/或多核苷酸(或其任何盐)(包括糖(例如核糖或脱氧核糖))和核碱基。在一些实施例中,将本公开的核苷酸并入到新生核酸链中,由此并入的核苷酸可以与缀合物反应以形成如本文所述的并入的核苷酸-缀合物复合物。
在一些实施例中,根据本公开的核苷酸、核苷、寡核苷酸和/或多核苷酸(包括其任何盐)具有式(IA)定义的结构:
Figure BDA0003698524750000221
其中
Y为-OH、-O-P(O)(OH)[-O-P(O)(OH)]z-OH或-O-P(O)(OH)-寡核苷酸,其中z为0或1至5范围内的整数;
PG是保护基团;
W是核碱基;
L1是具有介于1个与约60个之间的碳原子并且任选地被一个或多个杂原子取代的直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分,前提条件是L1包括一个或多个可切割基团;并且
Z1是反应性基团。
在一些实施例中,p为2。
在一些实施例中,如果仍然可以进行Watson-Crick碱基配对,则可以将部分L1连接在核碱基(“W”)上的任何位置。在一些实施例中,并且在嘌呤碱基的情况下,所述部分L1经由7-去氮嘌呤的7位,经由8-修饰的嘌呤,经由N-6修饰的腺嘌呤或N-2修饰的鸟嘌呤连接。在一些实施例中,并且在嘧啶的情况下,所述部分L1的连接是经由胞嘧啶、胸腺嘧啶或尿嘧啶上的5位和胞嘧啶上的N-4位进行的。
如上所述,在一些实施例中,部分L1包括1至约60个碳原子。在一些实施例中,部分L1包括1至约50个碳原子。在一些实施例中,部分L1包括1至约40个碳原子。在一些实施例中,部分L1包括1至约35个碳原子。在一些实施例中,部分L1包括1至约30个碳原子。在其他实施例中,部分L1包括2至约25个碳原子。在又其他实施例中,部分L1包括约5至约20个碳原子。在又其他实施例中,部分L1包括约5至约15个碳原子。在进一步的实施例中,部分L1包括约10至约20个碳原子。
在一些实施例中,部分L1的分子量为约50g/mol至约1000g/mol。在又其他实施例中,部分L1的分子量为约40g/mol至约400g/mol。在又其他实施例中,部分L1的分子量为约50g/mol至约300g/mol。在又其他实施例中,部分L1的分子量为约50g/mol至约250g/mol。在一些实施例中,部分L1的长度为约0.5nm至约70nm。在一些实施例中,部分L1的长度为约0.5nm至约60nm。在一些实施例中,部分L1的长度为约0.5nm至约50nm。在一些实施例中,部分L1的长度为约0.5nm至约40nm。在一些实施例中,部分L1的长度为约1nm至约40nm。
在一些实施例中,部分L1是具有1至约40个碳原子并且包括一个或多个可切割基团的取代或未取代烷基基团或杂烷基基团。在一些实施例中,部分L1是具有1至约30个碳原子并且包括一个或多个可切割基团的取代或未取代烷基基团或杂烷基基团。在一些实施例中,部分L1是具有1至约20个碳原子并且包括一个或多个可切割基团的取代或未取代烷基基团或杂烷基基团。
在一些实施例中,部分L1是具有2至约40个碳原子并且包括一个或多个可切割基团的取代或未取代烯基基团或或杂烯基基团。在一些实施例中,部分L1是具有2至约30个碳原子并且包括一个或多个可切割基团的取代或未取代烯基基团或或杂烯基基团。在一些实施例中,部分L1是具有2至约20个碳原子并且包括一个或多个可切割基团的取代或未取代烯基基团或或杂烯基基团。
在一些实施例中,部分L1是具有2至约40个碳原子并且包括一个或多个可切割基团的取代或未取代炔基基团或杂炔基基团。在一些实施例中,部分L1是具有2至约30个碳原子并且包括一个或多个可切割基团的取代或未取代炔基基团或杂炔基基团。在一些实施例中,部分L1是具有2至约20个碳原子并且包括一个或多个可切割基团的取代或未取代炔基基团或杂炔基基团。
如上所述,部分L1包括一个或多个能够被切割的基团,例如可光切割基团、可酶促切割基团、可化学切割基团和在某些pH下可切割的基团。虽然部分L1包括可切割基团,但是这并不意味着整个部分L1将从其所连接的核碱基中去除。而是,部分L1内的切割位点可以位于部分L1内的任何位置,这样确保部分L1的一部分在切割后保持与核碱基的连接。在一些实施例中,可切割接头的使用确保进一步偶联至式(IA)的核苷酸或核苷的任何组分随后可以被去除。在一些实施例中,可切割基团可以通过任何合适的方法切割,包括暴露于酸、碱、亲核试剂、亲电试剂、自由基、金属、还原剂或氧化剂、光、温度、酶等。合适的可切割基团的非限制性实例包括二硫键基团、α-叠氮醚、基于硝基苄基的基团和苯甲酰基。本文进一步描述了合适的可切割基团的其他非限制性实例。可以利用的切割基团或切割基团类别的另一些实例包括美国专利号9,605,310、7,414,116和7,057,026中描述的那些,这些专利的公开内容通过引用整体并入本文。
在一些实施例中,部分L1具有一般结构-[接头]-[可切割基团]-[接头]-,其中每个[接头]可以相同或不同。在一些实施例中,每个[接头]独立地是具有介于1个与约45个之间的碳原子并且任选地被一个或多个杂原子取代的直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分。在一些实施例中,每个[接头]独立地是具有介于1个与约35个之间的碳原子并且任选地被一个或多个杂原子取代的直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分。在一些实施例中,每个[接头]独立地是具有介于1个与约25个之间的碳原子并且任选地被一个或多个杂原子取代的直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分。在一些实施例中,每个[接头]独立地是具有介于1个与约20个之间的碳原子并且任选地被一个或多个杂原子取代的直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分。在一些实施例中,每个[接头]独立地是具有介于1个与约10个之间的碳原子并且任选地被一个或多个杂原子取代的直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分。
在一些实施例中,每个[接头]独立地是具有2至约45个碳原子的取代或未取代烯基基团或杂烯基基团。在一些实施例中,每个[接头]独立地是具有2至约35个碳原子的取代或未取代烯基基团或杂烯基基团。在一些实施例中,每个[接头]独立地是具有2至约25个碳原子的取代或未取代烯基基团或杂烯基基团。在一些实施例中,每个[接头]独立地是具有2至约20个碳原子的取代或未取代烯基基团或杂烯基基团。在一些实施例中,每个[接头]独立地是具有2至约10个碳原子的取代或未取代烯基基团或杂烯基基团。在一些实施例中,-[可切割接头]-是可光切割基团、可酶促切割基团、可化学切割基团和在某些pH下可切割的基团。
在一些实施例中,每个[接头]独立地是具有2至约45个碳原子的取代或未取代炔基基团或杂炔基基团。在一些实施例中,每个[接头]独立地是具有2至约35个碳原子的取代或未取代炔基基团或杂炔基基团。在一些实施例中,每个[接头]独立地是具有2至约25个碳原子的取代或未取代炔基基团或杂炔基基团。在一些实施例中,每个[接头]独立地是具有2至约20个碳原子的取代或未取代炔基基团或杂炔基基团。在一些实施例中,每个[接头]独立地是具有2至约10个碳原子的取代或未取代炔基基团或杂炔基基团。在一些实施例中,-[可切割接头]-是可光切割基团、可酶促切割基团、可化学切割基团和在某些pH下可切割的基团。
在一些实施例中,每个[接头]独立地是具有1至约45个碳原子的取代或未取代烷基基团或杂烷基基团。在一些实施例中,每个[接头]独立地是具有1至约35个碳原子的取代或未取代烷基基团或杂烷基基团。在一些实施例中,每个[接头]独立地是具有1至约25个碳原子的取代或未取代烷基基团或杂烷基基团。在一些实施例中,每个[接头]独立地是具有1至约20个碳原子的取代或未取代烷基基团或杂烷基基团。在一些实施例中,每个[接头]独立地是具有1至约10个碳原子的取代或未取代烷基基团或杂烷基基团。在一些实施例中,-[可切割接头]-是可光切割基团、可酶促切割基团、可化学切割基团和在某些pH下可切割的基团。
在一些实施例中,反应性基团Z1是一对反应性基团的第一成员。例如,并且如本文进一步描述的,Z1可以是与第二反应性基团成员Z2正交反应的第一反应性基团成员,例如具有式(IIA)至(IIE)中任一个并且如本文所述的缀合物的反应性基团成员Z2
在一些实施例中,Z1包括能够参与点击化学反应的反应性基团。适合参与“点击化学”反应的合适的反应性官能团(例如相互是反应性的官能团对)的实例列于下表1中。一般来讲,“点击化学”促进反应以模块化方式得到广泛应用,获得高化学收率,生成无害副产物,具有化学特异性,需要简单的反应条件,使用容易获得的起始材料和试剂,不使用溶剂或使用温和的溶剂(例如水),轻松分离产物,具有高热力学驱动力以有利于反应获得单一反应产物,和/或获得高的原子经济性。尽管某些一般标准在本质上可能是主观的,但并非所有标准都需要得到满足。
“点击化学”是一种化学原理,其由Sharpless和Meldal的研究组独立地定义,描述了定制以通过将小单元连接在一起而快速可靠地生成物质的化学过程。“点击化学”已应用于一组可靠并且自主的有机反应(Kolb,H.C.;Finn,M.G.;Sharpless,K.B.Angew.Chem.Int.Ed.2001,40,2004-2021)。例如,将铜催化的叠氮化物-炔烃[3+2]环加成反应鉴定为水中高度可靠的分子连接(Rostovtsev,V.V.等人,Angew.Chem.Int.Ed.2002,41,2596-2599),其已经用于增强多种类型的生物分子相互作用的研究(Wang,Q.等人,J.Am.Chem.Soc.2003,125,3192-3193;Speers,A.E.等人,J.Am.Chem.Soc.2003,125,4686-4687;Link,A.J.;Tirrell,D.A.J.Am.Chem.Soc.2003,125,11164-11165;Deiters,A.等人,J.Am.Chem.Soc.2003,125,11782-11783)。此外,还已出现在有机合成(Lee,L.V.等人,J.Am.Chem.Soc.2003,125,9588-9589)、药物发现(Kolb,H.C.;Sharpless,K.B.Drug Disc.Today 2003,8,1128-1137;Lewis,W.G.等人,Angew.Chem.Int.Ed.2002,41,1053-1057)以及表面功能化(Meng,J.-C.等人,Angew.Chem.Int.Ed.2004,43,1255-1260;Fazio,F.等人,J.Am.Chem.Soc.2002,124,14397-14402;Collman,J.P.等人,Langmuir 2004,ASAP,in press;Lummerstorfer,T.;Hoffmann,H.J.Phys.Chem.B 2004,in press)方面的应用。
在一些实施例中,Z1包括能够进行Cu(I)-催化的叠氮化物-炔烃环加成(CuAAC)的反应性基团(参见,例如,Meldal等人,“Cu-Catalyzed Azide-Alkyne Cycloaddition,”Chem Rev.2008,108,8,2952-3015)。在一些实施例中,Z1包括能够进行无铜应变促进的叠氮化物-炔烃环加成(SPAAC)的反应性基团。在一些实施例中,Z1包括能够进行螯合辅助乙酸铜(II)加速叠氮化物-炔烃环加成(CuAAC)的反应性基团。在一些实施例中,Z1包括能够进行逆需求狄尔斯-阿尔德环加成反应(例如四嗪应变-烯烃点击化学)的反应性基团。
表1:反应性官能团对的第一和第二成员。
Figure BDA0003698524750000271
Figure BDA0003698524750000281
在一些实施例中,Z1包括能够参与结合事件的反应性基团。结合事件的实例包括但不限于寡核苷酸彼此杂交、半抗原与抗体或其变体的结合以及主体-客体分子相互作用(即主体分子和客体分子的相互作用)。
因此,在一些实施例中,Z1包括特异性结合实体。如本文所用,术语“特异性结合实体”是指特异性结合对的成员。特异性结合对是特征在于彼此结合以实质性地排除与其他分子结合的分子对(例如,特异性结合对的结合常数可以比反应混合物或样品中其他分子的结合对的两个成员中的任一者的结合常数大至少约103M-1、至少约104M-1、或至少约105M-1)。
在一些实施例中,特异性结合实体是蛋白质,例如抗体、抗体片段、凝集素、抗生物素蛋白(例如链霉抗生物素蛋白)和蛋白A。在一些实施例中,抗体是抗半抗原抗体。
在又其他实施例中,特异性结合实体是半抗原。如本文所用,“半抗原”是可与抗体特异性结合的小分子,但是除与载体分子结合外,通常基本上不能具有免疫原性。半抗原的非限制性实例包括吡唑(例如硝基吡唑);硝基苯基化合物;苯并呋喃;三萜类;脲(例如苯基脲);硫脲(例如苯基硫脲);鱼藤酮和鱼藤酮衍生物;噁唑类(例如噁唑磺胺类);和噻唑类(例如噻唑磺胺类);香豆素和香豆素衍生物;和环木脂素(例如鬼臼毒素和鬼臼毒素衍生物)。在一些实施例中,半抗原选自苯并呋喃半抗原和噻唑磺酰胺半抗原。在一些实施例中,半抗原选自5-硝基-3-吡唑碳酰胺(NP)、2-乙酰氨基-4-甲基-5-噻唑磺酰胺(TS)、7-(二乙基氨基)-2-氧代-2H-色烯-3-羧酸(DCC)、地高辛(DIG)、2,4-二硝基苯基(DNP)、荧光素、3-羟基-2-喹喔啉碳酰胺和2,1,3-苯并噁二唑-5-碳酰胺(BF)。适用于本公开的其他半抗原包括美国专利号8,846,320;8,618,265;7,695,929;8,481,270;和9,017,954中所述的那些,这些专利的公开内容通过引用整体并入本文。
在一些实施例中,Z1包括寡核苷酸。在一些实施例中,寡核苷酸的长度是约3至约30个核苷酸,即约3个聚体至约30个聚体。在又其他实施例中,寡核苷酸的长度是约3至约25个核苷酸。在又其他实施例中,寡核苷酸的长度是约3至约20个核苷酸。在又其他实施例中,寡核苷酸的长度是约3至约16个核苷酸。在又其他实施例中,寡核苷酸的长度是约3至约12个核苷酸。在又其他实施例中,寡核苷酸的长度是约3至约10个核苷酸。在又其他实施例中,寡核苷酸的长度是约4至约6个核苷酸。在进一步的实施例中,寡核苷酸的长度是5至6个核苷酸。合适的寡核苷酸序列的非限制性实例列于下表2中。
表2:寡核苷酸序列的非限制性实例。
Figure BDA0003698524750000291
Figure BDA0003698524750000301
在一些实施例中,SEQ ID NO:1-22和29-50(在表2中列举)是LNA序列。在其他实施例中,SEQ ID NO:23-28和51-56(在表2中列举)是DNA序列。
在一些实施例中,寡核苷酸包括一种或多种“镜像”的“L-构型”或“L-型”单体(例如,由L-脱氧核糖组成的单体)。据信,由L型单体组成的寡核苷酸不与天然存在的、β-D构型的核酸(例如待测序的DNA分子、测序引物等)结合。β-L-构型寡核苷酸具有与其β-D构型寡核苷酸对应物相同的物理化学特性(例如溶解度、双链体稳定性、配对选择性)。然而,L-构型寡核苷酸对核酸酶消化是稳定的并且形成左旋双链体。类型的单体公开于以下文献中:J.Am.Chem.Soc.1991,113(21),8174-8175;和Nucleic Acids Research,第20卷,第13期,1992年7月11日,第3325-3332页,这些文献的公开内容通过引用整体并入本文。
在其他实施例中,寡核苷酸包括一个或多个2′-O-Me RNA碱基。在又其他实施例中,寡核苷酸包括一种或多种解链温度(Tm)增强的核碱基。在一些实施例中,Tm增强的核碱基选自5-丙炔基-尿嘧啶、5-丙炔基-胞嘧啶、7-丙炔基-7-脱氮腺嘌呤、7-丙炔基-7-脱氮鸟嘌呤、7-脱氮-8-氮杂-7-溴-鸟嘌呤和7-脱氮-8-氮杂-7-溴-2-氨基-腺嘌呤。
在一些实施例中,寡核苷酸是“LNA修饰的寡核苷酸”。“LNA修饰的寡核苷酸”是指用一个或多个LNA单体(“锁核酸”单体)完全或部分修饰的寡核苷酸。因此,“LNA修饰的寡核苷酸”可以完全由LNA单体组成,或者“LNA修饰的寡核苷酸”可以包含一个LNA单体、两个LNA单体等。如本文所用,术语“LNA单体”是指一类构象受限的核苷酸类似物,其核糖环受到2′-氧和4′-碳之间的亚甲基键的限制,即例如在2′和4′位置之间包含共价桥(2′-4′桥)的核苷酸。在一些实施例中,LNA以其β-D-构型应用,所述构型以高亲和力结合天然存在的核酸。还描述了α-L-LNA,并且其还以高亲和力与天然存在的核酸配对。与α-L-LNA相比,β-L-LNA不与天然存在的核酸结合,而仅与β-L-构型寡核苷酸如β-L-DNA或β-L-LNA结合。LNA单体进一步描述于美国专利号6,268,490、美国专利号6,794,499、美国专利号7,034,133中,这些专利的公开内容各自通过引用整体并入本文。锁核酸衍生物的合成描述于美国专利号8492390中,其公开内容通过引用整体并入本文。然而,还有其他单体公开于PCT公开号WO98/39352、WO99/14226和WO200066604中,这些专利的公开内容通过引用整体并入本文。
在一些实施例中,在寡核苷酸中并入到一个或多个LNA单体通过升高双链体的解链温度(Tm)来增加该寡核苷酸对其互补RNA或DNA靶标的亲和力。在一些实施例中,双链体的热稳定性在约3℃至约8℃的范围内增加,这取决于寡核苷酸中存在的每个LNA单体的实际碱基(参见Dwaine A.Braasch和David R.Corey,Chemistry and Biology 8(2001)1-7)。与DNA/LNA混合体相比,全LNA双链体形成非常稳定的双链体。因此,可以将非常短的序列用作结合对。在一些实施例中,据信使用非常短的序列是有利的,这是由于核苷酸处的修饰可以保持尽可能小,从而最小限度地损害聚合酶的并入到效率。此外,β-L-LNA具有不干扰D-构型核酸(例如与待测序的DNA)的额外的优势。在一些实施例中,寡核苷酸完全由LNA单体组成,例如包括3至12个LNA单体、4至8个LNA单体或5至6个LNA单体的寡核苷酸。在一些实施例中,Z1基团可以包含寡核苷酸序列,该寡核苷酸序列包含LNA单体并且具有SEQ ID NO:1-22中任一个的序列。本领域技术人员将理解,任何引入的缀合物(本文所述)将包含互补寡核苷酸序列,所述互补寡核苷酸序列包含LNA单体并且具有SEQ ID NO:29-50中任一个的序列。例如,如果核苷酸包括Z1基团,该基团包含具有SEQ ID NO:19的寡核苷酸,则引入的缀合物将具有互补序列,即SEQ ID NO:47。在一些实施例中,可以交换第一和第二寡核苷酸序列,即Z1基团可以包含一个寡核苷酸序列,该寡核苷酸序包含LNA单体并且具有SEQ ID NO:29-50中任一个的序列,然后任何引入的缀合物将包含互补寡核苷酸序列,该序列包含LNA单体并且具有SEQ ID NO:1-22中任一个的序列。
在一些实施例中,寡核苷酸是“PNA修饰的寡核苷酸”。“PNA修饰的寡核苷酸”是指用一个或多个PNA单体(“肽核酸”单体)完全或部分修饰的寡核苷酸。PNA单体是指一类核苷酸类似物,其中天然核酸的糖磷酸骨架已被合成肽骨架置换,通常由N-(2-氨基-乙基)-甘氨酸单元形成,生成非手性并且不带电荷的模拟物。据信由于PNA不含电荷,因此对于相同序列,PNA与DNA之间的结合杂交比DNA与DNA之间的结合杂交更强。与LNA/LNA双链体类似,PNA/PNA双链体具有高双链体稳定性。在一些实施例中,寡核苷酸完全由PNA单体组成,例如包括3至12个PNA单体、4至8个PNA单体或5至6个PNA单体的寡核苷酸。举例来说,寡核苷酸可包含6个PNA单体并具有序列5′-ctgtca-3′(SEQID NO:4)。
在一些实施例中,寡核苷酸由一个或多个γ-PNA单体组成。在一些实施例中,寡核苷酸中的一个或多个PNA单体可以在其γ碳处被取代,例如被带电部分(例如赖氨酸基团)取代。
在一些实施例中,Z1包括主体分子或客体分子之一(即主体/客体系统的一个成员)。主客体系统包括一个小客体分子,该客体分子适合略微更大的主体分子的空腔,并且通过吸引的非共价力(例如氢键和/或范德华引力)保持在那里。不同类型的主客系统表现出多种结合构象和广泛的结合亲和力。
在一些实施例中,主体分子是葫芦[n]脲化合物,而客体分子是可以存在于葫芦[n]脲化合物的空腔内的任何化合物。在一些实施例中,葫芦[n]脲化合物是葫芦[6]脲、葫芦[7]脲或葫芦[8]脲。其他主体化合物包括杯芳烃,例如杯[4]芳烃。
在一些实施例中,客体分子是氨基金刚烷。在一些实施例中,客体分子是双阳离子二茂铁衍生物(例如双(三甲基氨甲基)二茂铁)。在其他实施例中,客体分子是双阳离子N-金刚烷基乙二胺。在又其他实施例中,主体分子是环糊精,例如β-环糊精。
适用于本公开的又其他主体/客体分子描述于美国专利公开号2005/0080068、2009/0072191、2010/0247477和2017/0028374中,这些专利的公开内容通过引用整体并入本文。其他主体/客体分子进一步描述于以下文献中:Rekharsky等人,“A synthetic host-guest system achieves avidin-biotin affinity by overcoming enthalpy-entropycompensation”,PNAS,2007年12月26日,第一卷,104,第52期,20737-20742;Moghaddam等人,“Host-Guest Complexes with Protein-Ligand-like Affinities:ComputationalAnalysis and Design”,Journal of the American Chemical Society,2009,131,11,4012-4021;Sonzini等人,“High Affinity Recognition of a Selected Amino AcidEpitope within a Protein by Cucurbit[8]uril Complexation”,Angewandte Chemie,第55卷,第45期,2016年11月;Chakraborty等人,“A styryl based fluorogenic probewith high affinity for a cyclodextrin derivative”,Organic&BiomolecularChemistry,2019年第28期;Iwamoto等人,“Energetics of guest binding to calix[4]arene molecular containers”,Tetrahedron,第65卷,第35期,2009年8月,7259-7267,这些文献的公开内容通过引用整体并入本文。
在一些实施例中,PG是防止分子(例如另一个核苷酸,例如式(IA)的那些核苷酸中的任一种)的并入到在式(IA)的核苷酸的3′位置处反应的任何保护基,但是其中PG基团可以在定义的条件下去除(例如,通过并入到另外的核苷酸使发生聚合)。合适的保护基的非限制性实例包括叠氮甲基、3′-O-烯丙基(3′-O-CH2-CH=CH2)、3′-硝酸酯(3′-O-NO2)、3-二硫甲基(3′-O-CH2-S-S-R)、3′-O-氰乙基(3′-O-CH2CH2CN)和3′-O-氰基乙氧基甲基(3′-O-CH2-O-CH2CH2CN)。又另外的保护基描述于在美国专利号5,990,300;美国公开号2015/0140561和2007/0117104;以及PCT公开号WO/2008/037568A2和WO91/06678中,这些专利的公开内容各自通过引用整体并入本文。另外的保护基公开于PCT公开号PCT/US19/66670中,其公开内容通过引用整体并入本文。例如,PCT申请号PCT/US19/66670描述了具有式-B(OR1)(OR2)的保护基,其中R1和R2独立地选自-H、甲基或乙基。
在一些实施例中,根据本公开的核苷酸、核苷、寡核苷酸和/或多核苷酸(包括其任何盐)具有式(IB)定义的结构:
Figure BDA0003698524750000341
其中
Y为-OH、-O-P(O)(OH)[-O-P(O)(OH)]z-OH或-O-P(O)(OH)-寡核苷酸,其中z为0或1至5范围内的整数。
PG是保护基团;
W是核碱基;
Q1为具有1至25个碳原子并且任选地被一个或多个杂原子取代的直链或支链的、取代或未取代的、饱和或不饱和的脂肪族部分;
Q2为具有1至45个碳原子并且任选地被一个或多个杂原子取代的直链或支链的、取代或未取代的、饱和或不饱和的脂肪族或芳族部分;
X1是可切割基团;并且
Z1是反应性基团。
在一些实施例中,Q1包含C1-C25直链或支链的、取代或未取代的烷基或杂烷基基团。在一些实施例中,Q1包含C1-C20直链或支链的、取代或未取代的烷基或杂烷基基团。在一些实施例中,Q1包含C1-C15直链或支链的、取代或未取代的烷基或杂烷基基团。在其他实施例中,Q1包含C1-C8直链或支链的、取代或未取代的烷基或杂烷基基团。在又其他实施例中,Q1包含C1-C6直链或支链的、取代或未取代的烷基或杂烷基基团。在又进一步的实施例中,Q1包含C1-C4直链或支链的、取代或未取代的烷基或杂烷基基团。在更进一步的实施例中,Q1包含C1-C4直链或支链的、取代或未取代的烷基基团。在更进一步的实施例中,Q2包含C1-C4直链或支链烷基基团。
在一些实施例中,Q1包含C3-C6环烷基基团或杂环烷基基团。在一些实施例中,Q1包含C3-C4环烷基基团或杂环烷基基团。在一些实施例中,Q1包含取代或未取代的C5-C7环烷基基团。在一些实施例中,Q1包含取代或未取代的C5-C6环烷基基团。在一些实施例中,Q1包含取代或未取代的C5-C7杂环烷基基团。在一些实施例中,Q1包含取代或未取代的C5-C6杂环烷基基团。
在一些实施例中,Q1包含C2-C25取代或未取代的烯基基团。在一些实施例中,Q1包含C2-C12取代或未取代的烯基基团。在另一个实施例中,Q1包含C2-C6取代或未取代的烯基基团。在一些实施例中,Q1包含C2-C25取代或未取代的炔基基团。在一些实施例中,Q1包含C2-C12取代或未取代的炔基基团。在另一个实施例中,Q1包含C2-C6取代或未取代的炔基基团。
在一些实施例中,Q2包含C1-C45直链或支链的、取代或未取代的烷基或杂烷基基团。在一些实施例中,Q2包含C1-C35直链或支链的、取代或未取代的烷基或杂烷基基团。在一些实施例中,Q2包含C1-C25直链或支链的、取代或未取代的烷基或杂烷基基团。在其他实施例中,Q2包含C1-C20直链或支链的、取代或未取代的烷基或杂烷基基团。在又其他实施例中,Q2包含C1-C15直链或支链的、取代或未取代的烷基基团或杂烷基基团。在又进一步的实施例中,Q2包含C1-C10直链或支链的、取代或未取代的烷基或杂烷基基团。在又进一步的实施例中,Q2包含C1-C6直链或支链的、取代或未取代的烷基或杂烷基基团。在更进一步的实施例中,Q2包含C1-C6直链或支链的、取代或未取代的烷基基团。在更进一步的实施例中,Q2包含C1-C6直链或支链烷基基团。
在一些实施例中,Q2包含C3-C6环烷基基团或杂环烷基基团。在一些实施例中,Q2包含C3-C4环烷基基团或杂环烷基基团。在一些实施例中,Q2包含取代或未取代的C5-C7环烷基基团。在一些实施例中,Q2包含取代或未取代的C5-C6环烷基基团。在一些实施例中,Q2包含取代或未取代的C5-C7杂环烷基基团。在一些实施例中,Q2包含取代或未取代的C5-C6杂环烷基基团。
在一些实施例中,Q2包含C2-C45取代或未取代的烯基基团。在一些实施例中,Q2包含C2-C25取代或未取代的烯基基团。在一些实施例中,Q2包含C2-C45取代或未取代的炔基基团。在一些实施例中,Q2包含C2-C25取代或未取代的炔基基团。
在一些实施例中,Q1和/或Q2可以独立地包含聚环氧乙烷部分或聚环氧丙烷部分。例如,Q1和/或Q2可以包含基团-[CH2-CH2-O]s-,其中s是1至约27范围内的整数。在一些实施例中,s在1至12的范围内。例如,Q2可以包含基团-[CH2-CH(CH3)-O]s-,其中s是1至约27范围内的整数。在一些实施例中,s在1至约12的范围内。
在一些实施例中,Q1和/或Q2独立地包含取代或未取代的C5-C7芳基基团。在其他实施例中,Q1和/或Q2独立地包含取代或未取代的C5-C6芳基基团。
在一些实施例中,X1可以是任何可光切割的、可酶促切割的、可化学切割的、pH敏感的等基团。例如,X1是一个基团,该基团可以在暴露于波长为约200nm至约400nm(UV)或约400nm至约800nm(可见)的电磁辐射源时被切割。合适的可光切割基团的实例包括但不限于芳基羰基甲基(例如4-乙酰基-2-硝基苄基、二甲基苯甲酰基(DMP));2-(烷氧基甲基)-5-甲基-α-氯苯乙酮、2,5-二甲基苯甲酰基环氧乙烷、苯偶姻基团(例如3′,5′-二甲氧基苯偶姻(DMB))、邻硝基苄基团(例如1-(2-硝基苯基)乙基(NPE)、1-(甲氧基甲基)-2-硝基苯、4,5-二甲氧基-2-硝基苄基(DMNB)、α-羧基硝基苄基(α-CNB));邻硝基-2-苯乙氧基羰基(例如1-(2-硝基苯基)乙氧基羰基和2-硝基-2-苯乙基衍生物);邻硝基苯胺(例如酰化5-溴-7-硝基二氢吲哚);香豆素-4-基-甲基基团(例如7-甲氧基香豆素衍生物);9-取代的呫吨和芳甲基基团(例如邻羟基芳甲基)。
在一些实施例中,X1是一个基团,该基团可以在暴露于波长为约700nm至约1000nm的电磁辐射源时被切割。合适的可近红外光切割基团包括花菁基团,包括C4-二烷基胺取代的七甲川菁。
在一些实施例中,X1是一个基团,该基团可以被不同的化学反应物化学切割,包括还原剂或通过诱导的pH变化(例如,基团X1在小于约pH 7下切割)。可化学切割基团的非限制性实例包括基于二硫键的基团;重氮苯基团(例如2-(2-烷氧基-4-羟基-苯偶氮);苯甲酸支架;基于酯键的基团;和酸敏感基团(例如二烷氧基二苯基硅烷基团或酰基腙基团)。认为亲电切割的基团(例如对烷氧基苄基酯和对烷氧基苄基酰胺)被质子切割并且包括对酸敏感的切割。
在一些实施例中,X1是可以被酶促切割的基团,包括但不限于胰蛋白酶可切割基团和V8蛋白酶可切割基团。在一些实施例中,该基团可以被尿嘧啶-N-糖基化酶、核糖核酸酶A、β-葡糖醛酸酶、β-半乳糖苷酶或TEV-蛋白酶之一酶促切割。
在一些实施例中,基团W、Z1、Q1、X1和Q2经由化学键连接,例如C-C键、酰胺键、酯键、脲键、氨基甲酸酯键、胺键、醚键、硫醚键、磷酸键、1,2,3--三唑键,或二氢哒嗪键。举例来说,在合成过程中,Q1可以包括用于将(例如胺反应性基团、甲酸反应性基团或硫醇反应性基团)偶联至X1的相应反应性官能团(例如胺反应性基团、甲酸反应性基团或硫醇反应性基团)的第一反应性官能团。在一些实施例中,胺反应性基团包括异硫氰酸酯、异氰酸酯、酰基叠氮化物、NHS酯、酰氯例如磺酰氯、醛、环氧化物和环氧乙烷、碳酸酯、芳基化剂、酰亚胺酯、碳二亚胺、酸酐及其组合。合适的硫醇反应性官能团包括卤代乙酰基和卤代烷、马来酰亚胺、氮丙啶、丙烯酰基衍生物、芳基化剂、硫醇-二硫化物交换试剂,例如吡啶基二硫化物、TNB-硫醇和二硫化物还原剂及其组合。羧基反应性官能团包括重氮烷烃、重氮乙酰化合物、羰基二咪唑化合物和碳二亚胺。羟基反应性官能团包括环氧化物和环氧乙烷、羰基二咪唑、N,N′-二琥珀酰亚胺基碳酸酯或N-羟基琥珀酰亚胺基氯甲酸酯、高碘酸盐氧化化合物、酶促氧化、烷基卤素和异氰酸酯。醛和酮反应性官能团包括肼、席夫碱、还原胺化产物、曼尼希缩合产物及其组合。活性氢反应性化合物包括重氮衍生物、曼尼希缩合产物、碘化反应产物及其组合。光反应性化学官能团包括芳基叠氮化物、卤代芳基叠氮化物、苯甲酮、重氮化合物、双吖丙啶衍生物及其组合。
具有式(IA)或(IB)的核苷酸的非限制性实例如下所述:
Figure BDA0003698524750000381
Figure BDA0003698524750000391
Figure BDA0003698524750000401
缀合物
本公开还提供能够与式(IA)和(IB)的核苷酸、核苷、寡核苷酸和/或多核苷酸(或其任何盐)反应的缀合物。在一些实施例中,缀合物具有由式(IIA)或(IIB)定义的结构:
Figure BDA0003698524750000411
其中
D是可检测标记物或包括可检测标记物的缀合物;
L2为一个键或直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分,具有1至60个碳原子,并且任选地包括一个或多个杂原子;
Z2是反应性基团;并且
p的范围是从2至约1000。
在一些实施例中,并且参考式(IIA),可检测标记物或包含可检测标记物“D”的缀合物仅用单个Z2反应性基团,例如通过基团L2进行功能化。在其他实施例中,并且参考式(IIB),将两个或更多个Z2反应性基团缀合至单个可检测标记物或包含可检测标记物“D”的单个缀合物。在一些实施例中,p在2至约500的范围内。在其他实施例中,p在2至约250的范围内。在又其他实施例中,p在2至约150的范围内。在进一步的实施例中,p在2至约100的范围内。在更进一步的实施例中,p在2至约60的范围内。在又更进一步的实施例中,p在2至约30的范围内。
在一些实施例中,Z2是一对反应性基团的第二成员。例如,Z2可以是第二反应性基团成员,其与第一反应性基团成员Z1(例如任何式(IA)和(IB)的核苷酸的第一反应性基团成员Z1)特异性反应,即正交反应。在一些实施例中,Z2选自本文关于部分Z1描述的任何反应性基团。例如,如果Z1包含一对点击缀合物的第一成员,则Z2包含这对点击缀合物的第二成员,其中这对点击缀合物的第二成员的与这对点击缀合物的第一成员反应。再例如,如果Z1包含第一寡核苷酸,则Z2包含第二寡核苷酸,其中该第二寡核苷酸与该第一寡核苷酸互补并且能够与该第一寡核苷酸杂交。在另一实例中,如果Z1包含半抗原,则Z2包含抗半抗原抗体。在另一实例中,如果Z1包含主体分子,则Z2包含能够与该主体分子相互作用的客体分子。在一些实施例中,Z2选自本文关于Z1描述的任何化合物。
在一些实施例中,部分L2包括1至约50个碳原子。在一些实施例中,部分L2包括1至约40个碳原子。在其他实施例中,部分L2包括2至约30个碳原子。在又其他实施例中,部分L2包括约5至约20个碳原子。在又其他实施例中,部分L2包括约5至约15个碳原子。在进一步的实施例中,部分L2包括约10至约20个碳原子。在一些实施例中,部分L2的分子量为约20g/mol至约750g/mol。在又其他实施例中,部分L2的分子量为约20g/mol至约500g/mol。在又其他实施例中,部分L2的分子量为约20g/mol至约250g/mol。
在一些实施例中,部分L2包括生物素(5-[(3aS,4S,6aR)-2-氧代-1,3,3a,4,6,6a-六氢噻吩并[3,4-d]咪唑-4-基]戊酸)或其衍生物。在一些实施例中,L2具有以下结构:L4-L5-其中L4为生物素或其衍生物;并且其中L5为直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分,具有1至约50个碳原子,并且任选地包括一个或多个杂原子。在一些实施例中,L5为直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分,具有1至约20个碳原子,并且任选地包括一个或多个杂原子。在一些实施例中,L5包括一个或多个可切割基团。在一些实施例中,L2是生物素或其衍生物。在一些实施例中,L2至少部分源自生物素。在其他实施例中,L2为键。
在一些实施例中,部分L2任选地包括一个或多个可切割基团,例如可光切割基团、可酶促切割基团、可化学切割基团和在某些pH下可切割的基团。在部分L2包括可切割基团的那些实施例中,可切割基团可以位于部分L2内的任何位置处。在部分L2包括可切割基团的那些实施例中,可切割基团可以包括本文关于L1或X1描述的任何那些基团(例如二硫键或α-叠氮醚)。在一些实施例中,部分L2包括一个可切割基团。在其他实施例中,部分L2不包括可切割基团。在一些实施例中,L2不存在,即L2是键。
在一些实施例中,部分L2是具有1至约40个碳原子并且任选地包括一个或多个可切割基团的取代或未取代烷基基团或杂烷基基团。在一些实施例中,部分L2是具有1至约30个碳原子并且任选地包括一个或多个可切割基团的取代或未取代烷基基团或杂烷基基团。在一些实施例中,部分L2是具有1至约20个碳原子并且任选地包括一个或多个可切割基团的取代或未取代烷基基团或杂烷基基团。
在一些实施例中,部分L2具有一般结构-[接头]t-[可切割基团]u-[接头]v-其中每个[接头]可以相同或不同,并且其中t、u和v独立地为0或范围从1至约5的整数。在一些实施例中,t、u和v独立地为0或范围从1至约4的整数。在一些实施例中,t、u和v独立地为0或范围从1至约3的整数。在一些实施例中,t、u和v独立地为0或范围从1至2的整数。在一些实施例中,每个[接头]可以独立地包括1至约30个碳原子,并且其中每个[接头]任选地被一个或多个杂原子取代。在一些实施例中,每个[接头]可以独立地包括2至约20个碳原子,并且其中每个[接头]任选地被一个或多个杂原子取代。在一些实施例中,每个[接头]可以独立地包括3至约15个碳原子,并且其中每个[接头]任选地被一个或多个杂原子取代。在一些实施例中,每个[接头]独立地是具有1至约20个碳原子的取代或未取代烷基基团或杂烷基基团。在一些实施例中,每个[接头]独立地是具有1至约10个碳原子的取代或未取代烷基基团或杂烷基基团。在一些实施例中,-[可切割接头]-包括可光切割基团、可酶促切割基团、可化学切割基团和在某些pH下可切割的基团。
在一些实施例中,可检测标记物或包含可检测标记物“D”的缀合物可以是能够被检测到的任何化学基团或分子。在一些实施例中,可检测标记物或包含可检测标记物“D”的缀合物是磁性纳米粒子。在一些实施例中,磁性纳米粒子是由可以是由顺磁性、超顺磁性或铁磁性的磁性材料形成的。在一些实施例中,磁性纳米粒子是由结构为结晶、多晶或无定形的铁磁材料形成的。例如,磁性纳米粒子的核心可以包括例如但不限于Fe、Co、Ni、FeOFe2O3、NiOFe2O3,CuOFe2O3,MgOFe2O3,MnBi,MnSb,MnOFe2O3,Y3Fe5O12,CrO2、MnAs、SmCo、FePt或其组合。在其他实施例中,磁性纳米粒子包括核心材料,该核心材料是钝化金属和磁性金属的复合物或合金。在一些实施例中,钝化金属选自Au、Ag、Pt或Cu,磁性金属选自Fe和Co。纳米粒子核也可以由合金形成,这些合金包括Au/Fe、Au/Cu、Au/Gd、Au/Zn、Au/Fe/Cu、Au/Fe/Gd和Au/Fe/Cu/Gd。其他非限制性磁性纳米粒子描述于美国专利公开号2006/0233712和2003/0068187;PCT公开号WO/03/073444、WO/02/093140和WO/02/32404中;以及美国专利号6,531,304、6,514,481、6,254,662、8,557,607、9,623,126和9,707,2984中,这些专利的公开内容各自通过引用整体并入本文。
在一些实施例中,磁性纳米粒子可以包括具有高磁各向异性的那些。具有高磁各向异性的磁性纳米粒子的实例包括但不限于Fe3O4、FePt、FePd和CoPt。为了促进与核苷酸的化学结合,可以合成粒子并且用SiO2包被。参见,例如,M.Aslam,L.Fu,S.Li,和V.P.Dravid,“Silica encapsulation and magnetic properties of FePtnanoparticles”,Journal of Colloid and Interface Science,第290卷,第2期,2005年10月15日,第444-449页。具有高磁各向异性的纳米粒子的实例包括但不限于FeO、Fe3O4、FePt、FePd和CoPt。为了促进与核苷酸的化学并入,可以合成粒子并且用SiO2包被(参见例如M.Aslam、L.Fu、S.Li和V.P.Dravid,“Silica encapsulation and Magnetic propertiesof FePt nanoparticle”,Journal of Colloid and Interface Science,第290卷,第2期,2005年10月15日,第444-449页,其公开内容通过引用整体并入本文)。
在一些实施例中,磁性纳米粒子直接与一个或多个L2基团偶联(例如通过共价键)。在其他实施例中,磁性纳米粒子间接偶联到缀合物。例如,在一些实施例中,磁性纳米粒子可以包含用多个抗生物素蛋白和/或链霉抗生物素蛋白分子进行功能化的表面。在一些实施例中,用抗生物素蛋白和/或链霉抗生物素蛋白分子进行功能化的磁性纳米粒子可以与包括生物素分子或生物素分子的衍生物的L2基团反应(例如非共价反应)。
在一些实施例中,偶联(直接或间接)到缀合物的磁性纳米粒子可以包括能够用磁传感器阵列检测的任何磁性纳米粒子。在一些实施例中,偶联(直接或间接)到缀合物的磁性纳米粒子可以包括能够用包含多个磁传感器的磁传感器阵列(例如配置成线性阵列)检测的任何磁性纳米粒子,所述多个磁传感器中的每一个磁传感器偶联到至少一个地址线。在一些实施例中,向该至少一个地址线施加磁场以检测所述多个磁传感器中的至少一个的特性。在一些实施例中,检测到的特性表明存在可检测的磁性纳米粒子(例如与核苷酸、寡核苷酸/多核苷酸偶联的磁性纳米粒子或作为核苷酸-缀合物复合物的一部分,如本文进一步描述的)。用于检测包括磁性纳米粒子的标记核苷酸和/或形成的核苷酸-缀合物复合物(每个在本文中描述)的合适的磁性传感器阵列在共同未决的美国临时申请号62/833,130中进行了描述,其公开内容通过引用整体并入本文。
在一些实施例中,可检测标记物“D”为荧光团。荧光团属于多种常见的化学类别,包括香豆素、荧光素(或荧光素衍生物及类似物)、罗丹明、恶嗪(包括试卤灵)、BODIPY、发光体和花菁。荧光分子的其他实例可参见:Molecular Probes Handbook-A Guide toFluorescent Probes and Labeling Technologies,Molecular Probes,Eugene,OR,TheroFisher Scientific,第11版。在其他实施例中,荧光团选自氧杂蒽衍生物、花菁衍生物、方酸衍生物、萘衍生物、香豆素衍生物、噁二唑衍生物、蒽衍生物、芘衍生物、噁嗪衍生物、吖啶衍生物、芳基次甲基衍生物和四吡咯衍生物。在一些实施例中,荧光素家族的染料包括例如FAM、HEX、TET、JOE、NAN和ZOE。罗丹明家族的染料包括例如德克萨斯红、ROX、R110、R6G和TAMRA。FAM、HEX、TET、JOE、NAN、ZOE、ROX、R110、R6G和TAMRA可购自例如Perkin-Elmer,Inc.(Wellesley,Mass.,USA),Texas Red可购自例如Life Technologies(MolecularProbes,Inc.)(Grand Island,N.Y.)。在一些实施例中,花青家族的染料包括例如CY2、CY3、CY5、CY5.5和CY7,并且可购自例如GE Healthcare Life Sciences(Piscataway,N.J.,USA)。
在其他实施例中,荧光部分选自:CF染料(可得自Biotium);DRAQ和CyTRAK探针(可得自BioStatus);BODIPY(可得自Invitrogen);Alexa Fluor(可得自Invitrogen);DyLightFluor(例如DyLight 649)(可得自Thermo Scientific,Pierce);Atto和Tracy(可得自Sigma Aldrich);FluoProbe(可得自Interchim);Abberior染料(可得自Abberior);DY和MegaStokes染料(可得自Dyomics);Sulfo Cy染料(可得自Cyandye);HiLyte Fluor(可得自AnaSpec);Seta、SeTau和Square染料(可得自SETA BioMedicals);Quasar和Cal Fluor染料(可得自Biosearch Technologies);SureLight染料(可得自APC、RPEPerCP、Phycobilisomes)(Columbia Biosciences);以及APC、APCXL、RPE、BPE(可得自Phyco-Biotech、Greensea、Prozyme、Flogen)。
与本文所述的缀合物偶联的又其他类型的可检测标记物和标记系统包括量子点、表面增强拉曼散射粒子、散射金属纳米粒子、FRET系统、本征荧光、非荧光发色团、化学发光标记物、生物发光标记物、放射性标记物等。此类可检测标记物在本领域中通常是已知的并且进一步的描述于美国专利号6,399,335、5,866,366、7,476,503和4,981,977中,这些专利的公开内容各自通过引用整体并入本文。合适的化学发光剂描述于美国专利号7,256,299和4,363,759中,这些专利的公开内容通过引用整体并入本文。化学发光剂的另一个实例是吖啶翁酯。
在一些实施例中,缀合物具有由式(IIC)、(IID)或(IIE)中任一项定义的结构:
Figure BDA0003698524750000461
其中
D是可检测标记物或包括可检测标记物的缀合物;
Q3和Q4独立地为具有1至30个碳原子并且任选地被一个或多个杂原子取代的直链或支链的、取代或未取代的、饱和或不饱和的脂肪族或芳族部分;
X2是可切割基团;
Z2是反应性基团;
n为0或1至3范围内的整数;
m和o各自独立地为0或1,
r是1至3范围内的整数;并且
p是范围为2至约1000的整数。
在一些实施例中,并且参考式(IIC)和(IID),可检测标记物或包含可检测标记物“D”的缀合物仅用单个Z2反应性基团进行功能化。在其他实施例中,并且参考式(IID),将两个或更多个Z2反应性基团缀合至单个可检测标记物或包含可检测标记物“D”的单个缀合物。在一些实施例中,p在2至约500的范围内。在其他实施例中,p在2至约250的范围内。在又其他实施例中,p在2至约150的范围内。在进一步的实施例中,p在2至约100的范围内。在更进一步的实施例中,p在2至约60的范围内。在又更进一步的实施例中,p在2至约30的范围内。
在一些实施例中,X2选自本文关于部分X1描述的任何可切割基团。在一些实施方案中,n为0。在其他实施例中,n为范围从1至3的整数。在一些实施方案中,n为1。
在一些实施例中,部分Q3包括生物素(5-[(3aS,4S,6aR)-2-氧代-1,3,3a,4,6,6a-六氢噻吩并[3,4-d]咪唑-4-基]戊酸)或其衍生物。在一些实施例中,R3衍生自生物素。
在一些实施例中,Q3和Q4独立地包含C1-C25直链或支链的、取代或未取代的烷基或杂烷基基团。在其他实施例中,Q3和Q4独立地包含C1-C20直链或支链的、取代或未取代的烷基或杂烷基。在又其他实施例中,Q3和Q4独立地包含C1-C15直链或支链的、取代或未取代的烷基或杂烷基基团。在又进一步的实施例中,Q3和Q4独立地包含C1-C10直链或支链的、取代或未取代的烷基或杂烷基基团。在某些实施例中,Q3和/或Q4可以包含双键或三键。
在又进一步的实施例中,Q3和Q4独立地包含C1-C6直链或支链的、取代或未取代的烷基或杂烷基基团。在更进一步的实施例中,Q3和Q4独立地包含C1-C6直链或支链的、取代或未取代的烷基基团。在更进一步的实施例中,Q3和Q4独立地包含CC1-C6直链或支链烷基基团。在又进一步的实施例中,Q3和Q4独立地包含C1-C4直链或支链的、取代或未取代的烷基或杂烷基基团。在更进一步的实施例中,Q3和Q4独立地包含C1-C4直链或支链的、取代或未取代的烷基基团。在更进一步的实施例中,Q3和Q4独立地包含CC1-C4直链或支链烷基基团。
在一些实施例中,Q3和Q4独立地包含聚环氧乙烷部分或聚环氧丙烷部分。例如,Q3和Q4可以独立地包含基团-[CH2-CH2-O]s-,其中s是1至约27范围内的整数。在一些实施例中,s在1至约12的范围内。例如,Q3和Q4可以独立地包含基团-[CH2-CH(CH3)-O]s-,其中s是1至约27范围内的整数。在一些实施例中,s在1至12的范围内。
在一些实施例中,Q3和Q4独立地包含取代或未取代的C5-C7芳基基团。在其他实施例中,Q3和Q4独立地包含取代或未取代的C5-C6芳基基团。
在一些实施例中,Q3和Q4独立地包含取代或未取代的C5-C7环烷基基团。在一些实施例中,Q3和Q4独立地包含取代或未取代的C5-C6环烷基基团。在一些实施例中,Q3和Q4独立地包含取代或未取代的C5-C7杂环烷基基团。在一些实施例中,Q3和Q4独立地包含取代或未取代的C5-C6杂环烷基基团。
本领域技术人员将理解,基团D、Z2、Q3、X2和Q4经由化学键连接,例如C-C键、酰胺键、酯键、脲键、氨基甲酸酯键、胺键、醚键、硫醚键、磷酸键、1,2,3-三唑键,或二氢哒嗪键。例如,在合成过程中,D可以包括用于将(例如胺反应性基团、甲酸反应性基团或硫醇反应性基团)偶联至Q3的相应反应性官能团(例如胺反应性基团、甲酸反应性基团或硫醇反应性基团)的第一反应性官能团。本文描述了用于偶联的其他合适的反应性官能团(参见例如表1)。
具有式(IIA)至(IIE)中任一项的缀合物的非限制性实例如下所述:
Figure BDA0003698524750000491
Figure BDA0003698524750000501
其中n在2至1000的范围内。
核苷酸和缀合物之间的正交反应性
适当功能化的式(IA)或(IB)的核苷酸可以与相应的适当功能化的式(IIA)至(IIE)的缀合物正交反应。如本文所述,式(IA)或(IB)的不同核苷酸和式(IIA)至(IIE)的不同缀合物可各自包含相互正交反应的反应性基团对(Z1和Z2)。例如,式(IA)的第一核苷酸可以包含第一反应性基团,其是第一对反应性基团的第一成员。同样,式(IIA)的第一缀合物可以包含第二反应性基团,其是第一对反应性基团的第二成员。当具有第一对反应性基团的第一成员的第一核苷酸与具有第一对反应性基团的第二成员的第一缀合物接触时,该第一对反应性基团的第一成员和第二成员可以相互正交反应,并且如本文进一步描述的,从而提供化合物或中间体,例如具有式(III)的化合物或中间体。
本领域技术人员将理解,可以开发不同的式(IA)核苷酸,其各自包含不同的Z1部分。在这点上,具有不同Z1部分的每个不同核苷酸可以选择性地与式(IIA)或(IIB)中任一项的适当功能化的缀合物反应,即具有Z2部分的化合物能够选择性地与Z1部分反应。例如,第一核苷酸可以具有第一Z1部分Z1A,其选择性地与具有第一Z2部分Z2A的第一缀合物反应;第二核苷酸可以具有第二Z1部分Z1B,其选择性地与具有第二Z2部分Z2B的第二缀合物反应;第三核苷酸可以具有第三Z1部分Z1C,其选择性地与具有第三Z2部分Z2C的第三缀合物反应;并且第四核苷酸可以具有第四Z1部分Z1D,其选择性地与具有第四Z2部分Z2D的第四缀合物反应。
进一步遵循该实施例,第一、第二、第三和第四核苷酸中的每一个(具有部分Z1A、Z1B、Z1C、Z1D)可以包含不同的核碱基,例如A、G、C和T。以这种方式,可以提供四种不同的核苷酸,每种核苷酸包含不同的反应性官能团(Z1A、Z1B、Z1C、Z1D)和不同的核碱基(A、G、C和T),如下图所示:
核苷酸1:其中核碱基(W)=A;并且其中Z1=Z1A
核苷酸2:其中核碱基(W)=G;并且其中Z1=Z1B
核苷酸3:其中核碱基(W)=C;并且其中Z1=Z1C
核苷酸4:其中核碱基(W)=T;其中Z1=Z1D
然后,本实例中的每个核苷酸1-4可以独立并且选择性地与四种不同缀合物中的一种反应,这些缀合物具有Z2A、Z2B、Z2C或Z2D部分中的一个:
缀合物1:其中Z2=Z2A,其中Z2A是与Z1A反应的反应性基团
缀合物2:其中Z2=Z2B,其中Z2B是与Z1B反应的反应性基团
缀合物3:其中Z2=Z2C,其中Z2C是与Z1C反应的反应性基团
缀合物4:其中Z2=Z2D,其中Z2D是与Z1D反应的反应性基团
式(IA)和(IB)的不同核苷酸与式(IIA)和(IIB)的适当功能缀合物之间的正交反应性将在本文的测序方面进一步描述。
试剂盒
在一些实施例中,本公开提供了一种试剂盒,其包括四种不同的核苷酸,每种核苷酸具有不同的核碱基(A、G、C或T),并且每种核苷酸还具有不同的Z1部分。本公开还提供了包括一种或多种式(IA)至(IB)的核苷酸和/或一种或多种式(IIA)至(IIE)中任一个的缀合物的试剂盒。
在一些实施例中,试剂盒可以包含一种式(IC)的核苷酸、一种式(ID)的核苷酸、一种式(IE)的核苷酸和一种式(IF)的核苷酸:
Figure BDA0003698524750000521
其中Y、PG和L1如本文所定义;WA是腺嘌呤核碱基,WG是鸟嘌呤核碱基;WC是胞嘧啶核碱基;并且WR是胸腺嘧啶核碱基或尿嘧啶核碱基;并且其中Z1A、Z1B、Z1C、和Z1D各自包含不同的反应性基团(包括本文定义的任何那些反应性基团)。在一些实施例中,式(IC)、(ID)、(IE)和(IF)的核苷酸中的每一个可以在单个容器或分配器中以混合物的形式提供。在一些实施例中,式(IC)、(ID)、(IE)和(IF)的核苷酸中的每一个可以在单独的容器或单独的分配器中提供。
在一些实施例中,该试剂盒可进一步包括三种或四种不同的式(IIA)至(IIE)中任一个的缀合物,其中不同的缀合物中的每一种包含部分Z2,其与部分Z1A、Z1B、Z1C、和Z1D中的一种正交反应。例如,该试剂盒可以进一步包括式(IIF)、(IIG)、(IIH)和(III)的缀合物中的至少三种:
Figure BDA0003698524750000531
其中D和L2如本文所定义,并且其中Z2A、Z2B、Z2C、和Z2D各自包含不同的反应性基团,并且其中Z2A与Z1A选择性反应,Z2B与Z1B选择性反应,Z2C与Z1C选择性反应,并且Z2D与Z1D选择性反应。在一些实施例中,式(IIA)的不同缀合物中的每一种都在单独的容器或分配器中提供。在一些实施例中,试剂盒中的每种不同缀合物具有相同的标签。在其他实施例中,试剂盒中的每种不同缀合物具有不同的标记。同样,在一些实施例中,不同缀合物中的每一种包含相同的L2部分。在其他实施例中,不同缀合物中的每一种包含不同的L2部分。在“D”是磁性纳米粒子的那些实施例中,如在式(IIB)、(IID)和(IIE)中的任一个中,L2-Z2A、L2-Z2B、L2-Z2C、L2-Z2D可以出现多于一次。
核苷酸-缀合物复合物
式(IA)或(IB)的核苷酸、核苷、寡核苷酸和/或多核苷酸(或其盐)可以与式(IIA)至(IIE)中任一个的合适缀合物反应以提供核苷酸-缀合物复合物。在一些实施例中,核苷酸-缀合物复合物并入到新生核酸链内,例如本文进一步描述的。例如,并且如本文进一步描述的,当式(IIA)的缀合物与式(IA)的核苷酸(例如并入到新生核酸链中的式(IA)的核苷酸)反应时,可以形成核苷酸-缀合物复合物。通常,形成的核苷酸-缀合物复合物具有式(III)的结构:
Figure BDA0003698524750000541
其中Y、PG、W、L1、L2和D中的每一个如本文所定义,并且其中T表示反应性基团Z1(参见式(IA))和Z2(参见式(IB))之间的“反应”的产物。本领域技术人员将理解,基团W、L1、T、L2和D可以经由化学键彼此偶联,例如C-C键、酰胺键、酯键、脲键、氨基甲酸酯键、胺键、醚键、硫醚键、磷酸键、1,2,3-三唑键,或二氢哒嗪键。在本文中进一步描述了适用于偶联各种部分的其他类型的化学键。
在一些实施例中,核苷酸-缀合物复合物包含至少一个可切割基团(其可以在部分L1或L2内)。在其他实施例中,核苷酸-缀合物复合物包含至少两个可切割基团(例如L1内的一个可切割基团和L2内的另一个可切割基团)。
在一些实施例中,反应性基团之间的“反应”的产物包含新部分或代表两个分子之间的相互作用(例如氢键、范德华相互作用、杂交)。例如,T可以代表两个反应性官能团的共价偶联的产物(例如,两个不同官能团的反应能够参与“点击化学”反应);主体/客体分子之间的氢键和/或范德华相互作用(例如葫芦[7]脲和氨基金刚烷之间的相互作用);两个互补寡核苷酸的杂交(例如,第一寡核苷酸和与第一寡核苷酸互补的第二寡核苷酸之间的杂交;或包含至少一个LNA单体的第一寡核苷酸和与第一寡核苷酸互补的包含至少一个LNA单体的第二寡核苷酸之间的杂交);和/或两个特异性结合实体之间的相互作用(例如半抗原和抗半抗原抗体之间)。
在一些实施例中,式(III)的核苷酸-缀合物复合物是在合成测序期间产生的中间体,如方案1中所示(并且再次,核苷酸-缀合物复合物并入到新生核酸内)。合成测序技术(本文进一步描述)通常涉及通过针对模板链的核苷酸的顺序添加而对新生核酸链进行酶促延伸。在这方面,方案1说明了单个新生核酸链的延伸,例如与待测序的核酸模板杂交的新生核酸链。在此,新生核酸通过核苷酸(例如式(IA)的那些)的顺序引入和并入到来延伸。此外,方案1说明了通过引入具有式(IIA)至(IIE)中任一个的适当功能化的缀合物形成两种不同的式(III)的可检测的核苷酸-缀合物复合物。
Figure BDA0003698524750000561
方案1:说明将式(I)的核苷酸顺序引入新生核酸链,包括形成不同的式(III)的可检测物质。
更具体地,方案1说明了与新生核酸链偶联的核苷酸1(具有第一核碱基“WA”的式(IA)的第一核苷酸),其中核苷酸1包含保护基(“PG”)以防止新生核酸链的进一步延伸。在步骤10,可以引入式(IIA)至(IIE)中任一个的第一缀合物,其仅与并入的核苷酸1反应。例如,核苷酸1可以包含仅与式(IIA)至(IIE)中任一个的第一个引入的缀合物的Z2A部分反应的Z1A部分。核苷酸1与式(IIA)至(IIE)中任一个的缀合物之间的反应提供了包含可检测标记物“D”的第一核苷酸-缀合物复合物2。在第一个核苷酸-缀合物复合物2形成和检测后,可检测标记物“D”和保护基“PG”都可以去除(步骤11)以产生并入的核苷酸3。
举例来说,半胱胺可用于化学切割包含硝酸酯基团的可切割基团。同样,3′-O-烯丙基基团可以使用Pd催化的去烯丙基化混合物进行去烯丙基化。再举例来说,在一些实施例中,用可见光、紫外线或红外线辐射照射样品以光化学切割可切割基团L1和/或L2。一旦可切割基团被切割,基团L3就保留下来,它是基团L1的片段。在一些实施例中,在可检测标记物的切割之前、之后或同时从并入的核苷酸中去除保护基(步骤11)。TCEP(三(2-羧乙基)膦)可用于化学切割L1和/或L2中的叠氮甲基保护基和α-叠氮醚键。
在保护基“PG”切割后,另一个核苷酸4(具有第二个核碱基“WG”的式(IA)的第二个核苷酸)可以并入到新生核酸链(步骤12)。在一些实施例中,核碱基4包含保护基(“PG”)以防止新生核酸链的进一步延伸。在步骤13,可以引入式(IIA)至(IIE)中任一个的第二缀合物,其仅与并入的核苷酸4反应。例如,核苷酸4可以包含仅与式(IIA)至(IIE)中任一个的第二个引入的缀合物的Z2B部分反应的Z1B部分。核苷酸4与式(IIA)至(IIE)中任一个的缀合物之间的反应提供了包含可检测标记物“D”的第二核苷酸-缀合物复合物5。式(IA)的核苷酸的并入到、式(III)的核苷酸-缀合物复合物(例如对应于并入的核苷酸)的形成以及形成的式(III)的核苷酸-缀合物复合物的检测(III)可以重复(步骤14)。
合成测序
如上所述,合成测序技术涉及通过针对待测序的模板链分子的核苷酸的顺序添加而对新生核酸拷贝链进行酶促延伸。在一些实施例中,合成测序利用包含可逆终止子的核苷酸(例如式(IA)的核苷酸的保护基),使得酶(例如聚合酶)可以仅将单个碱基添加至每个新生核酸拷贝链。在一些实施例中,测序反应是同时对散布在固体表面上的大量(例如数百万)不同模板核酸分子进行的。在一些实施例中,待测序的核酸模板链可以由DNA、RNA或其类似物组成。在一些实施例中,模板核酸的来源可以是基因组DNA、信使RNA或来自天然来源的其他核酸。在一些实施例中,源自此类来源的模板核酸可在使用前进行扩增。合成测序的其他方面包括测序方法和在测序过程中使用的材料,描述于例如PCT申请公开号WO 91/06678、WO/2005/024010、WO/2006/120433、WO/2005/065814和WO/2006/064199;美国专利号9,605,310和9,441,272;以及美国公开号2019/0024162中,这些专利的公开内容通过引用整体并入本文。
虽然上面的方案1说明了式(III)的核苷酸-缀合物复合物的形成,但该方案说明了沿单个新生链发生的化学反应,因此仅对单个靶多核苷酸进行测序。然而,本领域技术人员将理解,可以同时确定多个(例如数百万)不同靶(或甚至相同扩增靶)多核苷酸的序列。在一些实施例中,在多个传感器的每一个内可能存在克隆扩增(例如桥接扩增)。在这些实施例中,单个传感器或多个传感器上可能有多个相同的核酸链。
本公开提供了一种通过合成进行测序的方法,其中检测核苷酸-缀合物复合物的不同子集的顺序形成。在这些实施例中,核苷酸-缀合物复合物的不同的顺序形成的子集的检测使得能够在核苷酸并入的每个循环期间顺序确定并入到多个靶多核苷酸分子中的每一个的互补物中的不同核苷酸。因此,当前描述的方法使得能够进行大规模并行测序,因为在每次迭代延伸期间顺序形成和检测核苷酸-缀合物复合物。
本公开提供了一种用于对靶多核苷酸分子进行测序的方法。在一些实施例中,本公开提供了一种通过合成进行测序的方法,其中在多个新生核酸拷贝链的每次重复延伸期间顺序地形成并检测核苷酸-缀合物复合物(诸如如式(III)的那些)的不同子集,其中每个新生核酸拷贝链与多个靶多核苷酸分子中的一个互补。在一些实施例中,该多个靶多核苷酸分子排列在固体支持物上。在一些实施例中,固体支持物是流动池。在一些实施例中,核苷酸-缀合物复合物并入到新生核酸链内,例如本文进一步描述的。
在一些实施例中,该方法首先包括通过将四种不同核苷酸中的一种并入到每个新生核酸拷贝链中来延伸每个新生核酸拷贝链。在一些实施例中,四种不同核苷酸中的每种包含(i)保护基,和(ii)通过可切割接头与核碱基偶联的反应性基团,并且其中四种不同核苷酸中的每种不同核苷酸包含不同核碱基和不同的反应性基团。技术人员将理解,不同的新生核酸链可以各自独立地用不同的核苷酸延伸,这取决于相应的互补靶多核苷酸分子的序列。
在一些实施例中,通过引入式(IA)或(IB)的四种不同核苷酸的池将核苷酸并入到新生核酸拷贝链中,其中四种不同核苷酸中的每种包含不同的核碱基(例如A、G、C,T/U)和不同的Z1部分。在其他实施例中,通过引入四种不同核苷酸的池来并入到核苷酸,其中第一个核苷酸具有式(IC),第二个核苷酸具有式(ID),第三个核苷酸具有式(IE),并且第四个核苷酸具有式(IF),条件是反应性基团Z1A,Z1B、Z1C、和Z1D各不相同。
接下来,顺序形成核苷酸-缀合物复合物的不同子集(例如在新生核酸内形成)。在一些实施例中,核苷酸-缀合物复合物的任何单个子集中的每个形成的核苷酸-缀合物复合物仅来源于并入到新生核酸拷贝链中的不同核苷酸之一。在一些实施例中,核苷酸-缀合物复合物的不同子集通过顺序引入包含可检测标记物的不同缀合物而顺序形成,其中引入的不同缀合物中的每一种与仅并入到新生核酸拷贝链中的核苷酸之一正交反应。例如,可以顺序引入式(IIA)至(IIE)中任一个的至少三种不同的缀合物,其中式(IIA)至(IIE)中任一个的至少三种不同的缀合物的每一种不同的缀合物仅与式(IA)或(IB)的四种并入的核苷酸之一正交反应。鉴于式(IIA)至(IIE)中任一个的不同缀合物的顺序添加及其与式(IA)或(IB)的不同并入的核苷酸的正交反应性,核苷酸-缀合物复合物的不同子集的顺序形成和检测有助于识别并入到新生核酸拷贝链中的不同核苷酸。因此,可以确定每个相应的互补靶多核苷酸分子的序列。技术人员将理解,上述过程可以重复一个或多个循环,即新生核酸拷贝链的一个或多个延伸。
图1A和1B说明了对包含多个靶多核苷酸分子的核酸文库进行测序的方法。在一些实施例中,可利用排列在固体支持物上的多个不同靶多核苷酸进行合成测序。例如,多个靶多核苷酸可以通过接头分子固定在固体支持物上,或者可以连接到粒子(其可以与固体支持物连接)上。在一些实施例中,合成测序可以利用装载有用于测序的多个不同靶多核苷酸分子文库的流动池。例如,流动池可以包含数百万个用于测序的靶多核苷酸分子。在一些实施例中,核酸测序文库可以通过将gDNA样品片段化并且将适配子连接到产生的片段的末端来制备。然后可以将文库加载到流通池中,并且可以将片段与流动池表面杂交。在一些实施例中,可以通过桥式扩增将每个结合片段扩增成克隆簇。固体支持物、流通池和测序文库的制备进一步公开于美国公开号2010/00111768;和公开于PCT公开号WO/2019/126040、WO/2018/119053和WO/2018/119101中,这些专利的公开内容通过引用整体并入本文。
在制备核酸文库并且排列到固体支持物上之后,将四种不同核苷酸中的一种到固体支持物上存在的每个互补新生核酸拷贝链中(步骤101),其中四种不同核苷酸中的每种包含并入(i)3′-羟基保护基,和(ii)通过可切割接头与核碱基偶联的反应性基团,并且其中四种不同核苷酸中的每个不同核苷酸包含不同核碱基和不同反应性基团。在一些实施例中,通过将式(IA)的四种不同核苷酸的池引入流动池并入到核苷酸,其中四种不同核苷酸中的每种包含不同的核碱基(例如A、G、C,T/U)和不同的Z1部分。在一些实施例中,四种不同核苷酸中的第一种具有式(IC)的结构;四种不同核苷酸中的第二种具有式(ID)的结构;四种不同核苷酸中的第三种具有式(IE)的结构;并且四种不同核苷酸中的第四种具有式(IF)的结构,条件是反应性基团Z1A、Z1B、Z1C、和Z1D各不相同。在一些实施例中,每个反应性基团Z1A、Z1B、Z1C、和Z1D可以包含不同的寡核苷酸序列。
在用四种不同核苷酸之一延伸每个新生核酸拷贝链之后(步骤101),顺序形成核苷酸-缀合物复合物的不同子集(步骤102),其中顺序形成的核苷酸-缀合物复合物的每个不同子集中的每个核苷酸-缀合物复合物仅衍生自并入到新生核酸拷贝链中的不同核苷酸之一(例如,核苷酸-缀合物复合物并入到新生核酸内)。在一些实施例中,将顺序形成核苷酸-缀合物复合物的不同子集的步骤进行三次。在其他实施例中,将顺序形成核苷酸-缀合物复合物的不同子集的步骤进行四次。
在一些实施例中,核苷酸-缀合物复合物的不同子集的顺序形成(步骤102)包括:引入包含可检测标记物且仅与并入到互补新生核酸拷贝链中的四种不同核苷酸之一正交反应的缀合物(步骤110);通过检测每个引入的缀合物的标记物来检测子集内的每个核苷酸-缀合物复合物的形成(步骤111);确定子集内的每个检测到的核苷酸-缀合物复合物在固体支持物内的位置(步骤112);以及任选地从子集内的所形成的可检测核苷酸-缀合物复合物中的每一个切割至少一个可检测标记物(步骤113)。在一些实施例中,每个引入的缀合物包含反应性基团,所述反应性基团包含寡核苷酸序列,所述寡核苷酸序列与偶联至并入的核苷酸之一的寡核苷酸序列互补。
本领域技术人员将理解,上述过程是用于与固体支持物上的多个靶多核苷酸分子互补的新生核酸拷贝链的单次延伸。然后可以针对与固体支持物上的多个靶多核苷酸分子互补的新生核酸拷贝链的每次迭代延伸重复该过程。在互补的新生核酸拷贝链可以进一步延伸之前(即在可以进行另一个循环之前),3′-羟基保护基必须从在步骤101并入的四种不同核苷酸上切割(步骤103)。此外,如果任何可检测标记物尚未被切割,则可检测标记物必须在下一次延伸之前被切割。在一些实施例中,可检测标记物和3′-羟基保护基同时被切割并且使用相同的试剂。在一些实施例中,核苷酸-缀合物复合物的不同子集的顺序形成和检测有助于确定在每次迭代延伸期间并入到每个新生核酸链中的每个核苷酸。
图2A和2B进一步说明了目前公开的对多个不同靶多核苷酸分子(例如排列在固体支持物上的多个不同靶多核苷酸分子)进行测序的方法,其中该方法包括用具有标记的不同缀合物顺序标记不同的并入的核苷酸。在一些实施例中,固体支持物是装载有待测序的核酸文库的流动池。在一些实施例中,首先将四种不同核苷酸中的一种并入到固体支持物上存在的每个互补新生核酸拷贝链中(步骤201),其中四种不同核苷酸中的每种包含(i)3′-羟基保护基,和(ii)通过可切割接头与核碱基偶联的反应性基团,并且其中四种不同核苷酸中的每个不同核苷酸包含不同核碱基和不同反应性基团。在一些实施例中,通过将式(IA)或(IB)的四种不同核苷酸的池引入流动池并入到核苷酸,其中四种不同核苷酸中的每种包含不同的核碱基(例如A、G、C,T/U)和不同的Z1部分。
在一些实施例中,四种不同核苷酸中的第一种具有式(IC)的结构;四种不同核苷酸中的第二种具有式(ID)的结构;四种不同核苷酸中的第三种具有式(IE)的结构;并且四种不同核苷酸中的第四种具有式(IF)的结构,条件是反应性基团Z1A、Z1B、Z1C、和Z1D各不相同。在一些实施例中,Z1A、Z1B、Z1C、和Z1D基团中的每一个包含不同的寡核苷酸。在一些实施例中,Z1A、Z1B、Z1C、和Z1D基团中的每一个包含不同的LNA修饰的寡核苷酸。在一些实施例中,Z1A、Z1B、Z1C、和Z1D基团中任一个的不同的LNA修饰的寡核苷酸具有SEQ ID NO:1至22或SEQID NO:29至50中任一个的序列,并且以其β-L-构型使用。
随后,顺序标记并入到每个新生核酸链中的四种不同核苷酸中的至少三种(步骤202)。在一些实施例中,通过依次引入三种不同的缀合物,例如具有式(IIA)至(IIE)中任一个的三种不同缀合物,依次标记并入到每个新生核酸链中的四种不同核苷酸中的至少三种。在一些实施例中,通过依次引入四种不同的缀合物,例如具有式(IIA)至(IIE)中任一个的四种不同缀合物,依次标记并入到每个新生核酸链中的四种不同核苷酸中的所有四种。在一些实施例中,式(IIA)至(IIE)中任一个的每种不同引入的缀合物仅与四种不同的并入的核苷酸中的一种正交反应。在一些实施例中,式(IIA)至(IIE)中任一个的缀合物中的每一个具有包含寡核苷酸的反应性部分。在一些实施例中,式(IIA)至(IIE)中任一个的缀合物中的每一个具有包含LNA修饰的寡核苷酸的反应性部分。在一些实施例中,引入的缀合物的不同LNA修饰的寡核苷酸具有SEQ ID NO:29至50或SEQ ID NO:1至22中任一个的序列,条件是为缀合物选择的任何LNA修饰的寡核苷酸序列与并入的核苷酸的LNA修饰的寡核苷酸序列之一互补。
例如,如果Z1A包含具有SEQ ID NO:6的寡核苷酸,则缀合物将包含具有SEQ ID NO:34的互补寡核苷酸。再举例来说,如果Z1B包含具有SEQ ID NO:19的寡核苷酸,则缀合物将包含具有SEQ ID NO:47的互补寡核苷酸。例如,如果Z1C包含具有SEQ ID NO:4的寡核苷酸,则缀合物将包含具有SEQ ID NO:32的互补寡核苷酸。例如,如果Z1D包含具有SEQ ID NO:31的寡核苷酸,则缀合物将包含具有SEQ ID NO:3的互补寡核苷酸。在一些实施例中,每个缀合物包含相同的可检测标记物(例如相同的磁性纳米粒子)。在其他实施例中,至少一种缀合物包含可检测标记物,该可检测标记物不同于偶联至其他缀合物的可检测标记物。
以这种方式,核苷酸-缀合物复合物的不同子集(例如具有式(III)的那些)通过标记过程顺序形成并且独立检测。鉴于不同缀合物的顺序添加及其与不同并入的核苷酸的正交反应性,不同并入的核苷酸的顺序标记允许顺序确定并入到新生核酸拷贝链中的不同核苷酸在固体支持物或流动池内的位置。
转到图2B,在一些实施例中,每个顺序标记(步骤202)包括:引入包含可检测标记物并且仅与并入到互补核酸链中的四种不同核苷酸中的一种正交反应以提供一种或多种标记核苷酸的缀合物(步骤210);检测一种或多种标记核苷酸的标记物(步骤211);基于检测到的标记物,识别一种或多种标记核苷酸在固体支持物或流动池内的位置(步骤212);和任选地从一个或多个经标记的核苷酸切割至少一个可检测标记物(步骤213)。在一些实施例中,顺序标记的步骤(步骤202)用三种不同的缀合物进行三次(例如以形成三组不同的可检测的、标记的并入的核苷酸)。在其他实施例中,顺序标记的步骤(步骤202)用四种不同的缀合物进行四次(例如以形成四组不同的可检测的、标记的并入的核苷酸)。
本领域技术人员将理解,上述过程(步骤201和202)是用于与固体支持物上或流动池内的多个靶多核苷酸分子互补的新生核酸拷贝链的单次延伸。然后可以针对与固体支持物上的多个靶多核苷酸分子互补的新生核酸拷贝链的每次迭代延伸重复该过程。在互补的新生核酸拷贝链可以进一步延伸之前(即在可以进行另一个循环之前),3′-羟基保护基必须从在步骤201并入的四种不同核苷酸上切割(步骤203)。此外,必须在下一次延伸之前去除任何剩余的尚未被切割的可检测标记物。在一些实施例中,3′-羟基保护基和可检测标记物通过引入相同试剂而去除。
参考图3所示,在一些实施例中,本公开提供了一种对固体支持物上的多个不同靶多核苷酸分子进行测序的方法。在一些实施例中,该方法包括(i)将四种不同核苷酸中的一种并入到与多个靶多核苷酸中的每一个互补的核酸链中,其中四种不同核苷酸中的每一种包含通过可切割接头偶联至核碱基的反应性基团和3′-羟基保护基,并且其中四种不同核苷酸中的每种不同核苷酸包含不同的核碱基和不同的反应性基团(步骤301)。在一些实施例中,四种不同的核苷酸具有式(IA)或(IB)中的任一个中提供的结构。
随后,该方法包括(ii)通过引入具有可检测标记物的第一缀合物来标记四种不同并入的核苷酸中的第一种,该第一缀合物与四种不同并入的核苷酸中的第一种正交反应(步骤310)。在一些实施例中,第一缀合物具有式(IIA)至(IIE)中任一者的任何缀合物的结构。如图3所示,四种不同核苷酸中的第一种包含腺嘌呤核碱基,因此第一种缀合物仅与那些并入的腺嘌呤核苷酸反应。在一些实施例中,第一缀合物的引入导致可检测的第一核苷酸-缀合物复合物的形成。
接下来,该方法包括(iii)通过检测四种不同并入的核苷酸中的第一种的标记来确定其中并入到四种不同核苷酸中的第一种的互补核酸链的固体支持物内的位置(步骤311)。然后,该方法包括(iv)任选地从四种不同的并入的核苷酸中的第一种切割可检测标记物(步骤312)。然后对至少还有两个不同的并入的核苷酸(例如那些在步骤301并入的核苷酸)重复该过程。
在一些实施例中,该方法包括(v)通过引入具有可检测标记物的第二缀合物来标记四种不同并入的核苷酸中的第二种,该第二缀合物与四种不同并入的核苷酸中的第二种正交反应(步骤320)。在一些实施例中,第二缀合物具有式(IIA)至(IIE)中任一者的任何缀合物的结构。如图3所示,四种不同核苷酸中的第二种包含鸟嘌呤核碱基,因此第二种缀合物仅与那些并入的鸟嘌呤核苷酸反应。在一些实施例中,第二缀合物的引入导致可检测的第二核苷酸-缀合物复合物的形成。
接下来,该方法包括(vi)通过检测四种不同并入的核苷酸中的第二种的标记来确定其中并入到四种不同核苷酸中的第二种的互补核酸链的固体支持物内的位置(步骤321)。然后该方法包括(vii)任选地从四种不同的并入的核苷酸中的第二种切割可检测标记物(步骤322)。
在一些实施例中,该方法进一步包括(viii)通过引入具有可检测标记物的第三缀合物来标记四种不同并入的核苷酸中的第三种,该第三缀合物与四种不同并入的核苷酸中的第三种正交反应(步骤330)。在一些实施例中,第三缀合物具有式(IIA)至(IIE)中任一者的任何缀合物的结构。如图3所示,四种不同核苷酸中的第三种包含胞嘧啶核碱基,因此第三种缀合物仅与那些并入的胞嘧啶核苷酸反应。在一些实施例中,第三缀合物的引入导致可检测的第三核苷酸-缀合物复合物的形成。
接下来,该方法包括(ix)通过检测四种不同并入的核苷酸中的第三种的标记来确定其中已经并入到四种不同核苷酸中的第三种的互补核酸链的固体支持物内的位置(步骤331)。在一些实施例中,该方法进一步包括(x)任选地从四种不同的并入的核苷酸中的第三种切割可检测标记物的步骤(步骤332)。
在一些实施例中,其中已并入到四种不同核苷酸中的第四种的互补核酸链在固体支持物内的位置是通过推断确定的。例如,通过知道第一个、第二个和第三个并入的核苷酸的位置(例如通过上面列举的步骤),第四个并入的核苷酸的位置可以通过识别那些尚未检测到的位置来确定。
在一些实施例中,该方法包括(xi)通过引入具有可检测标记物的第四缀合物来标记四种不同并入的核苷酸中的第四种,该第四缀合物与四种不同并入的核苷酸中的第四种正交反应(步骤340)。在一些实施例中,第四缀合物具有式(IIA)至(IIE)中任一者的任何缀合物的结构。如图3所示,四种不同核苷酸中的第四种包含胸腺嘧啶或尿嘧啶核碱基,因此第四种缀合物仅与那些并入的胸腺嘧啶或尿嘧啶核苷酸反应。在一些实施例中,第四缀合物的引入导致可检测的第四核苷酸-缀合物复合物的形成。在一些实施例中,该方法包括(xii)通过检测四种不同并入的核苷酸中的第四种的标记来确定其中已经并入到四种不同核苷酸中的第四种的互补核酸链的固体支持物内的位置(步骤341)。在一些实施例中,可检测标记物然后可以任选地被切割(步骤342)。
在一些实施例中,该方法进一步包括从每个并入的核苷酸中去除3′-羟基保护基(步骤302),例如,从步骤(i)中并入的所有核苷酸中去除3′-羟基保护基(参见步骤302)。在一些实施例中,该方法还包括去除任何剩余的尚未被切割的可检测标记物。在其他实施例中,任何剩余的可检测标记物与3′-羟基保护基同时被去除。在一些实施例中,例如对于每个循环,至少重复步骤(i)至(ix)。在其他实施例中,例如对于每个循环,至少重复步骤(i)至(x)。在其他实施例中,重复步骤(i)至(xii)。
图4A说明在核酸拷贝链延伸期间并入的四种不同核苷酸的顺序鉴定。特别地,图4A说明在核酸拷贝链延伸期间并入的四种不同核苷酸中的至少三种的顺序标记和检测。在一些实施例中,四种不同并入的核苷酸中的至少三种的顺序标记提供了至少三种不同的核苷酸-缀合物复合物的形成,其中每种不同的形成的核苷酸-缀合物复合物衍生自不同的并入的核苷酸。
在一些实施例中,并且参考图4A的小图A,首先将四种不同核苷酸的池(例如式(IA)的那些)添加到流动池中。如小图A中所示,这四种不同核苷酸中的每一种都并入到四种不同的新生核酸链之一(标记为“链1”、“链2”、“链3”和“链4”)。如小图A中进一步描述的,四种并入的核苷酸中的每一种都包含不同的Z1部分(Z1A、Z1B、Z1C,Z1D),它们能够与引入缀合物(例如具有式(IIA)的那些)的不同的Z2部分(Z2A、Z2B、Z2C、Z2D)正交“反应”。此外,四种不同的并入的核苷酸中的每一种都包含不同的核碱基,此处为A、G、C和T。对于这个特定的实例,假设核苷酸的Z1A部分与缀合物的Z2A部分反应;核苷酸的Z1B部分与缀合物的Z2B部分反应;核苷酸的Z1C部分与缀合物的Z2C部分反应;并且核苷酸的Z1D部分与缀合物的Z2D部分反应。
随后,可以将第一缀合物(例如式(IIA)的第一缀合物)引入流动池,在该实例中,第一缀合物是包含Z2B部分的第一缀合物。鉴于第一缀合物的Z2B部分仅与并入到链2的第一个核苷酸的Z1B部分反应,只有并入到链2的第一个核苷酸被标记(参见图4A的小图B中的“星”)。换句话说,形成可检测的第一核苷酸-缀合物复合物,其中该第一核苷酸-缀合物复合物对应于具有鸟嘌呤核碱基和Z1B部分的第一并入的核苷酸。然后可以检测该第一个标记的核苷酸(或第一个核苷酸-缀合物复合物),允许确定并入到链2的核苷酸。在一些实施例中,在第一个并入的核苷酸被标记(或形成第一核苷酸-缀合物复合物)之后,可检测标记物任选地从第一个并入的核苷酸(或第一核苷酸-缀合物复合物)上切割下来。
然后重复该过程,使得在延伸期间并入的至少两个其他核苷酸被顺序标记。例如后,可以将(例如式(IIA)的第二缀合物)的第二缀合物引入流动池,在该实例中,第二缀合物是包含Z2D部分的第二缀合物。鉴于第二缀合物的Z2D部分仅与并入到链4的第二个核苷酸的Z1D部分反应,只有并入到链4的第二个核苷酸被标记(参见图4A的小图C中的“星”)。换句话说,形成可检测的第二核苷酸-缀合物复合物,其中该第二核苷酸-缀合物复合物对应于具有胸腺嘧啶核碱基和Z1D部分的并入的式(IA)的核苷酸。然后可以检测该第二个标记的核苷酸(或第二个核苷酸-缀合物复合物),允许确定并入到链4的核苷酸。在一些实施例中,在检测到第二并入的核苷酸的标记物后,可检测标记物任选地从第二并入的核苷酸上切割下来。
在一些实施例中,可以将第三缀合物(例如式(IIA)的第三缀合物)引入流动池,在该实例中,第三缀合物是包含Z2C部分的第三缀合物。鉴于第三缀合物的Z2C部分仅与并入到链3的第三个核苷酸的Z1C部分反应,只有并入到链3的第三个核苷酸被标记(参见图4A的小图D中的“星”)。换句话说,形成可检测的第三核苷酸-缀合物复合物,其中该第三核苷酸-缀合物复合物对应于具有胞嘧啶碱基和Z1C部分的第三并入的核苷酸。然后可以检测该第三个标记的核苷酸,允许确定并入到链3的核苷酸。在一些实施例中,然后在检测到第三并入的核苷酸的标记物后,可检测标记物任选地从第三并入的核苷酸上切割下来。在一些实施例中,第四次执行该过程以标记和检测并入到链1中的第四个核苷酸(参见图4A的小图E,其中“星”表示并入的腺嘌呤核苷酸的标记)。在其他实施例中,可以通过推断来检测并入到链1的核苷酸。在一些实施例中,可检测标记物在每次检测后不被切割,而是在下一次延伸之前被切割,同时3′-羟基保护基被去除。
一旦鉴定了每个新生核酸拷贝链中的所有并入的核苷酸,可以去除存在于任何并入的式(IA)的核苷酸上的3′-羟基保护基,使得可以进一步延伸每个新生核酸拷贝链。在去除所有3′-羟基保护基之后,随后可以添加四种不同核苷酸的池,以进一步延伸每个新生核酸拷贝链。再一次,四个添加的核苷酸中的每一个都包含不同的核碱基和不同的Z1部分(Z1A、Z1B、Z1C、Z1D),它们能够与引入的具有式(IIA)的缀合物的不同的Z2部分(Z2A、Z2B、Z2C、Z2D)正交“反应”。图4A的小图F说明了四个核酸拷贝链的第二次延伸,特别是不同核苷酸并入到四个核酸拷贝链中。在该实施例中,并入到链1和2的式(IA)的核苷酸均相同,而并入到链3和4的式(IA)的核苷酸均不同。随后,然后可以顺序添加式(IIA)的不同缀合物(例如以与上述相同的顺序)。针对多个核酸拷贝链延伸循环,该过程可以重复。
本公开的合成测序的方法参考图4B进一步说明,其说明核苷酸-缀合物复合物(例如具有式(III)的那些核苷酸-缀合物复合物)的不同子集的顺序形成和检测。而图4A说明了将并入到四个不同的新生核酸链中的不同核苷酸(例如式(IA)的那些)顺序标记和检测到,B扩展了这个概念并且说明了本公开在平行测序中的效用。特别是,图4B说明式(IIA)的不同缀合物的顺序引入,使得具有不同并入的式(IA)的核苷酸的核酸拷贝链的不同群体可以被顺序地标记和检测。
参考图4B的小图A,假设式(IA)或(IB)中任一个的四种不同核苷酸的池以混合物的形式引入流动池400,其中式(IA)的四种不同核苷酸中的每一种具有不同的核碱基(例如A、G、C、T)和不同的部分Z1。此处,提供给流动池400的任何式(IA)或(IB)的四种不同核苷酸中的每一种独立地作为第一碱基并入到每个单独的新生核酸链中。在该实例中,式(IA)或(IB)中任一个的四种不同核苷酸的并入到代表每个单独的新生核酸链的第一次延伸。
在第一次延伸之后,然后将式(IIA)至(IIE)中任一个的第一缀合物添加至流动池400,其中式(IIA)至(IIE)中任一个的第一缀合物包含部分Z2,其仅与并入到新生核酸中的四种不同核苷酸中的第一种发生反应。例如,式(IIA)至(IIE)中任一个的第一缀合物可以包含仅与具有Z1B部分的式(IA)的并入的核苷酸反应的Z2B部分。式(IIA)至(IIE)中任一个的第一缀合物的引入导致形成式(III)的可检测的核苷酸-缀合物复合物的第一子集(例如并入到新生核酸内的核苷酸-缀合物复合物的第一子集)。鉴于式(IIA)至(IIE)中任一个的第一缀合物的正交反应性,在可检测的核苷酸-缀合物复合物的第一子集中每个形成的可检测第一核苷酸-缀合物复合物仅衍生自并入到新生核酸链中的式(IA)或(IB)中任一个的核苷酸中之一。通过检测核苷酸-缀合物复合物的第一子集中的一个或多个形成的第一核苷酸-缀合物复合物的标记,可以确定核酸拷贝链在具有第一个并入的四种不同核苷酸的流动池400中的位置(在小图A中,每个用“X”表示)。在一些实施例中,第一子集中每个形成的第一可检测核苷酸-缀合物复合物的可检测标记物可以被切割(这些核苷酸不再可检测,因此在图4B的小图B中由“-”表示)。然后可以重复该过程,例如再重复两次或再重复三次。
例如,然后将式(IIA)至(IIE)中任一个的第二缀合物添加至流动池400,其中式(IIA)至(IIE)中任一个的第二缀合物包含部分Z2,其仅与并入到新生核酸中的四种不同核苷酸中的第二种发生反应。例如,式(IIA)至(IIE)中任一个的第二缀合物可以包含仅与具有Z1D部分的式(IA)的并入的核苷酸反应的Z2D部分。式(IIA)至(IIE)中任一个的第二缀合物的引入导致形成式(III)的可检测核苷酸-缀合物复合物的第二子集。鉴于式(IIA)至(IIE)中任一个的第二缀合物的正交反应性,在可检测的核苷酸-缀合物复合物的第二子集中每个形成的可检测第二核苷酸-缀合物复合物仅衍生自并入到新生核酸链中的式(IA)或(IB)中任一个的核苷酸中之一。通过检测核苷酸-缀合物复合物的第二子集中的一个或多个形成的第二核苷酸-缀合物复合物的标记,可以确定核酸拷贝链在具有第二个并入的四种不同核苷酸的流动池400中的位置(在小图B中,每个用“X”表示)。在一些实施例中,第二子集中每个形成的第二可检测核苷酸-缀合物复合物的可检测标记物可以被切割(这些核苷酸不再可检测,因此在图4B的小图C中由“-”表示)。
参考图4B的小图C和D,在一些实施例中,上述步骤进行第三次并且任选地进行第四次,使得可以顺序形成和检测核苷酸-缀合物复合物的第三子集(衍生自并入到新生核酸链中的四种不同核苷酸中的第三种)和的核苷酸-缀合物复合物的第四子集(衍生自并入到新生核酸链中的四种不同核苷酸中的第四种)。一旦已经检测到并入到新生核酸拷贝链中的所有四种碱基的位置,则去除任何剩余的可检测标记物。此外,然后可以去除式(IA)或(IB)中任一个的四种不同并入的核苷酸中的每一种的3′-羟基保护基,以促进流动池400内的每一种单独的新生核酸的第二次延伸。
在其他实施例中,上述过程仅进行第三次,使得仅可以检测到核苷酸-缀合物复合物的第三子集(衍生自并入到新生核酸链中的四种不同核苷酸中的第三种)。在该特定实施例中,可通过推断确定并入到新生核酸链中的四种不同核苷酸中的第四种。例如,通过知道检测到的标记的位置,这些标记对应于流动池400内的并入到新生核酸拷贝链中的第一个、第二个和第三个核苷酸,可以通过鉴定那些尚没有检测到标记的位置来确定并入到新生的核酸拷贝链中的第四个核苷酸的位置。
在一些实施例中,对多个靶多核苷酸分子进行测序的方法包括:(a)将核酸链结合到流体室内的近端壁;(b)在一轮或多轮添加中,向流体室添加(i)可延伸引物,和(ii)核酸聚合酶的多个分子;(c)向流体室添加四种不同的核苷酸,其中四种不同的核苷酸中的每一种都包含(i)3′-羟基保护基,和(ii)通过可切割接头与核碱基偶联的反应性基团,并且其中四种不同核苷酸中的每种不同核苷酸包含不同的核碱基和不同的反应性基团;(d)对多个靶多核苷酸分子进行测序,其中对多个靶多核苷酸分子进行测序包括顺序地形成核苷酸-缀合物复合物的不同子集,其中形成的核苷酸-缀合物复合物的每个不同子集内的每个核苷酸-缀合物复合物来源于引入流体室并并入到与多个靶多核苷酸分子中的每一个互补的新生核酸拷贝链中的不同核苷酸中的仅一种核苷酸。
在一些实施例中,核苷酸-缀合物复合物的不同子集的顺序形成包括:引入包含可检测标记物且仅与并入到互补新生核酸拷贝链中的四种不同核苷酸之一正交反应的缀合物;通过检测每个引入的缀合物的标记物来检测子集内的每个核苷酸-缀合物复合物的形成;确定子集内的每个检测到的核苷酸-缀合物复合物在固体支持物内的位置;以及任选地从子集内的所形成的可检测核苷酸-缀合物复合物中的每一个切割至少一个可检测标记物。
合适的聚合酶的一些实例包括缺乏3′-5′外切核酸酶活性的B家族(B型)聚合酶。
在一些实施例中,聚合酶是热稳定聚合酶。热稳定核酸聚合酶包括水生栖热菌(Thermus aquaticus)Taq DNA聚合酶、栖热菌属(Thermus)物种Z05聚合酶、黄栖热菌(Thermus flavus)聚合酶、海栖热袍菌(Thermotoga maritima)聚合酶例如TMA-25和TMA-30聚合酶、Tth DNA聚合酶、高温球菌属(Thermococcus)物种9°N(和变体Therminator DNA聚合酶和Therminator II DNA聚合酶)、强烈火球菌(Pyrococcus furiosus)(Pfu)、鸟兹炽热球菌(Pyrococcus woesei)(Pwo)、Thermatoga maritima(Tma)和嗜热高温球菌(Thermococcus Litoralis)(Tli或Vent)、其突变体等。
在一些实施例中,聚合酶缺乏可检测的5′-3′外切核酸酶活性。基本上缺乏5′到3′核酸酶活性的DNA聚合酶的实例包括大肠杆菌DNA聚合酶I的Klenow片段;一种缺乏N末端235个氨基酸的水生栖热菌DNA聚合酶(Taq)(“Stoffel片段”),参见美国专利号5,616,494。其他实例包括具有足够缺失(例如,N末端缺失)、突变或修饰以消除或灭活负责5′-3′核酸酶活性的结构域的热稳定DNA聚合酶。参见例如美国专利No.5,795,762。
在一些实施例中,聚合酶缺乏可检测的3′-5′外切核酸酶活性。基本上缺乏3′-5′核酸外切酶活性的DNA聚合酶的实例包括Taq聚合酶及其衍生物和任何具有校对结构域的天然存在或工程缺失的B家族(B型)聚合酶。
在一些实施例中,聚合酶已被修饰或工程改造以使得能够或增强核苷酸类似物例如3′-修饰的核苷酸的并入到;参见例如美国专利号10,150,454、9,677,057和9,273,352。
在一些实施例中,聚合酶已被修饰或工程改造以使得能够或增强核苷酸类似物例如5′-磷酸-修饰的核苷酸的并入到;参见例如美国专利号10,167,455和8,999,676。在一些实施例中,此类聚合酶是phi29衍生的聚合酶;参见例如美国专利号8,257,954和8,420,366。在一些实施例中,此类聚合酶是phiCPV4衍生的聚合酶;参见例如美国专利公开号US20180245147。
在一些实施例中,聚合酶通过选择被修饰或工程化,从而成功并入到所需的修饰核苷酸或以所需的准确性和持续合成能力并入到核苷酸和核苷酸类似物。选择此类修饰聚合酶的方法是本领域已知的;参见,例如,标题为“Polymerase Compositions and Methodsof Making and Using Same”的美国专利公开号US20180312904A1。
核苷酸和缀合物的合成
下面列出的是本文所述的核苷酸和缀合物的合成的实例。
实例1-5′-硫醇修饰的β-L-LNA寡核苷酸的合成:
使用标准的自动固相DNA合成程序并应用亚磷酰胺化学方法,在ABI 394 DNA合成仪上以2x1μmol规模合成5′-硫醇修饰的LNA寡核苷酸。将Glen UnySupport PS(GlenResearch目录号26-5040)和β-L-LNA亚磷酰胺以及硫醇改性剂C6 S-S(Glen Research目录号10-1936)用作构建单元。根据文献(Bioorg.Med.Chem.Lett.2014,24,2699-2702;Tetrahedron 1998,54,3607-3630;Synthesis 2002,6,802-808),与β-D-LNA亚磷酰胺类似地合成β-L-LNA亚磷酰胺,但从L-葡萄糖而不是D-葡萄糖开始,这些文献的公开内容通过引用整体并入本文。在DNA级乙腈中,所有亚磷酰胺的浓度为0,1M。使用具有延长的偶联时间(180秒)、延长的氧化时间(45秒)和去三苯甲基化时间(85秒)的标准DNA循环以及标准合成试剂和溶剂。合成寡核苷酸为DMTon。应用标准切割程序通过浓氨从支持物上切割LNA寡核苷酸,残留的保护基也通过用浓氨处理(56℃下8h)进行切割。将粗制5′-二硫键修饰的β-L-LNA寡核苷酸蒸发并通过RP HPLC纯化(柱:PRP-1,7μm,250x21.5mm(Hamilton,部件号79352)),使用0,1M三乙基乙酸铵pH 7/乙腈梯度。合并产物级分,通过对水透析(MWCO1000,SpectraPor 6,部件号132638)脱盐并且浓缩。此后,在室温下用磷酸盐缓冲液中的100mM DTT pH 8.3-8.5在30分钟内切割二硫键。然后通过对水透析(MWCO 1000,SpectraPor 6,部件号132638)使5′-硫醇修饰的寡核苷酸脱盐,定量并且冻干。
产量范围为约200至400nmol。
通过RP18 HPLC(Chromolith RP18e,Merck,part no.1.02129.0001)使用0,1M pH7的三乙基乙酸铵/乙腈梯度对5′-硫醇修饰的β-L-LNA寡核苷酸进行分析。典型的纯度>90%。LC-MS分析证实了5′-硫醇修饰的β-L-LNA寡核苷酸的身份。
5′-HS-己基-β-LNA(TATCGC)-3′(SEQ ID NO:19)
5′-HS-己基-β-LNA(TCTTCC)-3′(SEQ ID NO:6)
5′-HS-己基-β-LNA(CTGTCA)-3′(SEQ ID NO:4)
5′-HS-己基-β-LNA(ACCAAC)-3′(SEQ ID NO:31)
实例2-5′-氨基修饰的β-L-LNA寡核苷酸的合成
使用标准的自动固相DNA合成程序并应用亚磷酰胺化学方法,在ABI 394 DNA合成仪上以2x1μmol规模合成5′-氨基修饰的LNA寡核苷酸。将Glen UnySupport PS(GlenResearch目录号26-5040)和β-L-LNA亚磷酰胺(参见欧洲专利申请号19179046.8,2019年6月7日提交,标题为“Hybridizing all-LNA核苷酸”,其公开内容通过引用整体并入本文)以及间隔基亚磷酰胺18(Sp18)(Glen Research目录号10-1918)和5′-氨基-修饰剂C6亚磷酰胺(Glen Research目录号10-1906)用作构建单元。在DNA级乙腈中,所有亚磷酰胺的浓度为0,1M。具有延长偶联时间(240秒)和延长氧化(45秒)的标准DNA循环以及标准合成试剂和溶剂用于组装MMTon合成的5′-氨基修饰的β-L-LNA寡核苷酸。应用标准切割程序通过浓氨从支持物上切割LNA寡核苷酸,残留的保护基也通过用浓氨处理(56℃下8h)进行切割。将粗制5’修饰的β-L-LNA寡核苷酸蒸发并通过RP HPLC纯化(柱:PRP-1,12-20μm,250x30mm(Hamilton,部件号79352)),使用0,1M三乙基乙酸铵pH 7/乙腈梯度。合并产物级分并通过针对水进行透析(MWCO 1000,SpectraPor 6,产品号132638)而脱盐,从而也切割了MMTon纯化的寡核苷酸的MMT基团。最后,对5′-氨基修饰的寡核苷酸进行定量和冻干。
典型产量:约300至400nmol。
通过RP18 HPLC(Chromolith RP18e,Merck,part no.1.02129.0001)使用0,1M pH7的三乙基乙酸铵/乙腈梯度对5′-氨基修饰的β-L-LNA寡核苷酸进行分析。典型的纯度>90%。
LC-MS分析证实了5′-氨基修饰的β-L-LNA寡核苷酸的身份。
5′-H2N-己基-Sp18-β-LNA(GCGATA)-3′(SEQ ID NO:47)
5′-H2N-己基-Sp18-β-LNA(GGAAGA)-3′(SEQ ID NO:34)
5′-H2N-己基-Sp18-β-LNA(TGACAG)-3′(SEQ ID NO:32)
5′-H2N-己基-Sp18-β-LNA(GTTGGT)-3′(SEQ ID NO:3)
实例3-核苷酸的合成
本文说明和描述的是合成本公开的核苷酸的方法。
Figure BDA0003698524750000741
Figure BDA0003698524750000751
Figure BDA0003698524750000761
Figure BDA0003698524750000771
Figure BDA0003698524750000781
根据US 2017/0240961 A1中描述的程序合成接头分子1,不同之处在于使用3,6,9,12-四氧杂十四烷-1,14-二胺(CAS 68960-97-4,例如来自Carbosynth(FD164979))而不是PEG12二胺。
在尿嘧啶和胞嘧啶的5位以及7-脱氮腺嘌呤和7-脱氮鸟嘌呤的7位用3-氨基丙-1-炔基基团修饰的3′-O-叠氮甲基-三磷酸核苷(化合物4-7)是根据WO 2004/018497中描述的程序合成的。炔丙基修饰的3′-叠氮甲基-dNTPs(化合物4-7)也可购自MyChem,LLC,SanDiego,Cal。
接头分子3的合成:
将接头分子1(1mmol,534mg)溶解在DMF(10ml)和N-甲基吗啉(1.2ml)中。向该溶液中缓慢添加马来酰亚胺-PEG2-琥珀酰亚胺酯2(Sigma Aldrich 746223)(1.1mmol(468mg))的DMF(10ml)溶液,然后在环境温度下搅拌16h。在真空下去除溶剂。残留物通过添加1M Hcl酸化,产物用乙酸乙酯萃取。合并的有机层用水和盐水洗涤并干燥(Na2SO4)。减压去除溶剂,并且将粗产物(0.8g)用于下一步。
核苷酸接头缀合物8-11的合成:
向接头分子3(11.3mg,13.2μmol)在无水DMF(2ml)中的搅拌溶液中添加N,N′-二琥珀酰亚胺基碳酸酯(3.4mg,13.2μmol)和4-二甲基氨基吡啶(1.6mg,13.2μmol)。将反应混合物在环境温度搅拌2h。TLC显示完全转化。该溶液直接用于与0.1M NaHCO3/Na2CO3缓冲液pH8.7(0.3ml)中的核苷酸4-7(13μmol)偶联。将反应混合物在环境温度搅拌3h并通过反相HPLC纯化,得到核苷酸接头缀合物8-11。典型产量为6至8μmol。
核苷酸β-L-LNA缀合物16-19的合成:
将核苷酸接头缀合物8-11(240nmol)和5′-硫醇修饰的β-L-LNA(12-15)(200nmol)各自溶解在2ml Dulbecco磷酸盐缓冲盐水(Sigma D8537)中并混合。在环境温度下10min后,反应完成(通过RP-HPLC控制)。然后将反应混合物针对水进行透析(MWCO 1000,SpectraPor 6,部件号132638),浓缩并通过RP HPLC纯化(柱:XBridge prep C18 5μm OBD,19x250mm(Waters,P/N 186004021),使用0,1M pH 7的三乙基乙酸铵/乙腈梯度。合并产物级分,通过对水透析(MWCO 1000,SpectraPor 6,部件号132638)脱盐,定量并冻干。
产量范围为约120至160nmol。
通过RP18 HPLC (Chromolith RP18e,Merck,part no.1.02129.0001)使用0,1MpH 7的三乙基乙酸铵/乙腈梯度对核苷酸β-L-LNA缀合物16-19进行分析。典型的纯度>95%。LC-MS分析证实了核苷酸β-L-LNA缀合物16-19的身份。
实例4-缀合物的合成
本文说明和描述的是合成本公开的缀合物的方法。
Figure BDA0003698524750000801
使用EDC/磺基-NHS活化羧基氧化铁纳米粒子(直径从5到30nm,例如来自OceanNanoTech),然后使用不同的比率与5′-氨基修饰的β-L-LNA寡核苷酸缀合,以产生具有低寡核苷酸负载的磁性纳米粒子(24-27)。
将0.2mL重新悬浮的(DI水)磁性纳米粒子(5mg/mL)等分到1.5mL微量离心管中,然后添加0.2mL活化缓冲液(25mM MES,pH 6.0)。此后,添加0.01mL磺基-NHS溶液(10mg/mL DI水)和0.01mL EDC溶液(10mg/mL DI水)。将悬浮液在室温下连续混合15min。然后通过NAP-10柱(GE 17-0854-02)分离未反应的EDC/磺基-NHS。将在10mM PBS缓冲液pH 7.4(每1mg纳米粒子5nmol和更低)中的5′-氨基修饰的寡核苷酸添加到从柱中洗脱的磁性纳米粒子中,并在室温连续混合,反应2.5h。此后,将0.1mL淬灭缓冲液(100mM Tris-HCl,pH 7.4)添加到磁性纳米粒子悬浮液中,并在室温连续混合,反应30min。然后通过磁分离去除未缀合的寡核苷酸。将磁性纳米粒子重新悬浮在储存缓冲液(10mM PBS,pH 7.4)中。阴离子交换HPLC或凝胶电泳可用于分离具有不同化学计量的磁性纳米粒子并分离用寡核苷酸单功能化的磁性纳米粒子。
如果寡核苷酸是多重缀合的:
Figure BDA0003698524750000821
实例5
包含Z1的核苷酸或寡核苷酸/多核苷酸与包含Z2的缀合物反应的反应条件(缀合物过量,例如1pM-1mM,优选0.1-25μM(取决于在芯片上的传感器和过量应用):
r.t.下的孵育时间10s至600s,优选10至60sec
1)反应性基团:寡核苷酸
缀合物在缓冲溶液中应用,该缓冲溶液含有例如Tris、Hepes、磷酸钠、氯化钠、乙酸钾(优选pH 6-8;优选盐浓度10-100mM(一价)和/或0-10mM二价离子(Mg2+);可以添加去污剂,例如聚多卡醇(Thesit)。
2)反应性基团:半抗原/抗体
缀合物在缓冲溶液中应用,该缓冲溶液含有例如Tris、Hepes、磷酸钠、氯化钠、乙酸钾(优选pH 6-8;优选盐浓度10-100mM;可以添加去污剂,例如聚多卡醇(Thesit)。
3)反应性基团:主体/客体
缀合物在缓冲溶液中应用,该缓冲溶液含有例如Tris、Hepes、磷酸钠、氯化钠、乙酸钾(优选pH 6-8;优选盐浓度10-100mM;可以添加去污剂,例如聚多卡醇(Thesit)。
4)点击
4a)CuAAC
缀合物在缓冲溶液中应用,该缓冲溶液含有例如Tris、Hepes、磷酸钠、氯化钠、乙酸钾(优选pH 6-8;优选盐浓度10-100mM和点击试剂(0.25mM硫酸铜(II)、1.25mM THPTA配体、5mM抗坏血酸钠、5mM氨基胍);可以添加去污剂,例如聚多卡醇(Thesit)。
4b)无铜点击
缀合物在缓冲溶液中应用,该缓冲溶液含有例如Tris、Hepes、磷酸钠、氯化钠、乙酸钾(优选pH 6-8;优选盐浓度10-100mM;可以添加去污剂,例如聚多卡醇(Thesit)。
4c)TCO/四嗪点击(逆需求狄尔斯-阿尔德环加成反应)
缀合物在缓冲溶液中应用,该缓冲溶液含有例如Tris、Hepes、磷酸钠、氯化钠、乙酸钾(优选pH 6-8;优选盐浓度10-100mM;可以添加去污剂,例如聚多卡醇(Thesit)。
实例6-5′-生物素化的β-L-LNA寡核苷酸的合成
使用标准的自动固相DNA合成程序并应用亚磷酰胺化学方法,在ABI 394 DNA合成仪上以2x1μmol规模合成5′-生物素化的LNA寡核苷酸。将Glen UnySupport PS(GlenResearch目录号26-5040)和β-L-LNA亚磷酰胺(参见欧洲专利申请号19179046.8,2019年6月7日提交,标题为“Hybridizing all-LNA核苷酸”,其公开内容通过引用整体并入本文)以及间隔基亚磷酰胺18(Sp18)(Glen Research目录号10-1918)和5′-生物素亚磷酰胺(GlenResearch目录号10-5950)用作构建单元。在DNA级乙腈中,所有亚磷酰胺的浓度为0,1M。具有延长偶联时间(240秒)和延长氧化(45秒)的标准DNA循环以及标准合成试剂和溶剂用于组装DMToff合成的5′-生物素化的β-L-LNA寡核苷酸。应用标准切割程序通过浓氨从支持物上切割LNA寡核苷酸,残留的保护基也通过用浓氨处理(56℃下8h)进行切割。将粗制5′-生物素化的β-L-LNA寡核苷酸蒸发并通过RP HPLC纯化(柱:PRP-1,12-20μm,250x30mm(Hamilton,部件号79352)),使用0,1M三乙基乙酸铵pH 7/乙腈梯度。合并产物级分,并且通过对水透析(MWCO 1000,SpectraPor 6,部件号132638)脱盐。最后,对5′-生物素化的寡核苷酸进行定量和冻干。
典型产量范围为约200至约400nmol。
通过RP18 HPLC(Chromolith RP18e,Merck,part no.1.02129.0001)使用0,1M pH7的三乙基乙酸铵/乙腈梯度对5′-生物素化的β-L-LNA寡核苷酸进行分析。典型的纯度>90%。
LC-MS分析证实了5′-生物素化的β-L-LNA寡核苷酸的身份。
5′-生物素-Sp18-β-LNA(GCGATA)-3′(SEQ ID NO:47)
5′-生物素-Sp18-β-LNA(GGAAGA)-3′(SEQ ID NO:34)
5′-生物素-Sp18-β-LNA(TGAGTG)-3′(SEQ ID NO:57)
5′-生物素-Sp18-β-LNA(GTTGGT)-3′(SEQ ID NO:3)
实例7-链霉抗生物素蛋白包被的纳米粒子(NP10nm;NP20nm)与不同生物素化的L- LNA的缀合
材料
Figure BDA0003698524750000851
设备
1.5 mL LB-Eppendorf小瓶
Vivaspin(Sartorius 500)的旋转过滤器系统:10K MWCO,过滤器体积100μL,体积上清液约500μL
离心机:Eppendorf 5415D;13 200rpm/16 100rcf最大值
离心机:Eppendorf 5417R;25 000rcf最大值,温度:21℃
恒温摇床
涡旋
实验
进行了3个不同的实验,每个实验有8个样品(2个NP x 4个L-LNA),如下所述:
(A)0.5mg NP;纯化:离心:Eppendorf 5417R;25,000rcf最大值,
Figure BDA0003698524750000852
(B)0.1mg NP;纯化:旋转过滤器10K,0.5mL,离心机:Eppendorf 5415D,8000rpm
(C)0.3mg NP;纯化:旋转过滤器10K,0.5mL,离心机:Eppendorf 5417R,5000rcf
实验(A)
将0.5mg(500μL)的纳米粒子转移到1.5mL LB-eppendorf小瓶中(参见表2)
缓冲液交换:将样品离心(15min(NP20);60min(NP10),25 000rcf)直至上清液无色,去除上清液(10mM PBS,pH 7.4,0.02%NaN3,0.01%BSA),并添加500μL的反应缓冲液KP缓冲液(pH 7.4),样品通过涡旋重新悬浮并再次离心,去除KP缓冲液,最后添加50μL KP缓冲液(cNP=10mg/mL)
取决于链霉抗生物素蛋白纳米粒子的生物素结合能力(以下称为“NP10和NP20的BiKA”,将40倍过量的相应L-LNA(100nmol/mL在KP缓冲液pH 7.4中)添加到纳米粒子悬浮液中,导致反应浓度分别为0.9和1.7mg/mL
使用热摇床进行缀合:1H,,21∞C,1000rpm
纯化:为了去除游离L-LNA,将样品离心(15min(NP20);60min(NP10),25000rcf)直到上清液无色,去除上清液并添加500μL的KP缓冲液(pH 7.4)。该洗涤程序重复两次。
最后,将纳米粒子团块重新悬浮在50μL的KP缓冲液pH 7.4(c=10mg/mL)中
实验(B)和(C)
用于润湿膜的旋转过滤器的预处理:使用2次500μL KP缓冲液pH 7.4进行离心
对于实验(B),将0.1mg(100μL)的纳米粒子转移到旋转过滤器中
对于实验(C),将0.,3mg(300μL)的纳米粒子转移到旋转过滤器中
缓冲液交换:将500μL的反应缓冲液KP缓冲液pH 7.4添加到旋转过滤器中并离心(3min;8000rpm(NP10,NP20)),此过程重复两次
使用100-200μL的KP缓冲液pH 7.4将过滤器中的NP悬浮液转移到1.5mL LB-Eppendorf小瓶中
取决于NP10和NP20的BiKA,添加40倍过量的相应L-LNA(B:100nmol/mL;C:250nmol/mL在KP缓冲液pH 7.4中)至纳米粒子悬浮液中,导致实验B的反应浓度分别为0.5和0.7mg/mL;并且实验C分别为0.9和1.2mg/mL。
使用热摇床进行缀合:1H,21℃,1000rpm
纯化:为了去除游离L-LNA,使用旋转过滤器系统(5-10min,8000rpm)用500μL的KP缓冲液pH 7.4洗涤样品3-6次。在每个离心步骤之后,通过移液将NP重新悬浮在过滤器中。收集滤液,从而经由UV/Vis光谱(260nm)检查L-LNA量/洗涤功效。
最后,将纳米粒子团块重新悬浮在~100μL的KP缓冲液pH 7.4(c=1mg/mL)中
结果
DLS
通过DLS测量分析反应系列A的样品(水中5μL NP悬浮液)
Figure BDA0003698524750000871
样品1、3、5、7(NP10)的DLS测量显示LNA包被的粒子的尺寸分布为约20至约40nm。这些直径与前体粒子(10nm Carboxyl粒子和链霉抗生物素蛋白粒子)相似。
没有观察到通过缀合L-LNA(2700g/mol)的可检测到的尺寸增加。
样品2、4、6、8(NP20)的DLS测量大多是不可测量的。这可能归因于NP20缀合物的聚集问题。
两种链霉抗生物素蛋白包被的粒子(NP10和NP20)都显示出不同的材料特性。
离心过程的应用(有和没有旋转过滤器)导致NP20粒子的聚集。据信NP20粒子粘在过滤膜上。这两个事实导致在与L-LNA的缀合反应中NP20样品的产量降低。这可以通过比较NP10与NP20样品的褐色强度来观察。
使用生物素荧光素的BiKA测定
NP10:BiKA 3030-3060pmol/mg(约3,0nmol/mg)
NP20:BiKA 10.400-11.500pmol/mg(约10,4-11,5nmol/mg)
出乎意料的是,NP20粒子显示的BiKa比NP10粒子高约3至约4倍。
实验中经验确定的NP10和NP20的BiKa被确定为:
NP 10:2.5nmol/mg珠粒
NP 20:1.25nmol/mg珠粒
对于NP10,几乎完全匹配(2.5nmol/mg对3.0nmol/mg)。
对于NP20,实验确定的Bika大约高10倍(1.25nmol/mg对11nmol/mg)。
然而,在所有实验中使用的40倍过量的L-LNA必须足以产生100%的负载,并且这可以通过生物素-荧光素测定(90-100%L-LNA负载)来证实。
附加实施例
一种对排列在固体支持物上的多个靶多核苷酸进行测序的方法,该方法包括:将四种不同核苷酸中的一种并入到与多个靶多核苷酸中的每一个互补的核酸拷贝链中,其中四种不同核苷酸中的每种包含:(i)3′-羟基保护基团,和(ii)一个通过可切割接头与核碱基偶联的反应性基团,并且其中四种不同核苷酸中的每种不同核苷酸包含不同的核碱基和不同的反应性基团;顺序地形成新生核酸链的核苷酸-缀合物复合物的不同子集,其中形成的核苷酸-缀合物复合物的每个不同子集内的每个核苷酸-缀合物复合物仅来源于并入到新生核酸拷贝链中的不同核苷酸中的一种核苷酸,其中核苷酸-缀合物复合物的每个不同子集的顺序形成包括:引入包含可检测标记物且仅与并入到互补核酸链中的四种不同核苷酸之一正交反应的缀合物;通过检测每个引入的缀合物的标记物来检测子集内的每个核苷酸-缀合物复合物的形成;确定子集内的每个检测到的核苷酸-缀合物复合物在固体支持物内的位置;以及任选地从子集内的所形成的可检测核苷酸-缀合物复合物中的每一个切割至少一个可检测标记物。
本说明书中提到的和/或申请数据表中列出的所有美国专利、美国专利申请公开、美国专利申请、国外专利、国外专利以及非专利公开均通过引用整体并入本文。如有必要,可对实施例的各个方面进行修改,从而采用各类专利、申请和公开的概念来提供其他进一步的实施例。
尽管已经参照一些说明性实施例描述了本公开,但应当理解,本领域技术人员可以在本公开原则的精神和范围内设计出许多其他的修改和实施例。更具体地,在不违背本公开的精神的情况下,在上述公开、附图和所附权利要求的范围内,所述主题组合排列的组成部分和/或布置可以进行合理的变化和修改。除了在所述组成部分和/或布置中的变化和修改外,对于本领域技术人员来说,替代用途也将是显而易见的。
Figure IDA0003698524800000011
Figure IDA0003698524800000021
Figure IDA0003698524800000031
Figure IDA0003698524800000041
Figure IDA0003698524800000051
Figure IDA0003698524800000061
Figure IDA0003698524800000071
Figure IDA0003698524800000081
Figure IDA0003698524800000091
Figure IDA0003698524800000101
Figure IDA0003698524800000111
Figure IDA0003698524800000121
Figure IDA0003698524800000131
Figure IDA0003698524800000141
Figure IDA0003698524800000151

Claims (19)

1.一种对排列在固体支持物上的多个靶多核苷酸进行测序的方法,所述方法包括:
(i)将四种不同核苷酸中的一种并入到与所述多个靶多核苷酸中的每一个互补的新生核酸拷贝链中,其中所述四种不同核苷酸中的每种包含:(i)3’-羟基保护基团,和(ii)第一反应性基团,所述第一反应性基团通过可切割接头与核碱基偶联,并且其中所述四种不同核苷酸中的每种不同核苷酸包含不同的核碱基和不同的第一反应性基团;
(ii)顺序地形成核苷酸-缀合物复合物的不同子集,其中所形成的核苷酸-缀合物复合物的每个不同子集内的每个核苷酸-缀合物复合物来源于并入到所述新生核酸拷贝链中的所述不同核苷酸中的仅一种核苷酸,其中核苷酸-缀合物复合物的每个不同子集的顺序形成包括:
a.引入缀合物,所述缀合物包含可检测标记物并且与并入到所述新生核酸链中的所述四种不同核苷酸中的仅一种发生正交反应;
b.通过检测每个引入的缀合物的所述标记物来检测所述子集内的每个核苷酸-缀合物复合物的形成;
c.确定所述子集内的每个所检测到的核苷酸-缀合物复合物在所述固体支持物内的位置;以及
d.任选地从所述子集内的所形成的可检测核苷酸-缀合物复合物中的每一个切割至少一个可检测标记物。
2.根据权利要求1所述的方法,其中所述四种不同核苷酸具有式(IC)、(ID)、(IE)和(IF)的结构:
Figure FDA0003698524740000021
其中
WA是腺嘌呤核碱基,WG是鸟嘌呤核碱基;WC是胞嘧啶核碱基;WR是胸腺嘧啶核碱基或尿嘧啶核碱基中的一者;
Z1A、Z1B、Z1C和Z1D各自是不同的第一反应性基团;
Y是-O-P(O)(OH)[-O-P(O)(OH)]z-OH,其中z的范围是从2至约5;
PG是保护基团;并且
每个L1独立地是具有介于1个与约60个之间的碳原子并且任选地被一个或多个杂原子取代的直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分,前提条件是L1包括一个或多个可切割基团。
3.根据权利要求1所述的方法,其中所述引入的缀合物具有式(IIA)或(IIB)中任一者的结构:
Figure FDA0003698524740000022
其中
D是可检测标记物或包括可检测标记物的缀合物;
L2是具有介于1个与约60个之间的碳原子并且任选地包含一个或多个杂原子的直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分;
Z2是反应性基团;并且
p的范围是从2至约1000。
4.一种确定排列在固体支持物上的多个靶多核苷酸的序列的方法,所述方法包括:
(i)将四种不同核苷酸中的一种并入到与所述多个靶多核苷酸中的每一个互补的新生核酸链中,其中所述四种不同核苷酸中的每种包含通过可切割接头与核碱基偶联的第一反应性基团和3’-羟基保护基团,并且其中所述四种不同核苷酸中的每种不同核苷酸包含不同的核碱基和不同的第一反应性基团;
(ii)顺序地标记并入到所述新生核酸链中的所述四种不同核苷酸中的每一种,其中所述顺序标记包括:
a.引入缀合物以提供一个或多个经标记的核苷酸,所述缀合物包含可检测标记物并且与并入到所述新生核酸链中的所述四种不同核苷酸中的仅一种发生正交反应;
b.检测所述一个或多个经标记的核苷酸的所述标记物;
c.基于所检测到的标记物,识别所述一个或多个经标记的核苷酸在所述固体支持物内的位置;以及
d.任选地从并入到所述新生核酸链中的所述一个或多个经标记的核苷酸切割至少一个可检测标记物。
5.一种具有由式(IA)定义的结构的化合物或其任何盐:
Figure FDA0003698524740000041
其中
Y是-O-P(O)(OH)[-O-P(O)(OH)]z-OH或-O-P(O)(OH)-寡核苷酸,其中z是范围从2至约5的整数;
PG是保护基团;
W是核碱基;
L1是具有介于1个与约60个之间的碳原子并且任选地包含一个或多个杂原子的直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分,前提条件是L1包括一个或多个可切割基团;并且
Z1是寡核苷酸。
6.根据权利要求5所述的化合物,其中Z1包含经LNA修饰或经PNA修饰的寡核苷酸。
7.根据权利要求5所述的化合物,其中Z1包含L-构型单体。
8.根据权利要求5所述的化合物,其中所述Z1寡核苷酸包含选自SEQ ID NO:1至SEQ IDNO:22或SEQ ID NO:29至SEQ ID NO:50中的任一者的序列。
9.根据权利要求5所述的化合物,其中所述至少一个可切割基团选自由以下项组成的组:可化学切割基团、可酶促切割基团和可光切割基团。
10.根据权利要求5所述的化合物,其中所述化合物或其盐具有式(IB)的结构:
Figure FDA0003698524740000051
其中
Y是-O-P(O)(OH)[-O-P(O)(OH)-]z-OH或-O-P(O)(OH)-寡核苷酸,其中z的范围是从2至约5;
PG是保护基团;
W是核碱基;
Q1是具有介于1个与约25个之间的碳原子并且任选地包含一个或多个杂原子的直链或支链的、取代或未取代的、饱和或不饱和的脂肪族部分;
Q2是具有介于1个与45个之间的碳原子并且任选地包含一个或多个杂原子的直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分;
X1是可切割基团;并且
Z1是寡核苷酸。
11.根据权利要求10所述的化合物,其中Q1包含C1-C10直链或支链的、取代或未取代的烷基或杂烷基。
12.根据权利要求10所述的化合物,其中Q2包含C1-C20直链或支链的、取代或未取代的烷基或杂烷基。
13.根据权利要求10所述的化合物,其中X1选自由以下项组成的组:可光切割基团、可酶促切割基团、可化学切割基团和pH敏感基团。
14.一种核苷酸,所述核苷酸包含:(i)3’-羟基保护基团,和(ii)反应性基团,所述反应性基团通过可切割接头与核碱基偶联,其中所述反应性基团包含经LNA修饰的寡核苷酸或经β-L-LNA修饰的寡核苷酸,
其中所述经LNA修饰的寡核苷酸或经β-L-LNA修饰的寡核苷酸包含具有SEQ ID NO:1至SEQ ID NO:22或SEQ ID NO:29至SEQ ID NO:50中的任一者的序列。
15.一种试剂盒,所述试剂盒包括:(i)根据权利要求10至13中任一项所述的化合物或其盐,或根据权利要求14所述的核苷酸或其盐;和(ii)具有式(IIA)或(IIB)中任一者的结构的缀合物:
Figure FDA0003698524740000063
或者
Figure FDA0003698524740000061
其中
D是可检测标记物或包括可检测标记物的缀合物;
L2是具有介于1个与约60个之间的碳原子并且任选地包含一个或多个杂原子的直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分;
Z2是与Z1的所述寡核苷酸互补的寡核苷酸;并且
p是范围为2至约1000的整数。
16.一种试剂盒,所述试剂盒包含一种式(IC)的核苷酸、一种式(ID)的核苷酸、一种式(IE)的核苷酸和一种式(IF)的核苷酸:
Figure FDA0003698524740000062
Figure FDA0003698524740000071
其中
Y是-O-P(O)(OH)[-O-P(O)(OH)]z-OH,其中z的范围是从2至约5;
PG是保护基团;
WA是腺嘌呤核碱基;
WG是鸟嘌呤核碱基;
WC是胞嘧啶核碱基;
WR是胸腺嘧啶核碱基或尿嘧啶核碱基;
L1是具有介于1个与约60个之间的碳原子并且任选地包含一个或多个杂原子的直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分,前提条件是L1包括一个或多个可切割基团;并且
Z1A、Z1B、Z1C和Z1D各自包含不同的第一反应性基团。
17.一种核苷酸-缀合物复合物,其中所述核苷酸-缀合物复合物是通过包含以下项的方法产生的:使(i)具有式(IA)的核苷酸与(ii)具有式(IIA)或(IIB)中的任一者的缀合物反应:
Figure FDA0003698524740000081
其中
Y是-O-P(O)(OH)[-O-P(O)(OH)]z-OH;其中z的范围是从2至约5;
PG是保护基团;
W是核碱基;
L1是具有介于1个与约60个之间的碳原子并且任选地被一个或多个杂原子取代的直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分,前提条件是L1包括一个或多个可切割基团;并且
Z1是第一反应性基团;
Figure FDA0003698524740000083
或者
Figure FDA0003698524740000082
其中
D是可检测标记物或包括可检测标记物的缀合物;
L2是具有介于1个与约60个之间的碳原子并且任选地包含一个或多个杂原子的直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分;
Z2是与所述第一反应性基团Z1正交反应的第二反应性基团;并且
p是范围为2至约1000的整数。
18.一种固体支持物,所述固体支持物包含与其间接偶联的多个新生核酸拷贝链,其中所述多个新生核酸拷贝链各自包含所并入的具有式(IA)的核苷酸:
Figure FDA0003698524740000091
其中
Y是-O-P(O)(OH)-O-寡核苷酸,其中
PG是保护基团;
W是核碱基;
L1是具有介于1个与约60个之间的碳原子并且任选地包含一个或多个杂原子的直链或支链的、取代或未取代的、饱和或不饱和的、脂肪族或芳香族部分,前提条件是L1包括一个或多个可切割基团;并且
Z1是第一寡核苷酸。
19.一种组件,所述组件包含根据权利要求18所述的固体支持物和适于顺序地检测包含磁性纳米颗粒的核苷酸-缀合物复合物的不同的形成的子集的磁性传感器阵列。
CN202080087416.5A 2019-12-18 2020-12-17 通过使用连续标记方案的合成进行测序的方法 Pending CN114829368A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962949461P 2019-12-18 2019-12-18
US62/949461 2019-12-18
PCT/EP2020/086902 WO2021123074A1 (en) 2019-12-18 2020-12-17 Methods of sequencing by synthesis using a consecutive labeling scheme

Publications (1)

Publication Number Publication Date
CN114829368A true CN114829368A (zh) 2022-07-29

Family

ID=74183107

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080087416.5A Pending CN114829368A (zh) 2019-12-18 2020-12-17 通过使用连续标记方案的合成进行测序的方法

Country Status (8)

Country Link
US (1) US20230061438A1 (zh)
EP (1) EP4077344A1 (zh)
JP (1) JP2023506891A (zh)
KR (1) KR20220111315A (zh)
CN (1) CN114829368A (zh)
AU (1) AU2020407267A1 (zh)
CA (1) CA3164781A1 (zh)
WO (1) WO2021123074A1 (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030099950A1 (en) * 2001-10-30 2003-05-29 Hanna Michelle M. Molecular detection systems utilizing reiterative oligonucleotide synthesis
WO2007053719A2 (en) * 2005-10-31 2007-05-10 The Trustees Of Columbia University In The City Of New York Chemically cleavable 3'-o-allyl-dntp-allyl-fluorophore fluorescent nucleotide analogues and related methods
US20070166705A1 (en) * 2002-08-23 2007-07-19 John Milton Modified nucleotides
CN102180924A (zh) * 1999-05-04 2011-09-14 桑塔里斯制药公司 L-核糖-lna类似物
WO2019178393A1 (en) * 2018-03-15 2019-09-19 The Trustees Of Columbia University In The City Of New York Nucleotide analogues and use thereof for nucleic acid sequencing and analysis

Family Cites Families (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4363759A (en) 1978-04-10 1982-12-14 Miles Laboratories, Inc. Chemiluminescent-labeled haptens and antigens
US5795762A (en) 1986-08-22 1998-08-18 Roche Molecular Systems, Inc. 5' to 3' exonuclease mutations of thermostable DNA polymerases
US4981977A (en) 1989-06-09 1991-01-01 Carnegie-Mellon University Intermediate for and fluorescent cyanine dyes containing carboxylic acid groups
EP0450060A1 (en) 1989-10-26 1991-10-09 Sri International Dna sequencing
EP0553264A4 (en) 1990-10-05 1994-07-13 Wayne M Barnes Thermostable dna polymerase
US5990300A (en) 1994-09-02 1999-11-23 Andrew C. Hiatt Enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
JP3756313B2 (ja) 1997-03-07 2006-03-15 武 今西 新規ビシクロヌクレオシド及びオリゴヌクレオチド類縁体
US5866366A (en) 1997-07-01 1999-02-02 Smithkline Beecham Corporation gidB
US6794499B2 (en) 1997-09-12 2004-09-21 Exiqon A/S Oligonucleotide analogues
CN1273476C (zh) 1997-09-12 2006-09-06 埃克西康有限公司 寡核苷酸类似物
DE19821968A1 (de) 1998-05-18 1999-11-25 Studiengesellschaft Kohle Mbh Verfahren zur Modifizierung der Dispergiereigenschaften von metallorganisch-prästabilisierten bzw. -vorbehandelten Nanometallkolloiden
US6254662B1 (en) 1999-07-26 2001-07-03 International Business Machines Corporation Chemical synthesis of monodisperse and magnetic alloy nanocrystal containing thin films
US6399335B1 (en) 1999-11-16 2002-06-04 Advanced Research And Technology Institute, Inc. γ-phosphoester nucleoside triphosphates
AU4305101A (en) 1999-11-22 2001-06-04 Research Foundation Of The State University Of New York, The Magnetic nanoparticles for selective therapy
GB0025414D0 (en) 2000-10-16 2000-11-29 Consejo Superior Investigacion Nanoparticles
US7132275B2 (en) 2001-05-14 2006-11-07 The John Hopkins University Multifunctional magnetic nanowires
US6623198B2 (en) 2001-10-09 2003-09-23 Crown Cork & Seal Company, Inc. Dispenser for cosmetics containing sunscreen
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
GB0129012D0 (en) 2001-12-04 2002-01-23 Solexa Ltd Labelled nucleotides
WO2003072830A1 (en) 2002-02-22 2003-09-04 Purdue Research Foundation Magnetic nanomaterials and methods for detection of biological materials
US7166478B2 (en) 2002-03-12 2007-01-23 Enzo Life Sciences, Inc., C/O Enzo Biochem, Inc. Labeling reagents and labeled targets, target labeling processes and other processes for using same in nucleic acid determinations and analyses
US7569575B2 (en) 2002-05-08 2009-08-04 Santaris Pharma A/S Synthesis of locked nucleic acid derivatives
US7414116B2 (en) 2002-08-23 2008-08-19 Illumina Cambridge Limited Labelled nucleotides
GB0313259D0 (en) 2003-06-09 2003-07-16 Consejo Superior Investigacion Magnetic nanoparticles
US7335768B2 (en) 2003-09-04 2008-02-26 University Of Maryland Cucurbit [n] uril compounds and analogs, and methods of making and using the same
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
EP2789383B1 (en) 2004-01-07 2023-05-03 Illumina Cambridge Limited Molecular arrays
US20070117104A1 (en) 2005-11-22 2007-05-24 Buzby Philip R Nucleotide analogs
JP2008513782A (ja) 2004-09-17 2008-05-01 パシフィック バイオサイエンシーズ オブ カリフォルニア, インコーポレイテッド 分子解析のための装置及び方法
WO2006064199A1 (en) 2004-12-13 2006-06-22 Solexa Limited Improved method of nucleotide detection
JP4990886B2 (ja) 2005-05-10 2012-08-01 ソレックサ リミテッド 改良ポリメラーゼ
WO2007106144A1 (en) 2006-02-28 2007-09-20 University Of Maryland NOR-SECO-, BIS-NOR-SECO, TRIS-NOR-SECO- AND HIGHER NOR-SECO- CUCURBIT[n]URIL COMPOUNDS
EP3373174A1 (en) 2006-03-31 2018-09-12 Illumina, Inc. Systems and devices for sequence by synthesis analysis
WO2008037568A2 (en) 2006-09-04 2008-04-03 Quiatech Ab Reversible terminators for efficient sequencing by synthesis
US8546547B2 (en) 2006-09-15 2013-10-01 Creabilis Therapeutics S.P.A. Polymer conjugates of Box-A of HMGB1 and Box-A variants of HMGB1
CA2858359C (en) 2006-11-01 2018-04-03 Ventana Medical Systems, Inc. Haptens, hapten conjugates, compositions thereof and method for their preparation and use
WO2008153744A2 (en) 2007-05-23 2008-12-18 Ventana Medical Systems, Inc. Polymeric carriers for immunohistochemistry and in situ hybridization
GB0723714D0 (en) 2007-12-04 2008-01-16 Cambridge Entpr Ltd Supramolecular handcuffs in polymeric architecture
US8999676B2 (en) 2008-03-31 2015-04-07 Pacific Biosciences Of California, Inc. Recombinant polymerases for improved single molecule sequencing
US8420366B2 (en) 2008-03-31 2013-04-16 Pacific Biosciences Of California, Inc. Generation of modified polymerases for improved accuracy in single molecule sequencing
WO2009145820A2 (en) 2008-03-31 2009-12-03 Pacific Biosciences Of California, Inc. Generation of modified polymerases for improved accuracy in single molecule sequencing
ES2538123T3 (es) 2008-08-22 2015-06-17 Ventana Medical Systems, Inc. Método para la detección cromogénica de dos o más moléculas diana en una sola muestra
WO2011150212A2 (en) 2010-05-26 2011-12-01 The General Hospital Corporation Magnetic nanoparticles
US8759038B2 (en) 2010-09-29 2014-06-24 Illumina Cambridge Limited Compositions and methods for sequencing nucleic acids
WO2013014452A1 (en) 2011-07-26 2013-01-31 Cambridge Enterprise Limited Supramolecular capsules
US9238836B2 (en) 2012-03-30 2016-01-19 Pacific Biosciences Of California, Inc. Methods and compositions for sequencing modified nucleic acids
EP2876166B1 (en) 2013-11-20 2016-12-14 Roche Diagnostics GmbH New compound for sequencing by synthesis
WO2016054096A1 (en) 2014-09-30 2016-04-07 Illumina, Inc. Modified polymerases for improved incorporation of nucleotide analogues
CN107208074B (zh) 2014-12-16 2021-06-15 生命技术公司 聚合酶组合物和制造与使用其的方法
JP6222166B2 (ja) 2015-05-22 2017-11-01 トヨタ自動車株式会社 車両用ウィンドウォッシャ装置
US20170240961A1 (en) 2016-02-23 2017-08-24 Complete Genomics, Inc. Affinity tag labeled nucleosides and uses
US10590480B2 (en) 2016-02-29 2020-03-17 Roche Sequencing Solutions, Inc. Polymerase variants
CN110248725B (zh) 2016-12-22 2022-08-02 伊鲁米那股份有限公司 包括树脂膜和图案化的聚合物层的阵列
WO2018119101A1 (en) 2016-12-22 2018-06-28 Illumina, Inc. Flow cell package and method for making the same
JP7087010B2 (ja) 2017-12-21 2022-06-20 イラミーナ インコーポレーテッド ヒドロゲルコーティングを有するフローセル

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102180924A (zh) * 1999-05-04 2011-09-14 桑塔里斯制药公司 L-核糖-lna类似物
US20030099950A1 (en) * 2001-10-30 2003-05-29 Hanna Michelle M. Molecular detection systems utilizing reiterative oligonucleotide synthesis
US20070166705A1 (en) * 2002-08-23 2007-07-19 John Milton Modified nucleotides
WO2007053719A2 (en) * 2005-10-31 2007-05-10 The Trustees Of Columbia University In The City Of New York Chemically cleavable 3'-o-allyl-dntp-allyl-fluorophore fluorescent nucleotide analogues and related methods
WO2019178393A1 (en) * 2018-03-15 2019-09-19 The Trustees Of Columbia University In The City Of New York Nucleotide analogues and use thereof for nucleic acid sequencing and analysis

Also Published As

Publication number Publication date
US20230061438A1 (en) 2023-03-02
KR20220111315A (ko) 2022-08-09
AU2020407267A1 (en) 2022-06-16
EP4077344A1 (en) 2022-10-26
JP2023506891A (ja) 2023-02-20
CA3164781A1 (en) 2021-06-24
WO2021123074A1 (en) 2021-06-24

Similar Documents

Publication Publication Date Title
Klöcker et al. Covalent labeling of nucleic acids
JP7334069B2 (ja) 非天然ヌクレオチドの取り込みによるインビトロの核酸の部位特異的な酵素標識のための方法
CN109562376B (zh) 一种基于荧光能量转移的单分子/集群dna合成测序
ES2805004T3 (es) Análogos de nucleótidos
JP5649018B2 (ja) 新規人工塩基対及びその利用
US11891651B2 (en) Compositions and methods for pairwise sequencing
US20140141989A1 (en) Multiplexed identification of nucleic acid sequences
US20060014191A1 (en) Analog probe complexes
WO2002002817A2 (en) Multipartite high-affinity nucleic acid probes
US20060292586A1 (en) ID-tag complexes, arrays, and methods of use thereof
CN107849605A (zh) 核酸测序方法和系统
JP2001288197A (ja) 蛍光ヌクレオチド
JPH02245663A (ja) 高度な特異的活性を有するヌクレオチドプローブの化学的製造方法
WO2006049297A1 (ja) 新規なヌクレオシド若しくはヌクレオチド誘導体及びその利用
Stengel et al. Incorporation of the fluorescent ribonucleotide analogue tCTP by T7 RNA polymerase
JP2024020299A (ja) 全lnaオリゴヌクレオチドのハイブリダイズ
JP2001519354A (ja) ヌクレオシドもしくはヌクレオチド蛍光接合体及びその調製方法と使用方法
CN114829368A (zh) 通过使用连续标记方案的合成进行测序的方法
US7563887B1 (en) Universal nucleobase analogs
US7323319B2 (en) RNA containing coenzymes, biotin, or fluorophores, and methods for their preparation and use
Walunj et al. Advances in the application of Pd-mediated transformations in nucleotides and oligonucleotides
US20080207885A1 (en) Method for site-specific labeling of RNA using a deoxyribozyme
Loakes Nucleotides and nucleic acids; oligo-and poly-nucleotides
Loakes Nucleotides and nucleic acids; oligo-and poly-nucleotides
JP2012110332A (ja) 新規人工塩基対及びその利用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination