CN111094315B - 用于测序应用中的核苷酸的短悬垂臂连接基 - Google Patents

用于测序应用中的核苷酸的短悬垂臂连接基 Download PDF

Info

Publication number
CN111094315B
CN111094315B CN201880041116.6A CN201880041116A CN111094315B CN 111094315 B CN111094315 B CN 111094315B CN 201880041116 A CN201880041116 A CN 201880041116A CN 111094315 B CN111094315 B CN 111094315B
Authority
CN
China
Prior art keywords
compound
nucleotides
nucleotide
formula
labeled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880041116.6A
Other languages
English (en)
Other versions
CN111094315A (zh
Inventor
埃琳娜·克雷西达
A·弗朗西斯
刘小海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Cambridge Ltd
Original Assignee
Illumina Cambridge Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Cambridge Ltd filed Critical Illumina Cambridge Ltd
Publication of CN111094315A publication Critical patent/CN111094315A/zh
Application granted granted Critical
Publication of CN111094315B publication Critical patent/CN111094315B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/06Pyrimidine radicals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/06Pyrimidine radicals
    • C07H19/073Pyrimidine radicals with 2-deoxyribosyl as the saccharide radical
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/06Pyrimidine radicals
    • C07H19/10Pyrimidine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/14Pyrrolo-pyrimidine radicals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/16Purine radicals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/16Purine radicals
    • C07H19/20Purine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Chemical Kinetics & Catalysis (AREA)

Abstract

本公开内容涉及新的核苷酸和寡核苷酸化合物以及它们在核酸测序应用中的用途。所述化合物具有式(I),其中B是核苷酸碱基;并且Fl是通过任选的连接基附接的荧光团。更具体地,所述化合物具有式(c)或式(t),其中p是三磷酸酯基团;并且Fl是通过任选的连接基附接的荧光团,

Description

用于测序应用中的核苷酸的短悬垂臂连接基
通过引用对任何优先权申请的并入
本申请要求于2017年7月12日提交的英国(GB)申请第1711219.4号的优先权的权益,该英国申请通过引用以其整体并入。
背景
领域
本公开内容涉及新的核苷酸和寡核苷酸化合物以及它们在核酸测序应用中的用途。
相关技术描述
随着测序技术的进步,已经发展了对改进的测序试剂的需求,该试剂特别适合高通量分子方法,例如固相测序及类似方法。
在某些类型的高通量测序中,所使用的核苷酸含有荧光团,这些荧光团特异性地识别掺入的碱基。荧光团可以通过可裂解的连接基(linker)被附接至核苷酸碱基。因此,在掺入的碱基被识别之后,连接基可以被裂解,这允许荧光团被移除,为下一个碱基被附接和识别做好准备。这样的裂解留下位于每个检测到的核碱基上的剩余的“疤痕(scar)”或“悬垂臂(pendant arm)”部分。虽然可以设计裂解后不留下任何痕迹的试剂,但这些试剂倾向于裂解慢,并且因此不是特别有效的。需要在标记的核苷酸的有效掺入、移除所有掺入标记物的有效裂解和随后的核苷酸的有效掺入之间找到平衡。本文中描述了优化的核苷酸结构,该优化的核苷酸结构提高了现有技术核苷酸在合成测序(Sequencing-by-Synthesis)(SBS)循环中的性能。
合适的核苷酸连接基在例如WO2004/018493中描述。其中公开的化合物被示出为示例性的式(e):
其中B是核苷碱基(nucleoside base);并且Fl是通过任选的连接基附接的荧光团。这被裂解以留下式(ei)的悬垂臂部分:
申请人已经意识到对悬垂臂的改变可以给出对获得的测序数据的改进。
本文描述了改进的核苷酸结构及其在测序中的应用。所描述的分子可以被掺入到核酸链中。还描述了具有允许更有效的核苷酸掺入的某些修饰的核酸链。还描述了核酸阵列及其在测序中的应用。在使用新的构建体可获得的标记的核苷酸掺入的效率和测序读段的长度和准确性方面可以看到具体改进。下文描述的分子在其中需要长读段长度的情况下或者在其中较短的核苷酸掺入时间是有利的情况下是特别有利的。使用高功率激发源。
概述
本公开内容涉及用于核酸测序的改进的试剂。在其中荧光标记的核苷酸被掺入到延伸的核酸链中的合成测序(SBS)的重复的循环期间,产生了“带疤痕的”DNA引物:模板。“疤痕”或“悬垂臂”是位于每个检测到的核碱基上的部分,这是荧光团从与其附接的核碱基上的化学裂解的结果。这些悬垂链(pendant)在重复的SBS循环中积聚在DNA引物:模板上,产生具有不同于天然DNA引物:模板的分子结构的引物:模板DNA分子。这些残留的悬垂臂减慢了新进入的核苷酸的掺入,并且因此增加了错误率(error rate),并且降低了数据质量,尤其是在测序运行的后期和长的测序运行中。本公开内容的目的是在测序期间最小化在DNA引物:模板上的悬垂臂的尺寸。
根据第一方面,本公开内容提供了式(I)的化合物:
其中B是核苷碱基;并且Fl是通过任选的连接基附接的荧光团。
核苷是具有附接至核碱基的碳水化合物核糖的化合物。核碱基可以是嘌呤或嘧啶。常见的天然存在的嘌呤是腺嘌呤(A)和鸟嘌呤(G)。常见的天然存在的嘧啶是在DNA链中的胞苷(C)和胸腺嘧啶(T)或在RNA链中的尿嘧啶(U)。核糖可以是2'-脱氧核糖(在DNA中)。具有与其附接的磷酸酯部分(phosphate moiety)的核苷是核苷酸,并且因此本文描述的化合物可以呈核苷酸的形式。在本文描述的任何式中,B可以代表核苷酸碱基。
在本文描述的任何式中,B可以代表嘧啶碱基。碱基B可以采取四种常见的天然存在的碱基A、G、C或T/U中的任何一种的形式。磷酸酯部分可以是三磷酸酯部分,该三磷酸酯部分可以被附接至核糖的5'-位。本公开内容的化合物可以包括以下的式(c)、式(t)或式(a)的化合物:
其中p是三磷酸酯基团;并且Fl是通过任选的连接基附接的荧光团。
三磷酸酯部分允许核苷酸化合物掺入到核酸中。使用核酸聚合酶的延伸允许该化合物附接至核酸引物的3'-OH。因此,本公开内容的化合物可以附接至寡核酸(oligonucleic acid)。寡核苷酸可以采取核酸引物的形式,该核酸引物已经经历聚合酶延伸以掺入本公开内容的化合物。因此,本文公开了包含如本文所公开的化合物的寡核苷酸。
公开了附接至寡核苷酸的核苷酸化合物。在化合物被荧光标记的情况下,通常仅单个修饰的化合物将被附接至每个寡核苷酸。因此,公开了寡核苷酸,其中3'-核苷酸是式(I)的化合物:
其中B是核苷碱基;并且Fl是通过任选的连接基附接的荧光团。
为了避免疑问,应当理解,在掺入后,三磷酸酯基团被转化为单磷酸二酯。因此公开了寡核苷酸,在该寡核苷酸中,3'-核苷酸是式(c)、式(t)或式(a)的化合物:
其中p是单磷酸酯基团;并且Fl是通过任选的连接基附接的荧光团。
上述化合物可以可选择地被表示为寡核苷酸,在该寡核苷酸中,3'-核苷酸是式(c)、式(t)或式(a)的化合物:
其中Oln是寡核苷酸;并且Fl是通过任选的连接基附接的荧光团。
在检测到所掺入的核碱基后,荧光标记物和任选的连接基可以被移除。移除是通过叠氮基基团的还原进行的,这导致O-CHNH2-部分的断裂。在裂解后,羟基基团被留下附接至核碱基,并且荧光部分被分离(detach)。
因此,公开了式(II)的化合物:
其中B是核苷酸碱基。
核碱基可以是嘌呤或嘧啶。常见的天然存在的嘌呤是腺嘌呤(A)和鸟嘌呤(G)。常见的天然存在的嘧啶是在DNA链中的胞苷(C)和胸腺嘧啶(T)或在RNA链中的尿嘧啶(U)。核糖可以是2'-脱氧核糖(在DNA中)。
式II的化合物可以被附接至寡核苷酸。因此,部分B可以是被附接至另外的碱基的碱基。因此,公开了寡核苷酸,在该寡核苷酸中,3'-核苷酸是式(ci)、式(ti)或式(ai)的化合物:
其中Oln是寡核苷酸。
具有羟基悬垂臂的寡核苷酸可以在相同的寡核苷酸上具有多个悬垂臂。用悬垂臂修饰的碱基通常将在序列上是连续的。公开了寡核苷酸,该寡核苷酸包含根据式(II)的化合物的两个或更多个拷贝。公开了寡核苷酸,该寡核苷酸包含根据式(II)的化合物的十个或更多个拷贝。公开了寡核苷酸,该寡核苷酸包含根据式(II)的化合物的一百个或更多个拷贝。
核苷酸的掺入可以使用具有多于一种类型的核苷酸的溶液来进行。因此,公开了试剂盒,该试剂盒包含两种或更多种核苷酸,其中至少一种核苷酸是如本文描述的标记的核苷酸。试剂盒可以包含两种或更多种核苷酸,其中至少两种核苷酸是如本文描述的标记的核苷酸。试剂盒可以包含四种核苷酸,其中至少两种核苷酸是如本文描述的标记的核苷酸。
如本文描述的核苷、核苷酸、寡核苷酸和试剂盒可以被用于测序、表达分析、杂交分析、基因分析、RNA分析或蛋白质结合测定或它们的组合。
附图简述
图1图示出了在测序期间带疤痕的臂或悬垂臂DNA引物:模板的形成。
图2图示出了在测序期间使用的短悬垂臂完全官能化的核苷酸(ffN)的结构的实例。
图3图示出了用于2-通道SBS测序的四个短悬垂臂核苷酸的实例。
图4A-图4C展示了在使用两种不同的聚合酶(PolA和PolB)和两种不同的模板库(PhiX和人)的2-通道修改的上用标准核苷酸和短悬垂臂核苷酸观察到的测序计量学(sequencing metrics)的实例。
图5A和图5B展示了在2-通道修饰的上用标准核苷酸或短悬垂臂核苷酸观察到的测序计量学的实例。
详细描述
本公开内容提供了新的化合物,该新的化合物特别地适合于荧光检测和合成测序的方法。具有缩短的残留悬垂臂的化合物改善了某些核酸测序应用。
根据第一方面,本公开内容提供了式(I)的化合物
其中B是核苷碱基;并且Fl是通过任选的连接基附接的荧光团。
核苷是具有附接至核碱基的碳水化合物核糖的化合物。核碱基可以是嘌呤或嘧啶。常见的天然存在的嘌呤是腺嘌呤(A)和鸟嘌呤(G)。常见的天然存在的嘧啶是在DNA链中的胞苷(C)和胸腺嘧啶(T)或在RNA链中的尿嘧啶(U)。核糖可以是2'-脱氧核糖(在DNA中)。具有与其附接的磷酸酯部分的核苷是核苷酸,并且因此本文描述的化合物可以呈核苷酸的形式。在本文描述的任何式中,B可以代表核苷酸碱基。
Fl是荧光团。因此,本公开内容的化合物被荧光标记。荧光团的性质并不重要,并且可以包括选自任何已知荧光物质的化合物,例如罗丹明或花青。荧光团可以经由任选的连接基被附接至核碱基。连接基的功能通常是帮助荧光团与核苷酸的化学附接。连接基可以是例如任选地具有一个或更多个杂原子取代的烷基链。连接基可以包含酰胺基团或酯基团,以便促进化学偶联反应。连接基可以使用点击化学来合成。连接基可以包含三唑基团。连接基可以包含其他芳基基团。
连接基的实例可以包括诸如以下的物质:
其中n是从2到6的整数并且Fl是荧光团。
核苷或核苷酸的核糖部分可以是核糖或脱氧核糖。核糖可以具有一个或更多个2'或3'封闭基团,以便限制掺入到单个核苷酸。封闭基团可以是叠氮甲基基团。核糖可以是具有3'-叠氮甲基封闭基团的2'-脱氧核糖。封闭基团可以是烯丙基基团。核糖可以是具有3'-烯丙基封闭基团的2'-脱氧核糖。
在本文描述的任何式中,B可以代表嘧啶碱基。碱基B可以采取四种常见的天然存在的碱基A、G、C或T/U中的任何一种的形式。磷酸酯部分可以是三磷酸酯部分,该三磷酸酯部分可以附接至核糖的5'-位。本公开内容的化合物可以包括以下的式(cl)、式(tl)或式(al)的化合物:
其中p是三磷酸酯基团;n是从2到6的整数;并且Fl是荧光团。
三磷酸酯部分允许核苷酸化合物掺入到核酸中。使用核酸聚合酶的延伸允许该化合物附接至核酸引物的3'-OH。因此,本公开内容的化合物可以附接至寡核酸。寡核苷酸可以采取核酸引物的形式,该核酸引物已经经历聚合酶延伸以掺入本公开内容的化合物。因此,本文公开了包含如本文公开的化合物的寡核苷酸。
公开了被附接至寡核苷酸的核苷酸化合物。在化合物被荧光标记的情况下,通常仅单个修饰的化合物将被附接至每个寡核苷酸。因此,公开了寡核苷酸,在该寡核苷酸中3'-核苷酸是式(III)的化合物:
其中B是核苷碱基;n是从2到6的整数;并且Fl是荧光团。
为了避免疑问,应当理解,在掺入后,三磷酸酯基团被转化为单磷酸二酯。因此,公开了寡核苷酸,在该寡核苷酸中,3'-核苷酸是式(cl)、式(tl)或式(al)的化合物:
其中p是单磷酸酯基团;n是从2到6的整数;并且Fl是荧光团。
上述化合物可以可选择地表示为寡核苷酸,在该寡核苷酸中,3'-核苷酸是式(cl)、式(tl)或式(al)的化合物:
/>
其中Oln是寡核苷酸;n是从2到6的整数;并且Fl是荧光团。
在给出的任何实例中;n可以等于2到6。在给出的任何实例中;n可以等于2。在给出的任何实例中;n可以等于3。在给出的任何实例中;n可以等于4。在给出的任何实例中;n可以等于5。在给出的任何实例中;n可以等于6。
在检测到所掺入的核碱基后,荧光标记物和任选的连接基可以被移除。移除是通过叠氮基基团的还原进行的,这导致O-CHNH2-部分的断裂。在裂解后,羟基基团被留下附接至核碱基,并且荧光部分被分离。
因此,公开了式(II)的化合物:
其中B是核苷酸碱基。
核碱基可以是嘌呤或嘧啶。常见的天然存在的嘌呤是腺嘌呤(A)和鸟嘌呤(G)。常见的天然存在的嘧啶是在DNA链中的胞苷(C)和胸腺嘧啶(T)或在RNA链中的尿嘧啶(U)。核糖可以是2'-脱氧核糖(在DNA中)。
式II的化合物可以被附接至寡核苷酸。因此,部分B可以是被附接至另外的碱基的碱基。因此,公开了寡核苷酸,在该寡核苷酸中,3'-核苷酸是式(ci)、式(ti)或式(ai)的化合物:
其中Oln是寡核苷酸。
具有羟基悬垂臂的寡核苷酸可以在相同的寡核苷酸上具有多个悬垂臂。用悬垂臂修饰的碱基通常将在序列上是连续的。公开了寡核苷酸,该寡核苷酸包含根据式(II)的化合物的两个或更多个拷贝。公开了寡核苷酸,该寡核苷酸包含根据式(II)的化合物的十个或更多个拷贝。公开了寡核苷酸,该寡核苷酸包含根据式(II)的化合物的一百个或更多个拷贝。
核苷酸的掺入可以使用具有多于一种类型的核苷酸的溶液来进行。因此,公开了试剂盒,该试剂盒包含两种或更多种核苷酸,其中至少一种核苷酸是如本文描述的标记的核苷酸。试剂盒可以包含两种或更多种核苷酸,其中至少两种核苷酸是如本文描述的标记的核苷酸。试剂盒可以包含四种核苷酸,其中至少两种核苷酸是如本文描述的标记的核苷酸。
如本文描述的核苷、核苷酸、寡核苷酸和试剂盒可以被用于测序、表达分析、杂交分析、基因分析、RNA分析或蛋白质结合测定或它们的组合。
本文提供了包含两种或更多种核苷酸的试剂盒,其中至少一种核苷酸是本公开内容的核苷酸。试剂盒可以包含两种或更多种标记的核苷酸。核苷酸可以用两种或更多种荧光标记物来标记。标记物中的两种或更多种可以使用单激发源来激发,所述单激发源可以是激光器。例如,用于两种或更多种标记物的激发带可以是至少部分地重叠的,使得在光谱的重叠区中的激发引起两种标记物均发射荧光。在特定的实施方案中,来自两种或更多种标记物的发射将在光谱的不同区域中发生,使得标记物中的至少一种的存在可以通过光学地区别该发射来确定。
试剂盒可以包含四种标记的核苷酸,其中四种核苷酸中的第一核苷酸是如本文所公开的。在这样的试剂盒中,第二核苷酸、第三核苷酸和第四核苷酸可以各自用任选地在光谱上不同于第一核苷酸上的标记物且任选地在光谱上不同于彼此上的标记物的化合物标记。因此,化合物中的一种或更多种可以具有有区别的吸光度最大值和/或发射最大值,使得该化合物与其他化合物是可区别的。例如,每种化合物可以具有有区别的吸收最大值和/或发射最大值,使得每种化合物与其他三种化合物是可区分的。将理解的是,除最大值之外的吸收光谱和/或发射光谱的部分可以不同,并且可以利用这些不同来区分化合物。试剂盒可以为使得化合物中的两种或更多种具有高于600nm的有区别的吸光度最大值。本发明的化合物通常吸收在高于640nm的区域中的光。
本文阐述的化合物、核苷酸或试剂盒可以被用于检测、测量或识别生物系统(包括,例如其过程或其组分)。可以采用化合物、核苷酸或试剂盒的示例性技术包括测序、表达分析、杂交分析、基因分析、RNA分析、细胞测定(例如,细胞结合或细胞功能分析)或蛋白质测定(例如,蛋白质结合测定或蛋白质活性测定)。用途可以是在用于进行特定技术的自动仪器上进行,例如自动测序仪器。测序仪器可以包括在不同的波长操作的两种激光器。
本公开内容提供了荧光标记的核苷和核苷酸(修饰的核苷酸)的缀合物。标记的核苷和核苷酸对于标记通过酶促合成形成的多核苷酸是有用的,例如,通过非限制性实例的方式,在PCR扩增、等温扩增、固相扩增、多核苷酸测序(例如固相测序)、切口平移反应(nicktranslation reaction)及类似过程中。
核苷和核苷酸可以在糖或核碱基上的位点处被标记。如本领域中已知的,“核苷酸”由含氮碱基、糖和一个或更多个磷酸酯基团组成。在RNA中,糖是核糖并且在DNA中糖是脱氧核糖,即缺少存在于核糖中的羟基基团的糖。含氮碱基是嘌呤或嘧啶的衍生物。嘌呤可以是腺嘌呤(A)或鸟嘌呤(G),并且嘧啶可以是胞嘧啶(C)、胸腺嘧啶(T),或在RNA的情形下是尿嘧啶(U)。脱氧核糖的C-1原子结合至嘧啶的N-1或嘌呤的N-9。核苷酸还是核苷的磷酸酯,其中酯化发生在被附接至糖的C-3或C-5的羟基基团上。核苷酸通常是单磷酸酯、二磷酸酯或三磷酸酯。
“核苷”在结构上与核苷酸类似但没有磷酸酯部分。核苷类似物的实例将是其中标记物被连接至碱基并且不存在被附接至糖分子的磷酸酯基团的核苷类似物。
虽然碱基通常被称为嘌呤或嘧啶,但技术人员将理解,不改变核苷酸或核苷经历沃森-克里克碱基配对(Watson-Crick base pairing)的能力的衍生物和类似物是可用的。“衍生物”或“类似物”意指其芯结构与母体化合物的芯结构相同或非常相似但具有化学修饰或物理修饰(诸如例如允许衍生的核苷酸或核苷被连接至另一个分子的不同的或另外的侧基)的化合物或分子。例如,碱基可以是脱氮嘌呤。在特定的实施方案中,衍生物能够经历沃森-克里克配对。“衍生物”和“类似物”还包括例如具有修饰的碱基部分和/或修饰的糖部分的合成的核苷酸衍生物或核苷衍生物。这样的衍生物和类似物在例如Scheit,Nucleotide analogs(John Wiley和Son,1980)和Uhlman等人,Chemical Reviews 90:543-584,1990中讨论。核苷酸类似物还可以具有修饰的磷酸二酯键,包括硫代磷酸酯键、二硫代磷酸酯键、烷基-磷酸酯键、苯胺磷酸酯(phosphoranilidate)键、氨基磷酸酯键及类似键。
荧光团可以例如通过连接基被附接至核苷酸碱基上的任何位置。在特定的实施方案中,对于所产生的类似物,沃森-克里克碱基配对仍然可以进行。特别的核碱基标记位点包括嘧啶碱基的C5位或7-脱氮嘌呤碱基的C7位。如上文所描述的,连接基基团可以被用于将染料共价地附接至核苷或核苷酸。在特定的实施方案中,标记的核苷或核苷酸可以是酶促地可掺入的和酶促地可延伸的。因此,连接基部分可以具有足够的长度以将核苷酸连接至化合物,使得该化合物不明显地干扰核酸复制酶对核苷酸的整体结合和识别。因此,连接基还可以包含间隔基单元(spacer unit)。例如,间隔基使核苷酸碱基远离(distance)裂解位点或标记物。
根据本公开内容标记的核苷或核苷酸可以具有下式:
其中染料(Dye)是荧光团化合物,B是核碱基,诸如例如尿嘧啶、胸腺嘧啶、胞嘧啶、腺嘌呤、鸟嘌呤及类似物,并且L是可以存在或可以不存在的任选的连接基基团。R'可以是H、单磷酸酯、二磷酸酯、三磷酸酯、硫代磷酸酯、磷酸酯类似物、被附接至反应性含磷基团的-O-或被封闭基团保护的-O-。R”可以是H、OH、亚磷酰胺或3'OH封闭基团并且R”'是H或OH。在R”是亚磷酰胺的情况下,R'是酸可裂解的羟基保护基,所述酸可裂解的羟基保护基允许在自动合成条件下的随后的单体偶联。
在另一个可选择的实施方案中,在戊糖的3'碳上不存在封闭基团,并且例如,附接至碱基的染料(或染料和连接基构建体)可以具有足以充当另外的核苷酸的掺入的封闭物(block)的大小或结构。因此,封闭可以是由于立体位阻或者可以是由于大小、电荷和结构的组合,无论染料是否被附接至糖的3'位。
在另一个可选择的实施方案中,封闭基团存在于戊糖的2'碳或4'碳上并且可以具有足以充当另外的核苷酸的掺入的封闭物的大小或结构。
当修饰的核苷酸被掺入时,封闭基团的使用允许聚合例如通过终止延伸来控制。如果封闭作用例如通过非限制性实例的方式通过改变化学条件或通过移除化学封闭物是可逆的,那么延伸可以在某些点停止并且然后允许继续。
在另一个特定的实施方案中,3'OH封闭基团将包含在WO2004/018497中公开的部分。例如,封闭基团可以是叠氮甲基(CH2N3)或烯丙基。
在特定的实施方案中,连接基(在染料和核苷酸之间)和封闭基团两者均存在并且是单独的部分。在特定的实施方案中,连接基和封闭基团在大体上类似的条件下都是可裂解的。因此,脱保护和去封闭过程(deblocking process)可以是更有效的,因为将仅需要单次处理来移除染料化合物和封闭物两者。然而,在一些实施方案中,连接基和封闭基团不需要是在类似的条件下可裂解的,而在有区别的条件下是单独地可裂解的。
本公开内容还涵盖掺入荧光化合物的多核苷酸。这样的多核苷酸可以是分别包含以磷酸二酯键连接的脱氧核糖核苷酸或核糖核苷酸的DNA或RNA。根据本公开内容的多核苷酸可以包括与本文阐述的至少一种修饰的核苷酸(例如用染料化合物标记的)组合的天然存在的核苷酸、除了本公开内容的修饰的核苷酸以外的非天然存在的(或修饰的)核苷酸或它们的任意组合。根据本公开内容的多核苷酸还可以包括非天然骨架连接和/或非核苷酸化学修饰。还预期包括包含根据本公开内容的至少一种修饰的核苷酸的核糖核苷酸和脱氧核糖核苷酸的混合物的嵌合结构。
包含根据本公开内容的荧光化合物的修饰的核苷酸(或核苷)可以被用于任何分析方法中,例如包括检测被附接至核苷酸或核苷的荧光标记物(无论以其自身或掺入到较大的分子结构或缀合物中或与较大的分子结构或缀合物缔合)的方法。在本上下文中,术语“掺入到多核苷酸中”可以意指,5'磷酸酯以磷酸二酯键连接至自身可以形成较长多核苷酸链的一部分的第二(修饰的或未修饰的)核苷酸的3'羟基基团。本文阐述的修饰的核苷酸的3'末端可以或可以不以磷酸二酯键连接至另外的(修饰的或未修饰的)核苷酸的5'磷酸酯。因此,在一个非限制性的实施方案中,本公开内容提供了检测被掺入到多核苷酸中的修饰的核苷酸的方法,该方法包括:(a)将本公开内容的至少一种修饰的核苷酸掺入到多核苷酸中,以及(b)通过检测来自附接至所述修饰的核苷酸的染料化合物的荧光信号来检测被掺入到多核苷酸中的修饰的核苷酸。
该方法可以包括:合成步骤(a),其中将根据本公开内容的一种或更多种修饰的核苷酸掺入到多核苷酸中;以及检测步骤(b),其中掺入到多核苷酸中的一种或更多种修饰的核苷酸通过检测或定量地测量它们的荧光来检测。
在本公开内容的一个实施方案中,至少一种修饰的核苷酸在合成步骤中通过聚合酶的作用被掺入到多核苷酸中。然而,可以使用将修饰的核苷酸连接至多核苷酸的其他方法,诸如例如,化学寡核苷酸合成或标记的寡核苷酸与未标记的寡核苷酸的连接。因此,术语“掺入”当关于核苷酸和多核苷酸使用时可以涵盖通过化学方法以及酶促方法的多核苷酸合成。
在具体实施方案中,合成步骤被进行并且可以任选地包括用包含本公开内容的荧光标记的修饰的核苷酸的反应混合物孵育模板多核苷酸链。还可以在以下条件下提供聚合酶,所述条件允许在退火为模板多核苷酸链的多核苷酸链上的游离3'羟基基团和修饰的核苷酸上的5'磷酸酯基团之间形成磷酸二酯键。因此,合成步骤可以包括如通过核苷酸与模板链的互补的碱基配对所引导的多核苷酸链的形成。
在本方法的所有实施方案中,在将修饰的核苷酸掺入到其中的多核苷酸链被退火成模板链的同时,或者在其中使两条链分开的变性步骤之后,可以进行检测步骤。另外的步骤,例如化学反应步骤或酶促反应步骤或纯化步骤可以被包括在合成步骤和检测步骤之间。特别地,掺入修饰的核苷酸的靶链(target strand)可以被分离或纯化并且然后被进一步处理或者被用于随后的分析中。通过实例的方式,在合成步骤中用修饰的核苷酸标记的靶多核苷酸可以随后被用作标记的探针或引物。在其他实施方案中,本文阐述的合成步骤的产物可以经历另外的反应步骤,并且如果需要,这些随后步骤的产物可以被纯化或分离。
用于合成步骤的合适的条件对于熟悉标准分子生物学技术的人员将是熟知的。在一个实施方案中,合成步骤可以类似于使用核苷酸前体(包括本文阐述的修饰的核苷酸)的标准引物延伸反应,以在合适的聚合酶的存在下形成与模板链互补的延伸的靶链。在其他实施方案中,合成步骤本身可以形成产生标记的双链的扩增产物的扩增反应的一部分,所述扩增产物包括源自靶多核苷酸链和模板多核苷酸链的复制的退火的互补链。其他示例性的合成步骤包括切口平移(nick translation)、链置换聚合、随机引发的DNA标记(randomprimed DNA labelling)等。用于合成步骤的特别有用的聚合酶是能够催化本文阐述的修饰的核苷酸中的一种或更多种的掺入的聚合酶。可以使用多种天然存在的聚合酶或修饰的聚合酶。通过实例的方式,热稳定聚合酶可以被用于使用热循环条件进行的合成反应,然而热稳定聚合酶对于等温引物延伸反应可能不是期望的。能够掺入根据本公开内容的修饰的核苷酸的合适的热稳定聚合酶包括在WO2005/024010或WO06120433中描述的那些。在较低的温度例如37℃进行的合成反应中,聚合酶不一定需要是热稳定聚合酶,因此聚合酶的选择将取决于许多因素,例如反应温度、pH、链置换活性以及类似因素。
在具体的非限制性实施方案中,本公开内容涵盖核酸测序、重新测序(re-sequencing)、全基因组测序、单核苷酸多态性评分的方法、或者涉及当掺入到多核苷酸中时检测用本文阐述的染料标记的修饰的核苷酸或核苷的任何其他应用。受益于使用包含荧光团的修饰的核苷酸标记的多核苷酸的多种其他应用中的任一种可以使用用本文阐述的染料标记的修饰的核苷酸或核苷。
在特定的实施方案中,本公开内容提供了根据本公开内容的修饰的核苷酸在多核苷酸合成测序反应(polynucleotide sequencing-by-synthesis reaction)中的用途。合成测序通常涉及使用聚合酶或连接酶在5'至3'方向上将一种或更多种核苷酸或寡核苷酸顺序添加至生长的多核苷酸链中,以便形成与待被测序的模板核酸互补的延伸的多核苷酸链。存在于添加的核苷酸中的一种或更多种中的碱基的同一性可以在检测步骤或“成像”步骤中被确定。添加的碱基的同一性可以在每个核苷酸掺入步骤之后被确定。然后,模板的序列可以使用常规的沃森-克里克碱基配对法则来推断。例如,在单核苷酸多态性的评分中,使用用本文阐述的染料标记的修饰的核苷酸用于确定单碱基的同一性可以是有用的,并且这样的单碱基延伸反应在本公开内容的范围内。
在本公开内容的实施方案中,模板多核苷酸的序列通过以下来确定:通过检测被附接至掺入的核苷酸的荧光标记物来检测一种或更多种核苷酸在与待被测序的模板多核苷酸互补的新生链中的掺入。模板多核苷酸的测序可以用合适的引物来引发(或被制备为发夹构建体(hairpin construct),其将包含作为发夹的一部分的引物),并且新生链通过在聚合酶催化的反应中将核苷酸添加至引物的3'末端以逐步方式延伸。
在特定的实施方案中,不同的核苷酸三磷酸酯(A、T、G和C)中的每个可以被标记有独特的荧光团并且在3'位还包含封闭基团以防止不受控制的聚合。可选择地,四种核苷酸中的一种可以是未被标记的(深色的)。聚合酶将核苷酸掺入到与模板多核苷酸互补的新生链中,并且封闭基团阻止核苷酸的进一步掺入。任何未被掺入的核苷酸可以被洗去,并且来自每个掺入的核苷酸的荧光信号可以通过合适的手段例如使用激光器激发和合适的发射滤光器的电荷耦合装置被光学地“读取”。然后,可以移除(脱保护)3'封闭基团和荧光团化合物(同时地或相继地),以暴露新生链用于进一步的核苷酸掺入。典型地,掺入的核苷酸的同一性将在每个掺入步骤之后被确定,但这不是严格地必要的。类似地,美国专利第5,302,509号公开了对固定在固体支撑物上的多核苷酸测序的方法。
如上文所例示的,该方法利用在DNA聚合酶的存在下将荧光标记的、3'封闭的核苷酸A、G、C和T掺入到与固定的多核苷酸互补的生长的链中。聚合酶掺入与靶多核苷酸互补的碱基,但通过3'-封闭基团来阻止进一步的添加。然后,可以确定所掺入的核苷酸的标记物并且封闭基团通过化学裂解移除以允许进一步的聚合发生。在合成测序反应中待被测序的核酸模板可以是期望测序的任何多核苷酸。用于测序反应的核酸模板通常将包含具有游离的3'羟基基团的双链区,其充当在测序反应中用于另外的核苷酸的添加的引物或起始点。待被测序的模板的区域将使此游离的3'羟基基团在互补链上突出。待被测序的模板的悬垂区域可以是单链的,但可以是双链的,条件是,“切口(nick)存在”于与待被测序的模板链互补的链上以提供游离的3'OH基团用于引发测序反应。在这样的实施方案中,测序可以通过链置换进行。在某些实施方案中,带有游离的3'羟基基团的引物可以作为与待被测序的模板的单链区杂交的单独组分(例如,短寡核苷酸)被添加。可选择地,引物和待被测序的模板链可以各自形成能够形成分子内双链体(duplex)诸如例如发夹环结构的部分地自互补的核酸链的一部分。发夹多核苷酸和它们可以被附接至固体支撑物的方法被公开在国际申请公布号WO0157248和WO2005/047301中。核苷酸可以被连续地添加至生长的引物中,这导致在5'至3'方向上多核苷酸链的合成。已经被添加的碱基的性质可以特别地但不一定地在每次核苷酸添加之后被确定,因此为核酸模板提供序列信息。因此,通过经由与核苷酸的5'磷酸酯基团形成磷酸二酯键而将核苷酸连接至核酸链的游离3'羟基基团,将核苷酸掺入到核酸链(或多核苷酸)中。
待被测序的核酸模板可以是DNA或RNA,或者甚至可以是包含脱氧核苷酸和核糖核苷酸的杂合体分子(hybrid molecule)。核酸模板可以包含天然存在的和/或非天然存在的核苷酸以及天然的或非天然的骨架连接,条件是它们不阻止模板在测序反应中的复制。
在某些实施方案中,待被测序的核酸模板可以经由本领域中已知的任何合适的连接方法例如经由共价附接被附接至固体支撑物。在某些实施方案中,模板多核苷酸可以被直接地附接至固体支撑物(例如基于二氧化硅的支撑物)。然而,在本公开内容的其他实施方案中,固体支撑物的表面可以以某种方式被修饰,以便允许模板多核苷酸的直接共价附接,或者通过水凝胶或聚电解质多层固定模板多核苷酸,水凝胶或聚电解质多层本身可以非共价地附接至固体支撑物。
其中多核苷酸已经被直接地附接至基于二氧化硅的支撑物的阵列是例如在WO00006770中公开的那些,其中多核苷酸通过玻璃上的侧接环氧基团与多核苷酸上的内部氨基基团之间的反应被固定在玻璃支撑物上。此外,多核苷酸可以通过基于硫的亲核试剂与固体支撑物的反应被附接至固体支撑物,例如,如在WO2005/047301中所描述的。固体支撑的模板多核苷酸的还另外的实例是其中模板多核苷酸被附接至被支撑在基于二氧化硅的或其他的固体支撑物上的水凝胶,例如,如在WO00/31148、WO01/01143、WO02/12566、WO03/014392、美国专利第6,465,178号和WO00/53812中所描述的。
模板多核苷酸可以被固定至的特定的表面是聚丙烯酰胺水凝胶。聚丙烯酰胺水凝胶在上文引用的参考文献中和在WO2005/065814中被描述。
DNA模板分子可以被附接至珠或微颗粒。附接至珠或微颗粒对于测序应用可以是有用的。可以制备珠库,其中每个珠含有不同的DNA序列。示例性的库及其创建方法在Nature.437,376-380(2005);Science.309,5741,1728-1732(2005)中被描述。使用本文阐述的核苷酸的这样的珠的阵列的测序在本公开内容的范围内。
待被测序的模板可以形成固体支撑物上的“阵列”的一部分,在这种情况下,阵列可以采取任何方便的形式。因此,本公开内容的方法适用于所有类型的高密度阵列,包括单分子阵列、成簇的阵列和珠阵列。用本公开内容的染料化合物标记的修饰的核苷酸可以被用于对本质上任何类型的阵列上的模板测序,包括但不限于通过使核酸分子固定在固体支撑物上形成的阵列。
然而,本公开内容的修饰的核苷酸在成簇的阵列的测序的上下文中是特别有利的。在成簇的阵列中,阵列上有区别的区域(经常称为位点或特征)包含多个多核苷酸模板分子。通常,多个多核苷酸分子通过光学手段单独地不是可分辨的而是作为总体被检测。取决于阵列如何形成,阵列上的每个位点可以包含一个单独的多核苷酸分子的多个拷贝(例如,位点对于特定的单链核酸物种或双链核酸物种是同质的)或者甚至小数目的不同的多核苷酸分子的多个拷贝(例如,两个不同的核酸物种的多个拷贝)。核酸分子的成簇的阵列可以使用本领域通常已知的技术来产生。通过实例的方式,WO 98/44151和WO00/18957(其各自被并入本文)描述了核酸扩增的方法,其中模板和扩增产物两者均保持固定在固体支撑物上,以便形成包括固定的核酸分子的簇或“集群”的阵列。存在于根据这些方法制备的成簇的阵列上的核酸分子是用于使用用本公开内容的染料化合物标记的修饰的核苷酸来测序的合适的模板。
本公开内容的修饰的核苷酸在单分子阵列上的模板的测序中也是有用的。如本文所使用的术语“单分子阵列”或“SMA”指的是分布(或排列)在固体支撑物上的多核苷酸分子的群体,其中任何单独的多核苷酸与群体中的所有其他多核苷酸的间距是使得可以单独地分辨(resolve)单独的多核苷酸分子。因此,在一些实施方案中,固定在固体支撑物的表面上的靶核酸分子可以能够通过光学手段来分辨。这意指一个或更多个有区别的信号(各自代表一种多核苷酸)将出现在所使用的特定成像装置的可分辨区域内。
可以实现单分子检测,其中阵列上相邻的多核苷酸分子之间的间距是至少100nm,更特别地至少250nm,还更特别地至少300nm,甚至更特别地至少350nm。因此,每个分子作为单分子荧光点是单独地可分辨的且可检测的,并且来自所述单分子荧光点的荧光还呈现出单步光漂白。
术语“单独地分辨(individually resolved)”和“单独的分辨(individualresolution)”在本文中用于说明,当被可视化时,可以使阵列上的一个分子与其邻近的分子区分开。阵列上的单独分子之间的分离将部分地通过用于分辨单独分子的特别的技术来确定。单分子阵列的一般特征将通过参考公布的申请WO00/06770和WO 01/57248来理解。虽然本公开内容的修饰的核苷酸的一种用途是在合成测序反应中,但修饰的核苷酸的用途不限于这样的方法。事实上,核苷酸可以被有利地用于需要检测被附接至掺入到多核苷酸中的核苷酸的荧光标记物的任何测序方法中。
特别地,本公开内容的修饰的核苷酸可以被用于自动化荧光测序方案,特别是基于Sanger和合作者的链终止测序方法的荧光团终止子循环测序。这样的方法通常使用酶和循环测序以将荧光标记的双脱氧核苷酸掺入到引物延伸测序反应中。所谓的Sanger测序方法和有关的方案(Sanger型)利用使用标记的双脱氧核苷酸的随机化链终止。
本公开内容还提供了试剂盒,所述试剂盒包含用荧光团标记的修饰的核苷和/或核苷酸。这样的试剂盒通常将包含如本文所阐述标记的至少一种修饰的核苷酸或核苷连同至少一种另外的组分。另外的组分可以是在上文阐述的方法中或在下文实施例部分中确定的组分中的一种或更多种。可以被组合到本公开内容的试剂盒中的组分的一些非限制性实例在下文中阐述。
在特定的实施方案中,试剂盒可以包含如本文所阐述标记的至少一种修饰的核苷酸或核苷连同修饰的或未修饰的核苷酸或核苷。例如,根据本公开内容标记的修饰的核苷酸可以与未标记的或天然的核苷酸组合和/或与荧光标记的核苷酸组合或其任何组合被供应。因此,试剂盒可以包含用根据本公开内容的染料标记的修饰的核苷酸和用其他例如现有技术染料化合物标记的修饰的核苷酸。核苷酸的组合可以作为分开的单独组分(例如,每容器或管一种核苷酸类型)或作为核苷酸混合物(例如,在相同的容器或管中混合的两种或更多种核苷酸)被提供。
在试剂盒包含用染料化合物标记的多种、特别地两种、更特别地四种修饰的核苷酸的情况下,不同的核苷酸可以用不同的染料化合物来标记,或一种核苷酸可以是深色的,没有染料化合物。在不同的核苷酸用不同的染料化合物标记的情况下,试剂盒的特征是,所述染料化合物是光谱上可区别的荧光团。如本文中所使用的,术语“光谱上可区别的荧光团”指的是,当在一种样品中存在两种或更多种这样的染料时,在可以通过荧光检测设备(例如,基于商用毛细管的DNA测序平台)区别的波长发射荧光能量的荧光团。当用荧光团化合物标记的两种修饰的核苷酸以试剂盒形式被供应时,一些实施方案的特征是,光谱上可区别的荧光团可以在相同的波长(诸如例如通过相同的激光器)被激发。当用荧光团化合物标记的四种修饰的核苷酸以试剂盒形式被供应时,一些实施方案的特征是,光谱上可区别的荧光团中的两种可以均在一个波长下被激发,并且另两种光谱上可区别的染料可以均在另一波长下被激发。特定的激发波长是532nm、630nm至700nm,特别地660nm。
在一个实施方案中,试剂盒包含用本公开内容的化合物标记的修饰的核苷酸和用第二染料标记的第二修饰的核苷酸,其中染料在吸光度最大值上具有至少10nm、特别地20nm至50nm的差异。更特别地,两种染料化合物具有在15nm-40nm之间的斯托克斯位移,其中“斯托克斯位移”是峰值吸收波长和峰值发射波长之间的距离。
在另外的实施方案中,试剂盒还可以包含用荧光团标记的两种其他修饰的核苷酸,其中染料通过相同的激光器在488nm至550nm、特别地532nm下被激发。染料在吸光度最大值上可以具有至少10nm、特别地20nm至50nm的差异。更特别地,两种染料化合物可以具有在20nm-40nm之间的斯托克斯位移。还更特别地,两种染料化合物可以具有低于640nm、特别地低于600nm的不同的吸光度最大值。在光谱上与本公开内容的多次甲基染料(polymethine dye)可区分的并且满足上述标准的特定染料是如在美国专利第5,268,486号(例如Cy3)或WO 0226891(Alexa 532;Molecular Probes(分子探针)A20106)中描述的多次甲基类似物或如美国专利第6,924,372号中公开的不对称多次甲基。可选择的染料包括罗丹明类似物,例如四甲基罗丹明及其类似物。
在可选择的实施方案中,本公开内容的试剂盒可以包含其中相同的碱基用两种不同的化合物标记的核苷酸。第一核苷酸可以用第一荧光化合物(例如在大于650nm处吸收的‘红色’荧光团)标记。第二核苷酸可以用光谱上有区别的化合物(例如在小于600nm处吸收的‘绿色’荧光团)来标记。第三核苷酸可以被标记为第一荧光团和光谱上有区别的化合物的混合物,并且第四核苷酸可以是‘深色的’并且不包含标记物。因此,简言之,核苷酸1-4可以被标记为‘绿色’、‘红色’、‘红色/绿色’以及深色。为进一步简化仪器,四种核苷酸可以用由单激光器激发的两种染料来标记,并且因此核苷酸1-4的标记可以是‘红色1’、‘红色2’、‘红色1/红色2’和深色或‘绿色1’、‘绿色2’、‘绿色1/绿色2’和深色。
虽然上文关于具有不同核苷酸的配置来示例试剂盒,该不同核苷酸用不同的染料化合物标记,但将理解的是,试剂盒可以包含具有相同染料化合物的2种、3种、4种或更多种不同的核苷酸。
在特定的实施方案中,试剂盒可以包含能够催化将修饰的核苷酸掺入到多核苷酸中的聚合酶。待被包含在这样的试剂盒中的其他组分可以包括缓冲剂及类似物。用根据本公开内容的染料标记的修饰的核苷酸和包括不同核苷酸的混合物的其他任何核苷酸组分,可以以待在使用之前被稀释的浓缩的形式被提供在试剂盒中。在这样的实施方案中,还可以包括合适的稀释缓冲剂。再次,在本文阐述的方法中识别的组分中的一种或更多种可以被包含在本公开内容的试剂盒中。
应注意,如在本说明书和所附权利要求中所使用的,单数形式“一(a)”、“一(an)”和“该(the)”包括复数指示物,除非清楚地且明确地限于一个指示物。对本领域技术人员将明显的是,可以对本文描述的各种实施方案做出各种修改和变型而不偏离本教导的精神或范围。因此,意图的是,本文描述的各种实施方案覆盖在所附权利要求及其等同物的范围内的其他修改和变型。
实施例
在以下实施例中进一步详细地公开另外的实施方案,这些实施例不以任何方式意图限制权利要求的范围。
实施例1.短悬垂臂核苷酸三磷酸酯的合成
/>
方案1:两个短悬垂臂核苷酸三磷酸酯(pppT-sPA-Fl和pppT-sPA2-Fl,其中Fl是荧光团)的合成的实例
中间体L2的合成
将起始材料L1(1.07g,4mmol)溶解在无水DMF(15mL)中,然后在氮气下在0℃放置在冰浴中。添加N,N-二异丙基乙胺(884μL,4.8mmol),随后添加PyBOP(2.29g,4.4mmol)。将反应在0℃在氮气下搅拌持续20分钟。然后添加N-(5-氨基戊基)-2,2,2-三氟乙酰胺、三氟乙酸盐(1.5g,4.8mmol),随后添加N,N-二异丙基乙胺(1mL,5.4mmol)。将反应从冰浴中移除,并且在室温搅拌持续3小时。将溶剂在减压下移除,并且将残余物溶解在乙酸乙酯(100mL)中。溶液用3x 100mL稀的KHSO4水溶液(pH=1)、1x 50mL的水、2x 100mL的饱和NaHCO3水溶液来提取。有机层经无水Na2SO4干燥并且在减压下移除溶剂。粗品通过硅胶上的快速色谱法来纯化(乙酸乙酯在DCM中的线性梯度,从50%至100%)。L2被分离为透明粘性油(1.60g,3.59mmol,90%)。1H NMR(400MHz,CDCl3):δ(ppm)7.45(m,1H,Ar CH),7.33(m,2H,Ar CH),7.07(m,2H,Ar CH,NH),6.57(t,J=5.6Hz,1H,NH),4.85(t,J=4.9Hz,1H,CH-N3),4.22(dd,J=10.4,5.1Hz,1H,CH2-OAr),4.16(dd,J=10.5,4.7Hz,1H,CH2-OAr),4.00(ddd,J=10.1,4.9,2.9Hz,1H,CH2-O),3.83(m,2H,CH2-OH),3.75(ddd,J=9.8,6.6,3.0Hz,1H,CH2-O),3.45(q,J=6.7Hz,2H,CH2-NH),3.36(q,J=6.6Hz,2H,CH2-NH),2.78(t,J=6.2Hz,1H,OH),1.65(m,4H,CH2-CH2-NH),1.41(p,J=7.4,6.9Hz,2H,CH2-CH2-CH2-NH)。19F NMR(376.5MHz,CDCl3):δ(ppm)-75.7。13C NMR(100MHz,CDCl3):δ(ppm)167.5(s),158.2(s),137.5(s),135.9(s),129.7(d),128.2(d),119.6(d),118.5(d),113.2(d),89.9(d),71.4(t),69.4(t),61.6(t),39.7(t),39.4(t),29.0(t),28.1(t),23.6(t)。LC-MS(ES和CI):(-ve)m/z 446(M-H+);(+ve)m/z 448(M+H+),470(M+Na+)。
连接基sPA LN3 TFA的合成
将醇L2(500mg,1.12mmol)溶解在乙腈(15mL)中,然后向其中添加TEMPO(70mg,0.448mmol)。将NaH2PO4·2H2O(1.1g,7.2mmol)和NaClO2(405mg,4.48mmol)溶解在10mL水中并添加到反应中。然后添加NaClO水溶液(14.5%有效氯,1.32mL,2.24mmol),并且溶液立即变成深棕色。将反应在室温搅拌持续6小时。在此时间期间,棕色逐渐变成橙色。反应用浓Na2S2O3水溶液猝灭,直到反应变成无色。在减压下蒸发乙腈,并且溶液用20mL的水稀释并且用三乙胺(约1mL)碱化。溶液用10mL的乙酸乙酯提取,并且水相在减压下浓缩。粗sPA LN3TFA通过C18上的反相色谱法来纯化(乙腈在水中的线性梯度为从0%至30%),并且被分离为澄清的油(438mg,0.95mmol,85%)。RP-HPLC:tR=17.9min(0.1M TEAB/乙腈梯度,从5%至50%,在YMC-C18分析柱上)。1H NMR(400MHz,CD3CN):δ(ppm)8.03(br s,1H,NH),7.63(s,1H,NH),7.54(s,1H,Ar),7.42(d,J=7.7Hz,1H,Ar),7.34(t,J=7.9Hz,1H,Ar),7.08(d,J=8.1Hz,1H,Ar),5.10(m,1H,CH-N3),4.35(dd,J=10.9,3.7Hz,1H,CH2O),4.18(dd,J=10.8,6.1Hz,1H,CH2O),4.09(m,2H,CH2O),3.32(m,2H,CH2-NH),3.27(m,2H,CH2-NH),3.02(q,J=7.3Hz,2H,Et3N),1.60(m,4H,CH2-CH2-NH),1.39(m,2H,CH2-CH2-CH2-NH),1.21(t,J=7.3Hz,2H,Et3N)。19F NMR(376.5MHz,CD3CN):δ(ppm)-76.5。13C NMR(100MHz,CD3OD):δ(ppm)173.1(s),170.0(s),159.9(s),137.5(s),131.0(d),125.7(d),121.4(d),119.2(d),114.5(d),90.8(d),70.5(t),66.7(t),41.0(t),40u.8(t),30.2(t),29.7(t),25.4(t)。LC-MS(ES和CI):(-ve)m/z 460(M-H+)。(+ve)m/z 484(M+Na+),561(M+Et3NH+)
中间体L3的合成
将起始材料L1(658mg,2.46mmol)溶解在无水DMF(10mL)中,然后在氮气下在0℃放置在冰浴中。添加N,N-二异丙基乙胺(544μL,2.95mmol),随后添加PyBOP(1.41g,2.71mmol)。将反应在氮气下在0℃搅拌持续20分钟,然后添加N-(2-氨基乙基)-2,2,2-三氟乙酰胺、三氟乙酸盐(796mg,2.95mmol),随后添加N,N-二异丙基乙胺(589μL,3.2mmol)。将反应从冰浴中移除,并且在室温搅拌持续3小时。将溶剂在减压下移除,并且将残余物溶解在乙酸乙酯(100mL)中。溶液用3x 100mL的稀KHSO4水溶液(pH=1)、1x 50mL的水、2x 100mL的饱和NaHCO3水溶液来提取。有机相经无水Na2SO4干燥并且在减压下移除溶剂。粗品通过硅胶上的快速色谱法来纯化(乙酸乙酯在DCM中的线性梯度,从50%至100%),并且被分离为粘性油(0.91g,2.24mmol,91%)。1H NMR(400MHz,CDCl3):δ(ppm)8.19(br s,1H,NH),7.39(d,J=1.7Hz,1H,Ar CH),7.38-7.30(m,2H,Ar),7.24(t,J=5.5Hz,1H,Ar CH),7.07(dt,J=7.2,2.1Hz,1H,Ar CH),4.84(t,J=4.9Hz,1H,CH-N3),4.20(dd,J=10.5,5.1Hz,1H,CH2-OAr),4.15(dd,J=6.0,4.5Hz,1H,CH2-OAr),4.00(ddd,J=10.2,4.8,3.0Hz,1H,CH2-O),3.88-3.79(m,2H,CH2-OH),3.74(ddd,J=9.8,6.4,3.2Hz,1H,CH2-O),3.65(m,2H,CH2-NH),3.58(m,2H,CH2-NH),2.82(t,J=5.6Hz 1H,OH)。19F NMR(376.5MHz,CDCl3):δ(ppm)-75.9。LC-MS(ES和CI):(-ve)m/z 404(M-H+);(+ve)m/z 406(M+H+),428(M+Na+)
sPA2 LN3 TFA的合成
将醇L3(230mg,0.567mmol)溶解在乙腈(10mL)中,然后向其中添加TEMPO(35mg,0.27mmol)。将NaH2PO4·2H2O(575mg,3.68mmol)和NaClO2(205mg,2.26mmol)溶解在10mL的水中并添加到反应中。然后添加NaClO水溶液(14.5%氯含量,0.671mL,1.13mmol),并且溶液立即变成深棕色。将反应在室温搅拌持续18小时。在此时间期间,棕色逐渐变成橙色。反应用浓Na2S2O3水溶液猝灭,直到其变成无色。在减压下蒸发乙腈,并且溶液用10mL的水稀释,用三乙胺(约0.6mL)碱化,并且用10mL的乙酸乙酯提取。将水相在减压下浓缩。粗sPA2LN3 TFA通过C18上的反相色谱法来纯化(乙腈在水中的线性梯度为从0%至20%),并且被分离为澄清的油(224mg作为三乙基铵盐,0.43mmol,77%)。RP-HPLC:tR=17.9min(0.1MTEAB/乙腈梯度,从5%至40%,在YMC-C18分析柱上)。1H NMR(400MHz,CD3CN):δ(ppm)8.52(br s,1H,NH),8.34(br s,1H,NH),7.77(s,1H,Ar),7.49(dt,J=7.7,1.1Hz,1H,Ar),7.38(t,J=7.9Hz,1H,Ar),7.10(ddd,J=8.2,2.6,1.0Hz,1H,Ar),5.14(dd,J=6.7,3.4Hz,1H,CH-N3),4.48(dd,J=11.5,3.4Hz,1H,CH2O),4.20(dd,J=11.5,6.7Hz,1H,CH2O),4.11(d,J=1.4Hz,2H,CH2O),3.66-3.42(m,4H,CH2-NH),3.05(q,J=7.3Hz,5H,Et3N),1.22(t,J=7.3Hz,8H,Et3N)。19F NMR(376.5MHz,CD3CN):δ(ppm)-76.3。13C NMR(101MHz,CD3CN):δ(ppm)173.1(s),166.9(s),157.6(s),135.7(s),129.3(d),120.0(d),118.0(d),117.0(s),112.1(d),88.4(d),68.8(t),67.6(t),45.1(t),39.2(t),38.4(t),7.5(q)。LC-MS(ES和CI):(-ve)m/z 418(M-H+)。
pppT-sPA和pppT-sPA2的一般合成
使连接基(sPA-LN3-TFA或sPA2-LN3-TFA,0.089mmol)与2x 2mL的无水N,N'-二甲基甲酰胺(DMF)共蒸发,然后溶解在2mL的无水DMF中。添加N,N-二异丙基乙胺(33μL,0.178mmol),随后添加N,N,N',N'-四甲基-O-(N-琥珀酰亚胺基)脲四氟硼酸酯(N,N,N',N'-tetramethyl-O-(N-succinimidyl)uronium tetrafluoroborate)(TSTU,32mg,0.106mmol)。将反应在室温在氮气下搅拌持续1小时。同时,将三磷酸PA-TTP(0.1mmol)的水溶液在减压下蒸发至干,并且重新悬浮在300μL的0.1M三乙基碳酸氢铵(TEAB)水溶液中。将连接基溶液添加到该三磷酸酯中,并且将反应在室温搅拌持续18小时。然后,在减压下蒸发溶剂,并且残余物溶解在1mL的甲醇和3mL的氢氧化铵水溶液33%中。将溶液在室温搅拌持续7小时,然后蒸发至干。使用用0.1M TEAB和乙腈洗脱的YMC-Pack-Pro C18柱,通过制备规模的RP-HPLC来纯化粗品。pppT-sPA:收率:67%。RP-HPLC:tR=16.9min(0.1M TEAB/乙腈梯度,从5%至35%,在YMC-C18分析柱上)。LC-MS(ES和CI):(-ve)m/z 922(M-H+),461(M-2H+)。pppT-sPA2:收率:65%。RP-HPLC:tR=17.5min(0.1M TEAB/乙腈梯度,从5%至30%,在YMC-C18分析柱上)。LC-MS(ES和CI):(-ve)m/z 880(M-H+),440(M-2H+)。
pppT-sPA-Fl和pppT-sPA2-Fl的一般合成
使荧光团羧酸酯(Fl,0.0105mmol)与2x 2mL的无水N,N'-二甲基甲酰胺(DMF)共蒸发,然后溶解在2mL的无水N,N'-二甲基乙酰胺DMA中。添加N,N-二异丙基乙胺(15μL,0.084mmol),随后添加N,N,N',N'-四甲基-O-(N-琥珀酰亚胺基)脲四氟硼酸酯(TSTU,0.012mmol)。将反应在室温在氮气下搅拌持续45分钟。同时,将三磷酸pppT-sPA或pppT-sPA2(0.084mmol)的水溶液在减压下蒸发至干,并且重新悬浮在300μL的0.1M三乙基碳酸氢铵(TEAB)水溶液中。将荧光团-NHS酯溶液添加到该三磷酸酯中,并且将反应在室温搅拌持续18小时。粗品通过DEAE-葡聚糖凝胶上的离子交换色谱法(梯度从0.1M TEAB至1M TEAB,用20%乙腈)以及通过制备规模的RP-HPLC(YMC-Pack-Pro C18柱,用0.1M TEAB和乙腈洗脱)来纯化。
N-(氨基烷基)-2,2,2-三氟乙酰胺的一般合成
方案2:N-三氟乙酰胺-二胺的一般合成。
将(氨基烷基)氨基甲酸叔丁酯(48mmol)溶解在无水DCM(60mL)中,并且在氮气下置于冰浴中。添加三乙胺(103mmol),随后逐滴添加三氟乙酸酐(53mmol)。将反应从冰浴中移除,并且在室温搅拌持续1小时。反应用200mL的DCM稀释并且用2x 200mL的饱和NaHCO3水溶液提取。将有机相经无水MgSO4干燥并且在减压下浓缩。粗品通过硅胶上的快速色谱法(石油醚/乙酸乙酯3:7)来纯化。
(5-(2,2,2-三氟乙酰胺基)戊基)氨基甲酸叔丁酯(n=5):1H NMR(400MHz,CDCl3):δ(ppm)6.40(br s,1H,NH),4.49(br s,1H,NH),3.30(q,J=6.8Hz,2H,CH2-NH),3.06(q,J=6.6Hz,2H,CH2-NH),1.56(p,J=7.2Hz,2H,CH2-CH2-NH),1.45(p,J=7.0Hz,2H,CH2-CH2-NH),1.37(m,9H,CH3),1.31(m,2H,CH2-CH2-CH2-NH)。19F NMR(376.5MHz,CDCl3):δ(ppm)-75.8。
(2-(2,2,2-三氟乙酰胺基)乙基)氨基甲酸叔丁酯(n=2):1H NMR(400MHz,CDCl3):δ(ppm)7.72(br s,1H,NH),4.86(br s,1H,NH),3.39(m,2H,CH2-NH),3.31(m,2H,CH2-NH),1.38(s,9H,CH3)。19F NMR(376.5MHz,CDCl3):δ(ppm)-76.1。
将(2-(2,2,2-三氟乙酰胺基)烷基)氨基甲酸叔丁酯(44mmol)溶解在无水DCM(40mL)和三氟乙酸(40mL)中。将反应在室温、开放于空气中(open to air)搅拌持续1小时。将挥发物在减压下移除。将残余物溶解在水中,并且用50mL的DCM提取,然后将水相蒸发至干。残余物与100mL的乙醇和4x 100mL的乙腈共蒸发。
N-(5-氨基戊基)-2,2,2-三氟乙酰胺(n=5):1H NMR(400MHz,d6-DMSO):δ(ppm)9.44(br s,1H,NH),7.75(br s,3H,NH),3.17(q,J=6.7Hz,2H,CH2-NH),2.77(m,2H,CH2-NH),1.57-1.45(m,4H,CH2-CH2-NH),1.29(m,2H,CH2-CH2-CH2-NH).19F NMR(376.5MHz,d6-DMSO):δ(ppm)-74.4,-74.7。
N-(2-氨基乙基)-2,2,2-三氟乙酰胺(n=2):1H NMR(400MHz,d6-DMSO):δ(ppm)9.58(br t,1H,NHCO),8.04(br s,3H,NH),3.45(m,2H,CH2NHCO),2.98(m,2H,CH2NH)。19FNMR(376.5MHz,d6-DMSO):δ(ppm)-74.0,-74.4。
实施例2.短悬垂臂核苷酸三磷酸酯在SBS测序中的用途
将短悬垂臂核苷酸的测序性能与标准SBS核苷酸的测序性能进行比较,所述标准SBS核苷酸在标准可裂解连接基上含有相同的荧光基团。用适合于2-通道SBS测序的荧光团标记的四种短悬垂臂核苷酸(两种A、C、T)和暗G被包含在含有DNA聚合酶和掺入缓冲液的溶液中,并且被用于2-通道修改的或2-通道修改的/>中,以在每次150个循环的两次读取中测序。在相同条件(例如掺入温度、掺入时间、聚合酶、模板库)下,在使用所有四种短悬垂臂核苷酸或所有标准核苷酸进行的实验之间比较测序计量学(例如定相(phasing)、预定相、百分比错误率和百分比Q30)。结果在图4A-图4C以及图5A和图5B中示出。
图4A-图4C展示了在使用50℃掺入温度和10秒掺入时间以及使用两种不同的聚合酶(PolA和PolB)和两种不同的模板库(PhiX和人)的2-通道修改的上用标准核苷酸和短悬垂臂核苷酸观察到的测序计量学(定相、预定相、%错误率、%Q30)的实例。当使用短悬垂臂核苷酸时,观察到定相和%错误率的降低以及%Q30的增加,这独立于所使用的聚合酶或模板。
图5A和图5B展示了在PhiX模板上,在60℃掺入温度、允许不同的掺入时间,用标准核苷酸或短悬垂臂核苷酸在2-通道修改的上观察到的测序计量学(定相和%错误率)的实例。
短悬垂臂核苷酸允许掺入时间减少约50%而对百分比错误率没有显著影响。在测试的最短掺入时间(10+5s),与使用标准核苷酸的2.5%错误率相比,百分比错误率仍然<1%。
本公开内容还提供了以下项目:
1.一种式(I)的化合物:
其中B是核苷碱基;并且
Fl是通过任选的连接基附接的荧光团。
2.根据项目1所述的化合物,其中B是核苷酸碱基。
3.根据项目2所述的化合物,其中B是嘧啶碱基。
4.根据项目3所述的化合物,其中所述化合物具有式(c)或式(t):
其中p是三磷酸酯基团;并且
Fl是通过任选的连接基附接的荧光团。
5.根据项目2所述的化合物,其中B是7-脱氮嘌呤碱基。
6.根据项目5所述的化合物,其中所述化合物具有式(a):
其中p是三磷酸酯基团;并且
Fl是通过任选的连接基附接的荧光团。
7.根据项目2所述的化合物,其中所述化合物被附接至寡核苷酸。
8.一种寡核苷酸,其用根据项目2所述的化合物标记。
9.一种式(II)的化合物:
其中B是核苷酸碱基。
10.根据项目9所述的化合物,其中B是嘧啶碱基。
11.根据项目10所述的化合物,其中所述化合物具有式(ci)或式(ti):
其中Oln是寡核苷酸。
12.根据项目9所述的化合物,其中B是7-脱氮嘌呤碱基。
13.根据项目12所述的化合物,其中所述化合物具有式(ai):
其中Oln是寡核苷酸。
14.一种寡核苷酸,包含根据项目9至13中任一项所述的化合物。
15.一种寡核苷酸,包含根据项目9至13中任一项所述的化合物的两个或更多个拷贝。
16.一种寡核苷酸,包含根据项目9至13中任一项所述的化合物的十个或更多个拷贝。
17.一种寡核苷酸,包含根据项目9至13中任一项所述的化合物的一百个或更多个拷贝。
18.一种试剂盒,包含两种或更多种核苷酸,其中至少一种核苷酸是标记的核苷酸,所述标记的核苷酸是根据项目2至6中任一项所述的化合物。
19.根据项目18所述的试剂盒,包括两种或更多种核苷酸,其中至少两种核苷酸是标记的核苷酸,所述标记的核苷酸是根据项目2至6中任一项所述的化合物。
20.根据项目18所述的试剂盒,包括四种核苷酸,其中至少两种核苷酸是标记的核苷酸,所述标记的核苷酸是根据项目2至6中任一项所述的化合物。
21.根据项目2至6中任一项所述的化合物在测序、表达分析、杂交分析、基因分析、RNA分析或蛋白质结合测定或它们的组合中的用途。
22.根据项目8所述的寡核苷酸在测序、表达分析、杂交分析、基因分析、RNA分析或蛋白质结合测定或它们的组合中的用途。
23.根据项目14所述的寡核苷酸在测序、表达分析、杂交分析、基因分析、RNA分析或蛋白质结合测定或它们的组合中的用途。

Claims (25)

1.一种式(I)的化合物:
其中B是核苷碱基或核苷酸碱基;并且
Fl是罗丹明荧光团或花青荧光团;
其中当B是嘌呤核苷碱基或嘌呤核苷酸碱基时,B在7位被附接,且当B是嘧啶核苷碱基或嘧啶核苷酸碱基时,B在5位被附接。
2.根据权利要求1所述的化合物,其中B是核苷酸碱基。
3.根据权利要求2所述的化合物,其中B是嘧啶碱基。
4.根据权利要求3所述的化合物,其中所述化合物具有式(c)或式(t):
其中p是三磷酸酯基团;并且
Fl是罗丹明荧光团或花青荧光团。
5.根据权利要求2所述的化合物,其中B是7-脱氮嘌呤碱基。
6.根据权利要求5所述的化合物,其中所述化合物具有式(a):
其中p是三磷酸酯基团;并且
Fl是罗丹明荧光团或花青荧光团。
7.根据前述权利要求中任一项所述的化合物,其中所述荧光团包含烷基链连接基。
8.根据权利要求7所述的化合物,其中所述烷基链连接基具有一个或更多个杂原子取代;和/或包含酰胺基团或酯基团;和/或包含芳基基团;和/或包含三唑基团。
9.根据权利要求2-8中任一项所述的化合物,其中所述化合物被附接至寡核苷酸。
10.一种寡核苷酸,其用根据权利要求2-8中任一项所述的化合物标记。
11.一种式(II)的化合物:
其中B是核苷碱基或核苷酸碱基;
其中当B是嘌呤核苷碱基或嘌呤核苷酸碱基时,B在7位被附接,且当B是嘧啶核苷碱基或嘧啶核苷酸碱基时,B在5位被附接。
12.根据权利要求11所述的化合物,其中B是嘧啶碱基。
13.根据权利要求12所述的化合物,其中所述化合物具有式(ci)或式(ti):
其中Oln是寡核苷酸。
14.根据权利要求11所述的化合物,其中B是7-脱氮嘌呤碱基。
15.根据权利要求14所述的化合物,其中所述化合物具有式(ai):
其中Oln是寡核苷酸。
16.一种寡核苷酸,包含根据权利要求11至15中任一项所述的化合物。
17.一种寡核苷酸,包含根据权利要求11至15中任一项所述的化合物的两个或更多个拷贝。
18.一种寡核苷酸,包含根据权利要求11至15中任一项所述的化合物的十个或更多个拷贝。
19.一种寡核苷酸,包含根据权利要求11至15中任一项所述的化合物的一百个或更多个拷贝。
20.一种试剂盒,包含两种或更多种核苷酸,其中至少一种核苷酸是标记的核苷酸,所述标记的核苷酸是根据权利要求2至8中任一项所述的化合物。
21.根据权利要求20所述的试剂盒,包括两种或更多种核苷酸,其中至少两种核苷酸是标记的核苷酸,所述标记的核苷酸是根据权利要求2至8中任一项所述的化合物。
22.根据权利要求20所述的试剂盒,包括四种核苷酸,其中至少两种核苷酸是标记的核苷酸,所述标记的核苷酸是根据权利要求2至8中任一项所述的化合物。
23.根据权利要求2至8中任一项所述的化合物在测序、表达分析、杂交分析、基因分析、RNA分析或蛋白质结合测定或它们的组合中的用途。
24.根据权利要求10所述的寡核苷酸在测序、表达分析、杂交分析、基因分析、RNA分析或蛋白质结合测定或它们的组合中的用途。
25.根据权利要求16至19中任一项所述的寡核苷酸在测序、表达分析、杂交分析、基因分析、RNA分析或蛋白质结合测定或它们的组合中的用途。
CN201880041116.6A 2017-07-12 2018-07-12 用于测序应用中的核苷酸的短悬垂臂连接基 Active CN111094315B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB1711219.4A GB201711219D0 (en) 2017-07-12 2017-07-12 Short pendant arm linkers for nucleotides in sequencing applications
GB1711219.4 2017-07-12
PCT/EP2018/069030 WO2019012080A1 (en) 2017-07-12 2018-07-12 SHORT ARM LINKS FOR NUCLEOTIDES IN SEQUENCING APPLICATIONS

Publications (2)

Publication Number Publication Date
CN111094315A CN111094315A (zh) 2020-05-01
CN111094315B true CN111094315B (zh) 2024-04-09

Family

ID=59676794

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880041116.6A Active CN111094315B (zh) 2017-07-12 2018-07-12 用于测序应用中的核苷酸的短悬垂臂连接基

Country Status (15)

Country Link
US (4) US10526648B2 (zh)
EP (1) EP3652191A1 (zh)
JP (1) JP7041695B2 (zh)
KR (2) KR20200023282A (zh)
CN (1) CN111094315B (zh)
AU (1) AU2018298847B2 (zh)
BR (1) BR112019027614A2 (zh)
CA (1) CA3060152A1 (zh)
GB (1) GB201711219D0 (zh)
IL (1) IL271428A (zh)
MX (1) MX2021011019A (zh)
MY (1) MY196912A (zh)
RU (1) RU2019137083A (zh)
WO (1) WO2019012080A1 (zh)
ZA (1) ZA201906836B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201711219D0 (en) 2017-07-12 2017-08-23 Illumina Cambridge Ltd Short pendant arm linkers for nucleotides in sequencing applications
SG11202012554QA (en) 2019-03-01 2021-01-28 Illumina Cambridge Ltd Tertiary amine substituted coumarin compounds and their uses as fluorescent labels
AU2020230955A1 (en) 2019-03-01 2021-01-07 Illumina Cambridge Limited Exocyclic amine-substituted coumarin compounds and their uses as fluorescent labels
KR20220107231A (ko) 2019-11-27 2022-08-02 일루미나 케임브리지 리미티드 사이클로옥타테트라엔 함유 염료 및 조성물
US20230047225A1 (en) 2021-08-14 2023-02-16 Illumina, Inc. Polymerases, compositions, and methods of use
CN116239493A (zh) * 2023-03-15 2023-06-09 杭州易速微控基因技术有限公司 一种Linker类化合物的合成方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105263918A (zh) * 2013-03-08 2016-01-20 伊鲁米纳剑桥有限公司 罗丹明化合物及其作为荧光标记物的用途

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5268486A (en) 1986-04-18 1993-12-07 Carnegie-Mellon Unversity Method for labeling and detecting materials employing arylsulfonate cyanine dyes
US5302509A (en) 1989-08-14 1994-04-12 Beckman Instruments, Inc. Method for sequencing polynucleotides
JP2002503954A (ja) 1997-04-01 2002-02-05 グラクソ、グループ、リミテッド 核酸増幅法
US6465178B2 (en) 1997-09-30 2002-10-15 Surmodics, Inc. Target molecule attachment to surfaces
US6485944B1 (en) 1997-10-10 2002-11-26 President And Fellows Of Harvard College Replica amplification of nucleic acid arrays
DE69928265T3 (de) 1998-07-30 2013-11-28 Illumina Cambridge Ltd. Matrizen von biomolekülen und ihre verwendung in sequenzierung
GB0002310D0 (en) 2000-02-01 2000-03-22 Solexa Ltd Polynucleotide sequencing
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6391937B1 (en) 1998-11-25 2002-05-21 Motorola, Inc. Polyacrylamide hydrogels and hydrogel arrays made from polyacrylamide reactive prepolymers
US6664061B2 (en) 1999-06-25 2003-12-16 Amersham Biosciences Ab Use and evaluation of a [2+2] photoaddition in immobilization of oligonucleotides on a three-dimensional hydrogel matrix
US6372813B1 (en) 1999-06-25 2002-04-16 Motorola Methods and compositions for attachment of biomolecules to solid supports, hydrogels, and hydrogel arrays
WO2002012566A2 (en) 2000-08-09 2002-02-14 Motorola, Inc. The use and evaluation of a [2+2] photocycloaddition in immobilization of oligonucleotides on a three-dimensional hydrogel matrix
ATE352586T2 (de) 2000-09-29 2007-02-15 Molecular Probes Inc Modifizierte carbocyaninfarbstoffe und deren konjugate
US9708358B2 (en) 2000-10-06 2017-07-18 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
EP1317464B1 (en) * 2000-10-11 2009-05-13 Applera Corporation Fluorescent nucleobase conjugates having anionic linkers
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
WO2004018497A2 (en) 2002-08-23 2004-03-04 Solexa Limited Modified nucleotides for polynucleotide sequencing
US11008359B2 (en) * 2002-08-23 2021-05-18 Illumina Cambridge Limited Labelled nucleotides
DE10258150A1 (de) 2002-12-10 2004-07-08 Dyomics Gmbh Hydrophile Marker auf der Basis von Benzopyrylo-Polymethinen
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
GB0326073D0 (en) 2003-11-07 2003-12-10 Solexa Ltd Improvements in or relating to polynucleotide arrays
JP2007525571A (ja) 2004-01-07 2007-09-06 ソレクサ リミテッド 修飾分子アレイ
WO2006097320A2 (de) * 2005-03-17 2006-09-21 Genovoxx Gmbh Makromolekulare nukleotidverbindungen und methoden zu deren anwendung
US8212020B2 (en) 2005-03-11 2012-07-03 Steven Albert Benner Reagents for reversibly terminating primer extension
EP1888743B1 (en) 2005-05-10 2011-08-03 Illumina Cambridge Limited Improved polymerases
GB0517097D0 (en) 2005-08-19 2005-09-28 Solexa Ltd Modified nucleosides and nucleotides and uses thereof
WO2008070749A2 (en) 2006-12-05 2008-06-12 Lasergen, Inc. Photocleavable labeled nucleotides and nucleosides and labeled nucleotides and nucleosides and methods for their use in dna sequencing
US10759824B2 (en) * 2008-09-03 2020-09-01 Quantumdx Group Limited Design, synthesis and use of synthetic nucleotides comprising charge mass tags
US10443096B2 (en) 2010-12-17 2019-10-15 The Trustees Of Columbia University In The City Of New York DNA sequencing by synthesis using modified nucleotides and nanopore detection
EP3074350A4 (en) 2013-11-25 2017-08-09 University Of Idaho Biochar water treatment
WO2017185026A1 (en) 2016-04-22 2017-10-26 Complete Genomics, Inc. Reversibly blocked nucleoside analogues and their use
GB201711219D0 (en) * 2017-07-12 2017-08-23 Illumina Cambridge Ltd Short pendant arm linkers for nucleotides in sequencing applications

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105263918A (zh) * 2013-03-08 2016-01-20 伊鲁米纳剑桥有限公司 罗丹明化合物及其作为荧光标记物的用途

Also Published As

Publication number Publication date
MX2021011019A (es) 2021-10-14
US20200131569A1 (en) 2020-04-30
CN111094315A (zh) 2020-05-01
US11001888B2 (en) 2021-05-11
GB201711219D0 (en) 2017-08-23
WO2019012080A1 (en) 2019-01-17
NZ759350A (en) 2023-10-27
RU2019137083A (ru) 2021-06-18
IL271428A (en) 2020-01-30
US10526648B2 (en) 2020-01-07
KR20200023282A (ko) 2020-03-04
AU2018298847B2 (en) 2021-02-11
ZA201906836B (en) 2023-04-26
JP7041695B2 (ja) 2022-03-24
CA3060152A1 (en) 2019-01-17
RU2019137083A3 (zh) 2021-06-18
AU2018298847A1 (en) 2019-11-07
JP2020527131A (ja) 2020-09-03
US11655502B2 (en) 2023-05-23
BR112019027614A2 (pt) 2020-07-07
MY196912A (en) 2023-05-10
EP3652191A1 (en) 2020-05-20
KR20220119182A (ko) 2022-08-26
US20210230687A1 (en) 2021-07-29
US20190017111A1 (en) 2019-01-17
US20230348968A1 (en) 2023-11-02

Similar Documents

Publication Publication Date Title
CN111094315B (zh) 用于测序应用中的核苷酸的短悬垂臂连接基
US11981955B2 (en) Polymethine compounds and their use as fluorescent labels
US7592435B2 (en) Modified nucleosides and nucleotides and uses thereof
CN107835809B (zh) 具有长斯托克斯位移的多次甲基化合物及其作为荧光标记物的用途
US9156987B2 (en) Polymethine compounds and their use as fluorescent labels
US20220195196A1 (en) Alkylpyridinium coumarin dyes and uses in sequencing applications
NZ759350B2 (en) Short pendant arm linkers for nucleotides in sequencing applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant