CN115867544A - 取代的香豆素染料和作为荧光标记的用途 - Google Patents

取代的香豆素染料和作为荧光标记的用途 Download PDF

Info

Publication number
CN115867544A
CN115867544A CN202180047349.9A CN202180047349A CN115867544A CN 115867544 A CN115867544 A CN 115867544A CN 202180047349 A CN202180047349 A CN 202180047349A CN 115867544 A CN115867544 A CN 115867544A
Authority
CN
China
Prior art keywords
optionally substituted
alkyl
compound
group
nucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180047349.9A
Other languages
English (en)
Inventor
N·N·罗曼诺夫
M·卡灵厄姆
C·阿纳斯塔西
P·麦考利
N·海恩斯
N·克雷克
吴晓琳
刘小海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Cambridge Ltd
Original Assignee
Illumina Cambridge Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Cambridge Ltd filed Critical Illumina Cambridge Ltd
Publication of CN115867544A publication Critical patent/CN115867544A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D417/00Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00
    • C07D417/02Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00 containing two hetero rings
    • C07D417/04Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00 containing two hetero rings directly linked by a ring-member-to-ring-member bond
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D403/00Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, not provided for by group C07D401/00
    • C07D403/02Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, not provided for by group C07D401/00 containing two hetero rings
    • C07D403/04Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, not provided for by group C07D401/00 containing two hetero rings directly linked by a ring-member-to-ring-member bond
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D405/00Heterocyclic compounds containing both one or more hetero rings having oxygen atoms as the only ring hetero atoms, and one or more rings having nitrogen as the only ring hetero atom
    • C07D405/02Heterocyclic compounds containing both one or more hetero rings having oxygen atoms as the only ring hetero atoms, and one or more rings having nitrogen as the only ring hetero atom containing two hetero rings
    • C07D405/04Heterocyclic compounds containing both one or more hetero rings having oxygen atoms as the only ring hetero atoms, and one or more rings having nitrogen as the only ring hetero atom containing two hetero rings directly linked by a ring-member-to-ring-member bond
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D405/00Heterocyclic compounds containing both one or more hetero rings having oxygen atoms as the only ring hetero atoms, and one or more rings having nitrogen as the only ring hetero atom
    • C07D405/14Heterocyclic compounds containing both one or more hetero rings having oxygen atoms as the only ring hetero atoms, and one or more rings having nitrogen as the only ring hetero atom containing three or more hetero rings
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D407/00Heterocyclic compounds containing two or more hetero rings, at least one ring having oxygen atoms as the only ring hetero atoms, not provided for by group C07D405/00
    • C07D407/02Heterocyclic compounds containing two or more hetero rings, at least one ring having oxygen atoms as the only ring hetero atoms, not provided for by group C07D405/00 containing two hetero rings
    • C07D407/04Heterocyclic compounds containing two or more hetero rings, at least one ring having oxygen atoms as the only ring hetero atoms, not provided for by group C07D405/00 containing two hetero rings directly linked by a ring-member-to-ring-member bond
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D409/00Heterocyclic compounds containing two or more hetero rings, at least one ring having sulfur atoms as the only ring hetero atoms
    • C07D409/02Heterocyclic compounds containing two or more hetero rings, at least one ring having sulfur atoms as the only ring hetero atoms containing two hetero rings
    • C07D409/04Heterocyclic compounds containing two or more hetero rings, at least one ring having sulfur atoms as the only ring hetero atoms containing two hetero rings directly linked by a ring-member-to-ring-member bond
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D409/00Heterocyclic compounds containing two or more hetero rings, at least one ring having sulfur atoms as the only ring hetero atoms
    • C07D409/14Heterocyclic compounds containing two or more hetero rings, at least one ring having sulfur atoms as the only ring hetero atoms containing three or more hetero rings
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D413/00Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and oxygen atoms as the only ring hetero atoms
    • C07D413/02Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and oxygen atoms as the only ring hetero atoms containing two hetero rings
    • C07D413/04Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and oxygen atoms as the only ring hetero atoms containing two hetero rings directly linked by a ring-member-to-ring-member bond
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D417/00Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00
    • C07D417/14Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00 containing three or more hetero rings
    • CCHEMISTRY; METALLURGY
    • C09DYES; PAINTS; POLISHES; NATURAL RESINS; ADHESIVES; COMPOSITIONS NOT OTHERWISE PROVIDED FOR; APPLICATIONS OF MATERIALS NOT OTHERWISE PROVIDED FOR
    • C09BORGANIC DYES OR CLOSELY-RELATED COMPOUNDS FOR PRODUCING DYES, e.g. PIGMENTS; MORDANTS; LAKES
    • C09B57/00Other synthetic dyes of known constitution
    • C09B57/02Coumarine dyes
    • CCHEMISTRY; METALLURGY
    • C09DYES; PAINTS; POLISHES; NATURAL RESINS; ADHESIVES; COMPOSITIONS NOT OTHERWISE PROVIDED FOR; APPLICATIONS OF MATERIALS NOT OTHERWISE PROVIDED FOR
    • C09KMATERIALS FOR MISCELLANEOUS APPLICATIONS, NOT PROVIDED FOR ELSEWHERE
    • C09K11/00Luminescent, e.g. electroluminescent, chemiluminescent materials
    • C09K11/06Luminescent, e.g. electroluminescent, chemiluminescent materials containing organic luminescent materials
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • CCHEMISTRY; METALLURGY
    • C09DYES; PAINTS; POLISHES; NATURAL RESINS; ADHESIVES; COMPOSITIONS NOT OTHERWISE PROVIDED FOR; APPLICATIONS OF MATERIALS NOT OTHERWISE PROVIDED FOR
    • C09KMATERIALS FOR MISCELLANEOUS APPLICATIONS, NOT PROVIDED FOR ELSEWHERE
    • C09K2211/00Chemical nature of organic luminescent or tenebrescent compounds
    • C09K2211/10Non-macromolecular compounds
    • C09K2211/1018Heterocyclic compounds
    • C09K2211/1025Heterocyclic compounds characterised by ligands
    • C09K2211/1029Heterocyclic compounds characterised by ligands containing one nitrogen atom as the heteroatom
    • CCHEMISTRY; METALLURGY
    • C09DYES; PAINTS; POLISHES; NATURAL RESINS; ADHESIVES; COMPOSITIONS NOT OTHERWISE PROVIDED FOR; APPLICATIONS OF MATERIALS NOT OTHERWISE PROVIDED FOR
    • C09KMATERIALS FOR MISCELLANEOUS APPLICATIONS, NOT PROVIDED FOR ELSEWHERE
    • C09K2211/00Chemical nature of organic luminescent or tenebrescent compounds
    • C09K2211/10Non-macromolecular compounds
    • C09K2211/1018Heterocyclic compounds
    • C09K2211/1025Heterocyclic compounds characterised by ligands
    • C09K2211/1088Heterocyclic compounds characterised by ligands containing oxygen as the only heteroatom
    • CCHEMISTRY; METALLURGY
    • C09DYES; PAINTS; POLISHES; NATURAL RESINS; ADHESIVES; COMPOSITIONS NOT OTHERWISE PROVIDED FOR; APPLICATIONS OF MATERIALS NOT OTHERWISE PROVIDED FOR
    • C09KMATERIALS FOR MISCELLANEOUS APPLICATIONS, NOT PROVIDED FOR ELSEWHERE
    • C09K2211/00Chemical nature of organic luminescent or tenebrescent compounds
    • C09K2211/10Non-macromolecular compounds
    • C09K2211/1018Heterocyclic compounds
    • C09K2211/1025Heterocyclic compounds characterised by ligands
    • C09K2211/1092Heterocyclic compounds characterised by ligands containing sulfur as the only heteroatom
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/101Sanger sequencing method, i.e. oligonucleotide sequencing using primer elongation and dideoxynucleotides as chain terminators
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/107Nucleic acid detection characterized by the use of physical, structural and functional properties fluorescence
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • G01N2021/6439Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" with indicators, stains, dyes, tags, labels, marks

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Materials Engineering (AREA)
  • General Physics & Mathematics (AREA)
  • Optics & Photonics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Pyrane Compounds (AREA)
  • Nitrogen Condensed Heterocyclic Rings (AREA)
  • Plural Heterocyclic Compounds (AREA)
  • Luminescent Compositions (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Saccharide Compounds (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

本申请涉及取代的香豆素衍生物及其作为荧光标记的用途。这些化合物可以用作用于核酸测序应用中的核苷酸的荧光标记。

Description

取代的香豆素染料和作为荧光标记的用途
技术领域
本公开涉及取代的香豆素衍生物及其作为荧光标记的用途。特别地,这些化合物可以用作用于核酸测序应用中的核苷酸的荧光标记。
背景技术
带有荧光标记的核酸的非放射性检测是分子生物学中的重要技术。在重组DNA技术中采用的许多程序以前依赖于使用带有放射性标记的核苷酸或多核苷酸,例如32P。放射性化合物允许灵敏地检测核酸和其他感兴趣的分子。然而,在放射性同位素的使用中存在严重的局限性,诸如它们的费用、有限的保质期、不足的灵敏度和更重要的安全考虑因素。消除对放射性标记的需求同时降低了安全性风险以及与例如试剂处理相关的环境影响和成本。适合于非放射性荧光检测的方法包括以非限制性示例的方式进行的自动化DNA测序、杂交方法、聚合酶链反应产物的实时检测和免疫测定。
对于许多应用而言,希望采用多个光谱可区分的荧光标记,以便实现对多个空间重叠分析物的独立检测。在此类多重方法中,可以减少反应容器的数量,从而简化实验方案并且促进专用试剂盒的生产。例如,在多色自动化DNA测序系统中,多重荧光检测允许在单个电泳通道中分析多个核苷酸碱基,从而通过单色方法提高吞吐量,并且降低与通道间电泳迁移率变化相关的不确定性。
然而,多重荧光检测可能存在问题,并且存在的许多重要因素会限制适当荧光标记的选择。首先,在给定的应用中可能难以找到具有基本上分辨的吸收和发射光谱的染料化合物。另外,当若干荧光染料一起使用时,通过同时激发在可区分光谱区域中产生荧光信号可能是复杂的,因为这些染料的吸收带通常很分开,所以即使是两种染料也难以达到相当的荧光激发效率。许多激发方法使用高功率光源,如激光,因此染料必须具有足够的光稳定性以承受此类激发。对分子生物学方法特别重要的最后一个考虑因素是荧光染料必须与试剂化学组成(诸如DNA合成溶剂和试剂、缓冲液、聚合酶和连接酶)相容的程度。
随着测序技术进展,还需要开发满足所有上述限制并且特别适用于高通量分子方法(诸如固相测序等)的另外的荧光染料化合物、其核酸缀合物和多个染料组。
具有改进的荧光特性(诸如合适的荧光强度、形状以及荧光带的波长最大值)的荧光染料分子可以提高核酸测序的速度和准确性。当在水基生物缓冲液中并且在较高温度下进行测量时,强荧光信号尤其重要,因为大多数有机染料的荧光强度在此类条件下显著较低。此外,染料所附接的碱基的性质也影响荧光最大值、荧光强度和染料的其他光谱特性。核碱基与荧光染料之间的序列特异性相互作用可以通过荧光染料的特异性设计来定制。荧光染料结构的优化可以提高核苷酸掺入的效率、降低测序误差的水平,并且减少核酸测序中试剂的使用,从而降低核酸测序的成本。
一些光学和技术的开发已引起图像质量的极大改善,但是最终受到光学分辨率差的限制。一般来讲,光学显微镜法的光学分辨率限于以所使用的光的波长的大约一半间隔开的对象。实际上,只有相距相当远(至少200nm至350nm)的对象才可以通过光学显微镜法分辨。提高图像分辨率并且增加每单位表面积的可分辨对象数量的一种方法是使用较短波长的激发光。例如,如果用相同的光学器件将光波长缩短Δλ约100nm,则分辨率将更好(约Δ50nm/(约15%)),将记录较少失真的图像,并且可识别区域上的对象的密度将增加约35%。
某些核酸测序方法采用激光来激发染料标记的核苷酸并对其进行检测。这些仪器使用较长波长的光,诸如红色激光,连同能够在660nm处激发的适当染料。为了在保持可用分辨率的同时检测更密集堆积的核酸测序簇,可以使用较短波长的蓝色光源(450nm至460nm)。在这种情况下,光学分辨率将不受较长波长红色荧光染料的发射波长的限制,而是受能够由次长波长光源(例如,由532nm处的“绿色激光”)激发的染料的发射的限制。因此,需要用于测序应用中的荧光检测的蓝色染料标记。
尽管蓝色染料化学和相关激光技术已经改进,例如,以产生用于DVD和蓝光光盘的染料,但是这些化合物不适用于生物标记并且不能用作生物标记物。此外,某些蓝色染料在延长的时间段内在水性环境中不稳定。例如,在碱性条件下,这些染料可能很容易被亲核试剂攻击,从而导致染料的干扰或劣化。
不幸的是,具有用于核苷酸标记的强荧光的适当可商购蓝色染料仍然非常罕见。本文描述了具有改善的化学稳定性的荧光化合物,其适用于在蓝光激发(例如,蓝色LED或激光,例如,在约450nm至约460nm处)下用强荧光进行核苷酸标记。
发明内容
本发明涉及取代的香豆素衍生物。这些化合物可以用作荧光标记,特别是用于核酸测序应用中的核苷酸标记。在一些方面,这些染料吸收短波长的光,最佳地吸收450nm至460nm波长的光,并且在使用具有450nm至460nm波长的蓝色波长激发源的情况下是特别有利的。由于发射的波长较短,所以蓝色波长激发允许检测和分辨每单位面积较高密度的特征。当此类染料用于与核苷酸的缀合物中时,可以看到在核酸测序方法期间获得的测序读段的长度、强度、准确性和质量方面的改进。
本公开的一些实施方案涉及式(I)的化合物或其盐或内消旋形式:
Figure BDA0004022520900000031
其中R1是各自任选地被一个或多个取代基取代的
Figure BDA0004022520900000032
Figure BDA0004022520900000033
或/>
Figure BDA0004022520900000034
该一个或多个取代基独立地选自由以下项组成的组:羧基、-C(O)NRbRc、-C(O)ORd、C1-C6烷基、取代的C1-C6烷基、卤基、任选地取代的氨基、羟基、磺基、磺酸根、硫酸根、N-亚磺酰氨基和S-亚磺酰氨基;/>
R2是H、任选地取代的C1-C6烷基或任选地被选自由以下项组成的组的一个或多个取代基取代的苯基:羧基、-C(O)NRbRc、-C(O)ORd、任选地取代的C1-C6烷基、卤基、氰基、硝基、磺酰基、亚磺酸基、磺基、磺酸根、任选地取代的氨基和羟基;
每个R3、R4和R7独立地是H、任选地取代的C1-C6烷基、C1-C6烷氧基、C2-C6烯基、C2-C6炔基、C1-C6卤代烷基、C1-C6卤代烷氧基、C1-C6羟烷基、(C1-C6烷氧基)(C1-C6烷基)、任选地取代的氨基、卤基、氰基、羟基、硝基、磺酰基、亚磺酸基、磺基、磺酸根、S-亚磺酰氨基、N-亚磺酰氨基、任选地取代的C3-C10碳环基或任选地取代的3元至10元杂环基;
每个R5和R6独立地是H、C1-C6烷基、取代的CC1-C6烷基,或者R5和R6连同它们所附接的氮原子一起形成任选地取代的4元至10元杂环基;
X是O、S或NRa
Ra是H或C1-C6烷基;
每个Rb和Rc独立地是H、C1-C6烷基或取代的C1-C6烷基;并且
Rd是任选地取代的C1-C6烷基或任选地取代的苯基。在一些实施方案中,R5或R6中的至少一者或由R5和R6与它们所附接的氮原子形成的任选地取代的4元至10元杂环基包含羧基或-C(O)ORd。在一些其他实施方案中,R1包含羧基或-C(O)ORd
本公开的一些另外的实施方案涉及式(II)或式(II')的化合物或其盐或内消旋形式:
Figure BDA0004022520900000041
其中X是S、O或NRa
Y是O或NH;
每个R1、R2、R3和R5独立地是H、任选地取代的C1-C6烷基、C1-C6烷氧基、C2-C6烯基、C2-C6炔基、C1-C6卤代烷基、C1-C6卤代烷氧基、C1-C6羟烷基、(C1-C6烷氧基)(C1-C6烷基)、任选地取代的氨基、卤基、氰基、羟基、硝基、磺酰基、亚磺酸基、磺基、磺酸根、S-亚磺酰氨基、N-亚磺酰氨基、任选地取代的C3-C10碳环基、任选地取代的C6-C10芳基、任选地取代的5元至10元杂芳基或任选地取代的3元至10元杂环基;
R4是-NRbRc、卤基、-ORd或-OS(O)2Rd
R6和R7中的每一者独立地是H、羧基、-C(O)NRbRc、-C(O)ORd、C1-C6烷基、取代的C1-C6烷基、C1-C6卤代烷基、卤基、任选地取代的氨基、N-亚磺酰氨基、磺酰基、S-亚磺酰氨基、羟基、氰基、硝基、任选地取代的苯基、任选地取代的C3-C8碳环基、任选地取代的5元至10元杂芳基或任选地取代的3元至10元杂环基;或者式(II)中的R6和R7连同它们所附接的原子一起形成任选地取代的C5-C8碳环基或任选地取代的5元至8元杂环基;
Ra是H或C1-C6烷基;
每个Rb和Rc独立地是H、C1-C6烷基或取代的C1-C6烷基;或者Rb和Rc连同它们所附接的氮原子一起形成任选地取代的4元至10元杂环基;并且
每个Rd独立地是任选地取代的C1-C6烷基或任选地取代的苯基。在一些实施方案中,R4是-NRbRc并且该化合物还由式(IIa)或式(IIa')表示:
Figure BDA0004022520900000051
在式(II)、式(II')、式(IIa)或式(IIa')的化合物的一些实施方案中,R6和R7中的至少一者包含羧基。在式(II)或式(IIa)的化合物的一些实施方案中,当R6和R7与它们所附接的原子形成任选地取代的C5-C8碳环基或任选地取代的5元至8元杂环基时,该C5-C8碳环基或5元至8元杂环基包含羧基或被羧基取代。在式(IIa)或式(IIa')的一些实施方案中,Rb和Rc中的至少一者包含羧基或-C(O)ORd
在一些方面,本公开的化合物被标记或与底物部分缀合,该底物部分是例如核苷、核苷酸、多核苷酸、多肽、碳水化合物、配体、颗粒、细胞、半固体表面(例如,凝胶)或固体表面。标记或缀合可以通过羧基基团(-CO2H)进行,该羧基基团可以通过使用本领域已知的方法与部分(诸如核苷酸)或与其结合的连接基上的氨基或羟基基团反应以形成酰胺或酯。
本公开的一些其他方面涉及包含连接基基团的染料化合物,以实现例如与底物部分共价附接。可以在染料的任何位置处(包括在R基团中的任一者处)进行连接。在一些实施方案中,可以通过式(I)的R1或通过R5或R6进行连接。在一些其他实施方案中,可以通过式(II)或式(II')的R6或R7或通过式(IIa)或式(IIa')的Rb或Rc进行连接。
本公开的一些其他方面提供由下式定义的标记的核苷或核苷酸化合物:
N-L-染料
其中N是核苷或核苷酸;
L是任选的连接基部分;并且
染料是根据本公开的式(I)、式(II)或式(II')的荧光化合物的部分。
本公开的一些另外的方面涉及用式(I)、式(II)或式(II')的化合物标记的部分,特别是核苷酸或寡核苷酸。
本公开的一些另外的方面涉及一种试剂盒,该试剂盒包含可以用于各种免疫学测定、寡核苷酸或核酸标记或用于DNA合成测序的染料化合物(游离或标记形式)。在又一方面,本公开提供了包含染料“组”的试剂盒,该染料“组”特别适合于在自动化仪器平台上的合成测序循环。在一些方面,该试剂盒含有一种或多种核苷酸,其中至少一种核苷酸是本文所述的标记的核苷酸。
本公开的另一方面是一种确定单链靶多核苷酸的序列的方法,该方法包括:
(a)使引物多核苷酸/靶多核苷酸复合物与一种或多种标记的核苷酸(例如,A、G、C和T)接触,其中所述标记的核苷酸中的至少一者是本文所述的核苷酸,并且其中该引物多核苷酸与该靶多核苷酸的至少一部分互补;
(b)将标记的核苷酸掺入到该引物多核苷酸中;以及
(c)执行一次或多次荧光测量以确定所掺入的核苷酸的身份。
附图说明
图1是示出在37℃下在缓冲溶液中用参考染料A标记的完全官能化C核苷酸(ffC)与用染料I-1或染料I-2标记的相同ffC的荧光强度对比的线图。
图2是示出在37℃下在缓冲溶液中用参考染料A标记的完全官能化C核苷酸(ffC)与用染料I-3或染料I-4标记的相同ffC的荧光强度对比的线图。
图3A示出了在460nm处激发时在缓冲溶液中用参考染料A标记的完全官能化A核苷酸(ffA)与用染料II-1或染料II-8标记的相同ffA的发射光谱对比。
图3B示出了在460nm处激发时在缓冲溶液中用参考染料A标记的完全官能化C核苷酸(ffC)与用染料II-1和染料II-标记的相同ffC的发射光谱对比。
图4A至图4C示出了与用
Figure BDA0004022520900000071
上使用的标准染料组标记的ffN的测序指标相比,用染料I-3a或染料I-4a标记在Illumina的/>
Figure BDA0004022520900000072
测序平台上使用的ffA和ffC时的测序指标(%定相、%误差率和%剩余信号)。
图5A至图5C示出了与用
Figure BDA0004022520900000073
上使用的标准染料组标记的ffN的测序指标相比,用染料II-1或染料II-8标记在/>
Figure BDA0004022520900000074
测序平台上使用的ffC时的测序指标(%定相、%误差率和%剩余信号)。
图6A至图6B是示出用染料I-4a标记的ffA和ffC的可用性的散点图,其中呈现了在一个剂量的光暴露之后来自ffC和ffT核苷酸的信号的比率(C/T@1X)和在10个剂量的暴露之后的适当信号的比率(C/T@10X/1X)。
图6C至图6D是示出用染料I-3a标记的ffA和ffC的可用性的散点图,其中呈现了在一个剂量的光暴露之后来自ffC和ffT核苷酸的信号的比率(C/T@1X)和在10个剂量的暴露之后的适当信号的比率(C/T@10X/1X)。
图6E至图6F是示出用染料II-1标记的ffA和ffC的可用性的散点图,其中呈现了在一个剂量的光暴露之后来自ffC和ffT核苷酸的信号的比率(C/T@1X)和在10个剂量的暴露之后的适当信号的比率(C/T@10X/1X)。
图6G至图6H是示出用染料II-8标记的ffA和ffC的可用性的散点图,其中呈现了在一个剂量的光暴露之后来自ffC和ffT核苷酸的信号的比率(C/T@1X)和在10个剂量的暴露之后的适当信号的比率(C/T@10X/1X)。
具体实施方式
本公开提供了特别适用于荧光检测和测序应用方法的取代的香豆素化合物。
定义
本文所用的章节标题仅用于组织目的,而不应理解为限制所述主题。
应注意,如在本说明书和所附权利要求书中所用的,单数形式“一个”、“一种”和“所述”包括复数指代物,除非清楚和明确地限于一指代物。对于本领域技术人员而言显而易见的是,在不脱离本教导的精神或范围的情况下,可以对本文描述的各种实施方案进行各种修改和变化。因此,本文描述的各种实施方案旨在覆盖在所附权利要求书及其等效物的范围内的其他修改和变化。
除非另有定义,否则本文所用的所有技术和科学术语的含义与本领域的普通技术人员通常理解的含义相同。术语“包括”以及其他形式(诸如“包括(include/includes/included)”)的使用不是限制性的。术语“具有”以及其他形式(诸如“具有(have/has/had)”)的使用不是限制性的。如本说明书中所用,无论是在过渡短语中还是在权利要求的正文中,术语“包含(comprise(s))”和“包含(comprising)”都将被解释为具有开放式含义。即,上述术语应与短语“至少具有”或“至少包括”同义地解释。例如,当在过程的上下文中使用时,术语“包含”表示该过程至少包括所列举的步骤,但是也可包括额外步骤。当在化合物、组合物或设备的上下文中使用时,术语“包含”是指该化合物、组合物或设备至少包含所列举的特征或组分,但是也可包含额外特征或组分。
如本文所用,常见的有机缩写的定义如下:
℃ 温度(以摄氏度计)
dATP 脱氧腺苷三磷酸
dCTP 脱氧胞苷三磷酸
dGTP 脱氧鸟苷三磷酸
dTTP 脱氧胸苷三磷酸
ddNTP 双脱氧核苷三磷酸
ffN 完全官能化核苷酸
h 小时
RT 室温
SBS 合成测序
SM 起始物质
如本文所用,术语“阵列”是指附接到一个或多个底物的一组不同的探针分子,使得这些不同的探针分子可根据相对位置彼此区分。阵列可包括各自位于底物上的不同可寻址位置的不同探针分子。另选地或附加地,阵列可包括各自带有不同探针分子的单独底物,其中可根据底物在底物所附接到的表面上的位置或根据底物在液体中的位置来识别不同的探针分子。其中单独底物位于表面上的示例性阵列包括但不限于包括孔中的珠粒的那些,例如如美国专利6,355,431 B1、US 2002/0102578和PCT公开WO 00/63437中所述。例如,在美国专利6,524,793中描述了可用于本发明中的例如使用微流体装置(诸如荧光激活细胞分选器(FACS))来区分液体阵列中的珠粒的示例性形式。可用于本发明的阵列的另外的示例包括但不限于美国专利5,429,807;5,436,327;5,561,071;5,583,211;5,658,734;5,837,858;5,874,219;5,919,523;6,136,269;6,287,768;6,287,776;6,288,220;6,297,006;6,291,193;6,346,413;6,416,949;6,482,591;6,514,751和6,610,482;和WO 93/17126;WO 95/11995;WO 95/35505;EP 742 287;和EP 799 897中描述的那些。
如本文所用,术语“共价附接的”或“共价键合的”是指形成特征在于原子之间共用电子对的化学键合。例如,共价附接的聚合物涂层是指与底物的官能化表面形成化学键的聚合物涂层,这与经由其他方式(例如,粘附或静电相互作用)粘附到该表面形成比较。应当理解,共价附接到表面的聚合物也可以经由除共价附接之外的方式键合。
如本文所用,术语“卤素”或“卤基”意味着元素周期表第7列的放射性稳定原子中的任一种,例如,氟、氯、溴或碘,其中氟和氯是优选的。
如本文所用,其中“a”和“b”是整数的“Ca至Cb”是指烷基、烯基或炔基基团中的碳原子数,或环烷基或芳基基团的环原子数。即,烷基、烯基、炔基、环烷基的环和芳基的环可以含有“a”至“b”个(包括端值在内)的碳原子。例如,“C1至C4烷基”基团是指具有1个至4个碳的所有烷基基团,即CH3-、CH3CH2-、CH3CH2CH2-、(CH3)2CH-、CH3CH2CH2CH2-、CH3CH2CH(CH3)-和(CH3)3C-;C3至C4环烷基基团是指具有3个至4个碳原子的所有环烷基基团,即环丙基和环丁基。类似地,“4元至6元杂环基”基团是指具有4个至6个总环原子的所有杂环基基团,例如氮杂环丁烷、氧杂环丁烷、噁唑啉、吡咯烷、哌啶、哌嗪、吗啉等。如果对于烷基、烯基、炔基、环烷基或芳基基团没有指定“a”和“b”,则将假设这些定义中描述的最广泛范围。如本文所用,术语“C1-C6”包括C1、C2、C3、C4、C5和C6,以及由这两个数字中的任一者定义的范围。例如,C1-C6烷基包括C1烷基、C2烷基、C3烷基、C4烷基、C5烷基和C6烷基、C2-C6烷基、C1-C3烷基等。类似地,C2-C6烯基包括C2烯基、C3烯基、C4烯基、C5烯基和C6烯基、C2-C5烯基、C3-C4烯基等;并且C2-C6炔基包括C2炔基、C3炔基、C4炔基、C5炔基和C6炔基、C2-C5炔基、C3-C4炔基等。C3-C8环烷基各自包括含有3、4、5、6、7和8个碳原子或由任何两个数字限定的范围的烃环,诸如C3-C7环烷基或C5-C6环烷基。
如本文所用,“烷基”是指完全饱和(即,不包含双键和三键)的直链或支链烃链。烷基基团可以具有1个至20个碳原子(每当在本文中出现时,诸如“1至20”的数值范围是指给定范围内的每个整数;例如,“1个至20个碳原子”意味着烷基基团可以由1个碳原子、2个碳原子、3个碳原子等,最多至并包括20个碳原子组成,但本定义还涵盖出现其中没有指定数值范围的术语“烷基”)。烷基基团还可以是具有1个至9个碳原子的中等大小烷基。烷基基团还可以是具有1个至6个碳原子的低级烷基。仅以举例的方式,“C1-6烷基”或“C1-C6烷基”表示烷基链中存在一个至六个碳原子,即,烷基链选自由甲基、乙基、丙基、异丙基、正丁基、异丁基、仲丁基和叔丁基组成的组。典型的烷基基团包括但绝不限于甲基、乙基、丙基、异丙基、丁基、异丁基、叔丁基、戊基、己基等。
如本文所用,“烷氧基”是指式–OR(其中R为如上文所定义的烷基),诸如“C1-9烷氧基”或“C1-C9烷氧基”,包括但不限于甲氧基、乙氧基、正丙氧基、1-甲基乙氧基(异丙氧基)、正丁氧基、异丁氧基、仲丁氧基和叔丁氧基等。
如本文所用,“烯基”是指包含一个或多个双键的直链或支链烃链。烯基基团可以具有2个至20个碳原子,但本定义还涵盖出现其中没有指定数值范围的术语“烯基”。烯基基团还可以是具有2个至9个碳原子的中等大小烯基。烯基基团还可以是具有2个至6个碳原子的低级烯基。仅以举例的方式,“C2-C6烯基”或“C2-6烯基”表示烯基链中存在两个至六个碳原子,即,烯基链选自由乙烯基、丙烯-1-基、丙烯-2-基、丙烯-3-基、丁烯-1-基、丁烯-2-基、丁烯-3-基、丁烯-4-基、1-甲基-丙烯-1-基、2-甲基-丙烯-1-基、1-乙基-乙烯-1-基、2-甲基-丙烯-3-基、丁-1,3-二烯基、丁-1,2-二烯基和丁-1,2-二烯-4-基组成的组。典型的烯基基团包括但绝不限于乙烯基、丙烯基、丁烯基、戊烯基和己烯基等。
如本文所用,“炔基”是指包含一个或多个三键的直链或支链烃链。炔基基团可以具有2个至20个碳原子,但本定义还涵盖出现其中没有指定数值范围的术语“炔基”。炔基基团还可以是具有2个至9个碳原子的中等大小炔基。炔基基团还可以是具有2个至6个碳原子的低级炔基。仅以举例的方式,“C2-6炔基”或“C2-C6炔基”表示炔基链中存在两个至六个碳原子,即,炔基链选自由乙炔基、丙炔-1-基、丙炔-2-基、丁炔-1-基、丁炔-3-基、丁炔-4-基和2-丁炔基组成的组。典型的炔基基团包括但绝不限于乙炔基、丙炔基、丁炔基、戊炔基和己炔基等。
如本文所用,“杂烷基”是指在链骨架中含有一个或多个杂原子(即,除碳之外的元素,包括但不限于氮、氧和硫)的直链或支链烃链。杂烷基基团可以具有1个至20个碳原子,但本定义还涵盖出现其中没有指定数值范围的术语“杂烷基”。杂烷基基团还可以是具有1个至9个碳原子的中等大小杂烷基。杂烷基基团还可以是具有1个至6个碳原子的低级杂烷基。杂烷基基团可以被命名为“C1-6杂烷基”、“C1-C6杂烷基”或类似的名称。杂烷基基团可以含有一个或多个杂原子。仅以举例的方式,“C4-6杂烷基”或“C4-C6杂烷基”表示杂烷基链中存在四个至六个碳原子,并且此外在链的骨架中存在一个或多个杂原子。
术语“芳族”是指具有共轭π电子体系的环或环系,并且包括碳环芳族基团(例如,苯基)和杂环芳族基团(例如,吡啶)这两者。该术语包括单环基团或稠环多环(即,共用相邻原子对的环)基团,前提条件是整个环系是芳族的。
如本文所用,“芳基”是指在环骨架中仅包含碳的芳族环或环系(即,共用两个相邻碳原子的两个或更多个稠环)。当芳基为环系时,该环系中的每个环均为芳族的。芳基基团可以具有6个至18个碳原子,但本定义还涵盖出现其中没有指定数值范围的术语“芳基”。在一些实施方案中,芳基基团具有6个至10个碳原子。芳基基团可以被命名为“C6-C10芳基”、“C6或C10芳基”或类似的名称。芳基基团的示例包括但不限于苯基、萘基、薁基和蒽基。
“芳烷基”或“芳基烷基”为作为取代基经由亚烷基基团连接的芳基基团,诸如“C7-14芳烷基”等,包括但不限于苄基、2-苯基乙基、3-苯基丙基和萘基烷基。在一些情况下,亚烷基基团是低级亚烷基基团(即,C1-6亚烷基基团)。
如本文所用,“杂芳基”是指在环骨架中含有一个或多个杂原子(即,除碳之外的元素,包括但不限于氮、氧和硫)的芳族环或环系(即,共用两个相邻原子的两个或更多个稠环)。当杂芳基是环系时,该环系中的每个环均是芳族的。杂芳基基团可以具有5个至18个环成员(即,构成环骨架的原子(包括碳原子和杂原子)的数目),但本定义还涵盖出现其中没有指定数值范围的术语“杂芳基”。在一些实施方案中,杂芳基基团具有5个至10个环成员或者5个至7个环成员。杂芳基基团可以被命名为“5元至7元杂芳基”、“5元至10元杂芳基”或类似的名称。杂芳基环的示例包括但不限于呋喃基、噻吩基、酞嗪基、吡咯基、噁唑基、噻唑基、咪唑基、吡唑基、异噁唑基、异噻唑基、三唑基、噻二唑基、吡啶基、哒嗪基、嘧啶基、吡嗪基、三嗪基、喹啉基、异喹啉基、苯并咪唑基、苯并噁唑基、苯并噻唑基、吲哚基、异吲哚基和苯并噻吩基。
“杂芳烷基”或“杂芳基烷基”为作为取代基经由亚烷基基团连接的杂芳基基团。示例包括但不限于2-噻吩基甲基、3-噻吩基甲基、呋喃基甲基、噻吩基乙基、吡咯基烷基、吡啶基烷基、异噁唑基烷基和咪唑基烷基。在一些情况下,亚烷基基团是低级亚烷基基团(即,C1-6亚烷基基团)。
如本文所用,“碳环基”意味着在环系骨架中仅含有碳原子的非芳族环状环或环系。当碳环基为环系时,两个或更多个环可以以稠合、桥接或螺接的方式接合在一起。碳环基可以具有任何饱和度,前提条件是环系中的至少一个环不是芳族的。因此,碳环基包括环烷基、环烯基和环炔基。碳环基基团可以具有3个至20个碳原子,但本定义还涵盖出现其中没有指定数值范围的术语“碳环基”。碳环基基团也可以是具有3个至10个碳原子的中等大小碳环基。碳环基基团也可以是具有3个至6个碳原子的碳环基。碳环基基团可以被命名为“C3-6碳环基”、“C3-C6碳环基”或类似的名称。碳环基环的示例包括但不限于环丙基、环丁基、环戊基、环己基、环己烯基、2,3-二氢-茚、双环[2.2.2]辛烷基、金刚烷基和螺[4.4]壬烷基。
如本文所用,“环烷基”意味着完全饱和的碳环基环或环系。示例包括环丙基、环丁基、环戊基和环己基。
如本文所用,“杂环基”是指在环骨架中含有至少一个杂原子的非芳族环状环或环系。杂环基可以稠合、桥接或螺接的方式接合在一起。杂环基可具有任何饱和度,前提条件是环系中的至少一个环不是芳族的。杂原子可以存在于环系中的非芳族环或芳族环中。杂环基基团可以具有3个至20个环元(即,构成环骨架的原子(包括碳原子和杂原子)的数目),但本定义还涵盖出现其中没有指定数值范围的术语“杂环基”。杂环基基团也可以是具有3个至10个环元的中等大小杂环基。杂环基基团也可以是具有3个至6个环元的杂环基。杂环基基团可以被命名为“3元至6元杂环基”或类似的名称。在优选的六元单环杂环基中,杂原子选自O、N或S中的一个至最多三个,并且在优选的五元单环杂环基中,杂原子选自一个或两个选自O、N或S的杂原子。杂环基环的示例包括但不限于吖庚因基、吖啶基、咔唑基、噌啉基、二氧戊环基、咪唑啉基、咪唑烷基、吗啉基、环氧乙烷基、氧杂环庚烷基、硫杂环庚烷基、哌啶基、哌嗪基、二氧代哌嗪基、吡咯烷基、吡咯烷酮基、吡咯烷二酮基、4-哌啶酮基、吡唑啉基、吡唑烷基、1,3-二噁英基、1,3-二噁烷基、1,4-二噁英基、1,4-二噁烷基、1,3-氧硫杂环己烷基、1,4-氧硫杂环己烯基、1,4-氧硫杂环己烷基、2H-1,2-噁嗪基、三噁烷基、六氢-1,3,5-三嗪基、1,3-间二氧杂环戊烯基、1,3-二氧戊环基、1,3-二噻吩基、1,3-二噻烷基、异噁唑啉基、异噁唑烷基、噁唑啉基、噁唑烷基、噁唑烷酮基、噻唑啉基、噻唑烷基、1,3-氧硫杂环戊烷基、二氢吲哚基、异二氢吲哚基、四氢呋喃基、四氢吡喃基、四氢噻吩基、四氢噻喃基、四氢-1,4-噻嗪基、硫代吗啉基、二氢苯并呋喃基、苯并咪唑烷基和四氢喹啉。
如本文所用,“烷氧基烷基”或“(烷氧基)烷基”是指通过亚烷基基团连接的烷氧基基团,诸如C2-C8烷氧基烷基或(C1-C6烷氧基)C1-C6烷基,例如–(CH2)1-3-OCH3
“O-羧基”基团是指其中R选自氢、C1-6烷基、C2-6烯基、C2-6炔基、C3-7碳环基、C6-10芳基、5元至10元杂芳基和3元至10元杂环基的“-OC(=O)R”基团,如本文所定义的。
“C-羧基”基团是指其中R选自由氢、C1-6烷基、C2-6烯基、C2-6炔基、C3-7碳环基、C6-10芳基、5元至10元杂芳基和3元至10元杂环基组成的组的“-C(=O)OR”基团,如本文所定义的。非限制性示例包括羧基(即,-C(=O)OH)。
“磺酰基”基团是指其中R选自氢、C1-6烷基、C2-6烯基、C2-6炔基、C3-7碳环基、C6-10芳基、5元至10元杂芳基和3元至10元杂环基的“-SO2R”基团,如本文所定义的。
“亚磺酸基”基团是指“-S(=O)OH”基团。
“磺基”基团是指“-S(=O)2OH”或“-SO3H”基团。
“磺酸根”基团是指“-SO3ˉ”基团。
“硫酸根”基团是指“-SO4ˉ”基团。
“S-亚磺酰氨基”基团是指其中RA和RB各自独立地选自氢、C1-6烷基、C2-6烯基、C2-6炔基、C3-7碳环基、C6-10芳基、5元至10元杂芳基和3元至10元杂环基的“-SO2NRARB”基团,如本文所定义的。
“N-亚磺酰氨基”基团是指其中RA和Rb各自独立地选自氢、C1-6烷基、C2-6烯基、C2-6炔基、C3-7碳环基、C6-10芳基、5元至10元杂芳基和3元至10元杂环基的“-N(RA)SO2RB”基团,如本文所定义的。
“C-酰氨基”基团是指其中RA和RB各自独立地选自氢、C1-6烷基、C2-6烯基、C2-6炔基、C3-7碳环基、C6-10芳基、5元至10元杂芳基和3元至10元杂环基的“-C(=O)NRARB”基团,如本文所定义的。
“N-酰氨基”基团是指其中RA和RB各自独立地选自氢、C1-6烷基、C2-6烯基、C2-6炔基、C3-7碳环基、C6-10芳基、5元至10元杂芳基和3元至10元杂环基的“-N(RA)C(=O)RB”基团,如本文所定义的。
“氨基”基团是指其中RA和RB各自独立地选自氢、C1-6烷基、C2-6烯基、C2-6炔基、C3-7碳环基、C6-10芳基、5元至10元杂芳基和3元至10元杂环基的“-NRARB”基团,如本文所定义的。非限制性示例包括游离氨基(即,-NH2)。
“氨基烷基”基团是指经由亚烷基基团连接的氨基基团。
“烷氧基烷基”基团是指经由亚烷基基团连接的烷氧基基团,诸如“C2-C8烷氧基烷基”等。
当基团被描述为“任选地取代的”时,其可以是未取代的或取代的。同样,当基团被描述为“取代的”时,取代基可以选自所指示的取代基中的一者或多者。如本文所用,取代的基团衍生自未取代的母体基团,其中已存在一个或多个氢原子与另一个原子或基团的交换。除非另外指明,否则当基团被认为是“取代的”时,这意味着该基团被一个或多个取代基取代,该一个或多个取代基独立地选自:C1-C6烷基、C1-C6烯基、C1-C6炔基、C1-C6杂烷基、C3-C7碳环基(任选被卤基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、C3-C7碳环基-C1-C6-烷基(任选被卤基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、3元至10元杂环基(任选地被卤基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、3元至10元杂环基-C1-C6-烷基(任选地被卤基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、芳基(任选地被卤基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、芳基(C1-C6)烷基(任选地被卤基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、5元至10元杂芳基(任选地被卤基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、5元至10元杂芳基(C1-C6)烷基(任选地被卤基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、卤基、-CN、羟基、C1-C6烷氧基、C1-C6烷氧基(C1-C6)烷基(即,醚)、芳氧基、硫氢基(巯基)、卤基(C1-C6)烷基(例如,–CF3)、卤基(C1-C6)烷氧基(例如,–OCF3)、C1-C6烷硫基、芳硫基、氨基、氨基(C1-C6)烷基、硝基、O-氨甲酰基、N-氨甲酰基、O-硫代氨甲酰基、N-硫代氨甲酰基、C-酰氨基、N-酰氨基、S-亚磺酰氨基、N-亚磺酰氨基、C-羧基、O-羧基、酰基、氰酸根、异氰酸根、硫氰酸根、异硫氰酸根、亚磺酰基、磺酰基、-SO3H、磺酸根、硫酸根、亚磺酸基、-OSO2C1-C4烷基和氧代基(=O)。在基团被描述为“任选地取代的”的任何地方,该基团可以被上述取代基取代。在一些实施方案中,当烷基、烯基、炔基、芳基、杂芳基、碳环基或杂环基基团被取代时,它们各自独立地被选自由以下项组成的组的一个或多个取代基取代:卤基、-CN、-SO3 -、-OSO3 -、-SO3H、-SRA、-ORA、-NRBRC、氧代基、-CONRBRC、-SO2NRBRC、-COOH和-COORB,其中RA、RB和RC各自独立地选自H、烷基、取代的烷基、烯基、取代的烯基、炔基、取代的炔基、芳基和取代的芳基。
如本领域的普通技术人员所理解的,本文所述的化合物可以以离子化形式存在,例如,-CO2 -、-SO3 -或–O-SO3 -。如果化合物包含带正电荷或带负电荷的取代基基团,例如,SO3 -,则其还可以包含带负电荷或带正电荷的抗衡离子,使得该化合物整体为中性的。在其他方面,该化合物可以以盐形式存在,其中抗衡离子由共轭酸或碱提供。
应当理解,根据上下文,某些基团命名惯例可以包括单基或二基。例如,当取代基需要两个与分子其余部分的附接点时,应当理解,该取代基是二基。例如,被识别为需要两个附接点的烷基的取代基包括二基,诸如–CH2–、–CH2CH2–、–CH2CH(CH3)CH2–等。其他基团命名惯例清楚地指示该基团是二基,诸如“亚烷基”或“亚烯基”。
当两个“相邻的”R基团据称“连同它们所附接的原子一起”形成环时,这意味着原子、居间键和两个R基团的集合体为所述的环。例如,当存在以下子结构时:
Figure BDA0004022520900000161
并且R1和R2被限定为选自由氢和烷基组成的组,或者R1和R2连同它们所附接的原子一起形成芳基或碳环基,这意味着R1和R2可以选自氢或烷基,或者另选地,该子结构具有结构:
Figure BDA0004022520900000171
其中A是含有所描绘的双键的芳环或碳环基。
当取代基被描述为二基(即,具有与分子的其余部分的两个附接点)时,应理解,除非另外指明,否则取代基可以任何定向构型附接。因此,例如,描绘为-AE-或
Figure BDA0004022520900000172
的取代基包括被定向成使得A附接在分子的最左侧附接点的取代基,以及其中A附接在所述分子的最右侧附接点处的取代基。另外,如果基团或取代基被描绘为/>
Figure BDA0004022520900000173
则L定义为任选地存在的连接基部分;当L不存在(或没有)时,此类基团或取代基等同于/>
Figure BDA0004022520900000174
本文所述的化合物可以表示为若干内消旋形式。在绘制单一结构的情况下,预期存在任何相关的内消旋形式。本文所述的香豆素化合物由单一结构表示,但同样可以被显示为任何相关的内消旋形式。下面分别示出了式(I)和式(IIa)的示例性内消旋结构:
Figure BDA0004022520900000175
Figure BDA0004022520900000181
在示出本文所述化合物的单一内消旋形式的每种情况下,同样设想了替代性的内消旋形式。
如本文所用,“核苷酸”包括含氮杂环碱基、糖以及一个或多个磷酸基团。它们是核酸序列的单体单元。在RNA中,糖是核糖,并且在DNA中是脱氧核糖,即,缺乏存在于核糖中的羟基基团的糖。含氮杂环碱基可是嘌呤或嘧啶碱基。嘌呤碱基包括腺嘌呤(A)和鸟嘌呤(G)以及它们的修饰衍生物或类似物,诸如7-脱氮腺嘌呤或7-脱氮鸟嘌呤。嘧啶碱基包括胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U)以及它们的修饰衍生物或类似物。脱氧核糖的C-1原子与嘧啶的N-1或嘌呤的N-9键合。
如本文所用,“核苷”在结构上类似于核苷酸,但缺少磷酸部分。核苷类似物的一个示例是其中标记与碱基连接并且没有磷酸基团附接到糖分子的核苷类似物。术语“核苷”在本文中以本领域技术人员所理解的常规含义使用。示例包括但不限于包含核糖部分的核糖核苷和包含脱氧核糖部分的脱氧核糖核苷。经修饰的戊糖部分是其中氧原子已被碳取代和/或碳已被硫或氧原子取代的戊糖部分。“核苷”是可以具有取代的碱基和/或糖部分的单体。另外,核苷可以掺入较大的DNA和/或RNA聚合物和低聚物中。
术语“嘌呤碱基”在本文中以本领域技术人员所理解的普通含义使用,并且包括其互变异构体。类似地,术语“嘧啶碱基”在本文中以本领域技术人员所理解的普通含义使用,并且包括其互变异构体。任选地取代的嘌呤碱基的非限制性列表包括嘌呤、腺嘌呤、鸟嘌呤、7-脱氮腺嘌呤、7-脱氮鸟嘌呤、次黄嘌呤、黄嘌呤、别黄嘌呤、7-烷基鸟嘌呤(例如7-甲基鸟嘌呤)、可可碱、咖啡因、尿酸和异鸟嘌呤。嘧啶碱基的示例包括但不限于胞嘧啶、胸腺嘧啶、尿嘧啶、5,6-二氢尿嘧啶和5-烷基胞嘧啶(例如5-甲基胞嘧啶)。
如本文所用,当寡核苷酸或多核苷酸被描述为“包含”本文所述的核苷或核苷酸时,这意味着本文所述的核苷或核苷酸与寡核苷酸或多核苷酸形成共价键。类似地,当核苷或核苷酸被描述为寡核苷酸或多核苷酸的一部分,诸如“掺入到”寡核苷酸或多核苷酸中时,这意味着本文所述的核苷或核苷酸与寡核苷酸或多核苷酸形成共价键。在一些此类实施方案中,共价键在寡核苷酸或多核苷酸的3'羟基与在本文中描述为寡核苷酸或多核苷酸的3'碳原子与核苷酸的5'碳原子之间的磷酸二酯键的核苷酸的5'磷酸基团之间形成。
如本文所用,术语“可裂解的连接基”并不意在暗示需要去除整个连接基。裂解位点可以位于连接基上确保该连接基的一部分在裂解后保持附接到可检测标记和/或核苷或核苷酸部分的某个位置处。
如本文所用,“衍生物”或“类似物”意指具有修饰的碱基部分和/或修饰的糖部分的合成核苷酸或核苷衍生物。此类衍生物和类似物在例如Scheit,Nucleotide Analogs(John Wiley&Son,1980)和Uhlman等人,Chemical Reviews 90:543-584,1990中进行了讨论。核苷酸类似物还可以包括经修饰的磷酸二酯键,包括硫代磷酸酯键、二硫代磷酸酯键、烷基膦酸酯键、苯胺磷酸酯键和氨基磷酸酯键。如本文所用,“衍生物”、“类似物”和“修饰的”可以互换使用,并且由本文定义的术语“核苷酸”和“核苷”涵盖。
如本文所用,术语“磷酸酯”以本领域技术人员所理解的普通含义使用,并且包括其质子化形式(例如,
Figure BDA0004022520900000191
和/>
Figure BDA0004022520900000192
)。如本文所用,术语“单磷酸”、“二磷酸”和“三磷酸”以本领域技术人员所理解的其普通含义使用,并且包括质子化形式。
如本文所用,术语“定相”是指SBS中的现象,该现象是由3'终止子和荧光团的不完全去除以及未能通过在给定测序循环下通过聚合酶完成簇内DNA链的一部分掺入所引起的。预定相是由掺入不具有有效3'终止子的核苷酸引起的,其中掺入事件由于终止失败而提前1个周期。定相和预定相导致特定循环的测量信号强度由来自当前循环的信号以及来自前一个和后一个循环的噪声组成。随着循环的数量增加,受到定相和预定相影响的每个簇的序列分数增加,妨碍对正确碱基的识别。预定相可以由在通过合成测序(SBS)期间存在痕量的未保护或未封端的3'-OH核苷酸引起。未保护的3'-OH核苷酸可以在制造过程期间或可能在储存和试剂处理过程期间产生。因此,降低预定相发生率的核苷酸类似物的发现是令人惊讶的,并且在SBS应用中提供了比现有核苷酸类似物的更大的优势。例如,所提供的核苷酸类似物可以带来更快的SBS循环时间、更低的定相和预定相值以及更长的测序读长。
式(I)的荧光化合物
本公开的一些方面涉及式(I)的染料及其盐和内消旋形式:
Figure BDA0004022520900000201
/>
其中R1是各自任选地被一个或多个取代基取代的
Figure BDA0004022520900000202
Figure BDA0004022520900000203
或/>
Figure BDA0004022520900000204
该一个或多个取代基独立地选自由以下项组成的组:羧基、-C(O)NRbRc、-C(O)ORd、C1-C6烷基、取代的C1-C6烷基、卤基、任选地取代的氨基、羟基、磺基、磺酸根、硫酸根、N-亚磺酰氨基和S-亚磺酰氨基;
R2是H、任选地取代的C1-C6烷基或任选地被选自由以下项组成的组的一个或多个取代基取代的苯基:羧基、-C(O)NRbRc、-C(O)ORd、任选地取代的C1-C6烷基、卤基、氰基、硝基、磺酰基、亚磺酸基、磺基、磺酸根、任选地取代的氨基和羟基;
每个R3、R4和R7独立地是H、任选地取代的C1-C6烷基、C1-C6烷氧基、C2-C6烯基、C2-C6炔基、C1-C6卤代烷基、C1-C6卤代烷氧基、C1-C6羟烷基、(C1-C6烷氧基)(C1-C6烷基)、任选地取代的氨基、卤基、氰基、羟基、硝基、磺酰基、亚磺酸基、磺基、磺酸根、S-亚磺酰氨基、N-亚磺酰氨基、任选地取代的C3-C10碳环基或任选地取代的3元至10元杂环基;
每个R5和R6独立地是H、C1-C6烷基、取代的C1-C6烷基,或者R5和R6连同它们所附接的氮原子一起形成任选地取代的4元至10元杂环基;
X是O、S或NRa
Ra是H或C1-C6烷基;
每个Rb和Rc独立地是H、C1-C6烷基或取代的C1-C6烷基;并且
Rd是任选地取代的C1-C6烷基或任选地取代的苯基;前提条件是R5或R6中的至少一者或由R5和R6与它们所附接的氮原子形成的任选地取代的4元至10元杂环基包含羧基或-C(O)或-C(O)ORd;或者R1包含羧基或-C(O)或-C(O)ORd
在式(I)的化合物的一些实施方案中,在一些实施方案中,X是O。在一些其他实施方案中,X是S。在其他实施方案中,X是NH。在一些另外的实施方案中,R1
Figure BDA0004022520900000211
Figure BDA0004022520900000212
它们各自独立地被羧基(-COOH)、-C(O)NRbRc或-C(O)ORd取代。在一些另外的实施方案中,R1是各自被羧基取代的/>
Figure BDA0004022520900000213
或/>
Figure BDA0004022520900000214
在一些此类实施方案中,R1是/>
Figure BDA0004022520900000215
Figure BDA0004022520900000216
或/>
Figure BDA0004022520900000217
在一些此类实施方案中,R5和R6中的每一者独立地是C1-C6烷基。在一个实施方案中,R5和R6中的每一者是乙基。在其他实施方案中,R5和R6中的至少一者是H。在一些此类实施方案中,R5是H并且R6是取代的C1-C6烷基。在其他实施方案中,R5和R6中的每一者是取代的C1-C6烷基。在一些此类实施方案中,该C1-C6烷基被一个或多个取代基取代,该一个或多个取代基是诸如羧基、-C(O)ORd、磺基(-SO3H)、磺酸根(-SO3 -)或硫酸根(–O-SO3 -)或任选地取代的氨基(诸如Boc保护的氨基基团)。
在式(I)的化合物的一些其他实施方案中,R1是各自未取代或被磺基(-SO3H)取代的
Figure BDA0004022520900000221
或/>
Figure BDA0004022520900000222
在一些此类实施方案中,R5是H并且R6是被羧基取代的C1-C6烷基。在其他实施方案中,R5和R6中的每一者是被羧基、-C(O)ORd、磺基(-SO3H)、磺酸根(-SO3 -)或硫酸根(–O-SO3 -)取代的C1-C6烷基,并且R5和R6中的一者被羧基取代。在其他实施方案中,R5和R6与它们所附接的氮原子形成包含羧基或被羧基取代的4元、5元、6元或7元杂环基。杂环基基团可以含有一个或两个杂原子。在一个实施方案中,杂环基基团是哌啶基。在其他实施方案中,杂环基基团是哌嗪基或吗啉基。当杂环基基团包含羧基基团时,其可以被C1-C6烷基取代,并且该C1-C6烷基被羧基取代。
在式(I)的化合物的一些实施方案中,R2是H。在其他实施方案中,R2是C1-C6烷基,诸如甲基、乙基、异丙基或叔丁基。在一个实施方案中,R2是甲基。
在式(I)的化合物的一些实施方案中,R3、R4和R7中的至少一者是H。在一些另外的实施方案中,R3、R4和R7中的每一者是H。
在式(I)的化合物的任何实施方案中,当该化合物被-C(O)ORd取代时,Rd是C1-C6烷基或取代的C1-C6烷基。在一个实施方案中,Rd是乙基。
式(I)的化合物的具体实施方案示于下表1中:
表1.式(I)的示例性染料
Figure BDA0004022520900000223
/>
Figure BDA0004022520900000231
式(II)或式(II')的荧光化合物
本公开的一些另外的方面涉及式(II)或式(II')的染料以及它们的盐和内消旋形式:
Figure BDA0004022520900000232
其中X是S、O或NRa
Y是O或NH;
每个R1、R2、R3和R5独立地是H、任选地取代的C1-C6烷基、C1-C6烷氧基、C2-C6烯基、C2-C6炔基、C1-C6卤代烷基、C1-C6卤代烷氧基、C1-C6羟烷基、(C1-C6烷氧基)(C1-C6烷基)、任选地取代的氨基、卤基、氰基、羟基、硝基、磺酰基、亚磺酸基、磺基、磺酸根、S-亚磺酰氨基、N-亚磺酰氨基、任选地取代的C3-C10碳环基、任选地取代的C6-C10芳基、任选地取代的5元至10元杂芳基或任选地取代的3元至10元杂环基;
R4是-NRbRc、卤基、-ORd或-OS(O)2Rd
R6和R7中的每一者独立地是H、羧基、-C(O)NRbRc、-C(O)ORd、C1-C6烷基、取代的C1-C6烷基、C1-C6卤代烷基、卤基、任选地取代的氨基、N-亚磺酰氨基、磺酰基、S-亚磺酰氨基、羟基、氰基、硝基、任选地取代的苯基、任选地取代的C3-C8碳环基、任选地取代的5元至10元杂芳基或任选地取代的3元至10元杂环基;或者式(II)中的R6和R7连同它们所附接的原子一起形成任选地取代的C5-C8碳环基或任选地取代的5元至8元杂环基;
Ra是H或C1-C6烷基;
每个Rb和Rc独立地是H、C1-C6烷基或取代的C1-C6烷基;或者Rb和Rc连同它们所附接的氮原子一起形成任选地取代的4元至10元杂环基;并且
每个Rd独立地是任选地取代的C1-C6烷基或任选地取代的苯基;前提条件是
R6和R7中的至少一者或者由R6和R7与它们所附接的原子形成的任选地取代的C5-C8碳环基或任选地取代的5元至10元杂芳基包含羧基或被羧基取代;或者
R4是-NRbRc并且Rb和Rc中的至少一者是取代的C1-C6烷基,该烷基包含羧基或-C(O)ORd或被羧基或-C(O)ORd取代。
在式(II)或式(II')的化合物的一些实施方案中,R4是卤基(例如,-F、-Cl或-Br)。在一些其他实施方案中,R4是–OS(O)2Rd。在一些此类实施方案中,Rd是C1-C6烷基(例如,甲基、乙基、异丙基或叔丁基)或C1-C6卤代烷基(例如,三氟甲基)。在一些其他实施方案中,R4是-NRbRc并且这些化合物也由式(IIa)或式(IIa')表示:
Figure BDA0004022520900000251
或它们的盐或内消旋形式。在一些此类实施方案中,Rb和Rc中的每一者是H、C1-C6烷基或取代的C1-C6烷基。在一个实施方案中,Rb和Rc中的每一者是H。在一些实施方案中,取代的C1-C6烷基独立地被羧基、-C(O)ORd、磺基(-SO3H)、磺酸根(-SO3ˉ)、硫酸根(–O-SO3ˉ)或-SO2NReRf取代,并且其中Re和Rf中的每一者独立地是H或C1-C6烷基。例如,Rb是H并且Rc是C1-C6烷基或取代的C1-C6烷基。在一个此类实施方案中,Rb是H并且Rc是乙基。在另一个实施方案中,Rb是H并且Rc是被羧基、-C(O)ORd、-SO3H、-SO3ˉ、–O-SO3ˉ或–SO2NH2取代的C1-C6烷基(诸如C3或C5烷基)。在其他示例中,Rb和Rc中的每一者独立地是C1-C6烷基,它们各自可以被-CO2H、-C(O)ORd、-SO3H、-SO3ˉ、–O-SO3ˉ或-SO2NReRf取代。在一个实施方案中,Rb和Rc中的每一者是乙基。在另外的实施方案中,Rb是被-SO3H、-SO3ˉ或–O-SO3ˉ取代的C3或C5烷基,并且Rc是被-CO2H或-C(O)ORd取代的C3或C5烷基。在一些其他实施方案中,Rb和Rc连同它们所附接的氮原子一起形成在环结构中含有一个或两个杂原子的任选地取代的4元、5元、6元或7元杂环基(例如
Figure BDA0004022520900000252
Figure BDA0004022520900000253
或/>
Figure BDA0004022520900000254
其中RN是H、任选地取代的C1-C6烷基(诸如甲基、C3或C5烷基,它们各自任选被一个或多个取代基取代,该一个或多个取代基是诸如羧基、-C(O)ORd、磺基(-SO3H)、磺酸根(-SO3 -)、硫酸根(–O-SO3ˉ)或-SO2NReRf)或氨基保护基团,诸如Boc(-C(=O)OtBu))。在另外的实施方案中,此类4元、5元、6元或7元杂环基可以被一个或多个取代基取代,该一个或多个取代基是诸如未取代或取代的C1-C6烷基、-CO2H、-C(O)ORd、-SO3H、-SO3 -、–O-SO3 -或-SO2NReRf
在式(II)、式(II')、式(IIa)或式(IIa')的化合物的一些实施方案中,Y是O。在其他实施方案中,Y是S。在另外的其他实施方案中,Y是NRa,其中Ra是H、甲基、乙基、异丙基或叔丁基。在一些此类实施方案中,X是O。在其他实施方案中,X是S。
在式(II)、式(II')、式(IIa)或式(IIa')的化合物的一些实施方案中,R1、R2、R3和R5中的每一者独立地是H或任选地取代的C1-C6烷基(例如,甲基、乙基、异丙基或叔丁基)。在一些此类实施方案中,R1是H或C1-C6烷基。在一些此类实施方案中,R2是H。在一些此类实施方案中,R3是H或C1-C6烷基。在一些此类实施方案中,R5是H。
在式(II)、式(II')、式(IIa)或式(IIa')的化合物的一些实施方案中,R6和R7中的每一者独立地是H、C1-C6烷基、取代的C1-C6烷基、任选地取代的苯基、羧基或-C(O)ORd。例如,R6或R7中的一者是H或C1-C6烷基,并且R6或R7中的另一者是羧基、-C(O)ORd、C1-C6烷基、取代的C1-C6烷基或任选地被羧基、-C(O)ORd、-SO3H、-SO3ˉ或–O-SO3ˉ取代的苯基。在一些另外的实施方案中,R6或R7中的一者是H或甲基,并且R6或R7中的另一者是羧基、-C(O)ORd、甲基、苯基、被羧基或-C(O)ORd取代的苯基或者被羧基或-C(O)ORd取代的C1-C6烷基(例如,甲基或乙基)。在式(II)或式(IIa)的化合物的其他实施方案中,R6和R7连同它们所附接的原子一起形成任选地取代的C5、C6、C7或C8碳环基。例如,C5-C8碳环基可以被羧基、-C(O)ORd、-SO3H、-SO3ˉ、–O-SO3ˉ或取代的C1-C6烷基(例如,被羧基或-C(O)ORd取代)取代。
在式(II)、式(II')、式(IIa)或式(IIa')的化合物的任何实施方案中,当该化合物包括C(O)ORd或被C(O)ORd取代时,Rd是C1-C6烷基或取代的C1-C6烷基。在一个实施方案中,Rd是乙基。
式(IIa)的化合物的具体实施方案示于下表2A中。
表2A.示例性的式(II)或式(IIa)的化合物(其中R1、R2和R5中的每一者是H)
Figure BDA0004022520900000261
/>
Figure BDA0004022520900000271
/>
Figure BDA0004022520900000281
/>
Figure BDA0004022520900000291
/>
Figure BDA0004022520900000301
/>
Figure BDA0004022520900000311
表2B.其他示例性的式(II)的化合物(其中R1、R2和R5中的每一者是H)
Figure BDA0004022520900000312
/>
Figure BDA0004022520900000321
式(IIa')化合物的具体实施方案示于下表2C中。
表2C.示例性的式(II')或式(IIa')的化合物(其中R1、R2、R3和R5中的每一者是H)
化合物编号 X Y R<sup>b</sup> R<sup>c</sup> R<sup>6</sup> R<sup>7</sup>
II-1' S O C<sub>2</sub>H<sub>5</sub> C<sub>2</sub>H<sub>5</sub> CH<sub>2</sub>CO<sub>2</sub>H H
II-1a' S O C<sub>2</sub>H<sub>5</sub> C<sub>2</sub>H<sub>5</sub> CH<sub>2</sub>CO<sub>2</sub>C<sub>2</sub>H<sub>5</sub> H
II-1b' S NH C<sub>2</sub>H<sub>5</sub> C<sub>2</sub>H<sub>5</sub> CH<sub>2</sub>CO<sub>2</sub>C<sub>2</sub>H<sub>5</sub> H
II-2' S O H (CH<sub>2</sub>)<sub>3</sub>SO<sub>3</sub>H CH<sub>2</sub>CO<sub>2</sub>H H
II-2a' S O H (CH<sub>2</sub>)<sub>3</sub>SO<sub>3</sub>H CH<sub>2</sub>CO<sub>2</sub>C<sub>2</sub>H<sub>5</sub> H
II-2b' S NH H (CH<sub>2</sub>)<sub>3</sub>SO<sub>3</sub>H CH<sub>2</sub>CO<sub>2</sub>C<sub>2</sub>H<sub>5</sub> H
非限制性示例性的式(IIa)的化合物包括以下:
Figure BDA0004022520900000322
/>
Figure BDA0004022520900000331
/>
Figure BDA0004022520900000341
/>
Figure BDA0004022520900000351
非限制性示例还包括:对应的C1-C6烷基羧酸酯(诸如由化合物的羧基基团形成的甲酯、乙酯、异丙酯和叔丁酯);对应的亚胺类似物(其中式(IIa)的香豆素核心Y位是NH而不是O);对应的噁唑类似物(其中式(IIa)的X位是O而不是S);它们的盐和内消旋形式。
式(II)或式(II')的化合物的附加示例包括以下:
Figure BDA0004022520900000361
非限制性示例还包括:对应的C1-C6烷基羧酸酯(诸如由化合物的羧基基团形成的甲酯、乙酯、异丙酯和叔丁酯);对应的溴化物类似物(其中式(II)或式(II')的R4是-Br而不是-F);对应的亚胺类似物(其中式(II)或式(II')的香豆素核心Y位是NH而不是O);对应的噁唑类似物(其中式(II)或式(II')的X位是O而不是S);它们的盐和内消旋形式。
环辛四烯(COT)光保护部分
在一些实施方案中,可以对本文所述的荧光化合物(式(I)、式(II)或式(II'))进行进一步修饰以引入与其共价键合的光保护部分,例如,环辛四烯部分包含以下结构:
Figure BDA0004022520900000362
其中
R1A和R2A中的每一者独立地是H、羟基、卤素、叠氮基、硫醇、硝基、氰基、任选地取代的氨基、羧基、-C(O)OR5A、-C(O)NR5AR6A、任选地取代的C1-6烷基、任选地取代的C1-6烷氧基、任选地取代的C1-6卤代烷基、任选地取代的C1-6卤代烷氧基、任选地取代的C2-6烯基、任选地取代的C2-6炔基、任选地取代的C6-10芳基、任选地取代的C7-14芳烷基、任选地取代的C3-7碳环基、任选地取代的5元至10元杂芳基或任选地取代的3元至10元杂环基;
X1和Y1各自独立地是化学键、-O-、-S-、-NR3A-、-C(=O)-、-C(=O)-O-、-C(=O)-NR4A-、-S(O)2-、-NR3A-C(=O)-NR4A、-NR3A-C(=S)-NR4A-、任选地取代的C1-6亚烷基或任选地取代的亚杂烷基,其中至少一个碳原子被O、S或N取代;
Z1不存在,是任选地取代的C2-6亚烯基或任选地取代的C2-6亚炔基;
R3A和R4A中的每一者独立地是H、任选地取代的C1-6烷基或任选地取代的C6-10芳基;
R5A和R6A中的每一者独立地是H、任选地取代的C1-6烷基、任选地取代的C6-10芳基、任选地取代的C7-14芳烷基、任选地取代的C3-7碳环基、任选地取代的5元至10元杂芳基或任选地取代的3元至10元杂环基;
Figure BDA0004022520900000371
中R1A和R2A所附接的碳原子任选地被O、S或N取代,前提条件是当所述碳原子被O或S取代时,则R1A和R2A两者均不存在;当所述碳原子被N取代时,则R2A不存在;并且/>
m为介于0和10之间的整数。
在本文所述的荧光化合物的一些实施方案中,X1是-C(=O)-或-C(=O)NR4A-。在X1的一些此类实施方案中,R4A是H。在X1的一些其他实施方案中,R4A是C1-6烷基(例如,甲基、乙基、异丙基或叔丁基)。在一些实施方案中,Y1是-C(=O)O-、-NR3A-或-S(O)2-。在Y1的一些此类实施方案中,R3A是H、C1-6烷基或取代的C1-6烷基(例如,被-CO2H、-NH2、-SO3H、-SO3ˉ或–O-SO3ˉ取代的C1-6烷基)。在Y1的一些此类实施方案中,R3A是H、C1-6烷基或取代的C1-6烷基(例如,被-CO2H、-NH2、-SO3H、-SO3ˉ或–O-SO3ˉ取代的C1-6烷基)。在一些实施方案中,X1和Y1不能两者都是化学键,例如,当X1是化学键时,Y1不是化学键。在一些实施方案中,Z不存在。在其他实施方案中,Z是C2-6亚烯基。
在一些实施方案中,环辛四烯部分包含以下结构:
Figure BDA0004022520900000372
在一些此类实施方案中,R1A和R2A中的至少一者是氢。在一些另外的实施方案中,R1A和R2A两者都是氢。在一些其他实施方案中,R1A是H并且R2A是任选地取代的氨基、羧基或-C(O)NR5AR6A。在一些实施方案中,m是1、2、3、4、5或6,并且R1A和R2A中的每一者独立地是氢、任选地取代的氨基、羧基、-C(O)NR5AR6A或它们的组合。在一些另外的实施方案中,当m是2、3、4、5或6时,一个R1A是氨基、羧基或-C(O)NR5AR6A,并且其余R1A和R2A是氢。在一些实施方案中,在
Figure BDA0004022520900000381
中R1A和R2A所附接的至少一个碳原子被O、S或N取代。在一些此类实施方案中,
Figure BDA0004022520900000382
中的一个碳原子被氧原子取代,并且附接到所述取代的碳原子的R1A和R2A两者都不存在。在一些其他实施方案中,当/>
Figure BDA0004022520900000383
中的一个碳原子被氮原子取代时,附接到所述取代的碳原子的R2A不存在,并且附接到所述取代的碳原子的R1A是氢或C1-6烷基。在R1A和R2A的任何实施方案中,当R1A或R2A是-C(O)NR5AR6A时,R5A和R6A可以独立地是H、C1-6烷基或取代的C1-6烷基(例如,被-CO2H、-NH2、-SO3H或-SO3ˉ取代的C1-6烷基)。
在一些另外的实施方案中,本文所述的荧光化合物包含以下结构的环辛四烯部分:
Figure BDA0004022520900000384
Figure BDA0004022520900000391
本文所述的COT部分可以由本文所述的荧光染料的官能团(例如,羧基基团)与COT衍生物的氨基基团之间的反应形成酰胺键(其中未示出酰胺键的羰基基团)产生。
式(I)的COT保护化合物的非限制性示例包括:
Figure BDA0004022520900000392
标记的核苷酸或寡核苷酸
根据本公开的一个方面,本文所述的染料化合物适用于附接到底物部分,特别是包含连接基基团以使得能够附接到底物部分的染料化合物。底物部分事实上可以是本公开的染料可以与之缀合的任何分子或物质,并且以非限制性示例的方式,可以包括核苷、核苷酸、多核苷酸、碳水化合物、配体、颗粒、固体表面、有机聚合物和无机聚合物、染色体、核、活细胞,以及它们的组合或装配物。染料可以通过任选的连接基通过多种方式(包括疏水吸引、离子吸引和共价附接)缀合。在一些方面,染料通过共价附接缀合至底物。更具体地讲,共价附接借助于连接基基团实现。在一些情况下,此类标记的核苷酸也被称为“经修饰的核苷酸”。
本公开的一些方面涉及用如本文所述的式(I)、式(II)、式(II')、式(IIa)或式(IIa')的染料标记的核苷酸或寡核苷酸,或它们的含有本文所述的光保护部分的衍生物。标记的核苷酸或寡核苷酸可以经由羧基(-CO2H)或烷基-羧基基团附接到本文所公开的染料化合物以形成酰胺或烷基-酰胺键。在一些另外的实施方案中,羧基基团可以呈羧基基团的活化形式的形式,例如,酰胺或酯,这样的形式可以用于附接到核苷酸或寡核苷酸的氨基或羟基基团。如本文所用,术语“活化酯”是指能够在温和条件下反应例如与含有氨基基团的化合物反应的羧基基团衍生物。活化酯的非限制性示例包括但不限于对硝基苯基、五氟苯基和琥珀酰亚胺酯。
例如,式(I)的染料化合物可以经由式(I)的R1或R5/R6中的一者附接到核苷酸或寡核苷酸。在一些此类实施方案中,式(I)的R1包含-CO2H或-(CH2)1-6-CO2H,并且该附接在R1的羧基官能团与核苷酸或核苷酸连接基的氨基官能团之间形成酰胺部分。因此,标记的核苷酸或寡核苷酸可以包含以下结构的染料部分:
Figure BDA0004022520900000401
在其他实施方案中,式(I)的R5或R6包含-CO2H或-(CH2)1-6-CO2H,并且该附接使用–CO2H基团形成酰胺。
此外,式(II)或式(II')的染料化合物可以经由式(II)/(II')/(IIa)/(IIa')的R6或R7;或式(IIa)/(IIa')的Rb或Rc附接到核苷酸或寡核苷酸。在一些此类实施方案中,式(II)/(II')/(IIa)/(IIa')的R6或R7包含-CO2H或-(CH2)1-6-CO2H,并且该附接在R6或R7的羧基官能团与核苷酸或核苷酸连接基的氨基官能团之间形成酰胺部分。因此,标记的核苷酸或寡核苷酸可以包含以下结构的染料部分:
Figure BDA0004022520900000411
在其他实施方案中,式(IIa)/(IIa')的Rb或Rc包含-CO2H或-(CH2)1-6-CO2H,并且该附接使用–CO2H基团形成酰胺。
在一些实施方案中,染料化合物可以经由核苷酸碱基共价附接到寡核苷酸或核苷酸。在一些此类实施方案中,标记的核苷酸或寡核苷酸可以具有任选地通过连接基部分附接到嘧啶碱基的C5位置或7-脱氮嘌呤碱基的C7位置的染料。例如,核碱基可以是7-脱氮腺嘌呤,并且染料任选地通过连接基在C7位置处附接到7-脱氮腺嘌呤。核碱基可以是7-脱氮鸟嘌呤,并且染料任选地通过连接基在C7位置处附接到7-脱氮鸟嘌呤。核碱基可以是胞嘧啶,并且染料任选地通过连接基在C5位置处附接到胞嘧啶。作为另一示例,核碱基可以是胸腺嘧啶或尿嘧啶,并且染料任选地通过连接基在C5位置处附接到胸腺嘧啶或尿嘧啶。
3'-OH封端基团
标记的核苷酸或寡核苷酸还可以具有共附连接到核苷酸的核糖或脱氧核糖的封端基团。该封端基团可以附接在核糖或脱氧核糖上的任何位置处。在特定实施方案中,该封端基团位于核苷酸的核糖或脱氧核糖的3'OH位置处。各种3'OH封端基团公开于WO2004/018497和WO2014/139596中,这些申请特此以引用方式并入。例如,封端基团可以是叠氮甲基(-CH2N3)或取代的叠氮甲基(例如,-CH(CHF2)N3或CH(CH2F)N3)、或连接至核糖或脱氧核糖部分的3'氧原子的烯丙基。在一些实施方案中,3'封端基团是叠氮甲基,与核糖或脱氧核糖的3'碳形成3′-OCH2N3
在一些其他实施方案中,3'封端基团和3'氧原子形成共价附接到核糖或脱氧核糖的3'碳的结构
Figure BDA0004022520900000421
的缩醛基团,其中:
每个R1a和R1b独立地是H、C1-C6烷基、C1-C6卤代烷基、C1-C6烷氧基、C1-C6卤代烷氧基、氰基、卤素、任选地取代的苯基或任选地取代的芳烷基;
每个R2a和R2b独立地是H、C1-C6烷基、C1-C6卤代烷基、氰基或卤素;
另选地,R1a和R2a连同它们所附接的原子一起形成任选地取代的五元至八元杂环基基团;
RF是H、任选地取代的C2-C6烯基、任选地取代的C3-C7环烯基、任选地取代的C2-C6炔基或任选地取代的(C1-C6亚烷基)Si(R3a)3;并且
每个R3a独立地是H、C1-C6烷基或任选地取代的C6-C10芳基。
附加的3'OH封端基团公开于美国公开2020/0216891A1中,该公开全文以引用方式并入。缩醛封端基团的非限制性示例为
Figure BDA0004022520900000422
(AOM)、
Figure BDA0004022520900000423
Figure BDA0004022520900000424
和/>
Figure BDA0004022520900000425
各自共价附接到核糖或脱氧核糖的3'碳。
连接基
如本文所公开的染料化合物可以在取代基位置之一处包括反应性连接基基团,用于将该化合物共价附接至底物或另一分子。反应性连接基团是能够形成键(例如,共价键或非共价键)、特别是共价键的部分。在一个特定实施方案中,连接基可以是可裂解的连接基。使用术语“可裂解的连接基”并不意在暗示需要除去整个连接基。裂解位点可以位于连接基上确保该连接基的一部分在裂解后保持附接到染料和/或底物部分的某个位置处。以非限制性示例的方式,可裂解的连接基可以是亲电可裂解的连接基、亲核可裂解的连接基、可光裂解的连接基、在还原条件下可裂解的(例如含有二硫化物或叠氮化物的连接基)、在氧化条件下可裂解的、通过使用安全捕获连接基可裂解的,以及通过消除机制可裂解的。使用可裂解的连接基将染料化合物附接到底物部分确保了如果需要的话,可以在检测后移除标记,从而避免下游步骤中的任何干扰信号。
可用的连接基基团可以见于PCT公开WO2004/018493(以引用方式并入本文)中,其示例包括可以使用水溶性膦或由过渡金属和至少部分水溶性的配体形成的水溶性过渡金属催化剂裂解的连接基。在水性溶液中,后者形成至少部分水溶性的过渡金属络合物。此类可裂解的连接基可以用于将核苷酸的碱基连接到标记,诸如本文所示的染料。
特定的连接基包括PCT公开WO2004/018493(以引用方式并入本文)中所公开的那些,诸如包括下式的部分的那些:
Figure BDA0004022520900000431
(其中X选自包括O、S、NH和NQ的组,其中Q是C1-10取代或未取代的烷基基团,Y选自包括O、S、NH和N(烯丙基)的组,T是氢或C1-C10取代或未取代的烷基基团,并且*指示所述部分与核苷酸或核苷的其余部分连接的位置)。在一些方面,连接基将核苷酸的碱基连接到标记,诸如,本文所述的染料化合物。
连接基的附加示例包括美国公开2016/0040225(以引用方式并入本文)中所公开的那些,诸如包括下式的部分的那些:
Figure BDA0004022520900000441
(其中*指示所述部分与核苷酸或核苷的其余部分连接的位置)。本文所展示的连接基部分可以包括核苷酸/核苷与标记之间的全部或部分连接基结构。本文所展示的连接基部分可以包括核苷酸/核苷与标记之间的全部或部分连接基结构。
连接基的附加示例包括下式的部分:
Figure BDA0004022520900000442
其中B是核碱基;Z是–N3(叠氮基)、–O-C1-C6烷基、–O-C2-C6烯基或–O-C2-C6炔基;并且Fl包括染料部分,所述染料部分可以含有另外的连接基结构。本领域普通技术人员理解,本文所述的染料化合物通过使染料化合物的官能团(例如,羧基)与连接基的官能团(例如,氨基)反应而共价键合到连接基。在一个实施方案中,可裂解连接基包含
Figure BDA0004022520900000451
(“AOL”连接基部分),其中Z是–O-烯丙基。
在特定实施方案中,荧光染料(荧光团)和鸟嘌呤碱基之间的连接基的长度可以改变,例如,通过引入聚乙二醇间隔区基团,从而与通过本领域已知的其他键附接到鸟嘌呤碱基的相同荧光团相比增加了荧光强度。示例性连接基及其特性在PCT公开WO2007020457(以引用方式并入本文)中示出。连接基的设计,尤其是其增加的长度,可以允许当掺入到多核苷酸(诸如DNA)中时,改善附接到鸟苷核苷酸的鸟嘌呤碱基的荧光团的亮度。因此,当染料用于需要检测附接到含有鸟嘌呤的核苷酸的荧光染料标记的任何分析方法中时,有利的是连接基包含式–((CH2)2O)n–的间隔区基团,其中n为介于2和50之间的整数,如WO 2007/020457中所述。
核苷和核苷酸可以在糖或核碱基上的位点处标记。如本领域所知的,“核苷酸”由含氮碱基、糖和一个或多个磷酸基团组成。在RNA中,该糖是核糖,而在DNA中是脱氧核糖,即,缺乏存在于核糖中的羟基基团的糖。含氮碱基是嘌呤或嘧啶的衍生物。嘌呤是腺嘌呤(A)和鸟嘌呤(G),并且嘧啶是胞嘧啶(C)和胸腺嘧啶(T),或在RNA的情况下是尿嘧啶(U)。脱氧核糖的C-1原子与嘧啶的N-1或嘌呤的N-9键合。核苷酸也是核苷的磷酸酯,其中酯化发生在附接到糖的C-3或C-5的羟基基团上。核苷酸通常是单磷酸、二磷酸或三磷酸。
“核苷”在结构上类似于核苷酸,但缺少磷酸部分。核苷类似物的一个示例是其中标记与碱基连接并且没有磷酸基团附接到糖分子的核苷类似物。
虽然碱基通常被称为嘌呤或嘧啶,但是技术人员将理解,可获得不改变核苷酸或核苷经历Watson-Crick碱基配对的能力的衍生物和类似物。“衍生物”或“类似物”意味着这样的化合物或分子:其核心结构与母体化合物的核心结构相同或非常类似,但其具有允许衍生的核苷酸或核苷与另一分子连接的化学或物理修饰,诸如不同的或附加的侧基。例如,碱基可以是脱氮嘌呤。在特定实施方案中,衍生物应当能够经历Watson-Crick配对。“衍生物”和“类似物”还包括例如具有经修饰的碱基部分和/或经修饰的糖部分的合成核苷酸或核苷衍生物。此类衍生物和类似物在例如Scheit,Nucleotide analogs(John Wiley&Son,1980)和Uhlman等人,Chemical Reviews 90:543-584,1990中进行了讨论。核苷酸类似物还可以包括经修饰的磷酸二酯键,包括硫代磷酸酯键、二硫代磷酸酯键、烷基膦酸酯键、苯胺磷酸酯键、氨基磷酸酯键等。
染料可以例如通过连接基附接到核苷酸碱基上的任何位置。在特定实施方案中,仍然可以对所得的类似物进行Watson-Crick碱基配对。特定的核碱基标记位点包括嘧啶碱基的C5位置或7-脱氮嘌呤碱基的C7位置。如上所述,连接基基团可以用于将染料共价附接到核苷或核苷酸。
在特定实施方案中,标记的核苷酸或寡核苷酸可以是可酶促掺入的和可酶促延伸的。因此,连接基部分可以具有足够的长度以将核苷酸连接到化合物,使得该化合物不显著干扰核酸复制酶对核苷酸的总体结合与识别。因此,连接基还可以包含间隔区单元。间隔区距离为例如核苷酸碱基距裂解位点或标记的距离。
用本文所述的染料标记的核苷或核苷酸可以具有下式:
Figure BDA0004022520900000461
其中染料是本文所述的染料化合物(标记)部分(在染料的官能团与连接基“L”的官能团之间的共价键合之后);B是核碱基,诸如尿嘧啶、胸腺嘧啶、胞嘧啶、腺嘌呤、7-脱氮腺嘌呤、鸟嘌呤、7-脱氮鸟嘌呤等;L是可以存在或可以不存在的任选的连接基;R'可以是H,或者-OR'是单磷酸根、二磷酸根、三磷酸根、硫代磷酸根、磷酸酯类似物、附接到反应性含磷基团的–O–,或者被封端基团保护的–O–;R”是H或OH;并且R”'是H、亚磷酰胺或本文所述的3'OH封端基团。其中R”是亚磷酰胺,R'是酸可裂解的羟基保护基团,其允许随后在自动化合成条件下进行单体偶联。在一些另外的实施方案中,B包括
Figure BDA0004022520900000471
Figure BDA0004022520900000472
或/>
Figure BDA0004022520900000473
或它们的任选地取代的衍生物和类似物。在一些另外的实施方案中,标记的核碱基包括结构
Figure BDA0004022520900000474
Figure BDA0004022520900000475
或/>
Figure BDA0004022520900000476
在一个特定实施方案中,封端基团是与染料化合物分开的并且独立于染料化合物,即,不与后者附接。另选地,染料可以包含3'-OH封端基团的全部或部分。因此,R”'可以是可以构成或可以不构成染料化合物的3'OH封端基团。
在又一个替代性的实施方案中,戊糖的3'碳上不存在封端基团,并且附接到碱基的染料(或染料和连接基构造)例如可以具有足以充当掺入另外的核苷酸的障碍的尺寸或结构。因此,该障碍可以归因于空间位阻或可以归因于尺寸、电荷和结构的组合,无论染料是否附接到糖的3’位置。
在另外又一个替代性的实施方案中,该封端基团存在于戊糖的2'或4'碳上,并且可以具有足以充当掺入另外的核苷酸的障碍的尺寸或结构。
使用封端基团允许对聚合进行控制,诸如当掺入标记的核苷酸时通过停止延伸来控制。如果封闭效应是可逆的,例如,以非限制性示例的方式,则通过改变化学条件或通过除去化学障碍,可以在某些点处停止延伸,然后允许其继续。
在一个特定实施方案中,连接基(在染料和核苷酸之间)和封端基团两者均存在并且为单独的部分。在特定实施方案中,连接基和封端基团两者在相同或基本上类似的条件下都是可裂解的。因此,脱保护和脱封闭过程可能更有效,因为只需要单一处理就可以除去染料化合物和封端基团这两者。然而,在一些实施方案中,连接基和封端基团不需要可在类似条件下裂解,而是可在不同条件下单独裂解。
本公开还涵盖掺入了染料化合物的多核苷酸。此类多核苷酸可以为分别由以磷酸二酯键接合的脱氧核糖核苷酸或核糖核苷酸组成的DNA或RNA。多核苷酸可以包含与如本文示出的至少一种经修饰的核苷酸(例如,用染料化合物标记)组合的天然存在的核苷酸、除本文所述的标记的核苷酸之外的非天然存在的(或经修饰的)核苷酸或它们的任何组合。根据本公开的多核苷酸还可以包括非天然的骨架键和/或非核苷酸化学修饰。还设想了由包含至少一种标记的核苷酸的核糖核苷酸和脱氧核糖核苷酸的混合物组成的嵌合结构。
如本文所述的非限制性示例性标记的核苷酸包括:
Figure BDA0004022520900000491
其中L表示连接基,并且R表示如上所述的核糖或脱氧核糖部分,或具有被单磷酸、二磷酸或三磷酸取代的5'位置的核糖或脱氧核糖部分。
在一些实施方案中,非限制性示例性荧光染料缀合物在下文示出:
Figure BDA0004022520900000501
/>
Figure BDA0004022520900000511
/>
Figure BDA0004022520900000521
其中PG代表本文所述的3'OH封端基团;n为1、2、3、4、5、6、7、8、9或10的整数;并且m为0、1、2、3、4或5。在一个实施方案中,–O–PG是AOM。在另一个实施方案中,–O–PG是–O–叠氮甲基。在一个实施方案中,n为5。
Figure BDA0004022520900000522
是指作为连接基部分的氨基与染料的羧基基团之间的反应的结果的染料与可裂解连接基的连接点。在本文所述的标记的核苷酸的任何实施方案中,核苷酸为核苷酸三磷酸。
本公开的另外的方面涉及包含本文所述的标记的核苷酸的寡核苷酸。在一些实施方案中,寡核苷酸与靶多核苷酸的至少一部分杂交。在一些实施方案中,靶多核苷酸被固定在固体载体上。在一些另外的实施方案中,固体载体包含多个固定的靶多核苷酸的阵列。
试剂盒
本文提供了包括一种或多种核苷酸的试剂盒,其中至少一种核苷酸是用本公开的化合物标记的核苷酸。在一些实施方案中,试剂盒包含第二类型的核苷酸,并且第二类型的核苷酸用与第一类型的标记的核苷酸不同的化合物标记。在一些实施方案中,使用单一激光波长能够激发第一类型的标记的核苷酸和第二类型的标记的核苷酸。该试剂盒可以包括两种或更多种标记的核苷酸。这些核苷酸可以用两种或更多种荧光标记物进行标记。可以使用单个激发源来激发这些标记中的两种或更多种标记,该激发源可以是激光器。例如,这两种或更多种标记的激发带可以至少部分地重叠,使得光谱重叠区域中的激发导致这两种标记发射荧光。在特定实施方案中,来自两种或更多种标记的发射将出现在光谱的不同区域中,使得可以通过光学区分发射来确定至少一种标记的存在。该试剂盒还包含第三核苷酸和第四核苷酸,其中第二核苷酸、第三核苷酸和第四核苷酸中的每一者用不同的化合物标记,其中每种标记具有能够与其他标记区分的不同的吸光度最大值。
在一些方面,试剂盒可以含有四种类型的标记的核苷酸(A、C、G和T或U,例如dATP、dCTP、dGTP和dTTP或dUTP),其中四种核苷酸中的第一类型用如本文所公开的化合物标记。在此类试剂盒中,四种类型的核苷酸中的每一者可以用与其他三种核苷酸上的标记相同或不同的化合物进行标记。另选地,第一类型的核苷酸是本文所描述的标记的核苷酸,第二类型的核苷酸用第二标记标记,第三类型的核苷酸用第三标记标记,并且第四类型的核苷酸未标记(暗色)。作为另一示例,第一类型的核苷酸是本文所述的标记的核苷酸,第二类型的核苷酸用第二标记标记,第三类型的核苷酸用两种标记(即本文公开的化合物和第二标记)的混合物标记,并且第四类型的核苷酸未标记(暗色)。当用两种标记的混合物标记一种类型的核苷酸时,此种类型的核苷酸的一部分可用一个标记(例如,本文所述的化合物)标记,并且此种类型的核苷酸的另一部分可用第二标记标记。因此,标记的化合物中的一者或多者可以具有不同的吸光度最大值和/或发射最大值,使得所述化合物能够与其他化合物区分开。例如,每种化合物可以具有不同的吸光度最大值和/或发射最大值,使得这些化合物中的每一种化合物能够与其他三种化合物区分开。应当理解,吸收光谱和/或发射光谱中除最大值之外的部分可以不同,并且可以利用这些差异来区分化合物。该试剂盒可以是这样的:即,这些化合物中的两种或更多种化合物具有不同的吸光度最大值。本发明的化合物通常吸收低于500nm的区域中的光。
本文示出的化合物、核苷酸或试剂盒可以用于检测、测量或识别生物系统(包括例如其过程或组分)。可以采用所述化合物、核苷酸或试剂盒的示例性技术包括测序、表达分析、杂交分析、遗传分析、RNA分析、细胞测定(例如,细胞结合或细胞功能分析)或者蛋白质测定(例如,蛋白质结合测定或蛋白质活性测定)。该用途可以是在用于执行特定技术的自动化仪器(诸如自动化测序仪器)上。测序仪器可以包含在不同波长下操作的两个激光器。
在一个特定实施方案中,本文所描述的标记的核苷酸可以与未标记或天然核苷酸或其任何组合进行组合供应。核苷酸的组合可以作为独立的单独组分(例如,每个容器或管一个核苷酸类型)或作为核苷酸混合物(例如,在同一容器或管中混合的两种或更多种核苷酸)提供。
在试剂盒包含多种,特别地是两种或三种、或者更特别地是四种核苷酸的情况下,不同的核苷酸可以用不同的染料化合物标记,或者一种可以是暗色的,没有染料化合物。在不同的核苷酸用不同的染料化合物标记的情况下,试剂盒的一个特征是染料化合物是光谱上可区分的荧光染料。如本文所用,术语“光谱上可区分的荧光染料”是指当一个样品中存在两种或更多种此类染料时,以能够通过荧光检测设备(例如,商业的基于毛细管的DNA测序平台)区分的波长发射荧光能量的荧光染料。当用荧光染料化合物标记的两种核苷酸以试剂盒形式提供时,一些实施方案的特征在于光谱上可区分的荧光染料能够以相同的波长激发,诸如,通过相同的激光器激发。当用荧光染料化合物标记的四种核苷酸以试剂盒形式提供时,一些实施方案的特征在于光谱上可区分的荧光染料中的两种荧光染料均能够以一个波长激发,并且另外两种光谱上可区分的染料均能够以另一个波长激发。染料的特定激发波长在450nm至460nm、488nm或532nm之间。
在一个实施方案中,试剂盒包括用本公开的化合物标记的第一核苷酸和用第二染料标记的第二核苷酸,其中染料具有至少10nm,特别地20nm至50nm的吸光度最大值差值。更具体地讲,这两种染料化合物具有介于15nm至40nm之间的斯托克斯位移,其中“斯托克斯位移”是峰值吸收波长和峰值发射波长之间的距离。
在一个另外的实施方案中,试剂盒还可以包括两种其他的用荧光染料标记的核苷酸,其中这些染料由相同的激光器在532nm处激发。这些染料可以具有至少10nm,特别地20nm至50nm的吸光度最大值差值。更具体地讲,这两种染料化合物可以具有介于20nm至40nm之间的斯托克斯位移。与本公开的染料光谱可区分并且满足上述标准的特定染料是如美国专利5,268,486(例如Cy3)或WO 0226891(Alexa 532;Molecular Probes A20106)所述的聚甲炔类似物或如美国专利6,924,372所述的不对称聚甲炔,这些专利中的每一篇以引用方式并入本文。替代性的染料包括罗丹明类似物,例如四甲基罗丹明及其类似物。
在一个替代性的实施方案中,本公开的试剂盒可以包含其中相同的碱基用两种不同的化合物标记的核苷酸。第一核苷酸可以用本公开的化合物标记。第二核苷酸可以用光谱上不同的化合物标记,例如在小于600nm处吸收的“绿色”染料。第三核苷酸可以被标记为本公开的化合物和光谱上不同的化合物的混合物,并且第四核苷酸可以是“暗色”并且不含标记。因此,简单地讲,核苷酸1至4可以被标记为“蓝色”、“绿色”、“蓝色/绿色”和暗色。为了进一步简化仪器,可以用单个激光器所激发的两种染料标记四种核苷酸,因此核苷酸1至4的标记可以是“蓝色1”、“蓝色2”、“蓝色1/蓝色2”和暗色。
核苷酸可以包含本公开的两种染料。试剂盒可以包含用本公开的染料标记的两种或更多种核苷酸。试剂盒可以包含另外的核苷酸,其中该核苷酸用在520nm至560nm的区域中吸收的染料标记。试剂盒还可以包含未标记的核苷酸。
尽管本文以具有用不同染料化合物标记的不同核苷酸的构型为例来说明试剂盒,但是应当理解,试剂盒可以包括具有相同染料化合物的2种、3种、4种或更多种不同核苷酸。
除了标记的核苷酸之外,试剂盒还可以同时包含至少一种另外的组分。所述另外的组分可以是在本文示出的方法中或在下文的实施例部分中识别的组分中的一种或多种组分。可以结合到本公开的试剂盒中的组分的一些非限制性示例在下文示出。在一些实施方案中,试剂盒还包含DNA聚合酶(诸如突变DNA聚合酶)和一种或多种缓冲液组合物。一种缓冲液组合物可以包含抗氧化剂,诸如抗坏血酸或抗坏血酸钠,该抗氧化剂可以用于在检测期间保护染料化合物免受光损伤。另外的缓冲液组合物可以包含可用于裂解3'封端基团和/或可裂解连接基的试剂。例如,由过渡金属和至少部分水溶性配体(诸如钯络合物)形成的水溶性膦或水溶性过渡金属催化剂。试剂盒的各种组分可以以在使用前稀释的浓缩形式提供。在此类实施方案中,还可以包括合适的稀释缓冲液。同样,在本文示出的方法中识别的组分中的一种或多种组分可以被包括在本公开的试剂盒中。
制备方法
本文公开了合成本公开的化合物的方法。根据本公开的染料可以由多种不同的合适起始物质合成。例如,式(IIa)的化合物可以通过使式(III)的化合物与式NHRbRc的胺反应来制备:
Figure BDA0004022520900000561
其中X是S、O或NRa
Y是O或NH;
每个R1、R2、R3和R5独立地是H、任选地取代的C1-C6烷基、C1-C6烷氧基、C2-C6烯基、C2-C6炔基、C1-C6卤代烷基、C1-C6卤代烷氧基、C1-C6羟烷基、(C1-C6烷氧基)(C1-C6烷基)、任选地取代的氨基、卤基、氰基、羟基、硝基、磺酰基、亚磺酸基、磺基、磺酸根、S-亚磺酰氨基、N-亚磺酰氨基、任选地取代的C3-C10碳环基、任选地取代的C6-C10芳基、任选地取代的5元至10元杂芳基或任选地取代的3元至10元杂环基;
R6和R7中的每一者独立地是H、羧基、-C(O)NRbRc、-C(O)ORd、C1-C6烷基、取代的C1-C6烷基、C1-C6卤代烷基、卤基、任选地取代的氨基、N-亚磺酰氨基、磺酰基、S-亚磺酰氨基、羟基、氰基、硝基、任选地取代的苯基、任选地取代的C3-C8碳环基、任选地取代的5元至10元杂芳基或任选地取代的3元至10元杂环基;或者R6和R7连同它们所附接的原子一起形成任选地取代的C5-C8碳环基或任选地取代的5元至8元杂环基;
R6和R7中的每一者独立地是H、羧基、-C(O)NRbRc、-C(O)ORd、C1-C6烷基、取代的C1-C6烷基、卤基、任选地取代的氨基、羟基或任选地取代的苯基;或者R6和R7连同它们所附接的原子一起形成任选地取代的C5-C8碳环基;
Rx是卤基、-ORd或-OS(O)2Rd
Ra是H或C1-C6烷基;
每个Rb和Rc独立地是H、C1-C6烷基或取代的C1-C6烷基;或者Rb和Rc连同它们所附接的氮原子一起形成任选地取代的4元至10元杂环基;并且
每个Rd独立地是任选地取代的C1-C6烷基或任选地取代的苯基。
反应可以在有机溶剂中在环境温度或升高的温度下进行。类似地,式(IIa')的化合物可以通过使式(III')的化合物与式NHRbRc的胺反应来制备,其中在本文中定义了结构中的变量。
Figure BDA0004022520900000571
测序方法
包含根据本公开的染料化合物的核苷酸可以用于任何分析方法,诸如包括检测附接到此类核苷酸的荧光标记的方法,无论是以其本身使用,还是掺入到较大的分子结构或缀合物中或者与较大的分子结构或缀合物相关联。在该语境中,术语“掺入到多核苷酸中”可以意味着5'磷酸以磷酸二酯键与第二核苷酸的3'羟基基团接合,该第二核苷酸本身可以形成较长多核苷酸链的一部分。本文示出的核苷酸的3'端可以以磷酸二酯键或可以不以磷酸二酯键与另外的核苷酸的5'磷酸接合。因此,在一个非限制性实施方案中,本公开提供了检测掺入到多核苷酸中的标记的核苷酸的方法,该方法包括:(a)将至少一种本公开的标记的核苷酸掺入到多核苷酸中,以及(b)通过检测来自附接到所述核苷酸的染料化合物的荧光信号,来确定掺入到多核苷酸中的核苷酸的身份。
该方法可以包括:合成步骤(a),其中将根据本公开的一种或多种标记的核苷酸掺入到多核苷酸中;以及检测步骤(b),其中通过检测或定量测量掺入到多核苷酸中的一种或多种标记的核苷酸的荧光,来检测所述核苷酸。
本申请的一些实施方案涉及一种确定单链靶多核苷酸的序列的方法,该方法包括:(a)使引物多核苷酸/靶多核苷酸复合物与一种或多种标记的核苷酸(诸如核苷三磷酸A、G、C和T)接触,其中所述标记的核苷酸中的至少一者是本文所述的标记的核苷酸,并且其中该引物多核苷酸与该靶多核苷酸的至少一部分互补;(b)将标记的核苷酸掺入到该引物多核苷酸中;以及(c)执行一次或多次荧光测量以确定所掺入的核苷酸的身份。在一些此类实施方案中,引物多核苷酸/靶多核苷酸复合物通过使靶多核苷酸与和靶多核苷酸的至少一部分互补的单链引物多核苷酸接触而形成。在一些实施方案中,该方法还包括(d)从掺入到引物多核苷酸中的核苷酸中去除标记部分和3'封端基团。在一些另外的实施方案中,该方法还可以包括(e)将去除的标记部分和3'封端基团从引物多核苷酸链上洗掉。在一些实施方案中,重复步骤(a)至步骤(d)或步骤(a)至步骤(e),直至确定靶多核苷酸链的至少一部分的序列。在一些情况下,重复步骤(a)至步骤(d)或步骤(a)至步骤(e)至少50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或200次。在一些实施方案中,在单一化学反应中去除来自掺入到引物多核苷酸链中的核苷酸的标记部分和3'封端基团。在一些另外的实施方案中,该方法在自动化测序仪器上执行,并且其中该自动化测序仪器包含在不同波长下操作的两个光源。
在一个实施方案中,至少一种核苷酸在合成步骤中通过聚合酶的作用被掺入到多核苷酸(诸如本文所述的单链引物多核苷酸)中。然而,可以使用将核苷酸接合到多核苷酸的其他方法,诸如,化学寡核苷酸合成或者将标记的寡核苷酸与未标记的寡核苷酸连接。因此,当术语“掺入”关于核苷酸和多核苷酸使用时,可以涵盖通过化学方法以及酶促方法进行的多核苷酸合成。
在一个特定实施方案中,进行了合成步骤并且该合成步骤可以任选地包括将模板或靶多核苷酸链与包含本公开的荧光标记的核苷酸的反应混合物一起温育。还可以在允许在退火到模板或靶多核苷酸链的多核苷酸链上的游离3'羟基基团和标记的核苷酸上的5'磷酸基团之间形成磷酸二酯键的条件下提供聚合酶。因此,合成步骤可以包括通过核苷酸与模板/靶链的互补碱基配对来指导多核苷酸链的形成。
在所述方法的所有实施方案中,检测步骤可以在向其中掺入了标记的核苷酸的多核苷酸链退火到模板/靶链上时进行,或者在其中将两条链分离的变性步骤之后进行。在合成步骤和检测步骤之间可以包括另外的步骤,例如化学反应步骤或酶促反应步骤,或者纯化步骤。具体地讲,可以分离或纯化掺入了标记的核苷酸的多核苷酸链,然后进一步加工或用于后续的分析。以举例的方式,在合成步骤中掺入了如本文所述的标记的核苷酸的多核苷酸链随后可以用作标记的探针或引物。在其他实施方案中,本文示出的合成步骤的产物可以经受进一步的反应步骤,并且如果需要,这些后续步骤的产物被纯化或分离。
用于合成步骤的合适条件将为熟悉标准分子生物学技术的人员所熟知。在一个实施方案中,合成步骤可以类似于标准引物延伸反应,该标准引物延伸反应在合适的聚合酶的存在下使用核苷酸前体(包括如本文所述的标记的核苷酸)形成与模板/靶链互补的延伸的多核苷酸链(引物多核苷酸链)。在其他实施方案中,合成步骤本身可以形成产生标记的双链扩增产物的扩增反应的一部分,该标记的双链扩增产物由来源于引物多核苷酸链和模板多核苷酸链的复制的退火互补链组成。其他示例性合成步骤包括切口平移、链置换聚合、随机引发的DNA标记等。用于合成步骤的特别有用的聚合酶是能够催化如本文示出的标记的核苷酸的掺入的聚合酶。可以使用多种天然存在的或突变的/经修饰的聚合酶。以举例的方式,热稳定聚合酶可以用于使用热循环条件进行的合成反应,而热稳定聚合酶可能不是等温引物延伸反应所期望的。能够掺入根据本公开的标记的核苷酸的合适的热稳定聚合酶包括WO 2005/024010或WO06120433中描述的那些,这些公开中的每一篇以引用方式并入本文。在较低温度诸如37℃下进行的合成反应中,聚合酶不必是热稳定聚合酶,因此对聚合酶的选择将取决于许多因素,诸如反应温度、pH、链置换活性等。
在具体的非限制性实施方案中,本公开涵盖以下的方法:核酸测序、重新测序、全基因组测序、单核苷酸多态性评分以及涉及当用本文示出的染料标记的经修饰的核苷酸或核苷掺入到多核苷酸中时对其进行检测的任何其他应用。
在一个特定实施方案中,本公开提供了包含根据本公开的染料部分的标记的核苷酸在多核苷酸合成测序反应中的用途。合成测序通常涉及使用聚合酶或连接酶在5'至3'方向上将一个或多个核苷酸或寡核苷酸顺序添加至生长的多核苷酸链,以便形成与待测序的模板/靶核酸互补的延伸多核苷酸链。存在于一个或多个添加的核苷酸中的碱基的身份可以在检测或“成像”步骤中确定。添加的碱基的身份可以在每个核苷酸掺入步骤之后确定。然后可以使用常规的Watson-Crick碱基配对规则来推断模板的序列。使用用本文示出的染料标记的核苷酸来确定单个碱基的身份可能是有用的,例如,在单核苷酸多态性的评分中,并且此类单碱基延伸反应在本公开的范围内。
在本公开的一个实施方案中,模板/靶多核苷酸的序列通过检测附接到掺入的核苷酸的荧光标记,检测一个或多个核苷酸掺入到与待测序的模板多核苷酸互补的新生链中来确定。模板多核苷酸的测序可以用合适的引物(或制备成发夹构建体,其将包含引物作为发夹的一部分)引发,并且新生链通过在聚合酶催化的反应中向引物的3'端添加核苷酸而以逐个方式延伸。
在特定实施方案中,不同的核苷酸三磷酸(A、T、G和C)中的每一种可以用独特的荧光团进行标记,并且还在3'位置处包含封端基团以防止不受控制的聚合。另选地,四种核苷酸中的一种可以是未标记的(暗色)。聚合酶将核苷酸掺入到与模板/靶多核苷酸互补的新生链中,并且封端基团防止核苷酸的进一步掺入。任何未掺入的核苷酸都可以被洗掉,并且来自每个掺入的核苷酸的荧光信号可以通过合适的装置(诸如使用激光激发和合适的发射滤光器的电荷耦合器件)以光学方式“读取”。然后可以(同时或顺序地)除去(脱保护)3'封端基团和荧光染料化合物,以暴露新生链用于进一步掺入核苷酸。通常,将在每个掺入步骤之后确定所掺入的核苷酸的身份,但这不是严格必需的。类似地,美国专利5,302,509(其以引用方式并入本文)公开了对固定在固体载体上的多核苷酸进行测序的方法。
如上文所例示,该方法利用了在DNA聚合酶的存在下将荧光标记的3'-封闭的核苷酸A、G、C和T掺入到与固定的多核苷酸互补的生长链中。聚合酶掺入与靶多核苷酸互补的碱基,但是被3'-封端基团防止进一步添加。然后可以确定掺入的核苷酸的标记,并且通过化学裂解除去封端基团以允许发生进一步的聚合。在合成测序反应中待测序的核酸模板可以是期望测序的任何多核苷酸。用于测序反应的核酸模板将通常包含具有游离的3'羟基基团的双链区域,该双链区域充当用于在测序反应中添加另外的核苷酸的引物或起始点。待测序模板的该区域将在互补链上悬垂该游离的3'羟基基团。待测序模板的悬垂区域可以是单链的,但也可以是双链的,前提条件是在与待测序的模板链互补的链上存在“切口”,以提供用于引发测序反应的游离3'OH基团。在此类实施方案中,测序可以通过链置换进行。在某些实施方案中,可以添加带有游离的3'羟基基团的引物,作为与待测序模板的单链区域杂交的单独组分(例如,短寡核苷酸)。另选地,待测序的引物和模板链可以各自形成能够形成分子内双链体(诸如发夹环结构)的部分自身互补核酸链的一部分。发夹多核苷酸及其可以附接到固体载体的方法在PCT公开号WO0157248和WO2005/047301中公开,这些公开中的每一篇以引用方式并入本文。核苷酸可以被连续地添加到生长引物,导致在5'至3'方向上合成多核苷酸链。可以确定已添加的碱基的性质,特别是但不必在每次添加核苷酸之后,从而提供核酸模板的序列信息。因此,通过经由与核苷酸的5'磷酸基团形成磷酸二酯键而将核苷酸接合到核酸链的游离的3'羟基基团,从而将该核苷酸掺入到核酸链(或多核苷酸)中。
待测序的核酸模板可以是DNA或RNA,或者甚至是由脱氧核苷酸和核糖核苷酸组成的杂合分子。核酸模板可以包含天然存在的和/或非天然存在的核苷酸以及天然或非天然的骨架键,前提条件是这些不阻止测序反应中模板的复制。
在某些实施方案中,待测序的核酸模板可以经由本领域已知的任何合适的连接方法(例如经由共价附接)附接到固体载体。在某些实施方案中,模板多核苷酸可以直接附接到固体载体(例如,基于二氧化硅的载体)。然而,在本公开的其他实施方案中,固体载体的表面可以以某种方式修饰,以便允许模板多核苷酸的直接共价附接,或者通过本身可以非共价地附接到固体载体的水凝胶或聚电解质多层来固定模板多核苷酸。
其中多核苷酸已直接附接到载体(例如,基于二氧化硅的载体,诸如WO00/06770(以引用方式并入本文)中所公开的那些)的阵列,其中通过玻璃上的环氧侧基与多核苷酸上的内部氨基基团之间的反应将多核苷酸固定在玻璃载体上。此外,可以通过硫基亲核物质与固体载体的反应将多核苷酸附接到固体载体,例如,如W02005/047301(以引用方式并入本文)中所述。固体支撑的模板多核苷酸的其他另外的示例是模板多核苷酸附接到在基于二氧化硅或其他固体载体上负载的水凝胶,例如如WO00/31148、WO01/01143、WO02/12566、WO03/014392、美国专利6,465,178和WO00/53812中所述,这些专利中的每一篇以引用方式并入本文。
模板多核苷酸可以固定于其上的特定表面是聚丙烯酰胺水凝胶。聚丙烯酰胺水凝胶描述于上文引用的参考文献和WO2005/065814中,该专利以引用方式并入本文。可以使用的特定水凝胶包括WO2005/065814和美国公开2014/0079923中所述的那些。在一个实施方案中,水凝胶为PAZAM(聚(N-(5-叠氮基乙酰氨基戊基)丙烯酰胺-共-丙烯酰胺))。
DNA模板分子可以附接到珠粒或微粒,例如,如美国专利6,172,218(其以引用方式并入本文)中所述。与珠粒或微粒的附接可以用于测序应用。可以制备珠粒文库,其中每个珠粒包含不同的DNA序列。示例性文库及其产生方法描述于Nature,437,376-380(2005);Science,309,5741,1728-1732(2005),这些文献中的每一篇均以引用方式并入本文。使用本文示出的核苷酸对此类珠粒的阵列进行测序在本公开的范围内。
待测序的模板可以形成固体载体上的“阵列”的一部分,在这种情况下,阵列可以采取任何方便的形式。因此,本公开的方法适用于所有类型的高密度阵列,包括单分子阵列、成簇阵列和珠粒阵列。用本公开的染料化合物标记的核苷酸可以用于对基本上任何类型的阵列上的模板(包括但不限于通过将核酸分子固定在固体载体上而形成的那些)进行测序。
然而,用本公开的染料化合物标记的核苷酸在对成簇阵列进行测序的背景中是特别有利的。在成簇阵列中,阵列上的不同区域(通常称为位点或特征)包含多个多核苷酸模板分子。一般来讲,所述多个多核苷酸分子不能通过光学手段单独地分辨,而是作为整体被检测到。取决于阵列的形成方式,阵列上的每个位点可以包含一个单独多核苷酸分子的多个拷贝(例如,该位点对于特定的单链核酸种类或双链核酸种类是同质的)或甚至少量不同多核苷酸分子的多个拷贝(例如,两个不同核酸种类的多个拷贝)。核酸分子的成簇阵列可以使用本领域中公知的技术产生。以举例的方式,WO 98/44151和WO00/18957(这些专利中的每一篇以引用方式并入本文)描述了扩增核酸的方法,其中模板和扩增产物均保持固定在固体载体上,以便形成由固定的核酸分子的簇或“集落”组成的阵列。根据这些方法制备的成簇阵列上存在的核酸分子是使用用本公开的染料化合物标记的核苷酸进行测序的合适模板。
用本公开的染料化合物标记的核苷酸也可用于对单分子阵列上的模板进行测序。如本文所用的术语“单分子阵列”或“SMA”,是指分布(或排列)在固体载体上的多核苷酸分子群,其中任何单独的多核苷酸与该分子群的所有其他多核苷酸的间距使得有可能单独地分辨单独的多核苷酸分子。因此,在一些实施方案中,固定到固体载体的表面上的靶核酸分子能够通过光学手段分辨。这意味着一个或多个不同的信号(每个信号代表一种多核苷酸)将出现在所用的特定成像装置的可分辨区域内。
可以实现单分子检测,其中阵列上的相邻多核苷酸分子之间的间距为至少100nm,更具体地讲至少250nm,还更具体地讲至少300nm,甚至更具体地讲至少350nm。因此,每个分子能够作为单分子荧光点来单独地分辨和检测,并且来自所述单分子荧光点的荧光也表现出单步光漂白。
术语“单独分辨的”和“单独分辨”在本文中用于规定,当可视化时,有可能将阵列上的一个分子与其相邻分子区分开。阵列上各个分子之间的间隔将部分地通过用于分辨各个分子的特定技术来确定。通过参考公开申请WO 00/06770和WO 01/57248将理解单分子阵列的一般特征,这些公开申请中的每一篇以引用方式并入本文。虽然本公开的标记的核苷酸的一种用途是用于合成测序反应,但此类核苷酸的效用却不限于此类方法。事实上,本文所述的标记的核苷酸可以有利地用于需要检测附接到掺入到多核苷酸中的核苷酸的荧光标记的任何测序方法。
具体地讲,用本公开的染料化合物标记的核苷酸可以用于自动化荧光测序方案,尤其是基于Sanger和同事的链终止测序方法的荧光染料-终止子循环测序。此类方法通常使用酶和循环测序将荧光标记的双脱氧核苷酸掺入引物延伸测序反应中。所谓的Sanger测序方法和相关方案(Sanger型)利用带有标记的双脱氧核苷酸的随机化链终止。
因此,本公开还涵盖用染料化合物标记的核苷酸,这些染料化合物是在3'位置和2'位置处都缺乏羟基基团的双脱氧核苷酸,此类经修饰的双脱氧核苷酸适合在Sanger型测序方法等中使用。
应当理解,用掺入3'封端基团的本公开的染料化合物标记的核苷酸也可以用于Sanger方法和相关方案,因为通过使用具有3'OH封端基团的核苷酸可以实现与通过使用双脱氧核苷酸所实现的效果相同的效果:两者均防止随后的核苷酸的掺入。在根据本公开的并且具有3'封端基团的核苷酸将用于Sanger型测序方法的情况下,应当理解,附接到核苷酸的染料化合物或可检测标记不需要经由可裂解的连接基连接,因为在掺入本公开的标记的核苷酸的每种情况下;随后不需要掺入核苷酸,因此不需要从核苷酸上除去标记。
另选地,还可以使用未标记的核苷酸和含有本文所述的荧光染料的亲和试剂来进行本文所述的测序方法。例如,在步骤(a)的掺入混合物中,四种不同类型的核苷酸(例如,dATP、dCTP、dGTP和dTTP或dUTP)中的一种类型、两种类型、三种类型或每种类型可以未被标记。四种类型的核苷酸(例如,dNTP)中的每一种类型都具有3'羟基封端基团,以确保仅单一碱基可以通过聚合酶添加到引物多核苷酸的3'端。在步骤(b)中掺入未标记的核苷酸后,洗掉剩余未掺入的核苷酸。然后引入亲和试剂,其特异性地识别并结合掺入的dNTP以提供包含掺入的dNTP的标记的延伸产物。在WO 2018/129214和WO 2020/097607中已经公开了未标记的核苷酸和亲和试剂在合成测序中的用途。使用未标记核苷酸的本公开的修饰的测序方法可以包括以下步骤:
(a')使引物多核苷酸/靶多核苷酸复合物与一种或多种未标记的核苷酸(例如,dATP、dCTP、dGTP和dTTP或dUTP)接触,其中引物多核苷酸与靶多核苷酸的至少一部分互补;
(b')将核苷酸掺入到引物多核苷酸中以产生延伸的引物多核苷酸;
(c')使延伸的引物多核苷酸与一组亲和试剂在一种亲和试剂特异性结合掺入的未标记的核苷酸的条件下接触,以提供标记的延伸的引物多核苷酸/靶多核苷酸复合物;
(d')对标记的延伸的引物多核苷酸/靶多核苷酸复合物执行一次或多次荧光测量,以确定掺入的核苷酸的身份。
在本文所述的修饰的测序方法的一些实施方案中,掺入混合物中的未标记核苷酸中的每一者含有3'羟基封端基团。在另外的实施方案中,在下一掺入循环之前去除掺入的核苷酸的3'羟基封端基团。在其他另外的实施方案中,该方法还包括从掺入的核苷酸中去除亲和试剂。在其他另外的实施方案中,在相同反应中去除3'羟基封端基团和亲和试剂。在一些实施方案中,亲和试剂组可以包含特异性结合第一类型的核苷酸的第一亲和试剂、特异性结合第二类型的核苷酸的第二亲和试剂和特异性结合第三类型的核苷酸的第三亲和试剂。在一些另外的实施方案中,第一亲和试剂、第二亲和试剂和第三亲和试剂中的每一者均包含一个或多个可检测的、光谱可区分的标记。在一些实施方案中,亲和试剂可以包括蛋白质标签、抗体(包括但不限于抗体的结合片段、单链抗体、双特异性抗体等)、适体、打结素、affimer或以合适的特异性和亲和力结合掺入的核苷酸的任何其他已知的试剂。在一个实施方案中,至少一种亲和试剂是抗体或蛋白质标签。在另一个实施方案中,第一类型的亲和试剂、第二类型的亲和试剂和第三类型的亲和试剂中的至少一种是包含一个或多个可检测标记(例如,相同可检测标记的多个拷贝)的抗体或蛋白质标签,其中可检测标记是或包括本文所述的双硼染料部分。
实施例
在以下实施例中更详细地公开了附加的实施方案,这些实施例并非旨在以任何方式限制权利要求书的范围。
实施例1.式(I)的化合物的合成
起始物质SM1的合成
Figure BDA0004022520900000661
将(苯并呋喃-2-基)乙酸(0.75g)与4-氟-2-羟基苯甲醛(1.04g)在二氯甲烷(20mL)中混合。添加N-(3-二甲基氨基丙基)-N'-乙基碳二亚胺盐酸盐(1.1g)、4-(二甲基氨基)吡啶(980mg)和二异丙基乙胺(1.38g)。将反应混合物在RT下搅拌。1h后,真空浓缩混合物。将残余物悬浮于乙腈中,通过真空过滤收集沉淀,用乙腈洗涤并干燥,以得到呈黄色固体的产物。产量为780mg(52%)。19F NMR(376MHz,DMSO)δ-105.29.
起始物质SM2的合成
Figure BDA0004022520900000662
在50℃下,将(噻吩-2-基)乙酸(0.84g,5.9mmol)、4-氟-2-羟基苯甲醛(0.75g,5.35mmol)、N-(3-二甲基氨基丙基)-N'-乙基碳二亚胺盐酸盐(1.23g,6.4mmol)、4-(二甲基氨基)吡啶(981mg,8mmol)和乙基二异丙胺(1.38g,11mmol)在二氯甲烷(20mL)中的混合物在搅拌下加热。在约5min内形成黄色沉淀。在UV下发出强荧光。1h后,真空浓缩混合物。将残余物悬浮于乙腈中,通过真空过滤收集沉淀,用乙腈洗涤并干燥。产量为1.1g(77%)。
一般合成程序(Suzuki交叉偶联)
在碱(碳酸钠)的存在下,用催化量的PdCl2(PPh3)2处理在二甲基甲酰胺与水的混合物中的适当的3-卤代香豆素(1eq)和芳基/杂芳基硼酸或酯(1.1eq)。将反应混合物在90℃下加热16h,并且随后冷却至RT。为了产物分离,将该反应混合物用水稀释,用HCl(1M)酸化,并且用乙酸乙酯萃取产物。将合并的有机级分用盐水洗涤,经无水硫酸钠干燥并且真空浓缩。将通常是半固体残余物的粗品用有机溶剂(例如DCM)研磨,并且通过过滤分离产物。
化合物:I-2:2-(7-(二乙基氨基)-4-甲基-2-氧代-2H-色烯-3-基)呋喃-4-甲酸
Figure BDA0004022520900000671
/>
用与二氯甲烷络合的[1,1'-双(二苯基膦基)二茂铁]二氯化钯(II)(PdCl2(dppf).DCM,2.6mg,3.2μmol,1.5mol%)和Na2CO3(59mg,0.56mmol)处理于二甲基甲酰胺(1.6mL)和水(0.4mL)中的3-溴-7-二乙基氨基-4-甲基-香豆素(50mg,0.22mmol)和2-硼烷呋喃-4-甲酸(51mg,0.22mmol)。将反应混合物在90℃下加热6h,并且随后冷却至RT。将混合物用H2O稀释,用HCl(1M)酸化,并且用乙酸乙酯萃取产物。将合并的有机物用盐水洗涤,干燥(Na2SO4)并真空浓缩。通过制备型HPLC纯化粗残余物。产率为7%。LC-MS(-):m/z 340(M-1)-;(+):342(M+1)+,683(2M+1)+。在EtOH中的吸收最大值在395nm。在EtOH中的发射最大值在485nm(在400nm处激发)。
化合物I-3:5-(7-(二乙基氨基)-2-氧代-2H-色烯-3-基)呋喃-2-甲酸
Figure BDA0004022520900000672
根据上文所述的一般偶联程序制备化合物I-3。产率为46%。LC-MS(-)m/z 326(M-1)-。根据与化合物I-3相似的程序制备化合物I-1,不同之处在于使用2-硼酸基呋喃-4-甲酸。
化合物I-4:2-(7-(二乙基氨基)-2-氧代-2H-色烯-3-基)苯并呋喃-6-甲酸
Figure BDA0004022520900000681
用PdCl2(PPh3)2(11mg,16μmol,5mol%)和Na2CO3(68mg,0.64mmol)处理于二甲基甲酰胺(10mL)和水(5mL)中的3-溴-7-二乙基氨基香豆素(135mg,0.40mmol)和2-硼酸基苯并呋喃-6-甲酸(113mg,0.55mmol)。将反应混合物在90℃下加热16h,并且随后冷却至RT。将混合物用H2O稀释,用HCl(1M)酸化并用乙酸乙酯萃取。将合并的有机物用盐水洗涤,干燥(Na2SO4)并真空浓缩。将粗残余物在二氯甲烷中研磨,并且通过在真空下过滤来分离产物。产量为76mg(50%)。LC-MS(-)m/z 376(M-1)-
化合物I-5:2-(7-(二乙基氨基)-2-氧代-2H-色烯-3-基)苯并呋喃-5-甲酸
Figure BDA0004022520900000682
根据上文所述的一般偶联程序制备化合物I-5。产率为36%。LC-MS(-):m/z 376(M-1)-;(+):378(M+1)+,755(2M+1)+
化合物I-6:2-(7-(二乙基氨基)-2-氧代-2H-色烯-3-基)噻吩-5-甲酸
Figure BDA0004022520900000683
根据上文所述的一般偶联程序制备化合物I-6。产率为78%。LC-MS(-):m/z 342(M-1)-;(+):344(M+1)+,687(2M+1)+。在EtOH中的吸收最大值在432nm。在EtOH中的发射最大值在506nm(在450nm处激发)。
化合物I-7:2-(7-(二乙基氨基)-2-氧代-2H-色烯-3-基)-1-甲基-1H-吲哚-5-甲
Figure BDA0004022520900000691
根据上文所述的一般偶联程序制备化合物I-7。产率为80%。LC-MS(-):m/z 389(M-1)-;(+):391(M+1)+。在EtOH中的吸收最大值在407nm。
化合物I-8a:3-(N-(3-(环辛-1,3,5,7-四烯-1-甲酰氨基)丙基)-2-(7-氟-2-氧 代-2H-色烯-3-基)苯并呋喃-6-甲酰氨基)丙烷-1-磺酸
Figure BDA0004022520900000692
根据一般偶联程序由于二甲基甲酰胺-水混合物(2:1)中的3-溴-7-氟-香豆素和2-硼酸基苯并呋喃-6-甲酸制备2-(7-氟-2-氧代-2H-色烯-3-基)苯并呋喃-6-甲酸。溶剂蒸发后,将粗残余物用二异丙醚研磨,并且通过过滤分离产物。产率为57%。LC-MS(-)m/z 323(M-1)-
Figure BDA0004022520900000693
用苯并三唑-1-基-氧基-三-吡咯烷基-六氟磷酸盐(PyBOP,193mg,0.37mmol)和二异丙基乙胺(DIPEA,1mL)处理于二甲基乙酰胺(5mL)中的2-(7-氟-2-氧代-2H-色烯-3-基)苯并呋喃-6-甲酸(100mg,0.31mmol)。将反应混合物在RT下搅拌10min,然后添加于二甲基乙酰胺(3mL)中的3-((3-(环辛-1,3,5,7-四烯-1-甲酰氨基)丙基)氨基)丙烷-1-磺酸(COT-S,110mg,0.37mmol)。将反应混合物搅拌18h并用2M HCl酸化。通过过滤分离所得沉淀,并且用乙腈洗涤,然后通过制备型HPLC纯化,以得到2-(N-(2-(环辛-1,3,5,7-四烯-1-甲酰氨基)乙基)-2-(7-氟-2-氧代-2H-色烯-3-基)苯并呋喃-6-甲酰氨基)乙烷-1-磺酸(化合物I-8b)。产量为33mg(18%)。LC-MS(-)m/z 603(M-1)-
Figure BDA0004022520900000701
在80℃下将于DMSO(3mL)中的化合物I-8b(33mg,55μmol)、三乙胺(15μL,110μmol)和4-氨基丁酸(11mg,110μmol)搅拌2h,然后添加另外量的4-氨基丁酸(1eq)和三乙胺(2eq)。将反应混合物在110℃下加热24h。冷却至RT并用乙腈和TEAB(0.1M)稀释。分离最终产物并且通过制备型HPLC纯化。产率为42%。LC-MS(-)m/z 686(M-1)-,343(M-1)2-。在EtOH中的吸收最大值在426nm。在EtOH中的发射最大值在482nm(在430nm处激发)。
化合物I-9:1-(3-(苯并呋喃-2-基)-2-氧代-2H-色烯-7-基)哌啶-4-甲酸
Figure BDA0004022520900000702
将3-(苯并呋喃-2-基)-7-氟-2H-色烯-2-酮(280mg)、二异丙基乙胺(0.1mL)和异哌啶酸(129mg)在120℃下在DMSO(2mL)中搅拌4h。然后将反应混合物用乙腈(3mL)和水(2mL)稀释。滤出固体沉淀,用水洗涤。产量为170mg(约44%)。1H NMR(400MHz,DMSO)δ8.49(s,1H),7.74–7.68(m,2H),7.60(dd,J=8.1,1.0Hz,1H),7.50(d,J=1.0Hz,1H),7.34(ddd,J=8.3,7.2,1.4Hz,1H),7.27(td,J=7.5,1.1Hz,1H),7.06(dd,J=9.0,2.5Hz,1H),6.91(d,J=2.4Hz,1H),4.02–3.88(m,2H),3.07(td,J=13.4,12.7,3.1Hz,2H),1.95–1.84(m,2H),1.67–1.54(m,2H)。
化合物I-10:1-[2-氧代-3-(噻吩-2-基)-2H-色烯-7-基)哌啶-4-甲酸
Figure BDA0004022520900000711
将3-(噻吩-2-基)-7-氟-2H-色烯-2-酮(280mg)、二异丙基乙胺(0.1mL)和异哌啶酸(147mg)在110℃下在DMSO(2mL)中搅拌6h。然后将反应混合物用乙腈(3mL)和水(2mL)稀释。滤出固体沉淀,用水洗涤。产量为135mg(约33%)。1H NMR(400MHz,DMSO)δ12.26(s,1H),8.42(s,1H),7.73(dd,J=3.7,1.2Hz,1H),7.58(d,J=0.9Hz,1H),7.58–7.55(m,1H),7.15(dd,J=5.1,3.7Hz,1H),7.04(dd,J=8.9,2.5Hz,1H),6.90(d,J=2.4Hz,1H),3.97–3.87(m,2H),3.04(ddd,J=14.0,11.6,3.0Hz,2H),1.90(dd,J=13.8,3.4Hz,2H),1.68–1.52(m,3H)。
化合物I-11:N-[2-氧代-3-(噻吩-2-基)-2H-色烯-7-基]-N-(2-磺基乙基)甘氨酸
Figure BDA0004022520900000712
按照本文所述的类似程序由3-(噻吩-2-基)-7-氟-2H-色烯-2-酮和N-(2-磺基乙基)甘氨酸制备化合物I-11。产率为28%。
化合物I-12:1-[3-(3-磺基-苯并呋喃-2-基)-2-氧代-2H-色烯喃-7-基]哌啶-4- 甲酸
Figure BDA0004022520900000713
将化合物I-9(390mg)添加到冷硫酸(1g)中并在RT下搅拌3h。用无水二乙醚研磨反应混合物。通过过滤收集结晶产物,并用乙醇和乙醚混合物(1:1,5mL)洗涤。产量为290mg(62%)。LC-MS m/z(-)468(M-1)-
化合物I-13:1-[3-(5-磺基-噻吩-2-基)-2-氧代-2H-色烯-7-基]哌啶-4-甲酸
Figure BDA0004022520900000721
将化合物I-10(710mg)添加到冷硫酸(1g)中并在RT下搅拌1h并且另外在50℃下搅拌1h。用无水二乙醚和乙腈研磨反应混合物。通过过滤收集产物,并用乙醇和乙醚混合物(1:1,2×5mL)洗涤。产量为720mg(83%)。LC-MS m/z(-)434(M-1)-
化合物I-14:1-(3-(苯并呋喃-2-基)-2-氧代-2H-色烯-7-基)哌啶-2-甲酸
Figure BDA0004022520900000722
将3-(苯并呋喃-2-基)-7-氟-2H-色烯-2-酮(实施例I-1,280mg)、二异丙基乙胺(0.1mL)和哌啶-2-甲酸(155mg)在110℃下在DMSO(2mL)中搅拌6h。然后将反应混合物用乙腈(3mL)和水(2mL)稀释。滤出固体沉淀,用水洗涤。产量为125mg(32%)。
实施例2.式(I)的染料的化学稳定性的比较
将分别用染料I-1、染料I-2和参考染料A标记的三个ffC在黑暗中在37℃下保持在掺入缓冲液中。然后,在48h期间检查荧光信号强度并归一化显示在图1中。结果表明,用式(I)的新的染料标记的ffC比用参考染料A标记的ffC在化学上更稳定。
在另一个实验中,将用染料I-3a、I-4a和参考染料A标记的三个ffC在37℃下保持在甘氨酸缓冲液中8天。然后,检查剩余的荧光信号强度并显示在图2中。观察到在甘氨酸缓冲液中加热之后荧光强度随时间降低。染料I-3a和染料I-4a两者均表现出比染料A更好的化学稳定性。
此外,在RT下在扫描混合物中测量用染料I-8a标记的ffC的光谱特性(在460nm处激发)。激发/发射光谱(Ex/Em)为434/494nm。
用式(I)的化合物和参考染料A标记的ffC的结构如下所示:
Figure BDA0004022520900000731
/>
Figure BDA0004022520900000741
/>
Figure BDA0004022520900000751
实施例3.式(II)或式(II')的化合物的合成
一般合成方案
式(II)的化合物可以通过以下一般反应方案(其中Y为O或NH)制备:
Figure BDA0004022520900000752
化合物II-51a:2-(2-(7-氟-2-氧代-2H-色烯-3-基)噻唑-4-基)乙酸乙酯
Figure BDA0004022520900000753
程序A:将于乙醇(100mL)中的2-氰基硫代乙酰胺(5g,50mmol,1eq)、4-氟水杨醛(7.7g,55mmol,1.1eq)和4-氯-乙酰乙酸乙酯(9.9g,60mmol,1.2eq)在约70℃下加热2h。添加四丁基溴化铵(NBu4Br,0.5g),并将反应混合物在90℃下加热1.5h并使其在RT下搅拌过夜。然后滤出沉淀,用乙醇(约5mL)和水(2×15mL)洗涤。从EtOH中结晶。产量为11g(约67%)。
Figure BDA0004022520900000761
程序B:将于乙醇(5mL)中的4-氟-2-羟基苯甲醛(1.5g,1.1eq)、3-氨基-3-硫代丙酸乙酯(1.5g,1.0eq)和4-溴乙酰乙酸乙酯(2.3g,1.1eq)回流3h。使反应混合物在RT下静置过夜。通过过滤分离沉淀,用少量乙醇洗涤,悬浮于水(约15mL)中,并且添加碳酸氢钠(1.1eq),将混合物搅拌10min,滤出沉淀。用水洗涤。分离出呈白色固体的目标化合物。
Figure BDA0004022520900000762
将4-氟-2-羟基苯甲醛(5g,1eq)和3-氨基-3-硫代丙酸乙酯(5.8g,1.1eq)溶解于EtOH(50mL)中。将反应混合物在RT下搅拌1h,然后回流3h。使反应混合物在RT下搅拌过夜。通过过滤分离沉淀,用少量乙醇洗涤。产量为6.6g(83%)。
将于乙醇(5mL)中的7-氟-2-氧代-2H-色烯-3-硫代甲酰胺(2g,1.0eq)和4-溴乙酰乙酸乙酯(1.87g,1eq)回流3h。使反应混合物在RT下静置过夜。通过过滤分离沉淀,用少量乙醇洗涤,悬浮于水(约15mL)中,并添加碳酸氢钠(1g),将混合物搅拌10min,滤出沉淀。用水洗涤。分离出呈灰白色固体的目标化合物。
按照上文在化合物II-51a的制备中描述的类似程序制备化合物II-51d(2-(2-(7-溴-2-氧代-2H-色烯-3-基)噻唑-4-基)乙酸乙酯)。产率为约80%。
化合物II-60a:2-(2-(6-氟-2-氧代-2H-色烯-3-基)噻唑-4-基)乙酸乙酯
Figure BDA0004022520900000771
类似于制备化合物II-51a的程序A制备化合物II-60a。产率为约50%。
化合物II-54a:2-(7-氟-2-氧代-2H-色烯-3-基)-4-甲基噻唑-5-甲酸乙酯
Figure BDA0004022520900000772
将7-氟-3-硫代氨基甲酰基香豆素(450mg,1eq)和2-氯乙酰乙酸乙酯(365mg,1.1eq)于二甲基甲酰胺(3mL)中的混合物在90℃下搅拌2h,并在RT下静置过夜。然后用水(5mL)稀释反应混合物并用碳酸氢钠中和。滤出沉淀并从乙醇中结晶。产率为约81%。
化合物II-51:(2-(7-氟-2-氧代-2H-色烯-3-基)噻唑-4-基)乙酸
Figure BDA0004022520900000773
将7-氟-3-[(4-乙氧基羰基甲基)-2-噻唑基]-2H-苯并吡喃酮-2(1g,3mmol,1eq)悬浮于水(5mL)中,添加乙醇(0.5mL)和氢氧化锂(0.36g,15mmol,5eq)。在35℃下搅拌反应混合物约3小时。过滤几乎澄清的溶液,滤液用乙酸(1.5mL)酸化,并在RT下静置过夜。然后将产物滤出,用冷水(2×10.5mL)洗涤并且在空气中干燥。产量为0.76g(83%)。1H NMR(400MHz,DMSO-d6)δ8.97(s,1H),8.14(dd,J=8.8,6.4Hz,1H),7.66(s,1H),7.53(dd,J=9.7,2.5Hz,1H),7.35(td,J=8.8,2.5Hz,1H),3.83(s,2H)。19F NMR(376MHz,DMSO)δ-104.37。
按照化合物II-51的制备中描述的类似程序,由对应的乙酯化合物II-51d制备2-(2-(7-溴-2-氧代-2H-色烯-3-基)噻唑-4-基)乙酸(化合物II-51c)。产率为约75%。
按照化合物II-51的制备中描述的类似程序,由对应的乙酯化合物II-60a制备(2-(6-氟-2-氧代-2H-色烯-3-基)噻唑-4-基)乙酸(化合物II-60)。产率为约83%。
按照化合物II-51的制备中描述的类似程序,在50℃下在水-DMSO混合物中由对应的乙酯化合物II-54a制备(2-(7-氟-2-氧代-2H-色烯-3-基)-4-甲基噻唑-5-甲酸(化合物II-54)。产率为约80%。
化合物II-52:(2-(7-氟-2-氧代-2H-色烯-3-基)噻唑-4-甲酸
Figure BDA0004022520900000781
按照上文在II-51的制备中描述的类似程序在约80℃下在乙醇中制备该化合物,持续1h。滤出沉淀。然后通过用水搅拌1h来水解亚氨基衍生物。可含有乙酯作为副产物,该副产物可以通过在过滤后从含乙酸的NaHCO3-或Na2CO3溶液重新沉淀去除。产率为约74%。LC-MS:(+)m/z 292(M+1);(-)m/z 290(M-1)-,581(2M-1)-
化合物II-1:2-(2-(2-氧代-7-((3-磺基丙基)氨基)-2H-色烯-3-基)噻唑-4-基) 乙酸
Figure BDA0004022520900000782
将于DMSO中的化合物II-51(1.0eq)和3-氨基丙磺酸(2.0eq)用DIPEA(2.0eq)处理并在110℃下加热18h。冷却至RT,用0.1M TEAB/MeCN稀释,并且通过制备型HPLC纯化。将合并的HPLC级分在真空下干燥。产率为约10%。吸收最大值在431nm(EtOH)。LC-MS:(+)m/z425(M+1)。
通过使于DMSO中的化合物II-51a(1.0eq)和3-氨基丙磺酸(2.0当量)反应(用DIPEA(2.0eq)处理并在100℃下加热12h)来制备3-[(3-(4-(2-乙氧基羰基甲基)噻唑-2-基)-2-氧代-2H-色烯-7-基)氨基]丙烷-1-磺酸(化合物II-1a)。冷却至RT,用0.1M TEAB/MeCN稀释,并且通过制备型HPLC纯化。产率为约14%。
化合物II-2a:2-[2-(二乙基氨基-2-氧代-2H-色烯-3-基)-4-噻唑基]乙酸乙酯
Figure BDA0004022520900000791
将7-二乙基氨基-3-硫代氨基甲酰基-2H-苯并吡喃酮-2(276mg,1eq)与4-氯乙酰乙酸乙酯(180mg,1.1eq)的混合物在100℃下在DMF(2.5mL)中搅拌0.5h,并在RT下静置过夜。然后将反应混合物用水(2.5mL)稀释,添加碳酸氢钠并滤出黄色沉淀。可以从乙醇中结晶。1HNMR(400MHz,DMSO-d6)δ8.74(s,1H),7.74(d,J=9.0Hz,1H),7.49(s,1H),6.81(dd,J=9.1,2.4Hz,1H),6.65(d,J=2.4Hz,1H),4.12(q,J=7.1Hz,2H),3.87(s,2H),3.49(q,J=7.0Hz,4H),1.21(t,J=7.1Hz,3H),1.15(t,J=7.0Hz,6H)。
通过按照化合物II-51的制备中描述的一般程序使对应的乙酯II-2a与LiOH反应来制备[2-(7-二乙基氨基-2-氧代-2H-色烯-3-基)噻唑-4-基]乙酸(化合物II-2)。产率为约93%。1H NMR(400MHz,DMSO-d6)δ12.43(s,1H),8.75(s,1H),7.74(d,J=9.0Hz,1H),7.46(d,J=0.7Hz,1H),6.81(dd,J=9.0,2.5Hz,1H),6.65(d,J=2.4Hz,1H),3.78(d,J=0.8Hz,2H),3.49(q,J=7.0Hz,4H),1.15(t,J=7.0Hz,6H)。
化合物II-2b:2-(2-(7-二乙基氨基-2-氧代-2H-色烯-3-基)噻唑-4-基)乙酸乙酯
Figure BDA0004022520900000801
在RT下将于EtOH(50mL)中的2-氰基硫代乙酰胺(2g,1eq)、对二乙基氨基水杨醛(3.86g,1eq)、4-溴乙酰乙酸乙酯(3.45mL,1eq)搅拌0.5h。添加三乙胺(0.25g),并将反应混合物再次在RT下搅拌1.5h,并且滤出沉淀的产物。产率为约45.5%。LC-MS:(+)386(M+1)+
化合物II-5b:p-[2-(7-(二乙基氨基)-2-亚氨基-2H-色烯-3-基)噻唑-4-基]苯甲
Figure BDA0004022520900000802
在RT下将于EtOH(50mL)中的2-氰基硫代乙酰胺(0.41g,1eq)、对二乙基氨基水杨醛(0.8g,1eq)和4-(2-溴乙酰基)苯甲酸(1g,1eq)搅拌0.5h。添加三乙胺(0.25g),并将反应混合物再次在RT下搅拌1.5h,并且滤出沉淀的产物。产率为约89%。LC-MS:(+)420(M+1)+
通过在EtOH-水-HCl的混合物中水解化合物II-5b来制备p-[2-(7-(二乙基氨基)-2-氧代-2H-色烯-3-基)噻唑-4-基]苯甲酸(化合物II-5)。滤出产物并用EtOH洗涤。产率为95%。1H NMR(400MHz,DMSO)δ12.99(s,1H),8.96(s,1H),8.32(s,1H),8.28–8.17(m,2H),8.10–7.95(m,2H),7.78(d,J=9.0Hz,1H),6.86(dd,J=9.0,2.4Hz,1H),6.68(d,J=2.3Hz,1H),3.51(q,J=7.0Hz,4H),1.16(t,J=7.0Hz,6H)。
化合物II-7:2-[2-氧代-7-((3-磺基丙基)氨基)-2H-色烯-3-基]噻唑-5-甲酸
Figure BDA0004022520900000803
在10mL单颈圆底烧瓶中添加7-氟香豆素(89mg,300μmol)、3-氨基-1-丙磺酸(125mg,900μmol)和DMSO(2mL)。将N,N-二异丙基乙胺(DIPEA,261μL,1500μmol)添加到烧瓶中并且开始加热至80℃。在加热时,反应混合物的颜色从浅黄色变为橙色/红色。在80℃下加热18h。然后使混合物冷却至RT,并且通过添加水(3mL)停止反应。通过20μm尼龙过滤器过滤反应混合物。经由制备型HPLC(Axia柱,梯度6-20)纯化粗物质。产量为28.6μmol(9.5%)。
化合物II-8:4-甲基-2-[2-氧代-7-((3-磺基丙基)氨基)-2H-色烯-3-基]噻唑-5- 甲酸
Figure BDA0004022520900000811
在10mL单颈圆底烧瓶中添加化合物II-54(110mg,360μmol)、3-氨基-1-丙磺酸(150mg,1080μmol)和DMSO(2mL)。将N,N-二异丙基乙胺(DIPEA,313μL,1800μmol)添加到烧瓶中。将反应在100℃下加热5h。然后使反应混合物冷却至RT,并且通过添加水(3mL)停止反应。通过20μm尼龙过滤器过滤反应混合物。通过制备型HPLC(Axia柱,梯度10-22)纯化粗物质。产量为74.5μmol,21%。吸收在439nm(在10mM TRIS(pH=8)中)。
化合物II-11a:2-(2-(7-乙基氨基-2-氧代-6-甲基-2H-色烯-3-基)-4-噻唑基)乙 酸乙酯
Figure BDA0004022520900000812
在RT下将3-(乙基氨基)-对甲酚(1eq)、无水二氯化镁(1.5eq)和无水三乙胺(3.5eq)在无水乙腈中的混合物在氮气下搅拌10分钟。添加多聚甲醛(6.5eq),并且在回流下继续搅拌4h。然后使反应混合物冷却至RT,添加HCl水溶液(10%),并且将所得混合物用二氯甲烷萃取。将合并的有机层用水洗涤,经无水硫酸镁干燥,减压浓缩,并且通过柱色谱法纯化。产率为15%至20%。
Figure BDA0004022520900000821
将于EtOH(3mL)中的2-乙氧基羰基硫代乙酰胺(300mg,1eq)、3-乙基氨基-4-甲基水杨醛(402mg,1.1eq)和3-氯-2-氧代丁酸乙酯(403mg,1.2eq)在约70℃下加热2h,然后在90℃下加热0.5h,并使其在RT下搅拌过夜。然后滤出沉淀,用EtOH(约0.5mL)和水(2×0.5mL)洗涤。产量为330mg(约43%)。
化合物II-11b:2-[2-(7-(丁基氨基)-2-氧代-2H-色烯-3-基)噻唑-4-基]乙酸
Figure BDA0004022520900000822
通过使化合物II-51(20mg,66μmol)、丁胺(10mg,133μmol)在DMSO(0.5mL)和DIPEA(23μL,132μmol)中反应制备化合物II-11b。在110℃下加热5h之后,用水(2mL)稀释反应混合物。滤出橙色固体并干燥。产量为6mg(25%)。LC-MS(+):359(M+1)。
化合物II-12a:2-(2-(7-氟-2-氧代-2H-色烯-3-基)-4-甲基-噻唑-5-基)乙酸乙
Figure BDA0004022520900000823
将于EtOH(100mL)中的2-乙氧基羰基硫代乙酰胺(5g,50mmol,1eq)、对二乙基氨基水杨醛(7.7g,55mmol,1.1eq)和3-氯-2-氧代丁酸乙酯(6.7g,41mmol,1.2eq)在约70℃下加热2h。添加四丁基溴化铵(0.5g),并将反应混合物在90℃下加热0.5h,并使其在RT下搅拌过夜。然后滤出沉淀,用EtOH(约5mL)和水(2×15mL)洗涤。从EtOH中结晶。产量为11.2g(约85%)。1H NMR(400MHz,DMSO-d6)δ8.87(s,1H),7.77(d,J=9.0Hz,1H),6.85(dd,J=9.1,2.5Hz,1H),6.67(d,J=2.4Hz,1H),4.28(q,J=7.1Hz,2H),3.51(q,J=7.0Hz,4H),2.68(s,3H),1.31(t,J=7.1Hz,3H),1.16(t,J=7.0Hz,6H)。
通过按照在化合物II-51的制备中描述的类似程序使对应的乙酯化合物II-12a与LiOH反应来制备[2-(7-二乙基氨基-2-氧代-2H-色烯-3-基)-4-甲基-噻唑-5-基)甲酸(化合物II-12)。通过从乙醇中结晶分离目标化合物。产率为58%。1H NMR(400MHz,DMSO-d6)δ8.86(s,1H),7.76(d,J=9.1Hz,1H),6.84(dd,J=9.1,2.5Hz,1H),6.66(d,J=2.4Hz,1H),3.51(q,J=7.0Hz,4H),2.67(s,3H),1.16(t,J=7.0Hz,6H)。
化合物II-12b:2-(2-(7-氟-2-亚氨基-2H-色烯-3-基)-4-甲基-噻唑-5-基)乙酸 乙酯
Figure BDA0004022520900000831
将于EtOH(80mL)中的2-氰基硫代乙酰胺(5g,50mmol,1eq)、对二乙基氨基水杨醛(10.6g,55mmol,1.1eq)和3-溴-2-氧代丁酸酯(12.52g,60mmol,1.2eq)在RT下加热3h。滤出沉淀,用EtOH(约5mL)洗涤。产量为9g(47%)。将该化合物在稀盐酸中水解成化合物II-12a。
化合物II-33a:2-[2-(7-(3-(叔丁氧基羰基)氮杂环丁烷-1-基)-2-氧代-2H-色 烯-3-基)噻唑-4-基]乙酸
Figure BDA0004022520900000841
将于DMSO(0.5mL)和DIPEA(35μL,200μmol)中的化合物II-51(31mg,100μmol)和3-(叔丁氧基羰基)氮杂环丁烷盐酸盐(39mg,200μmol)在90℃下加热5h。用水稀释反应混合物,并且通过制备型HPLC分离产物。产率为25%。
通过按照II-33a的制备中类似的程序使化合物II-51(31mg,100μmol)和氮杂环丁烷(13.5μL,200μmol)在DMSO(1mL)和DIPEA(35μL,200μmol)中反应来制备2-[2-(7-(氮杂环丁烷-1-基)-2-氧代-2H-色烯-3-基)噻唑-4-基]乙酸(化合物II-33)。产量为49μmol(49%)。LC-MS(+):343(M+1)。
化合物II-43c:2-(7-(乙基氨基)-6-甲基-2-氧代-2H-色烯-3-基)-4,5,6,7-四氢 苯并[d]噻唑-6-甲酸乙酯
Figure BDA0004022520900000842
将2-溴-4-乙氧基羰基环己酮(400mg,1.8mmol)、2-羟基-4-乙基氨基-5-甲基苯甲醛(293mg,1.64mmol)和3-氨基-3-硫代丙酸乙酯(265mg,1.8mmol)与乙醇(10mL)混合。将反应混合物搅拌并在80℃下加热2h。到这段时间结束时,起始物质被消耗。使反应冷却至RT。在真空中去除溶剂,然后将固体残余物溶解于乙酸乙酯中。将溶液用水和盐水洗涤。有机层经硫酸镁干燥,过滤并在真空中干燥。通过快速色谱法纯化。在真空中干燥以产生黄色粉末。产量为75mg(11%)。1H NMR(400MHz,CDCl3)δ7.32(s,1H),6.50(s,1H),4.19(qd,J=7.1,1.0Hz,2H),3.30(dd,J=7.6,3.9Hz,2H),3.17–3.01(m,2H),3.01–2.76(m,2H),2.36–2.25(m,1H),2.21–2.14(m,3H),2.10–1.97(m,1H),1.48(d,J=31.1Hz,2H),1.37(td,J=7.1,1.7Hz,3H),1.29(t,J=7.1Hz,3H)。
通过按照化合物II-51的制备中描述的类似程序使对应的乙酯II-43c与LiOH反应来制备2-(7-(乙基氨基)-6-甲基-2-氧代-2H-色烯-3-基)-4,5,6,7-四氢苯并[d]噻唑-6-甲酸(化合物II-43b)。产率为54%。UV-Vis:吸收在441nm,在50% EtOH/H2O中。荧光:498nm,在50% EtOH/H2O中。
化合物II-43e:2-(7-(二乙基氨基)-2-氧代-2H-色烯-3-基)-4,5,6,7-四氢苯并 [d]噻唑-4-甲酸乙酯
Figure BDA0004022520900000851
将4-二乙基氨基-水杨醛(0.35g,1.82mmol)、3-溴-2-氧代环己烷-1-甲酸乙酯(0.5g,2.00mmol)和3-氨基-3-硫代丙酸乙酯(0.29g,2.00mmol)与乙醇(20mL)混合。将反应混合物搅拌并在80℃下加热2h。到这段时间结束时,起始物质被消耗。使反应冷却至RT。在真空中去除溶剂,然后将残余物溶解于乙酸乙酯中。将溶液用水和盐水洗涤。有机层经硫酸镁干燥,过滤并在真空中干燥。通过快速色谱法纯化。在真空中干燥以产生黄色油状物。产量为300mg(38%)。
化合物II-47a:2-[2-(7-(4-甲基哌嗪-1-基)-2-氧代-2H-色烯-3-基)噻唑-4-基] 乙酸乙酯
Figure BDA0004022520900000852
/>
将4-氟水杨醛(5g,1eq)和1-甲基-哌嗪(3.93g)在DMSO(6mL)中的混合物在100℃下加热10h。使反应混合物在RT下静置过夜。在75℃下真空蒸馏出一部分溶剂和过量的N-甲基哌嗪。该水杨醛衍生物纯度足以用于下一步骤,但可以转化为盐以用于长期储存。例如,可以制备盐酸盐。向该粘性残余物中添加HCl在无水二乙醚(100mL,1m)中的溶液。滗出乙醚并用乙醇研磨产物。1h后,滤出产物。
添加在无水乙醇(5mL)和4-溴乙酰乙酸乙酯中混合在一起的3-氨基-3-硫代丙酸乙酯(0.6g,1eq,4.08mmol)和4-(4-甲基-哌嗪-1-基)-2-羟基苯甲醛盐酸盐(1.05g,1eq,4.08mmol)。将反应混合物在RT下搅拌约1h,然后在80℃下保持4h。形成新的黄色沉淀。使反应混合物在RT下静置过夜。将产物滤出,用EtOH洗涤并且从无水乙醇中结晶为盐酸盐。溶解在水中并用碳酸氢钠转化为碱。产量为1.39g(82.5%)。
通过使对应的乙酯(化合物II-47a,207mg,1eq)与LiOH(60mg,5eq)在EtOH(0.25mL)和水(2mL)中反应来制备2-(2-(7-(4-甲基哌嗪-1-基)-2-氧代-2H-色烯-3-基)噻唑-4-基)乙酸(化合物II-47)。将反应混合物在30℃至40℃下搅拌约3h。过滤几乎澄清的溶液,用乙酸酸化并在RT下静置过夜。然后将产物滤出,用冷水(2×10.5mL)洗涤并在空气中干燥。产量为0.15g(78.8%)。1H NMR(400MHz,DMSO)δ8.77(s,1H),7.77(d,J=8.9Hz,1H),7.51(s,1H),7.05(dd,J=9.0,2.4Hz,1H),6.92(d,J=2.3Hz,1H),3.79(s,2H),3.44(t,J=5.2Hz,4H),2.45(t,J=5.1Hz,5H),2.23(s,3H)。
II-48:2-[2-(7-(4-甲基-4-(3-磺酸根基丙基)哌嗪-1-基)-2-氧代-2H-色烯-3- 基)噻唑-4-基]乙酸
Figure BDA0004022520900000861
将2-(2-(7-(4-甲基哌嗪-1-基)-2-氧代-2H-色烯-3-基)噻唑-4-基)乙酸(化合物II-47,38mg,1eq)和1,3-丙磺酸内酯(12.2mg,1eq)于无水DMF(0.5mL)中的混合物在100℃下加热3h。产物用干燥二乙醚沉淀,滤出,用丙酮洗涤并干燥。产量为54mg(83%)。
化合物II-49a:2-[2-(7-(4-甲基-4-(5-羧酸根基戊基)哌嗪-1-基)-2-氧代-2H- 色烯-3-基)噻唑-4-基]乙酸乙酯
Figure BDA0004022520900000871
将2-(2-(7-(4-甲基哌嗪-1-基)-2-氧代-2H-色烯-3-基)噻唑-4-基)乙酸乙酯(化合物II-47a,413mg,1eq)和6-溴己酸(195mg,1eq)于干燥乙腈(5mL)中的混合物在90℃下加热12h。第二天,将沉淀的产物滤出,用丙酮洗涤并干燥。产量为321mg(约60%)。
化合物II-49c:3-(4-(3-(4-(乙氧基羰基甲基)噻唑-2-基)-2-氧代-2H-色烯-7- 基)-1-甲基哌嗪-1-鎓-1-基)丙基磺酸盐
Figure BDA0004022520900000872
将2-(2-(7-(4-甲基哌嗪-1-基)-2-氧代-2H-色烯-3-基)噻唑-4-基)乙酸乙酯(实施例II-6,100mg,1eq)和1,3-二氧杂-2-硫杂环丙烷-2,2-二氧化物(50mg,1eq)于干燥乙腈(1mL)中的混合物在80℃下加热1h。然后将沉淀的产物滤出,用丙酮洗涤并干燥。产量为110mg(82%)。1H NMR(400MHz,TFA-d)δ8.90(s,1H),7.87(d,J=9.1Hz,1H),7.81(s,1H),7.24(dd,J=9.2,2.4Hz,1H),7.06(d,J=2.3Hz,1H),4.58(t,J=5.3Hz,2H),4.46(q,J=7.2Hz,2H),4.31(s,2H),4.26–3.88(m,8H),3.80(t,J=9.3Hz,2H),3.40(s,3H),2.47(d,J=6.4Hz,2H),1.45(t,J=7.2Hz,3H)。
化合物II-50a:2-(2-(7-(4-叔丁氧基羰基哌嗪-1-基)-2-氧代-2H-色烯-3-基)噻 唑-4-基)乙酸乙酯
Figure BDA0004022520900000873
将4-氟水杨醛(2.80g,20mmol,1eq)、1-Boc-哌嗪(4.09g,22mmol)和Hunig碱在DMSO(6mL)中的混合物在80℃下加热10h。使反应混合物在RT下静置过夜。用少量乙腈稀释结晶的反应物,并且将产物滤出,用水洗涤。
Figure BDA0004022520900000881
将(4-叔丁氧基羰基哌嗪-1-基)水杨醛(1.5g,1eq)、2-乙氧基羰基-硫代乙酰胺和4-氯乙酰乙酸乙酯的混合物在EtOH(25mL)中在80℃至85℃下搅拌1h,并在RT下静置过夜。然后将反应混合物用水(25mL)稀释,添加碳酸氢钠并滤出黄色沉淀。可以从乙醇中结晶。产率为78%。
1H NMR(400MHz,DMSO)δ8.80(s,1H),7.83(d,J=9.0Hz,1H),7.56(s,1H),7.07(ddd,J=9.0,4.5,2.4Hz,1H),6.95(d,J=2.3Hz,1H),4.14(q,J=7.1Hz,2H),3.89(d,J=1.4Hz,2H),3.48(s,7H),3.41–3.35(m,1H),2.82(t,J=5.2Hz,1H),1.44(s,9H),1.23(t,J=7.1Hz,3H)。
化合物II-1a':2-(4-(7-(二乙基氨基)-2-氧代-2H-色烯-3-基)噻唑-2-基)乙酸 乙酯
Figure BDA0004022520900000882
在RT下将在无水EtOH(70mL)中的对二乙基氨基水杨醛(5.50g)和乙酰乙酸乙酯(3.89g)搅拌10min。添加哌啶(3滴),并将反应混合物回流2h。将呈黄色固体沉淀的结晶产物滤出,用EtOH洗涤。
将3-乙酰基-7-二乙基氨基-2H-色烯-2-酮(5.18g,20mmol)和四正丁基三溴化铵(19.3g,40mmol)于二氯甲烷(100mL)中的溶液在RT下搅拌48h。将所得沉淀滤出并用乙酸乙酯洗涤得到黄色棱柱(产率为约80%)。产物不经进一步纯化即可用于下一步骤。
Figure BDA0004022520900000891
将来自先前步骤的3-(2-溴乙酰基)-7-二乙基氨基-2H-色烯-2-酮(700mg,1egv)和3-氨基-3-硫代丙酸乙酯(380mg,1.25eq)与乙醇(5mL)混合,并且将反应混合物在80℃下保持2h。使反应混合物在RT下静置过夜。将无色沉淀滤出,并且用乙醇洗涤,然后用水(15mL)转移至烧杯中,并用碳酸氢钠中和。1h后,将产物滤出并用水洗涤。产量为780mg(94%)。1H NMR(400MHz,CDCl3)δ8.64(s,1H),8.30(s,1H),7.45(d,J=8.7Hz,1H),6.74(s,1H),6.63(s,1H),4.28(q,J=7.1Hz,2H),4.14(s,2H),3.47(q,J=7.1Hz,4H),1.34(td,J=7.1,0.6Hz,3H),1.26(t,J=7.1Hz,6H)。
通过按照在II-51的制备中描述的类似程序使对应的乙酯II-1a'与LiOH反应来制备2-(4-(7-(二乙基氨基)-2-氧代-2H-色烯-3-基)噻唑-2-基)乙酸(化合物II-1')。产量为0.275g(约74%)。1H NMR(400MHz,DMSO)δ8.61(s,1H),8.13(s,1H),7.65(d,J=9.0Hz,1H),6.75(dd,J=8.9,2.5Hz,1H),6.59(d,J=2.4Hz,1H),4.10(s,2H),3.46(q,J=7.0Hz,4H),1.14(t,J=7.0Hz,6H)。
用于制备用式(I)、式(II)或式(II')的化合物标记的核苷酸的一般程序
用二异丙基乙胺(DIPEA,10eq)和2-(内-5-降冰片烯-2.3-二羧酰亚胺)-1,1,3,3-四甲基脲四氟硼酸盐(TNTU)(1.2eq)处理于二甲基乙酰胺(DMA)中的适当的染料(1.0eq)。将反应混合物在RT下搅拌10min。然后添加相关氨基取代的核苷酸衍生物(具有含有氨基官能团的连接基部分的核苷酸,1.2eq),随后添加三乙胺。将反应混合物在RT下搅拌18h。在偶联完成后,在真空中蒸馏出溶剂,残余物通过离子交换柱(Sephadex,洗脱液TEAB,梯度为0.1M至1.0M)预纯化并且使用反相HPLC进一步纯化。通过LC-MS和HRMS确认产物的组成。
表3.用式(II)的染料标记的各种ffN的表征
编号 染料 碱基 连接基 Mw(染料) Mw Ex/Em(nm)(SRE)*
1 II-6 C sPA 358 1263 480/519
2 II-2 C sPA 358 1263 467/511
3 II-5 C sPA 420 1324 450/503
4 II-1 C sPA 424 1328 442/497
5 II-8 C sPA 424 1328 455/503
*在RT下在扫描混合物中测量标记的ffN的光谱特性(在460nm激发)。
表3中的一些示例性ffC和ffA的结构如下所示:
Figure BDA0004022520900000901
图3A示出了在460nm处激发时在缓冲溶液中用参考染料A标记的完全官能化A核苷酸(ffA)与用染料II-1或染料II-8标记的相同ffA的发射光谱对比。
图3B示出了在460nm处激发时在缓冲溶液中用参考染料A标记的完全官能化C核苷酸(ffC)与用染料II-1和染料II-8标记的相同ffC的发射光谱对比。
观察到,与参考染料A相比,染料II-1和染料II-8在蓝色激光波长(约460nm)激发时具有足够的吸收,并且在“蓝色发射”检测区(约470nm至520nm)中提供更强的荧光信号。结果表明了这些染料作为荧光生物标记例如在核酸测序应用中的效用。
实施例4.双通道测序应用
在Illumina的
Figure BDA0004022520900000911
平台上以双通道检测方法证明用新的染料(染料I-4a和染料I-3a;染料II-1和染料II-8)标记的完全官能化的核苷酸的效率。关于本文所述的双通道方法,可以利用在美国专利申请号2013/0079232中所述的方法和系统对核酸进行测序,该美国专利申请的公开内容全文以引用方式并入本文。蓝色曝光(通道1)500ms,绿色曝光(通道2)1000ms;标称1X曝光是蓝色450ms,并且绿色曝光是540ms,对应于约3.5J/cm2。将用染料I-4a、染料I-3a、染料II-1或染料II-8标记的ffA/ffC的性能与在/>
Figure BDA0004022520900000912
上使用的标准染料组标记的ffN生成的测序数据进行比较。这些数据在图4A至图4C和图5A至图5C中示出。数据清楚地表明,基于染料I-4a、染料I-3a、染料II-1和染料II-8的ffN具有与参考染料A相当的化学稳定性并且适用于测序。每个测序运行以五个不同的光剂量(1X、3X、5X、7.5X和10X)执行151个循环。
在双通道检测中,可以通过提供在第一通道中检测到的第一核苷酸类型、在第二通道中检测到的第二核苷酸类型、在第一通道和第二通道这两者中检测到的第三核苷酸类型,以及缺乏标记且在任一通道中未检测到或最低程度检测到的第四核苷酸类型,来对核酸进行测序。通过实验的RTA2.0.93分析生成散点图。散点图示出在图6A至图6H中。
图4A至图4C示出了当使用不同的光剂量(1X、3X、5X、7.5X和10X)时,与用标准染料组标记的ffN相比,在
Figure BDA0004022520900000913
测序平台中使用的ffA和ffC用染料I-4a(ffC=1.25uM;ffA=1.5uM)或染料I-3a(ffC=1.5uM;ffA=1.6uM)标记时的测序指标。对于用标准染料组标记的ffN,使用ffC-sPA-参考染料A和ffA-BL-参考染料A。DNA聚合酶Pol1901以90ug/mL最终浓度用于掺入ffN。观察到在1X和3X光剂量下,用染料I-3a和染料I-4a标记的ffA/ffC提供了与用参考染料A标记的那些相当的测序结果。
图5A至图5C示出了当使用不同的光剂量(1X、3X、5X、7.5X和10X)时,与用标准染料组标记的ffN相比,在
Figure BDA0004022520900000921
测序平台中使用的ffA和ffC用染料II-1或染料II-8标记时的测序指标。具体地,使用以下ffN:ffA-sPA-BL-染料II-1(1.65uM)+ffA-sPA-BL-NR550S0(0.35uM);ffC-sPA-染料II-1(1.5uM)+ffC-LN3-SO7181(0.5uM);ffA-BL-染料II-8(1.8uM)+ffA-sPA-BL-NR550S0(0.2uM);ffC-sPA-染料II-8(1.5uM)+ffC-LN3-SO7181(0.5uM)。ffT为以1uM使用的ffT-LN3-AF550POPOS0,并且G未标记。对于用标准染料组标记的ffN,使用ffC-sPA-参考染料A和ffA-BL-参考染料A。DNA聚合酶Pol 1901以90ug/mL最终浓度用于掺入ffN。观察到在1X和3X光剂量下,用染料II-1和染料II-8标记的ffA/ffC提供了与用参考染料A标记的那些相当的测序结果。
图6A至图6H是如上所述分别在1X和10X光剂量下用染料I-4a、染料I-3a、染料I-1和染料I-8标记的ffA/ffC的散点图。ffT是以1uM使用的ffT-LN3-AF550POPOS0,并且G未标记(暗色G)。Pol 1901以90ug/mL最终浓度用于掺入缓冲液中。蓝色曝光(通道1)500ms,绿色曝光(通道2)1000ms;以扫描混合物扫描。在图6A至图6H中的每一者中,“G”核苷酸显示为左下方的云状物(“暗色G”)。来自由本文所述的新的蓝色染料以及绿色染料(NR550S0)标记的“A”核苷酸的混合物的信号以右上方的云状物示出。来自用染料AF550POPOS0标记的“T”核苷酸的信号由左上方的云状物指示,并且来自用本文所述的新的蓝色染料以及另一染料SO7181标记的“C”核苷酸的信号由右下方的云状物指示。X轴示出了一个(蓝色)通道的信号强度,并且Y轴示出了另一个(绿色)通道的信号强度。AF550POPOS0和NR550S0的化学结构分别公开于PCT公开WO2018060482A1、WO2017051201A1和WO2014135221A1中,所有这些公开均以引用方式并入。
图6A至图6H示出了用新的蓝色染料(染料I-4a、染料I-3a、染料II-1或染料II-8)标记的ffA和ffC的可用性,其中呈现了在一个剂量的光暴露之后来自ffC和ffT核苷酸的信号的比率(C/T@1X)以及在10个剂量的暴露之后的适当信号的比率(C/T@10X/1X)。该参数测量在较高剂量的光下ffC荧光强度相对于ffT荧光强度移动的量,这指示了光漂白。图6A至图6H各自示出了用本文所述的新的染料标记的ffC缀合物提供了足够的信号强度和大的云状物分离。

Claims (66)

1.一种式(II)或式(II')的化合物或其盐或内消旋形式:
Figure FDA0004022520890000011
其中X是S、O或NRa
Y是O或NH;
每个R1、R2、R3和R5独立地是H、任选地取代的C1-C6烷基、C1-C6烷氧基、C2-C6烯基、C2-C6炔基、C1-C6卤代烷基、C1-C6卤代烷氧基、C1-C6羟烷基、(C1-C6烷氧基)(C1-C6烷基)、任选地取代的氨基、卤基、氰基、羟基、硝基、磺酰基、亚磺酸基、磺基、磺酸根、S-亚磺酰氨基、N-亚磺酰氨基、任选地取代的C3-C10碳环基、任选地取代的C6-C10芳基、任选地取代的5元至10元杂芳基或任选地取代的3元至10元杂环基;
R4是-NRbRc、卤基、-ORd或-OS(O)2Rd
R6和R7中的每一者独立地是H、羧基、-C(O)NRbRc、-C(O)ORd、C1-C6烷基、取代的C1-C6烷基、C1-C6卤代烷基、卤基、任选地取代的氨基、N-亚磺酰氨基、磺酰基、S-亚磺酰氨基、羟基、氰基、硝基、任选地取代的苯基、任选地取代的C3-C8碳环基、任选地取代的5元至10元杂芳基或任选地取代的3元至10元杂环基;或者式(II)中的R6和R7连同它们所附接的原子一起形成任选地取代的C5-C8碳环基或任选地取代的5元至8元杂环基;
Ra是H或C1-C6烷基;
每个Rb和Rc独立地是H、C1-C6烷基或取代的C1-C6烷基;或者Rb和Rc连同它们所附接的氮原子一起形成任选地取代的4元至10元杂环基;并且
每个Rd独立地是任选地取代的C1-C6烷基或任选地取代的苯基;前提条件是
R6和R7中的至少一者或者由R6和R7与它们所附接的原子形成的所述任选地取代的C5-C8碳环基或任选地取代的5元至8元杂环基包含羧基;或者
R4是-NRbRc并且Rb和Rc中的至少一者包含羧基或-C(O)ORd
2.根据权利要求1所述的化合物,其中R4是卤基。
3.根据权利要求1所述的化合物,其中R4是–OS(O)2Rd,并且其中Rd是C1-C6烷基或C1-C6卤代烷基。
4.根据权利要求3所述的化合物,其中Rd是三氟甲基。
5.根据权利要求1所述的化合物,其中R4是-NRbRc,并且所述化合物还由式(IIa)或式(IIa')表示:
Figure FDA0004022520890000021
/>
或它们的盐或内消旋形式。
6.根据权利要求5所述的化合物,其中Rb和Rc中的每一者独立地是H、C1-C6烷基或取代的C1-C6烷基。
7.根据权利要求6所述的化合物,其中Rb和Rc中的每一者独立地是C1-C6烷基或取代的C1-C6烷基,或者Rb是H并且Rc是C1-C6烷基或取代的C1-C6烷基。
8.根据权利要求6或7所述的化合物,其中所述取代的C1-C6烷基独立地被羧基、-C(O)ORd、磺基(-SO3H)、磺酸根(-SO3 -)、–O-SO3 -或-SO2NReRf取代,并且其中Re和Rf中的每一者独立地是H或C1-C6烷基。
9.根据权利要求6或7所述的化合物,其中Rb和Rc中的每一者是乙基。
10.根据权利要求6至8中任一项所述的化合物,其中Rb和Rc中的每一者独立地是被羧基、-C(O)ORd、-SO3H、-SO3 -或–SO2NH2取代的C1-C6烷基。
11.根据权利要求6至8中任一项所述的化合物,其中Rb是H并且Rc是C1-C6烷基或被羧基、-C(O)ORd、-SO3H、-SO3 -、–O-SO3 -或–SO2NH2取代的C1-C6烷基。
12.根据权利要求5所述的化合物,其中Rb和Rc连同它们所附接的氮原子一起形成任选地取代的4元、5元或6元杂环基。
13.根据权利要求1至12中任一项所述的化合物,其中Y是O。
14.根据权利要求1至13中任一项所述的化合物,其中X是S或O。
15.根据权利要求1至14中任一项所述的化合物,其中R1是H或C1-C6烷基。
16.根据权利要求1至15中任一项所述的化合物,其中R2是H。
17.根据权利要求1至16中任一项所述的化合物,其中R3是H或C1-C6烷基。
18.根据权利要求1至17中任一项所述的化合物,其中R5是H。
19.根据权利要求1至18中任一项所述的化合物,其中R6和R7中的每一者独立地是H、C1-C6烷基、取代的C1-C6烷基、任选地取代的苯基、羧基或-C(O)ORd
20.根据权利要求19所述的化合物,其中R6或R7中的一者是H或C1-C6烷基,并且R6或R7中的另一者是羧基、-C(O)ORd、C1-C6烷基、取代的C1-C6烷基或任选地被羧基、-C(O)ORd或磺基取代的苯基。
21.根据权利要求19或20所述的化合物,其中R6或R7中的一者是H或甲基,并且R6或R7中的另一者是羧基、-C(O)ORd、甲基、苯基、被羧基或-C(O)ORd取代的苯基、或被羧基或C(O)ORd取代的C1-C6烷基。
22.根据权利要求1至18中任一项所述的化合物,其中R6和R7连同它们所附接的原子一起形成C5-C6碳环基。
23.根据权利要求14所述的化合物,所述化合物选自由以下项组成的组:
Figure FDA0004022520890000041
/>
Figure FDA0004022520890000051
/>
Figure FDA0004022520890000061
/>
Figure FDA0004022520890000071
以及它们的C1-C6烷基羧酸酯、盐和内消旋形式。
24.一种式(I)的化合物或其盐或内消旋形式:
Figure FDA0004022520890000081
其中R1是各自任选地被一个或多个取代基取代的
Figure FDA0004022520890000082
Figure FDA0004022520890000083
所述一个或多个取代基独立地选自由以下项组成的组:羧基、-C(O)NRbRc、-C(O)ORd、C1-C6烷基、取代的C1-C6烷基、卤基、任选地取代的氨基、羟基、磺基、磺酸根、硫酸根、N-亚磺酰氨基和S-亚磺酰氨基;
R2是H、任选地取代的C1-C6烷基或任选地被选自由以下项组成的组的一个或多个取代基取代的苯基:羧基、-C(O)NRbRc、-C(O)ORd、任选地取代的C1-C6烷基、卤基、氰基、硝基、磺酰基、亚磺酸基、磺基、磺酸根、任选地取代的氨基以及羟基;
每个R3、R4和R7独立地是H、任选地取代的C1-C6烷基、C1-C6烷氧基、C2-C6烯基、C2-C6炔基、C1-C6卤代烷基、C1-C6卤代烷氧基、C1-C6羟烷基、(C1-C6烷氧基)(C1-C6烷基)、任选地取代的氨基、卤基、氰基、羟基、硝基、磺酰基、亚磺酸基、磺基、磺酸根、S-亚磺酰氨基、N-亚磺酰氨基、任选地取代的C3-C10碳环基或任选地取代的3元至10元杂环基;
每个R5和R6独立地是H、C1-C6烷基、取代的C1-C6烷基,或者R5和R6连同它们所附接的氮原子一起形成任选地取代的4元至10元杂环基;
X是O、S或NRa
Ra是H或C1-C6烷基;
每个Rb和Rc独立地是H、C1-C6烷基或取代的C1-C6烷基;并且
Rd是任选地取代的C1-C6烷基或任选地取代的苯基;前提条件是
R5或R6中的至少一者或由R5和R6与它们所附接的氮原子形成的所述任选地取代的4元至10元杂环基包含羧基或-C(O)ORd;或者
R1包含羧基或-C(O)ORd
25.根据权利要求24所述的化合物,其中R1是各自被羧基取代的
Figure FDA0004022520890000091
26.根据权利要求24或25所述的化合物,其中R1
Figure FDA0004022520890000092
/>
Figure FDA0004022520890000093
27.根据权利要求24至26中任一项所述的化合物,其中R5和R6中的每一者是C1-C6烷基。
28.根据权利要求27所述的化合物,其中R5和R6中的每一者是乙基。
29.根据权利要求24至26中任一项所述的化合物,其中R5是H并且R6是取代的C1-C6烷基。
30.根据权利要求24至26中任一项所述的化合物,其中R5和R6中的每一者是取代的C1-C6烷基。
31.根据权利要求29或30所述的化合物,其中所述C1-C6烷基被羧基、
-C(O)ORd、磺基(-SO3H)、磺酸根(-SO3 -)、硫酸根(–O-SO3 -)或任选地取代的氨基取代。
32.根据权利要求24所述的化合物,其中R1是各自未取代或被磺基(-SO3H)取代的
Figure FDA0004022520890000094
33.根据权利要求32所述的化合物,其中R5是H并且R6是被羧基取代的C1-C6烷基。
34.根据权利要求32所述的化合物,其中R5和R6中的每一者是被羧基、-C(O)ORd、磺基(-SO3H)、磺酸根(-SO3 -)或硫酸根(–O-SO3 -)取代的C1-C6烷基,并且R5和R6中的一者被羧基取代。
35.根据权利要求32所述的化合物,其中R5和R6与它们所附接的氮原子形成被羧基取代的5元或6元杂环基。
36.根据权利要求24至35中任一项所述的化合物,其中R2是H。
37.根据权利要求24至35中任一项所述的化合物,其中R2是C1-C6烷基。
38.根据权利要求37所述的化合物,其中R2是甲基。
39.根据权利要求24至38中任一项所述的化合物,其中R3、R4和R7中的每一者是H。
40.根据权利要求24所述的化合物,所述化合物选自由以下项组成的组:
Figure FDA0004022520890000101
以及它们的盐和内消旋形式。
41.一种核苷酸或寡核苷酸,所述核苷酸或寡核苷酸用根据权利要求5至40中任一项所述的化合物标记。
42.根据权利要求41所述的标记的核苷酸或寡核苷酸,其中所述化合物经由式(I)的R1的羧基基团附接到所述核苷酸或寡核苷酸。
43.根据权利要求41所述的标记的核苷酸或寡核苷酸,其中所述化合物经由式(II)或式(II')的R6或R7的羧基基团附接到所述核苷酸或寡核苷酸。
44.根据权利要求41至43中任一项所述的标记的核苷酸或寡核苷酸,其中所述化合物通过连接基部分附接到嘧啶碱基的C5位置或7-脱氮嘌呤碱基的C7位置。
45.根据权利要求41至44中任一项所述的标记的核苷酸或寡核苷酸,还包括共价附接到所述核苷酸的核糖或脱氧核糖的3'OH封端基团。
46.根据权利要求41所述的核苷酸或寡核苷酸,其中所述核苷酸或寡核苷酸是与靶多核苷酸的至少一部分杂交的寡核苷酸。
47.根据权利要求46所述的寡核苷酸,其中所述靶多核苷酸被固定在固体载体上。
48.根据权利要求47所述的寡核苷酸,其中所述固体载体包含多个固定的靶多核苷酸的阵列。
49.一种试剂盒,所述试剂盒包含第一类型的根据权利要求41至45中任一项所述的标记的核苷酸。
50.根据权利要求49所述的试剂盒,所述试剂盒还包含第二类型的标记的核苷酸,其中所述第二类型的标记的核苷酸用与所述第一类型的标记的核苷酸不同的化合物标记。
51.根据权利要求50所述的试剂盒,其中使用单一激光波长能够激发所述第一类型的标记的核苷酸和所述第二类型的标记的核苷酸。
52.根据权利要求50或51所述的试剂盒,所述试剂盒还包含第三类型的核苷酸和第四类型的核苷酸,其中所述第二类型的核苷酸、所述第三类型的核苷酸和所述第四类型的核苷酸中的每一者用不同的化合物标记,其中每种标记具有能够与其他标记区分的不同的吸光度最大值。
53.根据权利要求49所述的试剂盒,其中所述试剂盒包含四种类型的核苷酸,其中第一类型的核苷酸是根据权利要求41至45中任一项所述的标记的核苷酸,第二类型的核苷酸用第二标记标记,第三类型的核苷酸用第三标记标记,并且第四类型的核苷酸未标记(暗色)。
54.根据权利要求49所述的试剂盒,其中所述试剂盒包含四种类型的核苷酸,其中第一类型的核苷酸是根据权利要求41至45中任一项所述的标记的核苷酸,第二类型的核苷酸用第二标记标记,第三类型的核苷酸用两种标记的混合物标记,并且第四类型的核苷酸未标记(暗色)。
55.根据权利要求49至54中任一项所述的试剂盒,所述试剂盒还包含DNA聚合酶和一种或多种缓冲液组合物。
56.根据权利要求1至40中任一项所述的化合物、根据权利要求41至45所述的标记的核苷酸或寡核苷酸或根据权利要求49至55中任一项所述的试剂盒在测序、表达分析、杂交分析、遗传分析、RNA分析或蛋白质结合测定中的用途。
57.根据权利要求56所述的用途,所述用途适用于自动化测序仪器,其中所述自动化测序仪器包含在不同波长下操作的两个激光器。
58.一种确定单链靶多核苷酸的序列的方法,所述方法包括:
(a)使引物多核苷酸/靶多核苷酸复合物与一种或多种标记的核苷酸接触,其中所述标记的核苷酸中的至少一者是根据权利要求41至45中任一项所述的核苷酸,并且其中所述引物多核苷酸与所述靶多核苷酸的至少一部分互补;
(b)将标记的核苷酸掺入到所述引物多核苷酸中;以及
(c)执行一次或多次荧光测量以确定所掺入的核苷酸的身份。
59.根据权利要求58所述的方法,其中所述引物多核苷酸/靶多核苷酸复合物通过使所述靶多核苷酸与和所述靶多核苷酸的至少一部分互补的单链引物多核苷酸接触而形成。
60.根据权利要求58或59所述的方法,所述方法还包括(d)从掺入到所述引物多核苷酸中的所述核苷酸中去除所述标记和所述3'封端基团。
61.根据权利要求59所述的方法,所述方法还包括(e)将所述去除的标记和所述3'封端基团从所述引物多核苷酸上洗掉。
62.根据权利要求61所述的方法,所述方法还包括重复步骤(a)至步骤(e),直至确定所述模板多核苷酸链的至少一部分的序列。
63.根据权利要求62所述的方法,其中重复所述步骤(a)至步骤(e)至少50次。
64.根据权利要求58至63中任一项所述的方法,其中在单一化学反应中去除来自掺入到所述引物多核苷酸中的所述核苷酸的所述标记和所述3'封端基团。
65.根据权利要求58至64中任一项所述的方法,其中所述方法在自动化测序仪器上执行,并且其中所述自动化测序仪器包含在不同波长下操作的两个光源。
66.一种制备式(IIa)或式(IIa')的化合物的方法,所述方法包括分别使式(III)或式(III')的化合物与式NHRbRc的胺反应;
Figure FDA0004022520890000131
其中X是S、O或NRa
Y是O或NH;
每个R1、R2、R3和R5独立地是H、任选地取代的C1-C6烷基、C1-C6烷氧基、C2-C6烯基、C2-C6炔基、C1-C6卤代烷基、C1-C6卤代烷氧基、C1-C6羟烷基、(C1-C6烷氧基)(C1-C6烷基)、任选地取代的氨基、卤基、氰基、羟基、硝基、磺酰基、亚磺酸基、磺基、磺酸根、S-亚磺酰氨基、N-亚磺酰氨基、任选地取代的C3-C10碳环基、任选地取代的C6-C10芳基、任选地取代的5元至10元杂芳基或任选地取代的3元至10元杂环基;
R6和R7中的每一者独立地是H、羧基、-C(O)NRbRc、-C(O)ORd、C1-C6烷基、取代的C1-C6烷基、C1-C6卤代烷基、卤基、任选地取代的氨基、N-亚磺酰氨基、磺酰基、S-亚磺酰氨基、羟基、氰基、硝基、任选地取代的苯基、任选地取代的C3-C8碳环基、任选地取代的5元至10元杂芳基或任选地取代的3元至10元杂环基;或者式(III)中的R6和R7连同它们所附接的原子一起形成任选地取代的C5-C8碳环基或任选地取代的5元至8元杂环基;
Rx是卤基、-ORd或-OS(O)2Rd
Ra是H或C1-C6烷基;
每个Rb和Rc独立地是H、C1-C6烷基或取代的C1-C6烷基;或者Rb和Rc连同它们所附接的氮原子一起形成任选地取代的4元至10元杂环基;并且
每个Rd独立地是任选地取代的C1-C6烷基或任选地取代的苯基。
CN202180047349.9A 2020-07-28 2021-07-27 取代的香豆素染料和作为荧光标记的用途 Pending CN115867544A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063057758P 2020-07-28 2020-07-28
US63/057,758 2020-07-28
PCT/EP2021/071024 WO2022023353A1 (en) 2020-07-28 2021-07-27 Substituted coumarin dyes and uses as fluorescent labels

Publications (1)

Publication Number Publication Date
CN115867544A true CN115867544A (zh) 2023-03-28

Family

ID=77447854

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180047349.9A Pending CN115867544A (zh) 2020-07-28 2021-07-27 取代的香豆素染料和作为荧光标记的用途

Country Status (11)

Country Link
US (1) US11981964B2 (zh)
EP (1) EP4188921A1 (zh)
JP (1) JP2023539411A (zh)
KR (1) KR20230044364A (zh)
CN (1) CN115867544A (zh)
AU (1) AU2021314837A1 (zh)
BR (1) BR112022026802A2 (zh)
CA (1) CA3182088A1 (zh)
IL (1) IL298805A (zh)
MX (1) MX2022014722A (zh)
WO (1) WO2022023353A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022243480A1 (en) 2021-05-20 2022-11-24 Illumina, Inc. Compositions and methods for sequencing by synthesis
CA3223115A1 (en) 2022-03-28 2023-10-05 Xiaolin Wu Labeled avidin and methods for sequencing
US20230357845A1 (en) 2022-03-31 2023-11-09 Illumina, Inc. Compositions and methods for improving sequencing signals
CA3222797A1 (en) 2022-03-31 2023-10-05 Ramesh NEELAKANDAN Nucleosides and nucleotides with 3' vinyl blocking group
US20230383342A1 (en) 2022-05-31 2023-11-30 Illumina Cambridge Limited Compositions and methods for nucleic acid sequencing
WO2024068889A2 (en) 2022-09-30 2024-04-04 Illumina, Inc. Compositions and methods for reducing photo damage during sequencing

Family Cites Families (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5268486A (en) 1986-04-18 1993-12-07 Carnegie-Mellon Unversity Method for labeling and detecting materials employing arylsulfonate cyanine dyes
GB8822228D0 (en) 1988-09-21 1988-10-26 Southern E M Support-bound oligonucleotides
US6346413B1 (en) 1989-06-07 2002-02-12 Affymetrix, Inc. Polymer arrays
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
DE3924454A1 (de) 1989-07-24 1991-02-07 Cornelis P Prof Dr Hollenberg Die anwendung von dna und dna-technologie fuer die konstruktion von netzwerken zur verwendung in der chip-konstruktion und chip-produktion (dna chips)
US5302509A (en) 1989-08-14 1994-04-12 Beckman Instruments, Inc. Method for sequencing polynucleotides
ATE148889T1 (de) 1991-09-18 1997-02-15 Affymax Tech Nv Verfahren zur synthese der verschiedenen sammlungen von oligomeren
EP0916396B1 (en) 1991-11-22 2005-04-13 Affymetrix, Inc. (a Delaware Corporation) Combinatorial strategies for polymer synthesis
DE69333650T2 (de) 1992-02-19 2006-01-12 The Public Health Research Institute Of The City Of New York, Inc. Neue anordnungn von oligonukleotiden und ihr nutzen zum sortieren, isolieren, sequenzieren und manipulieren von nukleinsäuren
US5583211A (en) 1992-10-29 1996-12-10 Beckman Instruments, Inc. Surface activated organic polymers useful for location - specific attachment of nucleic acids, peptides, proteins and oligosaccharides
WO1995011995A1 (en) 1993-10-26 1995-05-04 Affymax Technologies N.V. Arrays of nucleic acid probes on biological chips
US5472672A (en) 1993-10-22 1995-12-05 The Board Of Trustees Of The Leland Stanford Junior University Apparatus and method for polymer synthesis using arrays
US6156501A (en) 1993-10-26 2000-12-05 Affymetrix, Inc. Arrays of modified nucleic acid probes and methods of use
US5429807A (en) 1993-10-28 1995-07-04 Beckman Instruments, Inc. Method and apparatus for creating biopolymer arrays on a solid support surface
US5807522A (en) 1994-06-17 1998-09-15 The Board Of Trustees Of The Leland Stanford Junior University Methods for fabricating microarrays of biological samples
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5556752A (en) 1994-10-24 1996-09-17 Affymetrix, Inc. Surface-bound, unimolecular, double-stranded DNA
US5624711A (en) 1995-04-27 1997-04-29 Affymax Technologies, N.V. Derivatization of solid supports and methods for oligomer synthesis
US5545531A (en) 1995-06-07 1996-08-13 Affymax Technologies N.V. Methods for making a device for concurrently processing multiple biological chip assays
WO1997014028A2 (en) 1995-10-11 1997-04-17 Luminex Corporation Multiplexed analysis of clinical specimens apparatus and method
US5658734A (en) 1995-10-17 1997-08-19 International Business Machines Corporation Process for synthesizing chemical compounds
US6458530B1 (en) 1996-04-04 2002-10-01 Affymetrix Inc. Selecting tag nucleic acids
US6297006B1 (en) 1997-01-16 2001-10-02 Hyseq, Inc. Methods for sequencing repetitive sequences and for determining the order of sequence subfragments
AU6846698A (en) 1997-04-01 1998-10-22 Glaxo Group Limited Method of nucleic acid amplification
US6465178B2 (en) 1997-09-30 2002-10-15 Surmodics, Inc. Target molecule attachment to surfaces
US6485944B1 (en) 1997-10-10 2002-11-26 President And Fellows Of Harvard College Replica amplification of nucleic acid arrays
US6087102A (en) 1998-01-07 2000-07-11 Clontech Laboratories, Inc. Polymeric arrays and methods for their use in binding assays
US6287776B1 (en) 1998-02-02 2001-09-11 Signature Bioscience, Inc. Method for detecting and classifying nucleic acid hybridization
JP3944996B2 (ja) 1998-03-05 2007-07-18 株式会社日立製作所 Dnaプローブアレー
US6031078A (en) 1998-06-16 2000-02-29 Millennium Pharmaceuticals, Inc. MTbx protein and nucleic acid molecules and uses therefor
GB0002310D0 (en) 2000-02-01 2000-03-22 Solexa Ltd Polynucleotide sequencing
CA2339121A1 (en) 1998-07-30 2000-02-10 Shankar Balasubramanian Arrayed biomolecules and their use in sequencing
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6277628B1 (en) 1998-10-02 2001-08-21 Incyte Genomics, Inc. Linear microarrays
US6391937B1 (en) 1998-11-25 2002-05-21 Motorola, Inc. Polyacrylamide hydrogels and hydrogel arrays made from polyacrylamide reactive prepolymers
ATE413467T1 (de) 1999-04-20 2008-11-15 Illumina Inc Detektion von nukleinsäurereaktionen auf kügelchen-arrays
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
US6372813B1 (en) 1999-06-25 2002-04-16 Motorola Methods and compositions for attachment of biomolecules to solid supports, hydrogels, and hydrogel arrays
US6664061B2 (en) 1999-06-25 2003-12-16 Amersham Biosciences Ab Use and evaluation of a [2+2] photoaddition in immobilization of oligonucleotides on a three-dimensional hydrogel matrix
US6770441B2 (en) 2000-02-10 2004-08-03 Illumina, Inc. Array compositions and methods of making same
WO2002012566A2 (en) 2000-08-09 2002-02-14 Motorola, Inc. The use and evaluation of a [2+2] photocycloaddition in immobilization of oligonucleotides on a three-dimensional hydrogel matrix
EP1322710B2 (en) 2000-09-29 2015-02-18 Life Technologies Corporation Modified carbocyanine dyes and their conjugates
GB2395953A (en) 2002-08-23 2004-06-09 Solexa Ltd Labelled nucleotides
SI3002289T1 (en) 2002-08-23 2018-07-31 Illumina Cambridge Limited MODIFIED NUCLEOTES FOR POLYUCULOTIDE SEQUENCING
DE10258150A1 (de) 2002-12-10 2004-07-08 Dyomics Gmbh Hydrophile Marker auf der Basis von Benzopyrylo-Polymethinen
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
GB0326073D0 (en) 2003-11-07 2003-12-10 Solexa Ltd Improvements in or relating to polynucleotide arrays
JP2007525571A (ja) 2004-01-07 2007-09-06 ソレクサ リミテッド 修飾分子アレイ
EP1888743B1 (en) 2005-05-10 2011-08-03 Illumina Cambridge Limited Improved polymerases
GB0517097D0 (en) 2005-08-19 2005-09-28 Solexa Ltd Modified nucleosides and nucleotides and uses thereof
CA2795350C (en) * 2010-04-05 2016-02-09 Mannkind Corporation Ire-1.alpha. inhibitors
DK3623481T3 (da) 2011-09-23 2021-11-15 Illumina Inc Sammensætninger til nukleinsyresekventering
US9012022B2 (en) 2012-06-08 2015-04-21 Illumina, Inc. Polymer coatings
CN105164106B (zh) 2013-03-08 2018-04-03 伊鲁米纳剑桥有限公司 多次甲基化合物和其作为荧光标记物的用途
JP6333297B2 (ja) 2013-03-15 2018-05-30 イルミナ ケンブリッジ リミテッド 修飾ヌクレオシドまたは修飾ヌクレオチド
GB201414098D0 (en) 2014-08-08 2014-09-24 Illumina Cambridge Ltd Modified nucleotide linkers
CN104449669B (zh) * 2014-10-15 2016-11-23 中山大学 一种多芳基取代咪唑荧光探针及其制备方法和在检测g-四链体结构中的应用
GB201516987D0 (en) 2015-09-25 2015-11-11 Illumina Cambridge Ltd Polymethine compounds and their use as fluorescent labels
ITUA20161706A1 (it) * 2016-03-15 2017-09-15 Cyanagen S R L Nuovi coloranti cumarinici e relativi coniugati
US10385214B2 (en) 2016-09-30 2019-08-20 Illumina Cambridge Limited Fluorescent dyes and their uses as biomarkers
KR102349259B1 (ko) 2017-01-04 2022-01-07 엠쥐아이 테크 컴퍼니 엘티디. 친화성 시약을 이용한 핵산 시퀀싱
GB201716931D0 (en) * 2017-10-16 2017-11-29 Illumina Cambridge Ltd New fluorescent compounds and their use as biomarkers
US20220162693A1 (en) 2018-11-09 2022-05-26 Mgi Tech Co., Ltd. Massively parallel sequencing using unlabeled nucleotides
US11293061B2 (en) 2018-12-26 2022-04-05 Illumina Cambridge Limited Sequencing methods using nucleotides with 3′ AOM blocking group
MX2020013416A (es) 2019-03-01 2021-04-28 Illumina Cambridge Ltd Compuestos de coumarina sustituidos con amina terciaria y sus usos como etiquetas fluorescentes.
CA3103900A1 (en) 2019-03-01 2020-09-10 Illumina Cambridge Limited Exocyclic amine substituted coumarin compounds and their uses as fluorescent labels

Also Published As

Publication number Publication date
EP4188921A1 (en) 2023-06-07
AU2021314837A1 (en) 2023-01-05
IL298805A (en) 2023-02-01
WO2022023353A1 (en) 2022-02-03
BR112022026802A2 (pt) 2023-04-18
US20220033900A1 (en) 2022-02-03
KR20230044364A (ko) 2023-04-04
MX2022014722A (es) 2023-03-03
CA3182088A1 (en) 2022-02-03
US11981964B2 (en) 2024-05-14
JP2023539411A (ja) 2023-09-14

Similar Documents

Publication Publication Date Title
JP7002478B2 (ja) 新規の蛍光色素およびバイオマーカーとしてのそれらの使用
US11371078B2 (en) Coumarin compounds and their uses as fluorescent labels
KR102411545B1 (ko) 이차 아민-치환된 쿠마린 화합물 및 형광 표지로서의 이들의 용도
CN115867544A (zh) 取代的香豆素染料和作为荧光标记的用途
KR20210134210A (ko) 삼차 아민 치환된 쿠마린 화합물 및 형광 표지로서의 이의 용도
US20220195517A1 (en) Long stokes shift chromenoquinoline dyes and uses in sequencing applications
US20220380389A1 (en) Fluorescent dyes containing bis-boron fused heterocycles and uses in sequencing
CN114829369A (zh) 含环辛四烯的染料和组合物
US20220195196A1 (en) Alkylpyridinium coumarin dyes and uses in sequencing applications
US20230416279A1 (en) Fluorescent dyes containing fused tetracyclic bis-boron heterocycle and uses in sequencing
US20230313292A1 (en) Chromenoquinoline dyes and uses in sequencing
WO2023232829A1 (en) Compositions and methods for nucleic acid sequencing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination