CN106255697A - 磷保护基团及其制备方法和用途 - Google Patents

磷保护基团及其制备方法和用途 Download PDF

Info

Publication number
CN106255697A
CN106255697A CN201580022581.1A CN201580022581A CN106255697A CN 106255697 A CN106255697 A CN 106255697A CN 201580022581 A CN201580022581 A CN 201580022581A CN 106255697 A CN106255697 A CN 106255697A
Authority
CN
China
Prior art keywords
compound
group
alkyl
hydrogen
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580022581.1A
Other languages
English (en)
Other versions
CN106255697B (zh
Inventor
D·J·德林杰
L·蒙弗雷戈拉
M·卡拉瑟斯
M·罗伊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agilent Technologies Inc
University of Colorado
Original Assignee
Agilent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agilent Technologies Inc filed Critical Agilent Technologies Inc
Publication of CN106255697A publication Critical patent/CN106255697A/zh
Application granted granted Critical
Publication of CN106255697B publication Critical patent/CN106255697B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/06Pyrimidine radicals
    • C07H19/10Pyrimidine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/06Pyrimidine radicals
    • C07H19/073Pyrimidine radicals with 2-deoxyribosyl as the saccharide radical
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/16Purine radicals
    • C07H19/173Purine radicals with 2-deoxyribosyl as the saccharide radical
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/23Heterocyclic radicals containing two or more heterocyclic rings condensed among themselves or condensed with a common carbocyclic ring system, not provided for in groups C07H19/14 - C07H19/22
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/55Design of synthesis routes, e.g. reducing the use of auxiliary or protecting groups

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biochemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Saccharide Compounds (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本申请的各方面包括利用磷和/或核碱基保护基团的组合物,该组合物可用于合成长的多聚核苷酸。提供有助于提高逐步偶联收率的磷保护基团和/或提供可在氧化步骤过程中脱去的磷保护基团。提供可用于主题组合物和方法的脒核碱基保护基团,其可提供例如,增强的对多聚核苷酸合成过程中脱嘌呤作用的抵抗性。在一些情况下,本申请公开的方法和组合物在具有长度为200个或更多个单体单元的序列的多聚核苷酸的合成中利用磷保护基团和脒核碱基保护基团的组合。也提供了使用本申请提供的一种或多种化合物合成多聚核苷酸(例如,DNA)的方法。

Description

磷保护基团及其制备方法和用途
相关申请的交叉引用
依照35 U.S.C.§119(e),本申请要求2014年4月30日提交的美国临时申请序列号61/986,594的申请日的优先权,其公开内容通过参考并入本申请。
技术领域
本发明总地涉及核酸的合成。更特别地,本发明涉及新颖的磷保护基团和新颖的碱基保护基团以及用于合成DNA的有关化合物,以及其组合物和方法。
背景技术
寡聚核苷酸、DNA和RNA的合成链的化学合成是化学合成具有确定的化学结构和序列的相对短的核酸片段。该技术极其重要和有用,归因于在现有实验室实践中的广泛应用。寡聚核苷酸合成可快速廉价地得到定制的具有所需序列的寡聚核苷酸。寡聚核苷酸可用于分子生物和医药学中的众多应用,例如,反义寡核苷酸,小干扰RNA,DNA测序和扩增的引物,分子探针等。
寡聚核苷酸的化学合成通常以3'到5'的方向作为固相合成使用亚磷酰胺方法和亚磷酰胺构建模块进行,所述亚磷酰胺构建模块源自保护的2'-脱氧核苷(dA,dC,dG,和T)、核糖核苷(A,C,G,和U)、或化学修饰的核苷例如2-O-甲基、2’-F、LNA等。为合成寡聚核苷酸,将构建模块按所需顺序相继偶联于增长的寡聚核苷酸链。一旦完成链组装,将产物脱保护,从固相释放到溶液中,并收集。(美国专利4,415,732;McBride,et al.1983 TetrahedronLetters 24:245-248;Sinha,et al.1984 Nuc.Acids Res.12:4539-4557.)
用氰基乙基亚磷酰胺进行DNA合成已经可有效在固相载体上和在阵列合成上能够合成200节(mers)或更短的寡聚核苷酸。但是,现行可用的化学方法难以合成较长的寡聚核苷酸,已经发现这样的寡聚核苷酸在其序列中包含单碱基缺失(SBD)以及大片段缺失(缺失较长片段的寡聚核苷酸)。由于不足的逐步偶联收率,可能发生单碱基缺失,而大的寡聚核苷酸片段的缺失可能是由于在寡聚核苷酸合成过程中面临不断用苛性化学品处理而使磷酸三酯连接基不稳定所致。
因此,对于现有的合成法,不期望的副反应已经对合成的寡聚核苷酸的长度(至多约200个核苷酸残基)设置了实际限制,因为随着合成的寡聚核苷酸的长度增加,错误的数目会累积。(Beaucage,et al.1992"Advances in the Synthesis of Oligonucleotidesby the Phosphoramidite Approach"Tetrahedron 48(12):2223;see also,Caruthers,etal.1987“Synthesis of oligonucleotides using the phosphoramidite method”Biophosphates and their Analogues Synthesis,Structure,Metabolism andActivity,eds.K.S.Bruzik,W.J.Stec,Elsevier Sci.Publ.,3-21.)。因为所需序列中的错误更容易随着序列长度增加而增加,多于80个碱基(特别是,多于200个碱基)的序列通常需要通过高效液相色谱(HPLC)分离以提高纯度。此外,逐步收率或偶联效率可极大限制可以合成的寡聚核苷酸的长度。寡聚核苷酸的合成的总收率表示为OY=y(n-1);其中OY是总收率,y是逐步偶联收率,n是寡聚核苷酸的长度或寡聚核苷酸中核苷酸的数目;因此以99.7%偶联收率合成的200节的寡聚核苷酸将具有OY=y199,这等于OY=0.997199=0.54996或54.99%,而以99.8%偶联效率合成的200节的寡聚核苷酸将具有OY=0.671394或67.14%。逐步偶联收率会显著影响这种长寡聚核苷酸的总收率,这该实例中得以证明,其中逐步偶联收率的0.1%差异会导致OY改变12%。因此,对逐步偶联效率的任何改进将会极大地提高全长度寡聚核苷酸的OY,这是期望的。
在寡聚核苷酸的化学合成中仍存在较大的挑战。特别是,需要新颖的提高逐步偶联收率的磷保护基团和/或可在氧化步骤过程中脱去的磷保护基团,由此避免之前讨论的在寡聚核苷酸合成过程中磷酸三酯连接基不稳定。这是下述新颖方法的关键的未满足需求,所述方法能够可靠合成具有比通过常规技术制备的长度长的核酸分子,同时实现可接受的纯度和收率。
发明内容
本申请部分基于合成具有比通过常规技术制备的长度长的核酸分子、同时实现可接受的纯度和收率的新颖方法。本申请的各方面是利用磷和/或核碱基保护基团的方法和组合物,该方法和组合物可用于合成具有长度为200个或更多个单体单元的序列的长多聚核苷酸(例如,DNA)。
提供有助于提高逐步偶联收率的磷保护基团和/或提供可在氧化步骤过程中脱去的磷保护基团。提供可用于主题组合物和方法的脒核碱基保护基团,其可提供,增强的对多聚核苷酸合成过程中脱嘌呤作用的抵抗性,减少的核碱基脱保护时间,例如,在多聚核苷酸断裂过程中在氨水中的核碱基脱保护时间,以及提高的粗寡聚核苷酸的纯度同时具有较少的副产物,例如,核碱基加合物。在一些情况下,本申请公开的方法和组合物可在具有长度为200个或更多个单体单元的序列的多聚核苷酸的合成中利用磷保护基团和核碱基保护基团的组合。
一方面,本申请总地涉及具有结构式(I)的化合物:
其中B是核碱基或其类似物;R1和R2各自独立地为直链、支化或环状的、取代的或未取代的烷基,或者R1和R2共同形成5元、6元、7元或8元的非芳环;R3是酸不稳定的保护基团;以及R是选自苄醇衍生物、α-甲基芳基醇衍生物、萘醇衍生物、双环脂族醇衍生物或稠环、S-乙基硫代酸酯衍生物和氨基酸衍生物的基团,条件是R不是邻-甲基苄基。
另一方面,本申请总地涉及使用本申请公开的一种或多种化合物合成多聚核苷酸(例如,DNA)的方法,其中合成的DNA具有至少约200个核苷酸的长度。
附图说明
图1显示使用1-(4-溴苯基)乙醇作为磷保护基团合成的dT20的TIC和HPLC色谱图和质谱分析。
图2显示使用1-甲氧基-2-萘甲醇作为磷保护基团合成的dT20的TIC和HPLC色谱图和质谱分析。
图3显示使用2-萘甲醇作为磷保护基团使用2-氨基甲酰基-2-氰基乙烯-1,1-二硫醇盐处理合成的dT20的TIC和HPLC色谱图和质谱分析。
图4显示使用6-溴-2-萘甲醇作为磷保护基团使用2-氨基甲酰基-2-氰基乙烯-1,1-二硫醇盐处理合成的dT20的TIC和HPLC色谱图和质谱分析。
图5显示使用1-羟基茚满-5-甲腈作为磷保护基团合成的dT20的TIC和HPLC色谱图和质谱分析。
图6显示使用4-氰基苄醇作为磷保护基团使用2-氨基甲酰基-2-氰基乙烯-1,1-二硫醇盐处理合成的dT20的TIC和HPLC色谱图和质谱分析。
图7显示使用3-氰基苄醇作为磷保护基团使用2-氨基甲酰基-2-氰基乙烯-1,1-二硫醇盐处理合成的dT20的TIC和HPLC色谱图和质谱分析。
图8显示使用2-乙炔基苄醇作为磷保护基团使用2-氨基甲酰基-2-氰基乙烯-1,1-二硫醇盐处理合成的dT20的TIC和HPLC色谱图和质谱分析。
图9显示使用乙酰基-L-苏氨酸甲酯作为磷保护基团合成的dT20的TIC和HPLC色谱图和质谱分析。
图10显示使用S-乙基硫代苯甲酸酯作为磷保护基团合成的dT20的TIC和HPLC色谱图和质谱分析。
图11显示使用4-氰基苄醇作为磷保护基团使用2-氨基甲酰基-2-氰基乙烯-1,1-二硫醇盐处理合成的dT20的TIC和HPLC色谱图和质谱分析。
图12显示使用乙酰基-L-苏氨酸甲酯作为磷保护基团合成的dT20的TIC和HPLC色谱图和质谱分析。
图13显示使用S-乙基硫代苯甲酸酯作为磷保护基团合成的dT20的TIC和HPLC色谱图和质谱分析。
图14显示使用S-乙基硫代苯甲酸酯作为磷保护基团合成的T60和使用标准2-氰基乙基亚磷酰胺合成的T60的TIC和HPLC色谱图和质谱分析的比较。
图15描述用于合成所选且显示于图1至图14的寡聚核苷酸的待研究的亚磷酰胺化合物(22-31)的结构。
图16显示用腺苷的氨基N-6上的标准苯甲酰基保护基团合成的d(AAT)20 60节的寡聚核苷酸的HPLC色谱图。
图17显示分别用腺苷的氨基N-6上的N6-(N,N-二甲基脒基)保护基团(上)和N6-(1-(吗啉代)乙叉)-dA(下)合成的d(AAT)20 60节的寡聚核苷酸的两个HPLC色谱图。
图18显示分别用N4乙酰基dC标准保护基团(上)和N4-(N-甲基-2-吡咯烷基叉)-dC(下)合成的(CCT)19C3 60节的寡聚核苷酸的两个HPLC色谱图。
图19显示用N4-(1-(吗啉代)乙叉)-dC合成的dC40的HPLC色谱图。
图20显示用标准N2-(异丁酰基)-dG合成的d(GGT)20 60节的寡聚核苷酸的HPLC色谱图。
图21显示分别用N2-(N,N-二甲基脒基)dG(上)和N2-(1-(吗啉代)乙叉)-dG(下)合成的d(GGT)20 60节的寡聚核苷酸的两个HPLC色谱图。
图22显示用标准保护基团和脒保护基团合成的60节的寡聚核苷酸的4个对比TIC色谱图。当使用脒保护基团时,碱基加合物的减少是显著的。
图23显示用N6-(N,N-二甲基脒基)-dA-3’O-S-(乙基)硫代苯甲酸酯亚磷酰胺合成的d(AAT)13 39节的寡聚核苷酸的HPLC色谱图。
图24显示分别用标准核碱基保护基团(上)和脒保护基团(下)合成的两个100节的寡聚核苷酸的两个对比HPLC色谱图。
图25描述使用3’-S-(乙基)硫代苯甲酸酯亚磷酰胺,和N6-(N,N-二甲基脒基)dA(化合物16,17,18,20)在阵列上合成的200节的寡聚核苷酸的变性聚丙烯酰胺凝胶电泳。
定义
以下更详细地描述具体官能团和化学术语的定义。有机化学、以及具体官能团和反应性的一般原则描述于“Organic Chemistry”,Thomas Sorrell,University ScienceBooks,Sausalito:1999。
本申请的某些化合物可以按特定的几何异构或立体异构形式存在。本申请涉及落入本申请范围内的所有这些化合物,包括顺式异构体和反式异构体,R-对映异构体和S-对映异构体,非对映异构体,(D)-异构体,(L)-异构体,其外消旋混合物,及其其它混合物。另外的不对称碳原子可以存在于取代基例如烷基中。本申请意在包括所有这样的异构体、以及其混合物。
根据本申请可以使用包含多种异构体比率的任一种的异构体混合物。例如,当仅将两种异构体组合时,本申请可以使用包含50:50、60:40、70:30、80:20、90:10、95:5、96:4、97:3、98:2、99:1、或100:0异构体比率的混合物。本领域技术人员容易认识到,对于更复杂的异构体混合物,可以使用类似的比率。
如果例如需要本申请的化合物的特定对映异构体,其可以通过不对称合成、或通过用手性助剂进行衍生化制备,在所述衍生化中将所得非对映异构体混合物分离并使辅助基团断裂从而得到纯的所需对映异构体。或者,当分子包含碱性官能团例如氨基或酸性官能团例如羧基时,用适当的光学活性酸或碱形成非对映异构体的盐,然后通过本领域公知的分级结晶或色谱方法拆分由此形成的非对映异构体,随后回收纯的对映异构体。
得益于本申请的益处,本领域技术人员可以知晓,本申请所述的合成方法可以利用多种保护基团。本申请使用的术语“保护基团”表示,特定的官能部分例如O、S、或N被临时阻碍,由此可以在多官能化合物中的另一个反应位点选择性地进行反应。在优选的实施方式中,保护基团以良好的收率选择性地反应,从而得到对预设反应稳定的保护的底物;保护基团应该可以良好的收率通过优选的不会攻击其它官能团的易得的无毒性试剂选择性地脱去;保护基团形成可容易分离的衍生物(更优选地不会产生新的立体异构中心);保护基团具有最小限度的另外的功能以避免产生其它反应位点。可以使用氧、硫、氮、和碳保护基团。多种保护基团的实例可见Protective Groups in Organic Synthesis,ThirdEd.Greene,T.W.and Wuts,P.G.,Eds.,John Wiley &Sons,New York:1999。
本申请使用的核酸化学、生物化学、遗传学、和分子生物学的术语和符号遵循本领域的标准专著和教科书的那些,例如,Kornberg and Baker,DNA Replication,第二版(W.H.Freeman,New York,1992);Lehninger,Biochemistry,第二版(Worth Publishers,New York,1975);Strachan and Read,Human Molecular Genetics,第二版(Wiley-Liss,New York,1999);Eckstein,editor,Oligonucleotides and Analogs:A PracticalApproach(Oxford University Press,New York,1991);Gait,editor,OligonucleotideSynthesis:A Practical Approach (IRL Press,Oxford,1984);Sambrook et al.,Molecular Cloning:A Laboratory Manual,第二版(Cold Spring Harbor Laboratory,1989)等。另外,为了便于清楚和易于参考,以下定义了某些术语。
应该知道,本申请所述的化合物可以取代有任何数目的取代基或官能部分。
本申请使用的术语"核苷酸"或"核苷酸部分"是指核酸(不管是DNA还是RNA还是其类似物)的亚单元(其包括磷酸酯基团、糖基和杂环碱基)以及这样的亚单元的类似物。其它基团(例如,保护基团)可以连接于核苷酸的任何组分。
本申请使用的术语"核苷"或"核苷部分"是指包括糖基和杂环碱基的核酸亚单元以及这样的亚单元的类似物。其它基团(例如,保护基团)可以连接于核苷的任何组分。
本申请使用的术语"核苷"和"核苷酸"意在包括下述那些部分,所述部分不仅包含已知的嘌呤和嘧啶碱基例如腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)、鸟嘌呤(G)、或尿嘧啶(U),而且包含已经修饰的其它杂环碱基。这样的修饰包括甲基化的嘌呤或嘧啶,烷基化的嘌呤或嘧啶,酰化的嘌呤或嘧啶,卤化的嘌呤或嘧啶,脱氮嘌呤,烷基化的核糖或其它杂环。这样的修饰包括,例如,二氨基嘌呤及其衍生物,次黄嘌呤及其衍生物,烷基化的嘌呤或嘧啶,酰化的嘌呤或嘧啶,硫醇化的嘌呤或嘧啶等,或添加保护基团如乙酰基、二氟乙酰基、三氟乙酰基、异丁酰基、苯甲酰基、9-芴基甲氧基羰基、苯氧基乙酰基、和取代的苯氧基乙酰基、二甲基甲脒、二丁基甲脒、吡咯烷代脒(pyrrolodinoamidine)、吗啉代脒、和其它脒衍生物、N,N-二苯基氨基甲酸酯等。嘌呤或嘧啶碱基也可以是前述的类似物;适宜的类似物是本领域技术人员已知的并且描述于有关的教科书和文献中。常见类似物包括但不限于,7-脱氮腺嘌呤,1-甲基腺嘌呤,2-甲基腺嘌呤,N6-甲基腺嘌呤,N6-异戊基腺嘌呤,2-甲硫基-N6-异戊基腺嘌呤,N,N-二甲基腺嘌呤,8-溴腺嘌呤,2-巯基胞嘧啶,3-甲基胞嘧啶,5-甲基胞嘧啶,5-乙基胞嘧啶,4-乙酰基胞嘧啶,1-甲基鸟嘌呤,2-甲基鸟嘌呤,7-甲基鸟嘌呤,2,2-二甲基鸟嘌呤,8-溴鸟嘌呤,8-氯鸟嘌呤,8-氨基鸟嘌呤,8-甲基鸟嘌呤,8-巯基鸟嘌呤,5-氟尿嘧啶,5-溴尿嘧啶,5-氯尿嘧啶,5-碘尿嘧啶,5-乙基尿嘧啶,5-丙基尿嘧啶,5-甲氧基尿嘧啶,5-羟基甲基尿嘧啶,5-(甲酸基羟基甲基)尿嘧啶,5-(甲基氨基甲基)尿嘧啶,5-(甲酸基甲基氨基甲基)-尿嘧啶,2-巯基尿嘧啶,5-甲基-2-巯基尿嘧啶,5-(2-溴乙烯基)尿嘧啶,尿嘧啶-5-氧基乙酸,尿嘧啶-5-氧基乙酸甲酯,假尿嘧啶,1-甲基假尿嘧啶,Q核苷(queosine),次黄苷,1-甲基次黄苷,次黄嘌呤,黄嘌呤,2-氨基嘌呤,6-羟基氨基嘌呤,6-硫代嘌呤和2,6-二氨基嘌呤。
"核碱基"是指核苷或核苷酸的杂环碱基。
另外,术语"核苷"和"核苷酸"包括不仅包含常规核糖和脱氧核糖、而且也包括其它糖的那些部分。修饰的核苷或核苷酸也包括糖部分上的修饰,例如,其中羟基的一个或多个由卤素原子或脂族基团替代(包括称为LNA的锁核酸和称为LNA的未锁核酸)、由2’-氟、2’-O-烷基、2’-O-乙氧基甲氧基替代,或者官能化为醚、胺等。
本申请使用的术语"类似物"是指具有特征在文献中承认为模拟物、衍生物的结构、具有类似结构、或其它类似术语的分子,并且包括,例如,结合了非天然(不是自然界经常出现的)核苷酸、非天然核苷酸模拟物例如2'-修饰的核苷、肽核酸、低聚核苷膦酸酯的多聚核苷酸,以及具有添加的取代基例如保护基团或连接基团的任何多聚核苷酸。
本申请使用的术语“核酸”是指下述具有任何长度(例如,大于约2个碱基,大于约10个碱基,大于约100个碱基,大于约500个碱基,大于1,000个碱基,至多约10,000个或更多个碱基)的由核苷酸如脱氧核糖核苷酸、核糖核苷酸构成的聚合物,并且可以用酶法或合成法制备(例如,PNA,如描述于美国专利5,948,902和其中引用的参考文献),其可以与天然存在的核酸按与两种天然存在的核苷酸相似的序列特异性方式杂交,例如,可以形成沃森-克里克碱基配对相互作用。天然存在的核苷酸包括鸟苷和2’-脱氧鸟苷,胞苷和2’-脱氧胞苷,腺苷和2’-脱氧腺苷,胸苷和尿苷(分别为G,dG,C,dC,A,dA以及T,U)。
核酸可以按单链形式或双链形式存在。双链核酸具有两个互补的核酸链,可以在本申请称为“第一”链和“第二”链或一些其它的任意名称。第一链和第二链是不同的分子,将一个链指认为第一链还是第二链是随意的,不暗示任何特定的取向、功能或结构。几种示例性哺乳动物染色体区域(例如,BACs,组装,染色体等)、以及很多病原体的第一链的核苷酸序列是已知的,并且可见例如NCBI的Genbank数据库。一个区域的第二链与该区域互补。
本申请使用的术语“寡聚核苷酸”是指核苷酸的单链多聚体,尤其是约2至500个核苷酸。寡聚核苷酸可以是合成的或者可以用酶法制备,在一些实施方式中,其长度为10至50个核苷酸。寡聚核苷酸可以包含核糖核苷酸单体(即,可以是寡聚核糖核苷酸)或脱氧核糖核苷酸单体。寡聚核苷酸在长度上尤其可以包含,例如,10至20个、21至30个、31至40个、41至50个、51至60个、61至70个、71至80个、80至100个、100至150个、150至500或大于500个核苷酸。
本申请使用的术语“脱氧核糖核酸”和"DNA"是指由核苷酸和/或脱氧核糖核苷酸构成的核酸。
本申请使用的术语“核糖核酸”和“RNA”是指由核苷酸和/或核糖核苷酸构成的核酸。
"核苷酸间键"或"核苷酸键"是指两个核苷部分之间的化学键合,例如自然中发现的核酸中的磷酸二酯键,或核酸和核酸类似物的合成领域公知的键合。核苷酸间键可以包括磷酸基或亚磷酸基,并且可以包括其中磷酸基或亚磷酸基的一个或多个氧原子由取代基或保护基团修饰或由另一个原子如硫原子或单烷基氨基或二烷基氨基的氮原子替代的键合。
本申请使用的术语"杂环"、"杂环的"、"杂环基团"或"杂环"是指在至少一个含碳原子的环中具有至少一个杂原子的完全饱和的或部分不饱和或完全不饱和的环状基团,所述含碳原子的环包括芳环("杂芳基")或非芳环(例如,3至13元单环环系,7至17元双环环系,或10至20元三环环系)。含杂原子的杂环基团的每个环可以具有1个、2个、3个、或4个选自氮原子、氧原子和/或硫原子的杂原子,其中氮和硫杂原子可以任选被氧化且氮杂原子可以任选被季铵化。杂环基团可以连接在环或环系的任何杂原子或碳原子上。多环杂环的环可以稠合,桥接和/或通过一个或多个螺接连接。含氮碱基是杂环的实例。其它实例包括哌啶基,吗啉基和吡咯烷基。
术语"吸电子基团"是指倾向于从相邻原子吸引价电子的部分(即,取代基相对于相邻原子是电负性的)。吸电子能力的水平量化由Hammett sigma常数给出。这一公知的常数描述于很多参考文献,例如,March,Advanced Organic Chemistry 251-59,McGraw HillBook Company,New York,(1977)。吸电子基团包括硝基,酰基,甲酰基,磺酰基,三氟甲基,氰基,氯等。
术语"供电子基团"是指倾向于排斥来自相邻原子的价电子的部分(即,取代基相对于相邻原子是电负性较小的)。供电子基团包括氨基,甲氧基,烷基(包括可具有直链或支化结构的C1-6烷基),C4-9环烷基等。
本申请使用的短语"保护基团"是指一种物类,其防止分子的一部分进行特定的化学反应,但是在反应完成之后可从分子脱去。"保护基团"在传统化学含义中用作使官能团在所需反应的某些条件下可逆地无反应性的基团,例如教导于Greene,et al.,"Protective Groups in Organic Synthesis,"John Wiley and Sons,第二版,1991。在所需反应之后,保护基团可以脱去以将保护的官能团脱保护。所有的保护基团应该在不会降解显著比例的待合成分子的条件下可脱去(因此不稳定)。与保护基团相反,"封端基团"永久地结合于分子链段以防止该链段发生任何进一步的化学转化。应该注意,由保护基团保护的官能团可以是或可以不是称为保护基团的基团的一部分。
本申请使用的术语"羟基保护基团"或"O-保护基团"是指其中保护的基团是羟基的保护基团。"反应活性位点羟基"是在3'-5'多聚核苷酸合成过程中的末端5'-羟基,或者在5'-3'多聚核苷酸合成过程中的3'-羟基。"自由反应活性位点羟基"是在多聚核苷酸合成过程中可以反应以形成核苷酸间键(例如,具有亚磷酰胺官能团)的反应活性位点羟基。
本申请使用的术语"烷基"是指具有(例如,具有1至24个,通常为1至12个)碳原子的饱和直链、支化或环状的烃基,例如甲基,乙基,正丙基,异丙基,正丁基,异丁基,叔丁基,戊基,环戊基,异戊基,新戊基,己基,异己基,环己基,3-甲基戊基,2,2-二甲基丁基,和2,3-二甲基丁基。烷基包括"环烷基",环烷基是指环状烷基,例如环丙基,环丁基,环戊基,环己基,环庚基和环辛基。
除非另有说明,否则本申请使用的术语"烯基"是指包含至少一个双键的具有2至24个碳原子、通常为2至12个碳原子的支化、非支化或环状(例如在C5和C6的情况下)烃基,例如乙烯基,乙烯基,烯丙基,辛烯基,癸烯基等。术语"低级烯基"表示具有2至8个碳原子的烯基,具体包括乙烯基和烯丙基。术语"环烯基"是指环状烯基。
除非另有说明,否则本申请使用的术语"炔基"是指包含至少一个三键的具有2至24个碳原子、通常为2至12个碳原子的支化或非支化烃基,例如乙炔基,乙炔基,正丙炔基,异丙炔基,正丁炔基,异丁炔基,叔丁炔基,辛炔基,癸炔基等。术语"低级炔基"表示具有2至8个碳原子的炔基,并且包括例如乙炔基和丙炔基,术语"环炔基"是指环状炔基。
本申请使用的术语"烃基"是指烷基,烯基或炔基。除非另有说明,否则术语烃基通常包括"取代的烃基",取代的烃基是指具有替代烃主链的一个或多个碳上的氢的取代基的烃基部分。这样的取代基可以包括,例如,羟基、卤素、羰基(例如羧基,烷氧羰基,甲酰基,或酰基)、硫代羰基(例如硫酯,硫代乙酸酯,或硫代甲酸酯)、烷氧基、磷酰基、膦酸酯基、亚膦酸酯基、氨基、酰胺基、脒、亚胺、氰基、硝基、叠氮基、巯基、烷基硫基、硫酸酯基、磺酸酯基、氨磺酰基、磺酰氨基、磺酰基、杂环基、芳烷基、或芳族或杂芳族部分。本领域技术人员应理解,如果适当,烃链上取代的部分可以本身是取代的。例如,取代的烷基的取代基可以包括取代和未取代形式的氨基、叠氮基、亚胺基、酰胺基、磷酰基(包括膦酸酯基和亚膦酸酯基)、磺酰基(包括硫酸酯基,磺酰氨基,氨磺酰基和磺酸酯基)、和甲硅烷基,以及醚、烷基硫基、羰基(包括酮,醛,羧酸酯,和酯)、-CN等。环烷基可以进一步取代有烷基,烯基,烷氧基,烷基硫基,氨基烷基,羰基取代的烷基,-CN等。
术语"烷氧基"或“烷基氧基”表示连接于氧的烷基并且可以由式:R-O-表示,其中R表示烷基。一个实例是甲氧基CH3O-。
术语"芳基"是指可以包括尤其是0至4个杂原子的5元、6元、和7元单环或多环芳族基团,例如,苯,吡咯,呋喃,噻吩,咪唑,唑,噻唑,三唑,吡唑,吡啶,吡嗪,哒嗪和嘧啶等。在环结构中具有杂原子的那些芳基也可以称为"芳基杂环"或"杂芳族基团"。术语"芳基"也包括具有两个或更多个环状环的多环环系,其中两个或更多个碳是两个邻接环(该环是"稠环")所共用的,其中该环的至少一个是芳族的(例如,其它环状环可以是环烷基,环烯基,环炔基,芳基,和/或杂环)。稠环芳基的实例是萘。"低级芳基"包含至多18个碳原子,例如至多14个、12个、10个、8个或6个碳原子。
芳环可以在一个或多个环位置取代有以上针对取代的烃基所描述的这样的取代基,例如,卤素,叠氮基,烷基,芳烷基,烯基,炔基,环烷基,羟基,烷氧基,氨基,硝基,巯基,亚胺基,酰胺基,膦酸酯基,亚膦酸酯基,羰基,羧基,甲硅烷基,醚,烷基硫基,磺酰基,磺酰氨基,酮,醛,酯,杂环部分,芳族或杂芳族部分,-CF3,-CN等。
本申请使用的术语"卤素"是指氟,氯,溴,或碘。
本申请使用的"连接基"是指键接于两个其它部分的第一部分,其中所述两个其它部分经第一部分连接。典型的连接基包括醚(-O-),氧代(-C(O)-),氨基(-NH-),酰胺基(-N-C(O)-),硫基(-S-),磷基(-P-),酯(-O-C(O)-)。
本申请使用的术语"官能化的"是指一种方法,通过该方法将一种物料修饰以具有结合于该物料的特定部分,例如,将分子或底物修饰以具有特定部分;已经由此修饰的物料(例如分子或载体)称为官能化的物料(例如,官能化的分子或官能化的载体)。
用于描述化学结构、基团、或部分的术语"取代的"是指包含一个或多个取代基的结构、基团、或部分。如本申请使用,在其中第一基团"取代有"第二基团的情况下,第二基团连接于第一基团,由此第一基团的部分(通常是氢)由第二基团替代。例如,当烷基具有“R”基团且R是氢时,认为烷基在标记位置是未取代的,而当氢由卤素替代时,认为其在该位置由卤素取代。
本申请使用的术语"取代基"是指替代化学结构中另一基团的基团。典型的取代基包括非氢原子(例如卤素),官能团(例如但不限于氨基,巯基,羰基,羟基,烷氧基,羧基,甲硅烷基,甲硅烷氧基,磷酸酯基团等),烃基,和取代有一个或多个杂原子的烃基。示例性的取代基包括烷基,低级烷基,芳基,芳烷基,低级烷氧基,硫代烷基,羟基,硫基,巯基,氨基,亚胺基,卤素,氰基,硝基,亚硝基,叠氮基,羧基,硫醚,砜,亚砜,磷酰基,甲硅烷基,甲硅烷氧基,硼基,和修饰的低级烷基。
"任选的"或"任选地"表示后面所述的情形可能发生或可能不发生,由此叙述中包含情形发生以及不发生的实例。例如,短语"任选取代的"表示非氢取代基可能存在或可能不存在,并且因此,叙述中包含其中非氢取代基存在以及不存在的结构。在本申请的各个方面,可以将一个部分描述为存在0次或多次:这等同于为任选的部分,并且包括其中该部分存在以及不存在的实施方式。如果任选的部分不存在(在结构中存在0次),描述为通过任选的部分连接的邻近基团则为彼此直接相连。类似地,可以将一个部分描述为(1)连接两个邻近基团的基团,或(2)连接两个邻近基团的键。叙述(1)和(2)等同于为任选的部分,并且包括该部分存在以及不存在的实施方式。如果任选的部分不存在(在结构中存在0次),描述为通过任选的部分连接的邻近基团则为彼此直接相连。
"分离的"或"纯化的"通常是指对一种物质(化合物,多聚核苷酸,蛋白质,多肽,多肽,染色体等)的分离,使得该物质占其所停留在其中的样品(不包括溶剂)的显著份额,即,该份额大于所述物质通常在其天然状态或未分离状态中所发现的存在份额。通常,显著份额的样品占样品(不包括溶剂)的至少约1%、至少约5%、至少约10%、至少约20%、至少约30%、至少约50%优选至少约80%、或更优选至少约90%。例如,分离的RNA的样品将通常占总RNA的至少约5%,其中百分比在本文上下文中计算为总RNA的质量(例如以微克计)除以(样品(不包括溶剂)中的总RNA+其它组分)的总和的质量(例如以微克计)。纯化有用的多聚核苷酸和多肽的技术是本领域公知的并且包括,例如,凝胶电泳法,离子交换色谱法,亲和色谱法,流式分选,以及根据密度沉降。在一些实施方式中,核苷酸组合物中的一种或多种呈分离形式。
如本申请使用,(Cx-Cy)总地表示具有从x到y(包括端点)个碳原子的基团。因此,例如,C1-C6是指具有1个、2个、3个、4个、5个、或6个碳原子的基团,其包括C1-C2,C1-C3,C1-C4,C1-C5,C2-C3,C2-C4,C2-C5,C2-C6,以及所有类似组合。(C1-C20)等类似地包括1至20(包括端点)个碳原子之间的各种组合,例如(C1-C6),(C1-C12)和(C3-C12)。
本申请使用的术语“共价的”或“共价地”是指原子间化学键接相互作用的性质。共价键是涉及原子间共用电子对的化学键接。当原子共用电子时它们之间的引力和斥力的稳定平衡称为共价键接。共用电子使得每个电子可获得等效的全部外电子层,符合稳定的电子组态。共价键接包括各种类型的相互作用,例如,σ-键接,π-键接,金属与金属的键接,不可知的相互作用,以及三中心两电子键。
本申请使用的术语“非共价的”或“非共价地”是指原子间化学键接相互作用的性质。非共价键是不涉及共用电子对、而是涉及更多变的静电作用的化学键接的类型。有四种常提及的非共价相互作用类型:氢键,离子键,范德华力,和疏水作用。
本申请使用的术语“纯化的”或“为纯化”是指从样品中除去组分(例如,污染物)。
具体实施方式
本申请提供可靠合成具有比通过常规技术制备的长度长的核酸分子、同时实现可接受的纯度和收率的新颖方法。本申请的各方面是利用磷和/或核碱基保护基团的方法和组合物,该方法和组合物可用于合成具有长度为200个或更多个单体单元的序列的长多聚核苷酸(例如,DNA)。
提供有助于提高逐步偶联收率的磷保护基团和/或提供可在氧化步骤过程中脱去的磷保护基团。提供可用于主题组合物和方法的脒核碱基保护基团,其可提供,增强的对多聚核苷酸合成过程中脱嘌呤作用的抵抗性,减少的核碱基脱保护时间,例如,在多聚核苷酸断裂过程中在氨水中的核碱基脱保护时间,以及提高的粗寡聚核苷酸的纯度同时具有较少的副产物,例如,核碱基加合物。在一些情况下,本申请公开的方法和组合物可在具有长度为200个或更多个单体单元的序列的多聚核苷酸的合成中利用磷保护基团和核碱基保护基团的组合。
本申请的方面包括新颖的磷保护基团,其可在碘氧化过程中脱去,使得核苷酸间键合较不易受下一氧化循环过程中发生的水解反应的影响(参见例如,以下图示)。该新颖方法可得到具有较少大缺失的寡聚核苷酸。
在核苷酸间键合上使用本申请的保护基团也可提供提高亚磷酰胺偶联效率的优势。最常用于固相亚磷酰胺DNA合成的磷保护基团是氰基乙基保护基团。(Letsinger,etal.1969 J.Am.Chem.Soc.91(12),3360-5)。该保护基团在下述相同条件下通过β-消除反应脱去,在所述条件下杂碱基(heterobase)保护基团在合成结束时用氨水或烷基胺脱去,如以下方案描述:
本发明的进一步的方面是设计使可能在现有氰基乙基亚磷酰胺化学的实践中发生的磷酸三酯核苷酸间键合水解最小化的磷保护基团。相反,在碘氧化过程中,磷酸三酯核苷酸间中间体通过保护基团的断裂转化为对水解稳定的磷酸二酯核苷酸间键接。磷保护基团的断裂可能是不完全的,例如,多达50%但仍可以对防止核苷酸间键接的水解具有显著影响。优选的是,断裂大于50%,更优选的是,其接近100%。本申请的进一步的方面是下述保护基团,其在碘氧化过程中以50%至100%断裂,然后在寡聚核苷酸合成结束时通过使用例如巯基试剂或其衍生物进行亲核攻击或通过使用进行碱或碱性胺进行β-消除或α裂解或组合而完全断裂。
本申请的另一方面是将碱加入到碘氧化溶液中以促进和增加氧化步骤过程中磷保护基团的断裂。这样的碱的实例包括叔丁胺,二异丙胺,二乙胺,三乙胺,二异丙基乙基胺,DBU和其它非亲核性碱。
一方面,本申请总地涉及具有结构式(I)的化合物:
其中
B是核碱基或其类似物;
R1和R2各自独立地为直链、支化或环状的、取代的或未取代的烷基,或者R1和R2共同形成5元、6元、7元或8元的非芳环;
R3是酸不稳定的保护基团;以及
R是选自苄醇衍生物(除了邻-甲基苄基)、α-甲基芳基醇衍生物、萘醇衍生物、双环脂族醇衍生物、酰基硫烷基醇衍生物、S-乙基硫代酸酯衍生物和氨基酸衍生物的磷保护基团。
在一些实施方式中,B是核碱基或保护的核碱基,其中核碱基选自腺嘌呤,鸟嘌呤,胸腺嘧啶,胞嘧啶和尿嘧啶,或其衍生物或类似物。
腺嘌呤
鸟嘌呤
胸腺嘧啶
胞嘧啶
尿嘧啶
任何适当的保护基团可以用于主题化合物。在一些实施方式中,B是保护的核碱基。在某些实施方式中,核碱基可以是常规的嘌呤或嘧啶碱基,例如,腺嘌呤(A),胸腺嘧啶(T),胞嘧啶(C),鸟嘌呤(G)或尿嘧啶(U),或其保护的形式,例如,其中碱基用保护基团保护,所述保护基团例如为乙酰基,二氟乙酰基,三氟乙酰基,异丁酰基,苯甲酰基,苯氧基乙酰基,4-(叔丁基)苯氧基乙酰基等。在某些实施方式中,核碱基包括脒保护基团(例如,如本申请所述的)。
嘌呤或嘧啶碱基也可以是前述的类似物;适宜的类似物包括但不限于:1-甲基腺嘌呤,2-甲基腺嘌呤,N6-甲基腺嘌呤,N6-异戊基腺嘌呤,2-甲硫基-N6-异戊基腺嘌呤,N,N-二甲基腺嘌呤,8-溴腺嘌呤,2-巯基胞嘧啶,3-甲基胞嘧啶,5-甲基胞嘧啶,5-乙基胞嘧啶,4-乙酰基胞嘧啶,1-甲基鸟嘌呤,2-甲基鸟嘌呤,7-甲基鸟嘌呤,2,2-二甲基鸟嘌呤,8-溴鸟嘌呤,8-氯鸟嘌呤,8-氨基鸟嘌呤,8-甲基鸟嘌呤,8-巯基鸟嘌呤,5-氟尿嘧啶,5-溴尿嘧啶,5-氯尿嘧啶,5-碘尿嘧啶,5-乙基尿嘧啶,5-丙基尿嘧啶,5-甲氧基尿嘧啶,5-羟基甲基尿嘧啶,5-(甲酸基羟基甲基)尿嘧啶,5-(甲基氨基甲基)尿嘧啶,5-(甲酸基甲基氨基甲基)-尿嘧啶,2-巯基尿嘧啶,5-甲基-2-巯基尿嘧啶,5-(2-溴乙烯基)尿嘧啶,尿嘧啶-5-氧基乙酸,尿嘧啶-5-氧基乙酸甲酯,假尿嘧啶,1-甲基假尿嘧啶,Q核苷(queosine),次黄苷,1-甲基次黄苷,次黄嘌呤,黄嘌呤,2-氨基嘌呤,6-羟基氨基嘌呤,6-巯基嘌呤和2,6-二氨基嘌呤。
R1和R2可以相同或不同。R1和R2可以都是直链的烷基、都是支化或环状的烷基,或者是混合的烷基。R1和R2可以都是未取代的烷基,或者两者之一是取代的烷基,或者两者都是取代的烷基。
在一些情况中,R1和R2可以是5元、6元、7元或8元环结构(如下所示的环Q)例如非芳环的组分或共同形成5元、6元、7元或8元环结构(如下所示的环Q)例如非芳环。
在某些实施方式中,R1和R2各自独立地为直链、支化或环状的、取代的或未取代的C1-C18烷基。在某些实施方式中,R1和R2各自独立地为直链或支化的未取代的C1-C6烷基。在某些实施方式中,R1和R2各自独立地为直链C1-C3烷基(即,甲基,乙基和丙基)。在某些实施方式中,R1和R2各自独立地为支化C3-C6烷基。例如,在式(Ia)的化合物中,R1和R2可以各自是异丙基,如式(Ia)中所示,或异丁基。
在某些实施方式中,环Q是5元或6元非芳环,其中该环的主链中具有0或1个杂原子。在某些实施方式中,环Q是主链中具有0个杂原子的5元非芳环。在某些实施方式中,环Q是5元非芳环取代的或未取代的环烷基环。
结构式(Ib)显示其中Q是5元非芳环的示例性实施方式。R4可以是任何适宜的基团,例如,各自独立地选自氢,卤素,C1-C6烷基和C1-C6烷氧基。
在某些实施方式中,R4是氢(即,未取代的环Q),且结构如式(Ic)所示
在一些情况中,R3是酸不稳定的保护基团。有用的R3基团的实例包括但不限于,(4,4'-二甲氧基三苯甲基)(DMT),MMT(单甲氧基三苯甲基),三甲氧基三苯甲基,9-苯基黄嘌呤-9-基(9-苯基吨基)和特戊酰基。(Fisher,et al.1983 Nucleic Acids Res.11,1589-1599.)
在一些情况中,R是选自苄醇衍生物(除了邻-甲基苄基)、α-甲基芳基醇衍生物、萘醇衍生物、双环脂族醇衍生物、酰基硫烷基醇衍生物和氨基酸衍生物的基团。在某些情况中,R是S-(乙基)硫代苯甲酸酯。
酰基硫烷基醇衍生物包括连接于烷基的酰化硫醇基团(例如,R-C(=O)S-烷基-,其中R是烃基,芳基或杂芳基)。在某些情况中,酰基硫烷基醇衍生物的烷基是乙基。本申请使用的术语“S-乙基硫代酸酯”和“酰基硫乙基”可互换使用。在一些实施方式中,酰基硫烷基醇衍生物是S-硫代酸乙酯衍生物。在某些情况中,酰基硫烷基醇衍生物是S-(乙基)硫代苯甲酸酯。在某些实施方式中,本申请的化合物具有结构式(Id):
其中R7各自独立地选自氢,卤素,烃基(例如,C1-C6烷基,C2-C6烯基,C2-C6炔基)和烷氧基。
在某些实施方式中,本申请的化合物具有结构式(Ie):
其中R7各自独立地选自氢,卤素,烃基(例如,C1-C6烷基,C2-C6烯基,C2-C6炔基)和烷氧基。
在某些实施方式中,本申请的化合物具有结构式(If):
其中R8是脂族基团。
在某些实施方式中,R(在以上式(Ia-c)中)是具有结构式(II)的苄醇的衍生物(除了邻-甲基苄基):
其中Ra是氢,或烷基;R11各自独立地为氢,烷基,烷氧基,烷基-S-,氰基,甲基氰基或卤素;且n为1、2、或3。在其中Ra为氢的式(II)的一些实施方式中,R11不是邻位的甲基。
R可以选自其中的示例性组包括苄醇的衍生物,例如:
其中R6各自独立地选自氢,卤素,氰基,甲基氰基,和烃基(例如,C1-C6烷基,C2-C6烯基,C2-C6炔基)。
特别地,R可以源自其中的示例性组包括:
其中R9选自氢,卤素,氰基,氰基乙基,C1-C6烷基,C1-C6烷氧基,硝基和其它吸电子基团,R7是一个或多个独立选自氢、卤素、烃基(例如,C1-C6烷基,C2-C6烯基,C2-C6炔基)、烷氧基和吸电子基团的取代基。
在一些实施方式中,R由下述结构描述:
其中R7是一个或多个各自独立选自氢、卤素、烃基(例如,C1-C6烷基,C2-C6烯基,C2-C6炔基)、烷氧基和吸电子基团的取代基。
在某些实施方式中,R由下述结构描述:
其中R9选自氢,卤素,氰基,氰基乙基,C1-C6烷基,C1-C6烷氧基,硝基和吸电子基团。
R可以源自其中的示例性组也包括具有结构式(III)的α-甲基芳基醇衍生物:
其中X是氢,卤素,氰基或三氟甲基;Y是氢,烷基,卤代烷基或烷氧基烷基;Ra是氢或烷基。在式(III)的一些实施方式中,X和Y不同时为氢,且当Ra和X都为氢时,Y不是甲基。示例性的R基团包括
其中R9是卤素,氰基,或三氟甲基;且R10选自氢,卤素,C1-C6烷基,C1-C6烷氧基,硝基和其它吸电子基团。
R也可以源自具有结构式(IV)的萘醇衍生物:
其中R7是一个或多个基团,R7各自独立地选自氢,卤素,氰基,甲基氰基,烃基(例如,C1-C6烷基,C2-C6烯基,C2-C6炔基)和烷氧基;R5选自氢和烃基(例如,C1-C6烷基,C2-C6烯基,C2-C6炔基);且R12是一个或多个基团,R12各自独立地选自氢和烷氧基。在某些情况中,R7是单个基团,R12是单个基团。
R可以源自其中的示例性组也包括:
其中R7各自独立地选自氢,卤素,氰基,甲基氰基,C1-C6烷基和C1-C6烷氧基;R5独立地选自氢和烃基(例如,C1-C6烷基,C2-C6烯基,C2-C6炔基);R13是C1-C6烷基,R也可以选自具有结构式(V)或(VI)的双环脂族醇衍生物:
其中R14选自氢,卤素,C1-C6烷基和C1-C6烷氧基;R15和R16各自独立地为氢,氰基,氰基甲基,烷氧基,或卤素,且m为1或2。
R可以源自其中的示例性组也包括:
其中R14选自氢,卤素,C1-C6烷基和C1-C6烷氧基;R15是氢,卤素或C1-C6烷氧基,R16是氢,氰基,或卤素。
另外,R可以选自其中的示例性组包括:
其中R7各自选自氢,卤素,氰基,甲基氰基,C1-C6烷基和C1-C6烷氧基;R8是脂族基团。
在一些实施方式中,R源自具有以下结构的S-(2-羟基乙基)硫代苯甲酸酯-醇:
其中R7是氢,卤素,氰基,甲基氰基,C1-C6烷基或C1-C6烷氧基。
在一些实施方式中,R源自具有以下结构的S-(2-羟基乙基)硫代烷基酸酯-醇:
其中R8是脂族基团。
另外,R可以选自其中的示例性组包括:
方法
本申请的方面包括使用标题化合物合成多聚核苷酸的方法。在一些实施方式中,方法包括:(a)提供具有未保护的羟基的核苷残基;和(b)使所述核苷残基与核苷单体(例如,如本申请所述的)接触,从而将所述核苷单体与所述核苷残基共价键接以及制备所述多聚核苷酸。
在一些实施方式中,方法进一步包括使多聚核苷酸暴露于氧化剂。可以使用任何便利的氧化剂。在一些实施方式中,方法进一步包括使核酸暴露于脱保护剂,例如,以将末端保护基团(例如,3’或5’-酸不稳定的保护基团,如本申请所述的)脱保护并产生能够进一步进行偶联反应的游离羟基末端。
在一些实施方式中,方法进一步包括重复接触步骤至少一次。可以重复方法的步骤,直到获得所需长度的多聚核苷酸。在一些情况中,将多聚核苷酸合成的循环重复200次或更多,例如250次或更多,300次或更多,400次或更多,500次或更多,600次或更多,700次或更多,800次或更多,900次或更多,1000次或更多,或甚至更多次,直到获得所需长度和序列的多聚核苷酸(例如,DNA)。
在方法的一些实施方式中,核苷残基共价结合于固相载体。任何适当的载体可以用于主题方法。有用的载体包括但不限于,平坦表面例如阵列,珠体等。适当的固相载体在一些情况下为聚合物,并且可以具有多种形式和组成,且源自天然存在的材料、已经合成修饰的天然存在的材料、或合成材料。适宜的载体材料的实例包括但不限于,多糖例如琼脂糖(例如,其作为商购自Pharmacia)和右旋糖苷(例如,以商业名称也商购自Pharmacia的那些),聚丙烯酰胺,聚苯乙烯,聚乙烯醇,甲基丙烯酸羟基乙酯和甲基丙烯酸甲酯的共聚物,硅石,特氟龙,玻璃等。待在基底表面上合成的多聚核苷酸的初始单体在一些情况下结合于连接部分,由此结合于表面亲水基团,例如,结合于硅石基底上存在的表面羟基部分。在方法的某些实施方式中,所述方法还包括使核酸从固体断裂载体以产生游离多聚核苷酸(例如,游离核酸)。
任何实用的多聚核苷酸合成方法、策略和化学可以适应于用于主题组合物和方法。可以适应于用于主题方法的有用的多聚核苷酸合成化学和方法包括但不限于,亚磷酰胺,H-膦酸酯,磷酸二酯,磷酸三酯,和亚磷酸三酯,以及描述于以下文献的那些方法和材料:S.L.Beaucage et al.(1981)Tetrahedron Lett.22:1859,Dellinger等人的美国专利6,222,030;Dellinger等人的美国专利申请公开US2002/0058802 Al;和Seio et al.(2001)Tetrahedron Lett.42(49):8657-8660。
在某些实施方式中,对于3'-到-5'合成,载体结合的核苷残基具有以下结构:
其中:
表示固相载体(经任选的连接基连接)或载体结合的多聚核苷酸链;
R是氢,保护的羟基,氟,烷氧基,O-亚乙基氧基烷基(O-CH2CH2OR),保护的氨基,保护的酰胺基,或保护的烷基氨基,其中当R是氢时,载体结合的核苷是脱氧核糖核苷,为将存在于DNA合成中,且当R是保护的羟基时,载体结合的核苷是核糖核苷,为将存在于RNA合成中;以及
B是核碱基或保护的核碱基,例如嘌呤或嘧啶碱基。
在某些实施方式中,核碱基可以是常规的嘌呤或嘧啶碱基,例如,腺嘌呤(A),胸腺嘧啶(T),胞嘧啶(C),鸟嘌呤(G)或尿嘧啶(U),或其保护的形式,例如,其中碱基用保护基团如乙酰基、二氟乙酰基、三氟乙酰基、异丁酰基、苯甲酰基等保护。嘌呤或嘧啶碱基也可以是前述的类似物;适宜的类似物包括但不限于,1-甲基腺嘌呤,2-甲基腺嘌呤,N6-甲基腺嘌呤,N6-异戊基腺嘌呤,2-甲硫基-N6-异戊基腺嘌呤,N,N-二甲基腺嘌呤,8-溴腺嘌呤,2-巯基胞嘧啶,3-甲基胞嘧啶,5-甲基胞嘧啶,5-乙基胞嘧啶,4-乙酰基胞嘧啶,1-甲基鸟嘌呤,2-甲基鸟嘌呤,7-甲基鸟嘌呤,2,2-二甲基鸟嘌呤,8-溴鸟嘌呤,8-氯鸟嘌呤,8-氨基鸟嘌呤,8-甲基鸟嘌呤,8-巯基鸟嘌呤,5-氟尿嘧啶,5-溴尿嘧啶,5-氯尿嘧啶,5-碘尿嘧啶,5-乙基尿嘧啶,5-丙基尿嘧啶,5-甲氧基尿嘧啶,5-羟基甲基尿嘧啶,5-(甲酸基羟基甲基)尿嘧啶,5-(甲基氨基甲基)尿嘧啶,5-(甲酸基甲基氨基甲基)-尿嘧啶,2-巯基尿嘧啶,5-甲基-2-巯基尿嘧啶,5-(2-溴乙烯基)尿嘧啶,尿嘧啶-5-氧基乙酸,尿嘧啶-5-氧基乙酸甲酯,假尿嘧啶,1-甲基假尿嘧啶,Q核苷(queosine),次黄苷,1-甲基次黄苷,次黄嘌呤,黄嘌呤,2-氨基嘌呤,6-羟基氨基嘌呤,6-硫代嘌呤和2,6-二氨基嘌呤。
另一方面,本申请提供使用一种或多种本申请公开的化合物合成DNA的方法。
在某些实施方式中,合成的核酸(例如,DNA)的序列具有至少约150个核苷酸,例如至少约155个核苷酸,至少约160个核苷酸,至少约165个核苷酸,至少约170个核苷酸,至少约175个核苷酸,至少约180个核苷酸,至少约185个核苷酸,至少约190个核苷酸,至少约195个核苷酸,至少约200个核苷酸,至少约205个核苷酸,至少约210个核苷酸,至少约215个核苷酸,至少约220个核苷酸,至少约225个核苷酸,至少约230个核苷酸,至少约240个核苷酸,至少约250个核苷酸,至少约255个核苷酸,至少约260个核苷酸,至少约270个核苷酸,至少约280个核苷酸,至少约300个核苷酸。在一些情况中,上述实施方式的任一种,合成的核酸(例如,DNA)的序列具有约500个核苷酸或更少,例如约400个核苷酸或更少,或约300个核苷酸或更少。在某些实施方式中,合成的DNA的序列具有至少约200个核苷酸。在某些实施方式中,合成的DNA的序列具有约150至约500个核苷酸,例如约150至约400个核苷酸,约150至约300个核苷酸,或约200至约300个核苷酸。
在某些实施方式中,合成的DNA的长度为200-mer至约1,000-mer,(例如,尤其包含约200-mer至约800-mer,约200-mer至约500-mer,约300-mer至约800-mer,约300-mer至约500-mer)。在某些实施方式中,合成的DNA具有2个或更少的单核苷酸缺失/100个核苷酸。在某些实施方式中,合成的DNA具有1个或更少的单核苷酸缺失/100个核苷酸。
在一些实施方式中,方法还包括将第一游离核酸与第二游离核酸偶联以制备延长的游离核酸,该核酸的长度尤其是包含约300至约10,000个核苷酸。如本申请使用,术语延长的游离核酸是指下述游离核酸,其通过将使用主题线性逐步合成法合成的核酸片段进行片段缩合所制备。任何便利的核酸片段偶联方法可以用于由通过主题线性逐步合成法制备的有用的核酸片段组装较大的延长核酸分子。在某些实施方式中,方法还包括将一个或多个另外的游离核酸偶联(例如,片段缩合)于延长的游离核酸以制备基因。
本申请的各方面进一步包括主题方法的核酸产品。本申请方法的核酸产品例如RNA、DNA的大小可以变化,在某些实施方式中长度可为200个或更多个单体单元,例如250个或更多个,300个或更多个,350个或更多个,400个或更多个,450个或更多个,500个或更多个,或甚至更多个。在一些实施方式中,核酸产品的长度为200至1000个单体单元,尤其包括,长度为200至500个单体单元,例如长度为200至400个单体单元或300至500个单体单元,在某些实施方式中,核酸产品具有1个或更少(例如,150个核苷酸中具有1个)个单核苷酸缺失/100个核苷酸且没有多核苷酸缺失。
如前所述,本申请的合成方法可以在具有化学实体可以与其结合的表面的固相载体。在一些实施方式中,待合成的多个寡聚核苷酸直接或间接附接于相同的固相载体并且可以形成阵列的一部分。"阵列"是已知单体序列的单独分子的集体,所述已知单体序列各自以空间限定和可物理设定地址的方式排列,使得各序列的位置已知。可以包含在阵列上的分子数目或"特征"将主要由以下决定:基底的表面积,特征的尺寸和特征间的间距,其中阵列表面可以包括或可以不包括由非特征面积表示的局部背景区域。阵列的密度可以为至多几十万或更多个特征/cm2,例如2,500至200,000个特征/cm2。特征可以或可以不共价键接于基底。可互换使用的"阵列"或"化学阵列"包括可设定地址的区域的任何一维、二维或基本二维(以及三维)的排列,所述可设定地址的区域具有与该区域相连的一个或多个特定化学部分(例如配体,例如,生物聚合物如多聚核苷酸或寡聚核苷酸序列(核酸),多肽(例如,蛋白质),碳水化合物,脂类等)。在下述情况下阵列是"可设定地址的":当其具有多个包含不同部分(例如,不同的多聚核苷酸序列)的区域,使得在阵列上一个特别的预定位置(即,一个"地址")的一个区域(即,阵列的一个"特征"或"点")将可检测一种特定靶标或特定类别的靶标(但是特征可以顺便检测该特征的非靶标)。阵列特征通常、但不必须由介于其间的空间分隔。在阵列中,"靶标"是指流动相(通常为流体)中的有待通过在多个区域结合于基底的探针("靶标探针")检测的部分。但是,"靶标"或"探针"可以相互评价(因此,任一可以是有待通过与另一结合来评价的被分析物(例如,多聚核苷酸)的未知混合物)。
在一些实施方式中,阵列是微流体装置的一部分,并且是二维或三维的。包含这种阵列的固相载可以是基本平面的或者可以包含多个微结构,例如阱,通道和微通道,升高的柱或杆(elevated columns or posts)。
在一些实施方式中,待合成的寡聚核苷酸直接或间接附接于珠体。珠体可以任选地放进阱或通道的阵列中。适宜的固相载体可以具有多种形式和组成,且源自天然存在的材料、已经合成修饰的天然存在的材料、或合成材料。
适宜的载体材料的实例包括但不限于,硅石、硅和硅氧化物(包括用于半导体制造的任何材料),特氟龙,玻璃,多糖例如琼脂糖(例如,得自Pharmacia的和右旋糖苷(例如,也得自Pharmacia的聚丙烯酰胺,聚苯乙烯,聚乙烯醇,甲基丙烯酸羟基乙酯和甲基丙烯酸甲酯的共聚物等。待在基底表面上合成的寡聚核苷酸的初始单体通常结合于连接部分,由此结合于表面亲水基团,例如,存在于硅石基底上的表面羟基部分。在一些实施方式中,使用通用连接基。在一些其它实施方式中,初始单体直接与例如表面羟基部分反应。或者,可以首先根据本申请合成寡聚核苷酸,并通过本领域已知的任何方法中的后合成法将其附接于固相基底。因此,本申请可以用于制备寡聚核苷酸的阵列,其中寡聚核苷酸或在阵列上合成、或通过后合成法附接于阵列基底。
关于本申请方法的效率和易行性,寡聚核苷酸合成可以小规模或大规模进行。在本申请方法的一个完整运行中(在一个容器中)制备的寡聚核苷酸的量因此可以小于微克级,或为微克级,数十微克,数百微克,克,数十克,数百克,或甚至千克。
在一些实施方式中,核酸的阵列通过本申请的方法和组合物合成。在一些实施方式中,核酸保持附接于阵列,以便用于基于阵列的应用(例如基因表达,细胞遗传学,基因分型,转录或外显子表达谱等)。在其它实施方式中,核酸全部-或有时仅一个亚序列-从固相载体释放,以产生一个或多个核酸的文库,或可以在从固相载体断裂之前或之后任选扩增的池。核酸的池或文库可以用作例如选择性靶向富集的诱饵,或用作原位杂交试验的探针(例如o-FISH)或其它杂交试验的探针,多重定点突变,多重基因组工程与加速进化(MAGE),用编码siRNAs、shRNAs、miRNAs的文库进行的基因敲除,用编码CRISPR RNAs和/或Cas蛋白的核酸的文库进行的基因工程,或编码基因或基因片段的核酸可以进一步组装和绑结成较长的DNA片段、基因和/或染色体。在一些实施方式中,组装的核酸是长度为约300个核苷酸至约10,000个核苷酸的DNA。在其它实施方式中,组装的核酸的长度其大小可以变化,其长度在某些实施方式中为300个或更多个核苷酸,例如400个或更多个核苷酸,1,000个或更多个核苷酸,2,000个或更多个核苷酸,3,000个或更多个核苷酸,4,000个或更多个核苷酸,5,000个或更多个核苷酸,6,000个或更多个核苷酸,8,000个或更多个核苷酸,10,000个或更多个核苷酸,或甚至更多个核苷酸。
本申请也提供了使用主题组合物和方法制备的核酸的文库。在文库的一些实施方式中,文库包括多个核酸,其中每个核酸通过本申请所述的主题方法合成。本申请也提供了包括多个长度为约300至约10,000个核苷酸的核酸的文库,其中每个核酸由组装的通过本申请所述的主题方法合成的核酸片段组成。核酸可以是游离核酸。多个核酸可以具有共同限定一个有用基因的序列。文库的多个核酸可以组装成基因,例如,使用任何便利的片段偶联的方法。
产物核酸可用于多种应用,包括研究、诊断和治疗应用。例如,产物核酸可以用于研究应用,例如基因学,细胞遗传学,靶向富集和测序,定点突变,合成生物学,基因合成,基因组装,例如,用作探针,引物,基因片段,DNA/RNA阵列,核酸的文库。关于诊断应用,例如基因学,细胞遗传学,肿瘤学,传染病,无创产前测试(NIPT),靶向富集和测序,产物核酸也可用作探针(例如oligoFISH),引物,基因片段,转录子,DNA/RNA阵列,核酸的文库,转录子或用于诊断程序的其它试剂的文库。关于治疗应用,产物核酸可用作任何DNA、RNA或其它核酸治疗物,如反义核酸,用于基因治疗应用,基因编辑,干扰RNA(即,iRNA或RNAi)应用等。
实施例
以下实施例说明本申请所述化合物(22-54)的通用合成策略。
合成各种5′-O-二甲氧基三苯甲基-2′-脱氧胸苷3′-O-芳基亚磷酰胺
将二(N,N-二异丙基氨基)氯代膦(Chem Genes,0.019摩尔,5.20克)溶解于装备有磁力搅拌棒和隔膜在氮气下的直火干燥的250-mL Schlenk烧瓶中的无水二氯甲烷(20mL)。向该溶液中添加5′-O-二甲氧基三苯甲基-2′-脱氧胸苷(Chem Genes,0.019摩尔,1.0当量)。当2′-脱氧核糖核苷完全溶解时,加入N,N-二异丙基乙基胺(Sigma Aldrich,0.057摩尔,3.0当量),将混合物在氩气下在室温搅拌30分钟。30分钟后的31P NMR谱表明起始物质完全转化为产物。在真空下移除溶剂之后,粗产物通过柱色谱使用乙酸乙酯在包含1%三乙胺的己烷中的50-90%梯度分离。31P NMR(CDCl3):δ115.9(s)。
将5′-O-二甲氧基三苯甲基-2′-脱氧胸苷3′-O-亚磷酰二胺(2.58mmols,2克)和芳基醇(1.0当量)溶解于100mL圆底烧瓶中的无水二氯甲烷(15mL)并在氩气下在室温搅拌。经注射器历时15min将1H-乙基硫基四唑(0.25M在无水乙腈中,Glen Research,VA,1.0当量)逐滴添加到混合物中,将混合物在氮气下在室温搅拌,直到TLC分析显示起始物质完全转化为较高的运行点。将溶剂真空移除,粗产物通过柱色谱使用乙酸乙酯在包含1%三乙胺的己烷中的50-90%梯度分离。
表1
表2
合成各种5′-O-二甲氧基三苯甲基-2′-脱氧胸苷3′-O-S-(乙基)硫代苯甲酸酯-吡 咯烷基亚磷酰胺
将三(1-吡咯烷基)膦(0.016摩尔,4克)溶解于100mL圆底烧瓶中的无水二氯甲烷(20mL)并在氩气下在室温搅拌。向该溶液中添加5′-O-二甲氧基三苯甲基-2′-脱氧胸苷(Chem Genes,0.016摩尔,1.0当量)。结束时,历时15min经注射器将1H-乙基硫基四唑(0.25M在无水乙腈中,Glen Research,VA,1.0当量)逐滴添加到混合物中,将混合物在氮气下在室温搅拌30分钟,这时31P NMR谱表明起始物质完全转化为产物。在真空下移除溶剂,粗产物通过柱色谱使用乙酸乙酯在包含1%三乙胺的二氯甲烷中的30-60%梯度分离。31P NMR(CDCl3):δ135.2(s)。
将5′-O-二甲氧基三苯甲基-2′-脱氧胸苷3′-O-二(1-吡咯烷基)亚磷酰二胺(2.80mmols,2克)和硫酯(1.0当量)溶解于100mL圆底烧瓶中的无水二氯甲烷(15mL)并在氩气下在室温搅拌。历时15min经注射器将1H-乙基硫基四唑(0.25M在无水乙腈中,GlenResearch,VA,1.0当量)逐滴添加到混合物中,将混合物在氮气下在室温搅拌,直到TLC分析显示起始物质完全转化为较高运行点。在真空下移除溶剂,粗产物通过柱色谱使用乙酸乙酯在包含1%三乙胺的二氯甲烷中的30-60%梯度分离。31P NMR(CDCl3):δ144.1,144.3(d)
固相寡聚核苷酸合成的通用过程。
合成在0.2微摩尔(60mer)和1.0微摩尔(20mer)级使用来自Glen Research的dT-CPG柱(对于20mer为500埃,对于60mer为1000埃)根据标准DNA循环在ABI型号394自动DNA合成器上进行。合成过程基于常规DMT亚磷酰胺方法。将所有保护的脱氧胸苷3′-O-芳基亚磷酰胺浓度100mM溶解于无水乙腈并放在合成器的适当口上。在合成之前,用3%的在二氯甲烷中的二氯乙酸使载体结合的2′-脱氧核糖核苷上的5′-DMT基团脱去。活化剂为5-乙基硫基-1H-四唑(0.25M在无水乙腈中,Glen Research,VA)。在每个缩合步骤之后,将载体用乙腈洗涤40s,根据制造商的推荐使用Unicap亚磷酰胺(Glen Research,VA)来覆盖失效序列。标准氧化试剂(0.02M碘在THF/水/吡啶中)用于氧化。通过用Ammonia(Macron,含有10-35%Ammonia的溶液)处理使后合成低聚物从固相载体断裂。在几种情况中,在断裂之前,将仍连接于CPG的寡聚核苷酸用1M的2-氨基甲酰基-2-氰基乙烯-1,1-二硫醇盐在DMF(1mL)中的溶液处理4至8小时。然后将树脂用DMF接着用MeOH洗涤,并在氩气下干燥,最后用氨水进行断裂。将断裂混合物弃置,将固相载体在SpeedVac中蒸发至干燥。将吸附在载体上的ODN产物溶解于水并通过LC-MS分析。
b寡聚核苷酸的LC-MS分析
20mers和60mers的分析在Agilent 6530 Accurate-Mass Q-TOF LC/MS上以负离子模式进行。数据用Agilent Mass Hunter Qualitative Analysis B 04.00软件处理。
使用两种不同的反相柱:ACQUITY UPLC BEH C18,1.7μm,2.1X100nm柱用于分析20mers;和ACQUITY UPLC PrST C4,1.7μm,2.1mm X150mm柱用于分析60mers。使用多于一种洗脱液系统和几种梯度:
洗脱液系统1
缓冲液A:200mmHFIP,8mMTEA,5%甲醇在水中
缓冲液B:90%甲醇在水中
洗脱液系统2
缓冲液A:5mM二丁基乙酸铵,5%有机组分在水中
缓冲液B:5mM二丁基乙酸铵,10%水在有机组分中
有机组分:1:1乙腈:2-异丙醇
表3梯度1
时间(min) %缓冲液B 流速(mL/min)
0.0 5.0 0.2
3.0 5.0 0.2
30.0 50.0 0.2
45.0 80.0 0.2
47.0 5.0 0.2
70.0 5.0 0.2
表4梯度2
表5梯度3
时间(min) %缓冲液B 流速(mL/min)
0.0 5.0 0.2
30.0 25.0 0.2
35.0 60.0 0.2
40.0 10.0 0.2
45.0 5.0 0.2
50.0 5.0 0.2
所有样品均以负离子模式运行,以下是使用的所有质谱参数的列表。
表6源参数
所有样品均使用MassHunter Qualitative Analysis软件处理以从各信号类型提取作为总离子流谱图(TIC)、DAD谱图和萃取离子谱图(EIC)的谱图。
以下实施例说明对通过使用本申请所述的亚磷酰胺(22-31)合成的20mers和60mers的分析。特别地,每种寡聚核苷酸已通过TIC、DAD和EIC谱图分析。
使用5′-O-二甲氧基三苯甲基-2′-脱氧胸苷3′-O-α-甲基-对-溴苄基亚磷酰胺 (22)合成的dT 20
使用1-(4-溴苯基)乙醇作为磷保护基团合成的dT20的TIC、DAD谱图和质谱分析显示于图1。
使用5′-O-二甲氧基三苯甲基-2′-脱氧胸苷3′-O-1-甲氧基萘亚磷酰胺(23)合成 的dT 20
使用1-甲氧基-2-萘甲醇作为磷保护基团合成的dT20的TIC、DAD谱图和质谱分析显示于图2。
使用5′-O-二甲氧基三苯甲基-2′-脱氧胸苷3′-O-萘亚磷酰胺(24)合成的dT 20
使用2-萘甲醇作为磷保护基团与2-氨基甲酰基-2-氰基乙烯-1,1-二硫醇盐处理合成的dT20的TIC、DAD谱图和质谱分析显示于图3。
使用5′-O-二甲氧基三苯甲基-2′-脱氧胸苷3′-O-6-溴-2-萘亚磷酰胺(25)合成的 dT 20
使用6-溴-2-萘甲醇作为磷保护基团与2-氨基甲酰基-2-氰基乙烯-1,1-二硫醇盐处理合成的dT20的TIC、DAD谱图和质谱分析显示于图4。
通过使用5′-O-二甲氧基三苯甲基-2′-脱氧胸苷3′-O-1-茚满-5-甲腈亚磷酰胺 (26)合成的dT 20
使用1-羟基茚满-5-甲腈作为磷保护基团合成的dT20的TIC、DAD谱图和质谱分析显示于图5。
使用5′-O-二甲氧基三苯甲基-2′-脱氧胸苷3′-O-4-氰基苄基亚磷酰胺(27)合成 的dT 20
使用4-氰基苄醇作为磷保护基团与2-氨基甲酰基-2-氰基乙烯-1,1-二硫醇盐处理合成的dT20的TIC、DAD谱图和质谱分析显示于图6。
使用5’-O-二甲氧基三苯甲基-2′-脱氧胸苷3′-O-3-氰基苄基亚磷酰胺(28)合成 的dT 20
使用3-氰基苄醇作为磷保护基团与2-氨基甲酰基-2-氰基乙烯-1,1-二硫醇盐处理合成的dT20的TIC、DAD谱图和质谱分析显示于图7。
通过使用5′-O-二甲氧基三苯甲基-2′-脱氧胸苷3′-O-2-乙炔基苄基亚磷酰胺 (29)合成的dT 20
使用2-乙炔基苄醇作为磷保护基团与2-氨基甲酰基-2-氰基乙烯-1,1-二硫醇盐处理合成的dT20的TIC、DAD谱图和质谱分析显示于图8。
使用5′-O-二甲氧基三苯甲基-2′-脱氧胸苷3′-O-乙酰基-L-苏氨酸甲酯亚磷酰胺 (30)合成的dT 20
使用乙酰基-L-苏氨酸甲酯作为磷保护基团合成的dT20的TIC、DAD谱图和质谱分析显示于图9。
使用5′-O-二甲氧基三苯甲基-2′-脱氧胸苷3′-O-S-乙基硫代苯甲酸酯-吡咯烷基 亚磷酰胺(31)合成的dT 20
使用S-乙基硫代苯甲酸酯作为磷保护基团合成的dT20的DAD谱图和质谱分析显示于图10。
使用5′-O-二甲氧基三苯甲基-2′-脱氧胸苷3′-O-4-氰基苄基亚磷酰胺(27)合成 的dT 60
使用4-氰基苄醇作为磷保护基团与2-氨基甲酰基-2-氰基乙烯-1,1-二硫醇盐处理合成的dT60的TIC、DAD谱图和质谱分析显示于图11。
使用5′-O-二甲氧基三苯甲基-2′-脱氧胸苷3′-O-乙酰基-L-苏氨酸甲酯亚磷酰胺 (30)合成的dT 60
使用乙酰基-L-苏氨酸甲酯作为磷保护基团合成的dT60的TIC、DAD谱图和质谱分析显示于图12。
通过使用5′-O-二甲氧基三苯甲基-2′-脱氧胸苷3′-O-S-乙基硫代苯甲酸酯-吡咯 烷基亚磷酰胺(31)合成的dT60
使用S-乙基硫代苯甲酸酯作为磷保护基团合成的dT60的TIC、DAD谱图和质谱分析显示于图13。
使用S-乙基硫代苯甲酸酯作为磷保护基团合成的T60与使用标准2-氰基乙基亚磷酰胺合成的T60的比较显示于图14。
以下实施例说明本申请所述的另外的化合物(1-15)的通用合成策略。
材料和方法:5'-二甲氧基三苯甲基-N6-二甲基氨基乙脒-2'-脱氧腺苷,3'-[(2-氰基乙基)-(N,N-二异丙基)]-亚磷酰胺DMA-dA-CE、腺苷水合物、鸟苷水合物、胞苷水合物、二甲氧基三苯甲基氯购自Chem Genes,5'-二甲氧基三苯甲基-N4-乙酰基-2'-脱氧胞苷,3'-[(2-氰基乙基)-(N,N-二异丙基)]-亚磷酰胺(Ac-dC-CE)、5'-二甲氧基三苯甲基-N2-异丁酰基-2'-脱氧鸟苷,3'-[(2-氰基乙基)-(N,N-二异丙基)]-亚磷酰胺iBu-dG-CE、dT-CE、dT-CPG柱(1μmol),dC-CPG柱(1μmol)、0.45M在乙腈中的乙基硫基四唑、CAP Mix A(THF/吡啶/Ac2O)和CAP Mix B(16%MeIm在THF中)、0.02M I2在THF/吡啶/H2O中、3%三氯乙酸在二氯甲烷中、干燥乙腈购自Glen Research,4-乙酰基吗啉、N,N-二甲基乙酰胺二乙基缩醛、N-甲基吡咯烷酮、N,N-二异丙基乙基胺、干燥吡啶、硫酸二甲酯、NaOMe购自Sigma-Aldrich。
DNA合成和LCMS研究:DNA在394 RNA/DNA合成器(Applied Biosystem.0.2微摩尔方法)中合成。亚磷酰胺方法的P(III)化学用于在标准四步循环(即,脱保护,活化和偶联,氧化,以及封端)中合成DNA。3%在二氯甲烷中的三氯乙酸用于脱保护,0.45M在乙腈中的乙基硫基四唑用作活化剂。0.02M在THF/吡啶中的I2用于将酰胺化物氧化为磷酸酯。THF/吡啶/Ac2O和16%在THF中的N-甲基咪唑用于将未能偶联的序列封端。可控孔径的玻璃球(CPG)用作固定相。较短的DNA在孔径的CPG上以1微摩尔规模合成,而较长的序列(>20bp)在孔径的CPG上以0.2微摩尔规模合成。通过用28-30%NH4OH在55℃处理CPG过夜,DNA从固相载体断裂。但是,研究乙脒和吗啉代乙脒保护基团在从环境温度到55℃的变化温度以及2h到过夜的NH4OH的断裂和脱保护效率。
将断裂的DNA萃取到包含5%乙腈的H2O中并过滤。过滤的DNA直接用于LCMS研究。在Agilent 6500 Q-TOF LC/MS系统中记录LCMS谱。通过使用二丁基乙酸铵/异丙醇(IPA)/乙腈(ACN)作为洗脱缓冲液系统记录LC/MS。缓冲液的组成为:缓冲液A:5mM二丁基乙酸铵+5%IPA:ACN(1:1),缓冲液B:5mM二丁基乙酸铵+90%IPA:ACN(1:1)。选择二丁基乙酸铵为流动相以减小较高电荷态的质谱信号。这有助于提取具有所需质量的DNA的EIC谱。DNA的质谱通过Agilent MassHunter Workstation Qualitative Analysis B.06.00分析。通过输入DNA或加合物的精确且计算的质量值从TIC色谱图提取具有所需质量的寡聚核苷酸的EIC谱。
合成用于核碱基保护的前体试剂。
N,N-二甲基乙酰胺二乙基缩醛:
N,N-二甲基乙酰胺二乙基缩醛根据McBride,L.J;Kierzek,R.;Beaucage,S.L.;Caruthers,M.H.J.Am.Chem.Soc.,1986,108,2040-2048的过程合成。
2,2-二甲氧基-1-甲基吡咯烷(Lu,J.;Khdour,O.M.;Armstrong,J.S.;Hecht,S.M.Bioorg.Med.Chem.,2010,18,7628-7638):
将N-甲基-2-吡咯烷酮(26mL,273mmol)和硫酸二甲酯(26mL,278mmol)的混合物搅拌并在90℃加热90min,然后使其冷却至室温。在~10℃在氩气下历时1h添加包含65mL的25%甲醇钠的甲醇溶液和135mL甲醇的溶液。将沉淀的白色固体过滤,将溶剂减压浓缩。将黄色油性残余物溶解于250mL乙醚并搅拌另外1h,然后再次过滤沉淀的固体。将固体用乙醚洗涤。在将醚浓缩之后,将残余物真空蒸馏,得到作为浅黄色液体的化合物:收率14.8g(37%)。在CHCl3中的1H NMR依据文献。
合成4-(1,1-二甲氧基乙基)吗啉(Feng R.,-L;Gong,P.;Fang,L.;Hong,W.Chem.Res.Chinese U,2005,21,177-192):
将4-乙酰基吗啉(32mL,278mmol)和硫酸二甲酯(26mL,278mmol)的混合物搅拌并在90℃加热60min,然后使其冷却至室温。在~10℃在氩气下历时2h添加包含65mL的25%甲醇钠的甲醇溶液和135mL甲醇的溶液。将沉淀的白色固体过滤,将溶剂减压浓缩。将黄色油性残余物溶解于250mL乙醚并搅拌另外1h,然后再次过滤沉淀的固体。将固体用乙醚洗涤。在将醚浓缩之后,残余物用于反应的下一步。粗制油的重量为22g。
合成dA,dC,dG,dT 3’-(2-氰基乙基)-N,N-二异丙基亚磷酰胺
方案1描述在以下条件下合成化合物(3):(i)4-(1,1-二甲氧基乙基)吗啉,室温,过夜;(ii)4,4-二甲氧基三苯甲基氯,吡啶,N,N-二异丙基乙基胺(2h);(iii)N,N-二异丙基-氰基乙基氨基磷酰氯,N,N-二异丙基乙基胺,CH2Cl2(2h)。
方案1
6-N-(1-(吗啉代)乙叉)-2’-脱氧腺苷(1):
将2.69g(10mmol)的2’-脱氧腺苷一水合物与吡啶共蒸发3次,使其悬浮在20mL干燥甲醇中。在氩气下在恒定搅拌下缓慢添加10g的4-(1,1-二甲氧基乙基)吗啉。使反应继续进行过夜。反应之后,通过旋转蒸发移除甲醇。用乙醚洗涤粘性残余物数次,得到不粘的白色粉末。将化合物通过硅胶柱色谱用CHCl3作为洗脱液来进一步纯化。甲醇(0-10%)用作梯度。在移除溶剂之后,产生作为白色泡沫状物的纯化合物(1)。收率:3.19g(88%),Rf(CHCl3/MeOH 10/2v/v):0.43,1H NMR(CDCl3,400MHz):δ8.22(s,1H),7.54(s,1H),5.77(t,J=6.11Hz,1H),4.03(d,J=6.4Hz,1H),3.88(m,2H),3.64(m,1H),3.37(m,4H.O(CH2)2),2.83(m,4H,N(CH2)2),2.51-2.29(m,2H),1.73(s,3H,C-CH3)。13C NMR(CDCl3,400MHz):δ160.85,154.22,152.01,147.94,138.21,122.11,88.22,83.19,71.53,68.12,62.41,46.36,40.11,22.38。
5’-O-(二-对-甲氧基三苯甲基)-6-N-(1-(吗啉代)乙叉)-2’-脱氧腺苷(2):
将4-N-(l-(二甲基氨基)乙叉)-2’-脱氧腺苷(1)(3.19g 0.0088摩尔)溶解于干燥吡啶(25mL)中,用氩气使溶液饱和。将N,N-二异丙基乙基胺(6.42g,0.05摩尔,8.65mL)添加到溶液中并在氩气下搅拌10min。在氩气下制备二-对-甲氧基三苯甲基氯(2.95g,0.0088摩尔)在25mL干燥吡啶中的溶液。在连续的氩气流下将DMT-Cl溶液转移至1的溶液中。在恒定搅拌下在氩气下使反应继续进行2h。将溶液浓缩,并用100mL二氯甲烷进一步稀释。将混合物用NaHCO3饱和水溶液(100mL)洗涤三次。将有机相用NaCl的饱和水溶液(100mL)进一步洗涤。将有机相用无水Na2SO4干燥。化合物通过硅胶柱色谱在含有3%三乙胺的CH2Cl2(MeOH用作梯度,0-2%)中进一步纯化。在移除溶剂之后,产生作为白色泡沫状物的化合物(2)。收率:4.54g(78%);Rf(CH2Cl2/MeOH 10/0.5v/v):0.41;1H NMR(CDCl3,400MHz):δ8.48(s,1H),7.76(s,1H),7.3-6.6(m,13H,芳基),5.84(t,J=6.31Hz,1H),4.13(d,J=7.3Hz,1H),3.93(m,2H),3.76(s,6H,(O-CH3)2),3.54(m,1H),3.33(m,4H.O(CH2)2),2.91(m,4H,N(CH2)2),2.55-2.31(m,2H),1.61(s,3H,C-CH3)。13C NMR(CDCl3,400MHz):δ167.15,157.62,154.41,150.37,147.54,140.22,140.14,133.97,130.21,128.33,124.32,122.38,112.76,91.22,86.92,80.27,74.22,67.21,62.12,59.37,47.28,41.19,23.3。
5’-O-(二-对-甲氧基三苯甲基)-6-N-(1-(吗啉代)乙叉)-2’-脱氧腺苷-2-氰基乙基-N,N-二异丙基亚磷酰胺(3):
将5’-O-(二-对-甲氧基三苯甲基)-4-N-(1-吗啉代乙叉氨基)-2’-脱氧腺苷(2)(1.66g,0.0025摩尔)溶解于10mL干燥CH2Cl2中。在恒定的氩气流下在搅拌下将N,N-二异丙基乙基胺(6mL)添加到溶液中。将N,N-二异丙基-O-氰基乙基氯亚磷酰胺(590mg,0.0025摩尔)添加到溶液中,使反应在氩气下继续进行2h。在反应结束之后,将溶液倒入30mL的NaHCO3饱和水溶液中并用CH2Cl2(3x 10mL)萃取。将合并的有机相用Na2SO4干燥,将溶剂蒸发。将所得油状物通过柱色谱使用包含3%三乙胺的CH2Cl2纯化,得到作为白色泡沫状物的最终化合物(3)。通过从二氯甲烷溶液中的冷己烷沉淀,进一步纯化化合物。收率:1.51g(71%)。Rf(CH2Cl2/MeOH 10/0.5v/v):0.44,31P NMR(CDCl3,400MHz):δ148.74,147.91(非对映异构体)。
方案2描述根据以下条件合成化合物(9):(i)N,N-二甲基乙酰胺二乙基缩醛,乙醇,60℃,24h;(ii)4,4-二甲氧基三苯甲基氯,吡啶,N,N-二异丙基乙基胺,室温,2h);(iii)N,N-二异丙基-氰基乙基氨基磷酰氯,N,N-二异丙基乙基胺,CH2Cl2(2h);(iv)4-(1,1-二甲氧基乙基)吗啉,60℃,过夜;(v)4,4-二甲氧基三苯甲基氯,吡啶,N,N-二异丙基乙基胺(3h);(vi)N,N-二异丙基-氰基乙基氨基磷酰氯,N,N-二异丙基乙基胺,CH2Cl2(2h)。
方案2
2-N-(l-(二甲基氨基)乙叉)-2’-脱氧鸟苷(4):
根据文献过程以较小修饰合成2-N-(l-(二甲基氨基)乙叉)-2’-脱氧鸟苷(Lu,J.;Khdour,O.M.;Armstrong,J.S.;Hecht,S.M.Bioorg.Med.Chem.,2010,18,7628-7638)。使2’-脱氧鸟苷脱水物(3.66g 12mmol)悬浮于干燥乙醇。在恒定搅拌下将N,N-二甲基乙酰胺二乙基缩醛(7.8g,44mmol)添加到悬浮液中。将混合物升温至~70℃并保持1小时,直到溶液变得均匀(浅黄色)。继续搅拌24h。通过在减压下的旋转蒸发移除乙醇。用乙醚洗涤粘性残余物数次,直到残余物变为不粘的固体。化合物通过柱色谱用CHCl3作为洗脱液来进一步纯化。甲醇用作梯度(0-20%)。首先洗脱化合物。在移除柱级分的溶剂之后,产生作为泡沫状物的化合物(4)。收率:1.95g(48%);Rf(CHCl3/MeOH 10/2v/v):0.38;1H NMR(CDCl3,400MHz):δ8.02(s,1H),6.34(t,J=6.8Hz,1H),5.84(m,1H),4.75(s,1H),4.14(d,J=6.6Hz,1H),4.14(s,1H),3.86(m,2H),3.5(m,2H),3.16(s,6H,N(CH3)2),2.71-2.19(m,2H),2.21(s,3H,C-CH3)。13C NMR(CDCl3,400MHz):δ162.25,158.66,156.26,147.26,138.10,88.70,86.26,71.67,62.61,40.95,38.18,30.29,17.00;ESI MS:337.1521[MH]+
5’-O-(二-对-甲氧基三苯甲基)-2-N-(l-(二甲基氨基)乙叉)-2’-脱氧鸟苷(5):
将2-N-(l-(二甲基氨基)乙叉)-2’-脱氧鸟苷(4)(3.98g 0.0118摩尔)溶解于干燥吡啶(25mL)中,用氩气使溶液饱和。将N,N-二异丙基乙基胺(6.42g,0.05摩尔,8.65mL)添加到溶液中并在氩气下搅拌10min。在氩气下制备二-对-甲氧基三苯甲基氯(4.2g,0.012摩尔)在25mL干燥吡啶中的溶液。在恒定的氩气流下将DMT-Cl溶液转移至(4)的溶液中。在恒定搅拌下在氩气下使反应继续进行2h。将溶液浓缩并用100mL二氯甲烷进一步稀释。将混合物用NaHCO3饱和水溶液(100mL)洗涤三次。将有机相用NaCl的饱和水溶液(100mL)进一步洗涤。将有机相用无水Na2SO4干燥。化合物通过硅胶柱色谱在含有3%三乙胺的CH2Cl2(MeOH用作梯度,0-5%)中进一步纯化。在移除溶剂之后,产生作为泡沫状物的化合物(5)。收率:5.51g(73%);Rf(CH2Cl2/MeOH 10/0.5v/v):0.31;1H NMR(CDCl3,400MHz):δ7.71(s,1H),7.4-6.8(m,13H,芳基),6.33(t,J=7Hz,1H)4.59(m,1H),4.11(m,1H),3.78(s,6H,(O-CH3)2),3.6-3.2(m,4H),3.12(s,6H,N(CH3)2),2.55(m,2H),2.21(s,3H,C-CH3)。13C NMR(CDCl3,400MHz):δ162.27,158.55,156.39,147.78,144.53,135.86,130.01,127.90,126.91,119.30,113.20,86.55,85.52,82.97,72.47,64.20,55.26,40.83,38.56,37.87,30.20,16.85,7.94;ESI MS:639.3019[MH]+
5’-O-(二-对-甲氧基三苯甲基)-2-N-(l-(二甲基氨基)乙叉)-2’-脱氧鸟苷-2-氰基乙基-N,N-二异丙基亚磷酰胺(6):
将5’-O-(二-对-甲氧基三苯甲基)-2-N-(l-(二甲基氨基)乙叉)-2’-脱氧鸟苷(5)(596mg,0.93毫摩尔)溶解于10mL干燥CH2Cl2。在连续氮气流和搅拌下将N,N-二异丙基乙基胺(1mL)添加到溶液中。将N,N-二异丙基-O-氰基乙基氯亚磷酰胺(440mg,1.86mmol)添加到溶液中,使反应在氩气下继续进行2h。在反应结束之后,将溶液倒入30mL的NaHCO3饱和水溶液中并用CH2Cl2(3x 10mL)萃取。将合并的有机相用Na2SO4干燥,将溶剂蒸发。将所得油状物通过柱色谱使用包含3%三乙胺的CH2Cl2纯化,得到作为淡黄色泡沫状物的最终化合物(6)。收率:0.74g(94%)。Rf(CH2Cl2/MeOH 10/0.6v/v):0.45;1H NMR(CDCl3,400MHz):δ11.98(s,1H),7.81(d,J=8Hz,1H),7.48-6.77(m,13H,aryl),6.21(t,J=6.9Hz,1H),4.83(m,1H),4.11(m,1H),3.78(s,6H,(O-CH3)2),3.6-3.2(m,4H),3.12(s,6H,N(CH3)2),2.55(m,2H),2.21(s,3H,C-CH3)。31P NMR(CDCl3,400MHz):δ148.36,147.86(非对映异构体)。
2-N-(1-(吗啉代)乙叉)-2’-脱氧鸟苷(7):
使2.85g(10mmol)的2’-脱氧鸟苷水合物与吡啶共蒸发3次,使其悬浮于20mL干燥甲醇中。在恒定搅拌下在氩气下缓慢添加12g的4-(1,1-二甲氧基乙基)吗啉。使反应在60℃继续进行过夜,直到溶液变得均匀且颜色变为浅黄色。反应之后,通过旋转蒸发移除甲醇。用乙醚洗涤粘性残余物数次,获得不粘的白色固体。化合物通过硅胶柱色谱用CHCl3作为洗脱液来进一步纯化。甲醇(0-20%)用作梯度。在移除溶剂之后,产生作为白色泡沫状物的纯化合物(7)。收率:3.31g(82%),Rf(CHCl3/MeOH 10/2v/v):0.32,1H NMR(CDCl3,400MHz):δ7.92(s,1H),6.04(t,J=5.8Hz,1H),5.67(m,1H),4.17(d,J=5.8Hz,1H),3.84(m,2H),3.52(m,2H),3.43(m,4H.O(CH2)2),2.96(m,4H,N(CH2)2),2.71-2.19(m,2H),2.03(s,3H,C-CH3)。13C NMR(CDCl3,400MHz):δ160.15,157.26,154.51,148.34,137.11,87.85,84.16,70.28,66.22,45.86,42.35,38.38,29.69,16.80。
5’-O-(二-对-甲氧基三苯甲基)-2-N-(1-(吗啉代)乙叉)-2’-脱氧鸟苷(8):
将2-N-(l-(吗啉代)乙叉)-2’-脱氧鸟苷(7)(3.31g 0.0087摩尔)溶解于干燥吡啶(25mL),用氩气使溶液饱和。将N,N-二异丙基乙基胺(6.42g,0.05摩尔,8.65mL)添加到溶液中并在氩气下搅拌10min。在氩气下制备二-对-甲氧基三苯甲基氯(2.9g,0.0087摩尔)在25mL干燥吡啶中的溶液。在恒定的氩气流下将DMT-Cl溶液转移至(10)的溶液中。在恒定搅拌下在氩气下使反应继续进行3h。将溶液浓缩并用100mL二氯甲烷进一步稀释。将混合物用NaHCO3饱和水溶液(100mL)洗涤三次。将有机相用NaCl的饱和水溶液(100mL)进一步洗涤。将有机相用无水Na2SO4干燥。化合物通过硅胶柱色谱在含有3%三乙胺的CH2Cl2(MeOH用作梯度,0-5%)中进一步纯化。在移除溶剂之后,产生作为白色泡沫状物的化合物(8)。收率:4.89g(83%);Rf(CH2Cl2/MeOH 10/0.5v/v):0.36;1H NMR(CDCl3,400MHz):δ7.78(s,1H),7.3-6.6(m,13H,aryl),6.03(t,J=6.8Hz,1H)4.59(m,1H),3.84(s,6H,(O-CH3)2),3.7-3.4(m,4H),3.33(m,4H,O(CH2)2),3.02(m,4H,N(CH2)2),2.55(m,2H),2.16(s,3H,C-CH3).13CNMR(CDCl3,400MHz):δ168.22,160.29,158.89,156.19,148.18,143.23,137.16,132.11,128.10,127.21,123.22,120.24,118.60,113.28,89.03,86.55,85.12,82.27,72.47,66.90,56.26,45.83,37.66,32.87,30.20,16.95。
5’-O-(二-对-甲氧基三苯甲基)-2-N-(1(吗啉代)乙叉)-2’-脱氧鸟苷-2-氰基乙基-N,N-二异丙基亚磷酰胺(9):
将5’-O-(二-对-甲氧基三苯甲基)-2-N-(1-(吗啉代)乙叉)-2’-脱氧鸟苷(8)(1.7g,0.0025摩尔)溶解于10mL干燥CH2Cl2。在连续氮气流和搅拌下将N,N-二异丙基乙基胺(6mL)添加到溶液中。将N,N-二异丙基-O-氰基乙基氯亚磷酰胺(590mg,0.0025摩尔)添加到溶液中,使反应在氩气下继续进行2h。在反应结束之后,将溶液倒入30mL的NaHCO3饱和水溶液中并用CH2Cl2(3x 10mL)萃取。将合并的有机相用Na2SO4干燥,将溶剂蒸发。将所得油状物通过柱色谱使用包含3%三乙胺的CH2Cl2纯化,得到作为白色泡沫状物的最终化合物。通过从二氯甲烷溶液中进行冷己烷沉淀来进一步纯化化合物(9)。收率:1.62g(77%)。Rf(CH2Cl2/MeOH 10/0.7v/v):0.49,31P NMR(CDCl3,400MHz):δ147.56,146.86(非对映异构体)。
方案3描述根据以下条件合成化合物(15):(i)2,2-二甲氧基-1-甲基吡咯烷,甲醇,室温(3h);(ii)4,4-二甲氧基三苯甲基氯,吡啶,N,N-二异丙基乙基胺(2h);(iii)N,N-二异丙基-氰基乙基氨基磷酰氯,N,N-二异丙基乙基胺,CH2Cl2(2h);(iv)4-(1,1-二甲氧基乙基)吗啉,室温,过夜;(v)4,4-二甲氧基三苯甲基氯,吡啶,N,N-二异丙基乙基胺(2h);(vi)N,N-二异丙基-氰基乙基氨基磷酰氯,N,N-二异丙基乙基胺,CH2Cl2(2h)。
方案3
合成4-N-(N-甲基亚吡咯烷-2-基)-2’-脱氧胞苷(10):
使2.5g(10mmol)的2’-脱氧胞苷水合物(2a)悬浮在20mL干燥甲醇中。在恒定搅拌下在氩气下缓慢添加3.8g(26mmol)的2,2-二甲氧基-1-甲基吡咯烷。使反应继续进行3h,直到溶液变得均匀且颜色变为浅黄色。反应之后,通过旋转蒸发移除甲醇。用乙醚洗涤粘性残余物数次,获得不粘的固体。化合物通过硅胶柱色谱用CH2Cl2作为洗脱液来进一步纯化。甲醇(0-20%)用作梯度。在移除溶剂之后,产生作为白色泡沫状物的纯化合物。收率:2.61g(85%);Rf(CH2Cl2/MeOH 10/2v/v):0.3;1H NMR(CDCl3,400MHz):δ7.91(d,J=7.8Hz,1H),6.13(t,J=7.1Hz,1H),6.03(d,J=8Hz,1H),4.55(m,1H),4.01(m,1H),3.88(m,2H),3.48(m,2H),3.11(m,2H),3.05(,3H),2.41(m,2H),2.06(m,2H);13C NMR(CDCl3,400MHz):δ172.20,169.00,156.74,141.98,103.40,87.53,70.17,61.71,51.71,40.56,31.93,30.53,19.71;ESI MS:309.1583[MH]+
合成5’-O-(二-对-甲氧基三苯甲基)-4-N-(N-甲基亚吡咯烷-2-基)-2’-脱氧胞苷(11):
将4.2g(0.0136摩尔)的4-N-(N-甲基亚吡咯烷-2-基)-2’-脱氧胞苷(10)溶解于25mL干燥吡啶。在氩气下将9.88mL的N,N-二异丙基乙基胺添加到溶液中并搅拌10min。在氩气和恒定搅拌下添加4.8g(0.0143摩尔)溶解于25mL干燥吡啶的DMT-Cl。使反应继续进行2h。将溶液浓缩并用100mL二氯甲烷进一步稀释。将混合物用NaHCO3饱和水溶液(100mL)洗涤三次。将有机相用NaCl的饱和水溶液(100mL)进一步洗涤。将有机相用无水Na2SO4干燥。化合物通过硅胶柱色谱在含有3%三乙胺的CH2Cl2(MeOH用作梯度,0-5%)中进一步纯化。在移除溶剂之后,产生作为浅黄色泡沫状物的化合物(11)。收率:6.48g(78%);Rf(CH2Cl2/MeOH10/0.5v/v):0.4;1H NMR(CDCl3,400MHz):δ7.90(d,1H),7.44-6.80(m,13H,aryl),6.42(t,J=6.8Hz,1H),5.81(d,J=8Hz,1H),4.54(m,1H),4.15(m,1H),3.80(s,6H,(O-CH3)2),3.70-3.40(m,4H),3.15(t,J=6.8Hz,2H),3.03(s,3H,N-CH3),2.68(m,2H),2.21(m,2H)。13C NMR(CDCl3,400MHz):δ172.09,169.02,158.53,156.59,144.54,140.50,130.10,128.17,127.91,126.91,113.22,103.17,86.64,86.44,86.01,71.52,63.31,55.24,51.55,42.03,31.82,30.63,19.71;ESI MS:611.2997[MH]+
5’-O-(二-对-甲氧基三苯甲基)-4-N-(N-甲基亚吡咯烷-2-基)-2’-脱氧胞苷-2-氰基乙基-N,N-二异丙基亚磷酰胺(12)
将5’-O-(二-对-甲氧基三苯甲基)-4-N-(N-甲基亚吡咯烷-2-基)-2’-脱氧胞苷(11)(456mg,0.75毫摩尔)溶解于10mL干燥CH2Cl2。在连续氮气流和搅拌下将N,N-二异丙基乙基胺(1mL)添加到溶液中。将N,N-二异丙基-O-氰基乙基氯亚磷酰胺(350mg,1.48mmol)添加到溶液中,使反应在氩气下继续进行2h。在反应结束之后,将溶液倒入30mL的NaHCO3饱和水溶液中并用CH2Cl2(3x 10mL)萃取。将合并的有机相用Na2SO4干燥,将溶剂蒸发。所得油状物通过柱色谱用包含3%三乙胺的CH2Cl2纯化,得到作为淡黄色泡沫状物的最终化合物(12)。收率:0.53g(87%)。Rf(CH2Cl2/MeOH 10/0.8v/v):0.5;31P NMR(CDCl3,400MHz):δ149.48,148.78(非对映异构体)。
4-N-(1-(吗啉代)乙叉)-2’-脱氧胞苷(13):
将2.45g(10mmol)的2’-脱氧胞苷一水合物与吡啶共蒸发3次,使其悬浮于20mL干燥甲醇中。在恒定搅拌下在氩气下缓慢添加10g的4-(1,1-二甲氧基乙基)吗啉。使反应继续进行过夜。反应之后,通过旋转蒸发移除甲醇。用乙醚洗涤粘性残余物数次,直到获得不粘的白色粉末。化合物通过硅胶柱色谱用CHCl3作为洗脱液来进一步纯化。甲醇(0-10%)用作梯度。在移除溶剂之后,产生作为白色泡沫状物的纯化合物(13)。收率:3.0g(88%),Rf(CHCl3/MeOH 10/2v/v):0.38;1H NMR(CDCl3,400MHz):δ7.53(d,J=6.3Hz,1H),6.01(t,J=6.7Hz,1H),5.27(d,J=7.4Hz,1H),4.35(m,1H),3.91(m,1H),3.88(m,2H),3.55(m,4H,O(CH2)2),2.91(m,4H,N(CH2)2),2.5-2.3(m,2H),1.73(s,3H,C-CH3)。13C NMR(CDCl3,400MHz):δ163.85,160.12,153.81,142.14,108.11,92.17,84.72,71.60,67.08,60.40,44.78,40.92,22.98。
5’-O-(二-对-甲氧基三苯甲基)-4-N-(1-(吗啉代)乙叉)-2’-脱氧胞苷(14):
将4-N-(l-((吗啉代)乙叉))-2’-脱氧胞苷(13)(2.98g 0.0088摩尔)溶解于干燥吡啶(25mL),用氩气使溶液饱和。将N,N-二异丙基乙基胺(6.42g,0.05摩尔,8.65mL)添加到溶液中并在氩气下搅拌10min。在氩气下制备二-对-甲氧基三苯甲基氯(2.95g,0.0088摩尔)在25mL干燥吡啶中的溶液。在恒定的氩气流下将DMT-Cl溶液转移至16的溶液中。在恒定搅拌下在氩气下使反应继续进行2h。将溶液浓缩并用100mL二氯甲烷进一步稀释。将混合物用NaHCO3饱和水溶液(100mL)洗涤三次。将有机相用NaCl的饱和水溶液(100mL)进一步洗涤。将有机相用无水Na2SO4干燥。化合物通过硅胶柱色谱在含有3%三乙胺的CH2Cl2(MeOH用作梯度,0-2%)中进一步纯化。在移除溶剂之后,产生作为白色泡沫状物的化合物(14)。收率:4.25g(75%);Rf(CH2Cl2/MeOH 10/0.5v/v):0.38;1H NMR(CDCl3,400MHz):δ7.5-6.7(m,14H,aryl),6.05(t,J=6.7Hz,1H),5.17(d,J=7.4Hz,1H),4.47(m,1H),4.13(m,1H),3.95(m,2H),3.71(s,6H,(O-CH3)2),3.48(m,4H,O(CH2)2),2.87(m,4H,N(CH2)2),2.6-2.3(m,2H),1.67(s,3H,C-CH3);13C NMR(CDCl3,400MHz):δ164.75,161.32,158.07,151.71,147.11,142.34,136.21,129.88,127.62,125.65,115.23,109.11,92.17,87.02,84.72,71.60,68.09,61.38,54.28,44.71,41.22,21.61。
5’-O-(二-对-甲氧基三苯甲基)-4-N-(1-(吗啉代)乙叉)-2’-脱氧胞苷-2-氰基乙基-N,N-二异丙基亚磷酰胺(15):
将5’-O-(二-对-甲氧基三苯甲基)-4-N-(1-吗啉代乙叉氨基)-2’-脱氧胞苷(14)(1.60g,0.0025摩尔)溶解于10mL干燥CH2Cl2。在连续氮气流和搅拌下将N,N-二异丙基乙基胺(6mL)添加到溶液中。将N,N-二异丙基-O-氰基乙基氯亚磷酰胺(590mg,0.0025摩尔)添加到溶液中,使反应在氩气下继续进行2h。在反应结束之后,将溶液倒入30mL的NaHCO3饱和水溶液中,并用CH2Cl2(3x 10mL)萃取。将合并的有机相用Na2SO4干燥,将溶剂蒸发。将所得油状物通过柱色谱用包含3%三乙胺的CH2Cl2纯化,得到作为白色泡沫状物的最终化合物。通过从二氯甲烷溶液中进行冷己烷沉淀来进一步纯化化合物(15)。收率:1.4g(66%)。Rf(CH2Cl2/MeOH 10/0.5v/v):0.4,31P NMR(CDCl3,400MHz):δ147.39,146.13(非对映异构体)。
以下实施例说明本申请所述的化合物(16-21)的通用合成策略。
合成5’-O-二甲氧基三苯甲基-2’-脱氧核糖核苷-3’-O-S-乙基硫代苯甲酸酯-吡咯烷基亚磷酰胺
将二(1-吡咯烷基)氯代膦(0.016摩尔,4克)溶解于250mL圆底烧瓶中的无水二氯甲烷(20mL),将三乙胺(1eq)添加到溶液中并在氩气下在室温搅拌。结束时,将5’-O-二甲氧基三苯甲基-2’-脱氧核糖核苷(0.016摩尔,1.0当量)添加到该溶液中。将混合物在氮气下在室温搅拌30分钟,这时31P NMR谱表明起始物质完全转化为产物。这时,将硫代水杨酸乙酯(1.0当量)添加到混合物中,之后立即经注射器历经15min逐滴添加1H-乙基硫基四唑(0.25M在无水乙腈中,Glen Research,VA,0.5当量)。将混合物在氮气下在室温搅拌,直到31P NMR谱表明亚磷酰二胺完全转化。将溶剂真空移除,粗产物通过Agilent制备HPLC SD-1系统使用乙腈在包含2%三甲胺的乙酸乙酯中的0-60%梯度分离。以下方案描述上述合成:
化合物(16):5’-O-二甲氧基三苯甲基-2’-脱氧胸苷-3’-O-S-乙基硫代苯甲酸酯-吡咯烷基亚磷酰胺。31P NMR(CD3CN):δ143.22,142.57(d)。ESI-MS(m/z):计算值826.2922(M+H)+,实测值826.2921(M+H)+
化合物(17):5’-O-二甲氧基三苯甲基-N6-(N,N-二甲基脒基)-2’-脱氧腺苷-3’-O-S-乙基硫代苯甲酸酯-吡咯烷基亚磷酰胺。31P NMR(CD3CN):δ142.92,142.79(d)。ESI-MS(m/z):计算值904.3616(M+H)+,实测值904.3607(M+H)+
化合物(18):5’-O-二甲氧基三苯甲基-N4-乙酰基-2’-脱氧胞苷-3’-O-S-乙基硫代苯甲酸酯-吡咯烷基亚磷酰胺。31P NMR(CD3CN):δ143.70,143.17(d)。ESI-MS(m/z):计算值853.3031(M+H)+,实测值853.3035(M+H)+
化合物(19):5’-O-二甲氧基三苯甲基-N4-(N-甲基-2-亚吡咯烷基)-2’-脱氧胞苷-3’-O-S-乙基硫代苯甲酸酯-吡咯烷基亚磷酰胺。31P NMR(CD3CN):δ143.41,142.80(d)。ESI-MS(m/z):计算值892.3504(M+H)+,实测值853.3506(M+H)+
化合物(20):5′-O-二甲氧基三苯甲基-N2-异丁酰基-2′-脱氧鸟苷-3′-O-S-乙基硫代苯甲酸酯-吡咯烷基亚磷酰胺。31P NMR(CD3CN):δ143.17,143.13(d)。ESI-MS(m/z):计算值921.3406(M+H)+,实测值921.3385(M+H)+
化合物(21):5’-O-二甲氧基三苯甲基-N2-(N,N-二甲基脒基)-2’-脱氧鸟苷-3’-O-S-乙基硫代苯甲酸酯-吡咯烷基亚磷酰胺。31P NMR(CD3CN):δ142.92,142.79(d)。ESI-MS(m/z):计算值920.3566(M+H)+,实测值920.3561(M+H)+
阵列的合成
DNA微阵列在Agilent阵列写入器上根据由Leproust等人在Nucleic AcidsResearch(2010),Vol.38(8),pp 2522-2540中描述的Agilent制造方法制造。一组5,528独特的寡聚核苷酸序列包含A,G,C,T且长度为178至202个核苷酸,其用以下化合物合成:T(16),C(18),A(17)和G(20)。寡聚核苷酸在甲硅烷基化的6.625x6寸晶片上的可断裂的连接基上原位合成。在合成结束时,将寡聚核苷酸脱保护并通过在室温进行的整夜氨气处理从单个载玻片断裂。寡聚核苷酸的序列包括:
·5’接头=29个核苷酸
·测序引物=32个核苷酸
·条形码=16个碱基
·查询序列=76或100个碱基
·3’接头=25个核苷酸
需要其以在Illumina MiSeq系统上进行测序分析。序列分析证明全长序列的完整性和存在。另外,单个200-mer寡聚核苷酸序列5’-AATGATACGGCGACCACCGAGATCTACACCGACAGGTTCAGAGTTCTACAGTCCGACGATCGACGTTCCCAGGATACTTATAGGAGGGGCAAACCTCTTCTCTAGAGTCGCTGGTCCTATCCAGTAAACCACTTGGTTAATGTAAGAGGCCCGCCTTTCGATCAGAAACGTCTGGATCTCGTATGCCGTCTTCTGCTTGT-3’(SEQ ID NO:1)在阵列上使用相同的过程和相同的亚磷酰胺化合物:T(16),A(17),C(18)和G(20)合成。如前述进行脱保护和与阵列的断裂。产物的变性聚丙烯酰胺凝胶电泳证明成功合成了200mer(图25)。
在说明书和所附权利要求中,除非上下文另有明确说明,否则单数形式“一个”、“一种”和“这个包括复数指代物。
除非另有定义,否则本申请使用的所有技术和科技术语具有的意义与本领域技术人员通常理解的相同。尽管与本申请所述那些相似或等同的任何方法和材料可以用于本申请的实践或测试,但是在本文只描述优选的方法和材料。除了公开的特定顺序之外,本申请记载的方法可以按逻辑可行的任何顺序进行。
通过参考并入
在本申请进行对其它文件如专利、专利申请、专利公开、期刊、课本、论文、网页内容的参考和引用。所有这样的文件针对所有目的以全部内容通过参考并入本申请。文件的任何材料或其部分通过参考并入本申请但是又不与现有定义、声明、或本申请明确陈述的其它公开材料矛盾,因为其并入程度仅为不会在并入材料和本申请材料之间产生矛盾。在矛盾的情况下,按有利于本申请作为优选公开内容的方式解决矛盾。
等价物
本申请公开的代表性实施例意在帮助说明本发明,且不意在也不应将其解释为限制本发明的范围。实际上,除了本申请所示和描述的那些之外,在参阅了本文的全部内容之后,本发明的各种修改以及很多进一步的实施方式也将是本领域技术人员显而易见的,包括之后的实施例以及对本申请引用的科技和专利文献的参考。本申请所述的实施例包含重要的额外信息,可在其各种实施方式及其等价物中适用于本发明实践的例证和指导。
实施方式
本申请的各方面包括具有结构式(I)的化合物:
其中B是核碱基或其类似物;R1和R2各自独立地为直链、支化或环状的、取代的或未取代的烷基,或者R1和R2共同形成5元、6元、7元或8元的非芳环;R3是酸不稳定的保护基团;以及R是选自苄醇衍生物、α-甲基芳基醇衍生物、萘醇衍生物、双环脂族醇衍生物、S-乙基硫代酸酯衍生物和氨基酸衍生物的基团,条件是R不是邻-甲基苄基。
在化合物的一些实施方式中,B是核碱基或保护的核碱基,其中核碱基选自腺嘌呤,鸟嘌呤,胸腺嘧啶,胞嘧啶和尿嘧啶;以及R3是选自DMT,MMT,TMT,9-苯基黄嘌呤-9-基和特戊酰基的基团。在化合物的一些实施方式中,R1和R2各自独立地为直链、支化或环状的、取代的或未取代的C1-C18烷基。在化合物的一些实施方式中,R1和R2各自独立地为直链或支化的未取代的C1-C6烷基。在一些实施方式中,化合物具有结构式(Ia):
在化合物的一些实施方式中,R1和R2共同形成5元或6元的非芳环,其中该环在主链中含有0或1个杂原子。在化合物的一些实施方式中,R1和R2共同形成5元的非芳环,其中该环在主链中含有0个杂原子。在一些实施方式中,化合物具有结构式(Ib):
其中R4各自选自氢,卤素,C1-C6烷基和C1-C6烷氧基。在一些实施方式中,化合物具有式Ic的结构
在一些实施方式中,化合物具有结构式(Id):
其中R7各自独立地为氢,卤素,C1-C6烷基或C1-C6烷氧基。
在一些实施方式中,化合物具有结构式(If):
其中R8是脂族基团。
在化合物的一些实施方式中,R是具有结构式(II)的苄醇的衍生物:
其中:Ra是氢或烷基;R11各自独立地为氢,烷基,烷氧基,烷基-S-,氰基,甲基氰基或卤素;以及n为1、2或3。
在化合物的一些实施方式中,R是选自以下的苄醇的衍生物:
其中R6各自独立地选自氢,卤素,氰基,甲基氰基和烃基。在化合物的一些实施方式中,R是具有以下结构的苄醇的衍生物:
其中R7是一个或多个取代基,其各自独立地选自氢,卤素,C1-C6烷基,C1-C6烷氧基和吸电子基团。
在化合物的一些实施方式中,R是具有结构式(III)的α-甲基芳基醇的衍生物:
其中X是氢,卤素,氰基,甲基氰基或三氟甲基;Y是氢,烷基,卤代烷基或烷氧基烷基;Ra是氢或烷基。
在化合物的一些实施方式中,R是选自以下的α-甲基芳基醇的衍生物:
其中R9是卤素,氰基或三氟甲基;以及R10选自氢,卤素,C1-C6烷基和C1-C6烷氧基。
在化合物的一些实施方式中,R是具有结构式(IV)的萘醇的衍生物:
其中R7选自氢,卤素,C1-C6烷基和C1-C6烷氧基;R5选自氢和烃基;R12选自氢和烷氧基。
在化合物的一些实施方式中,R是选自以下的萘醇的衍生物:
其中R13是C1-C6烷基。
在化合物的一些实施方式中,R是具有结构式(V)或(VI)的双环脂族醇的衍生物:
其中R14选自氢,卤素,C1-C6烷基和C1-C6烷氧基;R15和R16各自独立地为氢,氰基,烷氧基,或卤素;m为1或2。
在化合物的一些实施方式中,R是选自以下的双环脂族醇的衍生物:
其中R14是氢,卤素,C1-C6烷基或C1-C6烷氧基;R15是氢,卤素或C1-C6烷氧基;以及R16是氢,氰基,或卤素。
在化合物的一些实施方式中,R是:
其中R7选自氢,卤素,烃基和烷氧基。
在化合物的一些实施方式中,R选自:
在化合物的一些实施方式中,R是
其中R7是氢,卤素,C1-C6烷基或C1-C6烷氧基。
在化合物的一些实施方式中,R是
其中R8是脂族基团。
在化合物的一些实施方式中,B包括脒核碱基保护基团。在化合物的一些实施方式中,脒核碱基保护基团是乙脒保护基团。在化合物的一些实施方式中,乙脒保护基团由以下结构描述:
其中R21和R22各自独立地为烷基、取代的烷基,或者R21和R22以环状连接,从而形成5元或6元的取代的或未取代的杂环。在化合物的一些实施方式中,R21和R22是甲基。在化合物的一些实施方式中,R21和R22以环状连接,从而形成5元或6元的取代的或未取代的杂环,其中所述杂环选自吗啉,哌啶和吡咯烷。
在化合物的一些实施方式中,乙脒保护基团由以下结构描述:
在化合物的一些实施方式中,B由以下结构之一描述:
在化合物的一些实施方式中,R是
其中R7选自氢,卤素,烃基和烷氧基。
也提供了具有结构式(VII)的化合物
其中R1和R2各自为异丙基,或者R1和R2连同与它们相连的N共同形成吡咯烷杂环;R3是酸不稳定的保护基团;R’是选自氰基乙基和甲基的基团;以及B是选自以下的保护的核碱基:
本申请也提供了合成多聚核苷酸的方法,所述方法包括:(a)提供具有未保护的羟基的核苷残基;和(b)使所述核苷残基与核苷单体(例如,如本申请所述)接触,从而将所述核苷单体与所述核苷残基共价键接以及制备所述多聚核苷酸。在一些实施方式中,方法还包括使所述多聚核苷酸暴露于氧化剂。在一些实施方式中,方法还包括使核酸暴露于脱保护剂。在一些实施方式中,方法还包括重复所述接触步骤至少一次。在方法的一些实施方式中,使所述核苷残基共价键接于固相载体。在一些实施方式中,方法还包括使核酸从所述固相载体断裂,从而产生游离核酸。在方法的一些实施方式中,核酸是具有至少约200个核苷酸的序列的DNA。在方法的一些实施方式中,核酸是具有约200至约1,000个核苷酸的长度的DNA。在方法的一些实施方式中,DNA的长度为约300至约500个核苷酸。在方法的一些实施方式中,DNA具有少于2个单核苷酸缺失/100个核苷酸。在方法的一些实施方式中,DNA具有1个或更少的单核苷酸缺失/100个核苷酸。在一些实施方式中,方法还包括将第一游离核酸与第二游离核酸偶联,从而制备具有约300至约10,000个核苷酸的长度的延长的游离核酸在一些实施方式中,方法还包括将一个或多个另外的游离核酸与所述延长的游离核酸偶联,从而制备基因。
本申请也提供了通过上述主题方法的任一项实施方式制备的核酸产品。本申请也提供了通过上述主题方法的任一项实施方式合成的核酸的阵列。本申请也提供了一种文库,其包括多个通过上述主题方法的任一项实施方式合成的核酸。本申请也提供了一种文库,其包括多个长度为约300至约10,000个核苷酸的核酸,其中每个核酸由通过上述主题方法的任一项实施方式合成的组装的核酸片段构成。在文库的一些实施方式中,将所述多个核酸组装成基因。

Claims (51)

1.具有结构式(I)的化合物:
其中
B是核碱基或其类似物;
R1和R2各自独立地为直链、支化或环状的、取代的或未取代的烷基,或者R1和R2共同形成5元、6元、7元或8元的非芳环;
R3是酸不稳定的保护基团;以及
R是选自苄醇衍生物、α-甲基芳基醇衍生物、萘醇衍生物、双环脂族醇衍生物、S-乙基硫代酸酯醇衍生物和氨基酸衍生物的基团,条件是R不是邻-甲基苄基。
2.权利要求1的化合物,其中:
B是核碱基或保护的核碱基,其中所述核碱基选自腺嘌呤,鸟嘌呤,胸腺嘧啶,胞嘧啶和尿嘧啶;以及
R3是选自DMT、MMT、TMT、9-苯基黄嘌呤-9-基和特戊酰基的基团。
3.权利要求1的化合物,其中R1和R2各自独立地为直链、支化或环状的、取代的或未取代的C1-C18烷基。
4.权利要求3的化合物,其中R1和R2各自独立地为直链或支化的未取代的C1-C6烷基。
5.权利要求4的化合物,其具有结构式(Ia):
6.权利要求1的化合物,其中R1和R2共同形成5元或6元的非芳环,其中该环在主链中含有0或1个杂原子。
7.权利要求6的化合物,其中R1和R2共同形成5元的非芳环,其中该环在主链中含有0个杂原子。
8.权利要求1的化合物,其具有结构式(Ib):
其中R4各自选自氢,卤素,C1-C6烷基和C1-C6烷氧基。
9.权利要求8的化合物,其具有式Ic的结构
10.权利要求8的化合物,其具有结构式(Id):
其中R7各自独立地为氢,卤素,C1-C6烷基或C1-C6烷氧基。
11.权利要求8的化合物,其具有结构式(If):
其中R8是脂族基团。
12.权利要求1-9任一项的化合物,其中R是具有结构式(II)的苄醇的衍生物:
其中:
Ra是氢或烷基;
R11各自独立地为氢,烷基,烷氧基,烷基-S-,氰基,甲基氰基或卤素;以及
n为1、2或3。
13.权利要求12的化合物,其中R是选自以下的苄醇的衍生物:
其中R6各自独立地选自氢,卤素,氰基,甲基氰基和烃基。
14.权利要求12的化合物,其中R是具有以下结构的苄醇的衍生物:
其中R7是一个或多个取代基,其各自独立地选自氢,卤素,C1-C6烷基,C1-C6烷氧基和吸电子基团。
15.权利要求1-9任一项的化合物,其中R是具有结构式(III)的α-甲基芳基醇的衍生物:
其中X是氢,卤素,氰基,甲基氰基或三氟甲基;Y是氢,烷基,卤代烷基或烷氧基烷基;Ra是氢或烷基。
16.权利要求15的化合物,其中R是选自以下的α-甲基芳基醇的衍生物:
其中
R9是卤素,氰基或三氟甲基;以及
R10选自氢,卤素,C1-C6烷基和C1-C6烷氧基。
17.权利要求1-9任一项的化合物,其中R是具有结构式(IV)的萘醇的衍生物:
其中R7选自氢,卤素,C1-C6烷基和C1-C6烷氧基;R5选自氢和烃基;R12选自氢和烷氧基。
18.权利要求17的化合物,其中R是选自以下的萘醇的衍生物:
其中R13是C1-C6烷基。
19.权利要求1-9任一项的化合物,其中R是具有结构式(V)或(VI)的双环脂族醇的衍生物:
其中R14选自氢,卤素,C1-C6烷基和C1-C6烷氧基;R15和R16各自独立地为氢,氰基,烷氧基,或卤素;m为1或2。
20.权利要求19的化合物,其中R是选自以下的双环脂族醇的衍生物:
其中
R14是氢,卤素,C1-C6烷基或C1-C6烷氧基;
R15是氢,卤素或C1-C6烷氧基;以及
R16是氢,氰基,或卤素。
21.权利要求1-9任一项的化合物,其中R是:
其中R7选自氢,卤素,烃基和烷氧基。
22.权利要求1-9任一项的化合物,其中R选自:
23.权利要求1的化合物,其中R是
其中R7是氢,卤素,C1-C6烷基或C1-C6烷氧基。
24.权利要求1的化合物,其中R是
其中R8是脂族基团。
25.权利要求1-24任一项的化合物,其中B包括脒核碱基保护基团。
26.权利要求25的化合物,其中所述脒核碱基保护基团是乙脒保护基团。
27.权利要求26的化合物,其中所述乙脒保护基团由以下结构描述:
其中R21和R22各自独立地为烷基、取代的烷基,或者R21和R22以环状连接,从而形成5元或6元的取代的或未取代的杂环。
28.权利要求27的化合物,其中R21和R22是甲基。
29.权利要求27的化合物,其中R21和R22以环状连接,从而形成5元或6元的取代的或未取代的杂环,其中所述杂环选自吗啉,哌啶和吡咯烷。
30.权利要求26、27和29任一项的化合物,其中所述乙脒保护基团由以下结构描述:
31.权利要求25-30任一项的化合物,其中B由以下结构之一描述:
32.权利要求31的化合物,其中R是
其中R7选自氢,卤素,烃基和烷氧基。
33.具有结构式(VII)的化合物
其中
R1和R2各自为异丙基,或者R1和R2连同与它们相连的N共同形成吡咯烷杂环;
R3是酸不稳定的保护基团;
R’是选自氰基乙基和甲基的基团;以及
B是选自以下的保护的核碱基:
34.合成多聚核苷酸的方法,所述方法包括:
(a)提供具有未保护的羟基的核苷残基;和
(b)使所述核苷残基与权利要求1-28任一项的核苷单体接触,从而将所述核苷单体与所述核苷残基共价键接以及制备所述多聚核苷酸。
35.权利要求34的方法,其还包括使所述多聚核苷酸暴露于氧化剂。
36.权利要求34的方法,其还包括使核酸暴露于脱保护剂。
37.权利要求34的方法,其还包括重复所述接触步骤至少一次。
38.权利要求34的方法,其中使所述核苷残基共价键接于固相载体。
39.权利要求38的方法,其中所述方法还包括使核酸从所述固相载体断裂,从而产生游离核酸。
40.权利要求39的方法,其中核酸是具有至少约200个核苷酸的序列的DNA。
41.权利要求40的方法,其中核酸是具有约200至约1,000个核苷酸的长度的DNA。
42.权利要求41的方法,其中所述DNA的长度为约300至约500个核苷酸。
43.权利要求40的方法,其中所述DNA具有1个或更少的单核苷酸缺失/100个核苷酸。
44.权利要求39的方法,其还包括将第一游离核酸与第二游离核酸偶联,从而制备具有约300至约10,000个核苷酸的长度的延长的游离核酸。
45.权利要求39的方法,其还包括将一个或多个另外的游离核酸与所述延长的游离核酸偶联,从而制备基因。
46.通过权利要求34-45中任一项的方法制备的核酸产品。
47.通过权利要求34-43中任一项的方法合成的核酸的阵列。
48.一种文库,其包括多个通过权利要求34-45中任一项的方法合成的核酸。
49.一种文库,其包括多个长度为约300至约10,000个核苷酸的核酸,其中每个核酸由通过权利要求34-45中任一项的方法合成的组装的核酸片段构成。
50.权利要求47的文库,其中将所述多个核酸组装成基因。
51.通过权利要求44和45中任一项的方法制备的核酸产品。
CN201580022581.1A 2014-04-30 2015-04-30 磷保护基团及其制备方法和用途 Active CN106255697B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201461986594P 2014-04-30 2014-04-30
US61/986,594 2014-04-30
PCT/US2015/028624 WO2015168461A2 (en) 2014-04-30 2015-04-30 Phosphorous protecting groups and methods of preparation and use thereof

Publications (2)

Publication Number Publication Date
CN106255697A true CN106255697A (zh) 2016-12-21
CN106255697B CN106255697B (zh) 2020-04-28

Family

ID=54354752

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580022581.1A Active CN106255697B (zh) 2014-04-30 2015-04-30 磷保护基团及其制备方法和用途

Country Status (6)

Country Link
US (3) US10196418B2 (zh)
EP (2) EP3943500A1 (zh)
JP (1) JP6730932B2 (zh)
KR (1) KR102375480B1 (zh)
CN (1) CN106255697B (zh)
WO (1) WO2015168461A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113461743A (zh) * 2021-07-09 2021-10-01 中国石油大学(华东) 6-甲硫基乙基嘌呤-2’-脱氧核苷及其制备方法和应用

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10196418B2 (en) 2014-04-30 2019-02-05 Agilent Technologies, Inc. Phosphorous protecting groups and methods of preparation and use thereof
EP3430019A4 (en) 2016-03-13 2019-10-30 Wave Life Sciences Ltd. COMPOSITIONS AND METHODS FOR PHOSPHORAMIDITE AND OLIGONUCLEOTIDE SYNTHESIS
US11873316B2 (en) 2016-11-23 2024-01-16 Wave Life Sciences Ltd. Compositions and methods for phosphoramidite and oligonucleotide synthesis
TW201900170A (zh) 2017-05-01 2019-01-01 美商施萬生物製藥研發 Ip有限責任公司 使用jak抑制劑化合物之治療方法
EP4006045A4 (en) * 2019-08-29 2022-10-19 FUJIFILM Corporation METHOD FOR PRODUCTION OF A NUCLEIC ACID COMPOUND AND NUCLEIC ACID COMPOUND
EP3805242A1 (en) * 2019-10-07 2021-04-14 Sterna Biologicals GmbH & Co. KG Method for the production of a catalytically active dna molecule having improved activity and its use in a method of treating asthma

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999040101A1 (en) * 1998-02-10 1999-08-12 Isis Pharmaceuticals, Inc. Synthetic process for the preparation of oligonucleotides, nucleoside synthons used therein, and oligonucleotides prepared thereby
US6274725B1 (en) * 1998-06-02 2001-08-14 Isis Pharmaceuticals, Inc. Activators for oligonucleotide synthesis
US20060178507A1 (en) * 2004-12-30 2006-08-10 Berry & Associates, Inc. Fluorous oligonucleotide reagents and affinity purification of oligonucleotides
US20130052690A1 (en) * 2011-08-22 2013-02-28 Samsung Electronics Co., Ltd. Pcr primer and method for reducing non-specific nucleic acid amplification using a photolabile protecting group

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4415732A (en) 1981-03-27 1983-11-15 University Patents, Inc. Phosphoramidite compounds and processes
JPS6251695A (ja) * 1985-08-29 1987-03-06 Yuki Gosei Yakuhin Kogyo Kk ホスホロアミダイト類の合成法
NL8700724A (nl) * 1987-03-27 1988-10-17 Univ Eindhoven Tech Poly(deoxyribonucleotiden), farmaceutische samenstellingen, gebruik en bereiding van de poly(deoxyribonucleotiden).
US5955591A (en) * 1993-05-12 1999-09-21 Imbach; Jean-Louis Phosphotriester oligonucleotides, amidites and method of preparation
US5948902A (en) 1997-11-20 1999-09-07 South Alabama Medical Science Foundation Antisense oligonucleotides to human serine/threonine protein phosphatase genes
US6531590B1 (en) * 1998-04-24 2003-03-11 Isis Pharmaceuticals, Inc. Processes for the synthesis of oligonucleotide compounds
US6222030B1 (en) 1998-08-03 2001-04-24 Agilent Technologies, Inc. Solid phase synthesis of oligonucleotides using carbonate protecting groups and alpha-effect nucleophile deprotection
EP1176151B1 (en) 2000-07-28 2014-08-20 Agilent Technologies, Inc. Synthesis of polynucleotides using combined oxidation/deprotection chemistry
IN2015DN01765A (zh) * 2012-08-20 2015-05-29 Univ California
US10196418B2 (en) 2014-04-30 2019-02-05 Agilent Technologies, Inc. Phosphorous protecting groups and methods of preparation and use thereof

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999040101A1 (en) * 1998-02-10 1999-08-12 Isis Pharmaceuticals, Inc. Synthetic process for the preparation of oligonucleotides, nucleoside synthons used therein, and oligonucleotides prepared thereby
US6274725B1 (en) * 1998-06-02 2001-08-14 Isis Pharmaceuticals, Inc. Activators for oligonucleotide synthesis
US20060178507A1 (en) * 2004-12-30 2006-08-10 Berry & Associates, Inc. Fluorous oligonucleotide reagents and affinity purification of oligonucleotides
US20130052690A1 (en) * 2011-08-22 2013-02-28 Samsung Electronics Co., Ltd. Pcr primer and method for reducing non-specific nucleic acid amplification using a photolabile protecting group

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113461743A (zh) * 2021-07-09 2021-10-01 中国石油大学(华东) 6-甲硫基乙基嘌呤-2’-脱氧核苷及其制备方法和应用

Also Published As

Publication number Publication date
WO2015168461A2 (en) 2015-11-05
US20150315227A1 (en) 2015-11-05
KR20160147973A (ko) 2016-12-23
US11104699B2 (en) 2021-08-31
EP3137478A2 (en) 2017-03-08
KR102375480B1 (ko) 2022-03-16
US20220002334A1 (en) 2022-01-06
EP3943500A1 (en) 2022-01-26
EP3137478A4 (en) 2018-03-07
CN106255697B (zh) 2020-04-28
US10196418B2 (en) 2019-02-05
US20190194242A1 (en) 2019-06-27
JP2017518966A (ja) 2017-07-13
JP6730932B2 (ja) 2020-07-29
US11584773B2 (en) 2023-02-21
EP3137478B1 (en) 2021-09-22
WO2015168461A3 (en) 2015-12-23

Similar Documents

Publication Publication Date Title
CN106255697A (zh) 磷保护基团及其制备方法和用途
KR102190852B1 (ko) 변형된 커플링 프로토콜을 이용하는 올리고머 화합물의 제조 방법
Malek-Adamian et al. Adjusting the structure of 2′-modified nucleosides and oligonucleotides via C4′-α-F or C4′-α-OMe substitution: synthesis and conformational analysis
JP2005089441A (ja) 立体規則性の高いリン原子修飾ヌクレオチド類縁体の製造法
Carrette et al. A mildly inducible and selective cross-link methodology for RNA duplexes
JP2011088935A (ja) リン原子修飾ヌクレオチド類縁体の製造のための光学活性ヌクレオシド3’−ホスホロアミダイト
Horiba et al. Synthesis of scpBNA-mC,-A, and-G monomers and evaluation of the binding affinities of scpBNA-modified oligonucleotides toward complementary ssRNA and ssDNA
JP5194256B2 (ja) 2’水酸基修飾リボヌクレオシド誘導体
Haziri et al. Synthesis and pairing properties of oligodeoxynucleotides containing Bicyclo-RNA and Bicyclo-ANA modifications
Maeda et al. Synthesis and Properties of 4′-ThioLNA/BNA
EP1425417B1 (de) Detektion von wechselwirkungen auf sonden-arrays
Sekine Recent development of chemical synthesis of RNA
Zhou et al. Synthesis and evaluation of (S)-5′-C-aminopropyl and (S)-5′-C-aminopropyl-2′-arabinofluoro modified DNA oligomers for novel RNase H-dependent antisense oligonucleotides
Smicius et al. Preparation of zwitterionic ribonucleoside phosphoramidites for solid-phase siRNA synthesis
WO2015191303A2 (en) Protecting groups for "z nucleotide" and methods thereof
KR102325668B1 (ko) 고체 표면에 생체분자의 강한 고정용 디티올란 기능화된 뉴클레오시드 아미디트 및 지지체
Moriguchi et al. Novel method of the synthesis and hybridization properties of an oligonucleotide containing non-ionic diisopropylsilyl internucleotide linkage
CA2078256A1 (en) Synthesis of sulfide-linked di-or oligonucleotide analogs and incorporation into antisense dna or rna
WO2004048376A1 (ja) 二環性ナフチリジンヌクレオシド
EP1726597A1 (en) NOVEL ARTIFICIAL RNAóS MODIFIED AT THE 2ó-HYDROXYL GROUP
KR20240131337A (ko) 폴리뉴클레오티드 제조 방법
CN116981676A (zh) 用于减少由最终脱保护期间烷基胺暴露造成的脱嘧啶化的氢化肉桂酰基保护的核糖鸟苷亚磷酰胺
JP2005046073A (ja) 修飾核酸を用いるrna転写および/または増幅方法
Sharma et al. Sugar-Modified Mercaptoacetamido-linked Nonionic Nucleoside Dimer.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
TA01 Transfer of patent application right

Effective date of registration: 20170411

Address after: American California

Applicant after: Anjelen Sci. & Tech. Inc.

Applicant after: The Regents of the University of Colorado, a Body Corporate

Address before: American California

Applicant before: Anjelen Sci. & Tech. Inc.

TA01 Transfer of patent application right
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant