具体实施方式
I.定义
如本文所用,术语烷基、烯基和炔基包括直链和支链单价取代基。示例包括甲基、乙基、异丁基、3-丁炔基等。可用于本文所述的化合物和方法的这些基团的范围包括C1-C20烷基、C2-C20烯基和C2-C20炔基。可用于本文所述的化合物和方法的这些基团的另外的范围包括C1-C12烷基、C2-C12烯基、C2-C12炔基、C1-C6烷基、C2-C6烯基、C2-C6炔基、C1-C4烷基、C2-C4烯基和C2-C4炔基。
芳基分子包括例如环状烃,其结合一个或多个平面组的(通常为六个的)碳原子,这些碳原子通过编号相同的离域电子连接,就好像它们由交替的单和双共价键组成一样。芳基分子的一个示例是苯。杂芳基分子包括沿其主环原子链(例如O、N或S)的取代。当引入杂原子时,一组五个原子(例如四个碳和一个杂原子)可以创建芳族体系。杂芳基分子的示例包括呋喃、吡咯、噻吩、咪唑、噁唑、吡啶和吡嗪。芳基和杂芳基分子还可以包括另外的稠环,例如苯并呋喃、吲哚、苯并噻吩、萘、蒽和喹啉。除非另有说明,否则芳基和杂芳基分子可以连接在环上的任何位置。
如本文所用的术语烷氧基是通过单个末端醚键结合的烷基基团。同样,如本文所用的术语芳氧基是通过单个末端醚键结合的芳基基团。
如本文所用的术语胺或氨基由式—NZ1Z2表示,其中Z1和Z2可以各自为如本文所述的取代基,例如上文所述的氢、烷基、卤代烷基、烯基、炔基、芳基、杂芳基、环烷基、环烯基、杂环烷基或杂环烯基基团。
本文所用的烷氧基、芳氧基、氨基、烷基、烯基、炔基和芳基分子可以是取代的或未取代的。如本文所用,术语取代包括将取代基添加至与烷氧基、芳氧基、氨基、烷基、烯基、炔基和芳基的主链连接的位置,例如,氢被取代基替换。取代基的示例包括但不限于羟基、卤素(例如F、Br、Cl或I)和羧基。相反,如本文所用,术语未取代表示烷氧基、芳氧基、氨基、烷基、烯基、炔基或芳基具有完整的氢,即与其饱和水平相当,没有取代,例如直链癸烷(–(CH2)9–CH3)。
II.组合物
本文描述了包括核苷酸部分的含吖啶酯的化合物。如本文所用,术语“核苷酸部分”是指包括含氮碱基、糖组分(例如,5-碳糖)或其衍生物以及至少一个磷酸基团的基团。
本文所述的含吖啶酯的化合物包括由式I表示的化合物:
在式I中,R1、R2和R3各自独立地不存在或为连接基团。如本文所用,“连接基团”是指位于吖啶部分上的位置与R7基团之间的部分,其在下文进一步定义。在一些实施方案中,连接基团选自由取代或未取代的烷氧基、取代或未取代的烷基(例如,C1-8取代或未取代的烷基)、取代或未取代的烯基(例如,C2-8取代或未取代的烯基)、取代或未取代的炔基(例如,C3-8取代或未取代的炔基),以及取代或未取代的芳基组成的组。任选地,R1、R2和/或R3不存在,这意味着连接基团不作为R1、R2和/或R3存在。在这些实施方案中,R7直接连接到吖啶部分。
同样在式I中,R4、R5和R6各自独立地选自由氢、取代或未取代的C1-8烷基、取代或未取代的C2-8烯基和取代或未取代的C2-8炔基组成的组。任选地,R4、R5和R6未被核苷酸部分取代。在一些情况下,R4、R5和R6各自独立地选自由氢和取代或未取代的C1-6烷基组成的组。在一些情况下,R4、R5和R6各自独立地选自氢和甲基。在一些实施方案中,R4和R5相同(例如,R4和R5两者都是氢或R4和R5两者都是取代或未取代的C1-8烷基,例如甲基)。任选地,R4是甲基,R5是甲基,并且R6是氢。任选地,R4、R5和R6中的每一个是氢。
另外在式I中,每个R7独立地不存在、为氢、蛋白质(例如抗体)或由结构A表示的核苷酸部分:
在结构A中,R8是含氮碱基,如下文进一步定义,并且R9是氢或阻断基团,如下文进一步定义。
在一些情况下,根据式I的化合物中存在的三个R7基团中只有一个是由结构A表示的核苷酸部分。例如,如果与R1连接的R7基团是核苷酸部分,则与R2和R3连接的R7基团独立地不存在或为氢。类似地,如果与R2连接的R7基团是核苷酸部分,则与R1和R3连接的R7基团独立地不存在或为氢。同样,如果与R3连接的R7基团是核苷酸部分,则与R1和R2连接的R7基团独立地不存在或为氢。
在一些情况下,R7是核苷酸部分。在这些情况下,R8可以是含氮碱基。示例性的含氮碱基包括腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)、尿嘧啶(U)、肌苷(I)和它们的衍生物。示例性含氮碱基如下所示:
一方面,含氮碱基是腺嘌呤、肌苷或鸟嘌呤的7-脱氮衍生物。在某些情况下,7-脱氮腺嘌呤、肌苷和/或鸟嘌呤衍生物通过7位与R7中的炔基基团连接(即,7-脱氮腺嘌呤、肌苷和/或鸟嘌呤衍生物是通过R7的炔基由R7进行7-取代的)。在一些情况下,尿嘧啶、胞嘧啶、胸腺嘧啶和/或其衍生物是5-取代的。例如,5-取代的尿嘧啶、胞嘧啶、胸腺嘧啶和/或其衍生物可以通过5-位连接到R7中的炔基基团(即,5-取代的尿嘧啶、胞嘧啶、胸腺嘧啶和/或其衍生物是通过R7的炔基基团被R7取代的)。
任选地,R9可以是氢或阻断基团。如本文所用,术语“阻断基团”是指可被裂解以在核苷酸类似物的3’-位提供羟基基团的任何基团。阻断基团可以是可通过物理方式、化学方式、热和/或光而裂解的。任选地,阻断基团可通过酶促方式裂解。在一些实施方案中,阻断基团是含叠氮基的阻断基团(例如–CH2N3)。在一些实施方案中,阻断基团是含氨基的阻断基团(例如-–NH2)。在一些实施方案中,阻断基团是含烯丙基的阻断基团(例如–CH2CH=CH2)。在一些实施方案中,阻断基团是含烷氧基的阻断基团(例如–CH2OCH3)或含芳氧基的阻断基团(例如–CH2OPh)。在一些实施方案中,阻断基团是聚乙二醇(PEG)。在一些实施方案中,阻断基团是取代或未取代的烷基(即,取代或未取代的烃)。任选地,R9可以是如下所示的基团:
在一些情况下,一个或多个R7基团可以是蛋白质。例如,一个或多个R7基团可以是能够识别核苷酸的抗体或其他蛋白质。
此外,在式I中,X-是吖啶部分的季氮的抗衡阴离子。示例性的抗衡阴离子包括例如卤化物(例如,Cl-、Br-、I-、F-)、CH3SO4 -、FSO3 -、CF3SO3 -、C4F9SO3 -、CH3C6H4SO3 -、CF3COO-、CH3COO-和NO3 -。任选地,抗衡阴离子可以直接与式I中的取代基结合。
根据式I的含吖啶酯的化合物的示例包括以下:
在式I-A和式I-B中,X-、R1、R2、R3和每个R7如上文针对式I所定义。式I-A可称为“AE-D”(AE-二甲基)并且式I-B可称为“AE-H”(AE-氢)。
在一些实施方案中,根据式I-B的化合物由以下之一表示:
在一些示例中,根据式I-A的化合物由以下之一表示:
如本领域技术人员所理解的,本文所述的化合物可以以有机合成领域中已知的多种方式或其变体来制备。本文所述的化合物可以由容易获得的起始材料制备。最佳反应条件可随所用的具体反应物或溶剂而变化,但此类条件可由本领域技术人员确定。
式I和本文描述的化合物的变体包括如针对每种化合物描述的各种成分的添加、减少或移动。类似地,当分子中存在一个或多个手性中心时,可以改变分子的手性。此外,化合物合成可涉及各种化学基团的保护和去保护。保护和去保护的使用以及合适保护基团的选择可以由本领域技术人员确定。保护基的化学可以在例如Wuts和Greene,ProtectiveGroups in Organic Synthesis,第4版,Wiley&Sons,2006(其通过引用以其整体并入本文)中找到。考虑到了本文所述的各种化合物的合成和随后的测试以确定功效。
产生本文所述化合物的反应可以在溶剂中进行,溶剂可以由有机合成领域的技术人员选择。在进行反应的条件(即温度和压力)下,溶剂可以基本上不与起始材料(反应物)、中间体或产物反应。反应可以在一种溶剂或多于一种溶剂的混合物中进行。可以根据本领域已知的任何合适的方法监测产物或中间体形成。例如,产物形成可以通过诸如核磁共振光谱法(例如1H或13C)、红外光谱法、分光光度法(例如UV-可见)或质谱法(MS)之类的光谱手段,或者通过诸如高效液相色谱法(HPLC)或薄层色谱法(TLC)之类的色谱法进行监测。
任选地,本文所述的化合物可以通过使用可商购的dNTP来合成。可商购的dTNPs可以通过磷酸盐共轭反应与接头或结合分子共轭。dNTP的3’-位可以通过化合物与保护基团的反应来阻断。共轭和阻断反应可以按任何顺序进行。
通过如本文所述的吖啶酯-三磷酸酯可逆终止子共轭物实现的信号定位通过以下方案1中所示的反应机理进行描述。
方案1:信号定位反应机制
如以上方案1中所示,如本文所述的吖啶酯化合物(结构1)暴露于过氧化物源。然后过氧化氢阴离子攻击吖啶部分以形成结构2,这引发对羰基基团的分子内亲核攻击以形成二氧杂环丁烷中间体结构3。结构3高度应变并分解以形成结构4并发光。结构4作为激发后的吖啶部分(如星号所示),仍与三磷酸酯可逆终止子(即R7)连接。
III.具有可区分特性或最少串扰的AE对
有利地,具有不同信号产生特性的AE对可用于核酸测序方法,例如合成测序(SBS)方法。在一种方法中,AE对包含式I-A的第一化合物(AE-D)和式I-B的第二化合物(AE-H),例如化合物2B和化合物1B或化合物2A和化合物1A。可以使用本领域普通技术人员已知的方法确定合适的AE对。
AE的不同信号产生特性包括当存在过氧化物(例如,过氧化氢或过氧化氢-脲络合物)和表面活性剂[例如,Triton X-100(4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇)或Triton X-114(1,1,3,3-四甲基丁基)苯基-聚乙二醇)]时不同初始信号强度下的光发射。例如,AE-H和AE-D可以以高或非常低(例如,零)的初始信号强度发光,具体取决于过氧化物浓度和某些表面活性剂的存在、不存在或水平。为了说明,表1显示了AE对(AE-D和AE-H)以不同强度发光的示例性条件。期望地并如表1和图1所示的那样,AE对的两个AE成员在预定条件下具有最小的串扰。
在一种方法中,预定条件包括过氧化物浓度以及表面活性剂类型和浓度。
在一种方法中,“最小的串扰”是指在第一预定条件下来自AE对的第一成员的初始信号强度是在第一预定条件下AE对的第二成员的初始信号强度的至少10、至少50、至少100、至少500或至少1000倍,并且在第二预定条件下来自AE对的第二第一成员的初始信号强度是在第二预定条件下AE对的第一成员的初始信号强度的至少10,至少50、至少100、至少500或至少1000倍。在一个实施方案中,“最小的串扰”是指在第一预定条件下来自AE对的第一成员的初始信号强度是在第一预定条件下AE对的第二成员的初始信号强度的至少50倍,并且在第二预定条件下来自AE对的第二第一成员的初始信号强度是在第二预定条件下AE对的第一成员的初始信号强度的至少50倍。
表1和图1图示了包含AE-D[在图1中标识为“AE(D)”]和AE-H[在图1中标识为“AE”]的AE对具有最小的串扰的条件。该图示中使用的AE对是化合物2B和化合物1B。
表1
如上所述,第一和第二预定条件可以包括过氧化物浓度和表面活性剂类型和浓度。示例性过氧化物浓度的范围可以从例如但不限于0.0005%至0.010%(例如0.005%),有时称为“低浓度”,以及从0.011%至1.0%(例如0.5%),有时称为“高浓度”。
示例性表面活性剂包括阳离子、阴离子和非离子表面活性剂。在一些示例中,表面活性剂可包括Triton X-100(4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇)、十六烷基三甲基甲苯磺酸铵(CTAT)、表2中所示的其他表面活性剂以及表面活性剂的组合。可以凭经验确定用于给定AE对的每种表面活性剂的最佳浓度。CTAT的有用浓度包括1.0mM至10.0mM(例如7mM)的范围,并且Triton X-100的有用浓度包括0.5%至5%(例如,2%)。表面活性剂的其他示例性浓度显示在表2中。
表2
表面活性剂 |
缩写 |
示例性浓度 |
十六烷基三甲基氯化铵 |
CTAC |
7.8mM |
二十六烷基二甲基溴化铵 |
DHDAB |
10mM |
双十二烷基二甲基溴化铵 |
DDDAB |
10mM |
三甲基十八烷基氯化铵 |
TMDAC |
10mM |
二甲基双十八烷基溴化铵 |
DMDAB |
1mM |
四己基氯化铵 |
THAC |
10mM |
三十二烷基甲基氯化铵 |
TDMAC |
1mM |
四十二烷基氯化铵 |
TDAC |
1mM |
IV.单色测序
吖啶酯-三磷酸酯可逆终止子共轭物(AE对)可用于核酸测序方法。在一些方法中,测序方法是大规模并行合成测序(SBS)。用于核酸合成测序(SBS)的方法和其他下一代测序(NGS)方法是众所周知的。参见Blackburn等人,Curr.Genomics 16(3):159-174(2015);Stranneheim和Lundeberg,Biotechnol.J.7:1063-73(2012);Guo等人,Acc.Chem.Res.43:551-563(2010),Drmanac等人US20180223358A1;Mardis,E.R.,2013,Annu.Rev.Anal.Chem.6:287–303;Metzker,M.L.,2010,Nat.Rev.Genet.11:31–46;Goodwin等人,2016,Nat.Rev.Genet.17:333–351,每个都通过引用并入本文。在一些情况下,SBS方法使用具有可逆终止子染料的3’阻断dNTP,该染料包括但不限于美国公开专利申请号2010/00317531(通过引用并入本文)中描述的染料。在某些情况下,SBS方法是在流动池中使用有序或图案化的阵列进行的。本文公开的吖啶酯-三磷酸酯可逆终止子共轭物(AE对)在单色(也称为单通道)测序中特别有用。SBS可以使用通过桥式PCR、乳液PCR、多联体(DNA纳米球)的生产和其他方法制备的模板序列的克隆群来进行。
如本文所用,“单色测序”是指大规模平行测序方法,其中可以基于两种不同条件下的不同发光来区分四个碱基。在一种方法中,这两种条件是暴露于两种化学环境中。在一种方法中,第一条件和第二条件在标记与核苷酸的解离(例如通过裂解)或缔合(例如通过配体抗配体相互作用)方面没有不同,该核苷酸掺入例如在核酸测序方法中产生的引物延伸产物或生长链中。在两种条件下发射的光可以是相同波长、不同波长或大致相同的波长,例如相差小于500nm、200nm或100nM。关于某些单色方法的非限制性描述,参见美国专利号9,222,132,其通过引用并入本文。使用单色测序方法,基于在不同条件下(例如,在第一预定条件和第二预定条件下)对不同强度(或“亮度”)[包括零强度(无信号)]的信号检测来区分不同的碱基(例如,A、T、C、G)。
本文所述的测序方法利用了本文所述的吖啶酯-三磷酸酯可逆终止子共轭物。通常,使用四种核苷酸类似物(dATP、dTTP、dCTP、dGTP)的混合物。例如,在一种方法中,一种dNTP类似物用AE-D标记(与其共轭),第二种dNTP类似物用AE-H标记,第三种dNTP类似物用AE-D和AE-H进行双标记,并且第四种dNTP未用AE标记。双标记的dNTP可以以多种方式标记。在一种方法中,一些或所有双标记的dNTP分子(例如dTTP)用两种不同的标记(AE-D和AE-H)进行物理标记。在另一种方法中,使用双标记的dNTP分子(例如dTTP)的混合物,其中一些dNTP用AE-D标记并且一些用AE-H标记。在一种方法中,混合物包括大约等摩尔量的AE-D标记和AE-H标记的分子。
在一种方法中,本文所述的可逆终止子共轭物用于合成测序(SBS)方法。本领域技术人员将理解,通常可逆的终止子dNTP包含阻断基团,该阻断基团在每个测序循环结束时被去除(“去阻断”)以在脱氧核糖上再生3’-OH并允许在下一个测序位置处掺入与模板核苷酸互补的核苷酸。
在一种常见的SBS方法中,在每个测序循环中掺入一个核苷酸。通常,在每个测序循环中,将可逆终止子dNTP掺入生长链中,检测掺入,并去除终止子(“去阻断”)。根据本发明,掺入的dNTP在每个循环中暴露于两个预定条件(或每个半个循环中暴露于一个预定条件)。在一种方法中,在测序流动池中产生克隆簇(例如,由桥式PCR产生)、单分子、DNA纳米球等的阵列,包括(1)其上固定化有靶分子(例如,靶分子扩增子)的底物,以及(2)允许将试剂、酶、缓冲液、洗涤液等递送到底物的流体体系。在一种方法中,它是图案化的流动池。在每个dNTP掺入步骤之后,使第一溶液流过流动池(例如,低H2O2加CTAT)并收集图像,然后使第二溶液流过流动池(例如,高H2O2加Triton)并收集第二图像。比较这对图像并确定掺入的dNTP的身份,如下所讨论并如表3和4中所描述。
如本文所用,“图像”或“成像”是指数据(光发射强度)的收集并且不限于特定收集体系或方式。例如,“图像”可以使用CCD相机、互补金属氧化物半导体(CMOS)芯片和其他检测器来收集。“比较”图像通常包含使用计算机分析信号数据。
每个流动步骤可以是连续的或不连续的,并且任选地可以在暴露于每种溶液之前、之间或之后进行缓冲液洗涤。比较第一和第二图像并确定一个或多个AE-rtNTP的信号发射变化。通过比较阵列上每个位置处的信号,可以识别掺入的核苷酸。
表3
dNTP类似物 |
第一图像中捕获的信号 |
第二图像中捕获的信号 |
dNTP-1(例如,共轭至AE-D的dATP) |
不存在或低 |
存在或高 |
共轭至AE-H的dNTP-2(例如,dCTP) |
存在或高 |
不存在或低 |
共轭至AE-D和AE-H的dNTP-3(例如,dTTP) |
存在或高 |
存在或高 |
共轭至AE-D或AE-H的dNTP-4(例如,dGTP) |
不存在或低 |
不存在或低 |
表4
dNTP类似物 |
第一图像中捕获的信号 |
第二图像中捕获的信号 |
dATP |
0 |
1 |
dCTP |
1 |
0 |
dTTP |
1 |
1 |
dGTP |
0 |
0 |
实施例
本发明可以在不背离其结构、方法或如本文广泛描述和在下文中要求保护的其他基本特征的情况下以其他特定形式实施。所描述的实施方案在所有方面都应被认为仅是说明性的,而不是限制性的。因此,本发明的范围由所附权利要求而不是由前述描述指示。在权利要求等效的含义和范围内的所有变化都应包含在其范围内。
实施例1:含吖啶酯化合物的合成
制备化合物3的一般程序:
向250mL烧瓶中添加3-溴苯甲醚(5.0g)、3-甲氧基苯胺(4.0g)、乙酸钯(0.21g)、2,2'-双(二苯基膦基)-1,1'-联萘(BINAP;0.8g)、碳酸铯(9.6g)和甲苯(100mL)。将混合物脱气5分钟,然后在氩气下回流3天。向冷却的反应混合物中加入水,然后用乙酸乙酯(EtOAc)萃取。萃取物用水洗涤并用无水硫酸钠(Na2SO4)干燥。粗品通过硅胶柱色谱法纯化以得到化合物3。
制备化合物4的一般程序:
使用附加漏斗将在甲苯(60mL)中的化合物3(2.5g)缓慢添加到草酰氯(3.0mL)的甲苯(100mL)溶液中。添加结束后,将混合物在60℃加热1小时。除去溶剂并将残余物在120℃加热过夜。所得固体(化合物4)不经纯化用于下一步骤的反应。
制备化合物5的一般程序:
向粗制化合物4中添加2N NaOH/水(100mL)。将混合物回流4小时,然后冷却至室温。添加HCl/水混合物(2N)以将pH调节至1-3。收集所得的黄色沉淀物并用水洗涤。将固体干燥以得到化合物5。
制备化合物6的一般程序:
将化合物5悬浮在亚硫酰氯(12mL)中并添加两滴二甲基甲酰胺(DMF)。将混合物回流2小时,然后除去亚硫酰氯。向残余物中添加苯酚(1.3g)、无水二氯甲烷(CH2Cl2;20mL)和吡啶(5mL)。将混合物回流2小时,然后除去CH2Cl2和吡啶。将残余物溶解在氯仿(CHCl3)中并用碳酸氢钠(NaHCO3)/水洗涤。将有机层用无水Na2SO4干燥。将粗品通过硅胶柱色谱法纯化以得到化合物6。
制备化合物7的一般程序:
将化合物6(0.5g)和1,4-丁内酯(10g)混合并在130℃加热10小时,然后冷却至室温。将1N HCl的水(100mL)溶液添加到反应混合物中,并将所得的混合物在60℃加热30分钟。将混合物冷却至室温,然后用NaHCO3/水将pH调节至1-2。使用0.1%三氟乙酸(TFA)缓冲液和乙腈(CH3CN)作为溶剂通过C18柱色谱法将混合物纯化以得到化合物7。
制备化合物8的一般程序:
将化合物7(0.1g)悬浮在无水CH2Cl2(5mL)中。向混合物中添加草酰氯(1mL)并将所得的混合物在室温下搅拌2小时。除去溶剂和草酰氯,将残余物溶解在无水CH2Cl2(5mL)中,然后添加异哌啶酸乙酯(0.2ml)。将混合物在室温下搅拌10分钟,然后添加1N HCl/水。将混合物用CHCl3萃取,除去溶剂以得到化合物8而无需纯化。
制备化合物1的一般程序:
将上述粗制化合物8悬浮在二噁烷(20mL)和1N HCl/水(40mL)中,并将混合物在70℃搅拌4小时。除去二噁烷并用NaHCO3/水将水溶液的pH调节至1-2。然后添加乙腈,得到澄清溶液。使用0.1%TFA缓冲液和CH3CN作为溶剂将溶液通过制备型HPLC纯化以得到纯化合物1。
制备化合物2的一般程序:
使用与用于制备化合物1的相似的程序合成化合物2。
尽管为了清楚理解的目的已经通过说明和示例的方式对前述发明进行了一些详细的描述,但是本领域技术人员将理解在所附权利要求的范围内可以实施某些改变和修改。此外,本文提供的每篇参考文献均通过引用以其整体并入,其程度与每篇参考文献单独通过引用并入的程度相同。在本申请与本文提供的参考文献之间存在冲突的情况下,应以本申请为准。