CN114096540A - 用于纳米孔测序的易位控制元件、报告子代码和用于易位控制的其他手段 - Google Patents

用于纳米孔测序的易位控制元件、报告子代码和用于易位控制的其他手段 Download PDF

Info

Publication number
CN114096540A
CN114096540A CN202080037908.3A CN202080037908A CN114096540A CN 114096540 A CN114096540 A CN 114096540A CN 202080037908 A CN202080037908 A CN 202080037908A CN 114096540 A CN114096540 A CN 114096540A
Authority
CN
China
Prior art keywords
compound
bis
phosphodiester
propane
triazole
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080037908.3A
Other languages
English (en)
Inventor
D·奥康奈尔
A·雅各布斯
J·威鲁奇
B·巴纳西克
M·洛佩兹
D·古德曼
M·纳巴维
J·塔邦
M·S·科科里斯
C·马哈克
L·梅里尔
J·钱德拉斯卡
S·克里泽尔
C·切克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
Stratos Genomics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Stratos Genomics Inc filed Critical Stratos Genomics Inc
Publication of CN114096540A publication Critical patent/CN114096540A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/06Pyrimidine radicals
    • C07H19/10Pyrimidine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
    • C07H19/11Pyrimidine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids containing cyclic phosphate
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/06Pyrimidine radicals
    • C07H19/10Pyrimidine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/14Pyrrolo-pyrimidine radicals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/16Purine radicals
    • C07H19/20Purine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
    • C07H19/213Purine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids containing cyclic phosphate
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/48707Physical analysis of biological material of liquid biological material by electrical means
    • G01N33/48721Investigating individual macromolecules, e.g. by translocation through nanopores

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Food Science & Technology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Nanotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Medicinal Preparation (AREA)
  • Saccharide Compounds (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了基于氨基磷酸酯的单体,其用于合成用于基于纳米孔的感测的可膨胀聚合物。此类单体包含报告子构建体,所述报告子构建体包含第一报告子代码、带有易位控制元件的对称化学分支和第二报告子代码,其中所述报告子构建体的末端连接至氨基磷酸酯‑核苷。还提供了相关的方法和产品。

Description

用于纳米孔测序的易位控制元件、报告子代码和用于易位控 制的其他手段
技术领域
本发明总体上涉及新的合成报告子构建体,更具体地涉及新的无核苷酸、基于亚磷酰胺的易位控制元件、报告子代码和在穿过纳米孔时产生独特信号的其他特征,及其制造和利用方法,特别是在基于纳米孔的聚合物测序方法中。
背景技术
生物分子的测量是现代医学的基础,广泛用于医学研究,更具体地用于诊断和治疗,以及药物开发。核酸编码生命体活动和繁殖所必需的信息,本质上是生命的蓝图。确定此类蓝图在纯研究和应用科学中都有用。在医学中,测序可用于诊断和研发用于各种病症的治疗方法,包括癌症、心脏病、自身免疫性疾病、多发性硬化症和肥胖症。在工业中,测序可用于设计改进的酶促过程或合成生物。例如,在生物学中,该工具可用于研究生态系统的健康,因此具有广泛的用途。类似地,蛋白质和其他生物分子的测量提供了标志物和对疾病和病原传播的了解。
个体独特的DNA序列提供了有关他们对某些疾病的易感性的宝贵信息。它还为患者提供了筛查以早期发现和/或接受预防性治疗的机会。此外,根据患者的个人蓝图,临床医生将能够施用个性化疗法,以最大限度地提高药物疗效和/或最大限度地降低药物不良反应的风险。类似地,确定病原生物的蓝图可以为传染病提供新的治疗和更稳健的病原体监测。低成本的全基因组DNA测序将为现代医学奠定基础。为了实现该目标,测序技术必须在通量、准确性和读段长度方面不断进步。
在过去的十年中,大量的下一代DNA测序技术已经可商购,已大大降低了全基因组测序的成本。这些包括边合成边测序(″SBS″)平台(Illumina,Inc.,454 Life Sciences,Ion Torrent,Pacific Biosciences)和基于类似连接的平台(Complete Genomics,LifeTechnologies Corporation)。许多其他技术正在开发中,这些技术利用了各种各样的样品处理和检测方法。例如,GnuBio公司(Cambridge,Mass.)使用皮升反应容器来控制数百万个谨慎的探针测序反应,而Halcyon Molecular(Redwood City,Calif.)正在尝试开发使用透射电子显微镜进行直接DNA测量的技术。
基于纳米孔的核酸测序是一种已被广泛研究的引人注目的方法。Kasianowicz等人(Proc.Natl.Acad.Sci.USA 93:13770-13773,1996)在单链多核苷酸电易位通过嵌入脂双层中的α溶血素纳米孔时,表征了单链多核苷酸。已经证明,在多核苷酸易位期间,可以测量纳米孔孔口的部分堵塞作为离子电流降低的量度。然而,纳米孔中的多核苷酸测序因必须解析紧密间隔的碱基(0.34nm)而承受沉浸在显著背景噪音中的小信号差异。由于观察到多核苷酸的快速易位速率,通常大约为每微秒1个碱基,因此纳米孔中单碱基分辨率的测量挑战变得更加苛刻。可以通过调整运行参数(例如电压、盐成分、pH、温度和粘度等)来降低易位速度。然而,这种调整无法将易位速度降低到允许单碱基分辨率的水平。
Stratos Genomics开发了一种称为扩展测序(“SBX”)的方法,该方法使用生化过程将DNA序列转录到称为“Xpandomer”的可测量聚合物上(Kokoris等人,美国专利号7,939,259″High Throughput Nucleic Acid Sequencing by Expansion″)。转录的序列沿Xpandomer主链在高信噪比报告子中编码,所述报告子相隔约10nm,专为高信噪比、分化良好的反应而设计。这些差异在Xpandomer相对于天然DNA的序列读段效率和准确性方面提供了显著的性能增强。Xpandomer可以实现多种下一代DNA测序检测技术,并且非常适合纳米孔测序。
纳米孔已被证明是强大的放大器,就像它们被高度开发的前身库尔特计数器一样。然而,任务是DNA的碱基识别的当代有机纳米孔(诸如溶血素和MspA)是在自然界中不与DNA相互作用的跨膜蛋白。它们没有控制DNA易位的天然功能。这是一个公认的缺点,一些人试图通过在纳米孔附近添加蛋白质马达的功能来纠正。例如,Akeson的团队在α-溶血素纳米孔附近添加了
Figure BDA0003366876350000021
聚合酶,以便ss-DNA可以以受控的速率被送入孔中(参见G.M.Cherf等人″Automated forward and reverse ratcheting of DNA in a nanopore at 5-Aprecision,″Nat Biotech,vol.advance online publication,February 2012)。这种方法使测定复杂化,并强制α溶血素中的测量区域与聚合酶中的位置控制分离,这可能会给测量带来额外的噪声和序列依赖性变化。
在另一种称为杂交易位控制(TCH)的方法中,通过使用杂交产生的结构暂停纳米孔易位事件,所述结构解离以进行易位(参见,例如,授予McRuer和Kokoris的美国专利号10,457,979)。Akeson等人(美国专利号6,465,193)首先通过用顺序发夹双链区暂停DNA易位来证明这一点。易位在双链体处停止,因为它大于α-溶血素纳米孔的孔口。当双链体因随机热波动而释放时,易位进行到下一个双链体。在每次暂停期间,可以测量和识别位于纳米孔中(与双链体相邻)的DNA区域。当应用于纳米孔测序时,这种用于易位控制的双链方法存在局限性,包括双链体形成不完全或杂交填充率以及双链体解离的随机性,这可能会导致缺失或插入事件。无法本地化的插入和缺失会严重降低数据质量。
虽然在此领域取得了重大进展,但是商业上可行的易位控制的实施,例如使用Xpandomer,将受益于克服由双链引起的限制的改进。本发明满足这些需要并提供如下文所述的进一步的相关优点。
背景部分中讨论的所有主题都不一定是现有技术,不应仅仅因为其在背景部分中的讨论而被假定为现有技术。沿着这些思路,除非明确说明是现有技术,否则对背景部分中讨论的或与此类主题相关的现有技术中的问题的任何认识不应被视为现有技术。相反,背景部分中对任何主题的讨论都应被视为发明人解决特定问题的方法的一部分,其本身也可能具有创造性。
发明内容
简而言之,公开了用于改进聚合物分析物(例如,Xpandomer)的纳米孔测序(例如,产生具有更高读取长度、准确度和/或通量的序列)的化合物(例如,XNTP)和方法,所述化合物包括由一系列新颖亚磷酰胺单体单元合成的聚合物报告子和连接基构建体。
在一些实施例中,聚合物构建体可被设计成完全没有核苷酸。
在一个方面,本公开提供具有以下结构的化合物(即,XNTP):
Figure BDA0003366876350000041
其中R是OH或H;核碱基是腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶、尿嘧啶或核碱基类似物;报告子构建体是具有第一末端和第二末端的聚合物,并且包括从第一末端到第二末端串联的第一报告子代码、带有易位控制元件的对称化学分支和第二报告子代码;连接基A将α氨基磷酸酯的氧原子接合到报告子构建体的第一末端;连接基B将核碱基接合到报告子构建体的第二末端;并且其中易位控制元件是如下所述的聚合物。
在一个实施例中,所述易位控制元件是包含两个或更多个选自以下的重复单元的聚合物:1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b)、1,3-O-双(磷酸二酯)-2-(4-Me-O-PEG3)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35b)、1,3-O-双(磷酸二酯)-2s-O-mPEG6-丙烷(化合物12c)、1,2-O-双(磷酸二酯)-3-O-mPEG2-丙烷(化合物16)、2,3-O-双(磷酸二酯)-1-(5-苯并呋喃)-丙烷(化合物20i)、1,2-O-双(磷酸二酯)-3-(4-甲基哌嗪-1-基)-丙烷(化合物20j)、2,3-O-双(磷酸二酯)-1-(N1-(2-Me-5-硝基吲哚)-丙烷(化合物20g)、1,8-O-双(磷酸二酯)-N,N-二乙基哌嗪(化合物26h)、1,2-O-双(磷酸二酯)-3-(4-(Me-O-PEG3-O-Bz)-1-(1,2,3-三唑))-丙烷(化合物31d)、1,3-O-双(磷酸二酯)-2s-O-(4-(Me-O-PEG2)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35a)、1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35c)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG7)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35d)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Me-乙酸酯)-1,2,3-三唑)-丙烷(化合物35e)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物37a)、1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-2,2,2-三-(Me-O-Ac))-1,2,3-三唑)-丙烷(化合物37b)、1,3-O-双(磷酸二酯-2S-O-(PEG4-O-Bz)-丙烷(化合物38b)、1,3-O-双(磷酸二酯-2,2-双(Me-O-mPEG2)-丙烷(化合物45b)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG2-O-Me)-1-(Et-O-Bz)-1,2,3-三唑)-丙烷(化合物47f)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG3-O-Me)-1-(Et-O-Bz)-1,2,3-三唑)-丙烷(化合物47Gg)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG3-O-Me)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物47i)或1,3-O-双(磷酸二酯-2,2-双(1-Me-4-(Me-O-PEG2-O-Bz)-1,2,3-三唑)-丙烷(化合物52)。
在一些实施例中,R是OH。
在一些实施例中,R是H。
在其他实施例中,核碱基是腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶或尿嘧啶。
在其他实施例中,核碱基是核碱基类似物。
在其他实施例中,所述对称化学分支是1,2,3-O-三-(磷酸二酯)-丙烷、1,3-双-(5-O-磷酸二酯-戊基酰胺基)-2-O-磷酸二酯-丙烷或1,4,7-O-三-(磷酸二酯)-庚烷。
在其他实施例中,对称化学支化剂是1,2,3-O-三-(磷酸二酯)-丙烷。
在其他实施例中,所述易位控制元件是包含两个或更多个选自表1A的重复单元的聚合物。
在其他实施例中,所述易位控制元件是包含两个或更多个选自以下的重复单元的聚合物:1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b)和1,3-O-双(磷酸二酯)-2-(4-Me-O-PEG3)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35b)。
在再其他实施例中,所述易位控制元件是包含以下序列的聚合物:[(1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b))]n1[(1,3-O-双(磷酸二酯)-2-(4-Me-O-PEG3)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35b))]n2,其中n1为0至6且n2为6至10。
在其他实施例中,第一报告子代码和第二报告子代码是相同的。
在进一步的实施例中,所述第一报告子代码和所述第二报告子代码是包含两个或更多个选自以下的重复单元的聚合物:六乙二醇(D)、乙烷(L)、三乙二醇(X)、1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b)、1,3-O-双(磷酸二酯)-2-(4-Me-O-PEG3)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35b)、1,3-O-双(磷酸二酯-2,2-双(Me-O-mPEG2)-丙烷(化合物45b)、1,3-O-双(磷酸二酯-2S-O-(PEG4-O-Bz)-丙烷(化合物38b)、1,3-O-双(磷酸二酯)-2s-O-mPEG6-丙烷(化合物12c)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物37a)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Me-乙酸酯)-1,2,3-三唑)-丙烷(化合物35e)、1,3-O-双(磷酸二酯)-2s-O-(4-(Me-O-PEG2)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35a)、1,3-O-双(磷酸二酯)-2-(4-Et-1-(Et-O-mPEGl)-1,2,3-三唑)-丙烷(化合物31a)、2,3-O-双(磷酸二酯)-1-(1-二甲氧基喹唑啉二酮)-丙烷(化合物20c)、2,3-O-双(磷酸二酯)-1-(N9-(3,6-二甲氧基咔唑)-丙烷(化合物20e)、1,1′-O-双(磷酸二酯)-2,2′-(磺酰基双(苄-4-基))-二乙醇(化合物26d)、1,1′-O-双(磷酸二酯)-2,2′-联吡啶-4,4′-基)-二甲醇(化合物26a)、2,3-O-双(磷酸二酯)-1-(N1-(4,6-二甲氧基-3-Me-吲哚)-丙烷(化合物20b)、3-(1,2-O-双(磷酸二酯)-丙基)-8,8-二甲基六氢-3H-3a,6-甲桥苯并[c]异噻唑2,2-二氧化物(化合物20d)、2,3-O-双(磷酸二酯)-1-(N1-(6-氮杂胸腺嘧啶))-丙烷(化合物20f)、1,5-O-双(磷酸二酯)-六氢呋喃并[2,6]呋喃(化合物23)、1,1′-O-双(磷酸二酯)-八氢-2,6-二甲基-3,8∶4,7-二甲桥-2,6-萘啶-4,8-二基)-二甲醇(化合物26e)、2,3-O-双(磷酸二酯)-1-(N1-(2-Me-5-硝基吲哚)-丙烷(化合物20h)、2,3-O-双(磷酸二酯)-1-(N1-(2-Me-5-硝基吲哚)-丙烷(化合物20g)、2,3-O-双(磷酸二酯)-1-(5-苯并呋喃)-丙烷(化合物20i)、1,2-O-双(磷酸二酯)-3-O-mPEG2-丙烷(化合物5b)、1,3-O-双(磷酸二酯)-2-(4-Et-1-(Et-O-mPEG3)-1,2,3-三唑)-丙烷(化合物31b)和1,3-O-双(磷酸二酯)-3-O-mPEG4-丙烷(化合物5a)。
在其他实施例中,所述第一报告子代码和所述第二报告子代码是包含两个或更多个选自六乙二醇、乙烷、三乙二醇和表1A中所列任何化合物的重复单元的聚合物。
在进一步的实施例中,第一报告子代码和所述第二报告子代码是包含两个或更多个选自六乙二醇、乙烷、三乙二醇和1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b)的重复单元的聚合物。
在更具体的实施例中,第一报告子代码和第二报告子代码是包含选自以下序列的聚合物:(i)[(六乙二醇)2(乙烷)3(六乙二醇)(三乙二醇)],(ii)[(六乙二醇)2(1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b))2(乙烷)(三乙二醇)3],(iii)[(六乙二醇)2(1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b))3(乙烷)2(六乙二醇)(三乙二醇)]和(iv)[(三乙二醇)2(乙烷)(1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b))6(乙烷)7]。
在其他实施例中,连接基A和连接基B是包含两个或更多个选自以下的重复单元的聚合物:精胺(Q)、六乙二醇(D)、2-((4-((3-(苯甲酰氧基)-2-(((1-(3-(苯甲酰氧基)-2-((苯甲酰氧基)甲基)-2-((磷酸二酯-氧基)甲基)丙基)-1H-1,2,3-三唑-4-基)甲氧基)甲基)-2-((苯甲酰氧基)甲基)丙氧基)甲基)-1H-1,2,3-三唑-1-基)甲基)-2-O-磷酸二酯-丙烷-1,3-二基二苯甲酸酯(化合物62)、1,3-O-双(磷酸二酯-2,2-双(1-Me-4-(Me-O-PEG2-O-Bz)-1,2,3-三唑)-丙烷(化合物52)、1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35c)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG7)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35d)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物37a)、1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-2,2,2-三-(Me-O-Ac))-1,2,3-三唑)-丙烷(化合物37b)、1,2-O-双(磷酸二酯)-3-(4-(Me-O-PEG3-O-Bz)-1-(1,2,3-三唑))-丙烷(化合物31d)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG2-O-Me)-1-(Et-O-Bz)-1,2,3-三唑)-丙烷(化合物47f)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG3-O-Me)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物47i)、1,2-O-双(磷酸二酯)-3-(4-甲基哌嗪-1-基)-丙烷(化合物20j)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG3-O-Me)-1-(Et-O-Bz)-1,2,3-三唑)-丙烷(化合物47g)和1,1′-O-双(磷酸二酯)-N(对甲苯基)-二乙醇胺(化合物26b)。
在其他实施例中,连接基A和连接基B是包含两个或更多个选自精胺和表1A中所列任何化合物的重复单元的聚合物。
在再其他实施例中,连接基A和连接基B包含含有两个精胺重复单元的聚合酶增强区。
在进一步的实施例中,连接基A和连接基B包含含有两个或更多个选自以下的重复单元的易位减速区:1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35c)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG7)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35d)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物37a)和1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-2,2,2-三-(Me-O-Ac))-1,2,3-三唑)-丙烷(化合物37b)。
在更具体的实施例中,连接基A和连接基B包含含有选自以下的聚合物的易位减速区:(i)[((六乙二醇)(1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35c))3(六乙二醇)2]、(ii)[((六乙二醇)(1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35c))4(六乙二醇)2]、(iii)[((六乙二醇)(1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG7)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35d))4(六乙二醇)2]和(iv)[((六乙二醇)(1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-2,2,2-三-(Me-O-Ac))-1,2,3-三唑)-丙烷(化合物37b))4(六乙二醇)2]。
在其他实施例中,连接基A通过包含三唑的键合接合到α氨基磷酸酯的氧原子,并且连接基B通过包含三唑的键合接合到核碱基。
在另一方面,本发明提供一种报告子构建体,其包含具有第一末端和第二末端的聚合物,并且包含从所述第一末端到所述第二末端串联的第一报告子代码、带有易位控制元件的对称化学分支和第二报告子代码;并且其中所述易位控制元件是包含两个或更多个选自以下的重复单元的聚合物:1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b)、1,3-O-双(磷酸二酯)-2-(4-Me-O-PEG3)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35b)、1,3-O-双(磷酸二酯)-2s-O-mPEG6-丙烷(化合物12c)、1,2-O-双(磷酸二酯)-3-O-mPEG2-丙烷(化合物16)、2,3-O-双(磷酸二酯)-1-(5-苯并呋喃)-丙烷(化合物20i)、1,2-O-双(磷酸二酯)-3-(4-甲基哌嗪-1-基)-丙烷(化合物20j)、2,3-O-双(磷酸二酯)-1-(N1-(2-Me-5-硝基吲哚)-丙烷(化合物20g)、1,8-O-双(磷酸二酯)-N,N-二乙基哌嗪(化合物26h)、1,2-O-双(磷酸二酯)-3-(4-(Me-O-PEG3-O-Bz)-1-(1,2,3-三唑))-丙烷(化合物31d)、1,3-O-双(磷酸二酯)-2s-O-(4-(Me-O-PEG2)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35a)、1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35c)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG7)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35d)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Me-乙酸酯)-1,2,3-三唑)-丙烷(化合物35e)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物37a)、1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-2,2,2-三-(Me-O-Ac))-1,2,3-三唑)-丙烷(化合物37b)、1,3-O-双(磷酸二酯-2S-O-(PEG4-O-Bz)-丙烷(化合物38b)、1,3-O-双(磷酸二酯-2,2-双(Me-O-mPEG2)-丙烷(化合物45b)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG2-O-Me)-1-(Et-O-Bz)-1,2,3-三唑)-丙烷(化合物47f)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG3-O-Me)-1-(Et-O-Bz)-1,2,3-三唑)-丙烷(化合物47Gg)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG3-O-Me)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物47i)或1,3-O-双(磷酸二酯-2,2-双(1-Me-4-(Me-O-PEG2-O-Bz)-1,2,3-三唑)-丙烷(化合物52)。
在一些实施例中,所述对称化学分支是1,2,3-O-三-(磷酸二酯)-丙烷、1,3-双-(5-O-磷酸二酯-戊基酰胺基)-2-O-磷酸二酯-丙烷或1,4,7-O-三-(磷酸二酯)-庚烷。
在另一实施例中,对称化学支化剂是1,2,3-O-三-(磷酸二酯)-丙烷。
在其他实施例中,所述易位控制元件是包含两个或更多个选自表1A的重复单元的聚合物。
在再其他实施例中,所述易位控制元件是包含两个或更多个选自以下的重复单元的聚合物:1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b)和1,3-O-双(磷酸二酯)-2-(4-Me-O-PEG3)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35b)。
在进一步的实施例中,所述易位控制元件是包含以下序列的聚合物:[(1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b))]n1[(1,3-O-双(磷酸二酯)-2-(4-Me-O-PEG3)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35b))]n2,其中n1为0至6且n2为6至10。
在其他实施例中,第一报告子代码和第二报告子代码是相同的。
在一些实施例中,所述第一报告子代码和所述第二报告子代码是包含两个或更多个选自以下的重复单元的聚合物:六乙二醇(D)、乙烷(L)、三乙二醇(X)、1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b)、1,3-O-双(磷酸二酯)-2-(4-Me-O-PEG3)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35b)、1,3-O-双(磷酸二酯-2,2-双(Me-O-mPEG2)-丙烷(化合物45b)、1,3-O-双(磷酸二酯-2S-O-(PEG4-O-Bz)-丙烷(化合物38b)、1,3-O-双(磷酸二酯)-2s-O-mPEG6-丙烷(化合物12c)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物37a)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Me-乙酸酯)-1,2,3-三唑)-丙烷(化合物35e)、1,3-O-双(磷酸二酯)-2s-O-(4-(Me-O-PEG2)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35a)、1,3-O-双(磷酸二酯)-2-(4-Et-1-(Et-O-mPEG1)-1,2,3-三唑)-丙烷(化合物31a)、2,3-O-双(磷酸二酯)-1-(1-二甲氧基喹唑啉二酮)-丙烷(化合物20c)、2,3-O-双(磷酸二酯)-1-(N9-(3,6-二甲氧基咔唑)-丙烷(化合物20e)、1,1′-O-双(磷酸二酯)-2,2′-(磺酰基双(苄-4-基))-二乙醇(化合物26d)、1,1′-O-双(磷酸二酯)-2,2′-联吡啶-4,4′-基)-二甲醇(化合物26a)、2,3-O-双(磷酸二酯)-1-(N1-(4,6-二甲氧基-3-Me-吲哚)-丙烷(化合物20b)、3-(1,2-O-双(磷酸二酯)-丙基)-8,8-二甲基六氢-3H-3a,6-甲桥苯并[c]异噻唑2,2-二氧化物(化合物20d)、2,3-O-双(磷酸二酯)-1-(N1-(6-氮杂胸腺嘧啶))-丙烷(化合物20f)、1,5-O-双(磷酸二酯)-六氢呋喃并[2,6]呋喃(化合物23)、1,1′-O-双(磷酸二酯)-八氢-2,6-二甲基-3,8:4,7-二甲桥-2,6-萘啶-4,8-二基)-二甲醇(化合物26e)、2,3-O-双(磷酸二酯)-1-(N1-(2-Me-5-硝基吲哚)-丙烷(化合物20h)、2,3-O-双(磷酸二酯)-1-(N1-(2-Me-5-硝基吲哚)-丙烷(化合物20g)、2,3-O-双(磷酸二酯)-1-(5-苯并呋喃)-丙烷(化合物20i)、1,2-O-双(磷酸二酯)-3-O-mPEG2-丙烷(化合物5b)、1,3-O-双(磷酸二酯)-2-(4-Et-1-(Et-O-mPEG3)-1,2,3-三唑)-丙烷(化合物31b)和1,3-O-双(磷酸二酯)-3-O-mPEG4-丙烷(化合物5a)。
在其他实施例中,所述第一报告子代码和所述第二报告子代码是包含两个或更多个选自六乙二醇、乙烷、三乙二醇和表1A中所列任何化合物的重复单元的聚合物。
在进一步的实施例中,第一报告子代码和所述第二报告子代码是包含两个或更多个选自六乙二醇、乙烷、三乙二醇和1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b)的重复单元的聚合物。
在进一步的实施例中,第一报告子代码和第二报告子代码是包含选自以下序列的聚合物:(i)[(六乙二醇)2(乙烷)3(六乙二醇)(三乙二醇)],(ii)[(六乙二醇)2(1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b))2(乙烷)(三乙二醇)3],(iii)[(六乙二醇)2(1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b))3(乙烷)2(六乙二醇)(三乙二醇)]和(iv)[(三乙二醇)2(乙烷)(1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b))6(乙烷)7]。
在另一方面,本发明提供一种对称合成的报告子系链(SSRT),其中所述对称合成的报告子系链是具有第一末端和第二末端的聚合物,并且包含从所述第一末端到所述第二末端串联的第一连接基、根据上述报告子构建体中任一者的报告子构建体以及第二连接基,其中所述第一连接基和所述第二连接基是相同的并且是包含两个或更多个选自以下的重复单元的聚合物:精胺(Q)、六乙二醇(D)、2-((4-((3-(苯甲酰氧基)-2-(((1-(3-(苯甲酰氧基)-2-((苯甲酰氧基)甲基)-2-((磷酸二酯-氧基)甲基)丙基)-1H-1,2,3-三唑-4-基)甲氧基)甲基)-2-((苯甲酰氧基)甲基)丙氧基)甲基)-1H-1,2,3-三唑-1-基)甲基)-2-O-磷酸二酯-丙烷-1,3-二基二苯甲酸酯(化合物62)、1,3-O-双(磷酸二酯-2,2-双(1-Me-4-(Me-O-PEG2-O-Bz)-1,2,3-三唑)-丙烷(化合物52)、1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35c)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG7)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35d)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物37a)、1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-2,2,2-三-(Me-O-Ac))-1,2,3-三唑)-丙烷(化合物37b)、1,2-O-双(磷酸二酯)-3-(4-(Me-O-PEG3-O-Bz)-1-(1,2,3-三唑))-丙烷(化合物31d)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG2-O-Me)-1-(Et-O-Bz)-1,2,3-三唑)-丙烷(化合物47f)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG3-O-Me)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物47i)、1,2-O-双(磷酸二酯)-3-(4-甲基哌嗪-1-基)-丙烷(化合物20j)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG3-O-Me)-1-(Et-O-Bz)-1,2,3-三唑)-丙烷(化合物47g)和1,1′-O-双(磷酸二酯)-N(对甲苯基)-二乙醇胺(化合物26b)。
在一些实施例中,对称合成的报道系链(SSRT)包括含有两个精胺重复单元的聚合酶增强区。
在其他实施例中,所述对称合成的报告子系链(SSRT)包含含有两个或更多个选自以下的重复单元的易位减速区:1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35c)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG7)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35d)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物37a)和1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-2,2,2-三-(Me-O-Ac))-1,2,3-三唑)-丙烷(化合物37b)。
在其他实施例中,所述对称合成的报告子系链(SSRT)包含含有选自以下的聚合物的易位减速区:(i)[((六乙二醇)(1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35c))3(六乙二醇)2]、(ii)[((六乙二醇)(1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35c))4(六乙二醇)2]、(iii)[((六乙二醇)(1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG7)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35d))4(六乙二醇)2]和(iv)[((六乙二醇)(1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-2,2,2-三-(Me-O-Ac))-1,2,3-三唑)-丙烷(化合物37b))4(六乙二醇)2]。
在再其他实施例中,对称合成的报告子系链(SSRT)的第一末端和第二末端包括键合部分,并且在某些实施例中,键合部分是叠氮基(-N3)基团。
在另一方面,本发明提供了一种对靶核酸进行测序的方法,其包括以下步骤:一种用于对靶核酸进行测序的方法,其包括:a)提供通过模板定向合成产生的子链,所述子链包含多个XNTP亚基,所述多个XNTP亚基偶联在对应于所述靶核酸的全部或一部分的连续核苷酸序列的序列中,其中所述子链的各个XNTP亚基包含报告子构建体、核碱基残基和可选择性切割的键,并且其中所述报告子构建体在所述可选择性切割的键的切割时允许延长所述子链的所述亚基;b)切割所述可选择性切割的键以产生长度长于所述子链的多个所述亚基的Xpandomer,所述Xpandomer包含用于解析对应于所述靶核酸的全部或一部分的所述连续核苷酸序列的序列中的遗传信息的所述报告子构建体;和c)检测所述Xpandomer的所述报告子构建体。
在一些方面,用于解析遗传信息的所述报告子构建体包括报告子代码和易位控制元件,其中所述易位控制元件借由空间位阻提供易位控制,并在所述Xpandomer穿过经受基线电压的纳米孔时暂停易位,其中所述易位控制元件在所述纳米孔的孔口内接合所述报告子代码,其中所述报告子代码由所述纳米孔感测。
在一些实施例中,所述Xpandomer借由脉冲电压的施加恢复通过所述纳米孔的易位,其中所述脉冲电压足以允许所述易位控制元件的易位,同时使所述Xpandomer的下一个报告子构建体自由地与所述纳米孔接合。
在其他实施例中,与所述纳米孔接合的所述报告子构建体的所述易位控制元件借由空间位阻,在所述脉冲电压的每个脉冲时易位。
在一些实施例中,在所述脉冲电压的脉冲之间的时间段期间,由所述纳米孔感测目标构建体。
在某些实施例中,基线电压为约55mV至约75mV且脉冲电压为约550mV至约700mV。
在一些实施例中,脉冲电压具有约5μs至约10μs的持续时间和约0.5ms至1.5ms的周期性。
在其他实施例中,纳米孔经受交流电流(AC)。
在进一步的实施例中,XNTP亚基中的一者或多者包括2′氟阿拉伯糖基差向异构体。
在另一方面,本公开提供一种用于控制聚合物通过纳米孔的易位速率的缓冲剂,其包含至少一种选自由以下项组成的组的盐:NH4Cl、MgCl2、LiCl、KCl、CsCl、NaCl和CaCl2
在一些实施例中,缓冲剂还包含至少一种选自由3-甲基-2-噁唑烷酮(MOA)、DMF、ACN、DMSO和NMP组成的组的溶剂,其中所述溶剂以约1%vol/vol至约35%vol/vol的范围存在。
在其他实施例中,缓冲剂还包含至少一种选自由己酸钠(NaHex)、EDTA、氧化还原试剂、PEG、甘油、聚蔗糖等组成的组的添加剂。
在另一方面,本公开提供一种用于控制聚合物通过纳米孔检测器的易位速率的缓冲剂系统,其包括顺式缓冲剂和反式缓冲剂,其中所述顺式缓冲剂具有第一盐浓度,并且所述反式缓冲剂具有第二盐浓度,其中所述第一盐浓度低于所述第二盐浓度。
附图说明
图1A、图1B、图1C和图1D是说明概括性XNTP的主要特征及其在展开测序(SBX)中功能的简明示意图。
图2是说明XNTP的一个实施例的更多细节的示意图。
图3是说明Xpandomer穿过生物纳米孔的一个实施例的示意图。
图4是说明Xpandomer穿过生物纳米孔的另一个实施例的示意图。
图5A-图5D是说明报告子代码的替代实施例的示意图。
图6是说明SSRT报告子构建体的固态合成的一个实施例的示意图。
图7说明SSRT报告子构建体的替代结构实施例。
图8A和图8B是说明SSRT和dNTP-2c环化形成XNTP的一个实施例的示意图。
图9A和图9B是说明Xpandomer通过纳米孔的易位控制的一个实施例的示意图。
图10是说明生物素衍生物的一个实施例的示意图。
图11是说明可切割延伸寡核苷酸的一个实施例的示意图。
图12是说明经受棘轮穿过纳米孔的聚合物的一个实施例的示意图。
图13A和图13B是描述报告子代码特性的代表性迹线。
图14A和图14B是纳米孔衍生序列的比对读段群的直方图显示。
图15是显示简单DNA模板序列的代表性迹线。
图16是显示CAGT重复DNA模板序列的代表性迹线。
图17是显示复合DNA模板序列的代表性迹线。
图18是显示复合DNA 222mer模板序列的代表性迹线。
图19是纳米孔衍生序列的比对读段群的直方图显示。
图20A是说明经受棘轮穿过纳米孔的Xpandomer的一个实施例的示意图。
图20B是经受棘轮的易位Xpandomer的电流测量的实例。
具体实施方式
通过参考以下对本发明的优选实施例和本文包括的实例的详细描述,可以更容易地理解本发明。除非另有说明,否则本文中使用的所有技术和科学术语所具有的含义与本发明所属领域普通技术人员通常理解的含义相同。
贯穿本说明书的对“一个实施例”、“某一实施例”及其变体的引用,意指结合该实施例描述的特定特征、结构或特性包括在至少一个实施例中。因此,在本说明书中的不同位置出现的短语“在一个实施例中”或“在某一实施例中”不一定都是指同一个实施例。此外,具体特征、结构或特性可在一个或多个实施例中以任何合适的方式组合。
如在本说明书和所附权利要求中所用,单数形式“一个”、“一种”、“该”和“所述”包括复数指代物,即一个或多个,除非上下文另外明确规定。还应注意的是,连接术语“和”和“或”通常以最广泛的含义使用以包括“和/或”,除非内容和上下文根据具体情况明确规定了包容性或排他性。因此,替代方案(例如,“或”)的使用应被理解为表示替代方案中的任一个、两者或其任何组合。此外,“和”和“或”的组成在本文中被引用为“和/或”时旨在涵盖包括所有相关项或想法的实施例,以及包括少于所有相关项或想法的一个或多个其他替代实施例。
除非上下文另有要求,在整个说明书和随后的权利要求书中,词语“包括”及其同义词和变体,例如“具有”和“包括”,以及其变体,例如“包含”以开放的、包容性的意义来解释,例如,“包括但不限于”。术语“基本上由......组成”将权利要求的范围限制为特定的材料或步骤,或者对所要求保护的发明的基本和新特征没有实质性影响的那些。
缩写,“例如”源自拉丁语exempli gratia,在此用于表示非限制性示例。因此,缩写“例如”与术语“举个例子”同义。还应理解,本文和所附权利要求中使用的单数形式“一个”、“一种”和“所述”包括复数形式,除非上下文另有明确规定,术语“X和/或Y”表示“X”或“Y”或“X”和“Y”,名词后面的字母“s”表示该名词的复数和单数形式。此外,在根据马库什基团描述本发明的特征或方面的情况下,意图并且本领域技术人员将认识到,本发明包括并因此也在马库什基因的任何个体成员和任何成员亚基团方面进行描述,并且申请人保留修改申请或权利要求的权利,以明确提及马库什基团的任何个体成员或任何成员亚基团。
本文件中使用的任何标题仅用于加快读者的审阅,不应被解释为以任何方式限制本发明或权利要求。因此,本文提供的本公开的标题和摘要仅为方便起见,并不解释实施例的范围或含义。
在本文提供数值范围的情况下,应当理解,介于该范围的上限和下限之间的每个中间值(以下限单位的十分之一为基准,除非上下文另有明确规定)和所述范围内的任何其它所述的或中间值均包括在本发明内。这些较小范围的上限和下限可独立地包括在该较小范围内,并且也为本发明所涵盖,以所指定范围内任何明确排除的限制为准。若所指定范围包括一个或两个限值,则排除那些所包括限制中的任意一个或两个的范围也包括在本发明中。
例如,除非另有说明,本文提供的任何浓度范围、百分比范围、比例范围或整数范围应理解为包括所述范围内的任何整数的值以及在适当时其分数的值(例如一个整数的十分之一和百分之一)。此外,除非另有说明,否则本文引用的与任何物理特征(例如聚合物亚单元、尺寸或厚度)相关的任何数字范围应理解为包括所述范围内的任何整数。如本文所用,除非另有说明,否则术语“约”是指指示范围、值或结构的±20%。
扩展测序
由Stratos Genomics开发的“通过扩增测序”(SBX)方案(参见,例如Kokoris等人,美国专利号7,939,259,“High Throughput Nucleic Acid Sequencing by Expansion”)是基于称为“XNTP”的高度修饰、非天然核苷酸类似物的聚合。一般而言,SBX使用生化聚合将DNA模板的序列转录到称为“Xpandomer”的可测量聚合物上。转录的序列沿Xpandomer主链在高信噪比报告子中编码,所述报告子相隔约10nm,专为高信噪比、分化良好的反应而设计。这些差异在Xpandomer相对于天然DNA的序列读段效率和准确性方面提供了显著的性能增强。SBX过程的概述在图1A、图1B、图1C和图1D中描述。
XNTP是与模板依赖性酶促聚合相容的可展开的、5’三磷酸修饰的非天然核苷酸类似物。高度简化的XNTP在图1A中示出,其强调了这些非天然底物的独特特征:XNTP 100具有两个不同的功能区;即:可选择性切割的氨基磷酸酯键110,将5’α-磷酸115连接到核碱基105;以及连接在核苷三氨基磷酸酯内的某些位置处的对称合成的报告子系链(SSRT)120,该位置允许通过氨基磷酸酯键的切割来控制展开。SSRT包括连接基125A和125B,它们被可选择性切割的氨基磷酸酯键分开。每个连接基都连接到报告子代码130的一个末端。XNTP100以“受约束的构型”说明,这是XNTP底物和模板依赖性聚合的子链产物的特征。聚合XNTP的受限构型是扩展构型的前体,如Xpandomer产品中所见。从受限构型到扩展构型的转变发生在子链的主要主链内的氨基磷酸酯的P-N键断裂时。
Xpandomer聚合物的合成总结在图1B和图1C中。在组装期间,单体XNTP底物145(XATP、XCTP、XGTP和XTTP)通过使用单链模板140作为向导的模板导向聚合过程在新生子链150的可延伸末端聚合。通常,该过程从引物开始并沿5′到3′方向进行。通常,使用DNA聚合酶或其他聚合酶来形成子链,并且选择条件以便获得模板链的互补拷贝。在合成子链之后,偶联的SSRT形成进一步形成子链的受约束的Xpandomer。子链中的SSRT具有XNTP底物的“受约束的构型”。SSRT的受约束的构型是展开的构型的前体,如Xpandomer产物中所见。
如图1C所示,从受约束的构型160到展开的构型165的转变是由于子链的主要主链内可选择性切割的氨基磷酸酯键(为简单起见用无阴影椭圆表示)的切割引起的。在该实施例中,SSRT包含一个或多个对它们所连接的核碱基具有特异性的报告子或报告子代码,130A、130C、130G或130T,从而编码模板的序列信息。以这种方式,SSRT提供了一种手段来展开Xpandomer的长度并降低母链序列信息的线性密度。
图1D说明Xpandomer 165通过纳米孔180从顺式储器175易位到反式储器185。通过纳米孔后,线性化Xpandomer的每个报告子代码(在此图示中,标记为“G”、“C”和“T”)产生独特且可重复的电子信号(由叠加迹线190表示),对它所连接的核碱基具有特异性。
图2更详细地描绘了XNTP的一个实施例的概括结构。XNTP 200包含具有连接臂部分220A和220B的核苷三氨基磷酸酯210,这两个连接臂部分被可选择性切割的氨基磷酸酯键230分开。SSRT在键合基团250A和250B处与核苷三磷酸酯相连,其中第一SSRT末端连接到杂环260(此处由胞嘧啶表示,尽管杂环可以是四种标准核碱基A、C、G、或T中的任一个),并且第二SSRT末端连接到核碱基主链的α磷酸酯270。本领域技术人员将理解,可以使用本领域已知的许多合适的偶联化学以形成最终的XNTP底物产物,例如,可以通过三唑键合基团的形成来完成SSRT缀合。
在该实施例中,SSRT 275包括若干功能元件或“特征”,诸如聚合酶增强区280A和280B、报告子代码285A和285B,以及翻译控制元件(TCE)290A和290B。在其他实施例中,SSRT包括单个TCE。这些特征中的每一个都在Xpandomer通过纳米孔易位以产生一系列独特且可重复的电子信号期间执行独特的功能。SSRT 275设计用于通过空间位阻和/或电排斥的组合控制TCE引起的Xpandomer易位速率,如本文进一步讨论的。不同的报告子代码的大小可以阻止离子以不同的可测量水平流过纳米孔。使用通常用于寡核苷酸合成的亚磷酰胺化学可以有效地合成特定的SSRT聚合序列。可以通过从市售和/或专有库中选择特定亚磷酰胺的序列来设计报告子代码和其他特征。此类文库包括但不限于长度为1个至12个或更多乙二醇单元的聚乙二醇合长度为1个至12个或更多碳单元的脂肪族聚合物。在某些实施例中,SSRT在靠近核苷酸三磷酰胺酸二酯的SSRT末端包括称为“聚合酶增强区”的特征。聚合酶增强区可以包括带正电荷的多胺间隔区(例如,伯胺、仲胺、叔胺或季胺)或三胺间隔区(三个仲胺,每个由三个碳分开),其促进通过核酸聚合酶的XNTP结构掺入。在某些实施例中,聚合酶增强区包括两个精胺重复单元,其中精胺部分由具有以下结构的亚磷酰胺单体提供(本领域技术人员将认识到,三氟乙酰胺保护基团在SSRT合成结束时被去除以暴露精胺上的胺基团):
Figure BDA0003366876350000181
如本公开通篇所用,术语“报告子构建体”是指包括报告子代码、对称化学分支和易位控制元件的SSRT的元件。在某些实施例中,报告子构建体是聚合物,其包括从第一末端到第二末端串联的第一报告子代码、带有易位控制元件的对称化学分支和第二报告子代码。术语“带有”是指对称分支和易位控制元件之间的共价连接,其产生易位控制元件相对于所述两个报告子代码的有利取向。如本文进一步讨论并参考图6-图8,对称化学分支可以由字母“Y”表示,其中两个报告子代码接合到Y的臂,而易位控制元件接合到Y的茎。因此,两个报告子代码通过分支在线接合,而分支在相对于线性、在线、SSRT的垂直取向上带有易位控制元件。
如本公开通篇所用,术语“连接基A”和“连接基B”是指各自包括聚合酶增强区和一个或多个易位减速特征或区的SSRT区,并且在某些实施例中,包括含有例如PEG6聚合物的间隔区,其可以定制以调节在纳米孔中穿过的SSRT的长度。
在某些实施例中,XNTP可以是具有以下通用结构的化合物:
Figure BDA0003366876350000191
在一个实施例中,R可以是H,例如,当化合物用于对DNA模板进行测序时。在另一个实施例中,R可以是OH,例如,当化合物用于对RNA模板进行测序时。
在某些实施例中,核碱基是腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶、尿嘧啶或核碱基类似物。本领域技术人员将理解,腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶和尿嘧啶是天然存在的核碱基。如本文所用,术语“核碱基类似物”是指能够与相邻单链核酸模板上的互补核碱基形成Watson和Crick碱基对的非天然存在的核碱基。示例性核碱基类似物包括但不限于5-氟尿嘧啶;5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧基羟甲基)尿嘧啶、5-羧甲基氨基甲基-2-硫尿嘧啶、5-羧甲基氨基甲基尿嘧啶、二氢尿嘧啶、β-D-半乳糖苷、肌苷、N6-异戊烯基腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫尿嘧啶、β-D-甘露糖基辫苷、5′-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-N6-异戊烯基腺嘌呤、尿嘧啶-5-氧乙酸(v)、怀丁氧苷、假尿嘧啶、辫苷、2-硫代胞嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-氧乙酸甲酯、尿嘧啶-5-氧乙酸(v)、5-甲基-2-硫尿嘧啶、3-(3-氨基-3-N-2-羧基丙基)尿嘧啶、(acp3)w、2,6-二氨基嘌呤、3-硝基吡咯、8-氮杂-7-脱氮鸟嘌呤、8-氮杂-7-脱氮杂肌苷和8-氮杂-7-脱氮腺嘌呤。
如本文所讨论,报告子构建体是具有第一端和第二端的聚合物,并且包含从所述第一端到所述第二端串联的第一报告子代码、带有易位控制元件的对称化学分支和第二报告子代码。这一系列特征反映了报告子构建体(以及整个SSRT,包括对称连接基、连接基A和连接基B)的对称结构,其中两个报告子代码的序列相同并通过对称的化学分支以相反的取向串联接合。整个SSRT包括报告子构建体的合成,在本文中参考图6至图8进一步讨论。简而言之,合成沿3′到5′方向进行,从TCE的3′末端开始。向TCE的5′末端添加对称分支使第一报告子代码和第二报告子代码从分支的每个臂同时聚合,然后同时合成连接基A和连接基B,在SSRT的第一末端和第二末端的5′末端终止。已经发现,由带有易位控制元件的对称分支分隔的两个相同报告子代码提供的在线冗余在纳米孔测序过程中提供了几个优点。例如,Xpandomer当在任一方向上移位时都可能被纳米孔读取,即Xpandomer可以“向前”或“向后”读取。这种灵活性实现了本文进一步讨论的“棘轮”测序方法和其他方法,诸如基于电压施加的交流模式的“牙线”。
图3显示了在易位α-溶血素纳米孔的过程中切割的Xpandomer的一个实施例。该生物纳米孔嵌入脂质双层膜中,该膜将两个电解质储库分开并电隔离。典型的电解质具有缓冲至7.0的pH值的1摩尔KCl。当在双层上施加小电压(通常为100mV)时,纳米孔会限制离子电流的流动,并且是电路中的主要电阻。Xpandomer报告子代码设计用于提供特定的离子电流阻塞水平,并且可以通过测量离子电流水平序列随着报告子代码序列易位纳米孔来读取序列信息。
α-溶血素纳米孔通常是定向的,因此通过进入前庭侧并离开茎侧发生易位。如图3所示,纳米孔被定向以首先从茎侧捕获Xpandomer。在某些情况下,与首先进入前庭时相比,此取向可能会导致更少的阻塞伪影。然而,根据本发明,α-溶血素纳米孔可以在任一方向上取向。随着Xpandomer移位,报告子进入茎,直到其易位控制元件在茎入口处停止。报告子被保持在茎中,直到TCE能够进入并通过茎,然后易位进行到下一个报告子。在该实施例中,通过易位控制部分与TCE的解离实现TCE进入茎中。有利地,本发明人已经发现由一类新型悬垂PEG亚磷酰胺构造的TCE基于固有的物理化学和空间特性提供显着改善的易位控制,从而避免依赖于反式作用的易位控制部分的结合和解离。
用于SSRT特征设计的新型化合物
通常用于自动寡核苷酸合成的亚磷酰胺化学为合成聚合SSRT提供了一种有效且方便的手段。然而,SSRT特征设计的最终潜力受到商业图书馆中可用的亚磷酰胺单体(PPA)的限制。商业PPA主要基于核苷核心结构,并且因此不提供设计更广泛的功能阵列所需的物理化学特性范围,所述特征提高纳米孔读取的效率和准确性。为了解决本领域中的这个缺点,本发明人设计并合成了大量新的PPA单体化合物。重要的是,这些化合物不是基于本领域众所周知的核苷核心结构,并且如上所述,限制了特征设计。
如本文所用,缩写“PPA”是指为O-(2-氰乙基)-(N,N-二异丙基)-亚磷酰胺的亚磷酰胺。本领域技术人员容易理解,术语“亚磷酰胺”是指单体前体的结构;在PPA在线聚合成SSRT之后,单体被转化为磷酸二酯连接的寡聚产物。
用于制造磷酸二酯主链聚合物的其他方法可用于合成SSRT。因此,与这些化学物质一起使用的单体也可以产生具有非核苷元素的SSRT。其他组装方法可能涉及使用在溶液相或固体支持物上完成的自动或手动组装策略。H-膦酸酯合成和磷酸三酯合成是本领域已知的实例。此外,使用酶促合成的方法可适用于合成SSRT(例如,用于酶促寡核苷酸合成的那些)。在一些实施例中,SSRT的合成可以基于任何上述合成方法的组合。
以下是用于指导PPA单体设计的某些原则的简要、非限制性总结。1)磷酸盐间距。设计的化合物保持C3(3个原子)间距,所述间距模拟天然核苷酸主链的间距。在某些实施例中,其他合适的间距包括2至20个原子间距。出乎意料的是,发现原子间距会影响纳米孔易位的速率,从而可以对易位控制进行微调。2)亲水性。根据特定功能的需要,设计化合物以优化SSRT特征的亲水性。一些单体设计基于PEG,因为它能够增加水溶性,这是例如报告子代码的重要特性。本发明人能够通过调整PEG聚合物的长度,以及通过用甲基醚终止PEG聚合物或将1,2,3-三唑引入聚合物中来微调PPA单体的亲水性,这具有意想不到的进一步提高水溶性的作用。3)空间体积。设计并测试了线性、支化、环状和树枝状PPA结构的几种替代配置,以评估空间体积对通过纳米孔的电流的影响。4)主链中的手性。纳米孔是手性环境。对映体化合物被设计成确定关键纳米孔信号特性是否受到任何影响。5)电荷。除了反磷酸盐电荷外,某些化合物还带有正电荷,例如叔胺或负电荷,例如羧酸。(6)芳族:由多种芳烃和杂芳族结构构成的化合物被掺入到主链中,以确定与纳米孔的相互作用是否产生了期望的信号特性。
PPA单体化合物除了减弱纳米孔信号特性(诸如易位速率控制或电流电平控制)外,还会影响Xpandomer的物理化学特性。Xpandomer作为半合成聚合物,表现出与天然聚合物(例如DNA)和合成聚合物两者相关的特性。在一些实施例中,某些PPA单体可以使不期望的Xpandomer间相互作用或Xpanodmer与SBX工作流程的某些工艺要素之间的相互作用减弱。例如,有可能减少Xpandomer自聚集、高阶玻璃或明胶的形成、隔离、被动吸附到容器表面、纳米通道壁或包含膜和纳米孔的制作装置的表面或与其相互作用。
已证明当掺入SSRT特征时提供出色功能的一类化合物在本文中称为“悬垂PEG”。这些结构基于分子核心,所述分子核心能够以相对于核心的悬垂配置连接一种或多种含PEG的聚合物。可以在悬垂的PEG化合物的聚合物和梳子之间进行结构类比,其中单个化合物之间的磷酸二酯键形成梳子的底部,并且基于PEG的聚合物形成牙齿。有利地,可以针对特定的SSRT特征(例如,聚合物牙齿的间距、长度和组成中的一者或多者)定制悬垂的PEG“牙齿”的若干特性。下面的结构1a、2a、3a和4a说明悬垂PEG核心结构的四个示例性实施例。
Figure BDA0003366876350000221
在某些非限制性实施例中,X或X′可以表示-CH2O-[CH2CH2O-]mO-其中m为1-10且Y或Y′可表示-H、-CH3
Figure BDA0003366876350000222
Figure BDA0003366876350000223
表1A-C列出了用于例如SSRT特征设计的新型亚磷酰胺单体化合物的非限制性集合。参考相关实例来提及每种化合物的合成方案,并且包括每种化合物的具体前体。表征纯化合成化合物的分析数据也列于表1A中。这些化合物可用于合成任何合适的聚合特征,例如SSRT报告子代码、易位控制元件和易位减速特征,如本文进一步详细描述的。表1A还提供了化合物的名称,参考它们在掺入合成聚合物后采用的串联结构。
Figure BDA0003366876350000241
Figure BDA0003366876350000251
Figure BDA0003366876350000261
Figure BDA0003366876350000271
Figure BDA0003366876350000281
Figure BDA0003366876350000291
Figure BDA0003366876350000301
Figure BDA0003366876350000311
Figure BDA0003366876350000321
Figure BDA0003366876350000331
Figure BDA0003366876350000341
Figure BDA0003366876350000351
Figure BDA0003366876350000361
Figure BDA0003366876350000371
Figure BDA0003366876350000381
Figure BDA0003366876350000391
Figure BDA0003366876350000401
Figure BDA0003366876350000411
Figure BDA0003366876350000421
Figure BDA0003366876350000431
Figure BDA0003366876350000441
Figure BDA0003366876350000451
Figure BDA0003366876350000461
Figure BDA0003366876350000471
Figure BDA0003366876350000481
Figure BDA0003366876350000491
Figure BDA0003366876350000501
Figure BDA0003366876350000511
Figure BDA0003366876350000521
Figure BDA0003366876350000531
Figure BDA0003366876350000541
Figure BDA0003366876350000551
Figure BDA0003366876350000561
Figure BDA0003366876350000571
Figure BDA0003366876350000581
Figure BDA0003366876350000591
Figure BDA0003366876350000601
Figure BDA0003366876350000611
Figure BDA0003366876350000621
Figure BDA0003366876350000631
Figure BDA0003366876350000641
Figure BDA0003366876350000651
Figure BDA0003366876350000661
Figure BDA0003366876350000671
Figure BDA0003366876350000681
Figure BDA0003366876350000691
Figure BDA0003366876350000701
Figure BDA0003366876350000711
表1B
示例性新型亚磷酰胺(PPA)单体-组B
Figure BDA0003366876350000721
Figure BDA0003366876350000731
Figure BDA0003366876350000741
表1C
示例性新型亚磷酰胺(PPA)单体-组C
Figure BDA0003366876350000751
Figure BDA0003366876350000761
Figure BDA0003366876350000771
Figure BDA0003366876350000781
Figure BDA0003366876350000791
基于新型亚磷酰胺单体的易位控制元件(TCE)。
如本文所讨论的,SSRT的TCE特征被设计为阻止Xpandomer易位,以便将报告子代码定位在纳米孔孔口内进行测量。本发明的新的亚磷酰胺单体化合物的可用性使得能够设计下一代TCE结构,所述结构通过空间位阻、电排斥和与纳米孔的优先相互作用中的一种或多种来控制易位速率。当定位在孔隙孔口处时,TCE对离子电流的驱动力的阻力以及克服停滞和恢复易位所必需的随后施加的电压(即电压脉冲)的增加,可以通过调制TCE的各种性质(以及在一些实施例中,报告子代码和SSRT的其他元素)例如体积、长度和/或电荷密度来定制。重要的是,由于易位速率受TCE固有特性的控制,因此易位控制摆脱了依赖现有技术策略的负担,现有技术策略采用例如基于与可溶性寡核苷酸可逆相互作用的核苷酸杂交策略。
在某些实施例中,TCE是使用亚磷酰胺方法通过固相合成产生的聚合物,其具有以支化结构(即,“分支”)终止的合适单体结构单元。支化亚磷酰胺是本领域已知的,并且包括从例如Glen Research和ChemGenes商购获得对称和不对称分支。在一个实施例中,TCE分支是对称支化CED亚磷酰胺,其中分支的每个臂与报告子代码连接。示例性对称化学分支包括1,2,3-O-三-(磷酸二酯)-丙烷、1,3-双-(5-O-磷酸二酯-戊基酰胺基)-2-O-磷酸二酯-丙烷和1,4,7-O-三-(磷酸二酯)-庚烷。
图4以简化形式说明了TCE如何通过纳米孔阻止Xpandomer易位。此处,Xpandomer的每个SSRT包括报告子代码485A和485B,所述报告子代码在TCE的分支结构493的臂末端连接到TCE 490。在该实施例中,TCE 490包括结构495,其具有相对于报告子代码的物理体积更大的物理体积。当TCE 490遇到孔隙孔口时,Xpandomer易位通过纳米孔桶450被阻止。在某些实施例中,TCE的体积和报告子代码的电荷密度(即,阻滞位点的局部电场)都有助于易位阻滞。在暂停期间,报告子代码495A被保持在纳米孔桶中,并以特征性和可检测的方式阻止电流通过所述孔隙。为了克服阻滞,向系统施加电压脉冲,迫使TCE进入并通过孔隙。易位然后恢复,直到下一个TCE遇到孔隙孔口。
为了定制易位控制,可以调整TCE的几个结构特性(以及在某些实施例中,SSRT的其他特征)。例如,可以修改TCE的长度、体积和电荷密度中的一者或多者,以及纳米孔桶内带电荷元素的空间定位。在一些实施例中,通过将一种或多种悬垂PEG亚磷酰胺掺入到聚合结构中来增加TCE的体积。例如,TCE可以掺入2至30、2至20、3至15或4至14个悬垂PEG亚磷酰胺化合物。在其他实施例中,TCE可以包括表1A-C中列出的任何合适数量亚磷酰胺化合物和其组合。例如,TCE可以以任何顺序包括1到10、2到8、或2或3种不同的亚磷酰胺化合物;在某些实施例中,亚磷酰胺化合物中的至少一者是悬垂PEG亚磷酰胺。在某些实施例中,整个TCE的长度可包括2至30、2至20、3至15或4至14种亚磷酰胺化合物。在一些实施例中,TCE的式可以由(PPA1)n1(PPA2)n2表示,其中PPA1和/或PPA2表示悬垂PEG亚磷酰胺化合物并且n1=1至12和n2=0到10。发明人已经发现,基于该式的TCE显著减少了测序错误(例如,插入或缺失事件)并实现了顺序SSRT之间的单脉冲转换。在某些实施例中,TCE包括由具有以下序列的亚磷酰胺化合物合成的聚合物:[(1-O-DMT-3-O-PPA-2S-O-mPEG4-丙烷(化合物12b))]n1[(1-O-DMT-3-O-PPA-2-(4-Me-O-PEG3)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35b)]n2,其中n1是0至6且n2是6至10。在其他实施例中,TCE包括一种或多种可通过UV辐射检测的亚磷酰胺发色团,例如苯并呋喃或含三唑的PPA。
在其他实施例中,TCE可以包括具有多于两个臂的分支结构。在一种实施例中,亚磷酰胺分支可具有末端支化结构。在该实施例中,分支具有四个臂,其中两个臂连接到报告子代码,并且其中两个臂有助于易位控制。在其他实施例中。可以定制分支以优化诸如尺寸、极性和稳定性等特征。在一个实施例中,分支包括异氰酸酯三聚物。
在进一步的实施例中,本发明的TCE可以包括两个分支(即,“双分支”TCE),其中分支被多个未支化的亚磷酰胺隔开。分支可以是对称的或不对称的结构。不对称结构可以是单一的对映体或外消旋体。此外,外消旋体和/或两种对映体的组合可用于TCE中的不同位置。在该实施例中,每个分支促进不同的易位暂停事件,其中第一个可以被称为“代码暂停”,它在纳米孔中保持报告子代码,而其中的第二个可以被称为“时钟”暂停”,它会产生独特的信号,表明检测系统已经“读取”了前面的报告子代码。
表2列出了几个示例性TCE序列。需要强调的是,本发明并不限于这些特定的实施例,因为技术人员将理解,基于本公开,可以设计广泛的不同TCE文库以适应广泛的实验要求。在某些实施例中,以下列出的任何TCE序列可以在具有一种或多种间隔化合物,包括C3、苯并呋喃或PEG3的分支的远侧末端终止。表2中的关键将其形式的化合物识别为亚磷酰胺单体。对本领域普通技术人员而言将显而易见的是,描述词“亚磷酰胺”仅适用于单体形式的化合物;适用于多聚体“在线”形式的化合物的描述词列于表1A中。
表2
示例性易位控制元件(TCE)
Figure BDA0003366876350000821
Figure BDA0003366876350000831
Figure BDA0003366876350000841
Figure BDA0003366876350000851
Figure BDA0003366876350000861
Figure BDA0003366876350000871
降低Xpandomer易位过程中插入和缺失事件发生率的方法和构建体
在其他方面,本发明提供通过Xpandomer修饰结合设计到SSRT中的离散易位减速特征(在本文中也称为“D细胞”)的易位控制手段。如本文所公开的,Xpandomer在合成后经受几个处理步骤,包括胺修饰步骤。在胺修饰过程中,Xpandomer用琥珀酸酐处理,琥珀酸酐与SSRT聚合酶增强区的精胺成分上的仲胺基团(以及在某些情况下,酸切割步骤引入的伯胺基团)反应。胺基的琥珀酰化导致引入带负电荷的半琥珀酸酯基团。通过增加琥珀酰化程度,精胺基增强剂上的负电荷程度同样增加。每个精胺亚磷酰胺成分具有(+3)的净电荷;在标准修饰反应中,每个胺部分的电荷从(+1)变为(-1)。本发明人已经发现了产生不同程度的精胺琥珀酰化的条件,使得精胺成分的净电荷可以从(+3)到(-5)之间变化。在某些条件下,可能需要增加增强子区的负电荷,以便在施加电压脉冲时增加Xpandomer易位的速率(本文称为增强子电迁移率)。值得注意的是,已经发现这种电迁移率可以降低序列读取期间插入错误的百分比,并提高整体测序通量。
因此,在某些实施例中,Xpandomer处理包括胺修饰步骤。胺(例如精胺)修饰可以通过改变琥珀酰化反应条件,例如反应时间、温度、pH和/或反应中使用的琥珀酸酐的浓度中的一者或多者来实现。在其他实施例中,Xpandomer处理进一步包括在胺修饰步骤之后的HEPES洗涤步骤中的一者或多者以实现更完全的胺琥珀酰化。
在另一方面,本公开提供了一个或多个易位减速特征或区(术语“特征”和“区”在本文中可互换使用),它们是永久带电的,例如叔胺或季胺和/或大体积化合物。可以在聚合酶增强子内或附近的位置处将易位减速特征引入到SSRT中。选择减速特征以便在Xpandomer修饰(例如,琥珀酰化)反应期间不会改变。已发现将一个或多个减速特征包含到SSRT中的合适位置会减少缺失错误的百分比,这是由于增强子过度修饰导致易位率增加而引起的。不受理论束缚,据推测,大部分减速特征产生“摩擦”型力,其在遇到纳米孔孔口时降低Xpandomer易位速率。通常,减速特征被引入到SSRT中聚合酶增强子和报告子代码之间的位置(即,与增强子相邻)。
本发明的易位减速特征可以掺入表1A-1C中列出的亚磷酰胺化合物或市售亚磷酰胺的任何合适数量和组合。在一些实施例中,减速特征包括1至4个不同单体单元的组合。在其他实施例中,减速特征可以包括1或2个不同的单体单元。减速特征的整个长度可以是1至15个单体单元,或在其他实施例中,4至12或6至10个单体单元。表3列出了替代易位减速特征的非限制性实例。表3中的关键将其形式的化合物识别为亚磷酰胺单体。对本领域普通技术人员而言将显而易见的是,描述词“亚磷酰胺”仅适用于单体形式的化合物;适用于多聚体“在线”形式的化合物的描述词列于表1A中。
表3
示例性易位减速特征
Figure BDA0003366876350000891
Figure BDA0003366876350000901
Figure BDA0003366876350000911
报告子代码
每个SSRT使用TCE将报告子代码定位在具有高离子电流电阻的纳米孔区域内。在α溶血素中,该区域是茎。在该区域中,不同的报告子的大小被设计成阻止不同可测量水平的离子流。可以通过从表1A-1C和/或市售文库中设置的亚磷酰胺单体化合物集合中选择特定亚磷酰胺序列来设计报告子。合适的单体化合物也公开于申请人的美国专利号10,457,979中,其通过引用全文并入本文,包括PEG3、PEG6和C2。
每种成分单体化合物根据其在纳米孔中的位置、其位移、其电荷、其与纳米孔的相互作用、其化学和热环境以及其他因素对净电阻做出贡献。
报告子代码设计通过平衡测量特征来指导,所述测量特征包括:(i)归一化离子电流(I/Io):其中I是离子电流,并且Io是开放通道电流;(ii)离子电流噪声:包括多态响应、阻塞、随机尖峰等;和/或(iii)控制部分的释放时间或TCE在茎入口处停滞的时间。
图5A-5D说明了可如何设计不同的报告子代码以保持沿主链的相似电荷密度,同时提供由于每个独特单体成分占据的不同体积而导致的孔隙阻塞的特征水平。在这些插图中,纳米孔以横截面描绘,并标明了桶和前庭部分。报告子代码以简化形式描述,黑色圆圈表示由代码的亚磷酰胺成分引入的带电荷磷酸二酯部分。图5A说明了线性代码,在该实施例中识别为“零PEG代码”,但本发明不旨在如此受限,例如,在某些实施例中,线性代码可以包括PEG部分。图5B、图5C和5D说明了可如何从单个支化单体化合物的重复单元构建独特的代码,显示示例性基于PEG的结构,例如,悬垂PEG化合物。在这些实施例中,三个不同代码的支化部分在孔隙通道中占据不同的体积,并且从而产生可以彼此区分的独特信号。在这些实施例中,沿主链的电荷密度对于每个报告子代码是相同的。然而,如本文进一步讨论的,在其他实施例中,报告子代码可以设计为具有沿着主链的电荷密度梯度。
报告离子电流阻塞及其双链体释放时间也通过测量条件来调节,所述测量条件为例如:(i)电压;(ii)电解质;(iii)温度;(iv)压力;和/或(v)pH,如本文进一步描述的。
在一些实施例中,与报告子相关的TCE也有助于离子流阻塞。
对于一组给定的测量条件,报告子可以设计为定义测量动态范围的最小和最大I/Io水平。其他报告子可以设计为在动态范围内具有不同的I/Io水平。由于每个报告子在纳米孔中暂停,因此测量的I/Io水平必须保持足够长时间的稳定并且具有足够低的噪声,以便可以唯一地区分报告子类型。通过选择低阻抗分子(报告子代码聚合物)的主链,将动态范围最大化,通常是那些具有小物理横截面和低线性质量密度的分子。
表4列出了示例性报告子代码,但应理解,本发明考虑了掺入本文公开的亚磷酰胺化合物的任何合适组合和数量的报告子代码。表4中的关键将其形式的化合物识别为亚磷酰胺单体。对本领域普通技术人员而言将显而易见的是,描述词“亚磷酰胺”仅适用于单体形式的化合物;适用于多聚体“在线”形式的化合物的描述词列于表1A中。
表4
示例性报告子代码
Figure BDA0003366876350000921
Figure BDA0003366876350000931
Figure BDA0003366876350000941
Figure BDA0003366876350000951
Figure BDA0003366876350000961
Figure BDA0003366876350000971
Figure BDA0003366876350000981
SSRT和XNTP的合成
如本文所公开的,对称合成的报告子系链(SSRT)是使用标准自动化寡核苷酸合成方案合成的。图6以简化形式说明了SSRT合成。在步骤A中,将亚磷酰胺固定在固体支持物上;在步骤B中,使用亚磷酰胺偶联在支持物上聚合亚磷酰胺单体;在步骤C中,将对称分支添加到增长的SSRT结构中;在步骤D中,在对称分支的每个臂上聚合对称亚磷酰胺支链;在步骤E中,添加末端叠氮基,使SSRT能够经由点击反应与dNTP-2c缀合;在步骤F中,以其最终形式从底物上释放SSRT。
在一个实施例中,SSRT合成利用四步迭代过程,所述过程包括1)在固体支持物受控孔隙玻璃珠上合成SSRT聚合物(反映在步骤A-D的卡通片中)。在此步骤中,SSRT使用MerMadeTM 12合成仪(可从BioAutomation商购)以1μM的规模一次合成一个报告子构建体。首先制备MerMadeTM序列管理器,然后制备亚磷酰胺(例如,制备每种亚磷酰胺的0.067M溶液)。将每个亚磷酰胺的合适偶联时间编程到合成器中。SSRT合成循环基于传统的四步过程:脱三苯甲基化(使用溶剂,例如二氯甲烷中的3%DCA),单体偶联(使用溶剂,例如乙腈中的0.25M ETT),封端(使用溶剂例如,THF/二甲基吡啶/Ac2O(CAP A)和THF中的16%甲基咪唑(CAP B))和氧化(使用溶剂,例如0.02M I2的THF/吡啶/H2O)。步骤2)通过手动转换对5′末端进行功能化,用叠氮取代Br(反映在步骤E的卡通片中),即“叠氮修饰”。在该步骤中,合成柱用1mL DCM洗涤,并转移至2mL管中;制备叠氮化物转化溶液(DMF中的100mM碘化钠和100mM叠氮化钠)并在室温将1.6mL加入管中并孵育2小时;然后用1mL DMF冲洗支持物并转移到柱;用2mL DMF、然后是3mL ACN和1mL DCM冲洗柱。步骤3)去除氰乙基保护基团。在本步骤中,在ACN中制备10%的DEA溶液,所述溶液可能包含0.1M硝基甲烷;在真空下,该溶液的稳定流穿过柱至少10′;然后用2mL ACN然后是1mL DCM冲洗柱。步骤4)切割将SSRT从固体支持物上完全脱保护(反映在步骤F的卡通片中)。在此步骤中,将支持物转移到2ml管中,并且将500μL的30%NH4OH(可能包含100mM硝基甲烷)加入管中,并在55℃孵育30′;然后将管在冰箱中冷却5’;将500μL 40%甲胺加入管中,并在65℃孵育1小时。然后将样品在冰箱中冷冻5分钟;然后通过排空柱并用15mL H2O洗涤来使样品脱盐;然后用100mM TEAA从柱上洗脱SSRT并进行量化。
图7说明了四种示例性SSRT产物,所述产物可用作形成XATP、XCTP、XGTP和XTTP的报告子构建体,其中每一种都被设计为在穿过纳米孔时产生独特的电子信号。关键说明了这些特定亚磷酰胺的化学结构,因为它们存在于最终的SSRT报告子构建体中。如本公开通篇所用,R表示叠氮六,Q表示精胺,D表示PEG6,X表示PEG3,L表示C2间隔区,4表示悬垂PEG4,Y表示对称化学分支,并且5表示苯并呋喃。在该实施例中,R提供叠氮化物缀合特征,QQ聚合物提供增强子特征,Y444444444444聚合物提供TCE特征,并且DDLLLDX、DDD44LXXX、DDD4444LLDX和XXL444444LLLLLLL聚合物提供四种独特的报告子代码特征。
图8A总结了示例性XNTP经由SSRT和dNTP-2c的环化,经由铜催化的点击反应来形成。如本公开通篇所用,“dNTP-2c”是指可切割核苷三氨基磷酸酯类似物,其包括与核苷的杂环部分缀合的1,7-辛二炔基连接基和与三磷酰胺的α氨基磷酸酯部分缀合的5-己炔基连接基。这是包括以下步骤的三步过程:1)点击反应;在一个实施例中,将SSRT和dNTP-2c添加到由0.2mM CuSO4/0.6mM THPTA/1.2mM NaAsc构成的点击反应溶液中并孵育30′;2)标准HPLC纯化;以及3)使用本领域认可的方法进行脱盐。dNTP-2c化合物的结构和合成的更多细节公开于申请人颁发的美国专利10,301,345中,该美国专利以引用方式全文并入本文。图8B说明详细化学结构的示例性XNTP。
在某些实施例中,XNTP的核碱基可以是非天然类似物,例如7-脱氮杂腺嘌呤、7-脱氮鸟嘌呤等。
额外的易位控制手段
I.通过易位控制部分的可逆结合进行易位控制
在图9A和图9B中以简化形式说明了易位控制的该实施例。在该实施例中,易位速率由可溶性易位结合部分与Xpandomer的TCE的结合和解离来控制。如图9A所示,第一可溶性易位结合部分与靠近Xpandomer的第一报告子代码的第一TCE元件的结合形成“代码易位控制复合体”。这种可逆的相互作用使纳米孔中的第一报告子代码停止、暂停或阻滞(为简单起见,这些术语在本文中可互换使用)并产生第一代码所独有的电流变化。这些代码信号用于识别Xpandomer的每个单体单元。随后,如图9B所示,第一易位结合部分从第一TCE解离,允许第一报告子代码通过,即退出,在它进入孔隙的相对侧上的纳米孔。然后,该易位事件通过第二易位结合部分与Xpandomer中第一报告子代码远侧的第二TCE的结合而停止。该第二易位控制复合体在本文中被称为“时钟易位控制复合体”。这种易位的中断会产生电流(即“时钟信号”)的变化,表明第一代码区通过纳米孔的完全易位。在某些实施例中,Xpandomer的每个单元的时钟信号可以彼此相同或几乎无法区分。本领域技术人员将理解,代码信号本身足以确定Xpandomer的序列信息。
根据本发明,任何合适的可逆结合配偶体组均可用于易位控制。在一个实施例中,TCE包括生物素衍生物,而易位控制部分由链霉亲和素提供。在该实施例中,生物素衍生物可以被工程设计成以比天然生物素低的亲和力结合链霉亲和素。合适的生物素衍生物的一个实例是脱硫生物素(DTB),如图10所示。在其他实施例中,生物素-SA TCE系统可以通过例如使用形成较弱生物素-SA复合体的其他生物素类似物和/或使用形成较弱复合体的SA突变体来控制。
II.通过调整运行条件来进行易位控制
已经发现,对基于纳米孔的检测系统中使用的各种条件进行微调可以提高Xpandomer易位控制和代码读取的准确性。因此,在其他方面,本公开提供了通过修改以下运行条件中的一者或多者来提高聚合物易位通过纳米孔的速率的手段:
A.电压参数
离子从本文所述的基于纳米孔的检测系统的顺式腔室到反式腔室的流动是由于跨膜施加电压电位的结果,所述电压电位可互换地称为“读取电压”或“基线电压”。在本发明的一个实施例中,通过改变基线电压来调节Xpandomer易位速率。在一些实施例中,基线电压可以在从约40mV至约150mV的范围内。在其他实施例中,基线电压可以在从约90mV至约110mV的范围内。在再其他实施例中,基线电压可以在从约55mV至约75mV的范围内。在一些实施例中,可能需要更高的基线电压以更高的速率捕获报告子代码读段。
如本文所讨论的,当靠近报告子代码的TCE遇到孔隙的孔口时,Xpandomer易位受到阻滞。报告子代码保持在孔隙中,直到施加足够强的电压脉冲以克服由保持在孔隙中的TCE结构提供的电阻。因此,在另一个实施例中,通过改变脉冲电压的强度来调节Xpandomer易位速率。在一些实施例中,脉冲电压在从约250mV至约2000mV的范围内。在其他实施例中,脉冲电压在从约550mV至约700mV的范围内。同样,电压脉冲的持续时间会影响Xpandomer易位的速率。在一些实施例中,电压脉冲的持续时间在约1μs至约50μs的范围内。在其他实施例中,电压脉冲的持续时间在约5μs至约10μs的范围内。在另一个实施例中,可以优化脉冲电压的周期性。在一些实施例中,周期性在从约0.5ms至约20ms的范围内。在再其他实施例中,脉冲电压的周期为约0.5ms至约1.5ms。本领域技术人员将理解,最佳电压脉冲的强度、持续时间和周期性将取决于许多因素,例如TCE的力。
B.
流过本文所述的基于纳米孔的检测系统的电流速率可受填充系统的顺式和反式腔室的缓冲剂的盐组成的影响。因此,在某些实施例中,Xpandomer易位通过孔隙的速率可以通过盐组成调节。在这些实施例中,可以使用包含任何合适的一价或二价阳离子的盐。在一些实施例中,合适的盐包括但不限于NH4Cl、MgCl2、LiCl、KCl、CsCl、NaCl和CaCl2.在其他实施例中,合适的盐包括其中阴离子为乙酸根的盐。在需要较慢电流的条件下,具有较低离子迁移率的盐,例如LiCl,可能是有利的。在一些实施例中,反式腔室包含2M NH4Cl和具有约0.2M的合适摩尔浓度的第二任选盐,并且顺式腔室包含具有范围在约0.4M至约1M的合适摩尔浓度的NH4Cl和具有范围在约0.2M至约0.8M的合适摩尔浓度的第二任选盐。在其他实施例中,可能需要位于这些范围之外的其他摩尔浓度和/或盐的其他组合。
C.离液剂
在某些其他方面,本发明的基于纳米孔的检测系统的顺式腔室可以包括一种或多种离液剂以改善单个聚合物分析物例如线性化Xpandomer的易位。可以使用任何合适的离液剂,例如尿素和/或盐酸胍(GuCl)。在一些实施例中,顺式腔室的缓冲组合物包括范围在约200mM至约2M的GuCl和/或尿素。
D.渗透梯度
在其他方面,本发明提供基于纳米孔的检测系统,其中跨膜建立渗透梯度以影响Xpandomer易位通过孔隙的速率。不受理论束缚,假设其中反式腔室中盐和/或其他添加剂的浓度相对于顺式腔室更高的梯度产生朝向纳米孔的水流,从而将Xpandomer拉向孔隙。在这些条件下,可以在较低的运行电压下观察到事件频率(例如,代码读取)的速率增加。因此,在一些实施例中,运行条件包括跨膜建立约50%的渗透梯度;例如,在顺式腔室中约1M的盐(和/或其他添加剂)浓度和在反式腔室中约2M的盐(和/或其他添加剂)浓度。在进一步的实施例中,可以采用任何其他合适的渗透梯度。
E.溶剂
已经发现某些溶剂可以增强Xpandomer的溶解性并提高通过纳米孔的易位速率。因此,在某些实施例中,本发明的样品缓冲剂包括一种或多种有机溶剂。合适的溶剂包括但不限于以约1%至约25%的范围使用的3-甲基-2-噁唑烷酮(MOA)、DMF、ACN、DMSO和NMP。
F.缓冲剂、添剂和其他运行条件
用于本发明的合适的缓冲剂包括但不限于具有约7.4的pH值的20mM-100mM HEPES和具有范围在约25mM至约250mM的摩尔浓度且具有范围在约6至约10的pH值的双三丙烷缓冲剂。在其他方面,本发明的缓冲剂可以包含某些去污剂添加剂,例如己酸钠(NaHex),以提高Xpandomer易位的速率。在某些实施例中,本发明的样品缓冲剂包含约20mM NaHex。其他合适的添加剂包括但不限于稳定剂,诸如EDTA和氧化还原试剂。任何缓冲剂的粘度也可以通过添加剂诸如PEG、甘油、聚蔗糖等改变。
在其他方面,Xpandomer的易位率可以通过温度来调节。在一些实施例中,运行温度可以在从约4℃至约40℃的范围内。在其他实施例中,运行温度可以在约16℃至约22℃的范围内。
可切割延伸寡核苷酸
在另一方面,本公开提供用于Xpandomer合成的可切割的延伸寡核苷酸(EO)。可切割的设计特征使EO能够在合成之后且在纳米孔分析之前从Xpandomer中去除,即从Xpandomer上切割下来。当不希望多核苷酸序列通过纳米孔易位时,该功能提供了优势。Xpandomer的合成、处理和纳米孔序列分析如已在例如申请人的PCT专利申请号PCT/US18/67763中描述,其以引用方式全文并入本文。
可切割延伸寡核苷酸的一个实施例以简化形式示于图11中。EO的3′端被修饰以包括可切割键,例如,酸可切割氨基磷酸酯键,此处由“P-NH”表示。通过可切割连接基连接到EO的核碱基为Xpandomer合成提供了游离3′羟基,其方向由虚线箭头指示。相同核碱基的碱基部分被修饰以提供纳米孔易位所需的其他特征,例如在本文中也称为“悬垂前导序列”的前导基团。因此,在EO延伸形成Xpandomer之后,酸处理会释放寡核苷酸引物,而前导基团和其他接合特征仍然与Xpandomer相关联。有利地,发明人已经发现Xpandomer合成不受在可切割延伸寡核苷酸上添加悬垂前导序列的影响。
棘轮
本领域中实施的基于纳米孔的检测系统的一个缺点是由于在连续施加直流电压期间发生的电解质耗尽导致电流随时间消耗。例如,在电解质电路基于亚铁氰化物-铁氰化物氧化还原对的情况下,纳米孔阵列中的每个孔具有有限的体积,并且因此含有有限数量的这些氧化还原离子种类。在直流电压下,一种物质会转化为另一种物质,并将导致电流下降。为了克服电流消耗的这个问题并随着时间保持更平衡的电流,本公开提供了用于使用基于纳米孔的检测系统检测聚合物分析物的手段,该检测系统替代地依赖于电压施加的交流(AC)模式。这种模式在本文中被称为“棘轮”。棘轮的一般概述示于图12中。图12的顶部面板说明了电压施加的示例性模式;在本实施例中,施加了+70mV的“正向”读取电压,在中间,系统经受+500mV的短暂(5μs)脉冲电压。然后在“正向”读取电压之后是-70mV的“反向”读取电压,并且重复这个+70mV正向读取/500mV脉冲/+70mV正向读取/-70mV反向读取的循环,直到整个聚合分析物穿过纳米孔。棘轮协议的一个显著优势是在每个正向读取-反向读取循环中补充电解质分布。
图12的底部面板说明了在棘轮过程中聚合物易位的方向性如何变化。在该实施例中,聚合物分析物的每个单元包括由易位控制元件例如TCE 1215分开的两个相同的报告子代码(例如1210A和1210B)。如图12所示,施加+70mM正向运行电压导致聚合物通过孔隙从膜的顺式侧移动到反式侧,直到报告子代码1210A通过由TCE 1215诱导的易位暂停被阻滞在孔隙中。由于阻滞的报告子代码1210A引起的通过孔隙的电流变化被读取为信号“L1+”。应用500mV脉冲迫使TCE 1215和报告子代码1210B通过孔隙。在5μs脉冲之后,读取电压返回到+70mV,随后串联的下一个报告子代码1220A被其相应的TCE 1225阻滞在孔隙中。由于阻滞的报告子代码1220A引起的流过孔隙的电流变化被读取为信号“L2+”。接下来,通过向系统施加-70mM的反向读取电压来使电压反向,导致聚合物易位方向的反转。在此期间,报告子代码1220A被推回通过孔隙到膜的顺侧。易位继续进行,直到TCE 1215遇到孔隙,因此易位被阻滞,从而将报告子代码1210B定位在孔隙中以产生测量为电平“L1-”的电流变化。接下来,电压恢复到+70mM正向运行电压,因此聚合物易位的方向反转回顺式到反式方向,直到由于TCE 1225的ITC效应而发生阻滞,将报告子代码1220A定位在孔隙中。由此产生的电流变化读作电平“L2+”。在此棘轮协议期间,表征聚合物中每个单元的报告子代码被读取三次(报告子代码“A”被读取两次,并且报告子代码“B”被读取一次)。这种冗余为序列读段提供了一种质量控制手段,并提高了所得序列数据的准确性。插入和缺失错误很容易被识别为与预期模式的偏差,例如L1+/L2+/L1-/L2+。
尽管图12中描绘的棘轮图案示出了在正向读取电压的“中间”期间施加的脉冲电压,但本发明设想了其他脉冲模式。例如,在一些实施例中,可以在施加正向读取电压之前施加脉冲,而在其他实施例中,可以在正向读取电压结束时,恰好在施加反向读取电压之前施加脉冲。
在其他实施例中,棘轮提供用于补偿或校正由于不同报告子代码的电阻中的脉冲和不对称引起的电流消耗中的一者或两者的手段。例如,在一些实施例中,可以增加反向读取电压以补偿由于在正向读取电压期间施加的脉冲造成的电流损失。当不同的报告子代码具有不同的固有电阻时,也可以调整反向读取电压的百分比增加以平衡电流。
在棘轮方案的其他变体中,可以改变正向、脉冲和反向电压的顺序。例如,在一个实施例中,棘轮循环可以如下运行:(正向读取电压)、(正向读取电压)、(反向读取电压)。在另一个实施例中,棘轮循环可以如下运行:(正向读取)n(反向读取)n,其中“n”表示由纳米孔测量的聚合物中单体单元的总数。
在一个相关的想法中,提出了“牙线”,其中可以在纳米孔中沿其全长读取DNA,停止,然后在使电压极性反向时可以在另一个方向上读取(参见,例如,Kasianowicz,John J.“Nanopores:Flossing with DNA.”Nature Materials 3,no.6(2004):355-56.https://doi.org/10.1038/nmat1143)。这是阵列中效率较低的方法,因为DNA聚合物不会被同步捕获或停止,而棘轮是在这些时间尺度上连续向前的过程。
基于SBX的诊断方法和试剂盒
在另一方面,本发明公开了用于检测和诊断目标样品中的遗传改变/突变的方法和试剂盒,所述目标样品可以是实体组织或体液。遗传改变可以是种系或体细胞突变。本发明可用于与癌症、自身免疫疾病、器官移植排斥、遗传性胎儿异常、病原体和其他合适的病症相关的检测和诊断。
实例
材料和方法
除非另有说明,否则以下材料(具有所示缩写)均得自美国的上述来源。2-苯基-1,3-二恶烷-5-醇,TBDPS-Cl(叔丁基二苯基氯硅烷)、DMAP(4-二甲基氨基吡啶)、(R)-(+)-缩水甘油、(+)-2,3-O-异亚丙基-L-苏糖醇、异山梨醇、4,4′-双(羟基甲基)-2,2′-联吡啶、TBTA(三[(1-苄基-1H-1,2,3-三唑-4-基)甲基]胺),来自TCI America(Porrland,OR)。NaH(氢化钠)、MeOH(甲醇)、甲苯、THF(四氢呋喃)、TBAF(四丁基氟化铵)、DCM(二氯甲烷)、HCl(浓盐酸)、DMSO(二甲基亚砜)、Na抗坏血酸(抗坏血酸钠)、碳酸氢钠、硫酸铜、炔丙基丙二酸二甲酯、硼氢化锂和乙酸得自Sigma-Aldrich(St.Louis,MO)。DMT-Cl(4,4′-二甲氧基三苯甲基氯)和PPA-Cl(N,N-二异丙基氨基氰乙基磷酰胺)来自ChemGenes Corporation(Wilmington,MA)。TEA(三乙胺)、己烷、乙酸乙酯、EDTA(乙二胺四乙酸)、乙醚来自EMDMillipore(Billerica,MA)。m-PEG4-Tos由m-PEG4-OH(Cat.No.BP-23742)制成。氟[3,2-c]吡啶-4(5h)-酮(Combi-Blocks,San Diego,CA)。
高效液相色谱(HPLC)在Agilent Technologies,Inc.(Santa Clara,CA)的ProStar HelixTM HPLC系统上进行,所述系统由两个泵(ProStar 210溶剂输送模块)组成,所述泵具有10ml钛泵头、柱温箱(ProStar 510 Air Oven),设置为292nm的紫外检测器(ProStar 320紫外/可见检测器)。该系统由Star色谱工作站软件(6.41版)控制。使用的柱是来自Imtakt USA(Porrland,OR)的Cadenza Guard Column System CD-C18(2.0mm x5mm)。所用的缓冲剂是缓冲剂A(100mM三乙基醋酸铵,pH 7.0)和缓冲剂B(100mM三乙基醋酸铵,pH 7.0,含95%体积的乙腈)。自动固相亚磷酰胺合成在MerMadeTM 12合成仪(Bioautomation Corp,Plano,TX)上进行。MerMadeTM的合成溶液购自Glen Research(Sterling,VA)。
实例1
外消旋2-(3,6-二氧杂庚氧基)-1,3-丙二醇的DMT亚磷酰胺的合成悬垂代码2-甘 油基PEG-2亚磷酰胺[外消旋体]
将2-苯基-1,3-二恶烷-5-醇(1,2.7g,15mmol)溶解在30mL无水THF中。添加氢化钠(1.08g,27mmol)以产生醇盐。当鼓泡停止时,将mPEG4-Tos(4.94g,18mmol)溶解在10mL THF中并分批加入。将反应升温至40℃并在搅拌下孵育3小时,然后使其降至室温过夜。用1mLMeOH淬灭过量的NaHH,然后用水稀释并用DCM萃取。在减压下浓缩合并的有机层。将残余物重新悬浮在甲苯中,与剩余的盐分离,并通过快速色谱纯化得到产率为73%的2。
将苄基啶保护的2b(3.05g,10.8mmol)溶解在10mL MeOH中并添加HCl(0.2mL,2.3mmol)。将溶液孵育20分钟,然后用碳酸氢钠(200mg)中和并在减压下干燥。将残余物重新悬浮在DCM中,并通过快速色谱纯化得到产率为72%的二醇3。
将二醇3(1.52g,7.8mmol)溶解在20mL DCM和TEA(2.17mL,15.6mmol)中。在90分钟内分批加入DMT-Cl(1.85g,5.46mmol)在10mL DCM中的溶液以使单三苯甲基化最大化。添加MeOH(1mL)并将反应在减压下干燥。将残余物重新悬浮在甲苯中并与盐分离,然后通过快速色谱纯化得到以产率为48%的单三苯甲基产物4以及回收的起始二醇。
将单三苯甲基4(1.84g,3.7mmol)溶解在10mL DCM和TEA(1.03mL 7.4mmol)中。添加PPA-Cl(1.05g,4.4mmol)并将反应孵育15分钟。将反应在减压下干燥并重新悬浮在含有1%TEA的甲苯中,然后通过快速色谱纯化。得到产率79%为亚磷酰胺5(2.03g,2.9mmol)并通过1H和31P NMR确认。
Figure BDA0003366876350001081
实例2
对映体2-(3,6-二氧杂庚氧基)-1,3-丙二醇(12b)的DMT亚磷酰胺(悬垂代码2-甘 油基PEG-2亚磷酰胺[对映体]的合成
将2,3-异亚丙基-sn-甘油6溶解在无水DCM和TEA中。添加DMAP和TBDPS-Cl。用DCM从水中萃取反应并通过快速色谱纯化以得到产物7。
将甲硅烷基醚7溶解在MeOH中并添加HCl。将溶液孵育20分钟,然后用碳酸氢钠中和并在减压下干燥。将残余物重新悬浮在DCM中,并通过快速色谱纯化得到二醇8。
将二醇8溶解在DCM和TEA中。分批加入DMT-Cl的DCM溶液。添加MeOH并将反应在减压下干燥。将残余物重新悬浮在甲苯中并与盐分离,然后通过快速色谱纯化得到以单三苯甲基产物9。
将仲醇9溶解在无水THF中。添加氢化钠以产生醇盐。当鼓泡停止时,将mPEG4-Tos溶解在THF中并分批加入。将反应升温至40℃并在搅拌下孵育3小时,然后使其降至室温过夜。用1mL MeOH淬灭过量的NaH,然后用水稀释并用DCM萃取。在减压下干燥合并的有机层。将残余物重新悬浮在甲苯中,与剩余的盐分离,并通过快速色谱纯化得到10。
将mPEG4醚10b重新悬浮在THF中并添加TBAF。在减压下浓缩反应并通过快速色谱法纯化以得到11。
将DMT PEG4醇11b溶解在DCM和TEA中。添加PPA-Cl并将反应孵育15分钟。将反应在减压下干燥并重新悬浮在含有1%TEA的甲苯中,然后通过快速色谱纯化。分离亚磷酰胺12并通过1H和31P NMR确认。
Figure BDA0003366876350001091
实例3
对映体1-(3,6-二氧杂庚氧基)-2,3-丙二醇(16)的DMT亚磷酰胺的合成悬垂代码 1-甘油基PEG-2亚磷酰胺
将2,3-异亚丙基-sn-甘油6溶解在无水THF中。添加氢化钠以产生醇盐。当鼓泡停止时,将mPEG2-Tos(Broadpharm Cat.No.BP-2-982)溶解在THF中并分批加入。将反应孵育24小时。用MeOH淬灭过量的NaH,然后用水稀释并用DCM萃取。在减压下浓缩合并的有机层。将残余物重新悬浮在甲苯中,与剩余的盐分离,并通过快速色谱纯化得到13。
将PEG2产物13溶解在MeOH中并添加HCl。将溶液孵育20分钟,然后用碳酸氢钠中和并在减压下干燥。将残余物重新悬浮在DCM中,并通过快速色谱纯化得到二醇14。
将二醇14溶解在DCM和TEA中。分批加入DMT-C1的DCM溶液。添加MeOH并将反应在减压下干燥。将残余物重新悬浮在甲苯中并与盐分离,然后通过快速色谱纯化得到以单三苯甲基产物15。
将单DMT 15溶解在DCM和TEA中。添加PPA-Cl并将反应孵育15分钟。将反应在减压下干燥并重新悬浮在含有1%TEA的甲苯中,然后通过快速色谱纯化。分离亚磷酰胺16并通过1H和31P NMR确认。
Figure BDA0003366876350001101
实例4
1-(5H-呋喃并[3,2-c]吡啶-4-酮)-2,3-丙二醇(20)的DMT亚磷酰胺的合成悬垂代 码1-甘油基杂环亚磷酰胺
将(R)-(+)-缩水甘油17溶解在DCM和TEA中。分批加入DMT-Cl的DCM溶液。添加MeOH并将反应在减压下干燥。将残余物重新悬浮在甲苯中并与盐分离,然后通过快速色谱纯化得到DMT醚18。
将DMT醚18溶解在无水DMF中。添加氢化钠以产生醇盐。当鼓泡停止时,将氟[3,2-c]吡啶-4(5h)-酮溶解在THF中并分批加入。将反应带至100℃并在搅拌下孵育12小时。用MeOH淬灭过量的NaH,然后用水稀释并用DCM萃取。在减压下浓缩合并的有机层。将残余物重新悬浮在甲苯中,与剩余的盐分离,并通过快速色谱纯化得到19。
将仲醇19溶解在DCM和TEA中。添加PPA-Cl并将反应孵育15分钟。将反应在减压下干燥并重新悬浮在含有1%TEA的甲苯中,然后通过快速色谱纯化。分离亚磷酰胺20并通过1H和31P NMR确认。
Figure BDA0003366876350001111
实例5
异山梨醇(23)的在线代码DMT亚磷酰胺的合成双仲醇代码主链
将异山梨醇21溶解在DCM和TEA中。分批加入DMT-Cl的DCM溶液。添加MeOH并将反应在减压下干燥。将残余物重新悬浮在甲苯中并与盐分离,然后通过快速色谱纯化得到单三苯甲基22。
将单三苯甲基22溶解在DCM和TEA中。添加PPA-C1并将反应孵育15分钟。将反应在减压下干燥并重新悬浮在含有1%TEA的甲苯中,然后通过快速色谱纯化。分离亚磷酰胺23并通过1H和31P NMR确认。
Figure BDA0003366876350001121
实例6
联吡啶(26)的在线代码DMT亚磷酰胺的合成双伯醇代码主链
将4,4′-双(羟甲基)-2,2′-联吡啶24溶解在DCM和TEA中。分批加入DMT-Cl的DCM溶液。添加MeOH并将反应在减压下干燥。将残余物重新悬浮在甲苯中并与盐分离,然后通过快速色谱纯化得到单三苯甲基25。
将单三苯甲基25溶解在DCM和TEA中。添加PPA-C1并将反应孵育15分钟。将反应在减压下干燥并重新悬浮在含有1%TEA的甲苯中,然后通过快速色谱纯化。分离亚磷酰胺26并通过1H和31P NMR确认。
Figure BDA0003366876350001122
实例7
2-烷基三唑的悬垂代码DMT亚磷酰胺的合成PEG-21,3-丙二醇(31a)。悬垂三唑PEG 代码
将炔丙基丙二酸二甲酯27滴加到硼氢化锂在乙醚中的冷悬浮液中。然后将反应温热至室温,并且孵育过夜。用甲醇、然后水和乙酸淬灭反应。用乙醚萃取溶液,在减压下浓缩合并的有机层。通过快速色谱法纯化粗制材料得到二醇28。
将二醇28溶解在DCM和TEA中。分批加入DMT-C1的DCM溶液。添加MeOH并将反应在减压下干燥。将残余物重新悬浮在甲苯中并与盐分离,然后通过快速色谱纯化得到DMT醇29。
将DMT醇29溶解在DMSO中并添加叠氮化物(Cat.No.BP-20988Broadpharm)。单独地,将TBTA溶解在DMSO中并且合并抗坏血酸钠和硫酸铜。在搅拌下将TBTA溶液分批添加至炔烃/叠氮化物溶液中。孵育45分钟后,用EDTA淬灭反应。将溶液用水稀释并用乙酸乙酯萃取,然后在减压下浓缩有机层并通过快速色谱法纯化以得到30。
将1,2,3-三唑30a溶解在DCM和TEA中。添加PPA-Cl并将反应孵育15分钟。将反应在减压下干燥并重新悬浮在含有1%TEA的甲苯中,然后通过快速色谱纯化。分离亚磷酰胺31并通过1H和31P NMR确认。
Figure BDA0003366876350001131
实例8
悬垂PEG-2、PEG-4和PEG-6亚磷酰胺[异构体纯](35a)的合成
将1-O-TBDPS-3-O-DMTr-丙烷-1,2,3-三醇9(来自实例2)溶解在无水THF中。添加氢化钠以产生醇盐。当鼓泡停止时,分批加入甲苯磺酸酯(经由Cat.No.BP-21657的甲苯磺酰化制备,Broadpharm)。将反应在搅拌下孵育48小时。用水淬灭过量的NaH,然后将溶液转移到分液漏斗中并用乙酸乙酯萃取。将合并的有机层用盐水洗涤,经硫酸钠干燥,过滤并在减压下浓缩。将残余物重新悬浮在甲苯中,与剩余的盐分离,并通过快速色谱纯化得到32。
将炔烃32a重新悬浮在THF中并添加TBAF。在减压下浓缩反应并通过快速色谱法纯化以得到33。
向炔烃33a在DMSO中的溶液中添加2-叠氮基乙酸乙酯。在单独的小瓶中,将抗坏血酸钠溶解在水中并添加DMSO,然后添加1M CuSO4,以制备催化剂混合物。在10分钟内将催化剂混合物滴加到炔烃/叠氮化物溶液中。完成后,用0.5M EDTA淬灭并搅拌15分钟。用水稀释并用乙酸乙酯萃取三次。用盐水洗涤合并的有机萃取物并经硫酸钠干燥。将残余物重新悬浮在甲苯中,并通过快速色谱纯化得到34a。
将三唑34a溶解在DCM和TEA中。添加PPA-Cl并将反应孵育15分钟。将反应在减压下干燥并重新悬浮在含有1%TEA的甲苯中,然后通过快速色谱纯化。分离亚磷酰胺35并通过1H和31P NMR确认。
Figure BDA0003366876350001141
实例9
基于PEG的报告子代码(37b)的合成
向产物33在DMSO中的溶液中添加2-(乙酰氧基甲基)-2-(叠氮甲基)丙烷-1,3-二乙酸二酯(通过将2-(溴甲基)-2-(羟甲基)-1,3-丙二醇溶解在DMF中,然后加入NaN3制备)。将反应在110℃孵育、浓缩并通过快速色谱法纯化。分离产物后,将残余物与乙酸酐反应并纯化)。在单独的小瓶中,将抗坏血酸钠溶解在水中并添加DMSO,然后添加1M CuSO4,以制备催化剂混合物。在10分钟内将催化剂混合物滴加到炔烃/叠氮化物溶液中。完成后,用0.5MEDTA淬灭并搅拌15分钟。用水稀释并用乙酸乙酯萃取三次。用盐水洗涤合并的有机萃取物并经硫酸钠干燥。将残余物重新悬浮在甲苯中,并通过快速色谱纯化得到36。
将伯醇36b溶解在DCM和TEA中。添加PPA-Cl并将反应孵育15分钟。将反应在减压下干燥并重新悬浮在含有1%TEA的甲苯中,然后通过快速色谱纯化。分离亚磷酰胺37并通过1H和31P NMR确认。
Figure BDA0003366876350001151
实例10
基于PEG的报告子代码(40)的合成
将1-O-TBDPS-3-O-DMTr-丙烷-1,2,3-三醇9(来自实例2)溶解在无水THF中。添加氢化钠以产生醇盐。当鼓泡停止时,将甲苯磺酸酯(通过Cat.No.BP-21036,Broadpharm的顺序甲苯磺酸化和甲硅烷基保护来制备)溶解在THF中并分批加入。将反应在搅拌下孵育过夜。用水淬灭过量的NaH,并用DCM萃取。在减压下干燥合并的有机层。将残余物重新悬浮在甲苯中,与剩余的盐分离,并通过快速色谱纯化得到38。
双甲硅烷基醚38重新悬浮在THF中并添加TBAF。在减压下浓缩反应并通过快速色谱法纯化。将纯化的材料重新悬浮在DCM中并添加TEA。滴加BzCl。将反应在室温搅拌,直到完成。在减压下浓缩反应并通过快速色谱法纯化以得到醇39。
将醇39溶解在DCM和TEA中。添加PPA-Cl并将反应孵育15分钟。将反应在减压下干燥并重新悬浮在含有1%TEA的甲苯中,然后通过快速色谱纯化。分离亚磷酰胺40并通过1H和31P NMR确认。
Figure BDA0003366876350001161
实例11
基于双PEG的报告子代码(45a-d和47e-i)的合成
O,O′-亚苄基季戊四醇(41,Cat.No.B2682,TCI)溶解在无水THF中。添加氢化钠以产生醇盐。当鼓泡停止时,将甲苯磺酸盐(经由Cat.No.BP-21397,Broadpharm或Cat.No.BP-21657,Broadpharm的甲苯磺酰化制备)溶解在THF中并分批加入。将反应在搅拌下孵育过夜。用水淬灭过量的NaH,并用DCM萃取。在减压下干燥合并的有机层。将残余物重新悬浮在甲苯中,与剩余的盐分离,并通过快速色谱纯化得到42a-h。
将产物42a-h溶解在MeOH中并添加HCl。将反应在室温孵育过夜,然后用碳酸氢钠中和。将其减压浓缩并通过快速色谱纯化以得到43a-h。
将产物43a-h溶解在DCM和TEA中。分批加入DMT-C1的DCM溶液。将反应在减压下干燥。将残余物重新悬浮在甲苯中并与盐分离,然后通过快速色谱纯化得到单三苯甲基44a-h。
将产物44a-d溶解在DCM和TEA中。添加PPA-C1并将反应孵育15分钟。将反应在减压下干燥并重新悬浮在含有1%TEA的甲苯中,然后通过快速色谱纯化以得到亚磷酰胺45a-d。
向产物44(e-h)在DMSO中的溶液中加入2-叠氮基乙酸乙酯。在单独的小瓶中,将抗坏血酸钠溶解在水中并添加DMSO,然后添加1M CuSO4,以制备催化剂混合物。在10分钟内将催化剂混合物滴加到炔烃/叠氮化物溶液中。完成后,用0.5M EDTA淬灭并搅拌15分钟。用水稀释并用乙酸乙酯萃取三次。用盐水洗涤合并的有机萃取物并经硫酸钠干燥。将残余物重新悬浮在甲苯中,并通过快速色谱纯化得到46e-h。
将产物46e-h溶解在DCM和TEA中。添加PPA-Cl并将反应孵育15分钟。将反应在减压下干燥并重新悬浮在含有1%TEA的甲苯中,然后通过快速色谱纯化以得到亚磷酰胺47e-h。
Figure BDA0003366876350001181
实例12
基于PEG的报告子代码(52)的合成和测试
将2,2-双(溴甲基)-1,3-丙二醇(48,Cat.No.D1808,TCI)溶解在DMF中并添加NaN3。将反应在110℃孵育、浓缩并通过快速色谱法纯化以得到产物49。
向49在DMSO中的溶液中加入苯甲酸2-(2-(丙-2-炔-1-基氧基)乙氧基)乙酯(通过商业醇前体的苯甲酰化来制备)。在单独的小瓶中,将抗坏血酸钠溶解在水中并添加DMSO,然后添加1M CuSO4,以制备催化剂混合物。在10分钟内将催化剂混合物滴加到炔烃/叠氮化物溶液中。完成后,用0.5M EDTA淬灭并搅拌15分钟。用水稀释并用乙酸乙酯萃取三次。用盐水洗涤合并的有机萃取物并经硫酸钠干燥。将残余物重新悬浮在甲苯中,并通过快速色谱纯化得到50。
将产物50溶解在DCM和TEA中。分批加入DMT-Cl的DCM溶液。将反应在减压下干燥。将残余物重新悬浮在甲苯中并与盐分离,然后通过快速色谱纯化得到51。
将产物51溶解在DCM和TEA中。添加PPA-Cl并将反应孵育15分钟。将反应在减压下干燥并重新悬浮在含有1%TEA的甲苯中,然后通过快速色谱纯化以得到亚磷酰胺52。
Figure BDA0003366876350001191
实例13
基于PEG的报告子代码(62)的合成和测试
将2-(溴甲基)-2-(羟甲基)-1,3-丙二醇(53,Cat.No.B4057,TCI)溶解在DMF中并添加NaN3。将反应在110℃孵育、浓缩并通过快速色谱法纯化以得到产物54。
将产物54溶解在DCM和TEA中。添加苯甲酰氯。将溶液在室温孵育过夜。用DCM从水中萃取反应并通过快速色谱纯化以得到产物55,双-Bz,将其与任何单-或三-保护的物种分离并划分。
将一部分产物55溶解在DCM和TEA中。分批加入DMT-Cl的DCM溶液。添加MeOH并将反应在减压下干燥。将残余物重新悬浮在甲苯中并与盐分离,然后通过快速色谱纯化得到三苯甲基化56。
将41溶解在无水THF中。添加氢化钠以产生醇盐。当鼓泡停止时,将炔丙基溴溶解在THF中并分批加入。用1mL MeOH淬灭过量的NaH,然后用水稀释并用DCM萃取。在减压下干燥合并的有机层。将残余物重新悬浮在甲苯中,与剩余的盐分离,并通过快速色谱纯化得到57。
将产物57溶解在MeOH中并添加HCl。将反应在室温孵育过夜,然后用碳酸氢钠中和。将其在减压下浓缩并通过快速色谱法纯化以得到58。
将产物58溶解在DCM和TEA中。添加苯甲酰氯,并将反应孵育60分钟。用DCM从水中萃取反应并通过快速色谱纯化以得到产物59。
将产物56和59溶解在9∶1 DMSO:H2O中。添加TBTA、抗坏血酸钠和硫酸铜的溶液并将反应孵育60分钟。用DCM从水中萃取反应并通过快速色谱纯化以得到产物60。
将产物60和55溶解在9∶1 DMSO:H2O中。添加TBTA、抗坏血酸钠和硫酸铜的溶液并将反应孵育60分钟。用DCM从水中萃取反应并通过快速色谱纯化以得到产物61。
将产物61溶解在DCM和TEA中。添加PPA-Cl并将反应孵育15分钟。将反应在减压下干燥并重新悬浮在含有1%TEA的甲苯中,然后通过快速色谱纯化。分离亚磷酰胺62并通过1H和31P NMR确认。
Figure BDA0003366876350001211
实例14
对映体(9S,10S)-2,5,8,11,14,17-六氧杂十八烷-9,10-二醇(悬垂代码C2双- PEG-2亚磷酰胺[对映体])(67)DMT亚磷酰胺的合成
将(+)-2,3-O-异亚丙基-L-苏糖醇63在无水DMF中的溶液缓慢加入NaH在无水DMF中的混合物中(注意:H2气体剧烈放出)。当鼓泡停止时,将mPEG2-Tos(BroadpharmCat.No.BP-20983)溶解在DMF中并分批加入以在环境温度下搅拌过夜。将反应混合物倒在水中,用乙酸乙酯萃取并通过快速色谱纯化,得到64。
将产物64溶解在MeOH中并添加HCl。将溶液孵育20分钟,然后用碳酸氢钠中和并在减压下干燥。将残余物重新悬浮在乙酸乙酯中,并通过快速色谱纯化得到65。
将产物65溶解在DCM和TEA中。分批加入DMT-C1的DCM溶液。将反应在减压下干燥。将残余物重新悬浮在甲苯中并与盐分离,然后通过快速色谱纯化得到66。
将产物66溶解在DCM和TEA中。添加PPA-Cl并将反应孵育15分钟。将反应在减压下干燥并重新悬浮在含有1%TEA的甲苯中,然后通过快速色谱纯化。将亚磷酰胺67通过1H和31P NMR来确认。
Figure BDA0003366876350001221
实例15
1-O-DMT-3-O-PPA-2,2-双(Me-O-mPEG4)-丙烷(72)的合成
向季戊四醇(68,Cat.No.P0039,TCI)在DMF中的溶液中添加对甲苯磺酸。将反应用三乙胺中和,浓缩并通过快速色谱纯化,得到69。
将产物69添加到EDC-HCl、DMAP和乙酰丙酸在THF中的搅拌溶液中,并在环境温度下搅拌过夜。将溶液浓缩并通过快速色谱法纯化以得到70。
将产物70溶解在DCM和TEA中。分批加入DMT-Cl的DCM溶液。将反应在减压下干燥。将残余物重新悬浮在甲苯中并与盐分离,然后通过快速色谱纯化得到71。
将产物71溶解在DCM和TEA中。添加PPA-Cl并将反应孵育15分钟。将反应在减压下干燥并重新悬浮在含有1%TEA的甲苯中,然后通过快速色谱纯化。将亚磷酰胺72通过1H和31P NMR来确认。
Figure BDA0003366876350001231
实例16
基于PEG的报告子代码的合成和测试
在本实例中,报告子代码是用基于PEG的亚磷酰胺合成的;值得注意的是,这些代码不包含核苷酸。表5中列出了四个示例性报告子代码。
表5
代码指示符 序列
L1 DDDLLLL
L2 DXXX3LL3XXLL
L3 DXLL44XXXLLLL
L4 DXXL4444LLXXLL
关键:D=PEG6:X=PEG3;L=C2;3=点击PEG-2;4=悬垂PEG-4
通过合成源自HIV-2基因组的序列的100mer Xpandomer拷贝来评估每个代码的级别区分(即可区分的电子信号)和易位时间,所述序列掺入XNTP,其中四个XNTP中的每一个都包含来自表4所列组的唯一代码。Xpandomer合成、处理和纳米孔序列分析如申请人的PCT专利申请号PCT/US18/67763所述来实施,所述专利以引用方式全文并入本文。作为对照,对掺入不同已知代码的相同HIV-2序列的Xpandomer拷贝进行并行测序。图13A(对照-旧代码)和13B(测试-新的、基于PEG的对照)示出了说明每个代码的级别区分和易位时间的代表性轨迹。
为了评估Xpandomer序列信息的准确性,通过显示来自SBX反应的序列读段群的直方图显示来分析序列数据。分析软件将每个序列读段与模板序列对准,并修整与正确模板序列不对准的读段末端的序列范围。100mer模板的SBX测序的代表性直方图呈现在图14A(对照)和图14B(新的,基于PEG的代码)中。值得注意的是,掺入无核苷酸的基于PEG的代码的Xpandomer产生了该模板的高度准确的序列读段。
实例17
对基于PEG的TCE-2个代码级别进行易位控制
在本实例中,通过使用SBX方案对由TG二核苷酸重复序列组成的简单60mer模板进行测序,评估了掺入悬垂PEG亚磷酰胺的TCE的易位控制。XATP和XCTP底物均设计为掺入以下TCE:Y22222222222255,其中“Y”表示对称亚磷酰胺分支;“2”表示悬垂PEG2;且“5”表示苯并呋喃。XATP底物被设计为掺入以下报告子代码:DDDDDDLLLL,其中“D”表示PEG6,且“L”表示C2。XCTP底物被设计为掺入以下报告子代码:DDDDXX44XXDL,其中“X”表示PEG3,且“4”表示悬垂PEG4。
为了产生60mer模板的Xpandomer拷贝,使用4pm的延伸寡核苷酸和250pm的每个XNTP进行引物延伸反应。10μL延伸反应包括以下试剂:50mM TrisCl、pH 8.84、200mMNH4OAc、20%PEG8K、5%NMS、0.75nmol聚磷酸盐PP-60.20、2μg SSB、0.5M尿素、5mM PEM添加剂(合适的聚合酶增强分子公开在申请人的未决PCT专利申请号PCT/US18/67763中,所述专利通过引用全文并入本文)和1.2μg纯化的重组DNA聚合酶(DPO4聚合酶的合适工程变体公开在申请人的PCT专利申请号WO2017/087281、PCT/US2018/030972和PCT/US1864794中,所述专利申请通过引用全文并入本文)。在42℃进行延伸反应30分钟。
接下来使用SBX方案对延伸反应的Xpandomer产物进行测序。简而言之,将受约束的Xpandomer产物切割以产生线性化的Xpandomer。这通过首先淬灭延伸反应并用2M琥珀酸酐对Xpandomer进行胺修饰来实现。然后通过用11.7M DCl在23℃处理样品30分钟来切割Xpandomer的氨基磷酸酯键。通过乙醇沉淀纯化线性化的Xpandomer,并重新悬浮在补充有34%ACN和15%DMF的缓冲剂中。
对于测序,将Xpandomer添加到2.8M NH4Cl、1.2M GuanCl、20mM NaHex、10%DMF、2mM EDTA和20mM HEPES pH 7.4的样品缓冲剂中。通过将α-溶血素插入缓冲剂中的DPhPE/十六烷双层成员中来制备蛋白质纳米孔,所述缓冲剂含有2M NH4Cl和100mM HEPES,pH7.4。该实验在顺式孔中使用了0.4M NH4Cl、600mM GuanCl和100mM HEPES,pH 7.4的缓冲剂,并且在检测系统的反式孔中使用了2M NH4Cl和100mM HEPES,pH 7.4。将Xpandomer样品加热至70℃达2分钟,完全冷却,然后将2μL样品添加至顺式孔中。运行的电压参数如下:60mV/300mV/10μs/2ms(读段电压/脉冲电压/脉冲电压持续时间/脉冲频率)。数据经由Labview采集软件获得。该运行的代表性迹线如图15所示。
如图15中叠加在迹线上方的级别数所示,本实验中的检测系统正确读取了所有报告子代码,证明了100%的准确性。缺失或插入错误不存在验证了基于悬垂PEG的TCE作为能够严格调节Xpandomer易位的结构的功效。值得注意的是,通过本实验中使用的基于悬垂PEG的TCE,在单个电压脉冲之后观察到两个代码级别之间的转换。利用单个电压脉冲在Xpandomer的序列报告子代码之间转换的能力是本领域的重大进步,并且能够实现更高的测序通量。
实例18
通过扩增基于悬垂PEG的TCE-4个代码级别进行测序
在本实例中,通过使用SBX方案对由序列重复序列CATG组成的60mer模板进行测序,评估了对掺入悬垂PEG亚磷酰胺的TCE的易位控制。所有XNTP底物均设计为掺入以下TCE:Y444444444444455,其中“Y”表示对称亚磷酰胺分支;“4”表示悬垂PEG4;且“5”表示苯并呋喃。XATP底物被设计为掺入以下报告子代码:DDDDDDLLDX;XCTP底物被设计为掺入以下报告子代码:DDDDDDLLLL;XTTP底物被设计为掺入以下报告子代码:DDDDDD44LXXX;并且XGTP底物被设计为掺入以下报告子代码:DDDDXXL444444XLLLL,其中“D”表示PEG6,“L”表示C2,“X”表示PEG3,并且“4”表示悬垂PEG4。
为了产生60mer模板的Xpandomer拷贝,使用4pm的延伸寡核苷酸和1000pm的每个XNTP末端进行引物延伸反应。10μL延伸反应包括以下试剂:50mM TrisCl、pH 8.84、200mMNH4OAc、20%PEG8K、10%NMP、3nmol多磷酸盐PP-60.20、2μg SSB、1M尿素、10mM PEM添加剂和1.8μg纯化重组DNA聚合酶。延伸反应在37℃进行30分钟。
接下来使用SBX方案对延伸反应的Xpandomer产物进行测序。简而言之,将受约束的Xpandomer产物切割以产生线性化的Xpandomer。这通过首先淬灭延伸反应并用2M琥珀酸酐对Xpandomer进行胺修饰来实现。然后通过用11.7M DCl在23℃处理样品30分钟来切割Xpandomer的氨基磷酸酯键。通过乙醇沉淀纯化线性化的Xpandomer,并重新悬浮在补充有34%ACN和15%DMF的缓冲剂中。
对于测序,将Xpandomer添加到0.8M NH4Cl、1.2M GuanCl和200mM HEPES,pH 7.4的样品缓冲剂中。通过将α-溶血素插入缓冲剂中的DPhPE/十六烷双层成员中来制备蛋白质纳米孔,所述缓冲剂含有2M NH4Cl和100mM HEPES,pH 7.4。该实验在顺式孔中使用了0.4MNH4Cl、600mM GuanCl和100mM HEPES,pH 7.4的缓冲剂,并且在反式孔中使用了2M NH4Cl和100mM HEPES,pH 7.4。将Xpandomer样品加热至70℃达2分钟,完全冷却,然后将2μL样品添加至顺式孔中。运行的电压参数如下:70mV/650mV/6μs/1.5ms(读段电压/脉冲电压/脉冲电压持续时间/脉冲频率)。数据经由Labview采集软件获得。该运行的代表性迹线如图16所示。
图16中叠加在迹线上方的级别数对应于由XCTP代码(L1)、XTTP代码(L2)、XATP代码(L3)和XGTP代码(L4)生成的信号。在本实验中,检测系统正确读取了所有报告子代码,证明了100%的准确性。缺失和插入错误不存在强调了基于悬垂PEG的TCE在瞬时暂停孔通道中的报告子代码以在“读段电压”期间产生准确的信号读段并允许在“脉冲电压”期间恢复易位方面的功效。同样,使用本实验中使用的基于悬垂PEG的TCE,通过单个电压脉冲实现了顺序报告子代码之间的转换。值得注意的是,在使用以下电压参数的相同Xpandomer样品的等分试样的不同运行中观察到相同水平的准确性:65/700/6/1.5;65/650/6/1.5;60/650/6/1.5和60/600/6/1.5。进一步观察到,代码读段的通量会受到各种电压参数的影响。
实例19
通过扩增具有基于悬垂PEG的TCE的复杂模板进行测序在本实例中,通过使用SBX方案对复杂100mer模板进行测序,评估了掺入悬垂PEG亚磷酰胺的TCE的易位控制。每个XNTP底物都用以下TCE合成:Y22222222222255,其中“Y”表示对称亚磷酰胺分支;“2”表示悬垂PEG2;且“5”表示苯并呋喃。XNTP底物是用以下报告子代码合成:(XC)DDDDDDLLLL,其中“D”表示PEG6,“L”表示C2;(XT)DDDDDD44LDX,其中“X”表示PEG3,并且“4”表示悬垂PEG4;(XA)DDDDXX44XXDL;和(XG)DDDDXXL。
为了产生100mer模板的Xpandomer拷贝,使用1pmol的XATP和XCTP以及1.5pmol的XGTP和XTTP进行固态引物延伸反应(其中延伸寡核苷酸共价结合到芯片底物上的固态Xpandomer合成描述于申请人的临时专利申请号62/826,805中,所述专利申请通过引用全文并入本文)。50μL延伸反应包括以下试剂:50mM TrisCl、pH 8.84、200mM NH4OAc、20%PEG8K、10%NMP、15pmol多磷酸盐PP-60.20、10μg SSB、1M尿素、10mM PEM添加剂和9μg纯化重组DNA聚合酶。延伸反应在37℃进行30分钟。
接下来使用SBX方案对Xpandomer产物进行测序。简而言之,将受约束的Xpandomer产物切割以产生线性化的Xpandomer。这通过首先淬灭延伸反应并用琥珀酸酐对Xpandomer进行胺修饰来实现。然后通过用7.5MDCl在23℃处理样品30分钟来切割Xpandomer的氨基磷酸酯键。通过光切割延伸寡核苷酸从芯片底物释放线性化的Xpandomer,并在补充有15%ACN和5%DMSO(20%最终溶剂)的洗脱缓冲剂中回收。
对于测序,将Xpandomer添加到0.8M NH4Cl、1.2M GuCl、200mM HEPES;pH 7.4的样品缓冲剂中。通过将α-溶血素插入2M NH4Cl和100mM HEPES,pH 7.4的缓冲剂中的DPhPE/十六烷双层成员中来制备蛋白质纳米孔。对顺式孔灌注含有0.4M NH4Cl、600mM GuanCl、100mM HEPES;pH 7.4的缓冲剂,并且对反式孔灌注含有2M NH4Cl、100mM HEPES;pH值7.4的缓冲剂。将Xpandomer样品加热至70℃2分钟,完全冷却并涡旋,然后将2μL等分试样加入顺式孔中。电压参数运行如下:60mV/600mV/6μs/1.5ms(读段电压/脉冲电压/脉冲电压持续时间/脉冲频率)。数据经由Labview采集软件获得。该运行的代表性迹线如图17所示。
如图17所示,在本实验中,检测系统正确读取了所有报告子代码的序列,证明了100%的准确性。缺失或插入错误的不存在再次验证了基于悬垂PEG的TCE作为能够高度可靠地读取聚合模板序列的结构的功效。重要的是,在这些条件下均聚物的运行被准确测序(参见,例如,图14中所示的迹线开始附近的4x L1代码序列),由此突出了具有基于悬垂PEG的TCE的SBX的准确性。
实例20
通过扩增具有其于悬垂PEG的TCF的复杂222mer模板进行测序
在本实例中,通过使用SBX方案对复杂222mer模板进行测序,评估了对基于悬垂PEG的TCE的易位控制。合成每一XNTP底物以包含以下TCE:Y44444444444455,其中“Y”表示对称亚磷酰胺分支;“4”表示悬垂PEG-4;且“5”表示苯并呋喃。XNTP底物是用以下报告子代码合成:(XC)DDDDDDLLLDX;(XT)DDDDDD44LXXX;(XA)DDDDDD444LLDX;和(XG)DDDDXXL444444XLLLL,其中“D”表示PEG-6,“L”表示C2,“X”表示PEG-3,并且“4”表示悬垂PEG-4。
为了产生222mer模板的Xpandomer拷贝,使用1.25pmol的每种XNTP、10pmol的模板和20pmol的E-oligo引物进行固态引物延伸反应(其中延伸寡核苷酸共价结合到芯片底物上的固态Xpandomer合成描述于申请人的临时专利申请号62/826,805中,所述专利申请通过引用全文并入本文)。50μL延伸反应包括以下试剂:50mM TrisCl、pH 8.84、200mMNH4OAc、20%PEG8K、8%NMP、15nmol多磷酸盐PP-60.20、10μg SSB、1M尿素、5mM PEM添加剂和9μg纯化重组DNA聚合酶。延伸反应在37℃进行30分钟。
接下来使用SBX方案对Xpandomer产物进行测序。简而言之,将受约束的Xpandomer产物在缓冲剂B.001(1%Tween-20/3%SDS/5mM HEPES,pH 8.0/100mM NaPO4/15%DMF)中洗涤并通过添加200μl缓冲剂C.001(7.5M DCl)并在23℃孵育30分钟进行切割以产生线性化的Xpandomer。然后通过添加1000μl缓冲剂B.001中和样品。然后通过添加666μmol琥珀酸酐并在23℃孵育5分钟,对Xpandomer样品进行胺修饰。然后在缓冲剂D.094(50%ACN)中洗涤样品,并且将Xpandomer通过光切割从底物释放并储存在缓冲剂AG497(0.8M NH4Cl/1.2MGuanCl/200mM HEPES,pH 7.4)中。
通过将α-溶血素插入2M NH4Cl和100mM HEPES,pH 7.4的缓冲剂中的DPhPE/十六烷双层成员中来制备蛋白质纳米孔。对顺式孔灌注含有0.4M NH4Cl、600mM GuanCl、100mMHEPES;pH 7.4的缓冲剂,并且对反式孔灌注含有2M NH4Cl、100mM HEPES;pH值7.4的缓冲剂。将Xpandomer样品加热至70℃2分钟,完全冷却并涡旋,然后将2μL等分试样加入顺式孔中。电压参数运行如下:60mV/650mV/6μs/1.0ms(读段电压/脉冲电压/脉冲电压持续时间/脉冲频率)。数据经由Labview采集软件获得。该运行的代表性迹线如图18所示。
如图18所示,在本实验中,检测系统正确读取了所有报告子代码的序列,证明了100%的准确性。缺失或插入错误的不存在再次验证了基于悬垂PEG的TCE作为能够高度可靠地读取聚合模板序列的结构的功效。同样,在这些条件下对均聚物的运行进行了准确测序,从而强调了具有基于悬垂PEG的TCE的SBX的准确性。
实例21
通过扩增具有基于悬垂PEG的TCE和D细胞的复杂222mer模板进行测序
在本实例中,通过使用SBX方案对复杂222mer模板进行测序,评估了对基于悬垂PEG的TCE和D细胞特征的易位控制。合成每一XNTP底物以包含以下TCE:Y(32)(32)(32)(32)(32)(32)(61)(61)(61)(61)(61)(61),其中“Y”表示对称亚磷酰胺分支;“32”表示悬垂mPEG4(PPA032);且61”表示悬垂PEG(PPA061)。每个XNTP还包括以下D细胞特征:D(63)D(63)D(63)DD其中“D”表示PEG6,且“63”表示悬垂PEG(PPA063)。XNTP底物是用以下报告子代码合成:(XC)DDLLLX;(XT)LXXX;(XA)DD(32)(32)(32)LLLLLLL;和(XG)XXL(32)(32)(32)(32)(32)(32)LLLLLLL,其中“D”表示PEG-6,“L”表示C2,“X”表示PEG-3,且“32”表示悬垂mPEG-4(PPA032)。
为了产生222mer模板的Xpandomer拷贝,使用5000pmol的每种XNTP、4pmol的模板和20pmol的E-oligo引物进行固态引物延伸反应(其中延伸寡核苷酸共价结合到芯片底物上的固态Xpandomer合成描述于申请人的临时专利申请号62/826,805中,所述专利申请通过引用全文并入本文)。50μL延伸反应包括以下试剂:50mM TrisCl、pH 8.84、200mMNH4OAc、50mM GuCl 20%PEG8K、10%NMP、15nmol聚磷酸盐PP-60.23、2.5μg Kod SSB、0.1M尿素、15mM PEM添加剂和13μg纯化的重组DNA聚合酶(DPO4聚合酶的变体)。延伸反应在37℃进行60分钟。
接下来使用SBX方案对Xpandomer产物进行测序。简而言之,将受约束的Xpandomer产物在缓冲剂B.064(1%Tween-20/3%SDS/5mM HEPES,pH 8.0/100mM NaPO4/15%DMF)中洗涤并通过添加200μl缓冲剂C.001(7.5M DCl)并在23℃孵育30分钟进行切割以产生线性化的Xpandomer。然后通过添加2000μl缓冲剂B.064并在室温孵育2’来中和样品。然后通过在缓冲剂B.065中添加500μmol琥珀酸酐并在23℃孵育5分钟,对Xpandomer样品进行胺修饰。然后在缓冲剂D.102(50%ACN)中洗涤样品,并且将Xpandomer通过光切割从底物释放并在60μl洗脱缓冲剂中洗脱。
通过将α-溶血素插入2M NH4Cl和100mM HEPES,pH 7.4的缓冲剂中的DPhPE/十六烷双层成员中来制备蛋白质纳米孔。对顺式孔灌注含有0.4M NH4Cl、600mM GuanCl、100mMHEPES;pH 7.4和5%甘油的缓冲剂AG242,且对反式孔灌注含有0.4M NH4Cl、600mM GuanCl、5%乙酸乙酯、10mM HEPES;pH值7.4的缓冲剂AB080。将Xpandomer样品加热至70℃2分钟,完全冷却并涡旋,然后将2μL等分试样加入顺式孔中。电压参数运行如下:70mV/625mV/6μs/1.0ms(读段电压/脉冲电压/脉冲电压持续时间/脉冲频率)。数据经由Labview采集软件获得。
为了评估Xpandomer序列信息的准确性,通过显示来自SBX反应的序列读段群的直方图显示来分析序列数据。分析软件将每个序列读段与模板序列对准,并修整与正确模板序列不对准的读段末端的序列范围。222mer模板的SBX测序的代表性直方图呈现在图19中。可以看出,SBX实验产生了222mer模板的高度准确读段。值得注意的是,该实验的通量非常出色。这些结果表明,掺入基于悬垂PEG的TCE和D细胞特征的SSRT可以高度准确和有效地控制Xpandomer通过纳米孔的易位。
实例22
棘轮
在此棘轮的实例中,单个溶血素纳米孔在脂质双层中制备,在反面有前庭,并在顺式储器中具有由0.4M NH4C1、600mM GuanCl、100mM HEPES;pH 7.4构成的试剂混合体;且在反式储器顺式中具有由2M NH4C1、100mM HEPES;pH 7.4构成的试剂混合体。通过Axopatch200B放大器测量位于每个储器中的Ag/AgCl电极之间通过的电流,并以100k样品/秒的速度进行数字化。为了驱动电流通过纳米孔,向反式储器施加占空比在+70mV和-50mV之间交替变化的50%方波,同时在从正电压向负电压(所有电压均以顺式储器电势为基准)转变之间施加+600mV的6μs脉冲。采用这种施加的脉冲序列,假设理想的易位没有缺失或插入,测量了掺入Xpandomer中的每种XNTP的两个报告子,一个用+70mV,而另一个用-50mV。对每个碱基进行两次测量提供冗余,从而为匹配结果提供更高的置信度,并且还有助于识别非均聚物序列中的缺失和插入。图20A说明+70mV/600mV脉冲/-50mV的循环如何影响Xpandomer通过纳米孔易位并导致C代码的两次测量,然后是A代码的两次测量(以及G代码的第1(一)次测量)。模式代码显示了在这个非均聚物序列中,每个碱基的2个报告子测量值可如何用于识别插入和缺失。当Xpandomer不前进到下一个报告子(在纳米孔中)或它跳过下一个报告子时,会导致插入和缺失。
使用SBX合成和纯化方案,将从已知序列的合成DNA模板产生的Xpandomer样品引入顺式储器并进行测量。使Xpandomer易位的电流测量的实例示于图20B中。所述图按比例缩放,因此+70mV测量值(14、20、27和35pA)的四个报告子电流电平和-50mV测量值(-12、-20、-25和-29pA)的4(四)个报告子电流电平如水平虚线所示。将数据与预期的DNA模板序列比对,并由图表上的数字序列表示。四个数字中的每一个都表示一个基数。蓝色序列号表示与模板的确认碱基匹配。箭头表示错误。用数字1表示的箭头是非均聚物插入,因为碱基调用表明Xpandomer没有前进,因此可以识别这些插入。标有数字2的箭头表示未识别的均聚物插入,因为碱基调用均处于同一水平。
实例24
氟阿拉伯糖基XNTP差向异构体的合成
本实例描述了每种XNTP的2′氟(F)差向异构体(2′FANA XNTP)的合成。这些差向异构体基于氟化核苷,称为“氟代阿拉伯糖核酸”(FANA)。预计2′F差向异构体将在酸处理过程中表现出增加的稳定性,这是产生线性化的Xpandomer产物的合成途径中的关键步骤。以下是产生每种2′FANA XNTP的合成方案。
A.
2′FANA XTTP的制作方法
Figure BDA0003366876350001321
在第一步中,将氟尿嘧啶(化合物1,可从TCI America获得)经由菌头反应与1-8辛二炔偶联(参见,例如Bag,S.,Jana,S.和Kasula,M.(2018)。Sonogashira Cross-Coupling:Alkyne-Modified Nucleosides and TheirApplications.In Palladium-CatalyzedModification of Nucleosides,Nucleosides,and Oligonucleotides(pp.75-146).Elsevier)。在第二步中,用约一当量的DMTrCL在吡啶中处理化合物2以产生化合物3。在第三步中,按照授予Kokoris等人、标题为“Phosphoramidate esters and use andsynthesis thereof”的美国专利号10,301,345将化合物3转化为三磷酸酰胺,所述美国专利通过引用全文并入本文。
B.
2′FANA XCTP的制作方法
Figure BDA0003366876350001331
在第一步中,将fialcitabine(化合物5,可从TRC Canada获得)经由菌头反应(如上所述)与1-8辛二炔偶联,以产生化合物6。在第二步中,用约一当量的DMTrCL在吡啶中处理化合物6以产生化合物7。在第三步中,由乙酰基来保护化合物7的环外胺(参见,例如Fan,Y.,Gaffney,B.,和Jones,艮(2004).Transient Silylation of the Guanosine O6 andthe Amino Groups Faciltates N-Acylation.Organic Letters,6,15,2555-2557.),并且随后转化为酰胺三磷酸酯8,如授予Kokoris等人的美国专利号10,301,345中所述。
C.
2′FANA XGTP的制作方法
商购自Granlen
Figure BDA0003366876350001332
在第一步中,将7-脱氮-7-碘代鸟苷(可从Granlen获得的化合物9;CAS:444020-71-7)用1当量的1,3-二氯-1,1,3,3-四甲基二硅氧烷处理以提供化合物10(参见例如Markiewicz,W.T.和Wiewiorowski,M.(1978)A new type of silyl protecting groupsin nucleoside chemistry.Nuc.Acids Res.5,s185-ss190)。在第二步中,通过使用氟化剂DAST将化合物10转化为化合物11(参见,例如Pankiewicz,K.,Kreminski,J.,Ciszewski,L.,Ren,W.,和Watanabe,K.(1992).A synthesis of 9-(2-deoxy-2-fluoro-B-D-arabinofuranosyl)adenine and-hypoxanthine.An effect of C3’-endo to C2’-endoconformational shift on the reaction course of 2’-hydroxyl group withDAST.J.of Organic Chem.57,2,553-559.)在第三步中,如上所述用苯氧基乙酰基保护化合物11中的环外胺。在第四步中,所得化合物12通过上述菌头反应与1-8辛二炔偶联,得到化合物13。在第五步中,如上所述将硅氧烷基团脱保护将得到化合物14。在第六步中,用1当量DMTrCl在吡啶中处理化合物14产生化合物15。在第七步中,将化合物15转化为鸟苷酰胺三磷酸酯16,如授予Kokoris等人的美国专利号10,301,345所述。
同样的方案可用于合成以下三磷酸腺苷类似物:
Figure BDA0003366876350001341
来自起始化合物7-脱氮-7-碘代腺苷(可从Granlen获得,CAS:24386-93-4)。
本说明书中提及和/或申请数据表中列出的所有美国专利、美国专利申请公开、美国专利申请、国外专利、国外专利以及非专利公开,包括但不限于2019年5月23日提交的美国临时专利申请号62/852,262、2019年7月22日提交的美国临时专利申请号62/877,183和2019年8月12日提交的美国临时专利申请号62/885,746,均通过引用全文并入本文。为了描述和公开例如出版物中描述的材料和方法的目的,可以通过引用并入这些文件,其可以与当前描述的发明结合使用。提供以上和通篇讨论的出版物仅用于它们在本申请的申请日之前的公开。本文中的任何内容均不应被解释为承认发明人无权凭借在先发明早于任何引用出版物。

Claims (58)

1.一种具有以下结构的化合物:
Figure FDA0003366876340000011
其中
R为OH或H;
核碱基是腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶、尿嘧啶或核碱基类似物;
报告子构建体是具有第一末端和第二末端的聚合物,并且包含从所述第一末端到所述第二末端串联的第一报告子代码、带有易位控制元件的对称化学分支和第二报告子代码;
连接基A将α氨基磷酸酯的氧原子接合到所述报告子构建体的所述第一末端;
连接基B将所述核碱基接合到所述报告子构建体的所述第二末端;
并且其中
所述易位控制元件是包含两个或更多个选自以下的重复单元的聚合物:1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b)、1,3-O-双(磷酸二酯)-2-(4-Me-O-PEG3)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35b)、1,3-O-双(磷酸二酯)-2s-O-mPEG6-丙烷(化合物12c)、1,2-O-双(磷酸二酯)-3-O-mPEG2-丙烷(化合物16)、2,3-O-双(磷酸二酯)-1-(5-苯并呋喃)-丙烷(化合物20i)、1,2-O-双(磷酸二酯)-3-(4-甲基哌嗪-1-基)-丙烷(化合物20j)、2,3-O-双(磷酸二酯)-1-(N1-(2-Me-5-硝基吲哚)-丙烷(化合物20g)、1,8-O-双(磷酸二酯)-N,N-二乙基哌嗪(化合物26h)、1,2-O-双(磷酸二酯)-3-(4-(Me-O-PEG3-O-Bz)-1-(1,2,3-三唑))-丙烷(化合物31d)、1,3-O-双(磷酸二酯)-2s-O-(4-(Me-O-PEG2)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35a)、1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35c)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG7)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35d)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Me-乙酸酯)-1,2,3-三唑)-丙烷(化合物35e)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物37a)、1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-2,2,2-三-(Me-O-Ac))-1,2,3-三唑)-丙烷(化合物37b)、1,3-O-双(磷酸二酯-2S-O-(PEG4-O-Bz)-丙烷(化合物38b)、1,3-O-双(磷酸二酯-2,2-双(Me-O-mPEG2)-丙烷(化合物45b)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG2-O-Me)-1-(Et-O-Bz)-1,2,3-三唑)-丙烷(化合物47f)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG3-O-Me)-1-(Et-O-Bz)-1,2,3-三唑)-丙烷(化合物47g)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG3-O-Me)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物47i)或1,3-O-双(磷酸二酯-2,2-双(1-Me-4-(Me-O-PEG2-O-Bz)-1,2,3-三唑)-丙烷(化合物52)。
2.根据权利要求1所述的化合物,其中R为OH。
3.根据权利要求1所述的化合物,其中R为H。
4.根据权利要求1-3中任一项所述的化合物,其中核碱基为腺嘌呤。
5.根据权利要求1-3中任一项所述的化合物,其中核碱基为胞嘧啶。
6.根据权利要求1-3中任一项所述的化合物,其中核碱基为鸟嘌呤。
7.根据权利要求1-3中任一项所述的化合物,其中核碱基为胸腺嘧啶。
8.根据权利要求1-3中任一项所述的化合物,其中核碱基为尿嘧啶。
9.根据权利要求1-3中任一项所述的化合物,其中核碱基为核碱基类似物。
10.根据权利要求1-9中任一项所述的化合物,其中所述对称化学分支选自1,2,3-O-三-(磷酸二酯)-丙烷、1,3-双-(5-O-磷酸二酯-戊基酰胺基)-2-O-磷酸二酯-丙烷和1,4,7-O-三-(磷酸二酯)-庚烷。
11.根据权利要求1-9中任一项所述的化合物,其中所述对称化学分支是1,2,3-O-三-(磷酸二酯)-丙烷。
12.根据权利要求1-11中任一项所述的化合物,其中所述易位控制元件是包含两个或更多个选自表1A的重复单元的聚合物。
13.根据权利要求1-11中任一项所述的化合物,其中所述易位控制元件是包含两个或更多个选自以下的重复单元的聚合物:1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b)和1,3-O-双(磷酸二酯)-2-(4-Me-O-PEG3)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35b)。
14.根据权利要求1-11中任一项所述的化合物,其中所述易位控制元件是包含以下序列的聚合物:[(1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b))]n1[(1,3-O-双(磷酸二酯)-2-(4-Me-O-PEG3)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35b))]n2,其中n1为0至6且n2为6至10。
15.根据权利要求1-14中任一项所述的化合物,其中所述第一报告子代码和所述第二报告子代码是相同的。
16.根据权利要求1-14中任一项所述的化合物,其中所述第一报告子代码和所述第二报告子代码是包含两个或更多个选自以下的重复单元的聚合物:六乙二醇(D)、乙烷(L)、三乙二醇(X)、1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b)、1,3-O-双(磷酸二酯)-2-(4-Me-O-PEG3)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35b)、1,3-O-双(磷酸二酯-2,2-双(Me-O-mPEG2)-丙烷(化合物45b)、1,3-O-双(磷酸二酯-2S-O-(PEG4-O-Bz)-丙烷(化合物38b)、1,3-O-双(磷酸二酯)-2s-O-mPEG6-丙烷(化合物12c)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物37a)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Me-乙酸酯)-1,2,3-三唑)-丙烷(化合物35e)、1,3-O-双(磷酸二酯)-2s-O-(4-(Me-O-PEG2)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35a)、1,3-O-双(磷酸二酯)-2-(4-Et-1-(Et-O-mPEG1)-1,2,3-三唑)-丙烷(化合物31a)、2,3-O-双(磷酸二酯)-1-(1-二甲氧基喹唑啉二酮)-丙烷(化合物20c)、2,3-O-双(磷酸二酯)-1-(N9-(3,6-二甲氧基咔唑)-丙烷(化合物20e)、1,1'-O-双(磷酸二酯)-2,2'-(磺酰基双(苄-4-基))-二乙醇(化合物26d)、1,1'-O-双(磷酸二酯)-2,2'-联吡啶-4,4'-基)-二甲醇(化合物26a)、2,3-O-双(磷酸二酯)-1-(N1-(4,6-二甲氧基-3-Me-吲哚)-丙烷(化合物20b)、3-(1,2-O-双(磷酸二酯)-丙基)-8,8-二甲基六氢-3H-3a,6-甲桥苯并[c]异噻唑2,2-二氧化物(化合物20d)、2,3-O-双(磷酸二酯)-1-(N1-(6-氮杂胸腺嘧啶))-丙烷(化合物20f)、1,5-O-双(磷酸二酯)-六氢呋喃并[2,6]呋喃(化合物23)、1,1'-O-双(磷酸二酯)-八氢-2,6-二甲基-3,8:4,7-二甲桥-2,6-萘啶-4,8-二基)-二甲醇(化合物26e)、2,3-O-双(磷酸二酯)-1-(N1-(2-Me-5-硝基吲哚)-丙烷(化合物20h)、2,3-O-双(磷酸二酯)-1-(N1-(2-Me-5-硝基吲哚)-丙烷(化合物20g)、2,3-O-双(磷酸二酯)-1-(5-苯并呋喃)-丙烷(化合物20i)、1,2-O-双(磷酸二酯)-3-O-mPEG2-丙烷(化合物5b)、1,3-O-双(磷酸二酯)-2-(4-Et-1-(Et-O-mPEG3)-1,2,3-三唑)-丙烷(化合物31b)和1,3-O-双(磷酸二酯)-3-O-mPEG4-丙烷(化合物5a)。
17.根据权利要求1-14中任一项所述的化合物,其中所述第一报告子代码和所述第二报告子代码是包含两个或更多个选自六乙二醇、乙烷、三乙二醇和表1A中所列任何化合物的重复单元的聚合物。
18.根据权利要求1-14中任一项所述的报告子代码,其中所述第一报告子代码和所述第二报告子代码是包含两个或更多个选自六乙二醇、乙烷、三乙二醇和1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b)的重复单元的聚合物。
19.根据权利要求1-14中任一项所述的化合物,其中所述第一报告子代码和所述第二报告子代码是包含选自以下的序列的聚合物:(i)[(六乙二醇)2(乙烷)3(六乙二醇)(三乙二醇)],(ii)[(六乙二醇)2(1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b))2(乙烷)(三乙二醇)3],(iii)[(六乙二醇)2(1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b))3(乙烷)2(六乙二醇)(三乙二醇)]和(iv)[(三乙二醇)2(乙烷)(1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b))6(乙烷)7]。
20.根据权利要求1-19中任一项所述的化合物,其中连接基A和连接基B是包含两个或更多个选自以下的重复单元的聚合物:精胺(Q)、六乙二醇(D)、2-((4-((3-(苯甲酰氧基)-2-(((1-(3-(苯甲酰氧基)-2-((苯甲酰氧基)甲基)-2-((磷酸二酯-氧基)甲基)丙基)-1H-1,2,3-三唑-4-基)甲氧基)甲基)-2-((苯甲酰氧基)甲基)丙氧基)甲基)-1H-1,2,3-三唑-1-基)甲基)-2-O-磷酸二酯-丙烷-1,3-二基二苯甲酸酯(化合物62)、1,3-O-双(磷酸二酯-2,2-双(1-Me-4-(Me-O-PEG2-O-Bz)-1,2,3-三唑)-丙烷(化合物52)、1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35c)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG7)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35d)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物37a)、1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-2,2,2-三-(Me-O-Ac))-1,2,3-三唑)-丙烷(化合物37b)、1,2-O-双(磷酸二酯)-3-(4-(Me-O-PEG3-O-Bz)-1-(1,2,3-三唑))-丙烷(化合物31d)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG2-O-Me)-1-(Et-O-Bz)-1,2,3-三唑)-丙烷(化合物47f)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG3-O-Me)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物47i)、1,2-O-双(磷酸二酯)-3-(4-甲基哌嗪-1-基)-丙烷(化合物20j)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG3-O-Me)-1-(Et-O-Bz)-1,2,3-三唑)-丙烷(化合物47g)和1,1'-O-双(磷酸二酯)-N(对甲苯基)-二乙醇胺(化合物26b)。
21.根据权利要求1-19中任一项所述的化合物,其中连接基A和连接基B是包含两个或更多个选自精胺和表1A中所列任何化合物的重复单元的聚合物。
22.根据权利要求1-19中任一项所述的化合物,其中连接基A和连接基B包含含有两个精胺重复单元的聚合酶增强区。
23.根据权利要求1-22中任一项所述的化合物,其中连接基A和连接基B包含含有两个或更多个选自以下的重复单元的易位减速区:1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35c)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG7)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35d)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物37a)和1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-2,2,2-三-(Me-O-Ac))-1,2,3-三唑)-丙烷(化合物37b)。
24.根据权利要求1-22中任一项所述的化合物,其中连接基A和连接基B包含含有选自以下的聚合物的易位减速区:(i)[((六乙二醇)(1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35c))3(六乙二醇)2]、(ii)[((六乙二醇)(1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35c))4(六乙二醇)2]、(iii)[((六乙二醇)(1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG7)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35d))4(六乙二醇)2]和(iv)[((六乙二醇)(1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-2,2,2-三-(Me-O-Ac))-1,2,3-三唑)-丙烷(化合物37b))4(六乙二醇)2]。
25.根据权利要求1-24中任一项所述的化合物,其中连接基A通过包含三唑的键合接合至所述α氨基磷酸酯的所述氧原子。
26.根据权利要求1-24中任一项所述的化合物,其中连接基B通过包含三唑的键合接合至所述核碱基。
27.一种报告子构建体,其包含具有第一末端和第二末端的聚合物,并且包含从所述第一末端到所述第二末端串联的第一报告子代码、带有易位控制元件的对称化学分支和第二报告子代码;并且其中所述易位控制元件是包含两个或更多个选自以下的重复单元的聚合物:1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b)、1,3-O-双(磷酸二酯)-2-(4-Me-O-PEG3)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35b)、1,3-O-双(磷酸二酯)-2s-O-mPEG6-丙烷(化合物12c)、1,2-O-双(磷酸二酯)-3-O-mPEG2-丙烷(化合物16)、2,3-O-双(磷酸二酯)-1-(5-苯并呋喃)-丙烷(化合物20i)、1,2-O-双(磷酸二酯)-3-(4-甲基哌嗪-1-基)-丙烷(化合物20j)、2,3-O-双(磷酸二酯)-1-(N1-(2-Me-5-硝基吲哚)-丙烷(化合物20g)、1,8-O-双(磷酸二酯)-N,N-二乙基哌嗪(化合物26h)、1,2-O-双(磷酸二酯)-3-(4-(Me-O-PEG3-O-Bz)-1-(1,2,3-三唑))-丙烷(化合物31d)、1,3-O-双(磷酸二酯)-2s-O-(4-(Me-O-PEG2)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35a)、1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35c)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG7)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35d)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Me-乙酸酯)-1,2,3-三唑)-丙烷(化合物35e)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物37a)、1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-2,2,2-三-(Me-O-Ac))-1,2,3-三唑)-丙烷(化合物37b)、1,3-O-双(磷酸二酯-2S-O-(PEG4-O-Bz)-丙烷(化合物38b)、1,3-O-双(磷酸二酯-2,2-双(Me-O-mPEG2)-丙烷(化合物45b)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG2-O-Me)-1-(Et-O-Bz)-1,2,3-三唑)-丙烷(化合物47f)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG3-O-Me)-1-(Et-O-Bz)-1,2,3-三唑)-丙烷(化合物47Gg)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG3-O-Me)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物47i)或1,3-O-双(磷酸二酯-2,2-双(1-Me-4-(Me-O-PEG2-O-Bz)-1,2,3-三唑)-丙烷(化合物52)。
28.根据权利要求27所述的报告子构建体,其中所述对称化学分支选自1,2,3-O-三-(磷酸二酯)-丙烷、1,3-双-(5-O-磷酸二酯-戊基酰胺基)-2-O-磷酸二酯-丙烷和1,4,7-O-三-(磷酸二酯)-庚烷。
29.根据权利要求27所述的报告子构建体,其中所述对称化学分支是1,2,3-O-三-(磷酸二酯)-丙烷。
30.根据权利要求27-29中任一项所述的报告子构建体,其中所述易位控制元件是包含两个或更多个选自表1A的重复单元的聚合物。
31.根据权利要求27-29中任一项所述的报告子构建体,其中所述易位控制元件是包含两个或更多个选自以下的重复单元的聚合物:1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b)和1,3-O-双(磷酸二酯)-2-(4-Me-O-PEG3)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35b)。
32.根据权利要求27-29中任一项所述的报告子构建体,其中所述易位控制元件是包含以下序列的聚合物:[(1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b))]n1[(1,3-O-双(磷酸二酯)-2-(4-Me-O-PEG3)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35b))]n2,其中n1为0至6且n2为6至10。
33.根据权利要求27-32中任一项所述的报告子构建体,其中所述第一报告子代码和所述第二报告子代码是相同的。
34.根据权利要求27-32中任一项所述的报告子构建体,其中所述第一报告子代码和所述第二报告子代码是包含两个或更多个选自以下的重复单元的聚合物:六乙二醇(D)、乙烷(L)、三乙二醇(X)、1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b)、1,3-O-双(磷酸二酯)-2-(4-Me-O-PEG3)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35b)、1,3-O-双(磷酸二酯-2,2-双(Me-O-mPEG2)-丙烷(化合物45b)、1,3-O-双(磷酸二酯-2S-O-(PEG4-O-Bz)-丙烷(化合物38b)、1,3-O-双(磷酸二酯)-2s-O-mPEG6-丙烷(化合物12c)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物37a)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Me-乙酸酯)-1,2,3-三唑)-丙烷(化合物35e)、1,3-O-双(磷酸二酯)-2s-O-(4-(Me-O-PEG2)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35a)、1,3-O-双(磷酸二酯)-2-(4-Et-1-(Et-O-mPEG1)-1,2,3-三唑)-丙烷(化合物31a)、2,3-O-双(磷酸二酯)-1-(1-二甲氧基喹唑啉二酮)-丙烷(化合物20c)、2,3-O-双(磷酸二酯)-1-(N9-(3,6-二甲氧基咔唑)-丙烷(化合物20e)、1,1'-O-双(磷酸二酯)-2,2'-(磺酰基双(苄-4-基))-二乙醇(化合物26d)、1,1'-O-双(磷酸二酯)-2,2'-联吡啶-4,4'-基)-二甲醇(化合物26a)、2,3-O-双(磷酸二酯)-1-(N1-(4,6-二甲氧基-3-Me-吲哚)-丙烷(化合物20b)、3-(1,2-O-双(磷酸二酯)-丙基)-8,8-二甲基六氢-3H-3a,6-甲桥苯并[c]异噻唑2,2-二氧化物(化合物20d)、2,3-O-双(磷酸二酯)-1-(N1-(6-氮杂胸腺嘧啶))-丙烷(化合物20f)、1,5-O-双(磷酸二酯)-六氢呋喃并[2,6]呋喃(化合物23)、1,1'-O-双(磷酸二酯)-八氢-2,6-二甲基-3,8:4,7-二甲桥-2,6-萘啶-4,8-二基)-二甲醇(化合物26e)、2,3-O-双(磷酸二酯)-1-(N1-(2-Me-5-硝基吲哚)-丙烷(化合物20h)、2,3-O-双(磷酸二酯)-1-(N1-(2-Me-5-硝基吲哚)-丙烷(化合物20g)、2,3-O-双(磷酸二酯)-1-(5-苯并呋喃)-丙烷(化合物20i)、1,2-O-双(磷酸二酯)-3-O-mPEG2-丙烷(化合物5b)、1,3-O-双(磷酸二酯)-2-(4-Et-1-(Et-O-mPEG3)-1,2,3-三唑)-丙烷(化合物31b)和1,3-O-双(磷酸二酯)-3-O-mPEG4-丙烷(化合物5a)。
35.根据权利要求27-32中任一项所述的报告子构建体,其中所述第一报告子代码和所述第二报告子代码是包含两个或更多个选自六乙二醇、乙烷、三乙二醇和表1A中所列任何化合物的重复单元的聚合物。
36.根据权利要求27-32中任一项所述的报告子构建体,其中所述第一报告子代码和所述第二报告子代码是包含两个或更多个选自六乙二醇、乙烷、三乙二醇和1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b)的重复单元的聚合物。
37.根据权利要求27-32中任一项所述的报告子构建体,其中所述第一报告子代码和所述第二报告子代码是包含选自以下的序列的聚合物:(i)[(六乙二醇)2(乙烷)3(六乙二醇)(三乙二醇)],(ii)[(六乙二醇)2(1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b))2(乙烷)(三乙二醇)3],(iii)[(六乙二醇)2(1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b))3(乙烷)2(六乙二醇)(三乙二醇)]和(iv)[(三乙二醇)2(乙烷)(1,3-O-双(磷酸二酯)-2S-O-mPEG4-丙烷(化合物12b))6(乙烷)7]。
38.一种对称合成的报告子系链(SSRT),其中所述对称合成的报告子系链是具有第一末端和第二末端的聚合物,并且包含从所述第一末端到所述第二末端串联的第一连接基、根据权利要求27-37中任一项所述的报告子构建体和第二连接基,其中所述第一连接基和所述第二连接基是相同的并且是包含两个或更多个选自以下的重复单元的聚合物:精胺(Q)、六乙二醇(D)、2-((4-((3-(苯甲酰氧基)-2-(((1-(3-(苯甲酰氧基)-2-((苯甲酰氧基)甲基)-2-((磷酸二酯-氧基)甲基)丙基)-1H-1,2,3-三唑-4-基)甲氧基)甲基)-2-((苯甲酰氧基)甲基)丙氧基)甲基)-1H-1,2,3-三唑-1-基)甲基)-2-O-磷酸二酯-丙烷-1,3-二基二苯甲酸酯(化合物62)、1,3-O-双(磷酸二酯-2,2-双(1-Me-4-(Me-O-PEG2-O-Bz)-1,2,3-三唑)-丙烷(化合物52)、1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35c)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG7)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35d)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物37a)、1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-2,2,2-三-(Me-O-Ac))-1,2,3-三唑)-丙烷(化合物37b)、1,2-O-双(磷酸二酯)-3-(4-(Me-O-PEG3-O-Bz)-1-(1,2,3-三唑))-丙烷(化合物31d)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG2-O-Me)-1-(Et-O-Bz)-1,2,3-三唑)-丙烷(化合物47f)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG3-O-Me)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物47i)、1,2-O-双(磷酸二酯)-3-(4-甲基哌嗪-1-基)-丙烷(化合物20j)、1,3-O-双(磷酸二酯-2,2-双(4-(Me-O-PEG3-O-Me)-1-(Et-O-Bz)-1,2,3-三唑)-丙烷(化合物47g)和1,1'-O-双(磷酸二酯)-N(对甲苯基)-二乙醇胺(化合物26b)。
39.根据权利要求38所述的对称合成的报告子系链(SSRT),其中所述第一连接基和所述第二连接基包含含有两个精胺重复单元的聚合酶增强区。
40.根据权利要求38或39所述的对称合成的报告子系链(SSRT),其包含含有两个或更多个选自以下的重复单元的易位减速区:1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35c)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG7)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35d)、1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG3)-1-(Et-2,2,2-三-(Me-O-Bz))-1,2,3-三唑)-丙烷(化合物37a)和1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-2,2,2-三-(Me-O-Ac))-1,2,3-三唑)-丙烷(化合物37b)。
41.根据权利要求38或39所述的对称合成的报告子系链(SSRT),其包含含有选自以下的聚合物的易位减速区:(i)[((六乙二醇)(1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35c))3(六乙二醇)2]、(ii)[((六乙二醇)(1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-O-Ac)-1,2,3-三唑)-丙烷(化合物35c))4(六乙二醇)2]、(iii)[((六乙二醇)(1,3-O-双(磷酸二酯-2s-O-(4-(Me-O-PEG7)-1-(Et-OBz)-1,2,3-三唑)-丙烷(化合物35d))4(六乙二醇)2]和(iv)[((六乙二醇)(1,3-O-双(磷酸二酯-2-(4-(Me-O-PEG5)-1-(Et-2,2,2-三-(Me-O-Ac))-1,2,3-三唑)-丙烷(化合物37b))4(六乙二醇)2]。
42.根据权利要求38-41中任一项所述的对称合成的报告子系链(SSRT),其中所述第一末端和所述第二末端包含连接部分。
43.根据权利要求42所述的对称合成的报告子系链(SSRT),其中所述连接部分包含叠氮基(-N3)基团。
44.一种用于对靶核酸进行测序的方法,其包括:a)提供通过模板定向合成产生的子链,所述子链包含多个根据权利要求1所述的XNTP亚基,所述多个XNTP亚基偶联在对应于所述靶核酸的全部或一部分的连续核苷酸序列的序列中,其中所述子链的各个XNTP亚基包含报告子构建体、核碱基残基和可选择性切割的键,并且其中所述报告子构建体在所述可选择性切割的键的切割时允许延长所述子链的所述亚基;b)切割所述可选择性切割的键以产生长度长于所述子链的多个所述亚基的Xpandomer,所述Xpandomer包含用于解析对应于所述靶核酸的全部或一部分的所述连续核苷酸序列的序列中的遗传信息的所述报告子构建体;和c)检测所述Xpandomer的所述报告子构建体。
45.根据权利要求44所述的方法,其中用于解析所述遗传信息的所述报告子构建体包括报告子代码和易位控制元件,其中所述易位控制元件借由空间位阻提供易位控制,并在所述Xpandomer穿过经受基线电压的纳米孔时暂停易位,其中所述易位控制元件在所述纳米孔的孔口内接合所述报告子代码,其中所述报告子代码由所述纳米孔感测。
46.根据权利要求44所述的方法,其中所述Xpandomer借由脉冲电压的施加恢复通过所述纳米孔的易位,其中所述脉冲电压足以允许所述易位控制元件的易位,同时使所述Xpandomer的下一个报告子构建体自由地与所述纳米孔接合。
47.根据权利要求45所述的方法,其中与所述纳米孔接合的所述报告子构建体的所述易位控制元件借由空间位阻,在所述脉冲电压的每个脉冲时易位。
48.根据权利要求45所述的方法,其中在所述脉冲电压的脉冲之间的时间段期间,由所述纳米孔感测目标构建体。
49.根据权利要求44所述的方法,其中所述基线电压为约55mV至约75mV。
50.根据权利要求45所述的方法,其中所述脉冲电压为约550mV至约700mV。
51.根据权利要求45所述的方法,其中所述脉冲电压具有约5μs至约10μs的持续时间。
52.根据权利要求45所述的方法,其中所述脉冲电压的周期为约0.5ms至1.5ms。
53.根据权利要求44所述的方法,其中所述纳米孔经受交流电流(AC)。
54.根据权利要求44-53中任一项所述的方法,其中所述多个XNTP亚基中的一者或多者包含2'氟阿拉伯糖基差向异构体。
55.一种用于控制聚合物通过纳米孔的易位速率的缓冲剂,其包含至少一种选自由以下项组成的组的盐:NH4Cl、MgCl2、LiCl、KCl、CsCl、NaCl和CaCl2。
56.根据权利要求55所述的缓冲剂,其进一步包含至少一种选自由3-甲基-2-噁唑烷酮(MOA)、DMF、ACN、DMSO和NMP组成的组的溶剂,其中所述溶剂以约1%vol/vol至约35%vol/vol的范围存在。
57.根据权利要求55所述的缓冲剂,其进一步包含至少一种选自由己酸钠(NaHex)、EDTA、氧化还原试剂、PEG、甘油、聚蔗糖等组成的组的添加剂。
58.一种用于控制聚合物通过纳米孔检测器的易位速率的缓冲剂系统,其包括顺式缓冲剂和反式缓冲剂,其中所述顺式缓冲剂包含第一盐浓度,并且所述反式缓冲剂包含第二盐浓度,其中所述第一盐浓度低于所述第二盐浓度。
CN202080037908.3A 2019-05-23 2020-05-14 用于纳米孔测序的易位控制元件、报告子代码和用于易位控制的其他手段 Pending CN114096540A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201962852262P 2019-05-23 2019-05-23
US62/852262 2019-05-23
US201962877183P 2019-07-22 2019-07-22
US62/877183 2019-07-22
US201962885746P 2019-08-12 2019-08-12
US62/885746 2019-08-12
PCT/US2020/032950 WO2020236526A1 (en) 2019-05-23 2020-05-14 Translocation control elements, reporter codes, and further means for translocation control for use in nanopore sequencing

Publications (1)

Publication Number Publication Date
CN114096540A true CN114096540A (zh) 2022-02-25

Family

ID=73458608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080037908.3A Pending CN114096540A (zh) 2019-05-23 2020-05-14 用于纳米孔测序的易位控制元件、报告子代码和用于易位控制的其他手段

Country Status (7)

Country Link
US (1) US20220411458A1 (zh)
EP (1) EP3972976A4 (zh)
JP (1) JP7454760B2 (zh)
CN (1) CN114096540A (zh)
AU (1) AU2020279629B2 (zh)
CA (1) CA3140425A1 (zh)
WO (1) WO2020236526A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023059599A1 (en) 2021-10-04 2023-04-13 F. Hoffmann-La Roche Ag Online base call compression
WO2023186842A1 (en) 2022-03-28 2023-10-05 F. Hoffmann-La Roche Ag Synthesis of isomerically pure polyol-based phosphoramidites
WO2023213766A1 (en) 2022-05-02 2023-11-09 F. Hoffmann-La Roche Ag Compositions and methods that reduce prussian blue formation during nanopore sequencing
WO2024074412A1 (en) 2022-10-03 2024-04-11 F. Hoffmann-La Roche Ag Single molecule multi-molecular trace methods and systems
WO2024083982A1 (en) 2022-10-21 2024-04-25 F. Hoffmann-La Roche Ag Detection of modified nucleobases in nucleic acid samples

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100297644A1 (en) * 2007-10-23 2010-11-25 Stratos Genomics Inc. High throughput nucleic acid sequencing by spacing
CN102083998A (zh) * 2007-06-19 2011-06-01 斯特拉托斯基因公司 通过展开进行高通量核酸测序
US20120088235A1 (en) * 2009-01-29 2012-04-12 Stratos Genomics, Inc. High throughput nucleic acid sequencing by expansion and related methods
US20130186757A1 (en) * 2008-10-06 2013-07-25 Arizona Board Of Regents Nanopore and Carbon Nanotube Based Dna Sequencer and A Serial Recognition Elements
US20150368710A1 (en) * 2014-03-24 2015-12-24 The Trustees Of Columbia University In The City Of New York Chemical methods for producing tagged nucleotides
US20160145292A1 (en) * 2014-11-20 2016-05-26 Stratos Genomics, Inc. Phosphoroamidate esters, and use and synthesis thereof
WO2017014762A1 (en) * 2015-07-21 2017-01-26 Omniome, Inc. Nucleic acid sequencing methods and systems
US20170073740A1 (en) * 2014-05-14 2017-03-16 Stratos Genomics, Inc. Translocation control for sensing by a nanopore

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000034527A2 (en) 1998-12-11 2000-06-15 The Regents Of The University Of California Targeted molecular bar codes
GB201406151D0 (en) 2014-04-04 2014-05-21 Oxford Nanopore Tech Ltd Method
ES2846949T3 (es) 2015-11-16 2021-07-30 Stratos Genomics Inc Variantes de la polimerasa DPO4
CA3061651A1 (en) 2017-05-04 2018-11-08 Stratos Genomics, Inc. Dp04 polymerase variants
CA3084812A1 (en) 2017-12-11 2019-06-20 Stratos Genomics, Inc. Dpo4 polymerase variants with improved accuracy
CN111771001A (zh) 2018-01-05 2020-10-13 斯特拉托斯基因公司 通过芳香族化合物增强核酸聚合
CN113631764A (zh) * 2019-02-21 2021-11-09 斯特拉托斯基因公司 用于固态合成在单分子测序中使用的可扩展聚合物的方法、组合物和装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102083998A (zh) * 2007-06-19 2011-06-01 斯特拉托斯基因公司 通过展开进行高通量核酸测序
US20100297644A1 (en) * 2007-10-23 2010-11-25 Stratos Genomics Inc. High throughput nucleic acid sequencing by spacing
US20130186757A1 (en) * 2008-10-06 2013-07-25 Arizona Board Of Regents Nanopore and Carbon Nanotube Based Dna Sequencer and A Serial Recognition Elements
US20120088235A1 (en) * 2009-01-29 2012-04-12 Stratos Genomics, Inc. High throughput nucleic acid sequencing by expansion and related methods
US20150368710A1 (en) * 2014-03-24 2015-12-24 The Trustees Of Columbia University In The City Of New York Chemical methods for producing tagged nucleotides
CN106715453A (zh) * 2014-03-24 2017-05-24 哥伦比亚大学董事会 用于生产带标签的核苷酸的化学方法
US20170073740A1 (en) * 2014-05-14 2017-03-16 Stratos Genomics, Inc. Translocation control for sensing by a nanopore
US20160145292A1 (en) * 2014-11-20 2016-05-26 Stratos Genomics, Inc. Phosphoroamidate esters, and use and synthesis thereof
WO2017014762A1 (en) * 2015-07-21 2017-01-26 Omniome, Inc. Nucleic acid sequencing methods and systems

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YUE WANG ET AL.: "The evolution of nanopore sequencing", 《FRONTIERS IN GENETICS》, vol. 5, 7 January 2015 (2015-01-07), pages 1 - 20 *
汪荣亮 等: "纳米孔传感技术应用于核酸检测的研究进展", 《中国材料进展》, vol. 37, no. 1, 31 January 2018 (2018-01-31), pages 59 - 67 *

Also Published As

Publication number Publication date
EP3972976A4 (en) 2023-07-19
US20220411458A1 (en) 2022-12-29
WO2020236526A1 (en) 2020-11-26
JP7454760B2 (ja) 2024-03-25
CA3140425A1 (en) 2020-11-26
EP3972976A1 (en) 2022-03-30
AU2020279629A1 (en) 2021-11-11
AU2020279629B2 (en) 2023-01-19
JP2022535692A (ja) 2022-08-10

Similar Documents

Publication Publication Date Title
CN114096540A (zh) 用于纳米孔测序的易位控制元件、报告子代码和用于易位控制的其他手段
US6794499B2 (en) Oligonucleotide analogues
US7572582B2 (en) Oligonucleotide analogues
US5596086A (en) Modified internucleoside linkages having one nitrogen and two carbon atoms
EP1015469B2 (en) Bi- and tri-cyclic nucleoside, nucleotide and oligonucleoide analogues
KR101107315B1 (ko) 3′―하이드록실기에 형광을 띄는 장애그룹이 부착된 뉴클레오시드 삼인산을 가역적 종결자로서 이용한 dna 염기서열 분석 방법
RU2688435C2 (ru) Набор для получения реакционной смеси для синтеза 3′-o-пропаргил-модифицированной нуклеиновой кислоты
JP2022516244A (ja) 3’保護ヌクレオチド
JP2017008071A (ja) キャプチャータグを用いた、三リン酸化オリゴヌクレオチドの精製
JP6673211B2 (ja) モルフォリノオリゴヌクレオチドの製造方法
JP2005015395A (ja) 新規ピリミドピリミジンヌクレオシドとその構造類縁体
JP2019521096A (ja) 核酸シーケンシングにとって有用なタグ付きマルチヌクレオチド
US11214590B2 (en) Photoresponsive nucleotide analog capable of photocrosslinking in visible light region
ES2713653T3 (es) Análogos nucleotídicos para secuenciación
US8026348B2 (en) Nucleoside derivative, modified oligonucleotide, method for their synthesis and applications thereof
JP5973425B2 (ja) 同位体を有するリン酸化合物の製造方法
US7473683B2 (en) Nonpolar thymidine analogs
JP6429264B2 (ja) ボラノホスフェート化合物、及び核酸オリゴマー
JP5017639B2 (ja) ヌクレオシド誘導体
Yi et al. DNA bending facilitates the formation of Z-DNA investigated by single-molecule FRET
JP5176234B2 (ja) 標的核酸の検出方法
US20060154889A1 (en) Polyfluorinated nucleoside analogs and methods of use thereof
WO2005085270A1 (ja) ピリジン環5位にピロリル基を導入した核酸誘導体
McKenna et al. NIH-PA Author Manuscript

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Country or region after: U.S.A.

Address after: Washington State

Applicant after: Roche Diagnostics (Seattle) Co.

Address before: Washington State

Applicant before: STRATOS GENOMICS Inc.

Country or region before: U.S.A.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20240408

Address after: California, USA

Applicant after: Roche sequencing solutions Co.

Country or region after: U.S.A.

Address before: Washington State

Applicant before: Roche Diagnostics (Seattle) Co.

Country or region before: U.S.A.

TA01 Transfer of patent application right

Effective date of registration: 20240508

Address after: Basel, SUI

Applicant after: F. HOFFMANN-LA ROCHE AG

Country or region after: Switzerland

Address before: California, USA

Applicant before: Roche sequencing solutions Co.

Country or region before: U.S.A.