CN108350017A - 多肽标记的核苷酸及其在通过纳米孔检测的核酸测序中的用途 - Google Patents

多肽标记的核苷酸及其在通过纳米孔检测的核酸测序中的用途 Download PDF

Info

Publication number
CN108350017A
CN108350017A CN201680065780.5A CN201680065780A CN108350017A CN 108350017 A CN108350017 A CN 108350017A CN 201680065780 A CN201680065780 A CN 201680065780A CN 108350017 A CN108350017 A CN 108350017A
Authority
CN
China
Prior art keywords
amino acid
connector
group
polypeptide
nucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680065780.5A
Other languages
English (en)
Other versions
CN108350017B (zh
Inventor
F.贝格曼
C.赛德尔
A.特兰斯
D.格雷米亚青斯基
H.库切尔迈斯特
L.希尔林格豪斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of CN108350017A publication Critical patent/CN108350017A/zh
Application granted granted Critical
Publication of CN108350017B publication Critical patent/CN108350017B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/06Pyrimidine radicals
    • C07H19/10Pyrimidine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/16Purine radicals
    • C07H19/20Purine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/113Modifications characterised by incorporating modified backbone
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/197Modifications characterised by incorporating a spacer/coupling moiety
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/203Modifications characterised by incorporating a composite nucleic acid containing a polypeptide sequence other than PNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/204Modifications characterised by specific length of the oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/60Detection means characterised by use of a special device
    • C12Q2565/631Detection means characterised by use of a special device being a biochannel or pore

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Chemical Kinetics & Catalysis (AREA)

Abstract

本发明涉及基于多肽标记的核苷酸的组合物和方法,以及这样的多肽标记的核苷酸在纳米孔装置和方法中的应用。

Description

多肽标记的核苷酸及其在通过纳米孔检测的核酸测序中的 用途
技术领域
本申请涉及经标记的核苷酸组合物,其中所述标记包含多肽,制备公开的多肽标记的核苷酸组合物并用于对核酸测序的方法,和具体地,基于纳米孔的测序方法。
背景
核酸测序是用于确定核酸的核苷酸序列的方法。这样的序列信息可能有助于诊断和/或治疗个体。例如,个体的核酸序列可以用于鉴定、诊断遗传性疾病和潜在地开发遗传性疾病的治疗。作为另一个例子,对病原体的研究可以导致接触传染性疾病的治疗。由于一些疾病的特征在于在数百万个核苷酸的链中的少至一个核苷酸差异,所以非常准确的测序是必要的。
已经开发了使用纳米孔的单分子合成测序(SBS)技术。参见例如,美国专利公开号2013/0244340 A1、2013/0264207 A1、2014/0134616 A1。纳米孔SBS包括使用聚合酶来合成与靶序列模板互补的DNA链,和并行地随着每个核苷酸单体添加至生长中的链而确定其的身份,由此确定所述靶序列。通过在合成所述链时随时间监测穿过位于聚合酶活性部位附近的纳米孔的电流,检测每个添加的核苷酸单体。得到准确的信号要求将聚合酶活性部位适当定位在纳米孔附近和在每个添加的核苷酸上使用标记,所述标记可以进入纳米孔并提供穿过所述孔流动的电流的可鉴别的变化。为了提供准确的纳米孔测序,对于所述标记而言重要的是,进入纳米孔并在其中停留足够量的时间(即,“停留时间”),并当在所述纳米孔中停留时,提供穿过所述纳米孔的电流的充分地可检测的和可鉴别的阻断(即,“阻断电流”),使得与所述标记结合的特定核苷酸可以与其它经标记的核苷酸明确地区分开。
Kumar等人, (2012)“PEG-Labeled Nucleotides and Nanopore Detection forSingle Molecule DNA Sequencing by Synthesis,”Scientific Reports, 2:684; DOI:10.1038/srep00684, 描述了使用纳米孔来区分经由末端5’-氨基磷酸连接至dG核苷酸的四种不同长度PEG-香豆素标记,并分别证实了DNA聚合酶对这四种PEG-香豆素标记的dG核苷酸的有效和准确掺入。也参见,美国专利申请公开US 2013/0244340 A1(2013年9月19日公开)、US 2013/0264207 A1(2013年10月10日公开)和US 2014/0134616 A1(2014年5月14日公开)。
Stefureac等人(2006)描述了α-溶血素穿过膜运输肽,但是没有提出该运输现象用于测序的用途(参见例如,Stefureac等人,“Transport of alpha-helical Peptidesthrough alpha-Hemolysin and Aerolysin Pores,”Biochemistry 2006, 45, 9172;Stefureac等人,“Modulation of the translocation of peptides through nanoporesby the application of an AC electric field,”Chem. Comm. 2012, 48, 1028)。
WO 2013/154999一般地描述了经标记的核苷酸的应用,其中所述标记可以包括肽或氨基酸,并具体地提供了所述标记具有与所述化合物的其余部分的电荷在符号上相反的电荷。因而,与核苷酸连接的肽标记应当具有适当数目的赖氨酸或精氨酸以平衡磷酸的数目。
WO 2013/191793一般地公开了肽作为核苷酸标记的应用,但是没有提供具体肽序列或这样的肽标记的性质。
US 8,652,779 B2一般地描述了肽作为“电荷阻断标记”用于纳米孔测序的可能应用,并公开了三种带正电荷的7-聚体和11-聚体肽阻断标记,其具有6-7个赖氨酸残基。但是,US 8,652,779 B2没有证实,这些标记可以结合实际附着于纳米孔的聚合酶,也没有提供对于测序而言足够的必要纳米孔电流阻断水平和停留时间。
上述的先前公开内容没有教导这样的具体多肽标记结构:其可以提供足够长度的停留时间和足够狭窄且可辨别的阻断电流以用于纳米孔测序应用。因此,仍然需要可以用在纳米孔和其它测序技术中的多肽标记的核苷酸组合物和方法。
发明概述
本发明提供了多肽标记的核苷酸的组合物以及制备和使用这样的多肽标记的核苷酸的方法,包括它们在纳米孔测序中的应用。这些经标记的核苷酸化合物的多肽标记包含至少一个螺旋结构和总电荷。所述多肽标记的核苷酸非常适合用于在纳米孔检测系统中应用并为纳米孔检测提供惊人优点,包括、但不限于,具有更狭窄方差的更大阻断电流减小(相对于开放通道电流)、长停留时间和低背景电流(由于在纳米孔中更少的非特异性捕获事件)。另外,如本文中所述的,本发明的不同的多肽标记的核苷酸可以提供可辨别的纳米孔阻断电流和其它纳米孔检测特征。
在某些实施方案中,本发明提供了结构式(I)的化合物
N-P-L-T
(I)
其中,N是核苷;P是共价地连接至所述核苷的5’-O基团的寡磷酸,其中所述寡磷酸由3-12个磷酸基团组成;L是共价地连接至所述寡磷酸的末端磷酸基团的接头;且T是共价地连接至所述接头的多肽标记,其中所述多肽具有总电荷且包含至少一个螺旋结构。
在某些实施方案中,结构式(I)的化合物包含结构式(II):
其中,碱基选自腺苷、胞苷、鸟苷、胸苷和尿苷;R选自H和OH;n是1-4;接头是包含2-100个原子的共价键合链的接头;且多肽是包含总电荷和至少一个螺旋结构的多肽标记。
本发明进一步提供了被结构式(I)和(II)包括的各个亚结构的化合物,所述亚结构包含包括如本文别处公开的碱基、寡磷酸、接头和多肽标记的各个结构的范围。
例如,在某些实施方案中,结构式(I)或(II)的化合物可以包含多肽标记,其中所述多肽标记的长度是在至少16个氨基酸残基到至少90个氨基酸残基的范围内,且包括如本文中公开的各种中间长度范围。在某些实施方案中,所述多肽标记的螺旋结构可以包含至少8个氨基酸残基到至少60个氨基酸残基,且包括如本文中公开的各种中间范围。在某些实施方案中,所述螺旋结构是α-螺旋,且任选地,所述α-螺旋的长度是至少10个氨基酸残基、至少16个氨基酸残基、至少20个氨基酸残基、至少25个氨基酸残基、至少30个氨基酸残基或至少40个氨基酸残基。另外,在某些实施方案中,所述α-螺旋可以包含各种序列基序,包括包含至少3个氨基酸残基的序列基序的至少2个重复,和任选地所述序列基序的2个重复,其中所述基序包含至少4个氨基酸残基、至少5个氨基酸残基或至少6个氨基酸残基。在某些实施方案中,所述序列基序是同聚物,且任选地所述同聚物序列基序可以包含序列AAA。在某些实施方案中,所述序列基序的重复未被不形成螺旋的氨基酸残基中断。在某些实施方案中,所述序列基序选自由以下成员组成的基序组:EAAA、AEAA、AAEA、AAAE、DAAA、ADAA、AADA、AAAD、RAAA、ARAA、AARA、AAAR、KAAA、AKAA、AAKA和AAAK。
在某些与多肽标记的特征有关的实施方案中,所述多肽标记的总电荷是负的,任选地其中所述多肽标记的总电荷是在约-10和-30之间。在某些带负电荷的多肽标记的实施方案中,所述多肽标记的在接头远侧末端处的至少3个氨基酸残基是带负电荷的残基,且任选地所述多肽标记的在接头远侧末端处的至少5个氨基酸残基是带负电荷的残基。在某些实施方案中,所述带负电荷的残基选自谷氨酸、天冬氨酸、γ-羧基谷氨酸、高谷氨酸、半胱磺酸、磷酸-丝氨酸、磷酸-苏氨酸、磷酸-酪氨酸和它们的组合。在某些实施方案中,25%的位于所述多肽标记的接头远侧末端处的氨基酸残基具有这样的净电荷绝对值:其大于25%的位于所述多肽标记的接头近侧末端处的氨基酸残基的净电荷绝对值。
在某些实施方案中,所述多肽标记包含选自表4的多肽标记。
在某些实施方案中,结构式(I)或(II)的化合物可以包含含有不同接头结构的化合物的范围,包括、但不限于结构式(III)的化合物:
其中,“碱基”是天然存在的或非天然存在的核碱基;R选自H和OH;n是1-10;“多肽”是具有总电荷且包含至少一个螺旋结构的多肽;且“-LB-X-LA-”是接头,其中,LA和LB各自包含2-100个原子的共价键合链;且X是选自酯、醚、硫醚、胺、酰胺、酰亚胺、碳酸酯、氨基甲酸酯、方酸酯、噻唑、噻唑烷、腙、肟、三唑和二氢哒嗪的化学部分。在某些结构式(III)的化合物的实施方案中,LA和LB各自独立地包含选自结构式(XVIIIa) - (XVIIId)的接头结构。在某些实施方案中,LB包含氨基酸残基,且任选地,LB可以包含在所述多肽标记的N-端或C-端处的氨基酸残基。
本发明还提供了用于制备结构式(I)或(II)中的任一个或被结构式(I)和(II)包括的各个亚结构中的任一个的化合物的方法,所述亚结构包含包括如本文中公开的碱基、寡磷酸、接头和多肽标记的各个结构的范围。
本发明还提供了包含经标记的核苷酸的组的组合物,每种核苷酸具有不同的标记,其中当它位于纳米孔中时每种不同的标记造成不同的阻断电流,且所述组包含结构式(I)或(II)中的任一个或被结构式(I)和(II)包括的各个亚结构中的任一个的至少一种化合物,所述亚结构包含包括如本文中公开的碱基、寡磷酸、接头和多肽标记的各个结构的范围。
本发明还提供了一种用于确定核酸的序列的方法,所述方法利用结构式(I)或(II)中的任一个或被结构式(I)和(II)包括的各个亚结构中的任一个的至少一种化合物,所述亚结构包含包括如本文中公开的碱基、寡磷酸、接头和多肽标记的各个结构的范围。因而,在某些实施方案中,本发明提供了一种方法,其包含:(a)提供纳米孔测序组合物,其包含:膜,在所述膜的顺侧(cis side)和反侧(trans side)上的电极,其孔穿过所述膜延伸的纳米孔,与两个电极接触的电解质溶液,位于所述纳米孔附近的活性聚合酶,和与所述聚合酶形成复合物的引物链;(b)使所述纳米孔测序组合物与以下物质接触:(i)一条核酸链;和(ii)一组经标记的核苷酸,每种核苷酸具有不同的标记,其中当它位于所述纳米孔中时每种不同的标记造成不同的阻断电流和/或具有不同的停留时间,且所述组包含至少一种结构式(I)或(II)(包括被结构式(I)和(II)包括的各个亚结构中的任一个,所述亚结构包括如本文中公开的碱基、寡磷酸、接头和多肽标记的各个结构的范围)的化合物;和(c)随时间检测所述标记的不同的阻断电流和/或阻断电压和/或不同的停留时间,并与所述聚合酶掺入的不同的经标记的核苷酸(其与所述核酸序列互补)中的每一个关联,且由此确定所述核酸序列。
附图说明
图1描绘了可用于经由叠氮基-炔烃点击反应制备多肽标记的核苷-六磷酸的合成反应方案。
图2描绘了使用α-HL-Pol2聚合酶缀合物对多肽标记的核苷酸dT6P-接头-(EAAA)16-E5的“静电捕获”纳米孔检测数据,所述α-HL-Pol2聚合酶缀合物与JAM1A DNA模板形成复合物,且在100 mVDC电位下包埋在膜中。如在实施例2中所述,dT6P-接头-(EAAA)16-E5表现出20%O.C. (具有低方差)的强阻断电流和~975 ms的长平均停留时间。
图3描绘了两种不同的多肽标记的核苷酸dT6P-接头-(EAAA)16-E5和dT6P-(炔丙基)K(UE)25-生物素的“静电捕获”纳米孔检测数据。纳米孔检测是使用α-HL-Pol2聚合酶缀合物,其与JAM1A DNA模板形成复合物,并在250 mV (峰至峰)AC电位下包埋在膜中。如在实施例3中所述,dT6P-接头-(EAAA)16-E5 (其具有螺旋结构)和dT6P-(炔丙基)K(UE)25-生物素(其仅具有无规则卷曲结构)表现出50%O.C.和80-90%O.C.的可容易地辨别的阻断电流。
发明详述
对于在本文中的描述和所附权利要求,单数形式“一个”和“一种”包括复数指示物,除非上下文另外清楚地指出。因而,例如,对“一种蛋白”的提及包括超过一种蛋白,且对“一种化合物”的提及表示超过一种化合物。“包含”和“包括”的应用是可互换的,且无意成为限制性的。还应当理解,在各个实施方案的描述使用术语“包含”的情况下,本领域技术人员会理解,在某些具体情况下,可以可替换地使用语言“基本上由……组成”或“由……组成”描述一个实施方案。
在提供值的范围的情况下,除非上下文另外清楚地指明,否则应当理解,在该范围的上限与下限之间的所述值的每个居间整数和所述值的每个居间整数的每个十分之一(除非上下文另外清楚地指明)以及该所述范围内的任何其它所述值或居间值均被包含在本发明内。这些较小范围的上限和下限可以独立地被包含在所述较小范围内,并且也被包含在本发明内,受所述范围内任何具体排除的限值的约束。在所述范围包括一个或两个限值的情况下,排除那些被包括的限值中的(i)任一个或(ii)两个限值的范围也被包括在本发明中。例如“1-50”包括“2-25”、“5-20”、“25-50”、“1-10”等。
应当理解,前述一般描述(包括附图)和下述详细描述仅仅是示例性的和解释性的,且不是本发明的限制。
定义
在本文描述中使用的技术和科学术语将具有本领域普通技术人员通常理解的含义,除非另外明确定义。因此,下述术语意图具有下述含义。
本文中使用的“核酸”表示一个或多个核酸亚基的分子,所述核酸亚基包含核碱基腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)和尿嘧啶(U)之一或其变体。核酸可以表示核苷酸(例如,dAMP、dCMP、dGMP、dTMP)的聚合物,也被称作多核苷酸或寡核苷酸,且包括单链和双链形式的DNA、RNA,以及它们的杂合体。
本文中使用的“核苷酸”表示核苷-5’-寡磷酸化合物或核苷-5’-寡磷酸的结构类似物,其能够作为核酸聚合酶的底物或抑制剂起作用。示例性的核苷酸包括、但不限于:核苷-5’-三磷酸(例如,dATP、dCTP、dGTP、dTTP和dUTP);具有5’-寡磷酸链的核苷(例如,dA、dC、dG、dT和dU),其具有4个或更多个磷酸的长度(例如,5’-四磷酸磷酸、5’-五磷酸磷酸、5’-六磷酸磷酸、5’-七磷酸磷酸、5’-八磷酸磷酸);和核苷-5’-三磷酸的结构类似物,其可以具有经修饰的碱基部分(例如,被取代的嘌呤或嘧啶碱基)、经修饰的糖部分(例如,O-烷基化的糖)和/或经修饰的寡磷酸部分(例如,包含硫代磷酸、亚甲基和/或磷酸之间的其它桥的寡磷酸)。
本文中使用的“核苷酸类似物”表示在结构上类似于核苷酸且能够充当核酸聚合酶的底物或抑制剂的化学化合物。核苷酸类似物可以具有经修饰的或非天然存在的核碱基部分、经修饰的糖和/或经修饰的寡磷酸部分。
本文中使用的“核苷”表示包含与糖部分(例如,核糖或脱氧核糖)连接的天然存在的或非天然存在的核碱基的分子部分。
本文中使用的“脱氧核苷”表示包含具有单个羟基的糖部分(例如,脱氧核糖或脱氧己糖基团)的分子部分,天然存在的或非天然存在的核碱基与所述糖部分连接。
本文中使用的“寡磷酸”表示包含磷酸基团的寡聚体的分子部分。例如,寡磷酸可以包含2-20个磷酸的寡聚体、3-12个磷酸的寡聚体、3-9个磷酸的寡聚体。
本文中使用的“聚合酶”表示能够催化聚合反应(诸如核苷酸单体的聚合)以形成核酸聚合物的任何天然的或非天然存在的酶或其它催化剂。可以用在本发明的组合物和方法中的示例性聚合酶包括核酸聚合酶诸如DNA聚合酶(例如,EC 2.7.7.7类的酶)、RNA聚合酶(例如,EC 2.7.7.6或EC 2.7.7.48类的酶)、逆转录酶(例如,EC 2.7.7.49类的酶)和DNA连接酶(例如,EC 6.5.1.1类的酶)。
本文中使用的“纳米孔”表示在膜或其它屏障材料中形成的或以其它方式提供的具有约0.1 nm至约1000 nm的特征宽度或直径的孔、管道或通道。纳米孔可以由天然存在的孔形成蛋白构成,诸如来自金黄色葡萄球菌(S. aureus)的α-溶血素,或野生型孔形成蛋白的突变体或变体,无论是非天然存在的(即,经工程改造的)诸如α-HL-C46,还是天然存在的。膜可以是有机膜,诸如脂质双层,或由非天然存在的聚合材料制成的合成膜。所述纳米孔可以设置在传感器、传感电路或与传感电路(例如,互补金属氧化物半导体(CMOS)或场效应晶体管(FET)电路)偶联的电极邻近或附近。
本文中使用的“孔形成蛋白”表示能够在屏障材料(诸如脂质双层或细胞膜)中形成孔或通道结构的天然的或非天然存在的蛋白。本文中使用的该术语意图包括在溶液中的孔形成蛋白和被包埋在膜或屏障材料中或固定化在固体衬底或支持物上的孔形成蛋白。本文中使用的该术语意图包括作为单体和也作为它们能够组装成的任何多聚体形式的孔形成蛋白。可以用在本发明的组合物和方法中的示例性孔形成蛋白包括α-溶血素(例如,来自金黄色葡萄球菌)、β-溶血素、γ-溶血素、气单胞菌溶素、溶细胞素(例如,肺炎链球菌溶血素)、杀白细胞素、蜂毒肽和孔蛋白A(例如,来自耻垢分枝杆菌(Mycobacterium smegmatis)的MspA)。
本文中使用的“标记”表示能够实现或增强(直接地或间接地)检测和/或鉴定与所述标记偶联的分子或分子复合物的分子。例如,标记可以提供可检测的性质或特征,诸如空间大小或体积、静电荷、电化学电势和/或光谱特征。
本文中使用的“经标记的核苷酸”表示具有与寡磷酸部分、碱基部分或糖部分连接的标记的核苷酸或核苷酸类似物。
本文中使用的“纳米孔可检测的标记”表示这样的标记:其可以进入纳米孔中,变成定位在纳米孔中,被纳米孔捕获,穿过和/或横过纳米孔纳米孔转移,并由此导致穿过所述纳米孔的电流的可检测变化。示例性的纳米孔可检测的标记包括、但不限于天然的或合成的聚合物,诸如聚乙二醇、寡核苷酸、多肽、碳水化合物、肽核酸聚合物、锁核酸聚合物,其中任一种可以任选地用化学基团(诸如染料部分或荧光团)修饰或与其连接,所述化学基团可以导致可检测的纳米孔电流变化。
本文中使用的“接头”表示提供两个或更多个分子、分子基团和/或分子部分之间的具有一定空间的键合连接的任何分子部分。
本文中使用的“肽”表示通过酰胺键共价地连接的至少2个氨基酸。
本文中使用的“氨基酸”表示包含胺和羧酸官能团以及侧链的化合物。氨基酸可以包括本领域已知的和/或本文中公开的标准的20种遗传编码的α-氨基酸以及任意其它天然存在的和合成的氨基酸,其能够经历与另一个氨基酸的缩合反应以形成肽。
本文中使用的“多肽”表示2至约400个或更多个氨基酸的聚合物。当多肽序列在本文中呈现为单字母串或三字母缩写(或其混合物)时,根据常见惯例以氨基(N)至羧基(C)方向呈现所述序列。
本文中使用的“螺旋结构”表示形成一个或多个三维螺旋或环结构(诸如α-螺旋结构)的氨基酸的寡聚体或聚合物。
本文中在多肽标记的背景下使用的“总电荷”表示构成所述多肽标记的氨基酸残基的带正电荷的和带负电荷的侧链的总和。例如,包含具有5个带正电荷(+1)的赖氨酸残基和15个带负电荷(-1)的谷氨酸残基的多肽的多肽标记具有-10的总电荷。
本文中使用的“背景电流”表示,当施加电势且纳米孔是开放的且未阻断的(例如,在纳米孔中没有标记)时,跨纳米孔测得的电流水平。
本文中使用的“阻断电流”表示,当施加电势且标记存在于纳米孔中时,跨纳米孔测得的电流水平。通常,标记分子在纳米孔中的存在会限制穿过所述纳米孔的带电荷分子的流动,由此改变来自背景的电流水平。
本文中使用的“阻断电压”表示,当施加电流且标记存在于纳米孔中时,跨纳米孔测得的电压水平。通常,标记分子在纳米孔中的存在会限制穿过所述纳米孔的带电荷分子的流动,由此改变来自背景的电压水平。
本文中在捕获纳米孔中的标记的背景下使用的“停留时间”表示,通过阻断电流检测到的所述标记在纳米孔中度过的时间。
“天然存在的”表示在自然界中发现的形式。例如,天然存在的或野生型蛋白是具有在生物体(其可以分离自在自然界中发现的来源)中存在的序列的蛋白,且其没有通过人工操作有意地修饰。
“非天然存在的”或“重组的”或“经工程改造的”或当关于例如核酸、多肽或细胞使用时,表示这样的物质:其已经以在自然界中否则不会存在的方式修饰,或与其相同,但是从合成的物质和/或通过使用重组技术的操作生产或衍生。非限制性例子尤其包括重组细胞,其表达在细胞的天然(非重组)形式内不会发现的基因,或表达否则以不同的水平表达的天然基因。
实施方案的详细描述
在第一方面,本发明提供了结构式(I)的化合物
N-P-L-T
(I)
其中,
N是核苷;
P是共价地连接至所述核苷的5’-O基团的寡磷酸,其中所述寡磷酸由3-12个磷酸基团组成;
L是共价地连接至所述寡磷酸的末端磷酸基团的接头;且
T是共价地连接至所述接头的多肽标记,其中所述多肽具有总电荷且包含至少一个螺旋结构。
O优选地,所述化合物包含结构式(II):
其中,
碱基选自腺苷、胞苷、鸟苷、胸苷和尿苷;
R选自H和OH;
n是1-4;
接头是包含2-100个原子的共价键合链的接头;且
多肽是包含总电荷和至少一个螺旋结构的多肽标记。
所述多肽标记的长度可以是至少16个氨基酸残基、至少20个氨基酸残基、至少25个氨基酸残基、至少30个氨基酸残基、至少40个氨基酸残基、至少50个氨基酸残基、至少60个氨基酸残基、至少70个氨基酸残基、至少80个氨基酸残基或至少90个氨基酸残基。所述螺旋结构可以包含至少8个氨基酸残基,任选地至少16个氨基酸残基、至少20个氨基酸残基、至少25个氨基酸残基、至少30个氨基酸残基、至少40个氨基酸残基、至少50个氨基酸残基或至少60个氨基酸残基。例如,至少50%或至少75%的氨基酸残基是A残基。
所述螺旋结构可以是α-螺旋,其中所述α-螺旋的长度是至少10个氨基酸残基、至少16个氨基酸残基、至少20个氨基酸残基、至少25个氨基酸残基、至少30个氨基酸残基或至少40个氨基酸残基。所述α-螺旋可以包含含有至少3个氨基酸残基、至少4个氨基酸残基、至少5个氨基酸残基或至少6个氨基酸残基的序列基序的至少2个重复。所述序列基序可以是同聚物,其可以包含序列AAA。所述重复可以未被不形成螺旋的氨基酸残基中断。在一个实施方案中,所述序列基序由4个氨基酸组成,所述氨基酸可以包含至少2个A残基或3个A残基和1个带电荷的氨基酸残基。例如,所述4氨基酸序列选自由以下成员组成的基序组的基序:EAAA、AEAA、AAEA、AAAE、DAAA、ADAA、AADA、AAAD、RAAA、ARAA、AARA、AAAR、KAAA、AKAA、AAKA和AAAK,或包含至少2个A残基、1个带电荷的氨基酸残基和1个选自F、H、I、L、M、T、W和Y的氨基酸。所述重复可以未被不形成螺旋的氨基酸残基中断。
所述多肽标记的总电荷可以是负的,例如,所述多肽标记的总电荷是在约-10和-30之间。所述多肽标记的在接头远侧末端处的至少3、4或5个氨基酸残基可以是带负电荷的残基。所述带负电荷的残基选自谷氨酸、天冬氨酸、γ-羧基谷氨酸、高谷氨酸、半胱磺酸、磷酸-丝氨酸、磷酸-苏氨酸、磷酸-酪氨酸和它们的组合。总之,25%的位于所述多肽标记的接头远侧末端处的氨基酸残基可以具有这样的净电荷绝对值:其大于25%的位于所述多肽标记的接头近侧末端处的氨基酸残基的净电荷绝对值。在某些实施方案中,所述多肽标记包含选自表4的多肽标记。
元件“P”可以由3-9个磷酸基团组成,任选地由4-6个磷酸基团组成,或任选地由6个磷酸基团组成。接头“L”可以包含选自酯、醚、硫醚、胺、酰胺、酰亚胺、碳酸酯、氨基甲酸酯、方酸酯、噻唑、噻唑烷、腙、肟、三唑、二氢哒嗪、磷酸二酯、聚乙二醇(PEG)和它们的组合的化学基团。优选地,所述接头包含选自三唑、二氢哒嗪、酰胺、硫醚、醚、酯、磷酸二酯、碳酸酯、氨基甲酸酯、方酸酯、噻唑、噻唑烷、腙和肟的化学基团。在一个实施方案中,所述接头包含通过叠氮基与炔烃基的反应所产生的三唑基团。
根据本发明的化合物还可以包含结构式(III):
其中,
“碱基”是天然存在的或非天然存在的核碱基;
R选自H和OH;n是1-10;
“多肽”是具有总电荷且包含至少一个螺旋结构的多肽;且
“-LB-X-LA-”是接头,其中,
LA和LB各自包含2-100个原子的共价键合链;且
X是选自酯、醚、硫醚、胺、酰胺、酰亚胺、碳酸酯、氨基甲酸酯、方酸酯、噻唑、噻唑烷、腙、肟、三唑和二氢哒嗪的化学部分。
LA和LB各自独立地可以包含选自直链(C1-C12)烷基、直链(C1-C12)烯烃、直链(C1-C12)炔烃、酯、醚、硫醚、胺、酰胺、酰亚胺、碳酸酯、氨基甲酸酯、方酸酯、噻唑、噻唑烷、腙、肟、三唑、二氢哒嗪、磷酸二酯、聚乙二醇(PEG)和它们的组合的化学部分。La可以包含氨基酸残基。LB可以包含在所述多肽标记的N-端或C-端处的氨基酸残基。
根据本发明的化合物的实施例如下:
在第二方面,本发明提供了制备结构式(II)的多肽标记的核苷酸化合物的方法
其中,
碱基选自腺苷、胞苷、鸟苷、胸苷和尿苷;
R选自H和OH;
n是1-4;
接头是包含2-100个原子的共价键合链的接头;且
多肽是包含总电荷和至少一个螺旋结构的多肽标记
其中所述方法包括下述步骤:
(a)提供(i)在其5’-位置连接有3-12个磷酸的核苷酸,其中所述末端磷酸偶联至第一个接头形成基团;和(ii)多肽标记,其中所述多肽标记包含至少一个螺旋结构,具有总电荷,且偶联至第二个接头形成基团,所述第二个接头形成基团能够与所述第一个接头形成基团反应以形成接头;
其中
(1)所述第一个接头形成基团选自结构式(IVa)-(XVIIa)的化合物,且所述第二个接头形成基团是结构式(IVb) - (XVIIb)的对应的反应性化合物;或者
(2)所述第一个接头形成基团选自结构式(IVb)-(XVIIb)的化合物,且所述第二个接头形成基团是结构式(IVa)-(XVIIa)的对应的反应性化合物;和
(b)使所述第一个接头形成基团与所述第二个接头形成基团反应,由此形成所述核苷酸与所述多肽标记之间的共价键。
所述第一个接头形成基团可以选自炔烃和二烯,且所述第二个接头形成基团选自叠氮化物和四嗪;或(2)所述第一个接头形成基团选自叠氮化物和四嗪,且所述第二个接头形成基团选自炔烃和二烯。在一个实施方案中,所述第一个接头形成基团是叠氮化物,且所述第二个接头形成基团是炔烃。
在第三方面,本发明提供了包含经标记的核苷酸的组的组合物,每种核苷酸具有不同的标记,其中当它位于纳米孔中时每种不同的标记造成不同的阻断电流,且所述组包含至少一种在上面公开的化合物。
在另一个方面,本发明提供了一种用于确定核酸的序列的方法,所述方法包括:
(a)提供纳米孔测序组合物,其包含:膜,在所述膜的顺侧和反侧上的电极,其孔穿过所述膜延伸的纳米孔,与两个电极接触的电解质溶液,位于所述纳米孔附近的活性聚合酶,和与所述聚合酶形成复合物的引物链;
(b)使所述纳米孔测序组合物与以下物质接触:(i)一条核酸链;和(ii)一组经标记的核苷酸,每种核苷酸具有不同的标记,其中当它位于所述纳米孔中时每种不同的标记造成不同的阻断电流和/或具有不同的停留时间,且所述组包含至少一种在上面公开的化合物;和
(c)随时间检测所述标记的不同的阻断电流和/或不同的停留时间,并与所述聚合酶掺入的不同的经标记的核苷酸(其与所述核酸序列互补)中的每一个关联,且由此确定所述核酸序列。
概述:经标记的核苷酸和纳米孔测序
本发明描述了多肽标记的核苷酸化合物的组合物和可用于核酸的纳米孔测序的有关的方法、装置和系统。所述多肽标记的核苷酸可以用在方法中以准确地检测核酸聚合酶向生长中的链中掺入的与模板核酸链互补的单个核苷酸。通常,所述链延伸酶(例如,DNA聚合酶)特异性地结合与模板核酸链互补的多肽标记的核苷酸,其在它的活性部位处与生长中的核酸链杂交。所述链延伸酶然后将多肽标记的互补核苷酸催化地偶联(即,掺入)至生长中的核酸链的末端。催化掺入事件的完成会导致多肽标记和寡磷酸部分(减去在生长中的链中掺入的一个磷酸)的释放,其然后穿过邻近的纳米孔。
但是,甚至在它经历将它从掺入的核苷酸释放的催化过程之前,经标记的核苷酸的标记可以进入纳米孔的孔中,由此改变所述纳米孔在电势下的背景电流和造成可以被检测到的阻断电流。所述标记的不同分子性质(例如,质量、体积、3-D结构、静电荷)可以极大地影响它与所述孔的相互作用,并由此允许具有特定可辨别特征的不同标记分子用于纳米孔检测。多种纳米孔系统和关于在测序中使用它们检测经标记的分子(包括经标记的核苷酸)的方法是本领域已知的。参见,例如,2009年5月18日提交的Ju等人的美国专利申请号12/308,091;2013年6月14日提交的Ju等人的美国专利申请号13/994,431;2013年9月19日公开的美国专利申请公开US 2013/0244340 A1,2013年10月10日公开的US 2013/0264207A1,和2014年5月14日公开的US 2014/0134616 A1;2013年4月8日提交的Ju等人的PCT国际公开号PCT/US13/35635;和2013年4月8日提交的Ju等人的PCT国际公开号PCT/US13/35640,它们中的每一篇特此通过引用整体并入本文。
在大多数实施方案中,纳米孔测序使用可以被酶掺入生长中的链中的四种核苷酸类似物(例如,dA6P、dC6P、dG6P和dT6P)的混合物,每种核苷酸类似物具有共价地连接的标记,所述标记提供当用纳米孔检测时可鉴别的且可辨别的特征。
多肽分子是氨基酸的聚合物。可得到的天然存在的和非天然存在的氨基酸的宽范围和使用它们可以合成不同多肽序列的容易度允许制备这样的多肽标记:其具有非常宽的可以提供可辨别的纳米孔检测的分子性质的范围。
本发明提供了多肽标记的核苷酸,其中所述多肽标记表征了多种独特的分子特征,包括、但不限于,氨基酸链的不同长度、体积、3-D结构(例如,α-螺旋)和总电荷。
多肽标记的核苷酸化合物结构
在某些实施方案中,本发明提供了一种多肽标记的核苷酸,其为一般结构(I)的化合物
N-P-L-T
(I)
其中,N是核苷;P是共价地连接至所述核苷的5’-O基团的寡磷酸,其中所述寡磷酸包含3-12个磷酸基团;L是共价地连接至所述寡磷酸的末端磷酸基团的接头;且T是共价地连接至所述接头的多肽标记,其中所述多肽具有总电荷且包含至少一个螺旋结构。
核苷(N)可以是,当所述核苷共价地偶联至寡磷酸(P)(诸如三磷酸)时,能够被链延伸酶(诸如聚合酶)掺入的任何核苷。所述核苷可以包含天然存在的或非天然存在的核碱基和天然存在的或非天然存在的糖部分,诸如核糖或脱氧核糖基团。在某些实施方案中,所述核碱基选自腺苷、胞苷、鸟苷、胸苷和尿苷。所述糖部分应当提供在某个位置的游离羟基(例如,3’-OH基团),当被链延伸酶催化地掺入时,所述游离羟基可以与生长中的多核苷酸链形成磷酸二酯键。所述核苷糖部分还应当提供允许寡磷酸部分的共价连接的基团(例如,5’-O基团)。
在某些实施方案中,所述多肽标记的核苷酸可以包含化合物,其中所述化合物包含式(II)的结构:
其中,“碱基”是天然存在的或非天然存在的核碱基;R选自H和OH;n是1-10;“接头”是包含2-100个原子的共价键合链的接头;且“多肽”是具有总电荷且包含至少一个螺旋结构的多肽。
在某些实施方案中,所述核碱基(“碱基”)可以是任何天然地或非天然地存在的(例如,化学修饰的)碱基,其能够被链延伸酶(诸如聚合酶)掺入。在某些实施方案中,所述核碱基选自腺苷、胞苷、鸟苷、胸苷和尿苷。
在某些实施方案中,所述多肽标记的核苷酸的寡磷酸(P)可以是任何寡磷酸部分,其当连接至核苷的5’-O时允许得到的核苷酸仍然能够被链延伸酶(诸如聚合酶)掺入。通常,链延伸酶(诸如聚合酶)能够掺入包含寡磷酸的核苷酸,所述寡磷酸具有3-12个磷酸基团的链。因此,在本发明的多肽标记的核苷酸化合物(例如,结构式(I)或(II)的化合物)中,所述寡磷酸(P)基团可以包含3-12个磷酸基团。如在结构式(II)的化合物中所示,3-12个磷酸基团的寡磷酸可以由n = 1至n = 10的值表示。因而,在本发明的某些实施方案中,所述多肽标记的核苷酸化合物包含含有3-9个磷酸基团(或对于式(II),n = 1-7)的寡磷酸(P)基团。在某些实施方案中,所述寡磷酸磷酸基团包含4-6个磷酸基团(或对于式(II),n = 2-4)。在某些实施方案中,所述寡磷酸磷酸基团包含6个磷酸基团(或对于式(II),n = 4)。
在其它实施方案中,本发明的多肽标记的核苷酸包含4-20个磷酸、4-12个磷酸、4-9个磷酸、4-6个磷酸的寡磷酸链,其中所述链连接在核苷的5’位置(例如,5’-四磷酸、5’-五磷酸、5’-六磷酸、5’-七磷酸、5’-八磷酸、5’-九磷酸、5’-十磷酸等)。
进一步预见到,在本发明的多肽标记的核苷酸化合物中,所述寡磷酸可以包括经修饰的磷酸基团、磷酸类似物或其它非-磷酸化学基团。当然,当将寡磷酸连接至核苷的5’-O时,这样的磷酸基团在寡磷酸中的包含将允许得到的核苷酸仍然能够被链延伸酶掺入。通常,这要求在α-位置处的天然存在的磷酸基团和在可以经历链延伸酶的催化掺入的寡磷酸的α-位置和β-位置之间的磷酸二酯键。因而,在某些实施方案中,所述寡磷酸可以包含硫代磷酸基团。另外,预见到,所述寡磷酸可以包括磷酸或具有一个或多个非-磷酸基团(诸如亚甲基,和/或在两个或多个磷酸基团之间的桥连基)的磷酸-类似物基团的寡聚体。
宽范围的接头可以用在结构式(I)和(II)的多肽标记的核苷酸化合物中。通常,所述接头可以包含能够提供所述多肽标记和所述核苷酸之间的共价偶联和期望的间距或结构的任何分子部分。可以为多肽标记的核苷酸化合物的具体应用选择和优化期望的间距或结构。例如,在纳米孔检测应用中,可以选择接头,其提供当核苷酸与邻近聚合酶形成三元复合物时允许多肽标记进入纳米孔并在其中停留的间距。取决于聚合酶如何偶联至纳米孔,可以选择稍微更短或更长的间距,从而在多肽标记位于所述孔中时提供合适的阻断电流。但是,通常,在本发明的多肽标记的核苷酸化合物(例如,式(I)和(II)的化合物)中有用的接头包含2-100个原子的共价键合链。在某些实施方案中,2-100个原子的接头链包含一个或多个选自直链(C1-C12)烷基、直链(C1-C12)烯烃、直链(C1-C12)炔烃、酯、醚、硫醚、胺、酰胺、酰亚胺、碳酸酯、氨基甲酸酯、方酸酯、噻唑、噻唑烷、腙、肟、三唑、二氢哒嗪、磷酸二酯、聚乙二醇(PEG)和它们的组合的化学部分。在本文中描述和举例说明了多种接头,其包含在多肽标记的核苷酸化合物中有用的多种化学部分。
通常,在结构式(I)或(II)的多肽标记的核苷酸化合物的制备过程中,在将多肽标记与寡磷酸部分共价偶联的化学反应中,形成接头。更具体地,该化学反应通常涉及用反应性接头形成基团修饰的多肽标记和包含寡磷酸的核苷酸,其中所述寡磷酸的末端也用反应性接头形成基团修饰。该形成接头的化学反应可以如在方案1中所示。
方案1
如在方案1中所示,XA和XB是反应性接头形成基团,且LA和LB是化学部分,其为最后形成的结构-LB-X-LA-的接头的前体。因而,XA和XB是能够发生化学反应的化学部分,所述化学反应导致所述多肽标记和所述核苷酸之间的共价偶联。接头形成基团XA和XB之间的该共价偶联反应的产物是包含一般结构-LB-X-LA-的所述多肽标记和所述核苷酸之间的接头。也就是说,在某些实施方案中,在式(I)和(II)的化合物中的接头“L”或“接头”是如在方案1中所示的结构式“-LB-X-LA-”的接头。
新化学部分X是在接头形成反应中产生的独特化学部分。特定化学基团X的名称经常用于表示接头的类型,尽管由LA和LB提供的接头的其它部分可以实质上促进所述接头的总结构。例如,特征性接头部分X可以是三唑基团。所述三唑基团可以在叠氮化物接头形成基团和炔烃接头形成基团之间的“点击”反应中形成。
另外,总接头可以包括在三唑部分的一侧或两侧上的C5直链烷基和酰胺基。因此,在某些实施方案中,所述接头包含在接头形成试剂XA和XB之间的接头形成反应中产生的化学部分X,其中X是选自酯、醚、硫醚、胺、酰胺、酰亚胺、碳酸酯、氨基甲酸酯、方酸酯、噻唑、噻唑烷、腙、肟、三唑、二氢哒嗪、磷酸二酯和聚乙二醇(PEG)的化学部分。
化学部分LA和LB是可以有效地充当所述多肽标记或寡磷酸和它们的接头形成基团XA和XB之间的接头或间隔物的化学基团。通常,LA和LB是不会在接头形成反应中反应、但是为最终的形成的接头提供另外间距或结构的化学部分。所述LA和LB部分可以是相同的或不同的。在某些实施方案中,LA或LB可以比另一个长得多或短得多,和/或提供不同的结构特征,例如导致或多或少构象柔性的特征。因此,在某些实施方案中,在本发明的多肽标记的核苷酸化合物中有用的LA和LB部分包含2-100个原子的共价键合链,且任选地,一个或多个化学部分选自直链(C1-C12)烷基、直链(C1-C12)烯烃、直链(C1-C12)炔烃、酯、醚、硫醚、胺、酰胺、酰亚胺、碳酸酯、氨基甲酸酯、方酸酯、噻唑、噻唑烷、腙、肟、三唑、二氢哒嗪、磷酸二酯、聚乙二醇(PEG)和它们的组合。
因而,在某些实施方案中,本发明提供了结构式(III)的多肽标记的核苷酸化合物
其中,“碱基”是天然存在的或非天然存在的核碱基;R选自H和OH;n是1-10;“多肽”是具有总电荷且包含至少一个螺旋结构的多肽;且“-LB-X-LA-”是接头,其中LA和LB各自包含2-100个原子的共价键合链,且X是选自酯、醚、硫醚、胺、酰胺、酰亚胺、碳酸酯、氨基甲酸酯、方酸酯、噻唑、噻唑烷、腙、肟、三唑和二氢哒嗪的化学部分。在某些实施方案中,LA和LB各自独立地包含选自以下的化学部分:直链(C1-C12)烷基、直链(C1-C12)烯烃、直链(C1-C12)炔烃、酯、醚、硫醚、胺、酰胺、酰亚胺、碳酸酯、氨基甲酸酯、方酸酯、噻唑、噻唑烷、腙、肟、三唑、二氢哒嗪、磷酸二酯、聚乙二醇(PEG)和它们的组合。
示例性的接头形成基团XA和XB、接头前体部分LA和LB和它们形成的得到的式-LA-X-LB-的接头显示在下面表1中。
表1举例说明了一系列接头和对应的反应性接头形成基团,所述反应性接头形成基团经历产生共价偶联接头的反应。这些不同的接头和反应是本领域众所周知的。普通技术人员将能够鉴定这些反应所需的试剂,并合成它们或在商业上得到它们。例如,用于将多肽(或蛋白)与其它生物分子缀合或交联的试剂可以用作接头形成基团以制备本发明的多肽-标记-接头-寡磷酸-核苷酸化合物结构(参见例如,可得自Thermo Scientific, USA(在www.piercenet.com)或Sigma-Aldrich, USA(在www.sigmaaldrich.com)的“交联剂”目录)。另外,可以用在自动化的多肽固相合成中的宽范围的用叠氮化物或炔烃基(或其它接头形成基团)修饰的FMOC-保护的氨基酸残基是商购可得的(参见例如,AnaSpec, Fremont,California, USA)。类似地,末端磷酸修饰的核苷和/或用于这样的修饰的具有叠氮化物或炔烃基(或其它接头形成基团)的试剂是商购可得的(参见例如,Jena Bioscience Gmbh,Jena, 德国)。
预见到,结构式(IVa) - (XVIIa)和(IVb) - (XVIIb)的接头形成基团对中的任一对可以以任一种构型用于制备本发明的肽标记的核苷酸化合物(例如,式(III)的化合物)中的接头。也就是说,接头形成基团XA和XB中的任一种可以用在多肽标记或核苷酸上,只要所述接头形成基团配对以提供形成接头部分X的接头反应。因而,结构式(IVa) - (XVIIa)的接头形成基团中的任一种可以连接至多肽或核苷酸,且结构式(IVb) - (XVIIb)的缀合物接头形成基团可以连接至另一种。因而,在表1中在R1-LA-X-LB-R2形式的接头中描绘的基团R1和R2可以分别代表多肽标记和核苷酸、或核苷酸和多肽标记。
因此,在某些实施方案中,本发明提供了式(III)的多肽标记的核苷酸化合物,其中所述化合物包含式R1-LA-X-LB-R2的化合物,其中R1和R2分别是核苷酸和多肽标记,或R1和R2分别是多肽标记和核苷酸,且-LA-X-LB- 包含选自表1中的结构式(IVc) - (XVIIc)的部分的化学部分。
如上所述,构成接头的化学部分LA和LB可以各自独立地包含包括直链(C1-C12)烷基、酯、醚、硫醚、胺、酰胺、酰亚胺、碳酸酯、氨基甲酸酯、聚乙二醇(PEG)和它们的组合的化学部分。类似于接头形成基团XA和XB,预见到,构成接头的化学部分LA和LB中的任一种可以各自独立地与接头形成基团中的任一种一起使用,并且可以用在多肽标记或核苷酸上。另外,预见到,化学部分LA和LB可以是相同的或不同的。在式(III)的多肽标记的核苷酸化合物的某些实施方案中,LA和LB化学部分包含独立地选自表2中的式(XVIIIa) - 式(XVIIId)的部分结构的化学部分。
尽管化合物(III)的结构式将接头“-LB-X-LA-”描绘为共价地偶联至多肽标记的单独部分,预见到,在某些实施方案中,该接头可以包含氨基酸残基,所述氨基酸残基又经由标准肽键偶联至所述多肽标记。在本发明的实施例中举例说明了这样的实施方案,其中与多肽标记偶联的氨基酸包含炔丙基(或其它炔基)基团。所述炔丙基提供了炔烃“手柄”,其允许多肽标记经由叠氮化物-炔烃或叠氮化物-环辛炔“点击”反应共价地偶联至期望的核苷酸(或核苷酸类似物)。该炔丙基充当接头形成基团(即,“XB”)并经历与连接至核苷酸的叠氮化物接头形成基团的接头形成“点击”反应,如方案2中所示。
方案2
本文中公开的每种示例性多肽-标记(参见例如,下面的表4和5)可以用炔丙基修饰。具体的可能的修饰可以包括,但不限于:在N-端处的炔丙基-甘氨酸(“Pra”)氨基酸残基,或与在C-端处的氨基酸的侧链共价地连接的炔丙基(例如,C-端赖氨酸的侧链ε胺的炔丙基修饰)。炔丙基还可能可以是氨基酸残基侧链的修饰,其中所述氨基酸是在多肽序列的内部部分(即,不是在N-或C-末端)。因而,在某些实施方案中,结构式(III)(如上所述)的多肽标记的核苷酸化合物可以进一步包含结构式(XIX) (即,其中X是三唑基团)
可以在N-或C-端处或在多肽序列中能够修饰的任意其它氨基酸残基处用炔丙基修饰多肽标记。在某些实施方案中,通过包括炔丙基修饰的氨基酸合成试剂,可以在多肽标记的合成过程中引入炔丙基修饰。用于用在固相多肽合成中的这样的经修饰的氨基酸试剂是众所周知的和商购可得的。例如,所述多肽标记的合成可以包括这样的步骤:其中将L-炔丙基-甘氨酸氨基酸添加在它的N-端。N-端L-炔丙基-甘氨酸氨基酸残基(也被称作“Pra”氨基酸)具有在α-位置处的炔丙基(或2-丙炔基)基团,该基团可以发生与叠氮化物-修饰的核苷酸的反应以形成多肽标记的核苷酸。因而,在某些实施方案中,本发明提供了结构式(III)的多肽标记的核苷酸化合物,其中所述多肽标记(T)通过多肽的N-端连接至接头。在方案3中举例说明了这样的一个使用N-端Pra氨基酸残基的实施例。
方案3
因而,在某些实施方案中,结构式(III)(如上所述)的多肽标记的核苷酸化合物可以进一步包含结构式(XX) (即,其中LB包含经修饰的甘氨酸氨基酸,且X是三唑基团)
也可以在C-端或其它位置处用炔丙基修饰的氨基酸合成多肽标记。例如,试剂N 2-[(1,1-二甲基乙氧基)羰基]-N 6-[(2-丙炔基氧基)羰基]-L-赖氨酸可以用于插入炔丙基修饰的赖氨酸残基。在另一个实施方案中,可以经由固相多肽合成来合成多肽标记,并然后随后在多肽上的合适氨基酸残基侧链处用炔丙基修饰。例如,可以将赖氨酸氨基酸残基经由标准固相多肽合成添加至多肽标记序列的C-端。然后,在多肽合成以后,使用标准的缀合化学(例如,NHS-酯添加)可以用炔丙基修饰赖氨酸侧链的ε胺基团。炔丙基修饰的赖氨酸可以发生与叠氮化物-修饰的核苷酸的反应以形成多肽标记的核苷酸。在方案4中举例说明了这样的一个使用C-端炔丙基修饰的赖氨酸(即,“K(炔丙基))氨基酸残基的实施例。
方案4
因而,在某些实施方案中,结构式(III)(如上所述)的多肽标记的核苷酸化合物可以进一步包含结构式(XXI) (即,其中LB包含经修饰的赖氨酸氨基酸,且X是三唑基团)
如上面所指出的,预见到,接头形成基团XA和XB可以用在多肽标记或核苷酸上,只要所述接头形成基团配对以提供形成接头部分X的接头反应。例如,多肽标记的合成可以包括这样的步骤:其中将叠氮基修饰的氨基酸(例如,L-叠氮基丁基-丙氨酸、叠氮基-赖氨酸、叠氮基-苯丙氨酸)添加至所述序列(例如,在它的N-端处),并用炔烃基修饰核苷酸的末端磷酸。因而,在某些实施方案中,所述多肽标记包含叠氮基并发生与连接至核苷酸的炔丙基(或其它炔基)基团的“点击”反应,如在方案5中举例说明。
方案5
因而,在某些实施方案中,结构式(III)(如上所述)的多肽标记的核苷酸化合物可以进一步包含结构式(XXII),三唑基团相对于结构式(XIX)的化合物处于相反取向。
但是,在本发明的多肽标记的核苷酸化合物中有用的接头不限于由接头形成基团形成且具有如在结构式(III)的化合物中所示的结构-LB-X-LA-的接头。尽管通常必须有两种接头形成基团(即,XA和XB)存在以实现方案1中的接头形成反应,但是不需要两种前体接头基团的存在。例如,在某些实施方案中预见到可以实现接头形成反应,其中一种或两种接头形成基团直接地连接至多肽标记和/或核苷酸。因而,由接头形成基团XA和XB之间的反应形成的部分X可以提供完整接头。在方案6中举例说明了这样的一个实施例。
方案6
多肽标记
在本发明的多肽标记的核苷酸中可用作标记的多肽通常是具有总电荷和至少一个螺旋结构的30个或更多个氨基酸的聚合链。当所述结构进入纳米孔并在其中停留时,本发明的多肽标记的螺旋结构可以提供表现出更少差异的更强阻断电流。不希望受任何提出的理论或机制限制,据信,具有16个氨基酸或更长(例如,16-80个氨基酸)的螺旋结构(诸如α-螺旋环)的多肽可以更好地配合进纳米孔的孔中,从而提供与具有直链或无规则卷曲结构的多肽相比更强的当前阻断电流和更长的停留时间。因此,本发明提供了具有氨基酸序列的多肽标记,所述氨基酸序列具有长度、螺旋结构和总电荷的范围。
在多肽标记的某些实施方案中,所述多肽长度是至少10个氨基酸、至少16个氨基酸、至少20个氨基酸、至少25个氨基酸、至少30个氨基酸、至少40个氨基酸、至少50个氨基酸、至少60个氨基酸、至少70个氨基酸、至少80个氨基酸或甚至更多个氨基酸。在某些实施方案中,所述多肽的长度是10-100个氨基酸、16-90个氨基酸、30-90个氨基酸、40-80个氨基酸或50-70个氨基酸。
本发明的多肽标记不限于20种遗传编码的氨基酸。除了遗传编码的氨基酸以外,本文描述的多肽可以完全地或部分地包含其它合成的或天然存在的非编码的氨基酸,包括、但不限于:遗传编码的L-氨基酸的D-立体异构体;遗传编码的α-氨基酸的β-取代的氨基酸异构体(例如,β-丙氨酸);2,3-二氨基丙酸(Dpr);α-氨基异丁酸(Aib);ε-氨基己酸(Aha);δ-氨基戊酸(Ava);N-甲基甘氨酸或肌氨酸(MeGly或Sar);鸟氨酸(Orn);瓜氨酸(Cit);叔丁基丙氨酸(Bua);叔丁基甘氨酸(Bug);N-甲基异亮氨酸(MeIle);苯基甘氨酸(Phg);环己基丙氨酸(Cha);正亮氨酸(Nle);萘基丙氨酸(Nal);2-氯苯丙氨酸(Ocf);3-氯苯丙氨酸(Mcf);4-氯苯丙氨酸(Pcf);2-氟苯丙氨酸(Off);3-氟苯丙氨酸(Mff);4-氟苯丙氨酸(Pff);2-溴苯丙氨酸(Obf);3-溴苯丙氨酸(Mbf);4-溴苯丙氨酸(Pbf);2-甲基苯丙氨酸(Omf);3-甲基苯丙氨酸(Mmf);4-甲基苯丙氨酸(Pmf);2-硝基苯丙氨酸(Onf);3-硝基苯丙氨酸(Mnf);4-硝基苯丙氨酸(Pnf);2-氰基苯丙氨酸(Ocf);3-氰基苯丙氨酸(Mcf);4-氰基苯丙氨酸(Pcf);2-三氟甲基苯丙氨酸(Otf);3-三氟甲基苯丙氨酸(Mtf);4-三氟甲基苯丙氨酸(Ptf);4-氨基苯丙氨酸(Paf);4-碘苯丙氨酸(Pif);4-氨基甲基苯丙氨酸(Pamf);2,4-二氯苯基丙氨酸(Opef);3,4-二氯苯基丙氨酸(Mpcf);2,4-二氟苯丙氨酸(Opff);3,4-二氟苯丙氨酸(Mpff);吡啶-2-基丙氨酸(2pAla);吡啶-3-基丙氨酸(3pAla);吡啶-4-基丙氨酸(4pAla);萘-1-基丙氨酸(1nAla);萘-2-基丙氨酸(2nAla);噻唑基丙氨酸(taAla);苯并噻吩基丙氨酸(bAla);噻吩基丙氨酸(tAla);呋喃基丙氨酸(fAla);高苯丙氨酸(hPhe);高酪氨酸(hTyr);高色氨酸(hTrp);五氟苯丙氨酸(5ff);苯乙烯基k丙氨酸(sAla);authryl丙氨酸(aAla);3,3-二苯基丙氨酸(Dfa);3-氨基-5-苯基戊酸(Afp);青霉胺(Pen);1,2,3,4-四氢异喹啉-3-甲酸(Tic);β-2-噻吩基丙氨酸(Thi);甲硫氨酸亚砜(Mso);N(w)-硝基精氨酸(nArg);高赖氨酸(hLys);膦酰基甲基苯丙氨酸(pmPhe);磷酸丝氨酸(pSer);磷酸苏氨酸(pThr);高天冬氨酸(hAsp);高谷氨酸(hGlu);1-氨基环戊-(2或3)-烯-4羧酸;2-哌啶甲酸(PA), 氮杂环丁烷-3-甲酸(ACA);1-氨基环戊烷-3-甲酸;烯丙基甘氨酸(aOly);炔丙基甘氨酸(Pra);高丙氨酸(hAla);正缬氨酸(nVal);高亮氨酸(hLeu), 高缬氨酸(hVal);高异亮氨酸(hIle);高精氨酸(hArg);N-乙酰基赖氨酸(AcLys);2,4-二氨基丁酸(Dbu);2,3-二氨基丁酸(Dab);N-甲基缬氨酸(MeVal);高半胱氨酸(hCys);高丝氨酸(hSer);羟脯氨酸(Hyp);和高脯氨酸(hPro)。在本文描述的多肽标记中有用的另外的非编码的氨基酸将是本领域技术人员会明白的(参见,例如,在Fasman, 1989, CRC Practical Handbook ofBiochemistry and Molecular Biology, CRC Press, Boca Raton, FL的第3-70页和其中引用的参考文献中提供的各种氨基酸,它们都通过引用并入)。这些氨基酸可以处于L-或D-构型。
本领域技术人员会认识到,本发明的多肽标记还可以包含带有侧链保护基的氨基酸。这样的具有被保护的侧链的氨基酸的例子包括、但不限于(在括弧中列出保护基): Arg(tos)、Cys(甲基苄基)、Cys (硝基吡啶次磺酰基)、Glu(δ-苄基酯)、Gln(呫吨基)、Asn(N-δ-呫吨基)、His(bom)、His(苄基)、His(tos)、Lys(fmoc)、Lys(tos)、Ser(O-苄基)、Thr (O-苄基)和Tyr(O-苄基)。
本发明的多肽标记的多肽螺旋结构可以包含所述多肽的所有氨基酸残基或所述多肽的一些子部分。因此,在多肽标记的某些实施方案中,所述多肽螺旋结构包含至少10个氨基酸、至少16个氨基酸、至少20个氨基酸、至少25个氨基酸、至少30个氨基酸、至少40个氨基酸、至少50个氨基酸或至少60个氨基酸。
α螺旋(α-螺旋)是在本发明的多肽标记的核苷酸中有用的常见的且充分表征的螺旋结构。α-螺旋具有右旋螺旋构象,其中每个主链N-H基团表示与以前的氨基酸四残基的主链C=O基团的氢键。在多肽结构的类型中,α-螺旋是最普遍的且基于氨基酸序列容易地预测。关于设计具有α-螺旋结构的多肽的原理是本领域中充分研究的和确定的(参见例如,Garner & Harding, “Design and synthesis ofα-helical peptides and mimetics,”Org. Biomol. Chem., 2007, 5, 3577-3585;和Doig, “Stability and Design ofα-Helical Peptides,”Progress in Molecular Biology and Translational Science, 第83卷, 第1-52页, Elsevier 2008)。这些一般原理可以用于设计在本发明的多肽标记的核苷酸化合物中有用的具有螺旋结构的多肽标记。
不同的氨基酸序列具有不同的形成α-螺旋结构的倾向。甲硫氨酸、丙氨酸、亮氨酸、谷氨酸和赖氨酸(以氨基酸1-字母代码的形式,“MALEK”)都具有特别高的螺旋形成倾向,而脯氨酸和甘氨酸具有差的螺旋形成倾向。脯氨酸是破坏氨基酸序列免于形成螺旋结构(诸如α-螺旋)的氨基酸残基。但是,脯氨酸可以充当螺旋的第一个残基。甘氨酸也倾向于破坏螺旋结构,认为归因于它的高构象柔性的熵不利性,从而呈现相对受约束的螺旋结构。
例如,基于当氨基酸处于α-螺旋时相对于氨基酸丙氨酸(将其武断地设定为0)的自由能(以每个残基的kcal/mol估计)的差异,可以估计氨基酸的形成α-螺旋结构的倾向。已经基于自由能差异来估计氨基酸残基的α-螺旋形成倾向(参见例如,Pace, 等人(1998),“A Helix Propensity Scale Based on Experimental Studies of Peptides andProteins,”Biophysical Journal 75: 422-427; doi:10.1016/s0006-3495(98)77529-0)。如在下面关于20种遗传编码的L-氨基酸的表3中所示,氨基酸残基Ala、Arg、Leu、Met、Lys、Gln和Glu表现出相对高的形成螺旋结构的倾向(较高的正自由能具有较低的螺旋形成倾向)。但是,这些相对倾向值可以随邻近的氨基酸残基变化。
表3
在本发明的某些实施方案中,所述多肽标记的核苷酸的多肽标记包含含有α-螺旋的螺旋结构。在某些实施方案中,所述α-螺旋包含含有至少3个氨基酸的序列基序的至少两个重复。任选地,所述包含至少3个氨基酸的序列基序是同聚物,且进一步任选地,所述包含至少3个氨基酸的同聚物序列基序包含序列AAA。
在某些实施方案中,所述α-螺旋包含由4个氨基酸组成的序列基序的至少两个重复。任选地,所述4氨基酸序列基序包含至少2个A残基。在某些实施方案中,所述α-螺旋包含由8个氨基酸组成的序列基序的至少两个重复。在某些实施方案中,所述α-螺旋包含含有至少3个A残基的4个氨基酸序列的序列基序。在某些实施方案中,所述4氨基酸序列基序包含3个丙氨酸残基和1个带电荷的氨基酸残基。任选地,所述4氨基酸序列基序包含选自由以下成员组成的基序组的基序:EAAA、AEAA、AAEA、AAAE、DAAA、ADAA、AADA、AAAD、RAAA、ARAA、AARA、AAAR、KAAA、AKAA、AAKA和AAAK。在某些实施方案中,所述α-螺旋包含含有4氨基酸序列基序的序列基序,其中所述基序包含至少2个A残基、1个带电荷的氨基酸残基和1个具有提供位阻的侧链的氨基酸。任选地,所述具有提供位阻的侧链的氨基酸选自F、H、I、L、M、T、W和Y。
在包含α-螺旋的多肽标记的某些实施方案中,所述α-螺旋包含序列基序的至少两个重复,其中所述重复未被具有低α-螺旋形成倾向的氨基酸残基(诸如具有大于0.50或大于0.60或至少1.00的螺旋倾向的氨基酸残基(如上面在表3中列出的))中断。
在包含α-螺旋的多肽标记的某些实施方案中,所述α-螺旋包含序列基序的至少两个重复,其中所述重复未被不形成螺旋的氨基酸残基(或螺旋破坏者)中断。这样的不形成螺旋的残基可以包括但不限于P和G。
在包含α-螺旋的多肽标记的某些实施方案中,所述α-螺旋包含序列基序的至少两个重复,其中所述重复未被选自C、D、F、G、H、N、P、T、V和Y的氨基酸残基中断。在某些实施方案中,所述α-螺旋包含序列基序的至少两个重复,其中所述重复未被选自C、D、G、H、N、P、T和V的氨基酸残基中断。在某些实施方案中,所述α-螺旋包含序列基序的至少两个重复,其中所述重复未被选自G和P的氨基酸残基中断。
在本发明的多肽标记的某些实施方案中,所述多肽包含α-螺旋,其中所述α-螺旋的长度是至少10个氨基酸、至少16个氨基酸、至少20个氨基酸、至少25个氨基酸、至少30个氨基酸或至少40个氨基酸。在某些实施方案中,所述α-螺旋的至少50%的氨基酸残基是A残基。在某些实施方案中,所述α-螺旋的至少75%的氨基酸残基是A残基。因而,在某些实施方案中,所述多肽标记包含α-螺旋,其中所述α-螺旋的长度是至少16个氨基酸,且所述α-螺旋包含至少6个A残基(即,50%)。在某些实施方案中,所述多肽标记包含α-螺旋,其中所述α-螺旋的长度是至少40个氨基酸,且所述α-螺旋包含至少30个A残基(即,75%丙氨酸残基)。
标记分子的电荷可以促进纳米孔对经标记的核苷酸的捕获和检测。通常,当将纳米孔检测系统设置在交流电(AC)或直流电(DC)电位下,并且所述孔的顺侧(即,具有核苷酸和聚合酶的蓄池侧)具有带负电荷的电极,且反侧具有带正电荷的电极时,优选的是,所述经标记的核苷酸的标记具有负电荷。在这样的条件下,由反侧正电极提供的电动势可以促进带负电荷的标记的捕获和检测。可替换地,在其中纳米孔系统的反侧包含负电极的条件下,带正电荷的标记通常是优选的。
本发明提供了多肽标记的核苷酸,其中所述多肽具有30个或更多个氨基酸和总电荷。所述总电荷是整个多肽的该净电荷,其基于累加构成所述多肽的每个氨基酸侧链的电荷。因为可得到各种各样的可以掺入多肽序列中的带电荷的氨基酸残基,所以可以在宽范围内容易地调节(或调整)本发明的多肽标记的总电荷以允许宽范围的可能的纳米孔检测特征。
在某些实施方案中,本发明提供了多肽标记的核苷酸,其中所述多肽的总电荷是负的。在某些实施方案中,所述多肽的总电荷是在约-10和-30之间。在其中所述多肽的总电荷为负的实施方案中,所述多肽序列可以包含一个或多个带负电荷的氨基酸残基,其中所述带负电荷的残基可以是相同的或不同的。例如,在具有-10的总电荷的多肽标记的情况下,所述多肽序列需要包含至少10个带负电荷的残基。在某些实施方案中,所述带负电荷的残基选自谷氨酸、天冬氨酸、γ-羧基谷氨酸、高谷氨酸、半胱磺酸、磷酸-丝氨酸、磷酸-苏氨酸、磷酸-酪氨酸和它们的组合。
可替换地,在多肽标记的核苷酸的某些实施方案中,所述多肽的总电荷是正的,且任选地具有约+10和+30之间的总电荷。在这样的实施方案中,所述多肽序列可以包含一个或多个带正电荷的氨基酸残基,其任选地选自精氨酸、赖氨酸和组氨酸。
预见到,在某些实施方案中,所述多肽标记的总电荷可以在所述多肽标记的长度上均匀地分布。但是,在某些实施方案中,本发明的多肽标记的总电荷可以在所述多肽序列的长度上不均匀地分布。这样的不均匀的电荷分布可以提供在纳米孔检测条件(例如,AC或DC电位)下具有进一步区分特征的标记。因此,在某些实施方案中,本发明提供了一种多肽标记的核苷酸,其中25%的位于在接头远侧(即,更远)的多肽标记的末端的氨基酸残基具有这样的净电荷绝对值:其大于25%的位于在接头近侧(即,更近)的多肽的末端的氨基酸残基的净电荷绝对值。也就是说,如果总电荷是负的,25%的在接头远侧的氨基酸残基将比25%的在接头近侧的氨基酸残基带更多的负电荷。
在具有不均匀分布的总电荷的肽标记的、多肽标记的核苷酸的某些实施方案中,在接头远侧末端处的所述多肽的至少3个氨基酸残基是带负电荷的残基。在某些实施方案中,在接头远侧末端处的所述多肽的至少5个氨基酸残基是带负电荷的残基。在某些实施方案中,在接头远侧末端处存在至少6、7、8、9或10个或更多个带负电荷的残基。在某些实施方案中,在末端处的至少3、4、5、6个或更多个带负电荷的氨基酸残基是相同的氨基酸,例如,EEEEEE或DDDDD。在某些实施方案中,在末端处的至少3、4、5、6个或更多个带负电荷的氨基酸残基是不同的带负电荷的氨基酸的混合物,例如,EEEDDD或DEDED或EEDEE。
利用本领域中的关于氨基酸残基、电荷、长度、体积和质量特征以及它们的已知的当在多肽序列中聚合时形成某些结构类型的倾向(例如,α-螺旋形成倾向)的知识,和下面的关于在纳米孔检测中使用经标记的核苷酸的公开内容,可以设计多种多肽标记,其可以提供适合用于纳米孔检测的特征的范围。表4显示了可以用在本发明的多肽标记的核苷酸中的示例性多肽标记。
因而,在某些实施方案中,本发明提供了一种多肽标记的核苷酸化合物,其中所述多肽标记(T)包含表4的多肽标记序列。在某些实施方案中,本发明提供了结构式(I)、(II)、(III)、(XIX)、(XX)、(XXI)或(XXII)中的任一个的多肽标记的核苷酸化合物,其中所述多肽标记包含表4的多肽标记序列。
在表4中显示的示例性多肽标记包含天然的和/或非天然的氨基酸单体,并且可以通过标准固相多肽合成方法制备。另外,这些多肽标记(和基本上任何多达80个氨基酸的其它多肽序列)可商购得自定制肽卖方诸如Peptide 2.0 (Chantilly, Virginia, USA)或GenScript (Piscataway, New Jersey, USA)。
标准合成方法可以用于制备本发明的多肽标记的核苷酸化合物(例如,结构式(I)、(II)、(III)的化合物)。在上面和在实施例中描述了标准的叠氮基-炔烃点击反应(例如,(XIX)、(XX)、(XXI)或(XXII)的化合物)。表1和2举例说明了可以用于制备本发明的肽标记的核苷酸的接头和接头形成基团反应的范围。在表1中所示的结构式(IVa) - (XVIIa)的接头形成基团中的任一种可以连接至所述多肽或核苷酸的末端磷酸,且结构式(IVb) -(XVIIb)的缀合物接头形成基团可以彼此连接。得到的多肽-接头-寡磷酸-核苷酸结构在表1中由结构式(IVc) - (XVIIc)举例说明,且包括由反式-环辛烯(XVIIa)和四嗪(XVIIb)接头形成基团的点击反应产生的二氢吡啶(dihydropyrazidine)基团结构(XVIIc)。
因此,本发明提供了一种制备经标记的核苷酸的方法,所述方法包括:(a)提供(i)在其5’-位置连接有3-12个磷酸的核苷酸,其中所述末端磷酸偶联至第一个接头形成基团(例如,XA或XB);和(ii)多肽标记,其中所述多肽标记包含至少一个螺旋结构,具有总电荷,且偶联至第二个接头形成基团(例如,XB或XA),所述第二个接头形成基团能够与所述第一个接头形成基团反应以形成接头(例如,-X-);和(b)使所述第一个接头形成基团与所述第二个接头形成基团反应以将所述核苷酸连接至所述多肽标记。在上面表1中举例说明了能够反应以形成接头的第一个和第二个接头形成基团。因而,在所述方法的某些实施方案中,所述第一个接头形成基团选自结构式(IVa) - (XVIIa)的化合物,且所述第二个接头形成基团是结构式(IVb) - (XVIIb)的对应的反应性化合物;或可替换地,所述第一个接头形成基团可以选自结构式(IVb) - (XVIIb)的化合物,且所述第二个接头形成基团是结构式(IVa)- (XVIIa)的对应的反应性化合物。
在某些实施方案中,公开内容提供了制备结构式(II)的多肽标记的核苷酸化合物的方法
其中,碱基选自腺苷、胞苷、鸟苷、胸苷和尿苷;R选自H和OH;n是1-4;接头是包含2-100个原子的共价键合链的接头;且多肽是包含总电荷和至少一个螺旋结构的多肽标记;且所述方法包括以下步骤:
(a)提供(i)在其5’-位置连接有3-12个磷酸的核苷酸,其中所述末端磷酸偶联至第一个接头形成基团;和(ii)多肽标记,其中所述多肽标记包含至少一个螺旋结构,具有总电荷,且偶联至第二个接头形成基团,所述第二个接头形成基团能够与所述第一个接头形成基团反应以形成接头;
其中
(1)所述第一个接头形成基团选自结构式(IVa) - (XVIIa)的化合物,且所述第二个接头形成基团是结构式(IVb) - (XVIIb)的对应的反应性化合物;或者
(2)所述第一个接头形成基团选自结构式(IVb) - (XVIIb)的化合物,且所述第二个接头形成基团是结构式(IVa) - (XVIIa)的对应的反应性化合物;
(b)使所述第一个接头形成基团与所述第二个接头形成基团反应,由此形成所述核苷酸与所述多肽标记之间的共价键。
在制备多肽标记的核苷酸的方法的某些实施方案中,所述与末端磷酸连接的第一个接头形成基团是叠氮基,且所述与多肽标记连接的第二个接头形成基团是炔烃。在其它实施方案中,所述与末端磷酸连接的第一个接头形成基团是炔烃基,且所述与多肽标记连接的第二个接头形成基团是叠氮化物。
在制备多肽标记的核苷酸的方法的某些实施方案中,所述与末端磷酸连接的第一个接头形成基团是四嗪,且所述与多肽标记连接的第二个接头形成基团是反式-环辛烯。在其它实施方案中,所述与末端磷酸连接的第一个接头形成基团是反式-环辛烯,且所述与多肽标记连接的第二个接头形成基团是四嗪。
多肽标记的核苷酸在纳米孔测序中的应用
本发明的多肽标记的核苷酸化合物可以用在已知的纳米孔测序方法中,其中随着互补核苷酸被链延伸酶(例如,聚合酶、连接酶)掺入(或在它被掺入和释放以后),纳米孔检测与互补核苷酸连接的标记的存在,所述链延伸酶位于所述纳米孔近侧且正在延伸靶核酸序列的互补引物。使用经标记的核苷酸进行纳米孔测序的一般方法、材料、装置和系统描述在美国专利公开号2013/0244340 A1、2013/0264207 A1、2014/0134616 A1、2015/0119259 A1和USSN 14/666,124(2015年3月23日提交)中,它们中的每一篇特此通过引用并入本文。本发明的多肽标记的核苷酸可以用在使用经标记的核苷酸进行核酸的纳米孔测序的这些一般方法中。
因而,在一个实施方案中,本发明提供了一种用于确定核酸的序列的方法,所述方法包括: (a)提供纳米孔测序组合物,其包含:膜,在所述膜的顺侧和反侧上的电极,其孔穿过所述膜延伸的纳米孔,与两个电极接触的电解质溶液,位于所述纳米孔附近的活性聚合酶,和与所述聚合酶形成复合物的引物链;(b)使所述纳米孔测序组合物与以下物质接触:(i)一条核酸链;和(ii)一组经标记的核苷酸,每种核苷酸具有不同的标记,其中当它位于所述纳米孔中时每种不同的标记造成跨所述电极的不同阻断电流水平,且所述组包含至少一种结构式(I)的化合物
N-P-L-T
(I)
其中,N是核苷;P是共价地连接至所述核苷的5’-O基团的寡磷酸,其中所述寡磷酸包含3-12个磷酸基团;L是共价地连接至所述寡磷酸的末端磷酸基团的接头;且T是共价地连接至所述接头的多肽标记,其中所述多肽具有总电荷且包含至少一个螺旋结构;和(d)随时间检测跨所述电极的电流水平,并与所述聚合酶掺入的不同的经标记的核苷酸(其与所述核酸序列互补)中的每一个关联,且由此确定所述核酸序列。
在确定核酸的序列的方法的某些实施方案中,所述经标记的核苷酸(各自具有不同的标记)的组包含至少一种含有式(II)的结构的化合物:
其中,“碱基”是天然存在的或非天然存在的核碱基;R选自H和OH;n是1-10;“接头”是包含2-100个原子的共价键合链的接头;且“多肽”是具有总电荷且包含至少一个螺旋结构的多肽标记。
当用在确定核酸的序列的方法中时,包含式(I)或(II)的结构的多肽标记的核苷酸化合物可以包括在本文别处公开的化合物实施方案的范围中的任一种。例如,式(I)的核苷(N)可以是当所述核苷共价地偶联至寡磷酸(P)(诸如三磷酸)时能够被链延伸酶(诸如聚合酶)掺入的任何核苷;且所述核苷可以包含天然存在的或非天然存在的核碱基和天然存在的或非天然存在的糖部分,诸如核糖或脱氧核糖基团。
经标记的核苷酸的组
如本文别处所述,使用纳米孔检测确定核酸的序列的方法通常需要经标记的核苷酸的组,每种核苷酸包含不同的与希望检测的核苷酸结合的标记。在用于对DNA链测序的标准实施方案中,所述方法需要至少四种标准脱氧核苷酸dA、dC、dG和dT的组,其中每种核苷酸具有连接的标记,在所述核苷酸被近侧链延伸酶掺入后,所述标记能够被纳米孔检测到,且此外其中所述标记的纳米孔检测可与其它三种标记中的每一种的纳米孔检测区分开,由此允许经由纳米孔检测对与所述标记结合的具体核苷酸的鉴别。通常,在所述组中的每种不同的经标记的核苷酸通过当它位于所述纳米孔中时在近侧链延伸酶催化的掺入事件过程中由所述标记诱导的独特纳米孔检测特征来区分。在可以用于区分经标记的核苷酸的单独的或组合的纳米孔检测特征中包括跨纳米孔检测系统的电极的阻断电流水平(在DC或AC电位下)和所述阻断电流的停留时间。因此,在某些实施方案中,本发明提供了经标记的核苷酸的组,每种核苷酸具有不同的标记,其中当它位于所述纳米孔中时每种不同的标记造成跨所述电极的不同阻断电流水平和/或不同的停留时间,且所述组包含至少一种结构式(I)的化合物
N-P-L-T
(I)
其中,N是核苷;P是共价地连接至所述核苷的5’-O基团的寡磷酸,其中所述寡磷酸包含3-12个磷酸基团;L是共价地连接至所述寡磷酸的末端磷酸基团的接头;且T是共价地连接至所述接头的多肽标记,其中所述多肽具有总电荷且包含至少一个螺旋结构。
在各自具有不同标记的经标记的核苷酸的组的某些实施方案中,所述组包含至少一种含有式(II)的结构的化合物:
其中,“碱基”是天然存在的或非天然存在的核碱基;R选自H和OH;n是1-10;“接头”是包含2-100个原子的共价键合链的接头;且“多肽”是具有总电荷且包含至少一个螺旋结构的多肽标记。
预见到,本发明的多肽标记的核苷酸可以用在具有非多肽标记的经标记的核苷酸的组中。例如,在某些实施方案中,所述经标记的核苷酸的组可以包含结构式(I)或(II)的多肽标记的核苷酸,且所述组中的其它经标记的核苷酸可以包含非多肽标记,其中所述非多肽标记是纳米孔可检测的化合物或聚合物,诸如寡核苷酸、聚乙二醇聚合物、碳水化合物或染料化合物。其它经标记的核苷酸组(诸如寡核苷酸-标记的核苷酸组)是本领域已知的(参见例如,美国专利公开号2013/0244340 A1、2013/0264207 A1、2014/0134616 A1、2015/0119259 A1和USSN 14/666,124(2015年3月23日提交),它们中的每一篇特此通过引用并入本文)。在所述经标记的核苷酸的组的某些实施方案中,所述组包含至少两种、至少三种或至少四种结构式(I)或结构式(II)的多肽标记的核苷酸化合物,其中所述组中的至少两种、至少三种或至少四种多肽标记的核苷酸化合物的每种不同肽标记具有可与所述组中的其它化合物区分开的纳米孔检测特征。用于确定纳米孔检测特征(诸如阻断电流和/或停留时间)的方法和技术是本领域已知的(参见例如,美国专利公开号2013/0244340 A1、2013/0264207 A1、2014/0134616 A1、2015/0119259 A1和USSN 14/666,124(2015年3月23日提交),它们中的每一篇特此通过引用并入本文),且包括方法诸如使用纳米孔阵列微芯片在DC或AC电压电势下的纳米孔静电捕获实验,如在本文实施例中所述。
因此,在某些实施方案中,本发明提供了经标记的核苷酸的组,其包含至少两种不同的多肽标记的核苷酸,每种核苷酸具有不同的多肽标记,其中所述至少两种不同的多肽标记表现出可辨别的阻断电流水平和/或停留时间。在经标记的核苷酸的组的某些实施方案中,所述至少两种不同的多肽标记的核苷酸包含结构(I)或结构(II)的化合物。在某些实施方案中,所述至少两种不同的多肽标记的核苷酸各自包含选自表4的不同多肽标记。在某些实施方案中,所述至少两种不同的多肽标记表现出相差至少10%、至少25%、至少50%或至少75%的阻断电流水平。使用任意合适的纳米孔检测方法可以做出阻断电流水平之间的差异的测量。例如,可以在纳米孔静电捕获实验中测量至少两种不同的多肽标记的核苷酸(各自具有不同的多肽标记)中的每一种的阻断电流,通常如在本文实施例中所述。
纳米孔装置
纳米孔装置以及在使用经标记的核苷酸的纳米孔检测应用(诸如纳米孔测序)中制备和使用它们的方法是本领域已知的(参见例如,美国专利号7,005,264 B2;7,846,738;6,617,113;6,746,594;6,673,615;6,627,067;6,464,842;6,362,002;6,267,872;6,015,714;5,795,782;和美国公开号2015/0119259、2014/0134616、2013/0264207、2013/0244340、2004/0121525和2003/0104428,它们中的每一篇特此通过引用整体并入)。在本文公开的实施例中也描述了可用于测量纳米孔检测的纳米孔装置。通常,所述纳米孔装置都包含被包埋在脂质双层膜中的孔形成蛋白,其中所述膜被固定化至或附着于包含孔或蓄池的固体衬底。所述纳米孔的孔穿过所述膜延伸,从而建立所述膜的顺侧和反侧之间的流体连接。通常,所述固体衬底包含选自聚合物、玻璃、硅和它们的组合的材料。另外,所述固体衬底包含邻近纳米孔的传感器、传感电路或与传感电路(任选地,互补金属氧化物半导体(CMOS)或场效应晶体管(FET)电路)偶联的电极。通常,在所述膜的顺侧和反侧上存在电极,其允许跨所述膜设定DC或AC电压电势,所述电压电势穿过所述纳米孔的孔产生基线电流(或开放电流水平)。标记(诸如本发明的多肽标记)的存在导致阻断该电流,且由此产生相对于可以测量的开放电流的阻断电流水平。
预见到,本发明的多肽标记的核苷酸化合物可以与宽范围纳米孔装置一起使用,所述纳米孔装置包含由天然存在的和非天然存在的(例如,经工程改造的或重组的)孔形成蛋白产生的纳米孔。本领域已知宽范围的可以用于产生纳米孔的孔形成蛋白,所述纳米孔可用于本发明的多肽标记的核苷酸的纳米孔检测。代表性的孔形成蛋白包括、但不限于α-溶血素、β-溶血素、γ-溶血素、气单胞菌溶素、溶细胞素、杀白细胞素、蜂毒肽、MspA孔蛋白和孔蛋白A。孔形成蛋白,来自金黄色葡萄球菌(Staphyloccocus aureus)的α-溶血素(在本文中也被称作“α-HL”),是孔形成蛋白类别中被研究得最多的成员之一,且已经广泛地用于制备纳米孔装置(参见例如,美国公开号2015/0119259、2014/0134616、2013/0264207和2013/0244340)。α-HL还已经被测序,克隆,使用宽范围的技术(包括定位诱变和化学标记)在结构上和在功能上广泛地表征(参见例如,Valeva等人(2001),和其中引用的参考文献)。α-HL单体的七聚体复合物自发地形成纳米孔,其嵌入脂质双层膜中并在其中建立孔。已经证实,包含6:1的天然α-HL:突变α-HL比例的α-HL七聚体可以形成纳米孔(参见例如,Valeva等人(2001),和其中引用的参考文献)。此外,已经用插入在众多位置的半胱氨酸残基置换来工程改造α-HL,从而允许通过马来酰亚胺接头化学作用对蛋白的共价修饰(文献同上)。例如,经工程改造的α-溶血素-C46 (“α-HL-C46”)包含K46C氨基酸残基置换,其允许使用普通点击反应化学用接头修饰,所述接头可以用于共价地连接链延伸酶(诸如聚合酶)。可替换地,使用如在实施例中所述的SpyCatcher/SpyTag缀合方法,可以用DNA-聚合酶共价地修饰α-HL七聚体。
因此,在某些实施方案中,本发明的经标记的核苷酸组合物可以与纳米孔装置一起使用,其中所述纳米孔包含七聚体α-HL复合物,其具有6:1的天然α-HL:α-HL的经修饰或工程化形式,其中所述经修饰的α-HL共价地缀合至链延伸酶,诸如DNA聚合酶。例如,可以用接头修饰经工程改造的α-HL-C46,从而允许使用四嗪-反式-环辛烯点击化学将DNA聚合酶的Bst2.0变体共价地连接至七聚体6:1纳米孔。这样的一个实施方案描述在2015年3月9日提交的美国临时申请号62/130,326中,其特此通过引用并入本文。
本文中提供的多肽标记的核苷酸和有关的方法可以与宽范围的链延伸酶(诸如本领域已知的聚合酶和连接酶)一起使用。可以与本发明的化合物和方法一起使用的示例性聚合酶包括核酸聚合酶诸如DNA聚合酶(例如,EC 2.7.7.7类的酶)、RNA聚合酶(例如,EC2.7.7.6或EC 2.7.7.48类的酶)、逆转录酶(例如,EC 2.7.7.49类的酶)和DNA连接酶(例如,EC 6.5.1.1类的酶)。在某些实施方案中,可与多肽标记的核苷酸一起使用的聚合酶是9oN聚合酶、大肠杆菌DNA聚合酶I、细菌噬菌体T4 DNA聚合酶、测序酶、耐热性DNA聚合酶、9oN聚合酶(外-)A485L/Y409V或Phi29 DNA聚合酶(φ29 DNA聚合酶)。在某些实施方案中,掺入多肽标记的核苷酸的链延伸酶包含来自嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)的DNA聚合酶。在某些实施方案中,是来自嗜热脂肪芽孢杆菌(B. stearothermophilus)的DNA聚合酶的大片段在一个实施方案中,所述聚合酶是DNA聚合酶Bst 2.0 (可商购得自New England BioLabs, Inc., Massachusetts, USA)。在一个实施方案中,所述聚合酶是Pol2 DNA聚合酶-D44A。
实施例
在以下代表性实施例中举例说明了本发明的不同特征和实施方案,它们意图是示例性的,而不是限制性的。本领域技术人员将容易地认识到,具体实施例仅仅是在此后的权利要求中更完全地描述的发明的示例。在申请中描述的每个实施方案和特征应当理解为可互换的且可与其中所含的每个实施方案组合。
实施例1:多肽标记的核苷酸的制备
本实施例解释了使用在表4中列出的任何多肽标记或用炔丙基或其它炔烃部分(例如,用N-端炔丙基-甘氨酸(“Pra”)氨基酸残基)修饰的任何多肽标记制备结构式(I)或(II)的任何多肽标记的核苷酸的一般方法。本实施例具体地举例说明了dT6P-接头-(EAAA)16-E5(其对应于下面所示的化合物(1))的制备中的步骤。
在69-聚体多肽标记(EAAA)-E5(其用N-端炔丙基-甘氨酸氨基酸残基修饰(例如,如在结构式(V)的化合物中))和显示为化合物(2)的叠氮化物-接头-修饰的核苷六磷酸dT6P-N3之间的叠氮基-炔烃点击反应中合成化合物(1)的多肽标记的核苷酸:
A. 合成dT6P-叠氮化物(化合物(2))
按照在图1中描绘的一般反应方案制备化合物(2)的叠氮化物-接头-修饰的核苷六磷酸(dT6P-N3)。该一般反应方案可以用于用己胺接头和叠氮基修饰任何核苷-六磷酸化合物dN6P。简而言之,将6-Fmoc-氨基己烷醇(1g, 2.94 mmol) (图1中的1)与无水乙腈(2x 20ml)共蒸发,并然后溶解在磷酸三乙酯(10 ml)中。向该冷却并搅拌的溶液中加入新鲜的经蒸馏的磷酰氯(phosphorous oxychloride)(550 μl, 5.88 mmol),并将混合物在0℃搅拌2小时。加入三丁基焦磷酸铵(5当量,15 mmol, 0.5 M的在无水DMF中的溶液)和三丁基胺(15mmol),并将该混合物搅拌20 min。将溶液用0.1 M三乙基碳酸氢铵缓冲液(TEAB, 200 ml,pH7.5)淬灭并调至pH ~7。将该溶液加载到Sephadex A-25柱上并使用0.1 M至1.0 M TEAB缓冲液(pH 7.0)梯度洗脱。将适当的级分收集,合并,和在SupelcosilTM LC-18-T(Supelco) 3 μM, 15 cm×4.6 mm上在反相HPLC上进一步纯化(HPLC参数:流动相: A, 8.6mM Et3N, 100 mM的HFIP在水中的溶液,在pH 8.1;B, 100%甲醇。从100%A/0%B开始在40分钟中达到0%A/100%B)。纯的三磷酸31P-NMR (D2O)表现出以下迁移:δ: -7.68 (d, 1P), -10.5 (d, 1P), -22.65 (t, 1P)。将产生的Fmoc-氨基己基三磷酸(200 mg, 0.35 mmol)(图1中的2)与无水乙腈(2X 10 ml)共蒸发,并然后溶解在无水DMF (3 ml)中。加入CDI (4当量,1.4 mmol),并将溶液在室温搅拌4 h。加入甲醇(6当量,85 μl),并进一步搅拌30min。向以上产物(3)中加入期望的2’-脱氧核苷-5’-三磷酸(dNTP, 三丁基铵盐, 0.5mmol)在DMF和MgCl2 (10当量, 3.5 mmol)中的溶液。将该反应混合物搅拌18 h,随后加入10%的三乙胺在水中的溶液(25 ml)以水解Fmoc基团和产生期望的接头-修饰过的核苷酸六磷酸化合物, dN6P-NH2 (图1中的4-7)。将反应混合物进一步搅拌16 h,并将沉淀的固体过滤和将溶液用乙醚萃取。将水层在反相HPLC (SupelcosilTM LC-C18-T (Sulpelco) 3.0 μm颗粒尺寸, 15 cm×4.6 mm)上使用下述参数浓缩和纯化:在4 min中100%A/0%B,然后线性梯度变至70%A/30%B保持30分钟,且最后在室温在1 ml/min的流速在0%A和100%B保持另外45 min;流动相: A, 0.1 M TEAA;B, 100%ACN)。基于下述迁移,可以通过31P-NMR表征dN6P-NH2产物:δ-10.63 (bs, 1P), -11.65 (bs, 1P), -23.35 (bm. 4P)。四种常用的接头-修饰的dN6P化合物的MALDI-TOF MS:dA6P-NH2: 832.02 (计算值829);dT6P-NH2: 825.97(计算值820);dG6P-NH2: 848.33 (计算值845);dC6P-NH2: 826.08 (计算值828.0)。
通过将dN6P-NH2 (10 μmol)溶解在0.1 M碳酸氢盐-碳酸盐缓冲液(500 μl, pH8.7)和叠氮基丁酸-NHS (25 μmol)在200 μl DMF中的溶液中,制备期望的叠氮化物-修饰的化合物dN6P-N3 (图1中的8-11)。将该反应混合物搅拌过夜,然后使用上面关于dN6P-NH2化合物描述的相同HPLC参数和条件通过HPLC纯化。四种常用的叠氮化物-修饰的dN6P化合物的MALDI-TOF MS: dA6P-N3: 963.75 (作为Na+盐计算值963.3);dT6P-N3: 934.58 (计算值932.3);dG6P-N3: 960.27 (计算值957.4);dC6P-N3: 919.09 (计算值917.4)。
B. 合成炔丙基修饰的多肽标记, Pra-(EAAA)-E5
使用自动化的Multisyntech多重肽合成仪(multiple peptide synthesizer)借助于在TentaGel®S PHB树脂上的芴基甲氧羰基(Fmoc)固相肽合成,合成N-端炔丙基-甘氨酸修饰的多肽标记, Pra-(EAAA)-E5。将4.0当量的每种使用的氨基酸衍生物(即,Fmoc-Pra-OH、Fmoc-Ala-OH、Fmoc-Glu(OtBu)-OH)溶解在含有1当量的1-羟基-7-氮杂苯并三唑的N-甲基吡咯烷酮中。在作为反应介质的二甲基甲酰胺(DMF)中进行偶联反应5分钟,所述反应介质含有相对于树脂负载而言4当量的HATU和8当量的N,N-二异丙基乙胺。使用25%的哌啶在DMF中的溶液在每个合成步骤以后在8分钟内切割Fmoc基团。在室温用9.5 mL三氟乙酸、0.25mL三异丙基硅烷和0.25 mL水在3小时中实现所述多肽从合成树脂的释放和酸不稳定的保护基的切割。随后将反应溶液与冷却的二异丙醚混合以沉淀所述多肽。将沉淀物过滤,用二异丙醚再次洗涤,溶解在少量乙酸或NaOH水溶液中并低压冻干。将得到的粗制物质使用含有0.1%三氟乙酸的乙腈/水的梯度通过制备型RP-HPLC纯化。借助于离子喷射质谱法证实纯化的炔丙基修饰的多肽标记Pra-(EAAA)-E5的身份:ESI-MS计算: M+ = 6237.4;ESI-MS预期: [M+4H]4+ = 1559.7。
使用本实施例的合成方法制备的多种炔丙基修饰的多肽标记显示在表5中。用于合成各种多肽标记的氨基酸衍生物包括Fmoc-Pra-OH、Fmoc-Ala-OH、Fmoc Glu(OtBu)-OH、Fmoc-Pro-OH、Fmoc-Lys(Boc)-OH、Fmoc-β-Ala-OH和Fmoc-Gla(OtBu)2-OH。
C. dT6P-叠氮化物和Pra-(EAAA)-E5的点击反应
根据在图1的最终步骤中所示的相同的一般方案,可以进行叠氮基-炔烃点击反应以形成化合物(1)的多肽标记的核苷酸, dT6P-接头-(EAAA)16-E5,其中与期望的dN6P-N3化合物(图1中的8-11)连接的“TAG”是多肽标记。在所述多肽标记的N-端处的炔丙基-甘氨酸(“Pra”)残基会提供炔烃基,其经历与核苷酸上的叠氮基的点击反应以形成将核苷酸dN6P连接至经修饰的多肽标记Pra-(EAAA)16-E5的N-端炔丙基的共价键(经由三唑部分的形成)。
简而言之,将水溶液(0.7 mL) Pra-多肽标记、Pra-(EAAA)-E5 (400 nmol)、dT6P-叠氮化物(1200 nmol)、预混合的CuSO4/THPTA (6µmol/30µmol)和抗坏血酸钠(8µmol)在40℃摇动过夜。加入EDTA,并将所述混合物通过透析脱盐。通过制备型RP-HPLC用三乙基乙酸铵/乙腈梯度纯化点击-反应产物, dT6P-接头-(EAAA)-E5。将含有纯缀合物的级分合并,并通过离心真空浓缩进行干燥以得到白色固体。通过离子喷射质谱法证实多肽标记的核苷酸dT6P-接头-(EAAA)-E5的形成:ESI-MS计算: m/z = 7168.8;ESI-MS预期: m/z = 7169.2。
还使用下述炔丙基修饰的多肽标记进行根据上述的方法形成多肽标记的dT6P的点击反应:Pra-(EAAA)13-E5、Pra-(EAAA)10-E5和Pra-(EAAA)8-P-(EAAA)8-E5。通过下面显示的离子喷射质谱法分析来证实这些反应中的每一个对预期的式(II)的多肽标记的核苷酸化合物的形成:
dT6P-叠氮化物+ Pra-(EAAA)13-E5的反应的结果: ESI-MS计算: m/z = 6141.7;ESI-MS预期: m/z = 6141.7。
dT6P-叠氮化物+ Pra-(EAAA)10-E5的反应的结果: ESI-MS计算: m/z = 5114.7;ESI-MS预期: m/z = 5115.1。
dT6P-叠氮化物+ Pra-(EAAA)8-P-(EAAA)8-E5的反应的结果: ESI-MS计算: m/z =7265.9;ESI-MS预期: m/z = 7267.1。
实施例2:多肽标记的核苷酸的纳米孔检测
本实施例解释了使用具有纳米孔阵列微芯片检测系统的“静电捕获”实验检测和测量在实施例1中制备的多肽标记的核苷酸dT6P-接头-(EAAA)16-E5 (化合物(1))的阻断电流和停留时间特征。在所述“静电捕获”实验中,互补的多肽标记的核苷酸与缀合在纳米孔近侧的聚合酶形成活性部位三元复合物,但是由于要求的催化性Mg2+阳离子的缺失未被聚合酶掺入。但是,所述多肽标记能够进入所述纳米孔的孔中并停留在其中。由于纳米孔系统的电极是在DC或AC电位下,所述标记在纳米孔中的存在产生可检测的阻断电流。
纳米孔检测系统:
使用包含约1x1 mm CMOS微芯片的纳米孔阵列微芯片执行纳米孔阻断电流测量,所述CMOS微芯片具有在浅孔内的264个银电极(5 μm直径)的阵列(由Genia Technologies,Mountain View, CA, USA制造的芯片)。关于制造和使用这样的纳米孔阵列微芯片的方法还可以参见美国专利申请公开号2013/0244340 A1、US 2013/0264207 A1和US2014/0134616 A1,它们中的每一篇特此通过引用并入本文。使用标准的CMOS工艺制造所述阵列中的每个孔,其中进行表面修饰以允许与生物学试剂和传导性盐的恒定接触。每个孔可以支持磷脂双层膜,其具有嵌入其中的纳米孔-聚合酶缀合物。在每个孔处的电极可通过计算机接口单独寻址。使用计算机控制的注射泵将使用的所有试剂引入在阵列微芯片上面的简单流动池中。所述芯片支持模拟至数字转换并以超过1000点/秒的速率独立地报告来自所有电极的电测量。可以在所述阵列中在264个可寻址的含有纳米孔的膜中的每一个处以每毫秒(msec)至少一次异步地做出纳米孔阻断电流测量,并记录在接口的计算机上。
脂质双层在芯片上的形成:使用1,2-二植烷酰基-sn-甘油-3-磷酸胆碱(AvantiPolar Lipids)制备在芯片上的磷脂双层膜。将脂质粉末以15 mM溶解在癸烷中,并然后在芯片上的264个孔上涂层。然后通过穿过阵列孔的顺侧泵送空气开始薄化工艺,从而将多层脂质膜减小至单个双层。使用0-1000 mV的渐变电压试验双层形成。典型的单个双层在300-500 mV之间的施加电压暂时地开放。
纳米孔-聚合酶缀合物的制备:酿脓链球菌(Streptococcus pyogenes)纤连蛋白-结合蛋白FbaB的胶原附着结构域(CnaB2)的2个片段可以彼此特异性地结合并产生在一个片段(即,“SpyCatcher”)的赖氨酸的ε-氨基基团和另一个片段(即,“SpyTag”)的天冬氨酸的羧基侧基之间的肽键。在本实施例中,所述SpyTag片段经由短肽接头连接至具有H144A突变的α-HL单体的N-端,且所述SpyCatcher片段经由类似的短肽接头连接至具有D44A突变的Pol2 DNA聚合酶的N-端。将具有和没有SpyTag的α-HL单体混合,从而允许七聚体纳米孔的组装,并通过色谱法纯化具有仅一个SpyTag-修饰的α-HL单体的那些七聚体纳米孔以提供期望的6:1α-HL纳米孔。然后将6:1α-HL纳米孔溶液与SpyCatcher-修饰的Pol2 DNA聚合酶-D44A组合以形成6:1α-HL-Pol2缀合物。
纳米孔-聚合酶缀合物插入在膜中:在芯片的256个孔上形成脂质双层以后,将3 μM的化合物(1)的多肽标记的核苷酸、0.1 μM的6:1α-HL-Pol2纳米孔-聚合酶缀合物、0.4 μM的期望的“JAM1A”DNA模板(都在3 mM CaCl2、20 mM Hepes和300 mM NaCl的缓冲溶液pH7.5 (对于DC模式)或500 mM谷氨酸钾pH8 (对于AC模式)中,在20℃)加到芯片的顺侧。所述混合物中的纳米孔-聚合酶缀合物自发地插入脂质双层中。由于仅Ca2+且无Mg2+ 金属离子存在,在DNA聚合酶处的三元复合物能够在活性部位处形成,但是所述核苷酸未被掺入,并且5’-磷酸-连接的标记未被释放。
“JAM1A”DNA模板是一种99-聚体自引发单链。该DNA模板在用于结合互补dT核苷酸的模板上具有第一个可利用的位置。
纳米孔阻断电流测量:用于插入纳米孔缀合物和DNA模板(300 mM NaCl, pH 7.5(对于DC模式)或500 mM谷氨酸钾, pH 8 (对于AC模式), 3 mM CaCl2, 20 mM Hepes,在20℃)的相同缓冲溶液也用作纳米孔电流阻断测量的电解质溶液。对于DC模式,跨芯片板在放置于膜和孔的任一侧上的两个Ag/AgCl电极之间施加100 mV (顺侧相对于反侧)电压。对于AC模式,使用Pt/Ag/AgCl电极设置,并施加-10 mV至200 mV正方形波形。
图2显示了以DC模式进行的静电捕获实验的结果。在跨孔施加电压下,描绘了多肽标记的核苷酸的众多电流阻断事件。图2显示了基于阻断电流事件的2个可检测特征的图:(1)作为孔的背景电流或“开放电流”(“O.C.”)的百分比的阻断电流,和(2)以毫秒为单位的平均停留时间。将针对每种不同的经标记的核苷酸观察到的电流阻断事件停留时间的直方图拟合至指数函数y= A e-Bx,并将常数B的倒数用作计算的平均停留时间。认为具有长于10ms的平均停留时间和低于开放电流的60%的阻断电流的电流阻断事件指示与纳米孔缀合的聚合酶对经标记的核苷酸的产生性捕获(即,经标记的核苷酸与在聚合酶活性部位处的互补模板碱基和位于邻近孔中的经标记的核苷酸的“尾巴”的结合)。
结果:化合物(1)的多肽标记的核苷酸dT6P-接头-(EAAA)16-E5表现出开放电流的17%的一致高的阻断电流,具有1.7%的低方差。平均停留时间是975 ms,其显著地长于针对在纳米孔检测实验中使用的其它类型的标记(诸如30-聚体寡核苷酸,其表现出在15-30 ms范围内的平均停留时间)观察到的停留时间。
实施例3:在交流电(AC)条件下对不同的多肽标记的核苷酸的纳米孔捕获
本实施例解释了使用AC电压在纳米孔检测“静电捕获”下对四种多肽标记的核苷酸的阻断电流特征的测量和对比,并对比了具有螺旋结构和不同总电荷的三种多肽标记的核苷酸dT6P-接头-(EAAA)16-E5、dT6P-接头-(EAAA)13-E5和dT6P-接头-(EAAA)8-P-(EAAA)8-E5的阻断电流,主要具有无规则卷曲结构的多肽标记的核苷酸dT6P-接头-(UE)25-生物素的阻断电流。
根据在实施例1中描述的方法,经由dT6P-N3和对应的炔丙基修饰的多肽标记Pra-(EAAA)16-E5和(炔丙基)K(UE)25-生物素之间的点击反应,制备两种多肽标记的核苷酸。所述纳米孔检测系统是264纳米孔阵列微芯片,其具有插入在膜中的纳米孔-聚合酶缀合物,其与在实施例2中所述的JAM1A DNA模板形成复合物。纳米孔孔溶液是500 mM谷氨酸钾(KGlu), 3 mM CaCl2, 20 mM HEPES, pH 8,并且跨膜电极施加210 mV峰至峰的AC电压,而不是100 mV DC电压。
如本文别处指出的,AC电流对于纳米孔检测而言可以具有某些优点,因为它允许多肽标记被重复地导入纳米孔并然后从纳米孔排出,由此提供更多机会来检测所述标记。AC电流也可以随时间为更稳定的电流信号和更少的电极降解提供更稳定的电位。
先后将第一种dT6P-接头-(EAAA)16-E5和dT6P-接头-(UE)25-生物素的3 μM溶液加入到芯片的顺侧,并测量两种多肽标记的核苷酸的捕获事件的明显不同的阻断电流和相对于时间绘图。得到的图显示在图3中。dT6P-接头-(EAAA)16-E5的纳米孔捕获导致约50%O.C.的高得多的阻断电流,而dT6P-接头-(UE)25-生物素的纳米孔捕获导致约80-90%O.C.的显著更低的阻断电流(注:较低的开放电流百分比指示较高的开放电流阻断,因此指示较高的阻断电流)。因而,具有两种不同多肽标记的多肽标记的核苷酸能够在对于核酸测序有用的纳米孔阵列检测条件下提供非常可辨别的阻断电流。
另外,在具有螺旋结构的其它多肽标记的核苷酸dT6P-接头-(EAAA)13-E5和dT6P-接头-(EAAA)8-P-(EAAA)8-E5上进行的纳米孔静电捕获测量产生了类似的结果。二者表现出与dT6P-接头-(EAAA)16-E5(其具有类似的螺旋结构)的阻断电流类似的50-55%O.C.的高阻断电流。

Claims (16)

1.结构式(I)的化合物
N-P-L-T
(I)
其中,
N是核苷;
P是共价地连接至所述核苷的5’-O基团的寡磷酸,其中所述寡磷酸由3-12个磷酸基团组成;
L是共价地连接至所述寡磷酸的末端磷酸基团的接头;且
T是共价地连接至所述接头的多肽标记,其中所述多肽具有总电荷且包含至少一个螺旋结构。
2.根据权利要求1所述的化合物,其中所述化合物包含结构式(II):
其中,
碱基选自腺苷、胞苷、鸟苷、胸苷和尿苷;
R选自H和OH;
n是1-4;
接头是包含2-100个原子的共价键合链的接头;且
多肽是包含总电荷和至少一个螺旋结构的多肽标记。
3.根据权利要求1或2所述的化合物,其中所述多肽标记的长度是至少16个氨基酸残基,任选地其中所述多肽标记的长度是至少20个氨基酸残基、至少25个氨基酸残基、至少30个氨基酸残基、至少40个氨基酸残基、至少50个氨基酸残基、至少60个氨基酸残基、至少70个氨基酸残基、至少80个氨基酸残基或至少90个氨基酸残基。
4.根据权利要求1或2所述的化合物,其中所述螺旋结构包含至少8个氨基酸残基,任选地其中所述多肽螺旋结构包含至少16个氨基酸残基、至少20个氨基酸残基、至少25个氨基酸残基、至少30个氨基酸残基、至少40个氨基酸残基、至少50个氨基酸残基或至少60个氨基酸残基。
5.根据权利要求1或2所述的化合物,其中所述螺旋结构是α-螺旋,任选地其中所述α-螺旋的长度是至少10个氨基酸残基、至少16个氨基酸残基、至少20个氨基酸残基、至少25个氨基酸残基、至少30个氨基酸残基或至少40个氨基酸残基。
6.根据权利要求5所述的化合物,其中所述α-螺旋包含至少3个氨基酸残基的序列基序的至少2个重复,任选地其中所述序列基序包含至少4个氨基酸残基、至少5个氨基酸残基或至少6个氨基酸残基。
7.根据权利要求6所述的化合物,其中所述重复未被不形成螺旋的氨基酸残基中断。
8.根据权利要求6所述的化合物,其中所述氨基酸序列基序选自由以下成员组成的基序组:EAAA、AEAA、AAEA、AAAE、DAAA、ADAA、AADA、AAAD、RAAA、ARAA、AARA、AAAR、KAAA、AKAA、AAKA和AAAK。
9.根据权利要求1或2所述的化合物,其中所述多肽的总电荷标记是负的,任选地其中所述多肽标记的总电荷是在约-10和-30之间。
10.根据权利要求1或2所述的化合物,其中25%的位于所述多肽标记的接头远侧末端处的氨基酸残基具有这样的净电荷绝对值:其大于25%的位于所述多肽标记的接头近侧末端处的氨基酸残基的净电荷绝对值。
11.根据权利要求1或2所述的化合物,其中P由3-9个磷酸基团组成,任选地由4-6个磷酸基团组成,或任选地由6个磷酸基团组成。
12.根据权利要求1或2所述的化合物,其中所述接头包含选自以下的化学基团:酯、醚、硫醚、胺、酰胺、酰亚胺、碳酸酯、氨基甲酸酯、方酸酯、噻唑、噻唑烷、腙、肟、三唑、二氢哒嗪、磷酸二酯、聚乙二醇(PEG)和它们的组合。
13.一种制备结构式(II)的多肽标记的核苷酸化合物的方法,
其中,
碱基选自腺苷、胞苷、鸟苷、胸苷和尿苷;
R选自H和OH;
n是1-4;
接头是包含2-100个原子的共价键合链的接头;且
多肽是包含总电荷和至少一个螺旋结构的多肽标记
所述方法包括:
(a) 提供(i)在其5’-位置连接有3-12个磷酸的核苷酸,其中所述末端磷酸偶联至第一个接头形成基团;和(ii)多肽标记,其中所述多肽标记包含至少一个螺旋结构,具有总电荷,且偶联至第二个接头形成基团,所述第二个接头形成基团能够与所述第一个接头形成基团反应以形成接头;
其中
- 所述第一个接头形成基团选自结构式(IVa) - (XVIIa)的化合物,且所述第二个接头形成基团是结构式(IVb) - (XVIIb)的对应的反应性化合物;或者
- 所述第一个接头形成基团选自结构式(IVb) - (XVIIb)的化合物,且所述第二个接头形成基团是结构式(IVa) - (XVIIa)的对应的反应性化合物;和
(b)使所述第一个接头形成基团与所述第二个接头形成基团反应,由此形成所述核苷酸与所述多肽标记之间的共价键。
14.根据权利要求13所述的方法,其中(1)所述第一个接头形成基团选自炔烃和二烯,且所述第二个接头形成基团选自叠氮化物和四嗪;或(2)所述第一个接头形成基团选自叠氮化物和四嗪,且所述第二个接头形成基团选自炔烃和二烯。
15.包含经标记的核苷酸的组的组合物,每种核苷酸具有不同的标记,其中当它位于纳米孔中时每种不同的标记造成不同的阻断电流,且所述组包含至少一种权利要求1-15中的任一项所述的化合物。
16.一种用于确定核酸序列的方法,所述方法包括:
(a)提供纳米孔测序组合物,其包含:膜,在所述膜的顺侧和反侧上的电极,其孔穿过所述膜延伸的纳米孔,与两个电极接触的电解质溶液,位于所述纳米孔附近的活性聚合酶,和与所述聚合酶形成复合物的引物链;
(b)使所述纳米孔测序组合物与以下物质接触:(i)一条核酸链;和(ii)一组经标记的核苷酸,每种核苷酸具有不同的标记,其中当它位于所述纳米孔中时每种不同的标记造成不同的阻断电流和/或阻断电流和/或具有不同的停留时间,且所述组包含至少一种权利要求1-15中的任一项所述的化合物;和
(c)随时间检测所述标记的不同的阻断电流和/或阻断电压和/或不同的停留时间,并与所述聚合酶掺入的不同的经标记的核苷酸中的每一个关联,且由此确定所述核酸序列,其中所述不同的经标记的核苷酸与所述核酸序列互补。
CN201680065780.5A 2015-09-10 2016-08-26 多肽标记的核苷酸及其在通过纳米孔检测的核酸测序中的用途 Active CN108350017B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562216634P 2015-09-10 2015-09-10
US62/216634 2015-09-10
PCT/EP2016/070198 WO2017042038A1 (en) 2015-09-10 2016-08-26 Polypeptide tagged nucleotides and use thereof in nucleic acid sequencing by nanopore detection

Publications (2)

Publication Number Publication Date
CN108350017A true CN108350017A (zh) 2018-07-31
CN108350017B CN108350017B (zh) 2022-03-15

Family

ID=56855435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680065780.5A Active CN108350017B (zh) 2015-09-10 2016-08-26 多肽标记的核苷酸及其在通过纳米孔检测的核酸测序中的用途

Country Status (6)

Country Link
US (3) US10975426B2 (zh)
EP (2) EP3347366A1 (zh)
JP (2) JP2018526418A (zh)
CN (1) CN108350017B (zh)
CA (1) CA2998206A1 (zh)
WO (1) WO2017042038A1 (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3347366A1 (en) * 2015-09-10 2018-07-18 H. Hoffnabb-La Roche Ag Polypeptide tagged nucleotides and use thereof in nucleic acid sequencing by nanopore detection
WO2017132567A1 (en) 2016-01-28 2017-08-03 Roswell Biotechnologies, Inc. Massively parallel dna sequencing apparatus
CN109071212A (zh) 2016-01-28 2018-12-21 罗斯韦尔生物技术股份有限公司 使用大规模分子电子传感器阵列测量分析物的方法和装置
EP3414784B1 (en) 2016-02-09 2021-04-14 Roswell Biotechnologies, Inc Electronic label-free dna and genome sequencing
US10597767B2 (en) 2016-02-22 2020-03-24 Roswell Biotechnologies, Inc. Nanoparticle fabrication
WO2017202917A1 (en) 2016-05-27 2017-11-30 F. Hoffmann-La Roche Ag Tagged multi-nucleotides useful for nucleic acid sequencing
US9829456B1 (en) 2016-07-26 2017-11-28 Roswell Biotechnologies, Inc. Method of making a multi-electrode structure usable in molecular sensing devices
US10669580B2 (en) 2016-08-26 2020-06-02 Roche Sequencing Solutions, Inc. Tagged nucleotides useful for nanopore detection
KR102622275B1 (ko) 2017-01-10 2024-01-05 로스웰 바이오테크놀로지스 인코포레이티드 Dna 데이터 저장을 위한 방법들 및 시스템들
KR20230158636A (ko) 2017-01-19 2023-11-20 로스웰 바이오테크놀로지스 인코포레이티드 2차원 레이어 재료를 포함하는 솔리드 스테이트 시퀀싱 디바이스들
JP6977058B2 (ja) 2017-04-12 2021-12-08 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft ピクテ・スペングラー反応を介して得られたタグ付けヌクレオシドを用いたシーケンシング反応のための方法
CA3057151A1 (en) * 2017-04-25 2018-11-01 Roswell Biotechnologies, Inc. Enzymatic circuits for molecular sensors
US10508296B2 (en) 2017-04-25 2019-12-17 Roswell Biotechnologies, Inc. Enzymatic circuits for molecular sensors
CA3057155A1 (en) 2017-05-09 2018-11-15 Roswell Biotechnologies, Inc. Binding probe circuits for molecular sensors
CN111373049A (zh) 2017-08-30 2020-07-03 罗斯威尔生命技术公司 用于dna数据存储的进行性酶分子电子传感器
SG11201911977VA (en) * 2017-09-15 2020-01-30 Illumina Inc Tuning and calibration features of a sequence-detection system
WO2019075100A1 (en) 2017-10-10 2019-04-18 Roswell Biotechnologies, Inc. METHODS, APPARATUS AND SYSTEMS FOR STORING DNA DATA WITHOUT AMPLIFICATION
WO2019158548A1 (en) * 2018-02-15 2019-08-22 F. Hoffmann-La Roche Ag Nanopore protein conjugates for detection and analysis of analytes
MX2019015011A (es) * 2018-02-16 2021-01-08 Illumina Inc Nucleótidos etiquetados con carga y métodos de uso de los mismos.
EP3759116A1 (en) 2018-02-28 2021-01-06 F. Hoffmann-La Roche AG Tagged nucleoside compounds useful for nanopore detection
JP7155544B2 (ja) * 2018-03-02 2022-10-19 東洋紡株式会社 ポリカルボン酸誘導体
US20220099615A1 (en) * 2019-01-18 2022-03-31 Universal Sequencing Technology Corporation Devices, Methods, and Chemical Reagents for Biopolymer Sequencing
CN112147185B (zh) * 2019-06-29 2022-07-01 清华大学 一种控制多肽穿过纳米孔速度的方法及其应用
JP2023513128A (ja) 2020-02-06 2023-03-30 エフ. ホフマン-ラ ロシュ アーゲー ナノポアへの鋳型の貫通を低減する組成物
WO2022033998A1 (en) 2020-08-11 2022-02-17 F. Hoffmann-La Roche Ag Nucleoside-5'-oligophosphates tagged with positively-charged polymers, nanopores incorporating negative charges, and methods and systems using the same
EP4355757A1 (en) 2021-06-17 2024-04-24 F. Hoffmann-La Roche AG Nucleoside-5 -oligophosphates having a cationically-modified nucleobase
EP4355912A1 (en) 2021-06-17 2024-04-24 F. Hoffmann-La Roche AG Engineered nanopore with a negatively charged polymer threaded through the channel

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005024380A2 (en) * 2003-09-03 2005-03-17 Robert Gellibolian Method and system for assaying transferase activity
US20130264207A1 (en) * 2010-12-17 2013-10-10 Jingyue Ju Dna sequencing by synthesis using modified nucleotides and nanopore detection
US8652779B2 (en) * 2010-04-09 2014-02-18 Pacific Biosciences Of California, Inc. Nanopore sequencing using charge blockade labels

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5795782A (en) 1995-03-17 1998-08-18 President & Fellows Of Harvard College Characterization of individual polymer molecules based on monomer-interface interactions
US6362002B1 (en) 1995-03-17 2002-03-26 President And Fellows Of Harvard College Characterization of individual polymer molecules based on monomer-interface interactions
US6267872B1 (en) 1998-11-06 2001-07-31 The Regents Of The University Of California Miniature support for thin films containing single channels or nanopores and methods for using same
EP1192453B1 (en) 1999-06-22 2012-02-15 President and Fellows of Harvard College Molecular and atomic scale evaluation of biopolymers
US6464842B1 (en) 1999-06-22 2002-10-15 President And Fellows Of Harvard College Control of solid state dimensional features
AU783675B2 (en) 1999-09-07 2005-11-24 Regents Of The University Of California, The Methods of determining the presence of double stranded nucleic acids in a sample
US20030104428A1 (en) 2001-06-21 2003-06-05 President And Fellows Of Harvard College Method for characterization of nucleic acid molecules
US7005264B2 (en) 2002-05-20 2006-02-28 Intel Corporation Method and apparatus for nucleic acid sequencing and identification
US6870361B2 (en) 2002-12-21 2005-03-22 Agilent Technologies, Inc. System with nano-scale conductor and nano-opening
WO2005017025A2 (en) 2003-08-15 2005-02-24 The President And Fellows Of Harvard College Study of polymer molecules and conformations with a nanopore
WO2013109970A1 (en) 2012-01-20 2013-07-25 Genia Technologies, Inc. Nanopore based molecular detection and sequencing
JP6456816B2 (ja) * 2012-04-09 2019-01-23 ザ・トラスティーズ・オブ・コランビア・ユニバーシティー・イン・ザ・シティー・オブ・ニューヨーク ナノ細孔の調製方法およびその使用
EP3674412A1 (en) 2012-06-20 2020-07-01 The Trustees of Columbia University in the City of New York Nucleic acid sequencing by nanopore detection of tag molecules
US9605309B2 (en) 2012-11-09 2017-03-28 Genia Technologies, Inc. Nucleic acid sequencing using tags
EP3347366A1 (en) * 2015-09-10 2018-07-18 H. Hoffnabb-La Roche Ag Polypeptide tagged nucleotides and use thereof in nucleic acid sequencing by nanopore detection

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005024380A2 (en) * 2003-09-03 2005-03-17 Robert Gellibolian Method and system for assaying transferase activity
US8652779B2 (en) * 2010-04-09 2014-02-18 Pacific Biosciences Of California, Inc. Nanopore sequencing using charge blockade labels
US20130264207A1 (en) * 2010-12-17 2013-10-10 Jingyue Ju Dna sequencing by synthesis using modified nucleotides and nanopore detection

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BRADFORD W. GIBSON,等: "Mass Spectrometric Characterization of a Series of Adenosylated Peptides Acting as Bisubstrate Analogs of Protein Kinases", 《J AM SOCMASS SPECTROM》 *
KAROLINA PIECYK,等: "Chemical conjugation of an mRNA cap analogue with a cell-penetrating peptide as a potential membrane permeable translation inhibitor", 《TETRAHEDRON LETTERS》 *
RADU STEFUREAC,等: "Transport of R-Helical Peptides through R-Hemolysin and Aerolysin Pores", 《BIOCHEMISTRY》 *

Also Published As

Publication number Publication date
US20240209432A1 (en) 2024-06-27
EP4303314A3 (en) 2024-04-17
CN108350017B (zh) 2022-03-15
US11739378B2 (en) 2023-08-29
US10975426B2 (en) 2021-04-13
JP2018526418A (ja) 2018-09-13
CA2998206A1 (en) 2017-03-16
JP2021176895A (ja) 2021-11-11
EP4303314A2 (en) 2024-01-10
EP3347366A1 (en) 2018-07-18
JP7221341B2 (ja) 2023-02-20
US20220090189A1 (en) 2022-03-24
US20190002968A1 (en) 2019-01-03
WO2017042038A1 (en) 2017-03-16

Similar Documents

Publication Publication Date Title
CN108350017A (zh) 多肽标记的核苷酸及其在通过纳米孔检测的核酸测序中的用途
US11845780B2 (en) Mutant lysenin pores
US11939359B2 (en) Mutant pore
EP3259281B1 (en) Hetero-pores
JP2002530059A (ja) 輸送ベクター
HU218007B (hu) Eljárás random bio-oligomer könyvtár előállítására valamint, alkalmazására
JP6959251B2 (ja) ナノポアシステムに有用な部位特異的バイオコンジュゲーション方法および組成物
US20050079546A1 (en) Serum albumin scaffold-based proteins and uses thereof
WO2013166234A1 (en) Modified prokaryotic ubiquitin-like protein and methods of use thereof
EP0453556A1 (en) Pneumocystis carinii dihydrofolate reductase gene and methods for its use
EP4397970A2 (en) Mutant pore
US5164490A (en) Pneumocystis carinii dihydrofolate reductase gene and methods for its use
Rubin et al. The current state of backbone cyclic peptidomimetics and their application to drug discovery
EP0872555A1 (en) Bacterial peptide library
CN118326019A (zh) 突变体孔
CN118326018A (zh) 突变体孔
CN118256605A (zh) 突变体孔
MX9709747A (es) Serpina novedosa derivada de hipotalamo humano.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant