CN109312401B - 连接的核酸的纳米孔测序方法 - Google Patents

连接的核酸的纳米孔测序方法 Download PDF

Info

Publication number
CN109312401B
CN109312401B CN201780032978.8A CN201780032978A CN109312401B CN 109312401 B CN109312401 B CN 109312401B CN 201780032978 A CN201780032978 A CN 201780032978A CN 109312401 B CN109312401 B CN 109312401B
Authority
CN
China
Prior art keywords
polynucleotide
leu
ala
gly
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780032978.8A
Other languages
English (en)
Other versions
CN109312401A (zh
Inventor
安德鲁·约翰·赫伦
丹尼尔·赖安·加拉尔达
詹姆斯·怀特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oxford Nanopore Technology Public Co ltd
Original Assignee
Oxford Nanopore Technology Public Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oxford Nanopore Technology Public Co ltd filed Critical Oxford Nanopore Technology Public Co ltd
Publication of CN109312401A publication Critical patent/CN109312401A/zh
Application granted granted Critical
Publication of CN109312401B publication Critical patent/CN109312401B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/30Oligonucleotides characterised by their secondary structure
    • C12Q2525/301Hairpin oligonucleotides

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及使用孔表征两种或更多种靶多核苷酸的新方法。该方法包括将一个或多个后续多核苷酸顺序连接到第一多核苷酸上以形成连接的多核苷酸。

Description

连接的核酸的纳米孔测序方法
技术领域
本发明涉及使用孔表征两种或更多种靶多核苷酸的新方法。
背景技术
当前在广泛的应用范围内需要快速且便宜的核酸(例如DNA或RNA)测序和鉴定技术。现有技术缓慢且昂贵,主要是因为它们依赖于扩增技术来产生大量多核苷酸并且需要大量用于信号检测的专用荧光化学品。
跨膜孔(纳米孔)作为聚合物和各种小分子的直接电子生物传感器具有巨大的潜力。具体地,最近关注作为潜在的DNA测序技术的纳米孔。
当跨纳米孔施加电势时,当如核苷酸等分析物在桶中暂时停留一段时间时,电流会发生变化。纳米孔检测核苷酸给出已知特征和持续时间的电流变化。在链测序方法中,使单个多核苷酸链通过孔并且衍生出核苷酸的同一性。链测序可以涉及使用分子刹车来控制移动所述多核苷酸通过孔。
发明内容
本发明人惊奇地证明,通过将靶多核苷酸顺序连接在一起形成连接的多核苷酸,可以提高两种或多种靶多核苷酸的基于跨膜孔的表征的效率。如果第二靶多核苷酸与第一多核苷酸的结合选择性地发生,即仅在第一靶多核苷酸移动通过孔时发生结合,则第二靶多核苷酸与孔接触所花费的时间减少并且避免了在没有孔的情况下存在于样品中的靶多核苷酸的结合。仅当第一靶多核苷酸移动通过孔时才实现靶多核苷酸的连接。这是重要的,因为溶液中靶多核苷酸的连接将导致可被孔捕获的自由端数量的减少。
因此,本发明提供了表征两种或更多种靶多核苷酸的方法。该方法包括将一个或多个后续多核苷酸依次连接到第一多核苷酸上以形成连接的多核苷酸。方法包含:
(a)使第一靶多核苷酸与膜中的跨膜孔接触,使得第一靶多核苷酸移动通过孔;
(b)顺序地将一个或多个后续靶多核苷酸连接到第一靶多核苷酸上以提供连接的多核苷酸,其中靶多核苷酸以连接顺序移动通过孔,其中在前靶多核苷酸移动通过孔时后续靶多核苷酸以连接顺序选择性地连接到前一靶多核苷酸上;和
(c)进行一次或多次测量,其指示连接的多核苷酸相对于孔移动时的一种或多种特征。
还提供了用于表征两个或更多个双链靶多核苷酸的两个或更多个多核苷酸Y衔接子的群体,其中每个衔接子包含能够一起杂交的第一和第二部分,并且其中每个第一部分最初被保护免于杂交到第二部分。
另外,提供了用于表征两个或更多个双链靶多核苷酸的试剂盒,其包含本发明的Y衔接子群和发夹环群。
附图说明
图1显示了后续靶多核苷酸(标记为B)与第一靶多核苷酸(标记为A)的连接,以产生连接的多核苷酸。当第一多核苷酸移动通过孔(标记为C)时,显露第一靶多核苷酸中的连接点用于连接。
图2显示了当解旋酶T4Dda-(E94C/F98W/C109A/C136A/A360C)(SEQ ID NO:24,具有突变E94C/F98W/C109A/C136A/A360C并且然后(ΔM1)G1G2(其中(ΔM1)G1G2=M1的缺失然后添加G1和G2))通过MspA纳米孔控制连接的多核苷酸的易位时的示例电流迹线(y轴标记=电流(pA),x轴标记=两条迹线的时间(s))。顶部迹线显示连接多核苷酸的受控易位,标记为1的下部迹线显示顶部迹线的放大区域1。
图3显示当解旋酶T4Dda-(E94C/F98W/C109A/C136A/A360C)通过MspA纳米孔控制连接的多核苷酸易位时的示例电流迹线(y轴标记=电流(pA),x轴标记=两条迹线的时间(s))。顶部迹线显示连接多核苷酸的受控易位,标记为2的下部迹线显示顶部迹线的放大区域2。
图4显示当解旋酶T4Dda-(E94C/F98W/C109A/C136A/A360C)通过MspA纳米孔控制连接的多核苷酸易位时的示例电流迹线(y轴标记=电流(pA),x轴标记=两条迹线的时间(s))。顶部迹线显示连接多核苷酸的受控易位,标记为3的下部迹线显示顶部迹线的放大区域3。
图5显示当解旋酶T4Dda-(E94C/F98W/C109A/C136A/A360C)通过MspA纳米孔控制连接的多核苷酸易位时的示例电流迹线(y轴标记=电流(pA),x轴标记=两条迹线的时间(s))。顶部迹线显示连接多核苷酸的受控易位,标记为4的下部迹线显示顶部迹线的放大区域4。
图6显示当解旋酶T4Dda-(E94C/F98W/C109A/C136A/A360C)通过MspA纳米孔控制连接的多核苷酸易位时的示例电流迹线(y轴标记=电流(pA),x轴标记=两条迹线的时间(s))。顶部迹线显示连接多核苷酸的受控易位,标记为5的下部迹线显示顶部迹线的放大区域5。
图7显示了使用点击化学(参见标记为D的点击化学连接)将后续靶多核苷酸(标记为B)与第一靶多核苷酸(标记为A)连接以产生连接的多核苷酸。当第一多核苷酸移动通过孔(标记为C)时,显露第一靶多核苷酸中的连接点用于连接。
图8显示当解旋酶T4Dda-(E94C/F98W/C109A/C136A/A360C)通过MspA纳米孔控制连接的多核苷酸易位时的示例电流迹线(y轴标记=电流(pA),x轴标记=两条迹线的时间(s))。第一多核苷酸具有5个后续靶多核苷酸,其使用点击化学连接于其上。鉴定当前迹线的区域,其对应于第一多核苷酸(T1和C1)的模板或补体区域以及当它们易位通过纳米孔时的每个后续多核苷酸(T2-6、C2-6)。多核苷酸的前导区和发夹中的间隔区允许更多的电流流动并在它们移位通过纳米孔时产生电流尖峰。间隔区用*(a-k)突出显示,并标记第一和后续多核苷酸的模板和补体区之间的转换,所述多核苷酸连接形成靶连接的多核苷酸。
图9显示了后续靶多核苷酸(标记为B)与第一靶多核苷酸(标记为A)的连接,以产生连接的多核苷酸。当第一多核苷酸移动通过孔(标记为C)时,显露第一靶多核苷酸中的连接点用于连接。在该实例中,第一多核苷酸在任一端具有一种类型的点击化学反应性基团(例如叠氮化物反应性基团),并且随后的多核苷酸在任一端具有不同类型的点击化学反应性基团(例如DBCO反应性基团)。用于控制DNA通过纳米孔移动的酶未在该图中显示。
图10显示了如何仅表征和连接靶多核苷酸的模板链,其中用于将多核苷酸连接在一起的连接方法是点击化学。连接衔接子复合物含有运动蛋白和释放蛋白。该衔接子连接到靶多核苷酸的两端。两种蛋白质在连接的衔接子复合物上停滞,直到连接到靶多核苷酸的衔接子被孔捕获。一旦捕获了第一个多核苷酸,用于阻止蛋白质的阻断化学物质就被两种蛋白质克服。然后,如前所述,运动蛋白控制第一多核苷酸与孔的相互作用,并且释放蛋白可以比运动蛋白更快地转位,其分离链以暴露衔接子3'末端中的序列(3'杂交位点),该末端连接到靶多核苷酸的末端,该靶多核苷酸与衔接子复合物的前导链的5'核酸序列(5'杂交位点)互补,所述衔接子复合物与第二靶多核苷酸连接。通过显露3'杂交位点,第二靶多核苷酸中的5'杂交位点然后可以与显露的3'杂交位点杂交,并且第一多核苷酸的3'末端与第二多核苷酸的5'的共价偶联可以发生。然后重复该过程以进一步连接靶多核苷酸。
应理解的是,附图仅用于说明本发明的具体实施例而并不旨在是限制性的。
序列表的描述
SEQ ID NO:1示出了编码MS-B1突变体MspA单体的密码子优化的多核苷酸序列。此突变体缺乏信号序列,并且包含以下突变:D90N、D91N、D93N、D118R、D134R和E139K。
SEQ ID NO:2示出了MspA单体的MS-B1突变体的成熟形式的氨基酸序列。此突变体缺乏信号序列,并且包含以下突变:D90N、D91N、D93N、D118R、D134R和E139K。
SEQ ID NO:3示出编码α-hemolysin-E111N/K147N的一种单体的多核苷酸序列(α-HL-NN;Stoddart等人,PNAS,2009;106(19):7702-7707)。
SEQ ID NO:4示出了α-HL-NN的一种单体的氨基酸序列。
SEQ ID No:5-7示出了MspB、MspC和MspD的氨基酸序列。
SEQ ID NO:8示出了编码Phi29DNA聚合酶的多核苷酸序列。
SEQ ID NO:9示出了Phi29DNA聚合酶的氨基酸序列。
SEQ ID NO:10显示衍生自大肠杆菌sbcB基因的密码子优化多核苷酸序列。其编码大肠杆菌核酸外切酶I(EcoExo I)。
SEQ ID NO:11显示大肠杆菌核酸外切酶I(EcoExo I)的氨基酸序列。
SEQ ID NO:12显示衍生自大肠杆菌xthA基因的密码子优化多核苷酸序列。其编码大肠杆菌核酸外切酶III。
SEQ ID NO:13显示大肠杆菌核酸外切酶III的氨基酸序列。这种酶在3’到5’方向上对来自双链DNA(dsDNA)中的一条链的5’单磷酸酯核苷执行分配消化。链上的酶起始需要近似4个核苷酸的5’突出端。
SEQ ID NO:14显示衍生自极端嗜热菌(T.thermophilus)recJ基因的密码子优化多核苷酸序列。其编码极端嗜热菌RecJ酶(TthRecJ-cd)。
SEQ ID NO:15显示极端嗜热菌RecJ酶(TthRecJ-cd)的氨基酸序列。此酶以5’到3’方向从ssDNA执行逐步消化5’单磷酸核苷。链上的酶起始需要至少4个核苷酸。
SEQ ID NO:16显示衍生自噬菌体λexo(redX)基因的密码子优化多核苷酸序列。其编码噬菌体λ核酸外切酶。
SEQ ID NO:17示出了噬菌体λ核酸外切酶的氨基酸序列。此序列是组装成三聚体的三个相同的亚群中的一个。此酶以5’到3’方向对来自dsDNA的一条链的核苷酸执行高度逐步消化(www.neb.com/nebecomm/products/productM0262.asp)。链上的酶起始优先需要具有5’磷酸的近似4个核苷酸的5’突出端。
SEQ ID NO:18示出了Hel308Mbu的氨基酸序列。
SEQ ID NO:19示出了Hel308Csy的氨基酸序列。
SEQ ID NO:20示出了Hel308Tga的氨基酸序列。
SEQ ID NO:21示出了Hel308Mhu的氨基酸序列。
SEQ ID NO:22显示TraI Eco的氨基酸序列。
SEQ ID NO:23显示XPD Mbu的氨基酸序列。
SEQ ID NO:24示出了Dda 1993的氨基酸序列。
SEQ ID NO:25示出了Trwc Cba的氨基酸序列。
SEQ ID NO:26示出了编码来自大肠杆菌Str.K-12亚株MC4100的野生型CsgG单体的成熟形式的氨基酸序列。此单体缺乏信号序列。
SEQ ID NO:27示出了来自大肠杆菌Str.K-12亚株MC4100的野生型CsgG单体的成熟形式的氨基酸序列。此单体缺乏信号序列。对于此使用的缩写为CsgG=CsgG-Eco。
SEQ ID NO:28到42示出了在实施例中使用的序列。
应理解的是,序列不旨在是限制性的。
具体实施方式
应理解的是,所公开的产品和方法的不同应用可以根据本领域的特定需要而定制。还应理解的是,在本文使用的术语仅出于描述本发明的具体实施例的目的而并不旨在是限制性的。
另外,除非内容另外明确指明,否则如本说明书和所附权利要求书中所使用的,单数形式“一个/一种(a/an)”和“所述(the)”包含复数指示物。因此,例如,提及“多核苷酸”包含两个或更多个多核苷酸、提及“锚”是指两个或更多个锚、提及“解旋酶”包含两个或更多个解旋酶、并且提及“跨膜孔”包含两个或更多个孔等。
在本说明书中,特定位置处的不同氨基酸用符号“/”分开,/符号“/”意指“或”。例如,P108R/K意指P108R或P108K。在本说明书中,不同的位置或不同的取代被符号“/”分开,“/”符号意指“和”。例如,E94/P108意指E94和P108或者E94D/P108K意指E94D和P108K。
本文中(无论是上文还是下文)所引用的所有公开、专利和专利申请特此通过引用以其全部内容并入。
本发明方法
本发明人设计的方法具有各种优点。在使用跨膜纳米孔的多核苷酸表征的已知方法中,在随后的多核苷酸接触孔之前表征一种多核苷酸之后,孔是开放一段时间。该新方法显着减少了多核苷酸之间的开放孔时间,因为前多核苷酸正在被表征时随后的多核苷酸被招募。在一些实施方案中,可以消除、基本上消除或最小化开放孔时间。减少开孔时间不仅意味着孔比传统方法中的孔更多地表征(处理更多的多核苷酸),它也意味着孔阻塞的可能性降低(孔堵塞的可能性与常规方法相比,它是低的或相对低的)。当存在开孔状态时,容易发生孔阻塞。如果多核苷酸链在孔中,那么当孔已经“被占据”时,发生阻塞的可能性降低。因此,如果开孔状态时间减少,则阻塞的机会也减少。减少的开孔也意味着表征所需的多核苷酸浓度也降低。
可以使用本发明研究或表征任何数量的靶多核苷酸。例如,本发明的方法可以涉及表征两种或更多种多核苷酸,如3种或更多种、4种或更多种、5种或更多种、6种或更多种、7种或更多种、8种或更多种、9种或更多种、10种或更多种、20种或更多种、30种或更多种、50种或更多种、100种或更多种、500种或更多种、1,000种或更多种、5,000种或更多种、10,000种或更多种、50,000种或更多种、100,000种或更多种、1000,000种或更多种、或5000,000种或更多种多核苷酸。特别是,2种或更多种、5种或更多种、10种或更多种、20种或更多种、50种或更多种、100种或更多种、500种或更多种、1,000种或更多种、5,000种或更多种、10,000种或更多种、50,000种或更多种、100,000种或更多种、500,000种或更多种、1,000,000种或更多种、或5,000,000种或更多种后续靶多核苷酸与第一靶多核苷酸连接。
两种或更多种靶多核苷酸可以彼此不同。两种或更多种多核苷酸可以是相同多核苷酸的两种或更多种实例。这允许校对。两种或更多种靶多核苷酸可以衍生自较长靶多核苷酸的片段化。
连接的多核苷酸
该方法包括将一个或多个后续靶多核苷酸依次连接到第一靶多核苷酸上以提供连接的多核苷酸。连接的多核苷酸包含连接在一起的至少两个靶多核苷酸。
靶多核苷酸以连接顺序移动通过孔。例如,第一靶多核苷酸在第二靶多核苷酸之前立即移动通过孔。第二靶多核苷酸紧接在第三靶多核苷酸之前移动通过孔,依此类推。换句话说,第一靶多核苷酸移动通过孔,然后是第二靶多核苷酸。第二靶多核苷酸移动通过孔,然后是第三靶多核苷酸,依此类推。
连接
随着靶多核苷酸移动通过孔,当前一靶多核苷酸移动通过孔时,后续靶多核苷酸以连接顺序选择性地连接到前一靶多核苷酸上。例如,当第一靶多核苷酸移动通过孔时,第二靶多核苷酸选择性地连接于第一靶多核苷酸。当第二靶多核苷酸移动通过孔等时,第三靶多核苷酸选择性地附接于第二靶多核苷酸。
换句话说,靶多核苷酸彼此不连接,直到第一靶多核苷酸与孔相互作用。第一靶多核苷酸与孔的相互作用促进第一靶多核苷酸与第二靶多核苷酸的附接。与孔的相互作用可导致第一多核苷酸的构象变化,例如去杂交/分离双链靶多核苷酸的两条链,或去除保护分子以显露或暴露第一多核苷酸上的可以与第二多核苷酸上的位点相互作用的位点。在显露或暴露第一多核苷酸上的所述位点后,第一多核苷酸连接于第二多核苷酸。仅当第一多核苷酸与孔相互作用时连接的发生在本文中称为“选择性连接”。这与“选择性杂交”不同,“选择性杂交”在本文中用于描述第一多核苷酸和第二多核苷酸的互补区域之间的碱基对结合。
因此,连接是选择性的,即后续靶多核苷酸在不存在孔的情况下不能连接于前靶多核苷酸或直到前靶多核苷酸移动通过孔。例如,连接是选择性的,即第二靶多核苷酸在不存在孔的情况下不能连接于第一靶多核苷酸或直到第一靶多核苷酸移动通过孔。第三靶多核苷酸在不存在孔的情况下不能连接于第二靶多核苷酸,或者直到第二靶多核苷酸移动通过孔等等。
可以以任何方式实现选择性连接。首先保护前靶多核苷酸的一部分(例如,第一多肽上与第二多肽上的位点结合的位点)不与后续靶多核苷酸连接,并且当前靶多核苷酸移动通过孔时显露其用于连接。例如,最初保护第一靶多核苷酸的一部分不与第二靶多核苷酸连接,并且当第一靶多核苷酸移动通过孔时显露第一靶多核苷酸的一部分用于连接。最初保护第二靶多核苷酸的一部分不与第三靶多核苷酸连接,并且当第二靶多核苷酸移动通过孔等时显露第二靶多核苷酸的一部分用于连接。
该部分可能以任何方式受到保护。该部分通常由防止连接的分子保护。前面靶多核苷酸通过孔的移动可以去除分子并显露该部分用于连接。可以使用任何分子。例如,分子可以封闭下面讨论的点击反应基团之一。例如,这可能是与DBCO堆叠的芘。如果该部分包含Ni-NTA基团(其可以连接于在后续靶多核苷酸中的多组氨酸,例如6xHis),则该部分可以在相同的靶多核苷酸中用多组氨酸(例如6xHis)保护,反之亦然,即该部分包含多组氨酸,例如6xHis,并且被Ni-NTA基团保护。如果该部分包含环糊精(其可以在随后的多核苷酸中与金刚烷胺连接),则该部分可以在相同的靶多核苷酸中被金刚烷胺保护,反之亦然。该部分和保护分子可以存在于双链靶多核苷酸的相对链上。然后通过孔分离链可以将保护分子与该部分分离并显露该部分以连接。
前面靶多核苷酸的该部分可以通过与保护性多核苷酸的杂交被保护。当靶多核苷酸移动通过孔时,保护性多核苷酸可以与该部分分离。保护性多核苷酸可以形成靶多核苷酸的一部分,如下面更详细讨论的。保护性多核苷酸可以是单独的多核苷酸。如下文更详细讨论的,保护性多核苷酸可保护该部分免于与后续靶多核苷酸的一部分杂交。或者,保护性多核苷酸可以防止单链连接酶对该部分的作用。存在保护多核苷酸(与该部分形成双链区)意指连接酶不起作用。保护性多核苷酸的释放将显露该部分作为连接酶的底物。
后续靶多核苷酸的一部分优选与前面多核苷酸的一部分选择性杂交,例如由于其与孔相互作用而在前靶多核苷酸上显露的位点是与随后多核苷酸的核苷酸序列互补的核苷酸序列。例如,第二靶多核苷酸的一部分优选地选择性地与第一多核苷酸的一部分杂交。第三靶多核苷酸的一部分优选与第二靶多核苷酸的一部分选择性杂交,等等。
优选地,首先保护前靶多核苷酸的一部分免于与后续靶多核苷酸的部分杂交,并且当前靶多核苷酸移动通过孔时,显露其用于杂交。例如,第二靶多核苷酸的部分优选地最初被保护免于与第一靶多核苷酸的部分杂交,并且当第一靶多核苷酸移动通过孔时显露用于杂交。优选地,最初保护第三靶多核苷酸的部分不与第二靶多核苷酸的部分杂交,并且当第二靶多核苷酸移动通过孔时显露第一靶多核苷酸的部分用于杂交,等等。
前靶多核苷酸的一部分优选与后续靶多核苷酸的一部分特异性杂交。当靶多核苷酸彼此以优先或高亲和力杂交但与其它多核苷酸或序列基本上不杂交、不杂交或仅以低亲和力杂交时,它们的部分特异性杂交。如果前一靶多核苷酸的部分与后续靶多核苷酸的部分杂交,其熔解温度(Tm)高于其与其它序列的Tm至少2℃,如至少3℃、至少4℃、至少5℃、至少6℃、至少7℃、至少8℃、至少9℃或至少10℃,则该多核苷酸部分与后续靶多核苷酸的部分特异性杂交。更优选地,前靶多核苷酸的一部分与后续靶多核苷酸的部分杂交,其中Tm高于其与其它序列的Tm至少为2℃,如至少3℃、至少4℃、至少5℃、至少6℃、至少7℃、至少8℃、至少9℃、至少10℃、至少20℃、至少30℃或至少40℃。优选地,对于与后续靶多核苷酸的部分相差一个或多个核苷酸,如1个、2个、3个、4个或5个或更多个核苷酸的序列,前面靶多核苷酸的部分与后续靶多核苷酸的部分以高于与该序列的Tm至少2℃,如至少3℃、至少4℃、至少5℃、至少6℃、至少7℃、至少8℃、至少9℃、至少10℃、至少20℃、至少30℃或至少40℃的Tm杂交。前靶多核苷酸的一部分通常与后续靶多核苷酸的部分杂交的Tm为至少90℃,例如至少92℃或至少95℃。Tm可以使用已知技术通过实验测量,包含使用DNA微阵列,或者可以使用公众可获得的Tm计算器计算,如可通过因特网获得的计算器。
允许杂交的条件是本领域公知的(例如,Sambrook等人,2001年,《分子克隆:实验室手册》,第3版,冷泉港实验室出版社;以及《当代分子生物学实验手册(CurrentProtocols in Molecular Biology)》,第2章,Ausubel等人编辑,格林出版与威利交叉科学出版社(Greene Publishing and Wiley-lnterscience),纽约,(1995年))。杂交可以在低严格条件下进行,例如在37℃下存在30%到35%甲酰胺,1M NaCl和1%SDS(十二烷基硫酸钠)的缓冲溶液,然后在50℃下从1X(0.1650M Na+)到2X(0.33M Na+)SSC(标准柠檬酸钠)中洗涤20次。杂交可以在低严格条件下进行,例如在37℃下存在40%到45%甲酰胺,1M NaCl和1%SDS的缓冲溶液,然后在55℃下从0.5X(0.0825M Na+)到1X(0.1650M Na+)SSC中洗涤。杂交可以在低严格条件下进行,例如在37℃下存在50%甲酰胺,1M NaCl和1%SDS的缓冲溶液,然后在60℃下在0.1X(0.0165M Na+)SSC中洗涤。
前靶多核苷酸的一部分优选与后续靶多核苷酸的一部分基本上互补。因此,与后续靶多核苷酸中的部分相比,前靶多核苷酸的部分可以在5个、10个、15个、20个、21个、22个、30个、40个或50个核苷酸的区域上具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个错配。前靶多核苷酸的一部分优选与后续靶多核苷酸的一部分互补。
每个部分通常为50个核苷酸或更少,例如40个核苷酸或更少,30个核苷酸或更少,20个核苷酸或更少,12个核苷酸或更少,10个核苷酸或更少或5个核苷酸或更少。每个部分通常长度为至少4个核苷酸,例如长度为至少5个核苷酸,至少10个核苷酸或至少12个核苷酸。
每个靶多核苷酸可包含相同的部分,(当它是后续的靶多核苷酸时)其与前多核苷酸的部分选择性杂交和(当它是前多核苷酸时)选择性杂交到后续多核苷酸的部分。在这样的实施方案中,每个靶多核苷酸中的两个部分必须彼此保护,使得它们不彼此连接并且仅连接于不同的靶多核苷酸。可以以上述任何方式彼此保护部分。
在一个实施方案中,显露用于连接至后续(例如第二)多核苷酸的前(例如第一)多核苷酸的部分位于或接近于前一多核苷酸的相对末端至进入孔的末端。当多核苷酸以5'至3'方向穿过孔时,前多核苷酸的连接至后续多核苷酸的部分位于或接近前一多核苷酸的3'末端。然后,连接于前多核苷酸的后续多核苷酸的部分位于或接近后续多核苷酸的5'末端。靠近多核苷酸末端的部分通常在例如多核苷酸末端的1至30个碱基内,例如在距离多核苷酸末端2至25、3至20、4至15或5至10个碱基的范围内。
在一个优选的实施方案中,前靶多核苷酸是双链的,前靶多核苷酸的部分(连接位点)在一条链(第一条链)中并与另一条链(第二条链)杂交,并且随着靶多核苷酸移动通过孔,两条(第一条和第二条)链分离时,显露该部分(连接位点)用于杂交。在该实施方案中,靶多核苷酸的另一(第二)链是保护分子。如果第二链移动通过孔,则两条链分开并且显示该部分(第一链上的连接位点)与后续靶多核苷酸上的部分(连接位点)杂交。该实施方案的具体形式如图1所示。
前靶多核苷酸中的一条(第一条)链优选在其末端形成环结构。与后续靶多核苷酸的部分(连接位点)杂交的前靶多核苷酸的部分(连接位点)优选与环结构相邻但不是环结构的一部分。在这样的实施方案中,后续靶多核苷酸中的部分与前靶多核苷酸中的部分的杂交延长了环。该实施方案导致前面和后面的靶多核苷酸通过环连接,所述环可以去除杂交并移动通过孔。该实施方案的具体形式如图1所示。
在一个实施方案中,双链前靶多核苷酸的两条链优选在一端通过发夹环连接。下文更详细地论述了发夹环。如果两条链是连接的,则两条链分开,显露该部分与后续靶多核苷酸上的部分杂交,发夹移动通过孔,然后包含与后续靶多核苷酸连接的部分的链移动通过孔。
前靶多核苷酸另一端的另一条(第二条)链优选包含优先穿入孔中的前导序列。这确保了另一条(第二条)链进入孔中,并且当两条链分开时,显露该部分(连接位点)用于杂交。合适的前导序列在下文更详细地论述。
后续靶多核苷酸优选连接到前一靶多核苷酸另一端的一条(第一条)链上。当优选包含前导序列的另一(第二)链移动通过孔时,优选显露一条(第一)链上的部分(连接位点)用于连接或杂交到随后靶多核苷酸的部分(连接位点)。
后续靶多核苷酸优选是双链的。在一个实施方案中,两条链优选在一端通过发夹环连接。来自发夹环的后续靶多核苷酸的另一端优选选择性地连接至前一靶多核苷酸。特别地,来自发夹环的后续靶多核苷酸的另一端优选包含能够选择性连接前一靶多核苷酸的前导序列。前导序列的自由端优选能够与前靶多核苷酸的一部分杂交。前导序列的自由端优选是后续靶多核苷酸的一部分,其与前靶多核苷酸的部分特异性杂交。如上所述,前靶多核苷酸的部分优选与前靶多核苷酸中的环结构相邻。
前导序列的末端可以与桥接多核苷酸杂交,所述桥接多核苷酸形成突出端,其能够选择性地连接到前靶多核苷酸上。突出端优选能够与前靶多核苷酸的部分(连接位点)杂交。突出端优选是后续靶多核苷酸的一部分,其与前靶多核苷酸的部分特异性杂交。换句话说,突出端包含或构成后续靶多核苷酸中的连接位点。突出端与前靶多核苷酸中的部分(连接位点)的杂交将后续多核苷酸的前导序列与前靶多核苷酸中的部分(连接位点)相邻,并且这两个部分(连接位点)可以彼此连接。桥连多核苷酸和/或突出端可以是任何长度,并由下面讨论的任何多核苷酸形成。
第二(后续)靶多核苷酸优选选择性共价连接至第一(前)靶多核苷酸。例如,在一个实施方案中,前靶多核苷酸的一部分可以与第二靶多核苷酸的部分杂交(例如,其中第一和第二多核苷酸中的连接位点彼此互补),然后这两个多核苷酸可以是共价连接。可以使用任何形式的共价连接。
后续的(第二)靶多核苷酸优选使用连接酶、拓扑异构酶或通过点击化学共价连接至前一(第一)靶多核苷酸。连接酶、拓扑异构酶或点击化学导致在第一和第二靶多核苷酸之间形成一个或多个共价键。
可以使用连接酶,如T4DNA连接酶、大肠杆菌DNA连接酶、Taq DNA连接酶、Tma DNA连接酶和9°N DNA连接酶。连接酶优选为T3DNA连接酶。这可从例如New England
Figure GDA0001880175020000081
Inc.购得。
可以使用任何拓扑异构酶。合适的拓扑异构酶包括但不限于痘苗病毒DNA拓扑异构酶或人DNA拓扑异构酶I。
点击化学是有利的,因为它通常不涉及酶的使用。点击化学是Kolb等人2001年首先提出的术语,它描述了一套扩展的强大的选择性和模块化结构单元,可在小规模和大规模应用中可靠地工作(Kolb HC,Finn,MG,Sharpless KB,Click chemistry:diversechemical function from a few good reactions,Angew.Chem.Int.Ed.40(2001)2004–2021)。他们已经定义了一系列严格的点击化学标准:“反应必须是模块化的,范围广,产率非常高,只产生可以通过非色谱方法去除的无害副产物,并且是立体特异性的(但不一定是对映选择性的)。所需的工艺特性包括简单的反应条件(理想情况下,该工艺应对氧气和水不敏感),易于获得的原料和试剂,不使用溶剂或良性溶剂(如水)或易于除去,以及简单的产品分离。如果需要,必须通过非色谱方法进行纯化,例如结晶或蒸馏,并且产物必须在生理条件下稳定”。
点击化学的合适实例包括但不限于以下:
(a)1,3-偶极环加成反应的无铜变体,其中叠氮化物在应变下与炔烃反应,例如在环辛烷环中;
(b)一个接头上的氧亲核试剂与另一个上的环氧化物或氮丙啶反应性部分的反应;和
(c)施陶丁格连接,其中炔部分可以被芳基膦取代,导致与叠氮化物的特异性反应,得到酰胺键。
优选地,点击化学反应是炔烃和叠氮化物之间的Cu(I)催化的1,3偶极环加成反应。在优选的实施方案中,第一组是叠氮基,第二组是炔基。已经合成了在优选位置掺入叠氮基和炔基的核酸碱基(例如Kocalka P,El-Sagheer AH,Brown T,Rapid and efficientDNA strand cross-linking by click chemistry,Chembiochem.2008.9(8):1280-5)。炔基可从Berry Associates(Michigan,USA)商购获得,叠氮基团由ATDBio合成。
如果修饰前面和后面的多核苷酸或其部分以包括可以形成共价键的基团,则修饰的核苷酸优选彼此偏移一个核苷酸以实现连接。这是继Tom Brown(Kocalka等人(2008)ChemBiochem 9 8 1280-1285)的出版工作之后发表的。
用于本发明的其他优选基团示于下表1中。
表1-一些能够形成共价键的优选基团
Figure GDA0001880175020000091
Figure GDA0001880175020000101
由于其所需的性质,无铜点击化学可用于本发明。例如,它快速、清洁、对蛋白质无毒。其中的一个很好的例子是与环辛炔官能团(DIBO)连接的马来酰亚胺或碘乙酰胺。然而,其他合适的生物正交化学包括但不限于施陶丁格化学、肼或酰肼/醛或酮试剂(HyNic+4FB化学,包括所有SolulinkTM试剂),Diels-Alder试剂对和硼酸/水杨氧肟酸酯试剂。
优选地,反应性基团是叠氮基和己炔基,例如3AzideN和5'-己炔基-G。
优选的非共价反应性基团对包括但不限于(i)Ni-NTA和聚组氨酸,例如6xHis,和(ii)环糊精和金刚烷。
多核苷酸
另外两个靶多核苷酸还可以是任何类型的多核苷酸。如核酸等多核苷酸是包括两个或更多个核苷酸的大分子。多核苷酸或核酸可以包括任何核苷酸的任何组合。核苷酸可以是天然存在的或人工的。多核苷酸中的一或多个核苷酸可以是被氧化或甲基化的。多核苷酸中的一或多个核苷酸可以是受损的。例如,多核苷酸可以包括嘧啶二聚体。此类二聚体通常与紫外线损伤有关并且是皮肤黑色素瘤的主要病因。多核苷酸中的一或多个核苷酸可以例如用标记或标签修饰。合适的标记在下文描述。多核苷酸可包含一或多个间隔子。
核苷酸通常含有核碱基、糖和至少一个磷酸基。核碱基和糖形成核苷。
核碱基通常是杂环的。核碱基包括(但不限于)嘌呤和嘧啶,且更详细地说腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)、尿嘧啶(U)和胞嘧啶(C)。
糖通常是戊糖。核苷酸糖包括(但不限于)核糖和脱氧核糖。糖优选地是脱氧核糖。
多核苷酸优选地包含以下核苷:脱氧腺苷(dA)、脱氧尿苷(dU)和/或胸苷(dT)、脱氧鸟苷(dG)和脱氧胞苷(dC)。
核苷酸通常是核糖核苷酸或脱氧核糖核苷酸。核苷酸通常含有单磷酸、二磷酸或三磷酸。核苷酸可包含超过三个磷酸,如4或5个磷酸。磷酸可连接在核苷酸的5'或3'侧上。核苷酸包括(但不限于):单磷酸腺苷(AMP)、单磷酸鸟苷(GMP)、单磷酸胸苷(TMP)、单磷酸尿苷(UMP)、单磷酸5-甲基胞啶、单磷酸5-羟基甲基胞苷、单磷酸胞嘧啶核苷(CMP)、环单磷酸腺苷(cAMP)、环单磷酸鸟苷(cGMP)、单磷酸脱氧腺苷(dAMP)、单磷酸脱氧鸟苷(dGMP)、单磷酸脱氧胸苷(dTMP)、单磷酸脱氧尿苷(dUMP)、单磷酸脱氧胞苷(dCMP)和单磷酸脱氧甲基胞苷。核苷酸优选地是选自AMP、TMP、GMP、CMP、UMP、dAMP、dTMP、dGMP、dCMP和dUMP。
核苷酸可以无碱基(即缺乏核碱基)。核苷酸还可缺乏核碱基和糖(即是C3间隔子)。
多核苷酸中的核苷酸可以任何方式彼此连接。核苷酸通常通过其糖和磷酸基附接,如在核酸中那样。核苷酸可以通过其核碱基连接,如在嘧啶二聚体中那样。
多核苷酸可以是单链的或双链的。多核苷酸的至少一部分优选地是双链的。
多核苷酸可以是核酸,如脱氧核糖核酸(DNA)或核糖核酸(RNA)。多核苷酸可以包含与一条DNA链杂交的一条RNA链。多核苷酸可以是所属领域中已知的任何合成核酸,如肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁核酸(LNA)或具有核苷酸侧链的其它合成聚合物。PNA主链由通过肽键连接的N-(2-氨基乙基)-甘氨酸重复单元构成。GNA主链由通过磷酸二酯键连接的乙二醇重复单元构成。TNA主链由通过磷酸二酯键连接在一起的重复苏糖构成。LNA是由如上文所论述的具有将核糖部分中的2'氧和4'碳连接的额外桥的核糖核苷酸形成。
多核苷酸最优选地是核糖核酸(RNA)或脱氧核糖核酸(DNA)。
多核苷酸可以是任何长度的。举例来说,多核苷酸的长度可以是至少10、至少50、至少100、至少150、至少200、至少250、至少300、至少400或至少500个核苷酸或核苷酸对。多核苷酸的长度可以是1000个或更多个核苷酸或核苷酸对、5000个或更多个核苷酸或核苷酸对、或100000个或更多个核苷酸或核苷酸对。
样品
靶多核苷酸可以存在于任何合适的样品中。样品可以是生物样品。可使用从任何生物体或微生物获得或提取的样品在活体外进行本发明。生物体或微生物通常是古细菌、原核或真核微生物,且通常属于以下五界中的一个:植物界、动物界、真菌界、原核生物界和原生生物界。可以对从任何病毒中获得或提取的样品体外进行本发明。样品优选地是流体样品。样品通常包括患者的体液。样品可以是尿液、淋巴液、唾液、粘液或羊膜液,但优选地是血液、血浆或血清。通常,样品是人类来源的;但替代地其可以是来自另一哺乳动物,如来自商业养殖动物,如马、牛、绵羊、鱼、鸡或猪;或替代地可以是宠物,如猫或狗。替代地,样品可以是植物来源的,如从经济作物获得的样品,如谷物、豆科植物、果实或植物,例如小麦、大麦、燕麦、芥花、玉米、大豆、稻谷、大黃、香蕉、苹果、蕃茄、马铃薯、葡萄、烟草、菜豆、小扁豆、甘蔗、可可、西兰花或棉花。
样品可以是非生物样品。非生物样品优选地是流体样品。非生物样品的实例包括手术液、水(如饮用水、海水或河水)和实验室测试用试剂。
通常在于本发明中使用之前处理样品,例如通过离心或通过穿过滤出不需要的分子或细胞(如红细胞)的膜。可以在紧接着取得样品之后对其进行测量。通常还可以在分析之前优选地在低于-70℃下储存样品。
使多核苷酸与膜中的跨膜孔接触。根据本发明可以使用任何膜。合适膜在所属领域中是众所周知的。膜优选地是两亲层。两亲层是由两亲分子形成的层,所述两亲分子如磷脂,其具有亲水性和亲脂性特性两种。两亲分子可以是合成的或天然存在的。非天然存在的两亲物和形成单层的两亲物在所属领域中是已知的,且包括例如嵌段共聚物(Gonzalez-Perez等人,《朗缪尔(Langmuir)》,2009,25,10447-10450)。嵌段共聚物是两个或更多个单体亚基聚合在一起以产生单个聚合物链的聚合材料。嵌段共聚物通常具有通过每个单体亚基贡献的性质。然而,嵌段共聚物可以具有由单独的亚基形成的聚合物不拥有的独特性质。嵌段共聚物可以被工程化为使得单体亚基之一在水性介质中是疏水性的(即亲脂性),而一个或多个其它亚基是亲水性的。在这种情况下,嵌段共聚物可以拥有两亲性质,并且可以形成模拟生物膜的结构。嵌段共聚物可以是二嵌段(其由两个单体亚基组成),但也可以由多于两个单体亚基构造以形成表现为两亲物的更复杂布置。共聚物可以是三嵌段、四嵌段或五嵌段共聚物。膜优选地是三嵌段共聚物膜。
古细菌双极四醚脂质是天然存在的脂质,其被构建使得脂质形成单层膜。这些脂质一般发现于存活于苛刻生物环境中的极端条件的生物、嗜热菌、嗜盐菌和嗜酸菌中。认为其稳定性是源于最终双层的融合性质。通过产生具有一般基序亲水性-疏水性-亲水性的三嵌段聚合物来构筑模拟这些生物实体的嵌段共聚物材料,是直接了当的。这种材料可形成表现类似于脂质双层且涵盖囊泡到层状膜的一系列阶段表现的单体膜。由这些三嵌段共聚物形成的膜在生物脂质膜上保持若干优势。因为合成三嵌段共聚物,所以可小心地控制准确的构筑,以提供形成膜和与孔和其它蛋白质相互作用所需的正确链长度和特性。
还可由不分类为脂质亚材料的子单元来构筑嵌段共聚物,例如可由硅氧烷或其它非基于烃的单体来制成疏水性聚合物。嵌段共聚物的亲水性小节还可拥有很低的蛋白质结合特性,此允许产生当暴露于原始生物样品时具有高度抗性的膜。这种头基单元还可来源于非经典的脂质头基。
与生物脂质膜进行比较,三嵌段共聚物膜还具有增加的机械和环境稳定性,例如高许多的操作温度或pH范围。嵌段共聚物的合成性质提供定制用于广泛范围应用的基于聚合物的膜的平台。
膜最优选地是国际申请PCT/GB2013/052766(公布为WO 2014/064443)或PCT/GB2013/052767(公布为WO 2014/064444)中公开的膜中的一种。
两亲分子可以进行化学修饰或官能化以便于偶联多核苷酸。
两亲层可以是单层或双层。两亲层通常是平坦的。两亲层可以是弯曲的。两亲层可以是支撑式的。两亲层可以是弯曲的。两亲层可以悬浮于升高的柱,使得两亲层的外围区(附接到柱子)高于两亲层区。这可以允许微粒如上文所描述的沿着膜行进、移动、滑动或滚动。
两亲膜通常天然地是流动的,基本上以大致10-8cm s-1的脂质扩散速率充当二维液体。这意味着孔和偶联的多核苷酸可通常在两亲膜内移动。
膜可以是脂质双层。脂质双层是细胞膜的模型,且用作一系列实验研究的极佳平台。例如,脂质双层可以用于通过单通道记录对膜蛋白进行体外研究。可替代地,脂质双层可以用作检测一系列物质的存在的生物传感器。脂质双层可以是任何脂质双层。适当的脂质双层包含但不限于平坦脂质双层、支撑双层或脂质体。脂质双层优选地是平坦脂质双层。在以下文献中公开了适当的脂质双层:国际申请号PCT/GB08/000563(公开为WO 2008/102121)、国际申请号PCT/GB08/004127(公开为WO 2009/077734)以及国际申请号PCT/GB2006/001057(公开为WO 2006/100484)。
用于形成脂质双层的方法在所属领域中是已知的。在实例中公开了适当的方法。脂质双层通常通过Montal和Mueller的方法(《美国国家科学院院USA.)》,1972;69:3561-3566)来形成,其中脂质单层携载于通过开孔两侧的水溶液/空气界面上,所述开孔垂直于所述界面。通常通过首先将脂质溶解在有机溶剂中,且接着使在开孔两侧上的水溶液的表面上蒸发一滴溶剂,来将脂质添加到水性电解质溶液的表面。一旦有机溶剂已蒸发,那么开孔两侧上的溶液/空气界面来回物理地移动通过开孔,直到形成双层为止。可跨越膜中的开孔或跨越凹槽中的开口形成平坦脂质双层。
Montal和米勒的方法是常用的,这是因为是节约成本的,且是形成适合于蛋白孔插入的良好品质脂质双层的相对直接了当的方法。双层形成的其它常见方法包括脂质体双层的尖端浸没、双层涂刷和贴片夹持。
尖端浸没双层形成需要使开孔表面(例如移液管尖端)接触到携载脂质单层的测试溶液的表面。同样,通过将溶解于有机溶剂中的一滴脂质在溶液表面处蒸发来首先在溶液/空气界面处产生脂质单层。接着,通过朗缪尔-沙佛(Langmuir-Schaefer)过程形成双层,且需要机械自动以使开孔相对于溶液表面移动。
对于涂刷的双层,将溶解于有机溶剂中的一滴脂质直接应用于开孔,所述开孔浸没在水性测试溶液中。使用笔刷或等效物,使脂质溶液稀薄地扩散在开孔内。溶剂的薄化使得形成脂质双层。然而,从双层完全移除溶剂是非常困难的,并且因此通过这种方法形成的双层较不稳定且更倾向于在电化学测量期间具有噪声。
贴片夹持是在生物细胞膜研究中常用的。通过抽汲将细胞膜夹持到移液管的端,并且膜贴片变为附接在开孔上。所述方法已经适用于通过夹持脂质体来产生脂质双层,然后脂质体破裂以留下密封在移液管开孔上的脂质双层。所述方法需要稳定的、巨大的和单层的脂质体以及在具有玻璃表面的材料中制造小开孔。
可通过超声处理、挤压或Mozafari方法来形成脂质体(Colas等人(2007)《Micron》38:841-847)。
在优选的实施例中,脂质双层如国际申请号第PCT/GB08/004127号(公开为WO2009/077734)中所描述形成脂质双层。在此方法中有利的是,由干燥脂质形成脂质双层。在一最优选实施例中,跨越开口形成脂质双层,如WO2009/077734(PCT/GB08/004127)中所描述。
由脂质的两个相对层形成脂质双层。两个脂质层被布置成使得其疏水性尾基面朝彼此以形成疏水性的内部。脂质的亲水性头基向外朝向双层各侧上的水环境。双层可存在于多种脂质阶段中,所述阶段包括(但不限于)液体无序阶段(液体片层)、液体有序阶段、固体有序阶段(片层凝胶阶段、交错结合的凝胶阶段)和平坦双层晶体(片层亚凝胶阶段、片层结晶阶段)。
可以使用形成脂质双层的任何脂质组合物。选择脂质组合物,使得脂质双层具有所需的性质,如表面电荷、支持膜蛋白的能力、充填密度或所形成的机械性质。脂质组合物可以包括一或多种不同脂质。例如,脂质组合物可以含有多达100种脂质。脂质组合物优选地含有1种到10种脂质。脂质组合物可以包括天然存在的脂质和/或人工脂质。
脂质通常包括头基、界面部分和可以相同或不同的两个疏水性尾基。合适头基包括(但不限于):中性头基,如二酰基甘油酯(DG)和脑酰胺(CM);两性离子头基,如磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)和鞘磷脂(SM);带负电头基,如磷脂酰甘油(PG)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)、磷脂酸(PA)和心磷脂(CA);和带正电头基,如三甲基铵丙烷(TAP)。合适界面部分包括(但不限于)天然存在的界面部分,如基于甘油或基于脑酰胺的部分。合适疏水尾部基团包括(但不限于):饱和烃链,如月桂酸(正十二烷酸)、肉豆蔻酸(正十四烷酸)、棕榈酸(正十六烷酸)、硬脂酸(正十八烷酸)和花生酸(正二十烷酸);不饱和烃链,如油酸(顺-9-十八烷酸);和分支链烃链,如植烷酰基。链的长度和不饱和烃链中的双键的位置与数量可以变化。链的长度和分支链烃链中的分支(如甲基)的位置和数量可变化。疏水性尾基可以作为醚或酯连接于界面部分。脂质可以是分枝菌酸。
脂质还可以进行化学修饰。脂质的头基或尾部基团可以进行化学修饰。头基已进行化学修饰的合适脂质包括(但不限于):PEG修饰的脂质,如1,2-二酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000];官能化的PEG脂质,如1,2-二硬脂酰基-sn-甘油-3磷酸乙醇胺-N-[生物素基(聚乙二醇)2000];和针对结合修饰的脂质,如1,2-二油酰基-sn-甘油-3-磷酸乙醇胺-N-(丁二酰基)和1,2-二棕榈酰基-sn-甘油-3-磷酸乙醇胺-N-(生物素基)。尾部基团已进行化学修饰的合适脂质包括(但不限于):可聚合脂质,如1,2-双(10,12-三辅二炔基)-sn-甘油-3-磷酸胆碱;氟化脂质,如1-软脂酰基-2-(16-氟软脂酰基)-sn-甘油-3-磷酸胆碱;氘化脂质,如1,2-二棕榈酰基-D62-sn-甘油-3-磷酸胆碱;和醚连接的脂质,如1,2-二-O-植烷基-sn-甘油-3-磷酸胆碱。脂质可以进行化学修饰或官能化以便于偶联多核苷酸。
两亲层,例如脂质组合物,通常包括将影响层的性质的一个或多个添加剂。合适添加剂包括(但不限于):脂肪酸,如棕榈酸、肉豆蔻酸和油酸;脂肪醇,如棕榈醇、肉豆蔻醇和油醇;固醇,如胆固醇、麦角固醇、羊毛固醇、谷固醇和豆固醇;溶血磷脂,如1-酰基-2-羟基-sn-甘油-3-磷酸胆碱;和脑酰胺。
在另一个优选的实施例中,膜是固态层。固态层可以由有机材料和无机材料形成,所述材料包含但不限于:微电子材料、如HfO2、Si3N4、A12O3和SiO等绝缘材料、如聚酰胺等有机聚合物和无机聚合物、如
Figure GDA0001880175020000141
等塑料或如二组分加成固化的硅橡胶等弹性体、以及玻璃。固态层可以通过原子层沉积(ALD)。ALD固态层可以包括HfO2和A12O3的交替层。固态层可以由如石墨烯等单原子层或仅几个原子厚的层形成。在国际申请号PCT/US2008/010637(公布为WO 2009/035647),Yusko等人,《自然纳米科技(Nature Nanotechnology)》,2011年;6:253-260和美国专利申请号2013/0048499中公开了合适的石墨烯层,其描述了在不使用微粒的情况下将蛋白质递送到固态层中的跨膜孔。本发明的方法可以用于改进这些文献中公开的方法中的递送。
通常使用下列项来进行所述方法:(i)包括孔的人工两亲形层;(ii)包括孔的分离的天然存在的脂质双层;或(iii)具有插入其中的孔的细胞。通常使用人工两亲层,如人工三嵌段共聚物层来进行所述方法。所述层可以包括其它跨膜和/或膜内蛋白质以及除孔以外的其它分子。下文论述了适当的设备和条件。通常在体外进行本发明的方法。
跨膜孔
跨膜孔是在某种程度上穿过膜的结构。通常,跨膜孔包括第一开口和第二开口,其中内腔在第一开口与第二开口之间延伸。跨膜孔允许由施加的电势驱动的水合离子流过膜或膜内。跨膜孔通常穿过整个膜,使得水合离子可以从膜的一侧流到膜的另一侧。然而,跨膜孔不必穿过膜。其可能在一端关闭。例如,孔可以是膜中的阱、间隙、通道、沟槽或狭缝,水合离子可以沿着所述孔流动或流入其中。
任何跨膜孔可以用于本发明。孔可以是生物造的或人造的。合适的孔包含但不限于蛋白质孔、多核苷酸孔和固态孔。孔可以是DNA折纸孔(Langecker等人,《科学(Science)》,2012年;338:932-936)。
跨膜孔优选地是跨膜蛋白质孔。跨膜蛋白孔是多肽或多肽的集合,其允许如多核苷酸等水合离子从膜的一侧流到膜的另一侧。在本发明中,跨膜蛋白孔能够形成孔,所述孔允许由施加的电势驱动的水合离子从膜的一侧流到另一侧。跨膜蛋白孔优选地允许多核苷酸从膜的一侧,如三嵌段共聚物膜流到另一侧。跨膜蛋白孔允许如DNA或RNA等多核苷酸移动通过孔。
跨膜蛋白孔可以是单体或寡聚体。孔优选地由几个重复的亚基组成,如至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个或至少16个亚基。孔优选地为六聚体、七聚体、八聚体或非三聚体孔。孔可以是同源寡聚体或异源寡聚体。
跨膜蛋白孔通常包括离子可以流过的桶或通道。孔的亚基通常围绕中心轴线并且为跨膜β桶或通道或跨膜α-螺旋束或通道提供链。
跨膜蛋白孔的桶或通道通常包括促进与s相互作用的氨基酸,如核苷酸、多核苷酸或核酸。这些氨基酸优选地位于桶或通道的收缩部附近。跨膜蛋白孔通常包括一个或多个带正电荷的如精氨酸、赖氨酸或组氨酸等氨基酸,或如酪氨酸或色氨酸等芳香族氨基酸。这些氨基酸通常促进孔与核苷酸、多核苷酸或核酸之间的相互作用。
根据本发明使用的跨膜蛋白孔可以衍生自β桶孔或α螺旋束孔。β-桶孔包括由β-链形成的桶或通道。合适的β-桶孔包含但不限于β-毒素,如α-溶血素、炭疽毒素和白细胞素,以及细菌的外膜蛋白/孔蛋白,如耻垢分枝杆菌孔蛋白(Msp),例如MspA、MspB、MspC或MspD、CsgG,外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG)、外膜磷脂酶A和奈瑟氏球菌自转运蛋白(NalP)以及其它孔隙,如胞溶素(lysenin)。α-螺旋束孔包括由α-螺旋形成的桶或通道。合适的α螺旋束孔包含但不限于内膜蛋白和α外膜蛋白,如WZA和ClyA毒素。跨膜孔可以衍生自胞溶素。衍生自CsgG的合适的孔在国际申请号PCT/EP2015/069965中公开。衍生自胞溶素的合适的孔在国际申请号PCT/GB2013/050667(公布为WO 2013/153359)中公开。跨膜孔可以衍生自或基于Msp、α-溶血素(α-HL)、胞溶素、CsgG、ClyA、Sp1和溶血性蛋白质fragaceatoxin C(FraC)。野生型α-溶血素孔由7个相同的单体或亚基形成(即,其是七聚体)。α-溶血素-NN的一个单体或亚基的序列显示在SEQ ID NO:4中。
跨膜蛋白孔优选地衍生自Msp,更优选衍生自MspA。这种孔是寡聚的并且通常包括衍生自Msp的7个、8个、9个或10个单体。孔可以是衍生自Msp的同源寡聚孔,其包括相同的单体。可替代地,孔可以是衍生自Msp的异源寡聚孔,其包括至少一种不同于其它单体的单体。优选地,孔衍生自MspA或其同源物或旁系同源物。
衍生自Msp的单体通常包括SEQ ID NO:2中所示的序列或其变体。SEQ ID NO:2是MspA单体的MS-(B1)8突变体。其包含以下突变:D90N、D91N、D93N、D118R、D134R和E139K。SEQID NO:2的变体是具有不同于SEQ ID NO:2的氨基酸序列并且保持其形成孔的能力的多肽。可以使用本领域中已知的任何方法来测定变体形成孔的能力。例如,可以将变体连同其它适当的亚基一起插入到两亲层中,并且可以确定其寡聚形成孔的能力。用于将亚基插入到膜(如两亲层)中的方法在本领域中已知。例如,可以将纯化形式的亚基悬浮于含有三嵌段共聚物膜的溶液中,使得其扩散到膜中并且通过与膜结合和组装成功能性状态来插入。可替代地,可以使用M.A.Holden,H.Bayley,《美国化学学会期刊(J.Am.Chem.Soc.)》2005年,127,6502-6503和国际申请号PCT/GB2006/001057(公开为WO 2006/100484)。
在SEQ ID NO:2的氨基酸序列的整个长度内,基于氨基酸相似性或同一性,变体将优选地与所述序列至少50%同源。更优选地,基于氨基酸相似性或同一性,变异体可以在整个序列内与SEQ ID NO:2的氨基酸序列至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,并且更优选地至少95%、97%或99%同源。在100个或更多个、例如125个、150个、175个或200个或更多个连续氨基酸的延伸段内,可能存在至少80%、例如至少85%、90%或95%的氨基酸相似性或同一性(“硬同源性(hardhomology)”)。
本领域中的标准方法可以用于确定同源性。例如,UWGCG程序包提供了BESTFIT程序,其可以用于计算同源性,例如根据其默认设置使用(Devereux等人(1984年)《核酸研究(Nucleic Acids Research)》第12卷,第387到395页)。PILEUP和BLAST算法可以用于计算同源性或对序列进行排序(如识别等同残基或对应序列(通常根据其默认设置),例如如Altschul S.F.(1993年)《分子进化期刊(J Mol Evol)》36:290-300;Altschul,S.F等人(1990)《分子生物学期刊(J Mol Biol)》215:403-10中描述的。用于执行BLAST分析的软件可通过美国国家生物技术信息中心(National Center for Biotechnology Information)(http://www.ncbi.nlm.nih.gov/)公开地获得。相似性可以使用成对同一性或通过应用如BLOSUM62等评分矩阵并且转换为等效同一性来测量。由于其表示功能变化而非演化变化,所以在确定同源性时将掩盖故意突变的位置。通过在蛋白序列的综合数据库上使用例如PSIBLAST来应用位置特异性评分矩阵,可以更灵敏地确定相似性。可以使用反映氨基酸化学-物理性质而不是演化时间尺度(例如,电荷)内的取代频率的不同评分矩阵。
SEQ ID NO:2是MspA单体的MS-(B1)8突变体。与MspA相比,变体可以包括MspB、MspC或MspD单体中的任何突变。MspB、MspC和MspD的成熟形式显示在SEQ ID NO:5到SEQ IDNO:7中。具体地,所述变体可以包括MspB中存在的以下取代:A138P。变体可以包括MspC中存在的一种或多种以下取代:A96G、N102E和A138P。变体可以包括MspD中存在的一种或多种以下突变:G1、L2V、E5Q、L8V、D13G、W21A、D22E、K47T、I49H、I68V、D91G、A96Q、N102D、S103T、V104I、S136K以及G141A的缺失。变体可以包括来自Msp B、Msp C和Msp D的突变和取代中的一个或多个的组合。变体优选地包括突变L88N。除了MS-B1的所有突变之外,SEQ ID NO:2的变体还具有突变L88N,并且被称为MS-(B2)8。本发明中使用的孔优选为MS-(B2)8。SEQ IDNO:2的变体优选地包括D56N、D56F、E59R、G75S、G77S、A96D和Q126R中的一种或多种。除了MS-B1的所有突变之外,SEQ ID NO:2的变体还具有突变G75S/G77S/L88N/Q126R,并且被称为MS-B2C。本发明中使用的孔优选地为MS-(B2)8或MS-(B2C)8。SEQ ID NO:2的变体优选地包括N93D。变体更优选包括突变G75S/G77S/L88N/N93D/Q126R。
可以对SEQ ID NO:2的氨基酸序列进行除了上文所论述的取代之外的氨基酸取代,例如高达1个、2个、3个、4个、5个、10个、20个或30个取代。保守取代使用具有类似化学结构、类似化学性质或类似侧链体积的其它氨基酸来代替氨基酸。所引入的氨基酸可以具有与其所代替的氨基酸类似的极性、亲水性、疏水性、碱性、酸性、电中性或电荷。可替代地,保守取代可以引入另一芳香族或脂肪族氨基酸代替预先存在的芳香族或脂肪族氨基酸。
跨膜蛋白孔优选地衍生自CsgG,更优选地来自大肠杆菌Str.K-12亚株MC4100的野生型CsgG单体的成熟形式的氨基酸序列。这种孔将是寡聚的并且通常包括衍生自Msp的7个、8个、9个或10个单体。孔可以是衍生自CsgG的同源寡聚孔,其包括相同的单体。可替代地,孔可以是衍生自CsgG的异源寡聚孔,其包括至少一种不同于其它单体的单体。
衍生自CsgG的单体通常包括SEQ ID NO:27中所示的序列或其变体。SEQ ID NO:27的变体是具有不同于SEQ ID NO:27的氨基酸序列并且保持其形成孔的能力的多肽。可以使用如上文所论述的本领域中已知的任何方法来测定变体形成孔的能力。
在SEQ ID NO:27中任一个的氨基酸序列的整个长度内,基于氨基酸相似性或同一性,变体将优选地与所述序列至少50%同源。更优选地,基于氨基酸相似性或同一性,变体可以在整个序列内与SEQ ID NO:27的氨基酸序列至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,并且更优选地至少95%、97%或99%同源。在100个或更多个、例如125个、150个、175个或200个或更多个连续氨基酸的延伸段内,可能存在至少80%、例如至少85%、90%或95%的氨基酸相似性或同一性(“硬同源性(hardhomology)”)。可以如上文所论述的测量同源性。
SEQ ID NO:27的变体可以包括国际申请号PCT/GB2015/069965(公布为WO 2016/034591)中公开的任何突变。SEQ ID NO:27的变体优选地包括以下中的一种或多种(i)在以下位置处的一或多个突变(即在以下位置中的一或多个处的突变):N40、D43、E44、S54、S57、Q62、R97、E101、E124、E131、R142、T150和R192,如在以下位置处的一或多个突变(即在以下位置中的一或多个处的突变)N40、D43、E44、S54、S57、Q62、E101、E131和T150或N40、D43、E44、E101和E131;(ii)在Y51/N55、Y51/F56、N55/F56或Y51/N55/F56处的突变;(iii)Q42R或Q42K;(iv)K49R;(v)N102R、N102F、N102Y或N102W;(vi)D149N、D149Q或D149R;(vii)E185N、E185Q或E185R;(viii)D195N、D195Q或D195R;(ix)E201N、E201Q或E201R;(x)E203N、E203Q或E203R;以及(xi)以下位置中的一或多个的缺失:F48、K49、P50、Y51、P52、A53、S54、N55、F56和S57。变体可以包括(i)到(xi)的任何组合。如果变体包括(i)和(iii)到(xi)中的任一个,则其可以进一步包括在Y51、N55和F56中的一或多个处的突变,如在Y51、N55、F56、Y51/N55、Y51/F56、N55/F56或Y51/N55/F56处。
形成孔的SEQ ID NO:27的优选的变体,其中当多核苷酸移动通过孔时较少的核苷酸对电流起作用,包括Y51A/F56A、Y51A/F56N、Y51I/F56A、Y51L/F56A、Y51T/F56A、Y51I/F56N、Y51L/F56N或Y51T/F56N,或更优选地Y51I/F56A、Y51L/F56A或Y51T/F56A。
形成显示增加范围的孔的SEQ ID NO:27的优选的变体包括在以下位置处的突变:
Y51、F56、D149、E185、E201和E203;
N55和F56;
Y51和F56;
Y51、N55和F56;或
F56和N102。
形成显示增加范围的孔的SEQ ID NO:27的优选的变体包括:
Y51N、F56A、D149N、E185R、E201N和E203N;
N55S和F56Q;
Y51A和F56A;
Y51A和F56N;
Y51I和F56A;
Y51L和F56A;
Y51T和F56A;
Y51I和F56N;
Y51L和F56N;
Y51T和F56N;
Y51T和F56Q;
Y51A、N55S和F56A;
Y51A、N55S和F56N;
Y51T、N55S和F56Q;或
F56Q和N102R。
形成孔的SEQ ID NO:27的优选的变体,其中当多核苷酸移动通过孔时较少的核苷酸对电流起作用,包括在以下位置的突变:
N55和F56,如N55X和F56Q,其中X是任何氨基酸;或
Y51和F56,如Y51X和F56Q,其中X是任何氨基酸。
形成显示增加的通量的孔的SEQ ID NO:27的优选的变体包括在以下位置的突变:
D149、E185和E203;
D149、E185、E201和E203;或
D149、E185、D195、E201和E203。
形成显示增加的通量的孔的优选的变体包括:
D149N、E185N和E203N;
D149N、E185N、E201N和E203N;
D149N、E185R、D195N、E201N和E203N;或
D149N、E185R、D195N、E201R和E203N。
形成孔的SEQ ID NO:7的优选的变体,其中多核苷酸的捕获增加包括以下突变:
D43N/Y51T/F56Q;
E44N/Y51T/F56Q;
D43N/E44N/Y51T/F56Q;
Y51T/F56Q/Q62R;
D43N/Y51T/F56Q/Q62R;
E44N/Y51T/F56Q/Q62R;或
D43N/E44N/Y51T/F56Q/Q62R。
SEQ ID NO:27的优选的变体包括以下突变:
D149R/E185R/E201R/E203R或Y51T/F56Q/D149R/E185R/E201R/E203R;
D149N/E185N/E201N/E203N或Y51T/F56Q/D149N/E185N/E201N/E203N;
E201R/E203R或Y51T/F56Q/E201R/E203R;
E201N/E203R或Y51T/F56Q/E201N/E203R;
E203R或Y51T/F56Q/E203R;
E203N或Y51T/F56Q/E203N;
E201R或Y51T/F56Q/E201R;
E201N或Y51T/F56Q/E201N;
E185R或Y51T/F56Q/E185R;
E185N或Y51T/F56Q/E185N;
D149R或Y51T/F56Q/D149R;
D149N或Y51T/F56Q/D149N;
R142E或Y51T/F56Q/R142E;
R142N或Y51T/F56Q/R142N;
R192E或Y51T/F56Q/R192E;或
R192N或Y51T/F56Q/R192N。
SEQ ID NO:27的优选的变体包括以下突变:
Y51A/F56Q/E101N/N102R;
Y51A/F56Q/R97N/N102G;
Y51A/F56Q/R97N/N102R;
Y51A/F56Q/R97N;
Y51A/F56Q/R97G;
Y51A/F56Q/R97L;
Y51A/F56Q/N102R;
Y51A/F56Q/N102F;
Y51A/F56Q/N102G;
Y51A/F56Q/E101R;
Y51A/F56Q/E101F;
Y51A/F56Q/E101N;或
Y51A/F56Q/E101G
SEQ ID NO:27的变体可以包括存在于另一个CsgG同源物中的取代中的任一个。优选的CsgG同源物显示在国际申请号PCT/GB2015/069965(公布为WO 2016/034591)的SEQ IDNO:3到SEQ ID NO:7和SEQ ID NO:26到SEQ ID NO:41中。
例如通过添加组氨酸残基(his标签)、天冬氨酸残基(asp标签)、抗生蛋白链菌素标签、flag标签、SUMO标签、GST标签或MBP标签、或通过添加信号序列以促进其从细胞分泌,其中多肽不天然地含有这样的序列,可以修饰本文所描述的如跨膜蛋白孔等任何蛋白质以帮助其鉴定或纯化。引入基因标签的替代性方案是将标签化学反应到孔上的原生的或工程化的位置上。这种操作的实例将是使凝胶迁移试剂与孔外部上的工程化半胱氨酸反应。这已经被证明是一种用于分离溶血素异源寡聚体的方法(《生物化学(Chem Biol)》,1997年7月,4(7):497-505)。
单体可以用显露标记来进行标记。显露标记可以是允许孔被检测到的任何适当标记。适当的标记包含但不限于荧光分子;放射性同位素,例如,125I、35S、酶、抗体、抗原、多核苷酸和如生物素等配体。
本文所描述的如跨膜蛋白孔等任何蛋白质可以合成制备或通过重组方法制备。例如,可以通过体外转译和转录(IVTT)来合成蛋白质。可以修饰孔的氨基酸序列以包含非天然存在的氨基酸或增加蛋白质的稳定性。当通过合成手段来生产蛋白质时,可以在生产期间引入此类氨基酸。在合成或重组生产后,孔也可以改变。
本文所描述的如跨膜蛋白孔等任何蛋白质可以使用本领域已知的标准方法生产。编码孔或构建体的多核苷酸序列可以使用本领域的标准方法衍生和复制。编码孔或构建体的多核苷酸序列可以使用本领域的标准技术在细菌宿主细胞中表达。可以通过从重组表达载体原位表达多肽在细胞中产生孔。表达载体任选地携带诱导型启动子以控制多肽的表达。这些方法在Sambrook,J.和Russell,D.(2001年),《分子克隆:实验室手册(MolecularCloning:A Laboratory Manual)》,第3版,冷泉港实验室出版社(Cold Spring HarborLaboratory Press),纽约冷泉港(Cold Spring Harbor,NY.)中描述。
可以在从蛋白质产生生物体通过任何蛋白质液相色谱系统纯化之后或在重组表达之后,大规模生产孔。典型的蛋白质液相色谱系统包含FPLC、AKTA系统、Bio-Cad系统、Bio-Rad生物系统和Gilson HPLC系统。
微粒
微粒可以用于将靶多核苷酸递送到跨膜孔。可以在本发明的方法中使用任何数量的微粒。例如,本发明的方法可以使用单个微粒或2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、50个、100个、1,000个、5,000个、10,000个、100,000个、500,000个或1,000,000个或更多个微粒。如果使用两个或更多个微粒,则微粒可以是相同的。可替代地,可以使用不同微粒的混合物。
每个微粒可以附接一个多核苷酸。可替代地,每个微粒可以具有两个或更多个多核苷酸,如3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个、10个或更多个、20个或更多个、30个或更多个、50个或更多个、100个或更多个、500个或更多个、1,000个或更多个、5,000个或更多个、10,000个或更多个、100,000个或更多个、1000,000个或更多个、或5000,000个或附接更多个多核苷酸。微粒可以被多核苷酸基本上或完全涂覆或覆盖。微粒可以具有连接在其基本上全部或全部表面上的多核苷酸。微粒可以通过衔接子与多核苷酸附接。衔接子可以是Y衔接子或发夹衔接子(见下文)。
多核苷酸,即多核苷酸的单个实例,可以附接到两个或更多个微粒上。多核苷酸,即多核苷酸的单个实例,可以附接到上文论述的任何数量的微粒上。
微粒是微观粒子,其大小通常以微米(μm)测量。微粒也可以被称为微球或微珠。微粒可以是纳米颗粒。纳米颗粒是微观颗粒,其大小通常以纳米(nm)测量。
微粒通常具有约0.001μm到约500μm的粒径。例如,纳米颗粒可以具有约0.01μm到约200μm或约0.1μm到约100μm的粒径。更常见的是,微粒具有约0.5μm到约100μm,或例如约1μm到约50μm的粒径。微粒可以具有约1nm到约1000nm,如约10nm到约500nm、约20nm到约200nm或约30nm到约100nm的粒径。
微粒可以是球形或非球形。球形微粒可以被称为微球。非球形颗粒可以是例如板状、针状、不规则状或管状。如本文所使用的,术语“粒径”是指颗粒的直径,如果颗粒是球形的,或者如果颗粒是非球形的,则是指基于体积的颗粒大小。基于体积的粒径是球体的直径,其具有与所论述的非球形粒子相同的体积。
如果在所述方法中使用两种或更多种微粒,则微粒的平均粒径可以是上文所论述的任何大小,如约0.5μm到约500μm。两个或更多个微粒的群体优选地具有10%或更小的变异系数(标准偏差与平均值的比率),如5%或更小或2%或更小。
可以使用任何方法来确定微粒的大小。合适的方法包含但不限于流式细胞术(参见例如,Chandler等人,《血栓形成与止血期刊(J Thromb Haemost.)》2011年6月,9(6):1216-24)。
微粒可以由任何材料形成。所述微粒优选地由陶瓷形成,玻璃、二氧化硅、聚合物或金属。聚合物可以是天然聚合物,如聚羟基链烷酸酯、葡聚糖、聚丙交酯、琼脂糖、纤维素、淀粉或壳聚糖,或合成聚合物,如聚氨酯、聚苯乙烯、聚(氯乙烯)、硅烷或甲基丙烯酸酯。合适的微粒是本领域已知的并且是可商购的。陶瓷和玻璃微球可从
Figure GDA0001880175020000212
商购获得。二氧化硅和聚合物微粒可从EPRUI Nanoparticles&Microspheres Co.Ltd.商购获得。微粒也可从Polysciences Inc.、Bangs Laboratories Inc.和Life Technologies商购获得。
微粒可以是固体的。微粒可以是中空的。微粒可以由聚合物纤维形成。
微粒可以衍生自用于提取和分离多核苷酸的试剂盒。
微粒的表面可以与多核苷酸相互作用并且附接多核苷酸。所述表面可以与多核苷酸天然地相互作用而不进行官能化。通常将微粒的表面官能化以促进多核苷酸的附接。合适的官能化是本领域已知的。例如,微粒的表面可以用多组氨酸标签(六组氨酸标签、6xHis-标签、His6标签或
Figure GDA0001880175020000211
)、Ni-NTA、链霉抗生物素蛋白、生物素、寡核苷酸、多核苷酸(如DNA、RNA、PNA、GNA、TNA或LNA)、羧基、季胺基、硫醇基、叠氮基、炔基、DIBO、脂质、FLAG-标签(FLAG八肽、多核苷酸结合蛋白(包含下文所论述的任何一种)、肽、蛋白质、抗体或抗体片段进行官能化。下文更详细地论述了抗体片段。微粒还可以用下文参考附接所论述的任何连接子或基团进行官能化。
微粒可以用特异性结合多核苷酸的分子或基团进行官能化。在这种情况下,将要附接于微粒并且递送到跨膜孔的多核苷酸可以被称为靶多核苷酸。这允许微粒从含有其它多核苷酸的样品中选择或捕获靶多核苷酸。如果分子或基团以优先或高亲和力结合靶多核苷酸,则其特异性结合靶多核苷酸,但不与其它多核苷酸或不同的多核苷酸以低亲和力结合或仅与其它多核苷酸或不同的多核苷酸以低亲和力结合。如果分子或基团以1x 10-6M或更少、更优选地1x 10-7M或更少、5x 10-8M或更少、更优选地1x 10-8M或更少或更优选地5x10-9M或更少的Kd结合,则所述分子或基团以优先或高亲和力结合。如果分子或基团以1x10-6M或更多、更优选地1x 10-5M或更多、更优选地1x 10-4M或更多、更优选地1x 10-3M或更多、甚至更优选地1x 10-2M或更多的Kd结合,则所述分子或基团以低亲和力结合。
优选地,所述分子或基团与靶多核苷酸结合的亲和力是其对其它多核苷酸的亲和力的至少10倍,如至少50倍、至少100倍、至少200倍、至少300倍、至少400倍、至少500倍、至少1000倍或至少10,000倍。可以使用已知的结合测定来测量亲和力,如利用荧光和放射性同位素的结合测定。竞争性结合测定也是本领域已知的。肽或蛋白质与多核苷酸之间的结合强度可以使用如Hornblower等人,《自然方法(Nature Methods)》,4:315-317.(2007年),
微粒可以用寡核苷酸或多核苷酸(如上文论述的任何一种)进行功能化,所述寡核苷酸或多核苷酸与靶多核苷酸特异性杂交或包括与靶多核苷酸的一部分或区互补的部分或区。这允许微粒从含有其它多核苷酸的样品中选择或捕获靶多核苷酸。当寡核苷酸或多核苷酸与靶多核苷酸具有优先或高亲和力杂交,但没有实质上的杂交、没有杂交或与其它多核苷酸只具有低亲和力的杂交时,所述寡核苷酸或多核苷酸就会特异性地与靶多核苷酸杂交。如果寡核苷酸或多核苷酸与靶多核苷酸以熔解温度(Tm)至少为2℃,如至少3℃、至少4℃、至少5℃、至少6℃、至少7℃、至少8℃、至少9℃或至少10℃杂交,高于其它序列的Tm,则所述寡核苷酸或多核苷酸会发生特异性杂交。更优选地,寡多核苷酸或多核苷酸与靶多核苷酸杂交,其中Tm高于其与其它核酸的Tm至少2℃,如至少3℃、至少4℃、至少5℃、至少6℃、至少7℃、至少8℃、至少9℃、至少10℃、至少20℃、至少30℃或至少40℃。优选地,对于与靶多核苷酸相差一个或多个核苷酸,如1个、2个、3个、4个或5个或更多个核苷酸的序列,寡多核苷酸或多核苷酸与靶多核苷酸以高于与该序列的Tm至少2℃,如至少3℃、至少4℃、至少5℃、至少6℃、至少7℃、至少8℃、至少9℃、至少10℃、至少20℃、至少30℃或至少40℃的Tm杂交。寡核苷酸或多核苷酸通常与靶多核苷酸以Tm为至少90℃杂交,如至少92℃或至少95℃。Tm可以使用已知技术通过实验测量,包含使用DNA微阵列,或者可以使用公众可获得的Tm计算器计算,如可通过因特网获得的计算器。
允许杂交的条件是本领域公知的(例如,Sambrook等人,2001年,《分子克隆:实验室手册》,第3版,冷泉港实验室出版社;以及《当代分子生物学实验手册(CurrentProtocols in Molecular Biology)》,第2章,Ausubel等人编辑,格林出版与威利交叉科学出版社(Greene Publishing and Wiley-lnterscience),纽约,(1995年))。杂交可以在低严格条件下进行,例如在37℃下存在30%到35%甲酰胺,1M NaCl和1%SDS(十二烷基硫酸钠)的缓冲溶液,然后在50℃下从1X(0.1650M Na+)到2X(0.33M Na+)SSC(标准柠檬酸钠)中洗涤20次。杂交可以在低严格条件下进行,例如在37℃下存在40%到45%甲酰胺,1M NaCl和1%SDS的缓冲溶液,然后在55℃下从0.5X(0.0825M Na+)到1X(0.1650M Na+)SSC中洗涤。杂交可以在低严格条件下进行,例如在37℃下存在50%甲酰胺,1M NaCl和1%SDS的缓冲溶液,然后在60℃下在0.1X(0.0165M Na+)SSC中洗涤。
寡核苷酸或多核苷酸可以包括与靶多核苷酸的部分或区基本上互补的部分或区。因此,与靶多核苷酸中的部分或区相比,寡核苷酸或多核苷酸的区或部分可以在5个、10个、15个、20个、21个、22个、30个、40个或50个核苷酸的区上具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个错配。
区的一部分通常为50个核苷酸或更少,如40个核苷酸或更少、30个核苷酸或更少、20个核苷酸或更少、10个核苷酸或更少或5个核苷酸或更少。
微粒优选地是顺磁性或磁性的。微粒优选地包括顺磁性或超顺磁性材料或顺磁性或超顺磁性金属,如铁。可以使用任何合适的磁性微粒。例如,可以使用可从例如Clontech、Promega、Invitrogen ThermoFisher Scientific和NEB商购的磁珠。在一些实施例中,微粒包括附接如金属螯合基团等有机基团的磁性颗粒,如次氮基三乙酸(NTA)。例如,有机组分可以包括选自由以下组成的组:-C(=O)O-、-C-O-C-、-C(=O)-、-NH-、-C(=O)-NH、-C(=O)-CH2-I、-S(=O)2-和-S-。有机组分可以包括金属螯合基团,如NTA(次氮基三乙酸)。通常,如金、铁、镍或钴等金属也附接在金属螯合基团上。这种磁珠通常用于捕获带His标签的蛋白质,但也适用于本发明。
微粒最优选是可从Life Technologies商购的His-Tag
Figure GDA0001880175020000231
来自IBA的MagStrep珠、来自NEB的链霉抗生物素蛋白磁珠、来自Beckman Coulter或
Figure GDA0001880175020000232
MyOneTM链霉抗生物素蛋白C1(ThermoFisher Scientific)的固相可逆固定化(Solid PhaseReversible Immobilization)(SPRI)珠或Agencourt AMPure XP珠。
偶联
第一靶多核苷酸和/或一个或多个后续靶多核苷酸优选地包括一个或多个能够与膜偶联的锚。所述方法优选地另外包括使用一种或多种锚将靶多核苷酸偶联到膜。
锚包括与多核苷酸偶联(或结合)的基团和与膜偶联(或结合)的基团。每个锚可以共价偶联(或结合)多核苷酸和/或膜。
可以使用任何数量的锚将多核苷酸偶联到膜上,如2个、3个、4个或更多个锚。例如,可以使用两个锚将多核苷酸偶联到膜上,每个锚分别与多核苷酸和膜偶联(或结合)。
一个或多个锚可以包括一个或多个分子刹车。每个锚可以包括一个或多个分子刹车。一个或多个分子刹车可以是下文论述的任何一种。
如果膜是如三嵌段共聚物膜等两亲层,则一种或多种锚优选地包括存在于膜中的多肽锚和/或存在于膜中的疏水性锚。疏水性锚优选地是脂质、脂肪酸、固醇、碳纳米管、多肽、蛋白质或氨基酸,例如胆固醇、棕榈酸或生育酚。在优选的实施例中,一个或多个锚不是孔。
如两亲分子、共聚物或脂质等膜的组分可以进行化学修饰或官能化以形成一个或多个锚。下文更详细地论述合适的化学修饰和使膜组分官能化的合适方式的实例。可以对任何比例的膜组分进行官能化,例如至少0.01%、至少0.1%、至少1%、至少10%、至少25%、至少50%或100%。
多核苷酸可以直接与膜偶联。用于将多核苷酸偶联到膜的一个或多个锚优选地包括连接子。一个或多个锚可以包括一个或多个连接子,如2个、3个、4个或更多个。可以使用一个连接子将多于一个,如2个、3个、4个或更多个多核苷酸偶联到膜上。
优选连接子包括(但不限于)聚合物,如多核苷酸、聚乙二醇(PEG)、多糖和多肽。这些连接子可以是线性、分支链或环状的。例如,连接子可以是环状多核苷酸。多核苷酸可以与环状多核苷酸连接子上的互补序列杂交。
一或多个锚或一或多个连接子可以包括可以进行剪切或分解的组分,如限制位点或光不稳定性基团。
官能化连接子和其可以偶联分子的方式在本领域中是已知的。例如,用马来酰亚胺基团官能化的连接子将与蛋白质中的半胱氨酸残基反应并且附接。在本发明的上下文中,蛋白质可以存在于膜中,可以是多核苷酸本身或可以用于偶联(或结合)多核苷酸。在下文中更详细地论述这一点。
可以使用“锁和钥”布置来避免多核苷酸的交联。各连接子的仅一端可以一起反应以形成较长连接子,并且连接子的另一端各自分别与多核苷酸或膜反应。此类连接子在国际申请号PCT/GB10/000132(公开为WO 2010/086602)中描述。
在下文论述的测序实施例中,连接子的使用是优选的。如果在与孔相互作用时,多核苷酸是永久性地直接偶联到膜上,从某种意义上说所述多核苷酸不会解耦,则由于膜与孔之间的距离,测序运行不能继续到多核苷酸的端,因此一些序列数据将丢失。如果使用连接子,则多核苷酸可以得到完全处理。
偶联可以是永久的或稳定的。换句话说,偶联可以使得多核苷酸在与孔相互作用时保持与膜偶联。
偶联可以是暂时的。换句话说,偶联可以使得多核苷酸在与孔相互作用时可以与膜解耦。对于如适体检测和多核苷酸测序等某些应用,暂时性质的偶联是优选的。如果永久性或稳定连接子直接连接到多核苷酸的5’端或3’端,并且连接子比膜与跨膜孔的通道之间的距离短,则在测序操作不能持续到多核苷酸的端时,一些序列数据将丢失。如果偶联是暂时的,然后当偶联的端随机变为不含膜时,则多核苷酸可以得到处理完全。形成永久性/稳定或暂时连接的化学基团在下文更详细地论述。使用胆固醇或脂肪酰基链,多核苷酸可以与两亲层或三嵌段共聚物膜暂时偶联。可以使用长度为6个到30个碳原子的任何脂肪酰基链,如十六烷酸。
在优选实施例中,多核苷酸(如核酸)与两亲层(如三嵌段共聚物膜或脂质双层)偶联。先前已经用各种不同网络共享的策略进行核酸与合成脂质双层的偶联。这些总结在下文表2中。
表2
Figure GDA0001880175020000241
Figure GDA0001880175020000251
合成多核苷酸和/或连接子可以在合成反应中使用修饰胺基磷酸酯来官能化,所述修饰胺基磷酸酯容易地与直接添加合适的锚定基团相容,所述锚定基团如,胆固醇、生育酚、棕榈酸、巯基、脂质和生物素基团。这些不同的附接化学物质为多核苷酸的附接提供了一套选择。每个不同的修饰基团以稍微不同的方式偶联多核苷酸,并且偶联未必总是永久性的,因此给予多核苷酸到膜的不同停留时间。暂时偶联的优势在上文论述。
多核苷酸与连接子或与官能化膜的偶联还可以通过多种其它手段来实现,条件是可以将互补反应基团或锚定基团添加到多核苷酸中。先前已经报道了向多核苷酸的任一端添加反应性基团。可使用T4多核苷酸激酶和ATPγS向ssDNA或dsDNA的5'中添加巯基(Grant,G.P.和P.Z.Qin(2007年),“《一种用于在核酸的5’末端处附接氮氧化物自旋标记的简易方法(A facile method for attaching nitroxide spin labels at the 5’terminus of nucleic acids)》”,《核酸研究(Nucleic Acids Res)》,35(10):e77)。可以使用T4多核苷酸激酶和γ-[2-叠氮基乙基]-ATP或γ-[6-叠氮基己基]-ATP向ssDNA或dsDNA的5’-磷酸中添加叠氮基团。使用巯基或点击化学,含有巯基、碘乙酰胺OPSS或马来酰亚胺基团(与巯基具有反应性)或DIBO(二苯并环氧磷)或炔基(与叠氮化物具有反应性)的系链可以共价附接到多核苷酸上。可以使用末端转移酶添加更多样化选择的如生物素、硫醇和荧光团等化学基团以将修饰的寡核苷酸结合到ssDNA的3’中(Kumar,A.,P.Tchen等人,(1988年)。“《通过末端脱氧核苷酸转移酶对合成寡核苷酸探针进行非放射性标记(Nonradioactive labeling of synthetic oligonucleotide probes with terminaldeoxynucleotidyl transferase)》”,《分析生物化学(Anal Biochem)》,169(2):376-82)。抗生蛋白链菌素/生物素和/或抗生蛋白链菌素/脱硫生物素偶联可以用于任何其它多核苷酸。下文实例描述了如何使用链霉抗生物素蛋白/生物素和链霉抗生物素蛋白/脱硫生物素将多核苷酸偶联到膜上。还可以使用具有适当修饰的核苷酸(例如胆固醇或棕榈酸酯)的末端转移酶将锚直接添加到多核苷酸。
一个或多个锚优选地通过杂交将多核苷酸偶联到膜上。杂交可以存在于一个或多个锚的任何部分中,如在一个或多个锚与多核苷酸之间,在一个或多个锚内或在一个或多个锚与膜之间。如上文所论述的,在一个或多个锚中的杂交允许以暂时方式进行偶联。例如,连接子可以包括两个或更多个杂交在一起的多核苷酸,如3个、4个或5个多核苷酸。一或多个锚可以与多核苷酸杂交。一个或多个锚可以直接与多核苷酸杂交,或直接与Y衔接子和/或附接于多核苷酸的前导序列杂交,或直接与附接于多核苷酸的发夹环衔接子杂交(如下文所论述的)。可替代地,一个或多个锚可以与一个或多个(如2个或3个)中间多核苷酸(或“夹板”)杂交,所述中间多核苷酸与多核苷酸杂交,与附接于多核苷酸的Y衔接子和/或前导序列杂交,或与附接于多核苷酸的发夹环衔接子杂交(如下文所论述的)。
一个或多个锚可以包括单链或双链多核苷酸。锚的一部分可以连接到单链或双链多核苷酸分析物上。已经使用T4RNA连接酶I报道了短片ssDNA的连接(Troutt,A.B.,M.G.McHeyzer-Williams等人,(1992年)。“《接合锚定的PCR:具有单侧特异性的简单扩增技术(Ligation-anchored PCR:a simple amplification technique with single-sidedspecificity)》”.《美国国家科学院院刊(Proc Natl Acad Sci U S A)》,89(20):9823-5)。可替代地,可以将单链或双链多核苷酸连接到双链多核苷酸上,然后通过热或化学变性分离两条链。对于双链多核苷酸,可以将一条单链多核苷酸添加到双链体的一个或两个端,或将双链多核苷酸添加到一个或两个端。为了将单链多核苷酸添加到双链多核苷酸中,这可以使用T4RNA连接酶I实现,用于连接到单链多核苷酸的其它区。为了将双链多核苷酸添加到双链多核苷酸中,在多核苷酸上分别添加3’dA/dT尾部和所添加的多核苷酸(对于许多样品制备应用常规进行以防止多联体或二聚体形成)或使用通过限制性消化多核苷酸和连接相容的衔接子生成的“粘稠端”,则连接可以是“平端的”。接着,如果单链多核苷酸用于在5’端、3’端或两端(当双链多核苷酸用于连接时)处的接合或修饰,则当双螺旋熔融时,各个单链将具有5’或3’修饰。
如果多核苷酸是合成链,则可在化学合成多核苷酸期间结合一或多个锚。例如,可以使用具有附接于其的反应性基团的引物来合成多核苷酸。
腺苷酸化多核苷酸是接合反应中的中间物,其中单磷酸腺苷附接于多核苷酸的5’-磷酸。用于生成这种中间物的各种试剂盒是可获得的,如来自NEB的5’DNA腺苷酰化试剂盒。通过在反应中用ATP取代修饰的三磷酸核苷酸,然后向多核苷酸的5’添加反应基团(例如硫醇、胺、生物素、叠氮化物等)是可能的。还可以使用具有适当修饰的核苷酸(例如胆固醇或棕榈酸酯)的5’DNA腺苷酸化试剂盒将锚直接添加到多核苷酸中。
用于扩增基因组DNA区段的常见技术是使用聚合酶链式反应(PCR)。这里,使用两个合成的寡核苷酸引物,可以生成相同DNA区段的许多拷贝,其中对于每个拷贝,双链体中每条链的5’将是合成的多核苷酸。可以通过采用聚合酶将单个或多个核苷酸添加到单链或双链DNA的3’端。可以使用的聚合酶的实例包含但不限于末端转移酶、Klenow和大肠杆菌Poly(A)聚合酶)。通过在反应中用ATP取代修饰的三磷酸核苷酸,然后可以将如胆固醇、硫醇、胺、叠氮化物、生物素或脂质等锚结合到双链多核苷酸中。因此,扩增的多核苷酸的每个拷贝都含有锚。
理想地,多核苷酸与膜偶联而不必使多核苷酸官能化。这可以通过将一种或多种如分子刹车或化学基团等锚偶联到膜上并且使一种或多种锚与多核苷酸相互作用或通过使膜功能化来实现。一个或多个锚可以通过本文描述的任何方法偶联到膜。具体地,一个或多个锚可以包括一个或多个连接子,如马来酰亚胺官能化的连接子。
在此实施例中,多核苷酸通常是RNA、DNA、PNA、TNA或LNA,并且可以是双链或单链的。此实施例特别适用于基因组DNA多核苷酸。
所述一个或多个锚可以包括与单链或双链多核苷酸、多核苷酸内的特定核苷酸序列或多核苷酸内修饰的核苷酸的模式,或多核苷酸上存在的任何其它配体偶联、结合或相互作用的任何基团。
用于锚中的合适结合蛋白包括(但不限于):大肠杆菌单链结合蛋白、P5单链结合蛋白、T4gp32单链结合蛋白、TOPO V dsDNA结合区、人类组蛋白、大肠杆菌HU DNA结合蛋白,和其它古细菌、原核或真核单链或双链多核苷酸(或核酸)结合蛋白,包括下文所列的那些。
特异性核苷酸序列可以是由转录因子、核糖体、核酸内切酶、拓扑异构酶或复制起始因子识别的序列。修饰核苷酸的模式可以是甲基化模式或损坏模式。
所述一个或多个锚可以包括与多核苷酸偶联、结合、插入或相互作用的任何基团。基团可通过静电、氢结合或范德华力相互作用插入多核苷酸中或与其相互作用。此类基团包括赖氨酸单体、聚赖氨酸(其将与ssDNA或dsDNA相互作用)、溴化乙锭(其插入dsDNA)、通用碱基或通用核苷酸(其可与任何多核苷酸杂交)和锇络合物(其可与甲基化碱基反应)。因此,多核苷酸可以使用附接到膜的一或多个通用核苷酸而与膜偶联。各个通用核苷酸可以使用一或多个连接子而与膜偶联。通用核苷酸优选地包含以下核碱基中的一个:次黄嘌呤、4-硝基吲哚、5-硝基吲哚、6-硝基吲哚、甲酰基吲哚、3-硝基吡咯、硝基咪唑、4-硝基吡唑、4-硝基苯并咪唑、5-硝基吲唑、4-氨基苯并咪唑或苯基(C6-芳环)。通用核苷酸更优选地包括以下核苷中的一个:2’-脱氧肌苷、肌苷、7-脱氮-2’-脱氧肌苷、7-脱氮-肌苷、2-氮杂-脱氧肌苷、2-氮杂-肌苷、2-O’-甲基肌苷、4-硝基吲哚2’-脱氧核苷、4-硝基吲哚核苷、5-硝基吲哚2’--脱氧核苷、5-硝基吲哚核苷、6-硝基吲哚2’-脱氧核苷、6-硝基吲哚核苷、3-硝基吡咯2’-脱氧核苷、3-硝基吡咯核苷、次黄嘌呤的非环糖类似物、硝基咪唑2’--脱氧核苷、硝基咪唑核苷、4-硝基吡唑2’--脱氧核苷、4-硝基吡唑核苷、4-硝基苯并咪唑2’--脱氧核苷、4-硝基苯并咪唑核苷、5-硝基吲唑2’--脱氧核苷、5-硝基吲唑核苷、4-氨基苯并咪唑2’--脱氧核苷、4-氨基苯并咪唑核苷、苯基C-核苷、苯基C-2’-脱氧核糖基核苷、2’-脱氧烟云杯伞素、2’-脱氧异鸟苷、K-2’-脱氧核苷、P-2’-脱氧核苷和吡咯烷。通用核苷酸更优选地包括2’-脱氧肌苷。通用核苷酸更优选地是IMP或dIMP。通用核苷酸最优选地是dPMP(2’-脱氧-P-核苷单磷酸)或dKMP(N6-甲氧基-2,6-二氨基嘌呤单磷酸)。
一或多个锚可以通过Hoogsteen氢键(其中两个核碱基通过氢键保持在一起)或反向Hoogsteen氢键(其中一个核碱基相对于其它核碱基旋转180°)与多核苷酸偶联(或结合)。例如,一或多个锚可以包括与多核苷酸形成Hoogsteen氢键或反向Hoogsteen氢键的一或多个核苷酸、一或多个寡核苷酸或一或多个多核苷酸。这些类型的氢键允许第三多核苷酸链缠绕双链螺旋并且形成三链体。通过与双链双螺旋形成三链螺旋,一或多个锚可与双链多核苷酸偶联(或结合)。
在此实施例中,至少1%、至少10%、至少25%、至少50%或100%的膜组分可以进行官能化。
当一个或多个锚包括蛋白质时,所述一或多个锚可以能够直接锚定到膜中而无需进一步官能化,例如当其已具有与膜相容的外部疏水区时。此类蛋白质的实例包括(但不限于)跨膜蛋白质、膜内蛋白质和膜蛋白。可替代地,蛋白质可以用与膜相容的遗传融合的疏水区表达。这种疏水蛋白质区是本领域已知的。
优选地在递送到膜之前将一种或多种锚与多核苷酸混合,但是一种或多种锚可以与膜接触并且随后与多核苷酸接触。
在另一方面,可以使用上文所描述的方法使多核苷酸官能化,使得其可以被特异性结合基团识别。具体地说,多核苷酸可以用配体进行官能化,所述配体如,生物素(用于结合于抗生蛋白链菌素)、直链淀粉(用于结合于麦芽糖结合蛋白或融合蛋白)、Ni-NTA(用于结合于聚组氨酸或聚组氨酸标签的蛋白质)或肽(如抗原)。
根据优选的实施例,一个或多个锚可以用于当多核苷酸附接到前导序列时将多核苷酸与膜偶联,所述前导序列优选地螺旋到孔中。前导序列在下文更详细地论述。优选地,多核苷酸与前导序列附接(如连接),所述前导序列优先穿入孔中。这种前导序列可以包括同聚多核苷酸或无碱基区。前导序列通常被设计成直接与一个或多个锚杂交,或通过一个或多个中间多核苷酸(或夹板)与所述一个或多个锚杂交。在此类情况下,一或多个锚通常包含与前导序列中的序列或一或多个中间多核苷酸(或夹板)中的序列互补的多核苷酸序列。在此类情况下,一个或多个夹板通常包括与前导序列中的序列互补的多核苷酸序列。
上文论述的用于将多核苷酸偶联到如两亲层等膜上的任何方法当然可以应用于其它多核苷酸和膜组合。在一些实施例中,氨基酸、肽、多肽或蛋白质与如三嵌段共聚物层或脂质双层等两亲层偶联。可以获得这些多核苷酸的化学附接的各种方法。化学附接中使用的分子的实例是EDC(1-乙基-3-[3-二甲基胺基丙基]碳化二亚胺盐酸盐)。还可以使用可商购的试剂盒(Thermo Pierce,产品号22980)来向多核苷酸的5’中添加反应性基团。合适的方法包含但不限于使用组氨酸残基和Ni-NTA的暂时亲和力附接,以及通过反应性半胱氨酸、赖氨酸或非天然氨基酸的更稳健的共价附接。
多核苷酸表征
本发明的方法涉及表征靶多核苷酸。在靶多核苷酸与孔接触后,当连接的多核苷酸相对于孔移动时,采用指示靶多核苷酸的一个或多个特性的一种或多种测量。
多核苷酸可以是天然存在的或人工的。例如,所述方法可以用于验证两种或更多种制造的寡核苷酸的序列。所述方法通常在体外进行。
所述方法可以涉及测量每种多核苷酸的两个、三个、四个或五个或更多个特性。一个或多个特性优选地是选自:(i)多核苷酸的长度,(ii)多核苷酸的一致性,(iii)多核苷酸的序列,(iv)多核苷酸的二级结构,以及(v)多核苷酸是否被修饰。可以根据本发明来测量(i)到(v)的任何组合,如:{i}、{ii}、{iii}、{iv}、{v}、{i,ii}、{i,iii}、{i,iv}、{i,v}、{ii,iii}、{ii,iv}、{ii,v}、{iii,iv}、{iii,v}、{iv,v}、{i,ii,iii}、{i,ii,iv}、{i,ii,v}、{i,iii,iv}、{i,iii,v}、{i,iv,v}、{ii,iii,iv}、{ii,iii,v}、{ii,iv,v}、{iii,iv,v}、{i,ii,iii,iv}、{i,ii,iii,v}、{i,ii,iv,v}、{i,iii,iv,v}、{ii,iii,iv,v}或{i,ii,iii,iv,v}。
对于(i),可以例如通过确定多核苷酸与孔之间的相互作用的数量或多核苷酸与孔之间的相互作用的持续时间来测量多核苷酸的长度。
对于(ii),可以以多种方式来测量多核苷酸的一致性。可以结合测量多核苷酸的序列或不测量多核苷酸的序列来测量多核苷酸的一致性。前者是很简单的;测序多核苷酸并且由此进行鉴定。可以以若干方式进行后者。举例来说,可测量多核苷酸中的特定基序的存在(而不测量多核苷酸的残余序列)。可替代地,所述方法中的特定电子信号和/或光学信号的测量可以鉴定来自特定来源的多核苷酸。
对于(iii),可如先前所描述来测定多核苷酸的序列。在Stoddart D等人,《美国国家科学院院刊(Proc Natl Acad Sci)》,2012年,第106卷,第19期,第7702到7707页;Lieberman KR等人,《美国化学会志(J Am Chem Soc)》,2010年,132(50):17961-72,以及国际申请号WO 2000/28312中描述了适当的测序方法,尤其是使用电测量的测序方法。
对于(iv),可以以多种方式测量二级结构。例如,如果所述方法涉及电测量,则可以使用停留时间的变化或流过孔的电流的变化来测量二级结构。这允许区分单链多核苷酸和双链多核苷酸的区。
对于(v),可测量是否存在任何修饰。所述方法优选地包括,用一或多个蛋白质或用一或多个标记、标签或间隔区确定多核苷酸是否通过甲基化、通过氧化、通过损坏来修饰。特异性修饰将引起与可以使用下文所描述的方法测量的孔的特异性相互作用。例如,可以基于在孔与各核苷酸相互作用期间流过孔的电流将甲基胞嘧啶与胞嘧啶区分开。
可以使用适合于研究膜/孔系统的任何设备来进行所述方法,其中孔存在于膜中。可以使用适合于跨膜孔感测的任何设备来进行所述方法。例如,设备包括腔室,所述腔室包括水溶液和将腔室分成两个区段的屏障。屏障通常具有开孔,在开孔中形成含有孔的膜。可替代地,屏障形成其中存在孔的膜。
可以使用在国际申请号PCT/GB08/000562(WO 2008/102120)中描述的设备执行所述方法。
可以进行各种不同类型的测量。这包含但不限于:电测量和光学测量。在《美国化学学会期刊(J.Am.Chem.Soc.)》2009年,131 1652-1653中公开了涉及荧光测量的适当光学方法。可能的电测量包含:电流测量、阻抗测量、隧道测量(Ivanov AP等人,《纳米快报(NanoLett.)》,2011年1月12日;11(1):279-85)和FET测量(国际申请号WO 2005/124888)。光学测量可以与电测量组合(Soni GV等人,《科学仪器综述(Rev Sci Instrum.)》,2010年1月;81(1):014301)。测量可以是跨膜电流测量,如测量流过孔的离子电流。
可以使用如以下文献中描述的标准单通道记录设备来进行电测量:
Stoddart D等人,《美国国家科学院院刊》,2012年,106(19):7702-7,LiebermanKR等人,《美国化学学会期刊》,2010年,132(50):17961-72,以及国际申请号
WO 2000/28312。可替代地,可以使用多通道系统来进行电测量,
例如如国际申请号WO 2009/077734和国际申请号WO 2011/067559中所描述的。
所述方法优选地在跨膜施加电势的情况下进行。所施加的电势可以为电压电势。可替代地,所施加的电势可以为化学电势。此的实例是在膜(如两亲层)两端使用盐梯度。盐梯度在Holden等人,《美国化学学会期刊》2007年7月11日;129(27):8650-5中公开。在一些例子中,在多核苷酸相对于孔移动时穿过孔的电流用于评估或确定多核苷酸的序列。这是链测序。
所述方法可以涉及在多核苷酸相对于孔移动时测量穿过孔的电流。因此,所述设备还可以包括能够施加电势并且测量跨膜和孔的电信号的电路。可以使用贴片钳或电压钳来进行所述方法。所述方法优选地涉及使用电压钳。
本发明的方法可以涉及在多核苷酸相对于孔移动时测量穿过孔的电流。用于测量通过跨膜蛋白孔的离子电流的适当条件在本领域中是已知的并且在实例中公开。所述方法通常在跨膜和孔施加电压的情况下进行。所使用的电压通常是+5V到-5V,如+4V到-4V、+3V到-3V,或+2V到-2V。所使用的电压通常是-600mV到+600mV或-400mV到+400mV。所使用的电压优选地在具有下限和上限的范围内,下限选自:-400mV、-300mV、-200mV、-150mV、-100mV、-50mV、-20mV和0mV,上限独立地选自:+10mV、+20mV、+50mV、+100mV、+150mV、+200mV、+300mV和+400mV。所使用的电压更优选地在100mV到240mV的范围内,并且最优选在120mV到220mV的范围内。通过使用增加的施加电势,可以通过孔增加不同核苷酸之间的区分。
通常在存在任何电荷载流子的情况下进行所述方法,所述电荷载流子如金属盐,例如碱金属盐;卤盐,例如如碱金属氯化物盐等氯化物盐。电荷载流子可以包含离子液体或有机盐,例如四甲基氯化铵、三甲基苯基氯化铵、苯基三甲基氯化铵或1-乙基-3-甲基氯化咪唑鎓。在上文论述的示例性设备中,盐存在于腔室中的水溶液中。通常使用氯化钾(KCl)、氯化钠(NaCl)、氯化铯(CsCl),或亚铁氰化钾和铁氰化钾的混合物。优选的KCl、NaCl以及亚铁氰化钾和铁氰化钾的混合物。电荷载流子可以是跨膜不对称的。例如,电荷载流子的类型和/或浓度可以在膜的各侧上不同。
盐浓度可以是饱和的。盐浓度可以是3M或更低,并且通常0.1到2.5M、0.3到1.9M、0.5到1.8M、0.7到1.7M、0.9到1.6M或1M到1.4M。盐浓度优选地是150mM到1M。优选地使用至少0.3M的盐浓度来进行所述方法,如至少0.4M、至少0.5M、至少0.6M、至少0.8M、至少1.0M、至少1.5M、至少2.0M、至少2.5M或至少3.0M。高盐浓度提供高信噪比并且允许在正常电流波动的背景下识别指示核苷酸存在的电流。
通常在存在缓冲液的情况下进行所述方法。在上文论述的示例性设备中,缓冲液存在于腔室中的水溶液中。在本发明的方法中可以使用任何缓冲液。通常,缓冲液是磷酸盐缓冲液。其它合适的缓冲液是HEPES和Tris-HCl缓冲液。通常在以下的pH下来进行所述方法:4.0到12.0、4.5到10.0、5.0到9.0、5.5到8.8、6.0到8.7或7.0到8.8或7.5到8.5。所使用的pH优选地为约7.5。
可以在以下温度下进行所述方法:0℃到100℃、15℃到95℃、16℃到90℃、17℃到85℃、18℃到80℃、19℃到70℃或20℃到60℃。通常在室温下进行所述方法。任选地在支持酶功能的温度进行所述方法,如约37℃下进行。
分子刹车
链测序可以涉及使用分子刹车来控制移动所述多核苷酸通过孔。分子刹车优选在其与跨膜孔接触之前与第一靶多核苷酸结合,并且蛋白质控制整个连接的多核苷酸通过孔的运动。如下所述,分子刹车可以连接到第一靶多核苷酸上存在的Y衔接子。一种或多种后续多核苷酸优选在它们与第一靶多核苷酸连接之前不具有与它们结合的分子刹车。
可以使用任何分子刹车,包含国际申请号PCT/GB2014/052737(公开为WO 2015/110777)中公开的任何分子刹车。
分子刹车优选地是多核苷酸结合蛋白。多核苷酸结合蛋白可以是能够结合到多核苷酸并且控制其移动穿过孔的任何蛋白质。在本领域中确定蛋白质是否结合到多核苷酸是很简单的。蛋白质通常与多核苷酸的至少一种性质相互作用并且修饰其至少一种性质。蛋白质可通过裂解多核苷酸形成个别核苷酸或较短核苷酸链(如二或三核苷酸)来修改多核苷酸。所述部分可通过将多核苷酸定位或移动到特异性位置(即控制其移动)来修改多核苷酸。
多核苷酸结合蛋白优选地衍生自多核苷酸操作酶。多核苷酸操作酶是能够与多核苷酸相互作用并且修饰其的至少一个性质的多肽。酶可以通过裂解多核苷酸以形成单个核苷酸或如二核苷酸或三核苷酸等更短的核苷酸链来修饰多核苷酸。所述酶可以通过将多核苷酸定向或将其移动到特定位置来修饰多核苷酸。多核苷酸操作酶并不需要显示酶促活性,只要其能够结合多核苷酸并且控制其移动通过孔即可。例如,酶可以进行修饰以移除其酶促活性或可以在防止其充当酶的条件下使用。下文更详细地论述了这种条件。
多核苷酸处理酶优选地衍生自溶核酶。在酶的构建体中使用的多核苷酸处理酶更优选地衍生自以下酶分类(EC)组中的任何组的成员:3.1.11、3.1.13、3.1.14、3.1.15、3.1.16、3.1.21、3.1.22、3.1.25、3.1.26、3.1.27、3.1.30和3.1.31。所述酶可以是国际申请号PCT/GB10/000133(公开为WO 2010/086603)中公开的酶中的任何酶。
优选的酶是聚合酶、核酸外切酶、解旋酶和拓扑异构酶,如旋转酶。合适酶包含但不限于来自大肠杆菌的核酸外切酶I(SEQ ID NO:11)、来自大肠杆菌的核酸外切酶III(SEQID NO:13)、来自极端嗜热菌的RecJ(SEQ ID NO:15)和噬菌体λ核酸外切酶(SEQ ID NO:17)、TatD核酸外切酶和其变体。包括SEQ ID NO:15中所示序列的三个亚基或其变体相互作用以形成三聚体核酸外切酶。聚合酶可以是
Figure GDA0001880175020000312
3173DNA聚合酶(其可商购自
Figure GDA0001880175020000311
公司)、SD聚合酶(可商购自
Figure GDA0001880175020000313
)或其变体。酶优选地是Phi29DNA聚合酶(SEQID NO:9)或其变异体。拓扑异构酶优选地是任何Moiety Classification(EC)组5.99.1.2和5.99.1.3的成员。
所述酶最优选地衍生自解旋酶。解旋酶可以是或衍生自Hel308解旋酶、如Tral解旋酶或TrwC解旋酶等RecD解旋酶、XPD解旋酶或Dda解旋酶。解旋酶可以是或衍生自Hel308Mbu(SEQ ID NO:18)、Hel308Csy(SEQ ID NO:19)、Hel308Tga(SEQ ID NO:20)、Hel308Mhu(SEQ ID NO:21)、TraI Eco(SEQ ID NO:22)、XPD Mbu(SEQ ID NO:23)或其变体。
解旋酶可以是在以下国际申请号中公开的解旋酶、经修饰解旋酶或解旋酶构建体中的任一者:PCT/GB2012/052579(公开为WO 2013/057495);PCT/GB2012/053274(公开为WO2013/098562);PCT/GB2012/053273(公开为WO2013098561);PCT/GB2013/051925(公开为WO2014/013260);PCT/GB2013/051924(公开为WO 2014/013259);PCT/GB2013/051928(公开为WO 2014/013262)以及PCT/GB2014/052736(公开为WO/2015/055981)。
解旋酶优选地包括SEQ ID NO:25中所示的序列(Trwc Cba)或其变体、SEQ ID NO:18中所示的序列(Hel308Mbu)或其变体、或SEQ ID NO:24中所示的序列(Dda)或其变体。变体可以以下文论述的用于跨膜孔的任何方式与天然序列不同。SEQ ID NO:24的优选的变体包括:(a)E94C和A360C;或(b)E94C、A360C、C109A和C136A,并且然后任选地(ΔM1)G1(即缺失M1并且然后添加G1)。其也可以被称为M1G。上文论述的任何变体可以进一步包括M1G。
Dda解旋酶优选地包括国际申请号PCT/GB2014/052736和PCT/GB2015/052916(公开号WO/2015/055981和WO 2016/055777)中公开的任何修饰。
根据本发明可以使用任何数量的解旋酶。例如,可以使用1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个解旋酶。在一些实施例中,可以使用不同数量的解旋酶。
本发明的方法优选地包括使多核苷酸与两个或更多个解旋酶接触。两个或更多个解旋酶通常是相同的解旋酶。两个或更多个解旋酶可以是不同的解旋酶。
两个或更多个解旋酶可以是上文提到的解旋酶的任何组合。两个或更多个解旋酶可以是两个或更多个Dda解旋酶。两个或更多个解旋酶可以是一个或多个Dda解旋酶和一个或多个TrwC解旋酶。两个或更多个解旋酶可以是相同解旋酶的不同变体。
两个或更多个解旋酶优选地彼此附接。两个或更多个解旋酶更优选地彼此共价附接。解旋酶可以按任何次序和使用任何方法来附接。用于本发明中的优选的解旋酶构建体描述于以下国际申请号中:PCT/GB2013/051925号(公开为WO 2014/013260);PCT/GB2013/051924(公开为WO 2014/013259);第PCT/GB2013/051928号(公开为WO 2014/013262)和第PCT/GB2014/052736号。
SEQ ID NO:9、11、13、15、17、18、19、20、21、22、23、24或25的变体是具有不同于SEQID NO:9、11、13、15、17、18、19、20、21、22、23、24或25的氨基酸序列并且保留多核苷酸结合能力的酶。这可以使用本领域中已知的任何方法来测量。例如,可以使变体与多核苷酸接触,并且可以测量其结合到多核苷酸和沿所述多核苷酸移动的能力。变体可以包含便于多核苷酸结合和/或便于其在高盐浓度和/或室温下活性的修饰。变异体可进行修饰,使得其结合多核苷酸(即保持多核苷酸结合能力)但不充当解螺旋酶(即当具备所有便于移动的必需组分(例如ATP和Mg2+)时不沿多核苷酸移动)。这种修饰是本领域中已知的。例如,解旋酶中的Mg2+结合域的修饰通常产生不充当解旋酶的变体。这些变体类型可以充当分子刹车(参见下文)。
基于氨基酸相似性或同一性,在SEQ ID NO:9、11、13、15、17、18、19、20、21、22、23、24或25的氨基酸序列的整个长度上,变异体将优选地与所述序列至少50%同源。更优选地,基于氨基酸相似性或同一性,变体多肽可以在整个序列上与SEQ ID NO:9、11、13、15、17、18、19、20、21、22、23、24或25的氨基酸序列,至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,并且更优选地至少95%、97%或99%同源。在200个或更多个,例如230个、250个、270个、280个、300个、400个、500个、600个、700个、800个、900个或1000个或更多个邻接氨基酸的段上,可以存在至少80%,例如至少85%、90%或95%氨基酸相似性或同一性(“硬同源性”)。如上文所描述的确定同源性。变体可以与上文参考SEQID NO:2和SEQ ID NO:4论述的任何方式不同于野生型序列。酶可以共价附接于孔。任何方法可以用于将酶共价附接于孔。
优选分子刹车是TrwC Cba-Q594A(具有突变Q594A的SEQ ID NO:25)。变异体并不充当解螺旋酶(即当具备所有便于移动的必需组分(例如ATP和Mg2+)时,结合多核苷酸但并不沿其移动)。
在链测序中,通过所施加的电势或抵抗所施加的电势,多核苷酸通过纳米孔易位。在双链多核苷酸上逐渐或逐步起作用的外切核酸酶可以在孔的顺式侧使用,以在施加的电势下供给剩余的单链或在反向电势下供给反式侧。同样,使双链DNA解旋的解旋酶还可以以类似的方式使用。还可以使用聚合酶。还存在需要抵抗所施加的电势的链易位的测序应用的可能性,但是DNA必须首先在相反或无电势下由酶“捕获”。随着电势随后在结合后转回,链将以顺式到反式的方式穿过孔并且通过电流保持处于延长的构形。单链DNA核酸外切酶或单链DNA依赖性聚合酶可充当分子马达,所述分子马达抵抗施加的电势将最近易位的单链以逐步受控方式(反式到顺式)牵拉回反式通过孔。
所述方法中可以使用任何解旋酶。解旋酶可以相对于孔的两种模式来起作用。首先,优选地使用解旋酶来进行所述方法,使得在由所施加电压造成的场的情况下,所述解旋酶使多核苷酸移动通过孔。在这种模式中,多核苷酸的5’端首先在孔中被捕获,并且解旋酶使多核苷酸移动到孔中,使得其在场的情况下通过孔,直到其最终易位通过到膜的反式侧为止。可替代地,优选地进行所述方法,使得抵抗由所施加电压造成的场的情况下,解旋酶使多核苷酸移动通过孔。在这种模式中,多核苷酸的3’端首先在孔中被捕获,并且解旋酶使多核苷酸移动通过孔,使得其抵抗所施加场的情况下牵拉出孔,直到其最终推回到膜的顺式侧为止。
还可以在相反的方向上进行所述方法。多核苷酸的3’端可以首先在孔中被捕获,并且解旋酶可以使多核苷酸移动到孔中,使得其在场的情况下通过孔,直到其最终易位通过到膜的反式侧为止。
当解旋酶不具备便于移动的必需组分或进行修饰以阻止或防止其移动时,所述解旋酶可以结合多核苷酸并且当多核苷酸被施加的场拉入孔中时起到减慢多核苷酸移动的作用。在非活性模式中,多核苷酸是否被3’或5’向下捕获无关紧要,其是通过充当刹车的酶朝向反式侧将多核苷酸拉入孔中的所施加的场。当在非活动模式中时,通过解螺旋酶对多核苷酸的移动控制可以多种方式(包括棘轮、滑动和制动)描述。还可以以这种方式来使用缺乏解旋酶活性的解旋酶变体。
可以按任何次序使多核苷酸与多核苷酸结合蛋白和孔接触。优选的是,当使多核苷酸与多核苷酸结合蛋白(如解螺旋酶)和孔接触时,多核苷酸首先与蛋白质形成复合体。当跨孔施加电压时,多核苷酸/蛋白质复合物然后与孔形成复合物并且控制多核苷酸通过孔的移动。
使用多核苷酸结合蛋白的方法中的任何步骤通常在游离核苷酸或游离核苷酸类似物和促进多核苷酸结合蛋白作用的酶辅因子存在下进行。游离核苷酸可以是上文论述的任何单个核苷酸中的一种或多种。游离核苷酸包含但不限于:单磷酸腺苷(AMP)、二磷酸腺苷(ADP)、三磷酸腺苷(ATP)、单磷酸鸟苷(GMP)、二磷酸鸟苷(GDP)、三磷酸鸟苷(GTP)、单磷酸胸苷(TMP)、二磷酸胸苷(TDP)、三磷酸胸苷(TTP)、单磷酸尿苷(UMP)、二磷酸尿苷(UDP)、三磷酸尿苷(UTP)、单磷酸胞苷(CMP)、二磷酸胞苷(CDP)、三磷酸胞苷(CTP)、环单磷酸腺苷(cAMP)、环单磷酸鸟苷(cGMP)、单磷酸脱氧腺苷(dAMP)、二磷酸脱氧腺苷(dADP)、三磷酸脱氧腺苷(dATP)、单磷酸脱氧鸟苷(dGMP)、二磷酸脱氧鸟苷(dGDP)、三磷酸脱氧鸟苷(dGTP)、单磷酸脱氧胸苷(dTMP)、二磷酸脱氧胸苷(dTDP)、三磷酸脱氧胸苷(dTTP)、单磷酸脱氧尿苷(dUMP)、二磷酸脱氧尿苷(dUDP)、三磷酸脱氧尿苷(dUTP)、单磷酸脱氧胞苷(dCMP)、二磷酸脱氧胞苷(dCDP)和三磷酸脱氧胞苷(dCTP)。游离核苷酸优选地选自AMP、TMP、GMP、CMP、UMP、dAMP、dTMP、dGMP或dCMP。游离核苷酸优选地是三磷酸腺苷(ATP)。酶辅因子是允许构建体起作用的因子。酶辅因子优选地是二价金属阳离子。二价金属阳离子优选地是Mg2+、Mn2+、Ca2+或Co2+。酶辅因子最优选地是Mg2+
分子刹车可以是结合多核苷酸并且减缓多核苷酸通过孔的移动的任何化合物或分子。分子刹车可以是上文论述的任何一种。分子刹车优选地包括与多核苷酸结合的化合物。所述化合物优选地是大环化合物。合适的大环化合物包含但不限于环糊精、杯芳烃、环肽、冠醚、葫芦脲、柱状芳烃、其衍生物或其组合。环糊精或其衍生物可以是在Eliseev,A.V.和Schneider,H-J.(1994年),《美国化学学会期刊志(J.Am.Chem.Soc.)》,116,6081-6088。环糊精更优选地是七-6-氨基-β-环糊精(am7-βCD)、6-单脱氧-6-单氨基-β-环糊精(am1-βCD)或七-(6-脱氧-6-胍基)-环糊精(gu7-βCD)。
靶多核苷酸中的间隔区
如果在本发明中使用解旋酶,则其可能会停留在国际申请号PCT/GB2014/050175(公开为WO 2014/135838)中论述的一个或多个间隔区上。在本发明中可以使用在国际申请中所公开的一或多个解旋酶和一或多个间隔区的任何构形。
双链多核苷酸
如果靶多核苷酸是双链的,所述方法优选地进一步包括在多核苷酸的一端处为靶多核苷酸提供发夹环。所述方法可以包括在一端处将靶多核苷酸的两条链与发夹环连接。孔和任选地分子刹车优选地分离靶多核苷酸的两条链并且一次控制靶多核苷酸通过孔一条链的移动。以此方式连接和询问双链上的两条链增加表征的效率和准确度。
可以使用本领域中已知的方法来设计合适发夹环。发夹环可以是任何长度。发夹环的长度通常为110个或更少个核苷酸,如100个或更少个核苷酸、90个或更少个核苷酸、80个或更少个核苷酸、70个或更少个核苷酸、60个或更少个核苷酸、50个或更少个核苷酸、40个或更少个核苷酸、30个或更少个核苷酸、20个或更少个核苷酸、或10个或更少个核苷酸。发夹环的长度优选地为约1个到110个、2个到100个、5个到80个或6个到50个核苷酸。如果环涉及不同的衔接子的选择能力,则如50个到110个核苷酸等较长长度的发夹环是优选的。类似地,如果环不涉及如下文所论述的可选择结合,则如1个到5个核苷酸等较短长度的发夹环是优选的。
发夹环可以在多核苷酸的任一端处提供,即5’端或3’端。可以使用本领域已知的任何方法将发夹环连接到多核苷酸。可以使用连接酶,如T4DNA连接酶、大肠杆菌DNA连接酶、Taq DNA连接酶、Tma DNA连接酶和9°N DNA连接酶来连接发夹环。
可以使用本领域中已知的任何方法来将多核苷酸的两条链分开。例如,可以通过如多核苷酸结合蛋白等分子刹车分开,或者使用有利于脱水的条件(有利于去杂交的条件的实例包含但不限于高温、高pH和添加可以破坏氢键或碱基配对的试剂,如甲酰胺和脲。)
发夹环优选地包括可选择结合部分。这允许纯化或分离多核苷酸。可选择结合部分是可以基于其结合性质而选择的部分。因此,可选择结合部分优选地是特异性结合于表面的部分。如果可选择结合部分以比在本发明中使用的任何其它部分高许多的程度结合于表面,则其特异性结合于表面。在优选的实施例中,所述部分与本发明中没有其它部分结合的表面结合。
合适的选择性结合部分在本领域中是已知的。优选选择性结合部分包括(但不限于):生物素;多核苷酸序列;抗体;抗体片段,如Fab和ScSv;抗原;多核苷酸结合蛋白;聚组氨酸尾部和GST标签。最优选的选择性结合部分是生物素和可选择多核苷酸序列。生物素特异性结合于涂覆有抗生物素蛋白的表面。可选择多核苷酸序列特异性地结合(即杂交)于涂布有同源序列的表面。可替代地,可选择多核苷酸序列特异性结合于涂覆有多核苷酸结合蛋白的表面。
发夹环和/或可选择结合部分可以包括可以进行剪切、切割、裂解或水解的区。可以设计这种区以允许多核苷酸在纯化或分离后从其结合的表面除去。合适的区在本领域中是已知的。合适区包括(但不限于)RNA区、包含脱硫生物素和抗生蛋白链菌素的区、二硫键和可光裂解区。
前导序列
靶多核苷酸可以具有前导序列,其优先穿入孔中或能够选择性地连接于前靶多核苷酸。前导序列有助于本发明的方法。前导序列可被设计成优选地穿入孔中,并且由此有助于多核苷酸通过孔的移动。可以设计前导序列,使其选择性地连接于前靶多核苷酸并促进连接的多核苷酸的形成。前导序列还可以用于将多核苷酸连接到如上文所论述的一个或多个锚。
前导序列通常包括聚合物。聚合物优选地是带负电的。聚合物优选地是:多核苷酸,如DNA或RNA;修饰多核苷酸(如无碱基DNA);PNA;LNA;聚乙二醇(PEG)或多肽。前导优选地包括多核苷酸,并且更优选地包括单链多核苷酸。前导序列可以包括上文所论述的任一个多核苷酸。单链前导序列最优选地包括DNA的单链,如聚dT区段。前导序列优选地包括一个或多个间隔区。
前导序列可以是任何长度,但其长度通常是10个到150个核苷酸,如20个到150个核苷酸。前导的长度通常取决于所述方法中使用的跨膜孔。
后续靶多核苷酸中的前导序列通常包含与前靶多核苷酸中的部分杂交的部分。前导序列优选包含点击化学的一部分,例如点击反应基团。
Y衔接子
可以在一端或两端为双链靶多核苷酸提供衔接子。可以在两端为双链靶多核苷酸提供Y衔接子。
双链靶多核苷酸可以在一端提供Y衔接子,在另一端提供发夹环。表征多核苷酸的方法可以包括将Y衔接子连接到双链靶多核苷酸的一端并在另一端连接发夹环。Y衔接子和/或发夹衔接子通常是多核苷酸衔接子。其可以由上文所论述的任一个多核苷酸形成。
Y衔接子通常包含(a)双链区和(b)单链区或在另一端处不互补的区。如果Y衔接子包括单链区,则其可以被描述为具有悬突。Y衔接子中非互补区的存在给予衔接子其Y形状,这是由于不同于双链部分,两条链通常不彼此杂交。换句话说,Y衔接子包含两条多核苷酸链,例如DNA链。延伸至第一链的3'末端的部分与延伸至另一链的5'末端的部分互补。互补部分彼此杂交并形成Y衔接子的双链或双链区。第一和第二链的其余部分不互补并且彼此不杂交。
在一个实施方案中,Y衔接子包含一个或多个连接位点,其可用于选择性地将第一(前)靶多核苷酸连接至如本文所述的第二(后续)靶多核苷酸。
在一个实施方案中,第一连接位点存在于Y衔接子的双链区域中。当Y衔接子连接到靶多核苷酸的末端时,双链区中的连接位点被“隐藏”直到靶多核苷酸与孔相互作用。该“隐藏的”连接位点对应于第一(前)靶多核苷酸的一部分,其可以选择性地连接于第二(后续)靶多核苷酸的一部分。
在一个实施方案中,第二连接位点存在于Y衔接子的单链区域中。当Y衔接子连接到第二靶多核苷酸的末端时,当第一靶多核苷酸与孔相互作用以显露第一连接位点时,单链区中的连接位点可用于结合第一靶多核苷酸中的第一连接位点。该“暴露的”连接位点对应于第二(后续)靶多核苷酸的一部分,其可以选择性地连接于第一(前)靶多核苷酸的一部分。
如上所述,Y衔接子可包括第一连接位点和第二连接位点。在一个实施方案中,Y衔接子中存在的第一和第二连接位点彼此不互补。然后可以使用不同Y衔接子的群体,其中互补连接位点存在于不同的Y衔接子中,以执行如本文所述的方法。在该实施方案的一个实例中,第一Y衔接子中的第一(隐藏)连接位点和第二(暴露)连接位点可以具有相同的序列,该序列与第二个Y衔接子中的第一(隐藏)连接位点并且第二个(暴露)连接位点的序列互补。然后可以一起使用第一和第二Y衔接子,其中将包含第一Y衔接子的第一(前)靶多核苷酸连接至包含第二Y衔接子的第二(后续)靶多核苷酸。在另一个实施方案中,Y衔接子中存在的第一和第二连接位点彼此互补。在该实施例中,可以使用单一类型的Y衔接子。
本发明提供了包含第一多核苷酸链和第二多核苷酸链的Y衔接子,其中:(i)延伸至第一多核苷酸链的3'末端的部分与延伸至第二多核苷酸的5'末端的部分互补和互补部分形成双链体;(ii)延伸至第一多核苷酸链的5'末端的部分和延伸至第二多核苷酸链的3'末端的部分彼此不杂交;和(iii)延伸至第二多核苷酸链的5'末端的部分包含当双链体解开时能够与延伸至第一多核苷酸的5'末端的部分中包含的序列杂交的序列。
能够彼此杂交的延伸至第二多核苷酸链的5'末端的部分中的序列和延伸至第一多核苷酸链的5'末端的部分中包含的序列优选地长度为6至50个碱基对,例如7至40、8至30、9至20或10至15个碱基对。
本发明还提供了包含第一多核苷酸链和第二多核苷酸链的Y衔接子,其中:(i)延伸至第一多核苷酸链的3'末端的部分与延伸至第二多核苷酸的5'末端的部分互补和互补部分形成双链体;(ii)延伸至第一多核苷酸链的5'末端的部分和延伸至第二多核苷酸链的3'末端的部分彼此不杂交;和(iii)延伸至第二多核苷酸链的5'末端的部分包含与延伸至第一多核苷酸的5'末端的部分中包含的序列相同的序列。
与延伸至第一多核苷酸链的5'末端的部分中包含的序列相同的延伸至第二多核苷酸链的5'末端的部分中的序列优选地长度为6至50个碱基对,例如7至40、8至30、9至20或10至15个碱基对。
Y衔接子中的双链体区域可具有约6至200个碱基对的长度,例如10至150、20至175、25至150、50至125或75至100个碱基对。双链体区可包含阻断序列以防止解旋酶沿双链条移动。在一个实施方案中,阻断剂包含iSp18。合适的阻断剂序列描述于实施例中。
在Y衔接子中,延伸至第一多核苷酸链的5'末端的部分的长度优选为10至100个碱基对,例如长度为10至75、20至65或25至50个碱基对。延伸至第一多核苷酸链的5'末端的部分包含暴露的连接位点。延伸至第一多核苷酸链的5'末端的部分优选包含聚合物前导序列。聚合物优选地是带负电的。聚合物优选地是:多核苷酸,如DNA或RNA;修饰多核苷酸(如无碱基DNA);PNA;LNA;聚乙二醇(PEG)或多肽。前导序列优选地包括一个或多个间隔区,例如iSpC3。合适的前导序列的实例描述于实施例中。
前导序列可以是任何长度,但其长度通常是10个到150个核苷酸,如20个到150个、25个到100个、或30个到50个核苷酸。前导的长度通常取决于所述方法中使用的跨膜孔。在一个实施方案中,前导序列和暴露的连接位点的组合长度为25至40,例如30个碱基对,其可包含全部或部分前导序列。
在一个实施方案中,衔接子的第一多核苷酸链的5'末端包含点击化学的第一部分,例如点击反应基团。
在一个实施方案中,衔接子的第二多核苷酸链的3'末端包含点击化学的第二部分,例如点击反应基团。点击化学的第一部分是与点击化学的第二部分反应的部分。通常,在该实施方案中,延伸至第二多核苷酸链的5'末端的部分包含当双链体展开时能够与延伸至第一条多核苷酸链的5'末端的部分中包含的序列杂交的序列。
在另一个实施方案中,衔接子的第二多核苷酸链的3'末端包含点击化学的第一部分,例如点击反应基团。在该实施方案中,衔接子被设计用于与第二Y衔接子一起使用,第二Y衔接子包括点击化学的第二部分,例如其第一多核苷酸链的5'末端的点击反应基团,和点击化学的第二部分,例如在其第二条多核苷酸链的3'末端的点击反应基团。通常,在该实施方案中,延伸至第二多核苷酸链的5'末端的部分包含与延伸至第一多核苷酸链的5'末端的部分中包含的序列相同的序列。
在一个实施方案中,衔接子的第一多核苷酸链的5'末端包含磷酸酶。磷酸酶可促进第一多核苷酸链的5'末端与另一多核苷酸链的3'末端的连接(通常在第二衔接子中暴露隐藏的连接位点后第二衔接子的第二链的3'末端)。
Y衔接子可包括一个或多个锚。上文更详细地论述了锚。在一个实施方案中,Y衔接子优选包含与第三多核苷酸链连接的锚,所述第三多核苷酸链包含与第一多核苷酸链杂交的5'区。第三多核苷酸链结合的第一多核苷酸链的部分通常位于与第二多核苷酸链杂交的第一多核苷酸链的区域和前导序列之间。锚优选连接在第三多核苷酸链的3'末端或附近。第四多核苷酸链可以与第三多核苷酸链的未与第一多核苷酸链杂交的区域杂交。锚优选为胆固醇。
每个Y衔接子的第二链中的非互补区域的一部分优选地形成环结构。这有利于如上所述的本发明的方法。特别地,它促进连接双链多核苷酸的连接酶的作用。在该实施方案中,环的两侧通常彼此杂交。第二多核苷酸链的3'末端的核苷酸碱基优选位于环的末端。第二多核苷酸链的3'末端的核苷酸碱基通常与第二多核苷酸链的另一部分杂交。第一(隐藏)连接位点优选地与环结构相邻但不是环结构的一部分。第一(隐藏)连接位点与不同Y衔接子中的第二(暴露)连接位点的杂交延长了环。然后可以连接位于靶多核苷酸末端的Y衔接子,例如通过(使用连接酶)连接或通过点击化学。该实施方案导致两个衔接子(并且因此前面和后面的靶多核苷酸)通过环连接,所述环可以去除杂交并移动通过孔。
第二多核苷酸链中的环可以是任何长度。第二多核苷酸链中的环优选包含10至50个核苷酸,例如15至40,或20至25,例如23个核苷酸。
Y衔接子优选地包括优选地穿入孔中的前导序列。上文论述了前导序列。在一个实施方案中,第二(暴露)连接位点作为前导序列存在于Y衔接子的相同链中。通常,前导序列位于Y衔接子的5'末端,第二连接位点位于前导序列和双链区之间。暴露的连接位点可以形成前导序列的一部分。
Y衔接子可以进一步包含一种或多种多核苷酸结合蛋白。在一个实施方案中,多核苷酸结合蛋白与Y衔接子的第一多核苷酸链连接。多核苷酸结合蛋白优选位于前导序列的3'和阻断序列的5'。多核苷酸结合蛋白优选地是解旋酶。在衔接子中可以包含一种以上,例如两种或更多种多核苷酸结合蛋白,优选两种或更多种解旋酶。两种或更多种多核苷酸结合蛋白优选彼此不同,例如两种不同的解旋酶。当存在两种多核苷酸结合蛋白时,一旦除去阻断序列的作用,两种蛋白质优选以不同的速率处理结合的多核苷酸。例如,第一多核苷酸结合蛋白,优选第一解旋酶,可以与至第二多核苷酸结合蛋白,优选第二解旋酶的衔接子3'的第一多核苷酸链连接。在该实例中,第一多核苷酸结合蛋白可以分离双链靶多核苷酸的两条链,并且第二多核苷酸结合蛋白可以用于控制靶多核苷酸通过纳米孔的运动。在该实施方案中,第一多核苷酸结合蛋白可以称为“释放蛋白”,第二多核苷酸结合蛋白可以称为“运动蛋白”。释放蛋白优选沿着多核苷酸比运动蛋白更快地移动。
Y衔接子优选地包括如上文所论述的可选结合部分。Y衔接子和/或可选择的结合部分可以包括可以如上文所论述的进行剪切、切割、裂解或水解的区。
可以使用本领域已知的任何方法将Y衔接子和/或发夹环连接到多核苷酸。可以使用接合酶,如T4DNA接合酶、大肠杆菌DNA接合酶、Taq DNA接合酶、Tma DNA接合酶和9°N DNA接合酶来接合衔接子中的一个或两个。可替代地,可以使用下文论述的本发明的方法,向多核苷酸中添加衔接子。
在一个优选的实施方案中,该方法包括修饰双链多核苷酸,使其在其末端包含衔接子。例如,在一个实施例中,所述方法包括修饰双链多核苷酸,使得其包括在一端处的Y衔接子以及在另一端处的发夹环。在另一个实施方案中,该方法包括修饰双链多核苷酸,使其在每个末端包含Y衔接子。可以使用任何修饰方式。所述方法优选地包括修饰根据本发明的双链多核苷酸。在下文中更详细地论述这一点。可以任何方式对修饰和表征方法进行组合。
添加发夹环和前导序列
通过使多核苷酸与MuA转座酶和双链MuA底物群体接触,可以为双链多核苷酸提供Y衔接子和发夹环,其中群体中的一部分底物是包括前导序列的Y衔接子,并且其中群体中的一部分底物是发夹环。转座酶将双链多核苷酸片段化并且将MuA底物连接到片段的一端或两端。这产生多个修饰的双链多核苷酸,其在一端处包括前导序列,并且在另一端处包括发夹环。然后可以使用本发明的方法研究修饰的双链多核苷酸。
这些基于MuA的方法在国际申请号PCT/GB2014/052505(公开为2015/022544)中公开。其还在国际申请号PCT/GB2015/050991中详细论述。
通过使多核苷酸与MuA转座酶和一群双链MuA底物接触,可以为双链多核苷酸提供Y衔接子,其中底物是包含前导序列和连接位点的Y衔接子。转座酶将双链多核苷酸片段化并且将MuA底物连接到片段的一端或两端。这产生了多个修饰的双链靶多核苷酸,其在两端包含单链突出端。然后可以使用本发明的方法研究修饰的双链多核苷酸。
修饰的多核苷酸
在表征之前,可以通过使用多核苷酸作为模板在聚合酶形成修饰的多核苷酸的条件下使多核苷酸与聚合酶和游离核苷酸群体接触来修饰多核苷酸,其中当形成修饰的多核苷酸分析物时,聚合酶用不同的核苷酸种取代多核苷酸中的一种或多种核苷酸物种。然后可以根据本发明表征修饰的多核苷酸。此修饰类型在PCT申请号PCT/GB2015/050483中描述。可以使用上文论述的任何聚合酶。聚合酶优选地是Klenow或9° North。
Y衔接子的群体
本发明还提供了两个或更多个多核苷酸Y衔接子的群体,其中每个衔接子包括第一部分和第二部分(第一和第二连接位点),这是能够杂交在一起,并且其中每个第一部分(第一连接位点)被初始保护以免杂交到第二部分(第二连接位点)。群体可包含任何数量的衔接子,例如上文针对靶多核苷酸所讨论的数目。
还提供了包含第一多核苷酸衔接子和第二多核苷酸衔接子的多核苷酸衔接子群,其中第一多核苷酸衔接子和第二多核苷酸衔接子各自包含第一多核苷酸链和第二多核苷酸链,其中:(a)(i)延伸至第一多核苷酸链的3'末端的部分与延伸至第二多核苷酸的5'末端的部分互补和互补部分形成双链体;(ii)延伸至第一多核苷酸链的5'末端的部分和延伸至第二多核苷酸链的3'末端的部分彼此不杂交;和其中(b)延伸至第一多核苷酸衔接子的第二多核苷酸链的5'末端的部分包含当双链体解开时能够与延伸至第二多核苷酸衔接子的第一多核苷酸的5'末端的部分中包含的序列杂交的序列。这些多核苷酸衔接子因其形状而被称为“Y衔接子”。
群体中的Y衔接子可具有上面“Y衔接子”部分中描述的任何功能。上文参考本发明方法论述的实施方案中任一个同样适用于本发明的群体。
如上所述,每个Y衔接子通常包含(a)双链区和(b)单链区或在另一端处不互补的区。Y衔接子中非互补区的存在给予衔接子其Y形状,这是由于不同于双链部分,两部分/两条链通常不彼此杂交。
换句话说,Y衔接子包含两条多核苷酸链,例如DNA链。延伸至第一链的3'末端的部分与延伸至另一链的5'末端的部分互补。互补部分彼此杂交并形成Y衔接子的双链或双链区。第一和第二链的其余部分不互补并且彼此不杂交。
在一个实施方案中,Y衔接子包含一个或多个连接位点,其可用于选择性地将第一(前)靶多核苷酸连接至如本文所述的第二(后续)靶多核苷酸。
在一个实施方案中,第一连接位点存在于Y衔接子的双链区域中。当Y衔接子连接到靶多核苷酸的末端时,双链区中的连接位点被“隐藏”直到靶多核苷酸与孔相互作用。该“隐藏的”连接位点对应于第一(前)靶多核苷酸的一部分,其可以选择性地连接于第二(后续)靶多核苷酸的一部分。
在一个实施方案中,第二连接位点存在于Y衔接子的单链区域中。当Y衔接子连接到第二靶多核苷酸的末端时,当第一靶多核苷酸与孔相互作用以显露第一连接位点时,单链区中的连接位点可用于结合第一靶多核苷酸中的第一连接位点。该“暴露的”连接位点对应于第二(后续)靶多核苷酸的一部分,其可以选择性地连接于第一(前)靶多核苷酸的一部分。
如上所述,Y衔接子可包括第一连接位点和第二连接位点。在一个实施方案中,Y衔接子中存在的第一和第二连接位点彼此不互补。然后可以使用不同Y衔接子的群体,其中互补连接位点存在于不同的Y衔接子中,以执行如本文所述的方法。在另一个实施方案中,Y衔接子中存在的第一和第二连接位点彼此互补。在该实施例中,可以使用单一类型的Y衔接子。
Y衔接子可包括一个或多个锚。上文更详细地论述了锚。在一个实施方案中,Y衔接子优选包含连接于延伸至第二多核苷酸链的3'末端的部分的锚。
第一部分(第一连接位点)优选最初通过与Y衔接子的双链区中的相反链杂交保护。
每个Y衔接子中的非互补区域的一半优选地形成环结构。这有利于如上所述的本发明的方法。第一部分(优选地与环结构相邻,但不是环结构的一部分)。在不同的Y衔接子中第一部分与第二部分的杂交使环伸长。该实施方案导致两个衔接子(并且因此前面和后面的靶多核苷酸)通过环连接,所述环可以去除杂交并移动通过孔。
每个Y衔接子优选地还包括包含第二部分的前导序列。上文讨论了合适的前导序列。第二部分优选是由与前导序列的自由端杂交的桥连多核苷酸形成的突出端。桥连多核苷酸可以是任何长度并且由上文讨论的任何类型的多核苷酸形成。在一个实施方案中,第二(暴露)连接位点作为前导序列存在于Y衔接子的相同链中。通常,前导序列位于Y衔接子的5'末端,第二连接位点位于前导序列和双链区之间。
在优选的实施方案中,群体中仅一个衔接子包含分子刹车。将该衔接子连接到第一靶多核苷酸意味着分子刹车将控制连接的多核苷酸即所有靶多核苷酸通过孔的运动。
第一部分优选包含点击反应基团,第二部分包含互补点击反应基团。所述反应基团可以是上文所讨论的那些的任一种。
试剂盒
本发明还提供了用于表征两种或更多种双链靶多核苷酸的试剂盒。在一个实施方案中,试剂盒包含本发明的Y衔接子群。在进一步的实施方案中,试剂盒包含本发明的Y衔接子。在另一个实施方案中,试剂盒包含本发明的Y衔接子群和发夹环群。上面讨论了这种环。
试剂盒可以进一步包含微粒,用于将靶多核苷酸递送至膜中的跨膜孔。试剂盒可以进一步包括一个或多个锚,其能够将多核苷酸偶联到膜上。微粒和一个或多个锚可以是上文参考本发明的方法论述的微粒和锚中的任何一种。微粒优选地是用于提取和/或纯化多核苷酸的试剂盒的一部分。
上文参考本发明方法论述的实施例中任一个同样适用于试剂盒。试剂盒可以进一步包括膜的组分,如两亲层或三嵌段共聚物膜的组分。试剂盒可以进一步包括跨膜蛋白孔。
本发明的试剂盒可以另外包括一种或多种其它试剂或仪器,所述试剂或仪器能够实施上述实施例中的任一个。该试剂盒可以包括磁铁或电磁铁。此类试剂或仪器包含以下各项中的一项或多项:一种或多种适当的缓冲液(水溶液)、用于从受试者获得样品的装置(如包括针的容器或仪器)、用于扩增和/或表达多核苷酸序列的装置、如上文限定的膜或者电压钳或贴片钳设备。试剂可以以干态存在于试剂盒中,使得流体样品使试剂再悬浮。试剂盒还可以任选地包括使所述试剂盒能够用于本发明方法的说明书或关于所述方法可以用于何种生物体的详情。
以下实施例展示了本发明。
实施例
实施例1
该实施例描述了表征连接多核苷酸的方法,其中用于将多核苷酸连在一起的连接方法是通过连接(ligation)。
材料和方法
连接制备
下面的前导链(下面的ID1),含有3'发夹的底链(下面的ID NO:2)和阻断链(下面的ID No:3)分别以5μM、6μM和6μM退火,这是在50mM HEPES pH 8,100mM乙酸钾中以每分钟2℃从95℃至22℃。杂交的DNA被称为衔接子1。
等分试样的T4Dda-(E94C/F98W/C109A/C136A/A360C)(SEQ ID NO:24,具有突变E94C/F98W/C109A/C136A/A360C然后(ΔM1)G1G2(其中(ΔM1)G1G2=M1的缺失然后加入G1和G2)在冰上解冻,然后根据制造商的说明,通过0.5ml Zeba柱将50μl缓冲液交换到50mMHEPES pH 8,100mM乙酸钾,2mM EDTA中。使用A280纳米值将回收的蛋白质进行定量,并使用相同的缓冲液调节至0.25mg ml-1。将27ul缓冲液交换蛋白与3μl衔接子1在DNA低结合eppendorf中混合,并在35℃下孵育10分钟。然后加入0.37μl的8.1mMTMAD,将样品在35℃下孵育60分钟。然后加入30μl的50mM HEPES pH 8,1M NaCl,2mM MgCl2,2mM rATP,并在室温下再放置20分钟。
然后加入222μl的Agencourt AMPure珠(Beckman Coulter)并将样品在室温下在旋转器上温育5分钟。将珠粒在磁架上沉淀并除去上清液。在仍然在磁架上的同时,用500μl的50mMTris pH 7.5,2.5M NaCl,20%PEG 8,000洗涤珠子,转过360°以将颗粒洗涤在架子上。除去洗涤缓冲液,将颗粒在离心机中短暂脉冲,然后返回磁架以除去最后残留的溶液。然后将沉淀物在室温下重悬于30μl的50mM Tris pH 7.5,20mM NaCl中5分钟,然后置于磁架上以回收纯化的衔接子,该衔接子称为预装Y-衔接子1。
将500ng末端修复的和dA尾的大肠杆菌基因组DNA在室温下以50μl与来自上面的5μl的200nM预加载的Y-衔接子1和1μl的1μMHP-衔接子(ID)NO:4)在1x Blunt/TA主混合物(NEB)中连接10分钟。孵育后,加入0.5μl的5μM发夹系链(ID NO:6),并将样品在室温下再放置10分钟。
将25ul的MyOne C1链霉抗生物素蛋白珠(Invitrogen)与磁架结合,除去上清液。然后通过重悬于200μl的10mM Tris pH 7.5,2M NaCl,0.1mM EDTA中将颗粒洗涤3次。最后,将珠子重悬于50μl的10mM Tris pH 7.5,2M NaCl,0.1mM EDTA中。然后将珠子加入到连接混合物中并在室温下在旋转器上孵育10分钟。然后将珠子结合的文库加入磁架中并除去上清液。然后通过重悬于200μl的10mM Tris pH 7.5,2M NaCl,0.1mM EDTA中将颗粒洗涤3次。最后,将珠子重悬于12.5μl的40mM CAPS pH 10,40mM KCl,5mM生物素,0.1mM EDTA和400nM系链(ID NO:5)中。将样品在37℃温育10分钟,然后沉淀珠子并除去含有上清液的文库。
从插入在缓冲液(25mM磷酸钾缓冲液、150mM亚铁氰化钾(II)、150mM铁氰化钾(III)、pH 8.0)中的嵌段共聚物中的单一MspA纳米孔获取电测量。在达到插入在嵌段共聚物中的单一孔之后,接着缓冲液(2mL,25mM磷酸钾缓冲液,150mM亚铁(II)氰化钾,150mM铁(III)氰化钾,pH 8.0)流过系统,移除任何过量的MspA纳米孔。500μl的25mM磷酸钾缓冲液pH8,500mM KCl,2mM MgCl2和2mM rATP,每次洗涤间隔10分钟。将12ul回收的珠子纯化文库加入到150μl的50mM磷酸钾缓冲液pH8,1M KCl,8μl的75mM MgCl2,75mM rATP,124μl的无核酸酶水和6μl的T3DNA连接酶(NEB)中。然后将150μl该测序混合物加入纳米孔系统中。实验在–140mV下进行,并且监测解旋酶控制的DNA移动。
ID NO:1
/5Phos/GCGGTTGTT/iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3/(SEQ ID NO:28)/iSp18//iSp18//iSp18//iSp18/(SEQ ID NO:29)
ID NO:2
/5Phos/(SEQ ID NO:30)/iSp18//iSp18//iSp18/(SEQ ID NO:31)/iSp18//iSp18//iSp18/(SEQ ID NO:32)
ID NO:3
/5BNA-G//iBNA-G//iBNA-T//iBNA-T//iBNA-A/(SEQ ID NO:33)
ID NO:4
/5Phos/(SEQ ID NO:34)/iSp18//iSp18//iSp18/(SEQ ID NO:35)/iSp18//iSp18//iSp18/(SEQ ID NO:36)
ID NO:5
/5CholTEG/(SEQ ID NO:37)
ID NO:6
/5desthiobiotinTEG/TT/iSp18//iSp18//iSp18//iSp18//iSp18//iSp18/(SEQID NO:38)/iSp18//iSp18//iSp18//iSp18//iSp18//iSp18/TT/3CholTEG
结果
解旋酶T4Dda-(E94C/F98W/C109A/C136A/A360C)用于控制连接的多核苷酸通过MspA纳米孔的运动。图2-6各自显示了随着易位通过纳米孔,连接多核苷酸(与一个后续多核苷酸连接的第一多核苷酸)的电流迹线(每个幻灯片上的顶部迹线)。图2-6的下部迹线示出了上部迹线的放大区域1-5。下部迹线显示间隔基团(在第一和后续多核苷酸的前导区和发夹区中发现并用*标记)易位通过纳米孔。间隔基团允许更多的电流在它们易位通过纳米孔时流过纳米孔。示例性迹线显示第一多核苷酸成功连接至后续多核苷酸。
实施例2
该实施例描述了表征连接多核苷酸的方法,其中用于将多核苷酸连在一起的连接方法是通过点击化学(参见图7,用于使用点击化学连接的卡通表示)。
材料和方法
点击连接制备
前导链(ID NO:7)和阻断链(ID NO:8),其包含系链杂交位点,分别在5.5与6um退火,这是在50mM HEPES pH 8,100mM乙酸钾中,以每分钟2℃从95℃至22℃。将含有3'发夹的10μM底链(ID NO:9)加热至95℃持续1分钟,然后在冰上在50mM HEPES pH 8,100mM乙酸钾中快速冷却。将两个样品平衡至50℃,然后以1:1混合,并在40℃下放置1分钟,然后在冰上快速冷却。杂交的DNA被称为衔接子2。
等分试样的T4Dda-(E94C/F98W/C109A/C136A/A360C)(SEQ ID NO:24,具有突变E94C/F98W/C109A/C136A/A360C然后(ΔM1)G1G2(其中(ΔM1)G1G2=M1的缺失然后加入G1和G2)在冰上解冻,然后根据制造商的说明,通过0.5ml Zeba柱将50μl缓冲液交换到50mMHEPES pH 8,100mM乙酸钾,2mM EDTA中。使用A280纳米值将回收的蛋白质进行定量,并使用相同的缓冲液调节至0.25mg ml-1
将27ul缓冲液交换蛋白与3μl衔接子2在DNA低结合eppendorf中混合,并在35℃下孵育10分钟。然后加入0.37μl的8.1mM TMAD,将样品在35℃下孵育60分钟。然后加入30μl的50mM HEPES pH 8,1M NaCl,2mM MgCl2,2mM rATP,并在室温下再放置20分钟。
加入222μl的Agencourt AMPure珠(Beckman Coulter)并将样品在室温下在旋转器上温育5分钟。将珠粒在磁架上沉淀并除去上清液。在仍然在磁架上的同时,用500μl的50mM Tris pH7.5,2.5M NaCl,20%PEG 8,000洗涤珠子,转过360°以将颗粒洗涤在架子上。除去洗涤缓冲液,将颗粒在离心机中短暂脉冲,然后返回磁架以除去最后残留的溶液。将沉淀物在室温下重悬于30μl的50mM Tris pH 7.5,20mM NaCl中5分钟,然后置于磁架上以回收纯化的衔接子,该衔接子称为预装Y-衔接子2。
将500ng末端修复的和dA尾的大肠杆菌基因组DNA在室温下以50μl与来自上面的5μl的200nM预加载的Y-衔接子2和1μl的1μMHP-衔接子(ID)NO:4)在1x Blunt/TA主混合物(NEB)中连接10分钟。孵育后,加入0.5μl的5μM发夹系链(ID NO:6),并将样品在室温下再放置10分钟。
将25ul的MyOne C1链霉抗生物素蛋白珠(Invitrogen)与磁架结合,除去上清液。然后通过重悬于200μl的10mM Tris pH 7.5,2M NaCl,0.1mM EDTA中将颗粒洗涤3次。最后,将珠子重悬于50μl的10mM Tris pH 7.5,2M NaCl,0.1mM EDTA中。然后将珠子加入到连接混合物中并在室温下在旋转器上孵育10分钟。然后将珠子结合的文库加入磁架中并除去上清液。然后通过重悬于200μl的10mM Tris pH 7.5,2M NaCl,0.1mM EDTA中将颗粒洗涤3次。最后,将珠子重悬于12.5μl的40mM CAPS pH 10,40mM KCl,5mM生物素,0.1mM EDTA和400nM系链(ID NO:5)中。将样品在37℃温育10分钟,然后沉淀珠子并除去含有上清液的文库。
从插入在缓冲液(25mM磷酸钾缓冲液、150mM亚铁氰化钾(II)、150mM铁氰化钾(III)、pH 8.0)中的嵌段共聚物中的单一MspA纳米孔获取电测量。在达到插入在嵌段共聚物中的单一孔之后,接着缓冲液(2mL,25mM磷酸钾缓冲液,150mM亚铁(II)氰化钾,150mM铁(III)氰化钾,pH 8.0)流过系统,移除任何过量的MspA纳米孔。500μl的25mM磷酸钾缓冲液pH8,500mM KCl,2mM MgCl2和2mM rATP,每次洗涤间隔10分钟。将12ul回收的珠子纯化的文库加入150μl的50mM磷酸钾缓冲液pH8,1M KCl,8μl的75mM MgCl2,75mM rATP和130μl的无核酸酶水中。150ul该测序混合物然后被添加到纳米孔系统中。实验在–140mV下进行,并且监测解旋酶控制的DNA移动。
ID NO:7
/叠氮化物/(SEQ ID NO:39)/iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3/(SEQ ID NO:28)/iSp18//iSp18//iSp18//iSp18/(SEQ IDNO:29)
ID NO:8
SEQ ID NO:40
ID NO:9
/5Phos/(SEQ ID NO:41)/iSp18//iSp18//iSp18//iSp18/(SEQ ID NO:32)/DBCO/
结果
解旋酶T4Dda-(E94C/F98W/C109A/C136A/A360C)用于控制连接的多核苷酸通过MspA纳米孔的运动。图8显示了随着易位通过纳米孔,连接多核苷酸(与五个后续多核苷酸连接的第一多核苷酸)的电流迹线(顶部迹线)。图8的下部迹线示出了上部迹线的放大区域a*-k*。下部迹线显示间隔基团(在第一和后续多核苷酸的前导区和发夹区中发现并用a*-k*标记)易位通过纳米孔。间隔基团允许更多的电流在它们易位通过纳米孔时流过纳米孔。示例性迹线显示使用点击化学将第一多核苷酸成功连接至五个后续多核苷酸。
实施例3
该实施例描述了表征连接多核苷酸的方法,其中用于将多核苷酸连在一起的连接方法是通过点击化学。在该实施例中,一组衔接子具有用于产生种子文库的预结合酶,第二组没有用于产生测序文库的酶结合。
种子库准备:
前导链(ID NO:10),含有3'发夹的底链(ID NO:9)和使用含有系链杂交位点的阻断链(ID NO:8)产生种子文库Y-衔接子,其在50mM HEPES pH 8,100mM乙酸钾中以每分钟2℃从95℃至22℃分别在5.5μM、6μM和5μM下退火。杂交的DNA被称为衔接子2。
等分试样的T4Dda-(E94C/F98W/C109A/C136A/A360C)(SEQ ID NO:24,具有突变E94C/F98W/C109A/C136A/A360C然后(ΔM1)G1G2(其中(ΔM1)G1G2=M1的缺失然后加入G1和G2)在冰上解冻,然后根据制造商的说明,通过0.5ml Zeba柱将50μl缓冲液交换到50mMHEPES pH 8,100mM乙酸钾,2mM EDTA中。使用A280纳米值将回收的蛋白质进行定量,并使用相同的缓冲液调节至0.25mg ml-1
将27ul缓冲液交换蛋白与3μl衔接子2在DNA低结合eppendorf中混合,并在35℃下孵育10分钟。然后加入0.37μl的8.1mMTMAD,将样品在35℃下孵育60分钟。然后加入30μl的50mM HEPES pH 8,1M NaCl,2mM MgCl 2,2mM rATP,并在室温下再放置20分钟。
加入222μl的Agencourt AMPure珠(Beckman Coulter)并将样品在室温下在旋转器上温育5分钟。将珠粒在磁架上沉淀并除去上清液。在仍然在磁架上的同时,用500μl的50mM Tris pH7.5,2.5M NaCl,20%PEG 8,000洗涤珠子,转过360°以将颗粒洗涤在架子上。除去洗涤缓冲液,将颗粒在离心机中短暂脉冲,然后返回磁架以除去最后残留的溶液。将沉淀物在室温下重悬于30μl的50mM Tris pH 7.5,20mM NaCl中5分钟,然后置于磁架上以回收纯化的衔接子,该衔接子称为预装种子Y-衔接子2。
通过将前导链(ID NO:7)和含有系链杂交位点的阻断链(ID NO:11)和polyA 5'延伸杂交产生测序文库Y-衔接子,分别在250nM和300nM,在50mM HEPES pH 8,100mM乙酸钾中以每分钟2℃从95℃至22℃。将含有3'发夹的400μM底链(ID NO:9)加热至95℃持续1分钟,然后在冰上在50mM HEPES pH 8,100mM乙酸钾中快速冷却。将两个样品平衡至50℃,然后以1:1混合,并在40℃下放置1分钟,然后在冰上快速冷却。该样品称为无酶测序文库Y-衔接子3。
将500ng末端修复的和dA尾的大肠杆菌基因组DNA在室温下以50μl与来自上面的5μl的200nM预加载种子Y-衔接子2和1μl的1μM HP-衔接子(ID)NO:4)在1x Blunt/TA主混合物(NEB)中连接10分钟,建立种子库。孵育后,加入0.5μl的5μM发夹系链(ID NO:6),并将样品在室温下再放置10分钟。
将25ul的MyOne C1链霉抗生物素蛋白珠(Invitrogen)与磁架结合,除去上清液。然后通过重悬于200μl的10mM Tris pH 7.5,2M NaCl,0.1mM EDTA中将颗粒洗涤3次。最后,将珠子重悬于50μl的10mM Tris pH 7.5,2M NaCl,0.1mM EDTA中。然后将珠子加入到连接混合物中并在室温下在旋转器上孵育10分钟。然后将珠子结合的文库加入磁架中并除去上清液。然后通过重悬于200μl的10mM Tris pH 7.5,2M NaCl,0.1mM EDTA中将颗粒洗涤3次。最后,将珠子重悬于12.5μl的40mM CAPS pH 10,40mM KCl,5mM生物素,0.1mM EDTA和400nM系链(ID NO:5)中。将样品在37℃温育10分钟,然后沉淀珠子并除去含有上清液的文库。
将500ng末端修复的和dA尾的大肠杆菌基因组DNA在室温下以50μl与来自上面的5μl的200nM无酶测序库Y-衔接子3和1μl的1μMHP-衔接子(ID)NO:4)在1x Blunt/TA主混合物(NEB)中连接10分钟,建立测序库。孵育后,加入0.5μl的5μM发夹系链(ID NO:6),并将样品在室温下再放置10分钟。
将25ul的MyOne C1链霉抗生物素蛋白珠(Invitrogen)与磁架结合,除去上清液。然后通过重悬于200μl的10mM Tris pH 7.5,2M NaCl,0.1mM EDTA中将颗粒洗涤3次。最后,将珠子重悬于50μl的10mM Tris pH 7.5,2M NaCl,0.1mM EDTA中。然后将珠子加入到连接混合物中并在室温下在旋转器上孵育10分钟。然后将珠子结合的文库加入磁架中并除去上清液。然后通过重悬于200μl的10mM Tris pH 7.5,2M NaCl,0.1mM EDTA中将颗粒洗涤3次。最后,将珠子重悬于12.5μl的40mM CAPS pH 10,40mM KCl,5mM生物素,0.1mM EDTA和400nM系链(ID NO:5)中。将样品在37℃温育10分钟,然后沉淀珠子并除去含有上清液的文库。
从插入在缓冲液(pH 8.0的25mM磷酸钾缓冲液、150mM亚铁氰化钾(II)、150mM铁氰化钾(III))中的嵌段共聚物中的单一MspA纳米孔获得电测量。在达到插入在嵌段共聚物中的单一孔之后,接着缓冲液(2mL,25mM磷酸钾缓冲液,150mM亚铁(II)氰化钾,150mM铁(III)氰化钾,pH 8.0)流过系统,移除任何过量的MspA纳米孔。500μl的25mM磷酸钾缓冲液pH8,500mM KCl,2mM MgCl2和2mM rATP,每次洗涤间隔10分钟。将6ul回收的珠子纯化种子文库加入到150μl的50mM磷酸钾缓冲液pH8,1M KCl,8μl的75mM MgCl2,75mM rATP和130μl的无核酸酶水中。通过倒置彻底混合后,加入6μl测序文库,再次通过倒置将样品充分混合。然后将150μl该测序混合物加入纳米孔系统中。实验在–140mV下进行,并且监测解旋酶控制的DNA移动6小时。
ID NO:10
/5SpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3/(SEQ IDNO:28)/iSp18//iSp18//iSp18//iSp18/(SEQ ID NO:29)
ID NO 11
(SEQ ID NO:42)
结果
解旋酶T4Dda-(E94C/F98W/C109A/C136A/A360C)用于控制连接的多核苷酸通过MspA纳米孔的运动。获得了与实施例2中观察到的相似的结果。
实施例4
该实施例描述了仅表征和连接靶多核苷酸的模板链的方法,其中用于将多核苷酸连在一起的连接方法是通过点击化学。
制备含有运动蛋白和释放蛋白的连接衔接子复合物。然后将该衔接子连接到靶多核苷酸的两端。两种蛋白质在连接的衔接子复合物上停滞,直到连接到靶多核苷酸的衔接子被孔捕获。一旦捕获了第一个多核苷酸,用于阻止蛋白质的阻断化学物质就被两种蛋白质克服。然后,如前所述,运动蛋白控制第一多核苷酸与孔的相互作用,并且释放蛋白可以比运动蛋白更快地转位,其分离链以暴露衔接子3'末端中的序列(3'杂交位点),该末端连接到靶多核苷酸的末端,该靶多核苷酸与衔接子复合物的前导链的5'核酸序列(5'杂交位点)互补,所述衔接子复合物与第二靶多核苷酸连接。通过显露3'杂交位点,第二靶多核苷酸中的5'杂交位点然后可以与显露的3'杂交位点杂交,并且第一多核苷酸的3'末端与第二多核苷酸的5'的共价偶联可以发生(图10)。然后重复该过程以进一步连接靶多核苷酸。
序列表
<110> 牛津纳米孔技术公司
<120> 连接的核酸的纳米孔测序方法
<130> N408273WO
<140> TBC
<141> 2017-05-25
<150> GB 1609221.5
<151> 2016-05-25
<160> 43
<170> PatentIn version 3.5
<210> 1
<211> 558
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> MS-B1 突变 MspA 单体(MS-B1 mutant MspA monomer)
<400> 1
atgggtctgg ataatgaact gagcctggtg gacggtcaag atcgtaccct gacggtgcaa 60
caatgggata cctttctgaa tggcgttttt ccgctggatc gtaatcgcct gacccgtgaa 120
tggtttcatt ccggtcgcgc aaaatatatc gtcgcaggcc cgggtgctga cgaattcgaa 180
ggcacgctgg aactgggtta tcagattggc tttccgtggt cactgggcgt tggtatcaac 240
ttctcgtaca ccacgccgaa tattctgatc aacaatggta acattaccgc accgccgttt 300
ggcctgaaca gcgtgattac gccgaacctg tttccgggtg ttagcatctc tgcccgtctg 360
ggcaatggtc cgggcattca agaagtggca acctttagtg tgcgcgtttc cggcgctaaa 420
ggcggtgtcg cggtgtctaa cgcccacggt accgttacgg gcgcggccgg cggtgtcctg 480
ctgcgtccgt tcgcgcgcct gattgcctct accggcgaca gcgttacgac ctatggcgaa 540
ccgtggaata tgaactaa 558
<210> 2
<211> 184
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MspA 单体的MS-B1 突变的成熟形式(Mature form of the MS-B1 mutant of theMspA monomer)
<400> 2
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asn Asn Gly Asn Ile Thr Ala
85 90 95
Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Arg Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Arg Val Ser Gly Ala Lys Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 3
<211> 885
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> alpha-溶血素-E111N/K147N的单体(Monomer of alpha-hemolysin-E111N/K147N)
<400> 3
atggcagatt ctgatattaa tattaaaacc ggtactacag atattggaag caatactaca 60
gtaaaaacag gtgatttagt cacttatgat aaagaaaatg gcatgcacaa aaaagtattt 120
tatagtttta tcgatgataa aaatcacaat aaaaaactgc tagttattag aacaaaaggt 180
accattgctg gtcaatatag agtttatagc gaagaaggtg ctaacaaaag tggtttagcc 240
tggccttcag cctttaaggt acagttgcaa ctacctgata atgaagtagc tcaaatatct 300
gattactatc caagaaattc gattgataca aaaaactata tgagtacttt aacttatgga 360
ttcaacggta atgttactgg tgatgataca ggaaaaattg gcggccttat tggtgcaaat 420
gtttcgattg gtcatacact gaactatgtt caacctgatt tcaaaacaat tttagagagc 480
ccaactgata aaaaagtagg ctggaaagtg atatttaaca atatggtgaa tcaaaattgg 540
ggaccatacg atcgagattc ttggaacccg gtatatggca atcaactttt catgaaaact 600
agaaatggtt ctatgaaagc agcagataac ttccttgatc ctaacaaagc aagttctcta 660
ttatcttcag ggttttcacc agacttcgct acagttatta ctatggatag aaaagcatcc 720
aaacaacaaa caaatataga tgtaatatac gaacgagttc gtgatgatta ccaattgcat 780
tggacttcaa caaattggaa aggtaccaat actaaagata aatggacaga tcgttcttca 840
gaaagatata aaatcgattg ggaaaaagaa gaaatgacaa attaa 885
<210> 4
<211> 293
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> alpha-HL-NN的单体(Monomer of alpha-HL-NN)
<400> 4
Ala Asp Ser Asp Ile Asn Ile Lys Thr Gly Thr Thr Asp Ile Gly Ser
1 5 10 15
Asn Thr Thr Val Lys Thr Gly Asp Leu Val Thr Tyr Asp Lys Glu Asn
20 25 30
Gly Met His Lys Lys Val Phe Tyr Ser Phe Ile Asp Asp Lys Asn His
35 40 45
Asn Lys Lys Leu Leu Val Ile Arg Thr Lys Gly Thr Ile Ala Gly Gln
50 55 60
Tyr Arg Val Tyr Ser Glu Glu Gly Ala Asn Lys Ser Gly Leu Ala Trp
65 70 75 80
Pro Ser Ala Phe Lys Val Gln Leu Gln Leu Pro Asp Asn Glu Val Ala
85 90 95
Gln Ile Ser Asp Tyr Tyr Pro Arg Asn Ser Ile Asp Thr Lys Asn Tyr
100 105 110
Met Ser Thr Leu Thr Tyr Gly Phe Asn Gly Asn Val Thr Gly Asp Asp
115 120 125
Thr Gly Lys Ile Gly Gly Leu Ile Gly Ala Asn Val Ser Ile Gly His
130 135 140
Thr Leu Asn Tyr Val Gln Pro Asp Phe Lys Thr Ile Leu Glu Ser Pro
145 150 155 160
Thr Asp Lys Lys Val Gly Trp Lys Val Ile Phe Asn Asn Met Val Asn
165 170 175
Gln Asn Trp Gly Pro Tyr Asp Arg Asp Ser Trp Asn Pro Val Tyr Gly
180 185 190
Asn Gln Leu Phe Met Lys Thr Arg Asn Gly Ser Met Lys Ala Ala Asp
195 200 205
Asn Phe Leu Asp Pro Asn Lys Ala Ser Ser Leu Leu Ser Ser Gly Phe
210 215 220
Ser Pro Asp Phe Ala Thr Val Ile Thr Met Asp Arg Lys Ala Ser Lys
225 230 235 240
Gln Gln Thr Asn Ile Asp Val Ile Tyr Glu Arg Val Arg Asp Asp Tyr
245 250 255
Gln Leu His Trp Thr Ser Thr Asn Trp Lys Gly Thr Asn Thr Lys Asp
260 265 270
Lys Trp Thr Asp Arg Ser Ser Glu Arg Tyr Lys Ile Asp Trp Glu Lys
275 280 285
Glu Glu Met Thr Asn
290
<210> 5
<211> 184
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MspB
<400> 5
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Ala
85 90 95
Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 6
<211> 184
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MspC
<400> 6
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Gly
85 90 95
Pro Pro Phe Gly Leu Glu Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 7
<211> 183
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MspD
<400> 7
Val Asp Asn Gln Leu Ser Val Val Asp Gly Gln Gly Arg Thr Leu Thr
1 5 10 15
Val Gln Gln Ala Glu Thr Phe Leu Asn Gly Val Phe Pro Leu Asp Arg
20 25 30
Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Thr Tyr His
35 40 45
Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu Gly
50 55 60
Tyr Gln Val Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe Ser
65 70 75 80
Tyr Thr Thr Pro Asn Ile Leu Ile Asp Gly Gly Asp Ile Thr Gln Pro
85 90 95
Pro Phe Gly Leu Asp Thr Ile Ile Thr Pro Asn Leu Phe Pro Gly Val
100 105 110
Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val Ala
115 120 125
Thr Phe Ser Val Asp Val Lys Gly Ala Lys Gly Ala Val Ala Val Ser
130 135 140
Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu Arg
145 150 155 160
Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr Tyr
165 170 175
Gly Glu Pro Trp Asn Met Asn
180
<210> 8
<211> 1830
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Phi29 DNA 聚合酶(Phi29 DNA polymerase)
<400> 8
atgaaacaca tgccgcgtaa aatgtatagc tgcgcgtttg aaaccacgac caaagtggaa 60
gattgtcgcg tttgggccta tggctacatg aacatcgaag atcattctga atacaaaatc 120
ggtaacagtc tggatgaatt tatggcatgg gtgctgaaag ttcaggcgga tctgtacttc 180
cacaacctga aatttgatgg cgcattcatt atcaactggc tggaacgtaa tggctttaaa 240
tggagcgcgg atggtctgcc gaacacgtat aataccatta tctctcgtat gggccagtgg 300
tatatgattg atatctgcct gggctacaaa ggtaaacgca aaattcatac cgtgatctat 360
gatagcctga aaaaactgcc gtttccggtg aagaaaattg cgaaagattt caaactgacg 420
gttctgaaag gcgatattga ttatcacaaa gaacgtccgg ttggttacaa aatcaccccg 480
gaagaatacg catacatcaa aaacgatatc cagatcatcg cagaagcgct gctgattcag 540
tttaaacagg gcctggatcg catgaccgcg ggcagtgata gcctgaaagg tttcaaagat 600
atcatcacga ccaaaaaatt caaaaaagtg ttcccgacgc tgagcctggg tctggataaa 660
gaagttcgtt atgcctaccg cggcggtttt acctggctga acgatcgttt caaagaaaaa 720
gaaattggcg agggtatggt gtttgatgtt aatagtctgt atccggcaca gatgtacagc 780
cgcctgctgc cgtatggcga accgatcgtg ttcgagggta aatatgtttg ggatgaagat 840
tacccgctgc atattcagca catccgttgt gaatttgaac tgaaagaagg ctatattccg 900
accattcaga tcaaacgtag tcgcttctat aagggtaacg aatacctgaa aagctctggc 960
ggtgaaatcg cggatctgtg gctgagtaac gtggatctgg aactgatgaa agaacactac 1020
gatctgtaca acgttgaata catcagcggc ctgaaattta aagccacgac cggtctgttc 1080
aaagatttca tcgataaatg gacctacatc aaaacgacct ctgaaggcgc gattaaacag 1140
ctggccaaac tgatgctgaa cagcctgtat ggcaaattcg cctctaatcc ggatgtgacc 1200
ggtaaagttc cgtacctgaa agaaaatggc gcactgggtt ttcgcctggg cgaagaagaa 1260
acgaaagatc cggtgtatac cccgatgggt gttttcatta cggcctgggc acgttacacg 1320
accatcaccg cggcccaggc atgctatgat cgcattatct actgtgatac cgattctatt 1380
catctgacgg gcaccgaaat cccggatgtg attaaagata tcgttgatcc gaaaaaactg 1440
ggttattggg cccacgaaag tacgtttaaa cgtgcaaaat acctgcgcca gaaaacctac 1500
atccaggata tctacatgaa agaagtggat ggcaaactgg ttgaaggttc tccggatgat 1560
tacaccgata tcaaattcag tgtgaaatgc gccggcatga cggataaaat caaaaaagaa 1620
gtgaccttcg aaaacttcaa agttggtttc agccgcaaaa tgaaaccgaa accggtgcag 1680
gttccgggcg gtgtggttct ggtggatgat acgtttacca ttaaatctgg cggtagtgcg 1740
tggagccatc cgcagttcga aaaaggcggt ggctctggtg gcggttctgg cggtagtgcc 1800
tggagccacc cgcagtttga aaaataataa 1830
<210> 9
<211> 608
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Phi29 DNA 聚合酶(Phi29 DNA polymerase)
<400> 9
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Ala Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ala Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Lys Asp Phe Lys Leu Thr Val Leu Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Tyr
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Glu Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Val Asn Ser Leu Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Arg Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Arg Ser Arg Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Leu Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr
355 360 365
Tyr Ile Lys Thr Thr Ser Glu Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Thr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Trp Ala Arg Tyr Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Glu Ile Pro Asp Val Ile Lys Asp Ile Val Asp Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Ala His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Glu Val Asp Gly Lys
500 505 510
Leu Val Glu Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Lys Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Pro Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Asp Thr Phe Thr Ile Lys Ser
565 570 575
Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser
580 585 590
Gly Gly Gly Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys
595 600 605
<210> 10
<211> 1390
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 衍生自来自大肠杆菌的sbcB基因的密码子优化的多核苷酸序列(Codon optimisedpolynucleotide sequence derived from the sbcB gene from E. coli)
<400> 10
atgatgaacg atggcaaaca gcagagcacc ttcctgtttc atgattatga aaccttcggt 60
acccatccgg ccctggatcg tccggcgcag tttgcggcca ttcgcaccga tagcgaattc 120
aatgtgattg gcgaaccgga agtgttttat tgcaaaccgg ccgatgatta tctgccgcag 180
ccgggtgcgg tgctgattac cggtattacc ccgcaggaag cgcgcgcgaa aggtgaaaac 240
gaagcggcgt ttgccgcgcg cattcatagc ctgtttaccg tgccgaaaac ctgcattctg 300
ggctataaca atgtgcgctt cgatgatgaa gttacccgta atatctttta tcgtaacttt 360
tatgatccgt atgcgtggag ctggcagcat gataacagcc gttgggatct gctggatgtg 420
atgcgcgcgt gctatgcgct gcgcccggaa ggcattaatt ggccggaaaa cgatgatggc 480
ctgccgagct ttcgtctgga acatctgacc aaagccaacg gcattgaaca tagcaatgcc 540
catgatgcga tggccgatgt ttatgcgacc attgcgatgg cgaaactggt taaaacccgt 600
cagccgcgcc tgtttgatta tctgtttacc caccgtaaca aacacaaact gatggcgctg 660
attgatgttc cgcagatgaa accgctggtg catgtgagcg gcatgtttgg cgcctggcgc 720
ggcaacacca gctgggtggc cccgctggcc tggcacccgg aaaatcgtaa cgccgtgatt 780
atggttgatc tggccggtga tattagcccg ctgctggaac tggatagcga taccctgcgt 840
gaacgcctgt ataccgccaa aaccgatctg ggcgataatg ccgccgtgcc ggtgaaactg 900
gttcacatta acaaatgccc ggtgctggcc caggcgaaca ccctgcgccc ggaagatgcg 960
gatcgtctgg gtattaatcg ccagcattgt ctggataatc tgaaaatcct gcgtgaaaac 1020
ccgcaggtgc gtgaaaaagt ggtggcgatc ttcgcggaag cggaaccgtt caccccgagc 1080
gataacgtgg atgcgcagct gtataacggc ttctttagcg atgccgatcg cgcggcgatg 1140
aaaatcgttc tggaaaccga accgcgcaat ctgccggcgc tggatattac ctttgttgat 1200
aaacgtattg aaaaactgct gtttaattat cgtgcgcgca attttccggg taccctggat 1260
tatgccgaac agcagcgttg gctggaacat cgtcgtcagg ttttcacccc ggaatttctg 1320
cagggttatg cggatgaact gcagatgctg gttcagcagt atgccgatga taaagaaaaa 1380
gtggcgctgc 1390
<210> 11
<211> 485
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自大肠杆菌的核酶外切酶I梅(EcoExoI)(Exonuclease I enzyme (EcoExoI)from E. coli)
<400> 11
Met Met Asn Asp Gly Lys Gln Gln Ser Thr Phe Leu Phe His Asp Tyr
1 5 10 15
Glu Thr Phe Gly Thr His Pro Ala Leu Asp Arg Pro Ala Gln Phe Ala
20 25 30
Ala Ile Arg Thr Asp Ser Glu Phe Asn Val Ile Gly Glu Pro Glu Val
35 40 45
Phe Tyr Cys Lys Pro Ala Asp Asp Tyr Leu Pro Gln Pro Gly Ala Val
50 55 60
Leu Ile Thr Gly Ile Thr Pro Gln Glu Ala Arg Ala Lys Gly Glu Asn
65 70 75 80
Glu Ala Ala Phe Ala Ala Arg Ile His Ser Leu Phe Thr Val Pro Lys
85 90 95
Thr Cys Ile Leu Gly Tyr Asn Asn Val Arg Phe Asp Asp Glu Val Thr
100 105 110
Arg Asn Ile Phe Tyr Arg Asn Phe Tyr Asp Pro Tyr Ala Trp Ser Trp
115 120 125
Gln His Asp Asn Ser Arg Trp Asp Leu Leu Asp Val Met Arg Ala Cys
130 135 140
Tyr Ala Leu Arg Pro Glu Gly Ile Asn Trp Pro Glu Asn Asp Asp Gly
145 150 155 160
Leu Pro Ser Phe Arg Leu Glu His Leu Thr Lys Ala Asn Gly Ile Glu
165 170 175
His Ser Asn Ala His Asp Ala Met Ala Asp Val Tyr Ala Thr Ile Ala
180 185 190
Met Ala Lys Leu Val Lys Thr Arg Gln Pro Arg Leu Phe Asp Tyr Leu
195 200 205
Phe Thr His Arg Asn Lys His Lys Leu Met Ala Leu Ile Asp Val Pro
210 215 220
Gln Met Lys Pro Leu Val His Val Ser Gly Met Phe Gly Ala Trp Arg
225 230 235 240
Gly Asn Thr Ser Trp Val Ala Pro Leu Ala Trp His Pro Glu Asn Arg
245 250 255
Asn Ala Val Ile Met Val Asp Leu Ala Gly Asp Ile Ser Pro Leu Leu
260 265 270
Glu Leu Asp Ser Asp Thr Leu Arg Glu Arg Leu Tyr Thr Ala Lys Thr
275 280 285
Asp Leu Gly Asp Asn Ala Ala Val Pro Val Lys Leu Val His Ile Asn
290 295 300
Lys Cys Pro Val Leu Ala Gln Ala Asn Thr Leu Arg Pro Glu Asp Ala
305 310 315 320
Asp Arg Leu Gly Ile Asn Arg Gln His Cys Leu Asp Asn Leu Lys Ile
325 330 335
Leu Arg Glu Asn Pro Gln Val Arg Glu Lys Val Val Ala Ile Phe Ala
340 345 350
Glu Ala Glu Pro Phe Thr Pro Ser Asp Asn Val Asp Ala Gln Leu Tyr
355 360 365
Asn Gly Phe Phe Ser Asp Ala Asp Arg Ala Ala Met Lys Ile Val Leu
370 375 380
Glu Thr Glu Pro Arg Asn Leu Pro Ala Leu Asp Ile Thr Phe Val Asp
385 390 395 400
Lys Arg Ile Glu Lys Leu Leu Phe Asn Tyr Arg Ala Arg Asn Phe Pro
405 410 415
Gly Thr Leu Asp Tyr Ala Glu Gln Gln Arg Trp Leu Glu His Arg Arg
420 425 430
Gln Val Phe Thr Pro Glu Phe Leu Gln Gly Tyr Ala Asp Glu Leu Gln
435 440 445
Met Leu Val Gln Gln Tyr Ala Asp Asp Lys Glu Lys Val Ala Leu Leu
450 455 460
Lys Ala Leu Trp Gln Tyr Ala Glu Glu Ile Val Ser Gly Ser Gly His
465 470 475 480
His His His His His
485
<210> 12
<211> 804
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 衍生自来自大肠杆菌的xthA基因的密码子优化的多核苷酸序列(Codon optimisedpolynucleotide sequence derived from the xthA gene from E. coli)
<400> 12
atgaaatttg tctcttttaa tatcaacggc ctgcgcgcca gacctcacca gcttgaagcc 60
atcgtcgaaa agcaccaacc ggatgtgatt ggcctgcagg agacaaaagt tcatgacgat 120
atgtttccgc tcgaagaggt ggcgaagctc ggctacaacg tgttttatca cgggcagaaa 180
ggccattatg gcgtggcgct gctgaccaaa gagacgccga ttgccgtgcg tcgcggcttt 240
cccggtgacg acgaagaggc gcagcggcgg attattatgg cggaaatccc ctcactgctg 300
ggtaatgtca ccgtgatcaa cggttacttc ccgcagggtg aaagccgcga ccatccgata 360
aaattcccgg caaaagcgca gttttatcag aatctgcaaa actacctgga aaccgaactc 420
aaacgtgata atccggtact gattatgggc gatatgaata tcagccctac agatctggat 480
atcggcattg gcgaagaaaa ccgtaagcgc tggctgcgta ccggtaaatg ctctttcctg 540
ccggaagagc gcgaatggat ggacaggctg atgagctggg ggttggtcga taccttccgc 600
catgcgaatc cgcaaacagc agatcgtttc tcatggtttg attaccgctc aaaaggtttt 660
gacgataacc gtggtctgcg catcgacctg ctgctcgcca gccaaccgct ggcagaatgt 720
tgcgtagaaa ccggcatcga ctatgaaatc cgcagcatgg aaaaaccgtc cgatcacgcc 780
cccgtctggg cgaccttccg ccgc 804
<210> 13
<211> 268
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自大肠杆菌的核酶外切酶III酶(Exonuclease III enzyme from E. coli)
<400> 13
Met Lys Phe Val Ser Phe Asn Ile Asn Gly Leu Arg Ala Arg Pro His
1 5 10 15
Gln Leu Glu Ala Ile Val Glu Lys His Gln Pro Asp Val Ile Gly Leu
20 25 30
Gln Glu Thr Lys Val His Asp Asp Met Phe Pro Leu Glu Glu Val Ala
35 40 45
Lys Leu Gly Tyr Asn Val Phe Tyr His Gly Gln Lys Gly His Tyr Gly
50 55 60
Val Ala Leu Leu Thr Lys Glu Thr Pro Ile Ala Val Arg Arg Gly Phe
65 70 75 80
Pro Gly Asp Asp Glu Glu Ala Gln Arg Arg Ile Ile Met Ala Glu Ile
85 90 95
Pro Ser Leu Leu Gly Asn Val Thr Val Ile Asn Gly Tyr Phe Pro Gln
100 105 110
Gly Glu Ser Arg Asp His Pro Ile Lys Phe Pro Ala Lys Ala Gln Phe
115 120 125
Tyr Gln Asn Leu Gln Asn Tyr Leu Glu Thr Glu Leu Lys Arg Asp Asn
130 135 140
Pro Val Leu Ile Met Gly Asp Met Asn Ile Ser Pro Thr Asp Leu Asp
145 150 155 160
Ile Gly Ile Gly Glu Glu Asn Arg Lys Arg Trp Leu Arg Thr Gly Lys
165 170 175
Cys Ser Phe Leu Pro Glu Glu Arg Glu Trp Met Asp Arg Leu Met Ser
180 185 190
Trp Gly Leu Val Asp Thr Phe Arg His Ala Asn Pro Gln Thr Ala Asp
195 200 205
Arg Phe Ser Trp Phe Asp Tyr Arg Ser Lys Gly Phe Asp Asp Asn Arg
210 215 220
Gly Leu Arg Ile Asp Leu Leu Leu Ala Ser Gln Pro Leu Ala Glu Cys
225 230 235 240
Cys Val Glu Thr Gly Ile Asp Tyr Glu Ile Arg Ser Met Glu Lys Pro
245 250 255
Ser Asp His Ala Pro Val Trp Ala Thr Phe Arg Arg
260 265
<210> 14
<211> 1275
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 衍生自来自嗜热栖热菌的recJ基因的密码子优化的多核苷酸序列(Codonoptimised polynucleotide sequence derived from the recJ gene from T. thermophilus)
<400> 14
atgtttcgtc gtaaagaaga tctggatccg ccgctggcac tgctgccgct gaaaggcctg 60
cgcgaagccg ccgcactgct ggaagaagcg ctgcgtcaag gtaaacgcat tcgtgttcac 120
ggcgactatg atgcggatgg cctgaccggc accgcgatcc tggttcgtgg tctggccgcc 180
ctgggtgcgg atgttcatcc gtttatcccg caccgcctgg aagaaggcta tggtgtcctg 240
atggaacgcg tcccggaaca tctggaagcc tcggacctgt ttctgaccgt tgactgcggc 300
attaccaacc atgcggaact gcgcgaactg ctggaaaatg gcgtggaagt cattgttacc 360
gatcatcata cgccgggcaa aacgccgccg ccgggtctgg tcgtgcatcc ggcgctgacg 420
ccggatctga aagaaaaacc gaccggcgca ggcgtggcgt ttctgctgct gtgggcactg 480
catgaacgcc tgggcctgcc gccgccgctg gaatacgcgg acctggcagc cgttggcacc 540
attgccgacg ttgccccgct gtggggttgg aatcgtgcac tggtgaaaga aggtctggca 600
cgcatcccgg cttcatcttg ggtgggcctg cgtctgctgg ctgaagccgt gggctatacc 660
ggcaaagcgg tcgaagtcgc tttccgcatc gcgccgcgca tcaatgcggc ttcccgcctg 720
ggcgaagcgg aaaaagccct gcgcctgctg ctgacggatg atgcggcaga agctcaggcg 780
ctggtcggcg aactgcaccg tctgaacgcc cgtcgtcaga ccctggaaga agcgatgctg 840
cgcaaactgc tgccgcaggc cgacccggaa gcgaaagcca tcgttctgct ggacccggaa 900
ggccatccgg gtgttatggg tattgtggcc tctcgcatcc tggaagcgac cctgcgcccg 960
gtctttctgg tggcccaggg caaaggcacc gtgcgttcgc tggctccgat ttccgccgtc 1020
gaagcactgc gcagcgcgga agatctgctg ctgcgttatg gtggtcataa agaagcggcg 1080
ggtttcgcaa tggatgaagc gctgtttccg gcgttcaaag cacgcgttga agcgtatgcc 1140
gcacgtttcc cggatccggt tcgtgaagtg gcactgctgg atctgctgcc ggaaccgggc 1200
ctgctgccgc aggtgttccg tgaactggca ctgctggaac cgtatggtga aggtaacccg 1260
gaaccgctgt tcctg 1275
<210> 15
<211> 425
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自嗜热栖热菌的RecJ酶(TthRecJ-cd)(RecJ enzyme from T. thermophilus(TthRecJ-cd))
<400> 15
Met Phe Arg Arg Lys Glu Asp Leu Asp Pro Pro Leu Ala Leu Leu Pro
1 5 10 15
Leu Lys Gly Leu Arg Glu Ala Ala Ala Leu Leu Glu Glu Ala Leu Arg
20 25 30
Gln Gly Lys Arg Ile Arg Val His Gly Asp Tyr Asp Ala Asp Gly Leu
35 40 45
Thr Gly Thr Ala Ile Leu Val Arg Gly Leu Ala Ala Leu Gly Ala Asp
50 55 60
Val His Pro Phe Ile Pro His Arg Leu Glu Glu Gly Tyr Gly Val Leu
65 70 75 80
Met Glu Arg Val Pro Glu His Leu Glu Ala Ser Asp Leu Phe Leu Thr
85 90 95
Val Asp Cys Gly Ile Thr Asn His Ala Glu Leu Arg Glu Leu Leu Glu
100 105 110
Asn Gly Val Glu Val Ile Val Thr Asp His His Thr Pro Gly Lys Thr
115 120 125
Pro Pro Pro Gly Leu Val Val His Pro Ala Leu Thr Pro Asp Leu Lys
130 135 140
Glu Lys Pro Thr Gly Ala Gly Val Ala Phe Leu Leu Leu Trp Ala Leu
145 150 155 160
His Glu Arg Leu Gly Leu Pro Pro Pro Leu Glu Tyr Ala Asp Leu Ala
165 170 175
Ala Val Gly Thr Ile Ala Asp Val Ala Pro Leu Trp Gly Trp Asn Arg
180 185 190
Ala Leu Val Lys Glu Gly Leu Ala Arg Ile Pro Ala Ser Ser Trp Val
195 200 205
Gly Leu Arg Leu Leu Ala Glu Ala Val Gly Tyr Thr Gly Lys Ala Val
210 215 220
Glu Val Ala Phe Arg Ile Ala Pro Arg Ile Asn Ala Ala Ser Arg Leu
225 230 235 240
Gly Glu Ala Glu Lys Ala Leu Arg Leu Leu Leu Thr Asp Asp Ala Ala
245 250 255
Glu Ala Gln Ala Leu Val Gly Glu Leu His Arg Leu Asn Ala Arg Arg
260 265 270
Gln Thr Leu Glu Glu Ala Met Leu Arg Lys Leu Leu Pro Gln Ala Asp
275 280 285
Pro Glu Ala Lys Ala Ile Val Leu Leu Asp Pro Glu Gly His Pro Gly
290 295 300
Val Met Gly Ile Val Ala Ser Arg Ile Leu Glu Ala Thr Leu Arg Pro
305 310 315 320
Val Phe Leu Val Ala Gln Gly Lys Gly Thr Val Arg Ser Leu Ala Pro
325 330 335
Ile Ser Ala Val Glu Ala Leu Arg Ser Ala Glu Asp Leu Leu Leu Arg
340 345 350
Tyr Gly Gly His Lys Glu Ala Ala Gly Phe Ala Met Asp Glu Ala Leu
355 360 365
Phe Pro Ala Phe Lys Ala Arg Val Glu Ala Tyr Ala Ala Arg Phe Pro
370 375 380
Asp Pro Val Arg Glu Val Ala Leu Leu Asp Leu Leu Pro Glu Pro Gly
385 390 395 400
Leu Leu Pro Gln Val Phe Arg Glu Leu Ala Leu Leu Glu Pro Tyr Gly
405 410 415
Glu Gly Asn Pro Glu Pro Leu Phe Leu
420 425
<210> 16
<211> 738
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 衍生自噬菌体lambda exo (redX)基因的密码子优化的多核苷酸序列(Codonoptimised polynucleotide sequence derived from the bacteriophage lambda exo (redX)gene)
<400> 16
tccggaagcg gctctggtag tggttctggc atgacaccgg acattatcct gcagcgtacc 60
gggatcgatg tgagagctgt cgaacagggg gatgatgcgt ggcacaaatt acggctcggc 120
gtcatcaccg cttcagaagt tcacaacgtg atagcaaaac cccgctccgg aaagaagtgg 180
cctgacatga aaatgtccta cttccacacc ctgcttgctg aggtttgcac cggtgtggct 240
ccggaagtta acgctaaagc actggcctgg ggaaaacagt acgagaacga cgccagaacc 300
ctgtttgaat tcacttccgg cgtgaatgtt actgaatccc cgatcatcta tcgcgacgaa 360
agtatgcgta ccgcctgctc tcccgatggt ttatgcagtg acggcaacgg ccttgaactg 420
aaatgcccgt ttacctcccg ggatttcatg aagttccggc tcggtggttt cgaggccata 480
aagtcagctt acatggccca ggtgcagtac agcatgtggg tgacgcgaaa aaatgcctgg 540
tactttgcca actatgaccc gcgtatgaag cgtgaaggcc tgcattatgt cgtgattgag 600
cgggatgaaa agtacatggc gagttttgac gagatcgtgc cggagttcat cgaaaaaatg 660
gacgaggcac tggctgaaat tggttttgta tttggggagc aatggcgatc tggctctggt 720
tccggcagcg gttccgga 738
<210> 17
<211> 226
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 噬菌体lambda核酶外切酶(Bacteriophage lambda exonuclease)
<400> 17
Met Thr Pro Asp Ile Ile Leu Gln Arg Thr Gly Ile Asp Val Arg Ala
1 5 10 15
Val Glu Gln Gly Asp Asp Ala Trp His Lys Leu Arg Leu Gly Val Ile
20 25 30
Thr Ala Ser Glu Val His Asn Val Ile Ala Lys Pro Arg Ser Gly Lys
35 40 45
Lys Trp Pro Asp Met Lys Met Ser Tyr Phe His Thr Leu Leu Ala Glu
50 55 60
Val Cys Thr Gly Val Ala Pro Glu Val Asn Ala Lys Ala Leu Ala Trp
65 70 75 80
Gly Lys Gln Tyr Glu Asn Asp Ala Arg Thr Leu Phe Glu Phe Thr Ser
85 90 95
Gly Val Asn Val Thr Glu Ser Pro Ile Ile Tyr Arg Asp Glu Ser Met
100 105 110
Arg Thr Ala Cys Ser Pro Asp Gly Leu Cys Ser Asp Gly Asn Gly Leu
115 120 125
Glu Leu Lys Cys Pro Phe Thr Ser Arg Asp Phe Met Lys Phe Arg Leu
130 135 140
Gly Gly Phe Glu Ala Ile Lys Ser Ala Tyr Met Ala Gln Val Gln Tyr
145 150 155 160
Ser Met Trp Val Thr Arg Lys Asn Ala Trp Tyr Phe Ala Asn Tyr Asp
165 170 175
Pro Arg Met Lys Arg Glu Gly Leu His Tyr Val Val Ile Glu Arg Asp
180 185 190
Glu Lys Tyr Met Ala Ser Phe Asp Glu Ile Val Pro Glu Phe Ile Glu
195 200 205
Lys Met Asp Glu Ala Leu Ala Glu Ile Gly Phe Val Phe Gly Glu Gln
210 215 220
Trp Arg
225
<210> 18
<211> 760
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Hel308 Mbu
<400> 18
Met Met Ile Arg Glu Leu Asp Ile Pro Arg Asp Ile Ile Gly Phe Tyr
1 5 10 15
Glu Asp Ser Gly Ile Lys Glu Leu Tyr Pro Pro Gln Ala Glu Ala Ile
20 25 30
Glu Met Gly Leu Leu Glu Lys Lys Asn Leu Leu Ala Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Leu Ala Glu Leu Ala Met Ile Lys Ala Ile
50 55 60
Arg Glu Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala
65 70 75 80
Ser Glu Lys Phe Glu Arg Phe Lys Glu Leu Ala Pro Phe Gly Ile Lys
85 90 95
Val Gly Ile Ser Thr Gly Asp Leu Asp Ser Arg Ala Asp Trp Leu Gly
100 105 110
Val Asn Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu
115 120 125
Arg Asn Gly Thr Ser Trp Met Asp Glu Ile Thr Thr Val Val Val Asp
130 135 140
Glu Ile His Leu Leu Asp Ser Lys Asn Arg Gly Pro Thr Leu Glu Val
145 150 155 160
Thr Ile Thr Lys Leu Met Arg Leu Asn Pro Asp Val Gln Val Val Ala
165 170 175
Leu Ser Ala Thr Val Gly Asn Ala Arg Glu Met Ala Asp Trp Leu Gly
180 185 190
Ala Ala Leu Val Leu Ser Glu Trp Arg Pro Thr Asp Leu His Glu Gly
195 200 205
Val Leu Phe Gly Asp Ala Ile Asn Phe Pro Gly Ser Gln Lys Lys Ile
210 215 220
Asp Arg Leu Glu Lys Asp Asp Ala Val Asn Leu Val Leu Asp Thr Ile
225 230 235 240
Lys Ala Glu Gly Gln Cys Leu Val Phe Glu Ser Ser Arg Arg Asn Cys
245 250 255
Ala Gly Phe Ala Lys Thr Ala Ser Ser Lys Val Ala Lys Ile Leu Asp
260 265 270
Asn Asp Ile Met Ile Lys Leu Ala Gly Ile Ala Glu Glu Val Glu Ser
275 280 285
Thr Gly Glu Thr Asp Thr Ala Ile Val Leu Ala Asn Cys Ile Arg Lys
290 295 300
Gly Val Ala Phe His His Ala Gly Leu Asn Ser Asn His Arg Lys Leu
305 310 315 320
Val Glu Asn Gly Phe Arg Gln Asn Leu Ile Lys Val Ile Ser Ser Thr
325 330 335
Pro Thr Leu Ala Ala Gly Leu Asn Leu Pro Ala Arg Arg Val Ile Ile
340 345 350
Arg Ser Tyr Arg Arg Phe Asp Ser Asn Phe Gly Met Gln Pro Ile Pro
355 360 365
Val Leu Glu Tyr Lys Gln Met Ala Gly Arg Ala Gly Arg Pro His Leu
370 375 380
Asp Pro Tyr Gly Glu Ser Val Leu Leu Ala Lys Thr Tyr Asp Glu Phe
385 390 395 400
Ala Gln Leu Met Glu Asn Tyr Val Glu Ala Asp Ala Glu Asp Ile Trp
405 410 415
Ser Lys Leu Gly Thr Glu Asn Ala Leu Arg Thr His Val Leu Ser Thr
420 425 430
Ile Val Asn Gly Phe Ala Ser Thr Arg Gln Glu Leu Phe Asp Phe Phe
435 440 445
Gly Ala Thr Phe Phe Ala Tyr Gln Gln Asp Lys Trp Met Leu Glu Glu
450 455 460
Val Ile Asn Asp Cys Leu Glu Phe Leu Ile Asp Lys Ala Met Val Ser
465 470 475 480
Glu Thr Glu Asp Ile Glu Asp Ala Ser Lys Leu Phe Leu Arg Gly Thr
485 490 495
Arg Leu Gly Ser Leu Val Ser Met Leu Tyr Ile Asp Pro Leu Ser Gly
500 505 510
Ser Lys Ile Val Asp Gly Phe Lys Asp Ile Gly Lys Ser Thr Gly Gly
515 520 525
Asn Met Gly Ser Leu Glu Asp Asp Lys Gly Asp Asp Ile Thr Val Thr
530 535 540
Asp Met Thr Leu Leu His Leu Val Cys Ser Thr Pro Asp Met Arg Gln
545 550 555 560
Leu Tyr Leu Arg Asn Thr Asp Tyr Thr Ile Val Asn Glu Tyr Ile Val
565 570 575
Ala His Ser Asp Glu Phe His Glu Ile Pro Asp Lys Leu Lys Glu Thr
580 585 590
Asp Tyr Glu Trp Phe Met Gly Glu Val Lys Thr Ala Met Leu Leu Glu
595 600 605
Glu Trp Val Thr Glu Val Ser Ala Glu Asp Ile Thr Arg His Phe Asn
610 615 620
Val Gly Glu Gly Asp Ile His Ala Leu Ala Asp Thr Ser Glu Trp Leu
625 630 635 640
Met His Ala Ala Ala Lys Leu Ala Glu Leu Leu Gly Val Glu Tyr Ser
645 650 655
Ser His Ala Tyr Ser Leu Glu Lys Arg Ile Arg Tyr Gly Ser Gly Leu
660 665 670
Asp Leu Met Glu Leu Val Gly Ile Arg Gly Val Gly Arg Val Arg Ala
675 680 685
Arg Lys Leu Tyr Asn Ala Gly Phe Val Ser Val Ala Lys Leu Lys Gly
690 695 700
Ala Asp Ile Ser Val Leu Ser Lys Leu Val Gly Pro Lys Val Ala Tyr
705 710 715 720
Asn Ile Leu Ser Gly Ile Gly Val Arg Val Asn Asp Lys His Phe Asn
725 730 735
Ser Ala Pro Ile Ser Ser Asn Thr Leu Asp Thr Leu Leu Asp Lys Asn
740 745 750
Gln Lys Thr Phe Asn Asp Phe Gln
755 760
<210> 19
<211> 707
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Hel308 Csy
<400> 19
Met Arg Ile Ser Glu Leu Asp Ile Pro Arg Pro Ala Ile Glu Phe Leu
1 5 10 15
Glu Gly Glu Gly Tyr Lys Lys Leu Tyr Pro Pro Gln Ala Ala Ala Ala
20 25 30
Lys Ala Gly Leu Thr Asp Gly Lys Ser Val Leu Val Ser Ala Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Ile Ala Ala Ile Ala Met Ile Ser His Leu
50 55 60
Ser Arg Asn Arg Gly Lys Ala Val Tyr Leu Ser Pro Leu Arg Ala Leu
65 70 75 80
Ala Ala Glu Lys Phe Ala Glu Phe Gly Lys Ile Gly Gly Ile Pro Leu
85 90 95
Gly Arg Pro Val Arg Val Gly Val Ser Thr Gly Asp Phe Glu Lys Ala
100 105 110
Gly Arg Ser Leu Gly Asn Asn Asp Ile Leu Val Leu Thr Asn Glu Arg
115 120 125
Met Asp Ser Leu Ile Arg Arg Arg Pro Asp Trp Met Asp Glu Val Gly
130 135 140
Leu Val Ile Ala Asp Glu Ile His Leu Ile Gly Asp Arg Ser Arg Gly
145 150 155 160
Pro Thr Leu Glu Met Val Leu Thr Lys Leu Arg Gly Leu Arg Ser Ser
165 170 175
Pro Gln Val Val Ala Leu Ser Ala Thr Ile Ser Asn Ala Asp Glu Ile
180 185 190
Ala Gly Trp Leu Asp Cys Thr Leu Val His Ser Thr Trp Arg Pro Val
195 200 205
Pro Leu Ser Glu Gly Val Tyr Gln Asp Gly Glu Val Ala Met Gly Asp
210 215 220
Gly Ser Arg His Glu Val Ala Ala Thr Gly Gly Gly Pro Ala Val Asp
225 230 235 240
Leu Ala Ala Glu Ser Val Ala Glu Gly Gly Gln Ser Leu Ile Phe Ala
245 250 255
Asp Thr Arg Ala Arg Ser Ala Ser Leu Ala Ala Lys Ala Ser Ala Val
260 265 270
Ile Pro Glu Ala Lys Gly Ala Asp Ala Ala Lys Leu Ala Ala Ala Ala
275 280 285
Lys Lys Ile Ile Ser Ser Gly Gly Glu Thr Lys Leu Ala Lys Thr Leu
290 295 300
Ala Glu Leu Val Glu Lys Gly Ala Ala Phe His His Ala Gly Leu Asn
305 310 315 320
Gln Asp Cys Arg Ser Val Val Glu Glu Glu Phe Arg Ser Gly Arg Ile
325 330 335
Arg Leu Leu Ala Ser Thr Pro Thr Leu Ala Ala Gly Val Asn Leu Pro
340 345 350
Ala Arg Arg Val Val Ile Ser Ser Val Met Arg Tyr Asn Ser Ser Ser
355 360 365
Gly Met Ser Glu Pro Ile Ser Ile Leu Glu Tyr Lys Gln Leu Cys Gly
370 375 380
Arg Ala Gly Arg Pro Gln Tyr Asp Lys Ser Gly Glu Ala Ile Val Val
385 390 395 400
Gly Gly Val Asn Ala Asp Glu Ile Phe Asp Arg Tyr Ile Gly Gly Glu
405 410 415
Pro Glu Pro Ile Arg Ser Ala Met Val Asp Asp Arg Ala Leu Arg Ile
420 425 430
His Val Leu Ser Leu Val Thr Thr Ser Pro Gly Ile Lys Glu Asp Asp
435 440 445
Val Thr Glu Phe Phe Leu Gly Thr Leu Gly Gly Gln Gln Ser Gly Glu
450 455 460
Ser Thr Val Lys Phe Ser Val Ala Val Ala Leu Arg Phe Leu Gln Glu
465 470 475 480
Glu Gly Met Leu Gly Arg Arg Gly Gly Arg Leu Ala Ala Thr Lys Met
485 490 495
Gly Arg Leu Val Ser Arg Leu Tyr Met Asp Pro Met Thr Ala Val Thr
500 505 510
Leu Arg Asp Ala Val Gly Glu Ala Ser Pro Gly Arg Met His Thr Leu
515 520 525
Gly Phe Leu His Leu Val Ser Glu Cys Ser Glu Phe Met Pro Arg Phe
530 535 540
Ala Leu Arg Gln Lys Asp His Glu Val Ala Glu Met Met Leu Glu Ala
545 550 555 560
Gly Arg Gly Glu Leu Leu Arg Pro Val Tyr Ser Tyr Glu Cys Gly Arg
565 570 575
Gly Leu Leu Ala Leu His Arg Trp Ile Gly Glu Ser Pro Glu Ala Lys
580 585 590
Leu Ala Glu Asp Leu Lys Phe Glu Ser Gly Asp Val His Arg Met Val
595 600 605
Glu Ser Ser Gly Trp Leu Leu Arg Cys Ile Trp Glu Ile Ser Lys His
610 615 620
Gln Glu Arg Pro Asp Leu Leu Gly Glu Leu Asp Val Leu Arg Ser Arg
625 630 635 640
Val Ala Tyr Gly Ile Lys Ala Glu Leu Val Pro Leu Val Ser Ile Lys
645 650 655
Gly Ile Gly Arg Val Arg Ser Arg Arg Leu Phe Arg Gly Gly Ile Lys
660 665 670
Gly Pro Gly Asp Leu Ala Ala Val Pro Val Glu Arg Leu Ser Arg Val
675 680 685
Glu Gly Ile Gly Ala Thr Leu Ala Asn Asn Ile Lys Ser Gln Leu Arg
690 695 700
Lys Gly Gly
705
<210> 20
<211> 720
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Hel308 Tga
<400> 20
Met Lys Val Asp Glu Leu Pro Val Asp Glu Arg Leu Lys Ala Val Leu
1 5 10 15
Lys Glu Arg Gly Ile Glu Glu Leu Tyr Pro Pro Gln Ala Glu Ala Leu
20 25 30
Lys Ser Gly Ala Leu Glu Gly Arg Asn Leu Val Leu Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Val Ser Glu Ile Val Met Val Asn Lys Leu
50 55 60
Ile Gln Glu Gly Gly Lys Ala Val Tyr Leu Val Pro Leu Lys Ala Leu
65 70 75 80
Ala Glu Glu Lys Tyr Arg Glu Phe Lys Glu Trp Glu Lys Leu Gly Leu
85 90 95
Lys Val Ala Ala Thr Thr Gly Asp Tyr Asp Ser Thr Asp Asp Trp Leu
100 105 110
Gly Arg Tyr Asp Ile Ile Val Ala Thr Ala Glu Lys Phe Asp Ser Leu
115 120 125
Leu Arg His Gly Ala Arg Trp Ile Asn Asp Val Lys Leu Val Val Ala
130 135 140
Asp Glu Val His Leu Ile Gly Ser Tyr Asp Arg Gly Ala Thr Leu Glu
145 150 155 160
Met Ile Leu Thr His Met Leu Gly Arg Ala Gln Ile Leu Ala Leu Ser
165 170 175
Ala Thr Val Gly Asn Ala Glu Glu Leu Ala Glu Trp Leu Asp Ala Ser
180 185 190
Leu Val Val Ser Asp Trp Arg Pro Val Gln Leu Arg Arg Gly Val Phe
195 200 205
His Leu Gly Thr Leu Ile Trp Glu Asp Gly Lys Val Glu Ser Tyr Pro
210 215 220
Glu Asn Trp Tyr Ser Leu Val Val Asp Ala Val Lys Arg Gly Lys Gly
225 230 235 240
Ala Leu Val Phe Val Asn Thr Arg Arg Ser Ala Glu Lys Glu Ala Leu
245 250 255
Ala Leu Ser Lys Leu Val Ser Ser His Leu Thr Lys Pro Glu Lys Arg
260 265 270
Ala Leu Glu Ser Leu Ala Ser Gln Leu Glu Asp Asn Pro Thr Ser Glu
275 280 285
Lys Leu Lys Arg Ala Leu Arg Gly Gly Val Ala Phe His His Ala Gly
290 295 300
Leu Ser Arg Val Glu Arg Thr Leu Ile Glu Asp Ala Phe Arg Glu Gly
305 310 315 320
Leu Ile Lys Val Ile Thr Ala Thr Pro Thr Leu Ser Ala Gly Val Asn
325 330 335
Leu Pro Ser Phe Arg Val Ile Ile Arg Asp Thr Lys Arg Tyr Ala Gly
340 345 350
Phe Gly Trp Thr Asp Ile Pro Val Leu Glu Ile Gln Gln Met Met Gly
355 360 365
Arg Ala Gly Arg Pro Arg Tyr Asp Lys Tyr Gly Glu Ala Ile Ile Val
370 375 380
Ala Arg Thr Asp Glu Pro Gly Lys Leu Met Glu Arg Tyr Ile Arg Gly
385 390 395 400
Lys Pro Glu Lys Leu Phe Ser Met Leu Ala Asn Glu Gln Ala Phe Arg
405 410 415
Ser Gln Val Leu Ala Leu Ile Thr Asn Phe Gly Ile Arg Ser Phe Pro
420 425 430
Glu Leu Val Arg Phe Leu Glu Arg Thr Phe Tyr Ala His Gln Arg Lys
435 440 445
Asp Leu Ser Ser Leu Glu Tyr Lys Ala Lys Glu Val Val Tyr Phe Leu
450 455 460
Ile Glu Asn Glu Phe Ile Asp Leu Asp Leu Glu Asp Arg Phe Ile Pro
465 470 475 480
Leu Pro Phe Gly Lys Arg Thr Ser Gln Leu Tyr Ile Asp Pro Leu Thr
485 490 495
Ala Lys Lys Phe Lys Asp Ala Phe Pro Ala Ile Glu Arg Asn Pro Asn
500 505 510
Pro Phe Gly Ile Phe Gln Leu Ile Ala Ser Thr Pro Asp Met Ala Thr
515 520 525
Leu Thr Ala Arg Arg Arg Glu Met Glu Asp Tyr Leu Asp Leu Ala Tyr
530 535 540
Glu Leu Glu Asp Lys Leu Tyr Ala Ser Ile Pro Tyr Tyr Glu Asp Ser
545 550 555 560
Arg Phe Gln Gly Phe Leu Gly Gln Val Lys Thr Ala Lys Val Leu Leu
565 570 575
Asp Trp Ile Asn Glu Val Pro Glu Ala Arg Ile Tyr Glu Thr Tyr Ser
580 585 590
Ile Asp Pro Gly Asp Leu Tyr Arg Leu Leu Glu Leu Ala Asp Trp Leu
595 600 605
Met Tyr Ser Leu Ile Glu Leu Tyr Lys Leu Phe Glu Pro Lys Glu Glu
610 615 620
Ile Leu Asn Tyr Leu Arg Asp Leu His Leu Arg Leu Arg His Gly Val
625 630 635 640
Arg Glu Glu Leu Leu Glu Leu Val Arg Leu Pro Asn Ile Gly Arg Lys
645 650 655
Arg Ala Arg Ala Leu Tyr Asn Ala Gly Phe Arg Ser Val Glu Ala Ile
660 665 670
Ala Asn Ala Lys Pro Ala Glu Leu Leu Ala Val Glu Gly Ile Gly Ala
675 680 685
Lys Ile Leu Asp Gly Ile Tyr Arg His Leu Gly Ile Glu Lys Arg Val
690 695 700
Thr Glu Glu Lys Pro Lys Arg Lys Gly Thr Leu Glu Asp Phe Leu Arg
705 710 715 720
<210> 21
<211> 799
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Hel308 Mhu
<400> 21
Met Glu Ile Ala Ser Leu Pro Leu Pro Asp Ser Phe Ile Arg Ala Cys
1 5 10 15
His Ala Lys Gly Ile Arg Ser Leu Tyr Pro Pro Gln Ala Glu Cys Ile
20 25 30
Glu Lys Gly Leu Leu Glu Gly Lys Asn Leu Leu Ile Ser Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Leu Ala Glu Met Ala Met Trp Ser Arg Ile
50 55 60
Ala Ala Gly Gly Lys Cys Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala
65 70 75 80
Ser Glu Lys Tyr Asp Glu Phe Ser Lys Lys Gly Val Ile Arg Val Gly
85 90 95
Ile Ala Thr Gly Asp Leu Asp Arg Thr Asp Ala Tyr Leu Gly Glu Asn
100 105 110
Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu Arg Asn
115 120 125
Arg Thr Pro Trp Leu Ser Gln Ile Thr Cys Ile Val Leu Asp Glu Val
130 135 140
His Leu Ile Gly Ser Glu Asn Arg Gly Ala Thr Leu Glu Met Val Ile
145 150 155 160
Thr Lys Leu Arg Tyr Thr Asn Pro Val Met Gln Ile Ile Gly Leu Ser
165 170 175
Ala Thr Ile Gly Asn Pro Ala Gln Leu Ala Glu Trp Leu Asp Ala Thr
180 185 190
Leu Ile Thr Ser Thr Trp Arg Pro Val Asp Leu Arg Gln Gly Val Tyr
195 200 205
Tyr Asn Gly Lys Ile Arg Phe Ser Asp Ser Glu Arg Pro Ile Gln Gly
210 215 220
Lys Thr Lys His Asp Asp Leu Asn Leu Cys Leu Asp Thr Ile Glu Glu
225 230 235 240
Gly Gly Gln Cys Leu Val Phe Val Ser Ser Arg Arg Asn Ala Glu Gly
245 250 255
Phe Ala Lys Lys Ala Ala Gly Ala Leu Lys Ala Gly Ser Pro Asp Ser
260 265 270
Lys Ala Leu Ala Gln Glu Leu Arg Arg Leu Arg Asp Arg Asp Glu Gly
275 280 285
Asn Val Leu Ala Asp Cys Val Glu Arg Gly Ala Ala Phe His His Ala
290 295 300
Gly Leu Ile Arg Gln Glu Arg Thr Ile Ile Glu Glu Gly Phe Arg Asn
305 310 315 320
Gly Tyr Ile Glu Val Ile Ala Ala Thr Pro Thr Leu Ala Ala Gly Leu
325 330 335
Asn Leu Pro Ala Arg Arg Val Ile Ile Arg Asp Tyr Asn Arg Phe Ala
340 345 350
Ser Gly Leu Gly Met Val Pro Ile Pro Val Gly Glu Tyr His Gln Met
355 360 365
Ala Gly Arg Ala Gly Arg Pro His Leu Asp Pro Tyr Gly Glu Ala Val
370 375 380
Leu Leu Ala Lys Asp Ala Pro Ser Val Glu Arg Leu Phe Glu Thr Phe
385 390 395 400
Ile Asp Ala Glu Ala Glu Arg Val Asp Ser Gln Cys Val Asp Asp Ala
405 410 415
Ser Leu Cys Ala His Ile Leu Ser Leu Ile Ala Thr Gly Phe Ala His
420 425 430
Asp Gln Glu Ala Leu Ser Ser Phe Met Glu Arg Thr Phe Tyr Phe Phe
435 440 445
Gln His Pro Lys Thr Arg Ser Leu Pro Arg Leu Val Ala Asp Ala Ile
450 455 460
Arg Phe Leu Thr Thr Ala Gly Met Val Glu Glu Arg Glu Asn Thr Leu
465 470 475 480
Ser Ala Thr Arg Leu Gly Ser Leu Val Ser Arg Leu Tyr Leu Asn Pro
485 490 495
Cys Thr Ala Arg Leu Ile Leu Asp Ser Leu Lys Ser Cys Lys Thr Pro
500 505 510
Thr Leu Ile Gly Leu Leu His Val Ile Cys Val Ser Pro Asp Met Gln
515 520 525
Arg Leu Tyr Leu Lys Ala Ala Asp Thr Gln Leu Leu Arg Thr Phe Leu
530 535 540
Phe Lys His Lys Asp Asp Leu Ile Leu Pro Leu Pro Phe Glu Gln Glu
545 550 555 560
Glu Glu Glu Leu Trp Leu Ser Gly Leu Lys Thr Ala Leu Val Leu Thr
565 570 575
Asp Trp Ala Asp Glu Phe Ser Glu Gly Met Ile Glu Glu Arg Tyr Gly
580 585 590
Ile Gly Ala Gly Asp Leu Tyr Asn Ile Val Asp Ser Gly Lys Trp Leu
595 600 605
Leu His Gly Thr Glu Arg Leu Val Ser Val Glu Met Pro Glu Met Ser
610 615 620
Gln Val Val Lys Thr Leu Ser Val Arg Val His His Gly Val Lys Ser
625 630 635 640
Glu Leu Leu Pro Leu Val Ala Leu Arg Asn Ile Gly Arg Val Arg Ala
645 650 655
Arg Thr Leu Tyr Asn Ala Gly Tyr Pro Asp Pro Glu Ala Val Ala Arg
660 665 670
Ala Gly Leu Ser Thr Ile Ala Arg Ile Ile Gly Glu Gly Ile Ala Arg
675 680 685
Gln Val Ile Asp Glu Ile Thr Gly Val Lys Arg Ser Gly Ile His Ser
690 695 700
Ser Asp Asp Asp Tyr Gln Gln Lys Thr Pro Glu Leu Leu Thr Asp Ile
705 710 715 720
Pro Gly Ile Gly Lys Lys Met Ala Glu Lys Leu Gln Asn Ala Gly Ile
725 730 735
Ile Thr Val Ser Asp Leu Leu Thr Ala Asp Glu Val Leu Leu Ser Asp
740 745 750
Val Leu Gly Ala Ala Arg Ala Arg Lys Val Leu Ala Phe Leu Ser Asn
755 760 765
Ser Glu Lys Glu Asn Ser Ser Ser Asp Lys Thr Glu Glu Ile Pro Asp
770 775 780
Thr Gln Lys Ile Arg Gly Gln Ser Ser Trp Glu Asp Phe Gly Cys
785 790 795
<210> 22
<211> 1756
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> TraI Eco
<400> 22
Met Met Ser Ile Ala Gln Val Arg Ser Ala Gly Ser Ala Gly Asn Tyr
1 5 10 15
Tyr Thr Asp Lys Asp Asn Tyr Tyr Val Leu Gly Ser Met Gly Glu Arg
20 25 30
Trp Ala Gly Lys Gly Ala Glu Gln Leu Gly Leu Gln Gly Ser Val Asp
35 40 45
Lys Asp Val Phe Thr Arg Leu Leu Glu Gly Arg Leu Pro Asp Gly Ala
50 55 60
Asp Leu Ser Arg Met Gln Asp Gly Ser Asn Lys His Arg Pro Gly Tyr
65 70 75 80
Asp Leu Thr Phe Ser Ala Pro Lys Ser Val Ser Met Met Ala Met Leu
85 90 95
Gly Gly Asp Lys Arg Leu Ile Asp Ala His Asn Gln Ala Val Asp Phe
100 105 110
Ala Val Arg Gln Val Glu Ala Leu Ala Ser Thr Arg Val Met Thr Asp
115 120 125
Gly Gln Ser Glu Thr Val Leu Thr Gly Asn Leu Val Met Ala Leu Phe
130 135 140
Asn His Asp Thr Ser Arg Asp Gln Glu Pro Gln Leu His Thr His Ala
145 150 155 160
Val Val Ala Asn Val Thr Gln His Asn Gly Glu Trp Lys Thr Leu Ser
165 170 175
Ser Asp Lys Val Gly Lys Thr Gly Phe Ile Glu Asn Val Tyr Ala Asn
180 185 190
Gln Ile Ala Phe Gly Arg Leu Tyr Arg Glu Lys Leu Lys Glu Gln Val
195 200 205
Glu Ala Leu Gly Tyr Glu Thr Glu Val Val Gly Lys His Gly Met Trp
210 215 220
Glu Met Pro Gly Val Pro Val Glu Ala Phe Ser Gly Arg Ser Gln Ala
225 230 235 240
Ile Arg Glu Ala Val Gly Glu Asp Ala Ser Leu Lys Ser Arg Asp Val
245 250 255
Ala Ala Leu Asp Thr Arg Lys Ser Lys Gln His Val Asp Pro Glu Ile
260 265 270
Arg Met Ala Glu Trp Met Gln Thr Leu Lys Glu Thr Gly Phe Asp Ile
275 280 285
Arg Ala Tyr Arg Asp Ala Ala Asp Gln Arg Thr Glu Ile Arg Thr Gln
290 295 300
Ala Pro Gly Pro Ala Ser Gln Asp Gly Pro Asp Val Gln Gln Ala Val
305 310 315 320
Thr Gln Ala Ile Ala Gly Leu Ser Glu Arg Lys Val Gln Phe Thr Tyr
325 330 335
Thr Asp Val Leu Ala Arg Thr Val Gly Ile Leu Pro Pro Glu Asn Gly
340 345 350
Val Ile Glu Arg Ala Arg Ala Gly Ile Asp Glu Ala Ile Ser Arg Glu
355 360 365
Gln Leu Ile Pro Leu Asp Arg Glu Lys Gly Leu Phe Thr Ser Gly Ile
370 375 380
His Val Leu Asp Glu Leu Ser Val Arg Ala Leu Ser Arg Asp Ile Met
385 390 395 400
Lys Gln Asn Arg Val Thr Val His Pro Glu Lys Ser Val Pro Arg Thr
405 410 415
Ala Gly Tyr Ser Asp Ala Val Ser Val Leu Ala Gln Asp Arg Pro Ser
420 425 430
Leu Ala Ile Val Ser Gly Gln Gly Gly Ala Ala Gly Gln Arg Glu Arg
435 440 445
Val Ala Glu Leu Val Met Met Ala Arg Glu Gln Gly Arg Glu Val Gln
450 455 460
Ile Ile Ala Ala Asp Arg Arg Ser Gln Met Asn Leu Lys Gln Asp Glu
465 470 475 480
Arg Leu Ser Gly Glu Leu Ile Thr Gly Arg Arg Gln Leu Leu Glu Gly
485 490 495
Met Ala Phe Thr Pro Gly Ser Thr Val Ile Val Asp Gln Gly Glu Lys
500 505 510
Leu Ser Leu Lys Glu Thr Leu Thr Leu Leu Asp Gly Ala Ala Arg His
515 520 525
Asn Val Gln Val Leu Ile Thr Asp Ser Gly Gln Arg Thr Gly Thr Gly
530 535 540
Ser Ala Leu Met Ala Met Lys Asp Ala Gly Val Asn Thr Tyr Arg Trp
545 550 555 560
Gln Gly Gly Glu Gln Arg Pro Ala Thr Ile Ile Ser Glu Pro Asp Arg
565 570 575
Asn Val Arg Tyr Ala Arg Leu Ala Gly Asp Phe Ala Ala Ser Val Lys
580 585 590
Ala Gly Glu Glu Ser Val Ala Gln Val Ser Gly Val Arg Glu Gln Ala
595 600 605
Ile Leu Thr Gln Ala Ile Arg Ser Glu Leu Lys Thr Gln Gly Val Leu
610 615 620
Gly His Pro Glu Val Thr Met Thr Ala Leu Ser Pro Val Trp Leu Asp
625 630 635 640
Ser Arg Ser Arg Tyr Leu Arg Asp Met Tyr Arg Pro Gly Met Val Met
645 650 655
Glu Gln Trp Asn Pro Glu Thr Arg Ser His Asp Arg Tyr Val Ile Asp
660 665 670
Arg Val Thr Ala Gln Ser His Ser Leu Thr Leu Arg Asp Ala Gln Gly
675 680 685
Glu Thr Gln Val Val Arg Ile Ser Ser Leu Asp Ser Ser Trp Ser Leu
690 695 700
Phe Arg Pro Glu Lys Met Pro Val Ala Asp Gly Glu Arg Leu Arg Val
705 710 715 720
Thr Gly Lys Ile Pro Gly Leu Arg Val Ser Gly Gly Asp Arg Leu Gln
725 730 735
Val Ala Ser Val Ser Glu Asp Ala Met Thr Val Val Val Pro Gly Arg
740 745 750
Ala Glu Pro Ala Ser Leu Pro Val Ser Asp Ser Pro Phe Thr Ala Leu
755 760 765
Lys Leu Glu Asn Gly Trp Val Glu Thr Pro Gly His Ser Val Ser Asp
770 775 780
Ser Ala Thr Val Phe Ala Ser Val Thr Gln Met Ala Met Asp Asn Ala
785 790 795 800
Thr Leu Asn Gly Leu Ala Arg Ser Gly Arg Asp Val Arg Leu Tyr Ser
805 810 815
Ser Leu Asp Glu Thr Arg Thr Ala Glu Lys Leu Ala Arg His Pro Ser
820 825 830
Phe Thr Val Val Ser Glu Gln Ile Lys Ala Arg Ala Gly Glu Thr Leu
835 840 845
Leu Glu Thr Ala Ile Ser Leu Gln Lys Ala Gly Leu His Thr Pro Ala
850 855 860
Gln Gln Ala Ile His Leu Ala Leu Pro Val Leu Glu Ser Lys Asn Leu
865 870 875 880
Ala Phe Ser Met Val Asp Leu Leu Thr Glu Ala Lys Ser Phe Ala Ala
885 890 895
Glu Gly Thr Gly Phe Thr Glu Leu Gly Gly Glu Ile Asn Ala Gln Ile
900 905 910
Lys Arg Gly Asp Leu Leu Tyr Val Asp Val Ala Lys Gly Tyr Gly Thr
915 920 925
Gly Leu Leu Val Ser Arg Ala Ser Tyr Glu Ala Glu Lys Ser Ile Leu
930 935 940
Arg His Ile Leu Glu Gly Lys Glu Ala Val Thr Pro Leu Met Glu Arg
945 950 955 960
Val Pro Gly Glu Leu Met Glu Thr Leu Thr Ser Gly Gln Arg Ala Ala
965 970 975
Thr Arg Met Ile Leu Glu Thr Ser Asp Arg Phe Thr Val Val Gln Gly
980 985 990
Tyr Ala Gly Val Gly Lys Thr Thr Gln Phe Arg Ala Val Met Ser Ala
995 1000 1005
Val Asn Met Leu Pro Ala Ser Glu Arg Pro Arg Val Val Gly Leu
1010 1015 1020
Gly Pro Thr His Arg Ala Val Gly Glu Met Arg Ser Ala Gly Val
1025 1030 1035
Asp Ala Gln Thr Leu Ala Ser Phe Leu His Asp Thr Gln Leu Gln
1040 1045 1050
Gln Arg Ser Gly Glu Thr Pro Asp Phe Ser Asn Thr Leu Phe Leu
1055 1060 1065
Leu Asp Glu Ser Ser Met Val Gly Asn Thr Glu Met Ala Arg Ala
1070 1075 1080
Tyr Ala Leu Ile Ala Ala Gly Gly Gly Arg Ala Val Ala Ser Gly
1085 1090 1095
Asp Thr Asp Gln Leu Gln Ala Ile Ala Pro Gly Gln Ser Phe Arg
1100 1105 1110
Leu Gln Gln Thr Arg Ser Ala Ala Asp Val Val Ile Met Lys Glu
1115 1120 1125
Ile Val Arg Gln Thr Pro Glu Leu Arg Glu Ala Val Tyr Ser Leu
1130 1135 1140
Ile Asn Arg Asp Val Glu Arg Ala Leu Ser Gly Leu Glu Ser Val
1145 1150 1155
Lys Pro Ser Gln Val Pro Arg Leu Glu Gly Ala Trp Ala Pro Glu
1160 1165 1170
His Ser Val Thr Glu Phe Ser His Ser Gln Glu Ala Lys Leu Ala
1175 1180 1185
Glu Ala Gln Gln Lys Ala Met Leu Lys Gly Glu Ala Phe Pro Asp
1190 1195 1200
Ile Pro Met Thr Leu Tyr Glu Ala Ile Val Arg Asp Tyr Thr Gly
1205 1210 1215
Arg Thr Pro Glu Ala Arg Glu Gln Thr Leu Ile Val Thr His Leu
1220 1225 1230
Asn Glu Asp Arg Arg Val Leu Asn Ser Met Ile His Asp Ala Arg
1235 1240 1245
Glu Lys Ala Gly Glu Leu Gly Lys Glu Gln Val Met Val Pro Val
1250 1255 1260
Leu Asn Thr Ala Asn Ile Arg Asp Gly Glu Leu Arg Arg Leu Ser
1265 1270 1275
Thr Trp Glu Lys Asn Pro Asp Ala Leu Ala Leu Val Asp Asn Val
1280 1285 1290
Tyr His Arg Ile Ala Gly Ile Ser Lys Asp Asp Gly Leu Ile Thr
1295 1300 1305
Leu Gln Asp Ala Glu Gly Asn Thr Arg Leu Ile Ser Pro Arg Glu
1310 1315 1320
Ala Val Ala Glu Gly Val Thr Leu Tyr Thr Pro Asp Lys Ile Arg
1325 1330 1335
Val Gly Thr Gly Asp Arg Met Arg Phe Thr Lys Ser Asp Arg Glu
1340 1345 1350
Arg Gly Tyr Val Ala Asn Ser Val Trp Thr Val Thr Ala Val Ser
1355 1360 1365
Gly Asp Ser Val Thr Leu Ser Asp Gly Gln Gln Thr Arg Val Ile
1370 1375 1380
Arg Pro Gly Gln Glu Arg Ala Glu Gln His Ile Asp Leu Ala Tyr
1385 1390 1395
Ala Ile Thr Ala His Gly Ala Gln Gly Ala Ser Glu Thr Phe Ala
1400 1405 1410
Ile Ala Leu Glu Gly Thr Glu Gly Asn Arg Lys Leu Met Ala Gly
1415 1420 1425
Phe Glu Ser Ala Tyr Val Ala Leu Ser Arg Met Lys Gln His Val
1430 1435 1440
Gln Val Tyr Thr Asp Asn Arg Gln Gly Trp Thr Asp Ala Ile Asn
1445 1450 1455
Asn Ala Val Gln Lys Gly Thr Ala His Asp Val Leu Glu Pro Lys
1460 1465 1470
Pro Asp Arg Glu Val Met Asn Ala Gln Arg Leu Phe Ser Thr Ala
1475 1480 1485
Arg Glu Leu Arg Asp Val Ala Ala Gly Arg Ala Val Leu Arg Gln
1490 1495 1500
Ala Gly Leu Ala Gly Gly Asp Ser Pro Ala Arg Phe Ile Ala Pro
1505 1510 1515
Gly Arg Lys Tyr Pro Gln Pro Tyr Val Ala Leu Pro Ala Phe Asp
1520 1525 1530
Arg Asn Gly Lys Ser Ala Gly Ile Trp Leu Asn Pro Leu Thr Thr
1535 1540 1545
Asp Asp Gly Asn Gly Leu Arg Gly Phe Ser Gly Glu Gly Arg Val
1550 1555 1560
Lys Gly Ser Gly Asp Ala Gln Phe Val Ala Leu Gln Gly Ser Arg
1565 1570 1575
Asn Gly Glu Ser Leu Leu Ala Asp Asn Met Gln Asp Gly Val Arg
1580 1585 1590
Ile Ala Arg Asp Asn Pro Asp Ser Gly Val Val Val Arg Ile Ala
1595 1600 1605
Gly Glu Gly Arg Pro Trp Asn Pro Gly Ala Ile Thr Gly Gly Arg
1610 1615 1620
Val Trp Gly Asp Ile Pro Asp Asn Ser Val Gln Pro Gly Ala Gly
1625 1630 1635
Asn Gly Glu Pro Val Thr Ala Glu Val Leu Ala Gln Arg Gln Ala
1640 1645 1650
Glu Glu Ala Ile Arg Arg Glu Thr Glu Arg Arg Ala Asp Glu Ile
1655 1660 1665
Val Arg Lys Met Ala Glu Asn Lys Pro Asp Leu Pro Asp Gly Lys
1670 1675 1680
Thr Glu Leu Ala Val Arg Asp Ile Ala Gly Gln Glu Arg Asp Arg
1685 1690 1695
Ser Ala Ile Ser Glu Arg Glu Thr Ala Leu Pro Glu Ser Val Leu
1700 1705 1710
Arg Glu Ser Gln Arg Glu Arg Glu Ala Val Arg Glu Val Ala Arg
1715 1720 1725
Glu Asn Leu Leu Gln Glu Arg Leu Gln Gln Met Glu Arg Asp Met
1730 1735 1740
Val Arg Asp Leu Gln Lys Glu Lys Thr Leu Gly Gly Asp
1745 1750 1755
<210> 23
<211> 726
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> XPD Mbu
<400> 23
Met Ser Asp Lys Pro Ala Phe Met Lys Tyr Phe Thr Gln Ser Ser Cys
1 5 10 15
Tyr Pro Asn Gln Gln Glu Ala Met Asp Arg Ile His Ser Ala Leu Met
20 25 30
Gln Gln Gln Leu Val Leu Phe Glu Gly Ala Cys Gly Thr Gly Lys Thr
35 40 45
Leu Ser Ala Leu Val Pro Ala Leu His Val Gly Lys Met Leu Gly Lys
50 55 60
Thr Val Ile Ile Ala Thr Asn Val His Gln Gln Met Val Gln Phe Ile
65 70 75 80
Asn Glu Ala Arg Asp Ile Lys Lys Val Gln Asp Val Lys Val Ala Val
85 90 95
Ile Lys Gly Lys Thr Ala Met Cys Pro Gln Glu Ala Asp Tyr Glu Glu
100 105 110
Cys Ser Val Lys Arg Glu Asn Thr Phe Glu Leu Met Glu Thr Glu Arg
115 120 125
Glu Ile Tyr Leu Lys Arg Gln Glu Leu Asn Ser Ala Arg Asp Ser Tyr
130 135 140
Lys Lys Ser His Asp Pro Ala Phe Val Thr Leu Arg Asp Glu Leu Ser
145 150 155 160
Lys Glu Ile Asp Ala Val Glu Glu Lys Ala Arg Gly Leu Arg Asp Arg
165 170 175
Ala Cys Asn Asp Leu Tyr Glu Val Leu Arg Ser Asp Ser Glu Lys Phe
180 185 190
Arg Glu Trp Leu Tyr Lys Glu Val Arg Ser Pro Glu Glu Ile Asn Asp
195 200 205
His Ala Ile Lys Asp Gly Met Cys Gly Tyr Glu Leu Val Lys Arg Glu
210 215 220
Leu Lys His Ala Asp Leu Leu Ile Cys Asn Tyr His His Val Leu Asn
225 230 235 240
Pro Asp Ile Phe Ser Thr Val Leu Gly Trp Ile Glu Lys Glu Pro Gln
245 250 255
Glu Thr Ile Val Ile Phe Asp Glu Ala His Asn Leu Glu Ser Ala Ala
260 265 270
Arg Ser His Ser Ser Leu Ser Leu Thr Glu His Ser Ile Glu Lys Ala
275 280 285
Ile Thr Glu Leu Glu Ala Asn Leu Asp Leu Leu Ala Asp Asp Asn Ile
290 295 300
His Asn Leu Phe Asn Ile Phe Leu Glu Val Ile Ser Asp Thr Tyr Asn
305 310 315 320
Ser Arg Phe Lys Phe Gly Glu Arg Glu Arg Val Arg Lys Asn Trp Tyr
325 330 335
Asp Ile Arg Ile Ser Asp Pro Tyr Glu Arg Asn Asp Ile Val Arg Gly
340 345 350
Lys Phe Leu Arg Gln Ala Lys Gly Asp Phe Gly Glu Lys Asp Asp Ile
355 360 365
Gln Ile Leu Leu Ser Glu Ala Ser Glu Leu Gly Ala Lys Leu Asp Glu
370 375 380
Thr Tyr Arg Asp Gln Tyr Lys Lys Gly Leu Ser Ser Val Met Lys Arg
385 390 395 400
Ser His Ile Arg Tyr Val Ala Asp Phe Met Ser Ala Tyr Ile Glu Leu
405 410 415
Ser His Asn Leu Asn Tyr Tyr Pro Ile Leu Asn Val Arg Arg Asp Met
420 425 430
Asn Asp Glu Ile Tyr Gly Arg Val Glu Leu Phe Thr Cys Ile Pro Lys
435 440 445
Asn Val Thr Glu Pro Leu Phe Asn Ser Leu Phe Ser Val Ile Leu Met
450 455 460
Ser Ala Thr Leu His Pro Phe Glu Met Val Lys Lys Thr Leu Gly Ile
465 470 475 480
Thr Arg Asp Thr Cys Glu Met Ser Tyr Gly Thr Ser Phe Pro Glu Glu
485 490 495
Lys Arg Leu Ser Ile Ala Val Ser Ile Pro Pro Leu Phe Ala Lys Asn
500 505 510
Arg Asp Asp Arg His Val Thr Glu Leu Leu Glu Gln Val Leu Leu Asp
515 520 525
Ser Ile Glu Asn Ser Lys Gly Asn Val Ile Leu Phe Phe Gln Ser Ala
530 535 540
Phe Glu Ala Lys Arg Tyr Tyr Ser Lys Ile Glu Pro Leu Val Asn Val
545 550 555 560
Pro Val Phe Leu Asp Glu Val Gly Ile Ser Ser Gln Asp Val Arg Glu
565 570 575
Glu Phe Phe Ser Ile Gly Glu Glu Asn Gly Lys Ala Val Leu Leu Ser
580 585 590
Tyr Leu Trp Gly Thr Leu Ser Glu Gly Ile Asp Tyr Arg Asp Gly Arg
595 600 605
Gly Arg Thr Val Ile Ile Ile Gly Val Gly Tyr Pro Ala Leu Asn Asp
610 615 620
Arg Met Asn Ala Val Glu Ser Ala Tyr Asp His Val Phe Gly Tyr Gly
625 630 635 640
Ala Gly Trp Glu Phe Ala Ile Gln Val Pro Thr Ile Arg Lys Ile Arg
645 650 655
Gln Ala Met Gly Arg Val Val Arg Ser Pro Thr Asp Tyr Gly Ala Arg
660 665 670
Ile Leu Leu Asp Gly Arg Phe Leu Thr Asp Ser Lys Lys Arg Phe Gly
675 680 685
Lys Phe Ser Val Phe Glu Val Phe Pro Pro Ala Glu Arg Ser Glu Phe
690 695 700
Val Asp Val Asp Pro Glu Lys Val Lys Tyr Ser Leu Met Asn Phe Phe
705 710 715 720
Met Asp Asn Asp Glu Gln
725
<210> 24
<211> 439
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Dda 1993
<400> 24
Met Thr Phe Asp Asp Leu Thr Glu Gly Gln Lys Asn Ala Phe Asn Ile
1 5 10 15
Val Met Lys Ala Ile Lys Glu Lys Lys His His Val Thr Ile Asn Gly
20 25 30
Pro Ala Gly Thr Gly Lys Thr Thr Leu Thr Lys Phe Ile Ile Glu Ala
35 40 45
Leu Ile Ser Thr Gly Glu Thr Gly Ile Ile Leu Ala Ala Pro Thr His
50 55 60
Ala Ala Lys Lys Ile Leu Ser Lys Leu Ser Gly Lys Glu Ala Ser Thr
65 70 75 80
Ile His Ser Ile Leu Lys Ile Asn Pro Val Thr Tyr Glu Glu Asn Val
85 90 95
Leu Phe Glu Gln Lys Glu Val Pro Asp Leu Ala Lys Cys Arg Val Leu
100 105 110
Ile Cys Asp Glu Val Ser Met Tyr Asp Arg Lys Leu Phe Lys Ile Leu
115 120 125
Leu Ser Thr Ile Pro Pro Trp Cys Thr Ile Ile Gly Ile Gly Asp Asn
130 135 140
Lys Gln Ile Arg Pro Val Asp Pro Gly Glu Asn Thr Ala Tyr Ile Ser
145 150 155 160
Pro Phe Phe Thr His Lys Asp Phe Tyr Gln Cys Glu Leu Thr Glu Val
165 170 175
Lys Arg Ser Asn Ala Pro Ile Ile Asp Val Ala Thr Asp Val Arg Asn
180 185 190
Gly Lys Trp Ile Tyr Asp Lys Val Val Asp Gly His Gly Val Arg Gly
195 200 205
Phe Thr Gly Asp Thr Ala Leu Arg Asp Phe Met Val Asn Tyr Phe Ser
210 215 220
Ile Val Lys Ser Leu Asp Asp Leu Phe Glu Asn Arg Val Met Ala Phe
225 230 235 240
Thr Asn Lys Ser Val Asp Lys Leu Asn Ser Ile Ile Arg Lys Lys Ile
245 250 255
Phe Glu Thr Asp Lys Asp Phe Ile Val Gly Glu Ile Ile Val Met Gln
260 265 270
Glu Pro Leu Phe Lys Thr Tyr Lys Ile Asp Gly Lys Pro Val Ser Glu
275 280 285
Ile Ile Phe Asn Asn Gly Gln Leu Val Arg Ile Ile Glu Ala Glu Tyr
290 295 300
Thr Ser Thr Phe Val Lys Ala Arg Gly Val Pro Gly Glu Tyr Leu Ile
305 310 315 320
Arg His Trp Asp Leu Thr Val Glu Thr Tyr Gly Asp Asp Glu Tyr Tyr
325 330 335
Arg Glu Lys Ile Lys Ile Ile Ser Ser Asp Glu Glu Leu Tyr Lys Phe
340 345 350
Asn Leu Phe Leu Gly Lys Thr Ala Glu Thr Tyr Lys Asn Trp Asn Lys
355 360 365
Gly Gly Lys Ala Pro Trp Ser Asp Phe Trp Asp Ala Lys Ser Gln Phe
370 375 380
Ser Lys Val Lys Ala Leu Pro Ala Ser Thr Phe His Lys Ala Gln Gly
385 390 395 400
Met Ser Val Asp Arg Ala Phe Ile Tyr Thr Pro Cys Ile His Tyr Ala
405 410 415
Asp Val Glu Leu Ala Gln Gln Leu Leu Tyr Val Gly Val Thr Arg Gly
420 425 430
Arg Tyr Asp Val Phe Tyr Val
435
<210> 25
<211> 970
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Trwc Cba
<400> 25
Met Leu Ser Val Ala Asn Val Arg Ser Pro Ser Ala Ala Ala Ser Tyr
1 5 10 15
Phe Ala Ser Asp Asn Tyr Tyr Ala Ser Ala Asp Ala Asp Arg Ser Gly
20 25 30
Gln Trp Ile Gly Asp Gly Ala Lys Arg Leu Gly Leu Glu Gly Lys Val
35 40 45
Glu Ala Arg Ala Phe Asp Ala Leu Leu Arg Gly Glu Leu Pro Asp Gly
50 55 60
Ser Ser Val Gly Asn Pro Gly Gln Ala His Arg Pro Gly Thr Asp Leu
65 70 75 80
Thr Phe Ser Val Pro Lys Ser Trp Ser Leu Leu Ala Leu Val Gly Lys
85 90 95
Asp Glu Arg Ile Ile Ala Ala Tyr Arg Glu Ala Val Val Glu Ala Leu
100 105 110
His Trp Ala Glu Lys Asn Ala Ala Glu Thr Arg Val Val Glu Lys Gly
115 120 125
Met Val Val Thr Gln Ala Thr Gly Asn Leu Ala Ile Gly Leu Phe Gln
130 135 140
His Asp Thr Asn Arg Asn Gln Glu Pro Asn Leu His Phe His Ala Val
145 150 155 160
Ile Ala Asn Val Thr Gln Gly Lys Asp Gly Lys Trp Arg Thr Leu Lys
165 170 175
Asn Asp Arg Leu Trp Gln Leu Asn Thr Thr Leu Asn Ser Ile Ala Met
180 185 190
Ala Arg Phe Arg Val Ala Val Glu Lys Leu Gly Tyr Glu Pro Gly Pro
195 200 205
Val Leu Lys His Gly Asn Phe Glu Ala Arg Gly Ile Ser Arg Glu Gln
210 215 220
Val Met Ala Phe Ser Thr Arg Arg Lys Glu Val Leu Glu Ala Arg Arg
225 230 235 240
Gly Pro Gly Leu Asp Ala Gly Arg Ile Ala Ala Leu Asp Thr Arg Ala
245 250 255
Ser Lys Glu Gly Ile Glu Asp Arg Ala Thr Leu Ser Lys Gln Trp Ser
260 265 270
Glu Ala Ala Gln Ser Ile Gly Leu Asp Leu Lys Pro Leu Val Asp Arg
275 280 285
Ala Arg Thr Lys Ala Leu Gly Gln Gly Met Glu Ala Thr Arg Ile Gly
290 295 300
Ser Leu Val Glu Arg Gly Arg Ala Trp Leu Ser Arg Phe Ala Ala His
305 310 315 320
Val Arg Gly Asp Pro Ala Asp Pro Leu Val Pro Pro Ser Val Leu Lys
325 330 335
Gln Asp Arg Gln Thr Ile Ala Ala Ala Gln Ala Val Ala Ser Ala Val
340 345 350
Arg His Leu Ser Gln Arg Glu Ala Ala Phe Glu Arg Thr Ala Leu Tyr
355 360 365
Lys Ala Ala Leu Asp Phe Gly Leu Pro Thr Thr Ile Ala Asp Val Glu
370 375 380
Lys Arg Thr Arg Ala Leu Val Arg Ser Gly Asp Leu Ile Ala Gly Lys
385 390 395 400
Gly Glu His Lys Gly Trp Leu Ala Ser Arg Asp Ala Val Val Thr Glu
405 410 415
Gln Arg Ile Leu Ser Glu Val Ala Ala Gly Lys Gly Asp Ser Ser Pro
420 425 430
Ala Ile Thr Pro Gln Lys Ala Ala Ala Ser Val Gln Ala Ala Ala Leu
435 440 445
Thr Gly Gln Gly Phe Arg Leu Asn Glu Gly Gln Leu Ala Ala Ala Arg
450 455 460
Leu Ile Leu Ile Ser Lys Asp Arg Thr Ile Ala Val Gln Gly Ile Ala
465 470 475 480
Gly Ala Gly Lys Ser Ser Val Leu Lys Pro Val Ala Glu Val Leu Arg
485 490 495
Asp Glu Gly His Pro Val Ile Gly Leu Ala Ile Gln Asn Thr Leu Val
500 505 510
Gln Met Leu Glu Arg Asp Thr Gly Ile Gly Ser Gln Thr Leu Ala Arg
515 520 525
Phe Leu Gly Gly Trp Asn Lys Leu Leu Asp Asp Pro Gly Asn Val Ala
530 535 540
Leu Arg Ala Glu Ala Gln Ala Ser Leu Lys Asp His Val Leu Val Leu
545 550 555 560
Asp Glu Ala Ser Met Val Ser Asn Glu Asp Lys Glu Lys Leu Val Arg
565 570 575
Leu Ala Asn Leu Ala Gly Val His Arg Leu Val Leu Ile Gly Asp Arg
580 585 590
Lys Gln Leu Gly Ala Val Asp Ala Gly Lys Pro Phe Ala Leu Leu Gln
595 600 605
Arg Ala Gly Ile Ala Arg Ala Glu Met Ala Thr Asn Leu Arg Ala Arg
610 615 620
Asp Pro Val Val Arg Glu Ala Gln Ala Ala Ala Gln Ala Gly Asp Val
625 630 635 640
Arg Lys Ala Leu Arg His Leu Lys Ser His Thr Val Glu Ala Arg Gly
645 650 655
Asp Gly Ala Gln Val Ala Ala Glu Thr Trp Leu Ala Leu Asp Lys Glu
660 665 670
Thr Arg Ala Arg Thr Ser Ile Tyr Ala Ser Gly Arg Ala Ile Arg Ser
675 680 685
Ala Val Asn Ala Ala Val Gln Gln Gly Leu Leu Ala Ser Arg Glu Ile
690 695 700
Gly Pro Ala Lys Met Lys Leu Glu Val Leu Asp Arg Val Asn Thr Thr
705 710 715 720
Arg Glu Glu Leu Arg His Leu Pro Ala Tyr Arg Ala Gly Arg Val Leu
725 730 735
Glu Val Ser Arg Lys Gln Gln Ala Leu Gly Leu Phe Ile Gly Glu Tyr
740 745 750
Arg Val Ile Gly Gln Asp Arg Lys Gly Lys Leu Val Glu Val Glu Asp
755 760 765
Lys Arg Gly Lys Arg Phe Arg Phe Asp Pro Ala Arg Ile Arg Ala Gly
770 775 780
Lys Gly Asp Asp Asn Leu Thr Leu Leu Glu Pro Arg Lys Leu Glu Ile
785 790 795 800
His Glu Gly Asp Arg Ile Arg Trp Thr Arg Asn Asp His Arg Arg Gly
805 810 815
Leu Phe Asn Ala Asp Gln Ala Arg Val Val Glu Ile Ala Asn Gly Lys
820 825 830
Val Thr Phe Glu Thr Ser Lys Gly Asp Leu Val Glu Leu Lys Lys Asp
835 840 845
Asp Pro Met Leu Lys Arg Ile Asp Leu Ala Tyr Ala Leu Asn Val His
850 855 860
Met Ala Gln Gly Leu Thr Ser Asp Arg Gly Ile Ala Val Met Asp Ser
865 870 875 880
Arg Glu Arg Asn Leu Ser Asn Gln Lys Thr Phe Leu Val Thr Val Thr
885 890 895
Arg Leu Arg Asp His Leu Thr Leu Val Val Asp Ser Ala Asp Lys Leu
900 905 910
Gly Ala Ala Val Ala Arg Asn Lys Gly Glu Lys Ala Ser Ala Ile Glu
915 920 925
Val Thr Gly Ser Val Lys Pro Thr Ala Thr Lys Gly Ser Gly Val Asp
930 935 940
Gln Pro Lys Ser Val Glu Ala Asn Lys Ala Glu Lys Glu Leu Thr Arg
945 950 955 960
Ser Lys Ser Lys Thr Leu Asp Phe Gly Ile
965 970
<210> 26
<211> 786
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来自大肠杆菌 Str. K-12 substr.MC4100的野生型CsgG单体(Wild-type CsgGmonomer from Escherichia coli Str. K-12 substr.MC4100)
<400> 26
tgtctgaccg caccgccgaa agaagcggca cgtccgaccc tgatgccgcg tgcacagtct 60
tataaagatc tgacccatct gccggctccg acgggcaaaa tttttgttag cgtctataac 120
atccaggacg aaaccggtca atttaaaccg tacccggcga gtaatttctc cacggccgtt 180
ccgcagagtg caaccgctat gctggtcacg gcactgaaag attcccgttg gttcattccg 240
ctggaacgcc agggcctgca aaacctgctg aatgaacgta aaattatccg cgcagctcag 300
gaaaacggta ccgtggccat taacaatcgt attccgctgc aaagcctgac cgccgcaaac 360
atcatggttg aaggctctat catcggttac gaatcaaacg tcaaatcggg cggtgtgggc 420
gcacgttatt ttggcattgg tgctgatacc cagtaccaac tggaccagat cgcagttaac 480
ctgcgcgtgg ttaatgtcag caccggcgaa attctgagct ctgtgaatac cagcaaaacg 540
atcctgtctt acgaagtgca ggctggtgtt tttcgtttca ttgattatca acgcctgctg 600
gaaggcgaag tcggttacac ctcaaacgaa ccggtgatgc tgtgtctgat gtcggcgatt 660
gaaacgggtg ttattttcct gatcaatgat ggcatcgacc gtggtctgtg ggatctgcag 720
aacaaagccg aacgtcaaaa tgacattctg gtgaaatacc gccacatgag tgttccgccg 780
gaatcc 786
<210> 27
<211> 262
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 单体来自大肠杆菌Str. K-12 substr. MC4100的野生型CsgG的成熟形式(Matureform of the wild-type CsgG monomer from Escherichia coli Str. K-12 substr. MC4100)
<400> 27
Cys Leu Thr Ala Pro Pro Lys Glu Ala Ala Arg Pro Thr Leu Met Pro
1 5 10 15
Arg Ala Gln Ser Tyr Lys Asp Leu Thr His Leu Pro Ala Pro Thr Gly
20 25 30
Lys Ile Phe Val Ser Val Tyr Asn Ile Gln Asp Glu Thr Gly Gln Phe
35 40 45
Lys Pro Tyr Pro Ala Ser Asn Phe Ser Thr Ala Val Pro Gln Ser Ala
50 55 60
Thr Ala Met Leu Val Thr Ala Leu Lys Asp Ser Arg Trp Phe Ile Pro
65 70 75 80
Leu Glu Arg Gln Gly Leu Gln Asn Leu Leu Asn Glu Arg Lys Ile Ile
85 90 95
Arg Ala Ala Gln Glu Asn Gly Thr Val Ala Ile Asn Asn Arg Ile Pro
100 105 110
Leu Gln Ser Leu Thr Ala Ala Asn Ile Met Val Glu Gly Ser Ile Ile
115 120 125
Gly Tyr Glu Ser Asn Val Lys Ser Gly Gly Val Gly Ala Arg Tyr Phe
130 135 140
Gly Ile Gly Ala Asp Thr Gln Tyr Gln Leu Asp Gln Ile Ala Val Asn
145 150 155 160
Leu Arg Val Val Asn Val Ser Thr Gly Glu Ile Leu Ser Ser Val Asn
165 170 175
Thr Ser Lys Thr Ile Leu Ser Tyr Glu Val Gln Ala Gly Val Phe Arg
180 185 190
Phe Ile Asp Tyr Gln Arg Leu Leu Glu Gly Glu Val Gly Tyr Thr Ser
195 200 205
Asn Glu Pro Val Met Leu Cys Leu Met Ser Ala Ile Glu Thr Gly Val
210 215 220
Ile Phe Leu Ile Asn Asp Gly Ile Asp Arg Gly Leu Trp Asp Leu Gln
225 230 235 240
Asn Lys Ala Glu Arg Gln Asn Asp Ile Leu Val Lys Tyr Arg His Met
245 250 255
Ser Val Pro Pro Glu Ser
260
<210> 28
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 前导链的部分序列(Partial sequence of leader strand)
<400> 28
ggcgtctgct tgggtgttta accttttttt ttttt 35
<210> 29
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 前导链的部分序列(Partial sequence of leader strand)
<400> 29
ggttgtttct gttggtgctg atattgct 28
<210> 30
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 具有3'发夹的底链的部分序列(Partial sequence of bottom strand with 3'hairpin)
<400> 30
gcaatatcag caccaacaga aacaaccgcc atcagattgt gtttgttagt cgct 54
<210> 31
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 具有3'发夹的底链的部分序列(Partial sequence of bottom strand with 3'hairpin)
<400> 31
gaggcgagcg gtcaa 15
<210> 32
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 含有3'发夹的底链的部分序列(Partial sequence of bottom strandcontaining a 3' hairpin)
<400> 32
agcgactaac aaacacaatc tgatg 25
<210> 33
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 阻断链的序列(Sequence of blocker strand)
<400> 33
aacacccaag cagacgcctt 20
<210> 34
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> HP-衔接子的部分序列(Partial sequence of HP-adapter)
<400> 34
cgttctgttt atgtttcttg gacactgatt gacacggttt agtagaac 48
<210> 35
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> HP-衔接子的部分序列(Partial sequence of HP-adapter)
<400> 35
tttttttttt tttttttttt tttttttt 28
<210> 36
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> HP-衔接子的部分序列(Partial sequence of HP-adapter)
<400> 36
caagaaacat aaacagaacg t 21
<210> 37
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 系链(Tether)
<400> 37
ttgaccgctc gcctc 15
<210> 38
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 发夹系链的序列(Sequence of hairpin tether)
<400> 38
ttgttctact aaaccgtgtc aatcagtgtc tt 32
<210> 39
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 前导链的部分序列(Partial sequence of leader strand)
<400> 39
ggttgtttct 10
<210> 40
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 含有系链杂交位点的阻断链(Blocker strand containing a tetherhybridisation site)
<400> 40
ggttaaacac ccaagcagac gcctttgagg cgagcggtca a 41
<210> 41
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 含有3'发夹的底链的部分序列(Partial sequence of bottom strandcontaining a 3' hairpin)
<400> 41
gcaatatcag caccaacaga aacaacccat cagattgtgt ttgttagtcg ct 52
<210> 42
<211> 53
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 含有系链杂交位点和polyA 5'延伸的阻断链(Blocker strand containing atether hybridisation site and a polyA
5' extension)
<400> 42
aaaaaaaaaa aaggttaaac acccaagcag acgcctttga ggcgagcggt caa 53
<210> 43
<400> 43
000

Claims (45)

1.一种表征两种或更多种靶多核苷酸的方法,包括:
(a)使第一靶多核苷酸与膜中的跨膜孔接触,使得第一靶多核苷酸移动通过孔,其中第一多核苷酸和所述孔的相互作用促进所述第一靶多核苷酸连接到后续多核苷酸;
(b)顺序地将一种或多种后续靶多核苷酸连接到第一靶多核苷酸上以提供连接的多核苷酸,在其中靶多核苷酸以连接顺序移动通过孔,其中在前靶多核苷酸移动通过孔时后续靶多核苷酸以连接顺序选择性地连接到所述前靶多核苷酸上;和
(c)进行一次或多次测量,其指示所述连接的多核苷酸相对于孔移动时的一种或多种特征。
2.根据权利要求1所述的方法,其中所述第一靶多核苷酸和所述后续靶多核苷酸的两端设置有衔接子。
3.根据权利要求1所述的方法,其中2种或更多种后续靶多核苷酸与第一靶多核苷酸连接。
4.根据权利要求1所述的方法,其中5种或更多种后续靶多核苷酸与第一靶多核苷酸连接。
5.根据权利要求1所述的方法,其中10种或更多种后续靶多核苷酸与第一靶多核苷酸连接。
6.根据权利要求1所述的方法,其中20种或更多种后续靶多核苷酸与第一靶多核苷酸连接。
7.根据权利要求1所述的方法,其中50种或更多种后续靶多核苷酸与第一靶多核苷酸连接。
8.根据权利要求1所述的方法,其中100种或更多种后续靶多核苷酸与第一靶多核苷酸连接。
9.根据权利要求1所述的方法,其中500种或更多种后续靶多核苷酸与第一靶多核苷酸连接。
10.根据权利要求1所述的方法,其中1,000种或更多种后续靶多核苷酸与第一靶多核苷酸连接。
11.根据权利要求1所述的方法,其中5,000种或更多种后续靶多核苷酸与第一靶多核苷酸连接。
12.根据权利要求1所述的方法,其中10,000种或更多种后续靶多核苷酸与第一靶多核苷酸连接。
13.根据权利要求1所述的方法,其中50,000种或更多种后续靶多核苷酸与第一靶多核苷酸连接。
14.根据权利要求1所述的方法,其中100,000种或更多种后续靶多核苷酸与第一靶多核苷酸连接。
15.根据权利要求1所述的方法,其中500,000种或更多种后续靶多核苷酸与第一靶多核苷酸连接。
16.根据权利要求1所述的方法,其中1,000,000种或更多种后续靶多核苷酸与第一靶多核苷酸连接。
17.根据权利要求1所述的方法,其中5,000,000种或更多种后续靶多核苷酸与第一靶多核苷酸连接。
18.根据权利要求1所述的方法,其中最初保护前靶多核苷酸的一部分不与后续靶多核苷酸连接,并且当所述前靶多核苷酸移动通过孔时显露其用于连接。
19.根据权利要求1所述的方法,其中后续靶多核苷酸的一部分选择性地与前多核苷酸的一部分杂交。
20.根据权利要求18所述的方法,其中后续靶多核苷酸的一部分选择性地与前多核苷酸的一部分杂交。
21.根据权利要求19或20所述的方法,其中首先保护前靶多核苷酸的一部分免于与后续靶多核苷酸的部分杂交,并且当前靶多核苷酸移动通过孔时显露其用于杂交。
22.根据权利要求21所述的方法,其中前靶多核苷酸是双链的,其中前靶多核苷酸的部分在一条链中并与另一条链杂交,并且其中随着前靶多核苷酸移动通过孔,两条链分离时显露所述部分用于杂交。
23.根据权利要求22所述的方法,其中所述双链前靶多核苷酸的两条链在一端通过发夹环连接。
24.根据权利要求23所述的方法,其中在前靶多核苷酸的另一端的另一条链包含优先穿入孔中的前导序列。
25.根据权利要求24所述的方法,其中所述后续靶多核苷酸在所述前靶多核苷酸的另一端与所述一条链连接。
26.根据权利要求1所述的方法,其中所述后续靶多核苷酸是双链的,并且两条链在一端通过发夹环连接。
27.根据权利要求26所述的方法,其中所述后续靶多核苷酸的另一端选择性地连接于所述前靶多核苷酸。
28.根据权利要求26所述的方法,其中后续靶多核苷酸的另一端包含能够选择性连接前靶多核苷酸的前导序列。
29.根据权利要求1所述的方法,其中在它们中的至少一种不移动通过孔的情况下两种不同的后续靶多核苷酸不能彼此连接。
30.根据权利要求1所述的方法,其中所述一种或多种后续靶多核苷酸选择性共价连接至第一靶多核苷酸。
31.根据权利要求1所述的方法,其中所述一种或多种后续靶多核苷酸通过连接酶、拓扑异构酶或通过点击化学选择性连接至第一靶多核苷酸。
32.根据权利要求1所述的方法,其中连接的多核苷酸通过孔的运动由分子刹车控制。
33.根据权利要求32所述的方法,其中所述分子刹车是或衍生自聚合酶、解旋酶或核酸外切酶。
34.根据权利要求32或33所述的方法,其中所述分子刹车在其与跨膜孔接触之前与第一靶多核苷酸结合,并且蛋白质控制整个连接的多核苷酸通过孔的运动。
35.根据权利要求34所述的方法,其中所述一种或多种后续多核苷酸在它们与第一靶多核苷酸连接之前不具有与它们结合的分子刹车。
36.根据权利要求1所述的方法,其中所述第一靶多核苷酸和/或所述一个或多个后续靶多核苷酸包含一个或多个能够将所述多核苷酸偶联至所述膜的锚。
37.根据权利要求1所述的方法,其中所述跨膜孔是蛋白质孔或固态孔。
38.根据权利要求37所述的方法,其中所述蛋白质孔衍生自或基于Msp、α-溶血素(α-HL)、胞溶素、CsgG、ClyA、Sp1和FraC。
39.根据权利要求1所述的方法,其中所述膜是两亲层或固态层。
40.根据权利要求1所述的方法,其中步骤(c)包括当所述连接的多核苷酸相对于孔移动时测量通过孔的离子传递或电流。
41.根据权利要求1所述的方法,其中所述一或多个特征选自(i)所述连接的多核苷酸的长度、(ii)所述连接的多核苷酸的身份、(iii)所述连接的多核苷酸的序列、(iv)所述连接的多核苷酸的二级结构和(v)所述连接的多核苷酸是否经修饰。
42.根据权利要求1所述的方法,其中表征所述两种或更多种靶多核苷酸包括估计它们的序列或对它们进行测序。
43.一种使多核苷酸顺序通过跨膜孔的方法,所述方法包括在第一靶多核苷酸进入孔的条件下使第一靶多核苷酸与孔接触,其中,在其进入后,在第一靶多核苷酸上显露连接位点,使得第一靶多核苷酸在所述连接位点连接于第二靶多核苷酸,从而在第一靶多核苷酸通过孔后引导第二靶多核苷酸顺序进入孔中。
44.一种适用于权利要求1所述的方法的包含第一多核苷酸衔接子和第二多核苷酸衔接子的多核苷酸衔接子群,其中第一多核苷酸衔接子和第二多核苷酸衔接子各自包含第一多核苷酸链和第二多核苷酸链,其中:(a)(i)延伸至第一多核苷酸链的3'末端的部分与延伸至第二多核苷酸的5'末端的部分互补和互补部分形成双链体;(ii)延伸至第一多核苷酸链的5'末端的部分和延伸至第二多核苷酸链的3'末端的部分彼此不杂交;(b)所述延伸至第一多核苷酸衔接子的第二多核苷酸链的5'末端的部分包含当双链体解开时能够与所述延伸至第二多核苷酸衔接子的第一多核苷酸的5'末端的部分中包含的序列杂交的序列;和(c)所述第一多核苷酸链的5'末端包含点击反应基团,所述第二多核苷酸链的3'末端包含互补点击反应基团。
45.一种用于表征两种或更多种双链靶多核苷酸的试剂盒,其包含权利要求44所述的多核苷酸衔接子群和下列中的一种或多种:发夹环群;微粒;一种或多种能够将多核苷酸偶联到膜上的锚;膜组件;和磁铁或电磁铁。
CN201780032978.8A 2016-05-25 2017-05-25 连接的核酸的纳米孔测序方法 Active CN109312401B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1609221.5 2016-05-25
GBGB1609221.5A GB201609221D0 (en) 2016-05-25 2016-05-25 Method
PCT/GB2017/051493 WO2017203269A1 (en) 2016-05-25 2017-05-25 Method of nanopore sequencing of concatenaded nucleic acids

Publications (2)

Publication Number Publication Date
CN109312401A CN109312401A (zh) 2019-02-05
CN109312401B true CN109312401B (zh) 2022-09-20

Family

ID=56369958

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780032978.8A Active CN109312401B (zh) 2016-05-25 2017-05-25 连接的核酸的纳米孔测序方法

Country Status (5)

Country Link
US (2) US11098355B2 (zh)
EP (1) EP3464624B1 (zh)
CN (1) CN109312401B (zh)
GB (1) GB201609221D0 (zh)
WO (1) WO2017203269A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107208160B (zh) * 2015-01-30 2023-02-17 哈佛学院院长及董事 无显微镜成像
GB201609221D0 (en) 2016-05-25 2016-07-06 Oxford Nanopore Tech Ltd Method
GB201620450D0 (en) 2016-12-01 2017-01-18 Oxford Nanopore Tech Ltd Method
US11492661B2 (en) 2017-01-10 2022-11-08 President And Fellows Of Harvard College Multiplexed signal amplification
GB201707140D0 (en) 2017-05-04 2017-06-21 Oxford Nanopore Tech Ltd Method
CN111630179A (zh) 2018-01-26 2020-09-04 哈佛学院院长及董事 邻近检测方法和组合物
US20210035473A1 (en) 2018-02-02 2021-02-04 Bayer Aktiengesellschaft Control of resistent harmful organisms
GB201801768D0 (en) * 2018-02-02 2018-03-21 Oxford Nanopore Tech Ltd Synthesis method
GB201809323D0 (en) 2018-06-06 2018-07-25 Oxford Nanopore Tech Ltd Method
GB201907244D0 (en) * 2019-05-22 2019-07-03 Oxford Nanopore Tech Ltd Method
CN111164097B (zh) * 2019-09-29 2021-02-19 北京齐碳科技有限公司 一种Mnep单体变体及其应用
CN115315513A (zh) * 2019-11-25 2022-11-08 威廉马歇莱思大学 用于纳米孔测序的线性dna组装
AU2021339945A1 (en) * 2020-09-11 2023-03-02 Illumina Cambridge Limited Methods of enriching a target sequence from a sequencing library using hairpin adaptors
US20240117340A1 (en) * 2021-02-18 2024-04-11 Roche Sequencing Solutions, Inc. Structure to prevent threading of nucleic acid templates through a nanopore during sequencing
CN113462764B (zh) * 2021-09-01 2021-12-17 北京齐碳科技有限公司 用于表征双链靶多核苷酸的类发夹衔接子、构建体和方法
CN114134142B (zh) * 2021-11-23 2024-05-28 成都齐碳科技有限公司 衔接体、复合物、单链分子、试剂盒、方法和应用
AR128277A1 (es) 2022-01-19 2024-04-10 Syngenta Crop Protection Ag Monitoreo de patógenos en cultivos y predicción de poblaciones
WO2024099985A1 (en) 2022-11-10 2024-05-16 Bayer Aktiengesellschaft Targeted crop protection product application based on genetic profiles

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012003330A2 (en) * 2010-06-30 2012-01-05 Stratos Genomics, Inc Multiplexed identification of nucleic acid sequences
WO2016059436A1 (en) * 2014-10-17 2016-04-21 Oxford Nanopore Technologies Limited Method for nanopore rna characterisation

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6362002B1 (en) 1995-03-17 2002-03-26 President And Fellows Of Harvard College Characterization of individual polymer molecules based on monomer-interface interactions
US20120160687A1 (en) 1995-03-17 2012-06-28 President And Fellows Of Harvard College Characterization of individual polymer molecules based on monomer-interface interactions
US6267872B1 (en) 1998-11-06 2001-07-31 The Regents Of The University Of California Miniature support for thin films containing single channels or nanopores and methods for using same
FR2814939B1 (fr) 2000-10-05 2002-12-20 Sofradim Production Ensemble de soutenement sous-uretral dans le traitement de l'incontinence urinaire d'effort de la femme
WO2005124888A1 (en) 2004-06-08 2005-12-29 President And Fellows Of Harvard College Suspended carbon nanotube field effect transistor
GB0505971D0 (en) 2005-03-23 2005-04-27 Isis Innovation Delivery of molecules to a lipid bilayer
EP2122344B8 (en) 2007-02-20 2019-08-21 Oxford Nanopore Technologies Limited Lipid bilayer sensor system
US8698481B2 (en) 2007-09-12 2014-04-15 President And Fellows Of Harvard College High-resolution molecular sensor
GB0724736D0 (en) 2007-12-19 2008-01-30 Oxford Nanolabs Ltd Formation of layers of amphiphilic molecules
GB0820927D0 (en) 2008-11-14 2008-12-24 Isis Innovation Method
JP2012516145A (ja) 2009-01-30 2012-07-19 オックスフォード ナノポア テクノロジーズ リミテッド ハイブリダイゼーションリンカー
GB0901588D0 (en) 2009-02-02 2009-03-11 Itis Holdings Plc Apparatus and methods for providing journey information
JP5873023B2 (ja) 2009-12-01 2016-03-01 オックスフォード ナノポール テクノロジーズ リミテッド 生化学分析機器
US9593370B2 (en) 2010-10-01 2017-03-14 Oxford Nanopore Technologies Ltd. Biochemical analysis apparatus and rotary valve
US9751915B2 (en) 2011-02-11 2017-09-05 Oxford Nanopore Technologies Ltd. Mutant pores
US9347929B2 (en) 2011-03-01 2016-05-24 The Regents Of The University Of Michigan Controlling translocation through nanopores with fluid wall
AU2012288629B2 (en) 2011-07-25 2017-02-02 Oxford Nanopore Technologies Limited Hairpin loop method for double strand polynucleotide sequencing using transmembrane pores
CA3113287C (en) 2011-09-23 2022-12-20 Oxford Nanopore Technologies Limited Analysis of a polymer comprising polymer units
US9758823B2 (en) 2011-10-21 2017-09-12 Oxford Nanopore Technologies Limited Enzyme method
US10385382B2 (en) 2011-12-29 2019-08-20 Oxford Nanopore Technologies Ltd. Enzyme method
EP2798083B1 (en) 2011-12-29 2017-08-09 Oxford Nanopore Technologies Limited Method for characterising a polynucelotide by using a xpd helicase
CN104254771B (zh) 2012-01-20 2018-01-12 吉尼亚科技公司 基于纳米孔的分子检测与测序
WO2013153359A1 (en) 2012-04-10 2013-10-17 Oxford Nanopore Technologies Limited Mutant lysenin pores
WO2013181170A1 (en) * 2012-05-31 2013-12-05 Board Of Regents, The University Of Texas System Method for accurate sequencing of dna
WO2013185137A1 (en) 2012-06-08 2013-12-12 Pacific Biosciences Of California, Inc. Modified base detection with nanopore sequencing
EP2875128B8 (en) 2012-07-19 2020-06-24 Oxford Nanopore Technologies Limited Modified helicases
EP2875152B1 (en) 2012-07-19 2019-10-09 Oxford Nanopore Technologies Limited Enzyme construct
EP2875154B1 (en) 2012-07-19 2017-08-23 Oxford Nanopore Technologies Limited SSB method for characterising a nucleic acid
GB201313121D0 (en) 2013-07-23 2013-09-04 Oxford Nanopore Tech Ltd Array of volumes of polar medium
CA2889664C (en) 2012-10-26 2020-12-29 Oxford Nanopore Technologies Limited Droplet interfaces
CA2890515C (en) 2012-11-09 2021-11-09 Stratos Genomics, Inc. Concentrating a target molecule for sensing by a nanopore
JP6408494B2 (ja) 2013-03-08 2018-10-17 オックスフォード ナノポール テクノロジーズ リミテッド 酵素停止法
GB201314695D0 (en) 2013-08-16 2013-10-02 Oxford Nanopore Tech Ltd Method
CN203450281U (zh) 2013-08-01 2014-02-26 大行科技(深圳)有限公司 一种折叠自行车走线结构
US20150051088A1 (en) * 2013-08-19 2015-02-19 Abbott Molecular Inc. Next-generation sequencing libraries
CN117947149A (zh) 2013-10-18 2024-04-30 牛津纳米孔科技公开有限公司 经修饰的酶
GB201406151D0 (en) 2014-04-04 2014-05-21 Oxford Nanopore Tech Ltd Method
AU2015208919B9 (en) 2014-01-22 2021-04-01 Oxford Nanopore Technologies Limited Method for attaching one or more polynucleotide binding proteins to a target polynucleotide
GB201406155D0 (en) 2014-04-04 2014-05-21 Oxford Nanopore Tech Ltd Method
GB201403096D0 (en) 2014-02-21 2014-04-09 Oxford Nanopore Tech Ltd Sample preparation method
WO2015127387A1 (en) 2014-02-21 2015-08-27 Northeastern University Fluorescence-based analysis of biopolymers using nanopores
CN106460061B (zh) 2014-04-04 2020-03-06 牛津纳米孔技术公司 在双链核酸分子的两端使用纳米孔和锚分子来表征所述双链核酸的方法
GB201417712D0 (en) 2014-10-07 2014-11-19 Oxford Nanopore Tech Ltd Method
WO2016034591A2 (en) 2014-09-01 2016-03-10 Vib Vzw Mutant pores
GB201418159D0 (en) 2014-10-14 2014-11-26 Oxford Nanopore Tech Ltd Method
US10689697B2 (en) 2014-10-16 2020-06-23 Oxford Nanopore Technologies Ltd. Analysis of a polymer
GB201418469D0 (en) 2014-10-17 2014-12-03 Oxford Nanopore Tech Ltd Method
US9557294B2 (en) 2014-12-19 2017-01-31 Genia Technologies, Inc. Nanopore-based sequencing with varying voltage stimulus
CN108027335B (zh) 2015-06-25 2021-05-04 罗斯韦尔生物技术股份有限公司 生物分子传感器和方法
US20200216887A1 (en) 2016-01-21 2020-07-09 Genia Technologies, Inc. Nanopore sequencing complexes
GB201609221D0 (en) 2016-05-25 2016-07-06 Oxford Nanopore Tech Ltd Method
GB201620450D0 (en) 2016-12-01 2017-01-18 Oxford Nanopore Tech Ltd Method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012003330A2 (en) * 2010-06-30 2012-01-05 Stratos Genomics, Inc Multiplexed identification of nucleic acid sequences
WO2016059436A1 (en) * 2014-10-17 2016-04-21 Oxford Nanopore Technologies Limited Method for nanopore rna characterisation

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
固态纳米孔中DNA分子再捕捉的探测和分析;胡颖等;《科学通报》;20150210(第04期);全文 *

Also Published As

Publication number Publication date
US20220090192A1 (en) 2022-03-24
US20200010887A1 (en) 2020-01-09
CN109312401A (zh) 2019-02-05
EP3464624B1 (en) 2021-11-24
WO2017203269A1 (en) 2017-11-30
US11098355B2 (en) 2021-08-24
EP3464624A1 (en) 2019-04-10
GB201609221D0 (en) 2016-07-06

Similar Documents

Publication Publication Date Title
CN109312401B (zh) 连接的核酸的纳米孔测序方法
US11649490B2 (en) Method of target molecule characterisation using a molecular pore
US20240026441A1 (en) Method for attaching one or more polynucleotide binding proteins to a target polynucleotide
AU2018270075B2 (en) Transmembrane pore consisting of two CsgG pores
US20190345550A1 (en) Method for controlling the movement of a polynucleotide through a transmembrane pore
CN107002151B (zh) 向跨膜孔输送分析物的方法
EP3126515B1 (en) Method for characterising a double stranded nucleic acid using a nano-pore and anchor molecules at both ends of said nucleic acid
CN109196116B (zh) 一种表征靶多核苷酸的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: oxford

Applicant after: Oxford nanopore Technology Public Co.,Ltd.

Address before: Oxfordshire

Applicant before: OXFORD NANOPORE TECHNOLOGIES LTD.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant