CN111235245A - 方法 - Google Patents

方法 Download PDF

Info

Publication number
CN111235245A
CN111235245A CN202010051452.8A CN202010051452A CN111235245A CN 111235245 A CN111235245 A CN 111235245A CN 202010051452 A CN202010051452 A CN 202010051452A CN 111235245 A CN111235245 A CN 111235245A
Authority
CN
China
Prior art keywords
leu
ala
gly
polynucleotide
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010051452.8A
Other languages
English (en)
Inventor
戴维·杰克逊·斯托达特
詹姆斯·怀特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oxford Nanopore Technologies PLC
Original Assignee
Oxford Nanopore Technologies PLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oxford Nanopore Technologies PLC filed Critical Oxford Nanopore Technologies PLC
Publication of CN111235245A publication Critical patent/CN111235245A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种用于修饰模板双链多核苷酸的方法,特别是使用纳米孔测序进行表征的方法。所述方法从多个修饰的双链多核苷酸模板化而产生。这些修饰的多核苷酸可以随后被表征。

Description

方法
本申请为2014年8月14日递交的申请号为2014800568060,发明名称为“方法”的分案申请。
技术领域
本发明涉及一种用于修饰模板双链多核苷酸的方法,尤其涉及一种使用纳米孔测序进行表征的方法。所述方法从多个修饰的双链多核苷酸模板化而产生。这些修饰的多核苷酸可以随后被表征。
背景技术
许多商业情况需要制备核酸文库。这通常使用转座酶而实现。根据制备该文库所使用的转座酶,在该文库可能需要在使用前,如在测序使用中前,在体外对易位事件(transposition events)进行修复。
目前需要一种具有广泛的应用范围的快速且廉价的多核苷酸(如DNA或RNA)测序和鉴定技术。现有的技术是缓慢的且昂贵的,这主要由于它们依赖于扩增技术以产生大量的多核苷酸,且需要大量特定的用于信号检测的荧光化学物质。
跨膜孔(纳米孔)作为用于聚合物和各种小分子的直接的、电生物传感器,具有很大的潜力。特别是,目前作为一种有潜力的DNA测序技术的纳米孔得到了许多关注。
当跨纳米孔施加电势时,在特定的时间段内,当分析物如核苷酸片刻停留在桶(barrel)中时,会产生电流的变化。所述核苷酸的纳米孔检测能产生已知特征和持续时间的电流变化。在链测序方法中,单个多核苷酸链穿过所述孔并能实现对核苷酸的鉴定。链测序可包括使用多核苷酸结合蛋白,以控制所述多核苷酸穿过所述孔的移动。
发明内容
本发明已令人惊讶地表明可以修饰模板双链多核苷酸以产生多个较短且修饰的双链多核苷酸。所述双链多核苷酸可包括,例如,发夹环或单链前导序列。这些修饰可以被设计,使得修饰的双链多核苷酸各自比原来的模板多核苷酸更易于表征,例如通过链测序。所述修饰的多核苷酸的随后的表征允许模板多核苷酸的特点更容易被确定。
在一个实施例中,修饰方法使用MUA转座酶和MuA底物组,每个底物包含通用核苷酸突出。通用核苷酸是与模板多核苷酸中的所有核苷酸都有一定程度杂交的核苷酸。MuA转座酶能够将模板多核苷酸片段化且产生在两端具有突出的片段。MUA转座酶还能够将所述底物连接到所述双链片段的一端或两端的突出。不具有突出的底物的链通常被连接到具有突出的片段的链。这使得在得到的双链构建体中有单链缺口。令人惊奇的是,含有通用核苷酸的底物中的突出能够杂交到所述片段的链中的突出(底物中没有突出的反义链连接其上),并通过转座酶的作用闭合留下的缺口(见图1)。将所述突出连接到所述片段中相邻的链,产生了修饰的双链多核苷酸。
因此,本发明提供了用于修饰模板双链多核苷酸的方法,包括:
(a)将模板多核苷酸与MuA转座酶和双链MuA底物组接触,每个所述底物含有至少一个通用核苷酸突出,使得所述转座酶将所述模板多核苷酸片段化并将底物连接到双链片段的一端或两端,并由此制备多个片段/底物构建体;以及
(b)将所述突出连接到所述构建体中的所述片段,并由此制备多个修饰的双链多核苷酸。在另一个实施例中,该修饰方法使用MuA转座酶和MuA转座酶底物组,每个底物包括至少一个突出以及与所述突出在相同的链中的至少一个核苷酸,所述核苷酸包含在所述模板多核苷酸中不存在的核苷酸。所述MuA转座酶能够将所述模板多核苷酸片段化。还能够将底物连接到双链片段的一端或两端。使用所述至少一个核苷酸将所述突出从连接的构建体中特定的除去,所述至少一个核苷酸包含在模板多核苷酸中不存在的核苷酸。这在双链片段中留下了缺口,且修复这些缺口提供了多个修饰的双链多核苷酸。
因此,本发明还提供了用于修饰模板双链多核苷酸的方法,包括:
(a)将模板多核苷酸与MuA转座酶和双链MuA底物组接触,每个所述底物包含(i)至少一个突出以及(ii)与所述至少一个突出在相同的链中的至少一个核苷酸,所述至少一个核苷酸包含在所述模板多核苷酸中不存在的核苷酸,使得所述转座酶将所述模板多核苷酸片段化并将底物连接到双链片段的一端或两端,并由此制备多个片段/底物构建体;
(b)通过选择性地除去所述至少一个核苷酸将所述突出从所述构建体中除去,并由此制备多个包含单链缺口的双链构建体;以及
(c)修复在所述构建体中所述单链缺口,并由此制备多个修饰的双链多核苷酸。
本发明还提供:
-使用本发明方法修饰的多个多核苷酸。
-用于修饰模板多核苷酸的双链多核苷酸底物组,其中所述底物如上文所定义:
-一种表征使用本发明的方法修饰的至少一个多核苷酸的方法,包括a)将所述修饰的多核苷酸与跨膜孔接触,使得所述多核苷酸的至少一条链移动穿过所述孔;以及b)随着所述至少一条链相对于所述孔移动,获取一个或多个测量值,其中所述测量值代表所述至少一条链的一个或多个特征,并由此表征所述修饰的多核苷酸。
-一种表征模板多核苷酸的方法,包括a)使用本发明的方法修饰所述模板多核苷酸,以产生多个修饰的多核苷酸;b)将每个修饰的多核苷酸与跨膜孔接触,使得每个多核苷酸的至少一条链移动穿过所述孔;以及c)随着每个多核苷酸的至少一条链相对于所述孔移动,获取一个或多个测量值,其中所述测量值代表每个多核苷酸的至少一条链的一个或多个特征,并由此表征所述模板多核苷酸。
-一种用于修饰模板多核苷酸的试剂盒,包含(a)如上定义的MuA底物组以及(b)MuA转座酶。
附图说明
图1示出了修饰模板双链多核苷酸的链(a)的方法,通过将模板双链多核苷酸(a)的链与MuA转座酶(b)和双链MuA底物组(c)接触。双链MuA底物每个含有5'磷酸(标记为圆圈)和五个通用核苷酸(标记为矩形)。MuA转座酶将模板双链多核苷酸片段化,并在片段化的位点的每一侧插入MuA底物(步骤1)。在片段化的双链构建体中留下的缺口随后使用DNA连接酶(d)修复,该连接酶将含有通用核苷酸的链连接到双链构建体(步骤2)。
图2示出了修饰模板双链多核苷酸的链(a)的方法,通过将模板双链多核苷酸(a)的链与MuA转座酶(b)和双链发夹形MuA底物组(c)接触。发夹形MuA底物每个含有5'磷酸(标记为圆圈)和五个通用核苷酸(标记为矩形)。MuA转座酶将模板双链多核苷酸片段化,并在片段化的位点的每一侧插入MuA底物(步骤1)。在片段化的双链构建体中留下的缺口随后使用DNA连接酶(d)修复,该连接酶将含有通用核苷酸的链连接到双链构建体(步骤2)。
图3示出了修饰模板双链多核苷酸的链(a)的方法,通过将模板双链多核苷酸(a)的链与MuA转座酶(b)和Y-形MuA底物组(c)接触。Y-形MuA底物每个含有5'磷酸(标记为圆圈)和五个通用核苷酸(标记为矩形)。MuA转座酶将模板双链多核苷酸片段化,并在片段化的位点的每一侧插入Y-形MuA底物(步骤1)。在片段化的双链构建体中留下的缺口随后使用DNA连接酶(d)修复,该连接酶将含有通用核苷酸的链连接到双链构建体(步骤2)。
图4示出了修饰模板双链多核苷酸的链(a)的方法,通过将模板双链多核苷酸(a)的链与MuA转座酶(b)、双链发夹形MuA底物(d)、Y-形MuA底物(c)的组接触。两种MuA底物每个含有5'磷酸(标记为圆圈)和五个通用核苷酸(标记为矩形)。MuA转座酶将模板双链多核苷酸片段化,并在片段化的位点的每一侧插入MuA底物(步骤1)。在片段化的双链构建体中留下的缺口随后使用DNA连接酶(e)修复,该连接酶将含有通用核苷酸的链连接到双链构建体(步骤2)。
图5示出了修饰模板双链多核苷酸的链(a)的方法,通过将模板双链多核苷酸(a)的链与MuA转座酶(b)、双链发夹形MuA底物(d)、Y-形MuA底物(c)的组接触。两种MuA底物每个含有5'磷酸(标记为圆圈)和五个通用核苷酸(标记为矩形)。MuA转座酶将模板双链多核苷酸片段化,并在片段化的位点的每一侧插入MuA底物(步骤1)。在片段化的双链构建体中留下的缺口随后使用DNA连接酶(e)修复,该连接酶将含有通用核苷酸的链连接到双链构建体(步骤2)。
图6示出了修饰模板双链多核苷酸(a)的方法,通过将模板双链多核苷酸(a)的链与MuA转座酶(b)、双链发夹形MuA底物组(d)、Y-形MuA底物(c)的组接触。Y-形MuA底物具有附加的polyT前导序列(标记为不连续的波浪线)。两种MuA底物每个含有5'磷酸(标记为圆圈)和五个通用核苷酸(标记为矩形)。MuA转座酶将模板双链多核苷酸片段化,并在片段化的位点的每一侧插入MuA底物(步骤1)。在片段化的双链构建体中留下的缺口随后使用DNA连接酶(e)修复,该连接酶将含有通用核苷酸的链连接到双链构建体(步骤2)。
图7示出了修饰模板双链多核苷酸(a)的方法,通过将模板双链多核苷酸(a)的链与MuA转座酶(b)和双链MuA底物组(c)的组接触。发夹环MuA底物每个含有5'磷酸(标记为圆圈)和五个通用核苷酸(标记为矩形)。MuA转座酶将模板双链多核苷酸片段化,并在片段化的位点的每一侧插入MuA底物(步骤1)。在片段化的双链构建体中留下的缺口随后使用DNA连接酶(d)修复,该连接酶将含有通用核苷酸的链连接到双链构建体(步骤2)。
图8示出了修饰模板双链多核苷酸(a)的方法,通过将模板双链多核苷酸(a)的链与MuA转座酶(b)和双链MuA底物组(c)接触。双链MuA底物含有标记为三角形的在模板多核苷酸中不存在的单核苷酸。MuA转座酶将模板双链多核苷酸片段化,并在片段化的位点的每一侧插入MuA底物(步骤1)。尿嘧啶特异性切除试剂(Uracil-specific Excision Reagent)(USERTM)在模板多核苷酸中不存在的该单核苷酸的位置(三角形)产生单核苷酸缺口,使得含有在模板多核苷酸中不存在的该单核苷酸的DNA片段被除去(步骤2)。留在片段化的双链构建体中的单链DNA缺口随后使用DNA聚合酶(e)修复,其用合适的互补核苷酸填充了该缺口,且DNA连接酶(f)将新合成的链连接到含有单一缺口的双链构建体(步骤3)。
图9示出了修饰模板双链多核苷酸(a)的方法,通过将模板双链多核苷酸(a)的链与MuA转座酶(b)和双链发夹形MuA底物组(c)接触。双链发夹形MuA底物含有标记为三角形的在模板多核苷酸中不存在的单核苷酸。MuA转座酶将模板双链多核苷酸片段化,并在片段化的位点的每一侧插入MuA底物(步骤1)。尿嘧啶特异性切除试剂(USERTM)在模板多核苷酸中不存在的该单核苷酸的位置(三角形)产生单核苷酸缺口,使得含有在模板多核苷酸中不存在的该单核苷酸的DNA片段被除去(步骤2)。留在片段化的双链构建体中的单链DNA缺口随后使用DNA聚合酶(e)修复,其用合适的互补核苷酸填充该缺口,且DNA连接酶(f)将新合成的链连接到含有单一缺口的双链构建体(步骤3)。
图10示出了修饰模板双链多核苷酸(a)的方法,通过将模板双链多核苷酸(a)的链与MuA转座酶(b)和Y-形MuA底物组(c)接触。Y-形MuA底物含有标记为三角形的在模板多核苷酸中不存在的单核苷酸。MuA转座酶将模板双链多核苷酸片段化,并在片段化的位点的每一侧插入Y-形MuA底物(步骤1)。尿嘧啶特异性切除试剂(USERTM)在模板多核苷酸中不存在的该单核苷酸的位置(三角形)产生单核苷酸缺口,使得含有在模板多核苷酸中不存在的该单核苷酸的DNA片段被除去(步骤2)。留在片段化的双链构建体中的单链DNA缺口随后使用DNA聚合酶(e)修复,其用合适的互补核苷酸填充了该缺口,且DNA连接酶(f)将新合成的链连接到含有单一缺口的双链构建体(步骤3)。
图11示出了修饰模板双链多核苷酸(a)的方法,通过将模板双链多核苷酸(a)的链与MuA转座酶(b)、双链发夹形MuA底物(d)、Y-形MuA底物(c)的组接触。两种MuA底物含有标记为三角形的在模板多核苷酸中不存在的单核苷酸。MuA转座酶将模板双链多核苷酸片段化,并在片段化的位点的每一侧插入MuA底物(步骤1)。尿嘧啶特异性切除试剂(USERTM)在模板多核苷酸中不存在的任何单核苷酸的位置(三角形)产生单核苷酸缺口,使得含有在模板多核苷酸中不存在的该单核苷酸的DNA片段(e)被除去(步骤2)。留在片段化的双链构建体中的单链DNA缺口随后使用DNA聚合酶(f)修复,其用合适的互补核苷酸填充了该缺口,且DNA连接酶(g)将新合成的链连接到含有单一缺口的双链构建体(步骤3)。
图12示出了修饰模板双链多核苷酸(a)的方法,通过将模板双链多核苷酸(a)的链与MuA转座酶(b)、双链发夹形MuA底物(d)、Y-形MuA底物(c)的组接触。两种MuA底物含有标记为三角形的在模板多核苷酸中不存在的单核苷酸。MuA转座酶将模板双链多核苷酸片段化,并在片段化的位点的每一侧插入MuA底物(步骤1)。尿嘧啶特异性切除试剂(USERTM)在模板多核苷酸中不存在的任何单核苷酸的位置(三角形)产生单核苷酸缺口,使得含有在模板多核苷酸中不存在的该单核苷酸的DNA片段(e)被除去(步骤2)。留在片段化的双链构建体中的单链DNA缺口随后使用DNA聚合酶(f)修复,其用合适的互补核苷酸填充了该缺口,且DNA连接酶(g)将新合成的链连接到含有单一缺口的双链构建体(步骤3)。
图13示出了修饰模板双链多核苷酸(a)的方法,通过将模板双链多核苷酸(a)的链与MuA转座酶(b)、双链发夹形MuA底物(d)、Y-形MuA底物(c)的组接触。Y-形MuA底物具有附加的聚T前导序列(显示为不连续的波浪线)。两种MuA底物含有标记为三角形的在模板多核苷酸中不存在的单核苷酸。MuA转座酶将模板双链多核苷酸片段化,并在片段化的位点的每一侧插入MuA底物(步骤1)。尿嘧啶特异性切除试剂(USERTM)在模板多核苷酸中不存在的任何单核苷酸的位置(三角形)产生单核苷酸缺口,使得含有在模板多核苷酸中不存在的该单核苷酸的DNA片段(e)被除去(步骤2)。留在片段化的双链构建体中的单链DNA缺口随后使用DNA聚合酶(f)修复,其用合适的互补核苷酸填充了该缺口,且DNA连接酶(g)将新合成的链连接到含有单一缺口的双链构建体(步骤3)。
图14示出了修饰模板双链多核苷酸(a)的方法,通过将模板双链多核苷酸(a)的链与MuA转座酶(b)和双链发夹形MuA底物组(c)接触。发夹环MuA底物含有标记为三角形的在模板多核苷酸中不存在的单核苷酸。MuA转座酶将模板双链多核苷酸片段化,并在片段化的位点的每一侧插入MuA底物(步骤1)。尿嘧啶特异性切除试剂(USERTM)在模板多核苷酸中不存在的任何单核苷酸的位置(三角形)产生单核苷酸缺口,使得含有在模板多核苷酸中不存在的该单核苷酸的DNA片段(d)被除去(步骤2)。留在片段化的双链构建体中的单链DNA缺口随后使用DNA聚合酶(f)修复,其用合适的互补核苷酸填充了该缺口,且DNA连接酶(g)将新合成的链连接到含有单一缺口的双链构建体(步骤3)。
图15示出在实施例1中使用用于两个MuA底物的DNA底物的设计(MuA底物1标记为A,MuA底物2标记为B)。SEQ ID NO:26中的dUMP高亮为星型,C3间隔区显示为x’s。
图16示出与以下样品相关的凝胶中的泳道-泳道1=适当的DNA梯(DNA标记物的单位为kb),泳道2与样品1对应(对照,显示由未修饰的SEQ ID NO:29产生的带),泳道3与样品2对应(野生型MuA底物(MUA底物1,通过4个C3间隔区单元连接到SEQ ID NO:24的SEQ IDNO:27,与SEQ ID NO:28杂交)不含在模板多核苷酸(SEQ ID NO:29)中不存在的至少一个核苷酸),泳道4与样品3对应(含有dUMP的MuA底物(MuA底物2,通过4个C3间隔区单元连接到SEQ ID NO:24的SEQ ID NO:27,与SEQ ID NO:26杂交),其在模板多核苷酸(SEQ ID NO:29)中不存在),泳道5与样品4对应(在凝胶上的宽带表明MuA转座酶能够将野生型MuA底物(通过4个C3间隔区单元连接于SEQ ID NO:24的SEQ ID NO:27,与SEQ ID NO:28杂交)插入到模板多核苷酸(SEQ ID NO:29)中),泳道6与样品5对应(在凝胶上的宽带表明MuA转座酶能够将含有dUMP的MuA底物(SEQ ID NO:27通过4个C3间隔区单元连接到SEQ ID NO:24,与SEQID NO:26杂交)插入到模板多核苷酸(SEQ ID NO:29))。泳道3和泳道4作为额外的对照运行,在凝胶的底部产生模糊的带。
图17A)部分显示出实施例2中描述的样品制备方法。在步骤1中的多个ssDNA片段退火以形成模型构建体(X)。步骤2示出使用USERTM从构建体X(标记为三角形)中除去dUMP。最后,在步骤3中构建体x中的缺口使用DNA聚合酶和连接酶修复,以产生ds-DNA多核苷酸,B)部分示出对照链,其中SEQ ID NO:30退火到其互补链SEQ ID NO:33。
图18示出安捷伦1000芯片,具有包含在泳道1-9如下样品,-泳道1=合适的DNA梯,泳道2=对照样品a(含构建体Y,未消化),泳道3=对照样品b(含消化后的构建体Y),泳道4=对照样品C(含未暴露于聚合酶或连接酶的构建体X,未消化),泳道5=对照样品d(含在消化后未暴露于聚合酶或连接酶的构建体X),泳道6=对照样品e(含仅暴露于聚合酶的构建体X,未消化),泳道7=对照样品f(含仅暴露于聚合酶的构建体X,消化后),泳道8=对照样品g(含暴露于聚合酶和连接酶的构建体X,未消化),泳道9=对照样品h(包含未暴露于聚合酶和连接酶的构建体X,消化后)。用星号标记的条带对应于未消化的dsDNA构建体,用正方形标记的条带对应于消化的DNA。
图19示出在实施例3中使用的样品制备过程的卡通表示。在步骤1中所述双链是λDNA(SEQ ID NO:29,标记为a)与MuA转座酶(b)、双链发夹形MuA底物组(d)和Y-形MuA底物(c)接触。两种类型的MuA底物含有标记为三角形的单dUMP。该MuA转座酶将λDNA片段化为5-10kB的片段,并将MuA底物插入到片段化的位点的每侧(步骤1)。尿嘧啶特异性切除试剂USERTM在任何dUMPs(三角形)的位置处产生单核苷酸缺口,这使含有dUMP(e)的DNA片段被除去(步骤2)。留在片段化的双链构建体中的单链DNA缺口随后使用DNA聚合酶(f)修复,用合适的互补核苷酸填充了该缺口,且DNA连接酶(g)将新合成的链连接到含有单一链缺口的双链构建体(步骤3)。在步骤4中,得到的λDNA构建体(h)然后在解旋酶(j)的控制下易位穿过纳米孔(i)。
图20(a)显示了实施例3中使用的发夹形MuA底物和Y-形MuA底物的设计。SEQ IDNO:36中的dUMP被突出显示为三角形且所述iSpC3间隔区显示为x's。图20(b)显示了实施例3中详述的样品制备过程中制备的λDNA构建体。λDNA构建体的5-10kB片段标记为X,由聚合酶插入并由连接酶结合到该构建体的其余部分的DNA片段标记为y(且以点线示出),且所述iSpC3间隔区显示为x。连接体序列(tether sequence)(SEQ ID NO:39)与所示DNA构建体杂交。在SEQ ID NO:39的3'末端连接6个iSp18间隔区,该6个iSp18间隔区连接到2个胸腺嘧啶残基和3'胆固醇TEG(显示为灰色圆圈)。
图21显示了当解旋酶(Trwc Cba(SEQ ID NO:40,由标记A)控制的λDNA构建体(如图20(b)中所示)穿过纳米孔(MS(B1-G75S/G77S/L88N/Q126R)8MspA(具有突变G75S/G77S/L88N/Q126R的SEQ ID NO:2))的易位时的示例电流轨迹(y-轴坐标=电流(pA),x-轴坐标=时间(s),对于上轨迹和下轨迹)。上轨迹显示了由解旋酶控制的整个λDNA构建体穿过纳米孔的DNA移动,标记为X1的第一个iSpC3间隔区产生的标记为1的电流的尖峰,标记为X2的第二个iSpC3间隔区产生的标记为2的电流的尖峰。下轨迹显示了由解旋酶控制的DNA移动穿过纳米孔的终点的放大的区域,标记为X3的第三个iSpC3产生的标记为3的电流的尖峰。
图22示出在实施例3中使用的样品制备过程的卡通表示。在步骤1中所述双链是λDNA(SEQ ID NO:29,标记为a)与MuA转座酶(b)、双链发夹形2MuA底物组(d)和Y-形2MuA底物(c)接触。两种类型的MuA底物含有5’磷酸(标记为圆形)和5个肌苷(标记为矩形)。MuA转座酶将λDNA片段化为5-10kB的片段,并将MuA底物插入到片段化的位点的每侧(步骤1)。留在片段化的双链构建体中的缺口随后使用DNA连接酶(e)修复,该连接酶将包含肌苷的链连接到双链λDNA构建体(步骤2)。在步骤3中,得到的λDNA构建体(f)在解旋酶(g)的控制下易位穿过纳米孔(h)。
图23(a)显示了在实施例4中使用的发夹形2和Y-形MuA底物设计。5'磷酸标记为圆形,SEQ ID NO:41中的肌苷突出显示为矩形,iSpC3间隔区显示为x。图23(b)显示了实施例4中所述的样品制备过程中制备的λDNA构建体。λDNA构建体的5-10kB片段标记为X,已被连接到x的肌苷标记为矩形,iSpC3间隔区显示为x。连接体序列(SEQ ID NO:39)与所示DNA构建体杂交。SEQ ID NO:39的3'末端连接6个iSp18间隔区,该6个iSp18间隔区连接到2个胸腺嘧啶残基和3'胆固醇TEG(显示为灰色圆圈)。
图24显示了当解旋酶(Trwc Cba(SEQ ID NO:40,由标记的A)控制的λDNA构建体穿过纳米孔(MS(B1-G75S/G77S/L88N/Q126R)8的MspA(SEQ ID NO:2具有突变G75S/G77S/L88N/Q126R))易位时的示例电流轨迹(y-轴坐标=电流(pA),x-轴坐标=时间(s),对于上轨迹和下轨迹)。上轨迹显示了由解旋酶控制的整个λDNA构建体穿过纳米孔的DNA移动,标记为X1的第一个iSpC3间隔区产生标记为1的电流的尖峰,标记为X2的第二个iSpC3间隔区产生的标记为2电流中的尖峰,标记为X3的第三个iSpC3间隔区产生的标记为3的电流的尖峰。下轨迹显示了由解旋酶控制的DNA移动穿过纳米孔的后半部分放大的区域,标记为X2的第二个iSpC3间隔区产生标记为2的电流的尖峰,标记为X3的第三个iSpC3间隔区产生的标记为3的电流的尖峰。
序列表的说明
SEQ ID NO:1显示了编码MS-B1突变体MspA单体的密码子优化的多核苷酸序列。该突变体缺少信号序列,并包含下列突变:D90N,D91N,D93N,D118R,D134R和E139K。
SEQ ID NO:2显示了由MspA单体的MS-B1突变体的成熟形式的氨基酸序列。该突变体缺少信号序列,并包含下列突变:D90N,D91N,D93N,D118R,D134R和E139K。
SEQ ID NO:3显示了编码α-溶血素-E111N/K147N(α-HL-NN;Stoddart等人,PNAS,2009;106(19):7702-7707)的一个单体的多核苷酸序列。
SEQ ID NO:4显示了α-HL-NN的一个单体的氨基酸序列。
SEQ ID NO:5至SEQ ID NO:7显示了MspB,C和D的氨基酸序列。
SEQ ID NO:8显示了编码Phi29 DNA聚合酶的多核苷酸序列。
SEQ ID NO:9表示的Phi29 DNA聚合酶的氨基酸序列。
SEQ ID NO:10显示了由大肠杆菌的sbcB基因衍生的密码子优化的多核苷酸序列。它编码来自大肠杆菌的核酸外切酶I酶(EcoExo Ⅰ)。
SEQ ID NO:11显示出来自大肠杆菌的核酸外切酶I酶(EcoExo Ⅰ)的氨基酸序列。
SEQ ID NO:12显示了从大肠杆菌xthA基因衍生的密码子优化的多核苷酸序列。其编码来自大肠杆菌的核酸外切酶III酶。
SEQ ID NO:13显示了来自大肠杆菌的核酸外切酶III酶的氨基酸序列。这种酶在3'-5'的方向对双链DNA(dsDNA)的一条链的5'单磷酸核苷进行分配消化。在链上酶启动需要约4个核苷酸的5'突出。
SEQ ID NO:14显示了由嗜热栖热菌(T.thermophilus)recJ基因衍生的密码子优化的多核苷酸序列。其编码来自嗜热栖热菌的RecJ酶(TthRecJ-cd)。
SEQ ID NO:15显示了来自嗜热栖热菌的RecJ酶(TthRecJ-cd)的氨基酸序列。这种酶在5'-3'的方向对ssDNA的5'单磷酸核苷进行进行性消化。在链上酶启动需要至少4个核苷酸。
SEQ ID NO:16显示了由λ噬菌体(Bacteriophage lambda)exo(redX)基因衍生的密码子优化的多核苷酸序列。其编码λ噬菌体核酸外切酶。
SEQ ID NO:17显示了λ噬菌体核酸外切酶的氨基酸序列。该序列是装配成三聚体的三个相同的亚基之一。该酶在5'-3'方向上对dsDNA的一条链的核苷酸进行高度的进行性消化,(http://www.neb.com/nebecomm/products/productM0262.asp)。在链上酶启动优选需要具有5'磷酸的约为4个核苷酸的5'突出。
SEQ ID NO:18显示了Hel308 Mbu的氨基酸序列。
SEQ ID NO:19显示了Hel308 Csy的Hel308基序。
SEQ ID NO:20显示了Hel308 Tga的氨基酸序列。
SEQ ID NO:21显示了Hel308 Mhu的氨基酸序列。
SEQ ID NO:22显示了Tral Eco的氨基酸序列。
SEQ ID NO:23显示了XPD Mbu的氨基酸序列。
SEQ ID NO:24显示了本发明的MuA底物的双链部分的多核苷酸序列。在实施例1中,这个序列通过其5'末端被连接到链4个C3间隔区单元的一条链的一端。C3间隔区单元的链的相对端被连接到SEQ ID NO:27的3'末端。
SEQ ID NO:25显示了本发明的MuA底物的双链部分的多核苷酸序列。该序列与SEQID NO:24互补,除了其在3'末端含有U。
SEQ ID NO:26显示了本发明的双链MuA底物的突出链的多核苷酸序列。在实施例1该序列具有连接到序列的5'末端的磷酸基团。
SEQ ID NO:27显示了实施例1中使用的多核苷酸序列中的一个。其通过其3'末端被连接到4个C3间隔区单元的一个链的一端。C3间隔区单元的该链的相对端被连接到SEQID NO:24的5'末端。
SEQ ID NO:28显示了实施例1中使用的多核苷酸序列中的一个。
SEQ ID NO:29显示了肠杆菌噬菌体λ的多核苷酸序列。该序列包含连接在模板链的5'末端的额外12个碱基突出部分。所显示的序列仅为模板链的序列。
SEQ ID NO:30显示了实施例2中所用的多核苷酸序列中的一个。
SEQ ID NO:31显示了实施例2中所用的多核苷酸序列中的一个。
SEQ ID NO:32显示了实施例2中所用的多核苷酸序列中的一个。它具有连接到该序列的5'末端的磷酸基团。
SEQ ID NO:33显示了与实施例2中使用的SEQ ID NO:30互补的多核苷酸序列。
SEQ ID NO:34显示了实施例3和实施例4中使用的部分多核苷酸序列。SEQ ID NO:34在其3'末端由4个iSpC3间隔区单元连接至SEQ ID NO:35的5'末端。
SEQ ID NO:35显示了实施例3和实施例4中使用的部分多核苷酸序列。在实施例3和实施例4的Y-形MuA底物中,SEQ ID NO:35在其5'末端由4个iSpC3间隔区单元连接到SEQID NO:34的3'末端。在实施例3的发夹环中,SEQ ID NO:35在其5'末端由4个iSpC3间隔区连接至SEQ ID NO:36的3'末端。在实施例4的发夹形MuA底物中,SEQ ID NO:35在其5'末端由4个iSpC3间隔区连接到SEQ ID NO:41的3'末端。
SEQ ID NO:36显示了实施例3中使用的部分多核苷酸序列。在Y型-MuA底物中,SEQID NO:36在其3'末端由4个iSpC3间隔区单元连接至SEQ ID NO:37的5'末端。在发夹形MuA底物中SEQ ID NO:36在其3'末端由4个iSpC3间隔区连接至SEQ ID NO:35的5'末端。
SEQ ID NO:37显示了在实施例3和4中使用的部分多核苷酸序列。在实施例3中SEQID NO:37在其5'末端由4个iSpC3间隔区单元被连接到SEQ ID NO:36的3'末端。在实施例4中SEQ ID NO:37在其5'末端由4个iSpC3间隔区单元被连接到SEQ ID NO:41的3'末端。
SEQ ID NO:38显示了在实施例3中使用的多核苷酸序列的一部分。
SEQ ID NO:39显示了在实施例3和实施例4中使用的多核苷酸序列,其中在该序列的3'末端具有连接到两个胸腺嘧啶残基的6个iSpl8间隔和3'胆固醇TEG。
SEQ ID NO:40显示了Trwc Cba解旋酶的氨基酸序列。
SEQ ID NO:41显示了在实施例4中使用的多核苷酸序列的部分。在Y-形MuA底物中,SEQ ID NO:41在其3'末端由4个iSpC3间隔区单元连接到SEQ ID NO:37的5'末端。在发夹形MuA底物中,SEQ ID NO:41由4个iSpC3间隔区单元在其3'末端连接到SEQ ID NO:35的5'末端。序列具有连接到其5'末端的磷酸,以及在序列中由I表示处于位置1至5的脱氧肌苷。
具体实施方式
应该理解的是,所公开的产品和方法的不同应用可以适用于本领域中的特定需要。也应理解的是,这里使用的术语仅用于描述本发明的具体实施方案的目的,并且不意于对本发明的限制。
此外,用于本说明书和所附权利要求书中的单数形式“一”,“一个”,和“所述”包括复数对象,除非内容另外明确指出。因此,例如,关于“多核苷酸”包括“多核苷酸”,关于“底物”包括两个或多个所述底物,关于“跨膜蛋白孔”包括两个或多个所述孔等。
所有在此引用的出版物、专利和专利申请,无论在上文或下文,以全文参考的方式引入本文。
本发明的修饰方法
本发明提供了一种修饰模板多核苷酸的方法。该模板可以为任何目的而被修饰。所述方法优选用于修饰模板多核苷酸,用于表征,例如用于链测序。根据本发明,模板多核苷酸通常是最终将被表征或测序的多核苷酸。这在下面更详细地讨论。
所述方法包含多个修饰的双链多核苷酸的形成。这些修饰的双链多核苷酸通常比模板多核苷酸更容易表征,特别是在使用链测序。所述多个修饰的双链多核苷酸其本身可被表征,以便于模板多核苷酸的表征。例如,所述模板多核苷酸的序列可以通过对每个修饰的双链多核苷酸测序而确定。
修饰的双链多核苷酸比模板多核苷酸短,并因此使用链测序更直接的表征它们。
修饰的双链多核苷酸可以通过包括在MuA底物中的标记物选择性标记。合适的标记物包括,但不限于,校准序列,连接部分和适配器结合酶(adaptor bound enzymes)。
在一些实施例中,所述方法将修饰引入到双链多核苷酸中,有助于使用链测序表征。已经被充分证实,将多核苷酸连接到含有纳米孔的膜降低了表征或测序的所需要的几个数量级的多核苷酸的量。这在国际专利申请No.PCT/GB2012/051191(公开为WO 2012/164270)讨论。本发明的方法允许多个双链多核苷酸的制备,每个双链多核苷酸包括用于将多核苷酸连接到膜的装置(means)。这在下面更详细地讨论。
使用纳米孔的双链多核苷酸的表征通常需要设计为优选旋入纳米孔的前导序列的存在。本发明的方法允许多个双链多核苷酸的制备,每个双链多核苷酸包括单链前导序列。这在下面更详细地讨论。
已经被充分证实,通过桥连部分如发夹环将双链多核苷酸的两条链连接,能使得多核苷酸的两条链通过纳米孔被表征或测序。这是有利的,因为能将从单一的双链目标多核苷酸获得的信息的量二倍化。此外,由于在模板互补链中的序列必须正交于模板链的序列,来自两条链的信息可以在信息上(informatically)的组合。因此,这个机制提供了一个正交校对阅读功能,提供更高的可信度。这在国际专利申请No.PCT/GB2012/051786(公开为WO 2013/014451)中讨论。本发明的方法允许多个修饰的双链多核苷酸的制备,其中每个多核苷酸的两条链是使用发夹环相连的。
模板多核苷酸
本发明的方法修饰模板双链多核苷酸,优选用于表征。模板多核苷酸通常是根据本发明将最终被表征或测序的多核苷酸。它也可以被称为目标双链多核苷酸或感兴趣的双链多核苷酸。
多核苷酸如核酸是含有两个或更多个核苷酸的大分子。多核苷酸或核酸可包括任何核苷酸的任意组合。核苷酸可以是天然存在的或人工合成的。模板多核苷酸中的一个或多个核苷酸可以被氧化或甲基化。模板多核苷酸中的一个或多个核苷酸的可被损坏。例如,多核苷酸可包含嘧啶二聚体。此类二聚体通常与紫外线导致的损坏相关联,且是皮肤黑素瘤的首要原因。模板多核苷酸中的一个或多个核苷酸可被修饰,例如用标记物或标签。合适的标记物如下所述。所述模板多核苷酸可包含一个或多个间隔区。
核苷酸通常包含核碱基、糖和至少一个磷酸基团。核碱基和糖形成核苷。
核碱基通常为杂环。核碱基包括但不限于:嘌呤和嘧啶,更具体的腺嘌呤(A),鸟嘌呤(G),胸腺嘧啶(T),尿嘧啶(U)和胞嘧啶(C)。
糖通常为戊糖。核苷酸的糖包括但不限于,核糖和脱氧核糖。所述糖优选是脱氧核糖。
所述模板双链多核苷酸优选包括下列核苷:脱氧腺苷(dA),脱氧尿苷(dU)和/或胸苷(dT),脱氧鸟苷(dG)和脱氧胞苷(dC)。
核苷酸通常是核糖核苷酸和脱氧核糖核苷酸。所述核苷酸优选脱氧核糖核苷酸。核苷酸通常含有单磷酸、二磷酸或三磷酸。磷酸盐可连接在核苷酸的5'或3'侧上。
核苷酸包括但不限于,单磷酸腺苷(AMP),单磷酸鸟苷(GMP),单磷酸胸苷(TMP),单磷酸尿苷(UMP),5-甲基单磷酸胞苷,5-羟甲基胞苷单磷酸,单磷酸胞苷(CMP),环磷酸腺苷(cAMP),环磷酸鸟苷(cGMP),脱氧单磷酸腺苷(dAMP),脱氧单磷酸鸟苷(dGMP),脱氧单磷酸胸苷(dTMP),脱氧单磷酸尿苷(dUMP)和脱氧单磷酸胞苷(dCMP)。所述核苷酸优选选自AMP,TMP,GMP,CMP,UMP,dAMP,dTMP,dGMP,dCMP和dUMP。所述核苷酸最优选自dAMP,dTMP,dGMP,dCMP和dUMP。
模板双链多核苷酸优选包括以下核苷酸:dAMP,dUMP和/或dTMP,dGMP和dCMP。
核苷酸可能是脱碱基(即缺乏碱基)。核苷酸也可能缺乏核碱基和糖(即是C3间隔区)。
模板多核苷酸中的核苷酸可以以任何方式连接彼此。核苷酸通常通过它们的糖和核酸中的磷酸基团连接。所述核苷酸可通过经它们的核碱基连接,如嘧啶二聚体中的。
模板多核苷酸是双链。模板多核苷酸可以含有一些单链区,但至少一部分模板多核苷酸是双链的。
模板多核苷酸可以是核酸,例如脱氧核糖核酸(DNA)或核糖核酸(RNA)。模板多核苷酸可包含杂交到DNA的一条链的RNA链。所述多核苷酸可以是本领域已知的任何合成的核酸,例如肽核酸(PNA),甘油核酸(GNA),苏糖核酸(TNA),锁核酸(LNA),或其它具有核苷酸侧链的合成聚合物。
所述模板多核苷酸能够为任何长度。例如,多核苷酸可以为至少10个,至少50个,至少100,至少150,至少200,至少250,至少300,至少400或至少500个核苷酸对长度。所述多核苷酸可以为1000或更多个核苷酸对,5000或更多个核苷酸对长度或100000或更多个核苷酸对长度。
所述模板多核苷酸通常存在于任何合适的样品中。本发明通常在已知含有或怀疑含有模板多核苷酸的样品上实施。可替换的,可以对样本实施本发明,以确认所识别的一个或多个模板多核苷酸,所述模板多核苷酸已知或预期存在于所述样本中。
所述样品可以是生物样品。本发明可以针对从任何生物体或微生物中获得或提取的样品在体外实施。所述生物体或微生物通常是古核的(archaean),原核的或真核的,并且通常属于以下五界中的一个:植物界,动物界,真菌,原核生物和原生生物。本发明针对从任何病毒中获得或提取的样品在体外实施。所述样品优选是液体样品。样品通常包括患者的体液。所述样品可以是尿液,淋巴液,唾液,粘液或羊水,但优选血液,血浆或血清。通常,所述样品是来源于人的,但可替代地可以是来自其他哺乳动物的,如自商业上养殖的动物如马,牛,绵羊或猪,或者可以是宠物如猫或狗。或者,植物来源的样品通常从商业作物获得,如谷类,豆类,水果或蔬菜,例如小麦,大麦,燕麦,芸苔,玉米,大豆,水稻,香蕉,苹果,番茄,土豆,葡萄,烟草,菜豆,小扁豆,甘蔗,可可,棉花。
所述样品可以是非生物样品。非生物样品优选为液体样品。非生物样品的示例包括外科手术液体,水如饮用水,海水或河水,以及用于实验室测试的试剂。
样品通常在用于本发明前进行处理,例如通过离心或通过膜滤除不需要的分子或细胞,例如红血细胞。可以在获取所述样本后立即进行检测。通常也可以在分析前储存所述样本,优选低于-70℃。
MuA和条件
模板多核苷酸与MuA转座酶接触。在允许转座酶实现功能的条件下例如将模板多核苷酸片段化并将MuA底物连接到片段的一端或两端的条件下,发生接触。MuA转座酶是商业上可获得的,例如从Thermo Scientific(目录编号F-750C,20μL(1.1μg/μL))。MuA转座酶发挥功能的条件是在本领域中公知的。合适的条件在实施例中描述。
底物组
模板多核苷酸与双链MuA底物组接触。双链底物是多核苷酸底物且可以由如上所讨论的任何核苷酸或核酸形成。底物通常由与模板多核苷酸相同的核苷酸形成,不同之处在于通用核苷酸或所述至少一个核苷酸包含模板多核苷酸中不存在的核苷酸。
底物组通常是同质的(即通常含有多个相同的底物)。底物组可以是异质的(即,可以包含多个不同的底物)。
用于MuA转座酶的合适的底物在本领域已知的(Saariaho和Savilahti,NucleicAcids Research,2006;34(10):3139-3149,以及Lee和Harshey,J.Mol.Biol.,2001;314:433-444)。
每个底物通常包括双链部分,该双链部分提供其作为MuA转座酶的底物的活性。每个底物中的所述双链部分通常是相同的。底物组可以包括不同的双链部分。
每个底物中的双链部分通常是长度为至少50个,例如至少55,至少60或至少65个核苷酸对的长度。每个底物的双链部分优选在每条链的3'末端包括含脱氧胞苷(dC)和脱氧腺苷(dA)的二核苷酸。在双链部分的两条链中dC和dA通常是不同方向的,即当从3'到5'读取数据时,在3'末端,一条链具有dC/dA,另一条链具有dA/dC。
双链部分的一条链优选包含在SEQ ID NO:24中所示的序列,而双链部分的另一条链优选包含与SEQ ID NO:24所示的序列互补的序列。
通用核苷酸
在一个实施例中,所述方法包括将模板多聚核苷酸与双链MuA底物组接触,每个底物包含至少一个通用核苷酸突出。每个底物优选包含SEQ ID NO:24所示的序列和与SEQ IDNO:24所示的序列互补的序列杂交的双链部分。所述至少一个突出优选位于与SEQ ID NO:24所示的序列互补的序列的5'末端。
每个底物包括至少一个通用核苷酸突出。突出由通用核苷酸组成。可以在每个底物的一端或两端具有通用核苷酸突出。如果在每个底物的两端有突出,每个突出通常位于双链多核苷酸部分的不同链上。突出优选位于所述双链部分的一条链的5'末端。
每个底物优选仅包括一个突出。仅有的一个突出优选位于双链部分的一条链的5'末端。
突出可以是至少3个,至少4个,至少5个,至少6个或至少7个核苷酸的长度。突出优选为5个核苷酸的长度。
通用核苷酸是与模板多核苷酸中的所有核苷酸都有一定程度杂交的核苷酸。通用核苷酸优选是与包含核苷腺苷(A),胸腺嘧啶(T),尿嘧啶(U),鸟嘌呤(G)和胞嘧啶(C)的核苷酸具有一定程度杂交的核苷酸。通用核苷酸可以更倾向于杂交到某些核苷酸,而不是其他的核苷酸。例如,包括核苷,2'-脱氧肌苷的通用核苷酸(I),显示出I-C>I-A>I-G约为=I-T的配对的优先顺序。为了本发明的目的,仅需要将在低聚物中使用的通用核苷酸能与模板多核苷酸中的所有核苷酸杂交。
通用核苷酸优选地包括以下核碱基中的一个:次黄嘌呤,4-硝基吲哚,5-硝基吲哚,6-硝基吲哚,3-硝基吡咯,硝基咪唑,4-硝基吡唑,4-硝基苯咪唑,5-硝基吲唑,4-氨基苯并咪唑或苯基(C6-芳香环。通用核苷酸更优选包括下列核苷之一:2'-脱氧肌苷,肌苷,7-脱氮-2'-脱氧肌苷,7-脱氮-肌苷,2-氮杂-脱氧肌苷,2-氮杂-肌苷,4-硝基吲哚2'-脱氧核糖核苷,4-硝基吲哚核糖核苷,5-硝基吲哚2'-脱氧核糖核苷,5-硝基吲哚核糖核苷,6-硝基吲哚2'-脱氧核糖核苷,6-硝基吲哚核糖核苷,3-硝基吡咯2'-脱氧核糖核苷,3-硝基吡咯核糖核苷,次黄嘌呤的无环糖类似物,硝基咪唑2'-脱氧核糖核苷,硝基咪唑核糖核苷,4-硝基吡唑2'-脱氧核糖核苷,4-硝基吡唑核糖核苷,4-硝基苯咪唑2'-脱氧核糖核苷,4-硝基苯咪唑核糖核苷,5-硝基吲唑2'-脱氧核糖核苷,5-硝基吲唑核糖核苷,4-氨基苯并咪唑2'-脱氧核糖核苷,4-氨基苯并咪唑核糖核苷,苯基C-核糖核苷或苯基C-2'-脱氧核糖核苷。通用核苷酸是最优选包括2'-脱氧肌苷。
每个突出中的通用核苷酸可以是彼此不同的。每个突出中的通用核苷酸是优选相同的。底物组中的所有通用核苷酸优选是相同的通用核苷酸。
本发明的方法优选包括
(a)将模板多核苷酸与MuA转座酶和双链MuA底物组接触,每个所述底物含有至少一个通用核苷酸突出,使得所述转座酶将所述模板多核苷酸片段化为核苷酸片段,所述核苷酸片段在一端或两端具有突出,并将没有突出的底物链连接到该双链片段的一端或两端的突出上,并由此制备多个片段/底物构建体;
(b)使底物突出与构建体中所述片段突出杂交;以及
(b)将底物突出连接到构建体中相邻的片段的链上,并由此制备多个修饰的双链多核苷酸。
通用核苷酸突出还可以进一步包含反应性基团,优选位于5'末端。反应性基团可用于将突出连接到构建体中的片段,如下文所述。反应性基团可用于使用点击化学(clickchemistry)将片段连接到突出。点击化学是最早由科尔布等人于2001年提出的术语,用来描述能在小型应用和大型应用中可靠工作的不断扩展的强大的,选择性的,模块化的区块(Kolb HC,Finn,MG,Sharpless KB,Click chemistry:diverse chemical function froma few good reactions,Angew.Chem.Int.Ed.40(2001)2004–2021)。他们已经为点击化学定义了一套严格的标准如下:“该反应必须是模块化的,宽的范围,得到非常高的产率,仅生成可通过非色谱方法除去的无害的副产物,并为立体定向的(但不必须为对映选择性)。所需的方法的特征包括简单的反应条件(理想情况下,这个方法应该是对氧气和水不敏感的),容易获得的起始材料和试剂,不使用溶剂或使用良性溶剂(例如水)或容易除去的溶剂,且简单的产物分离。如果需要纯化,必须是由非色谱方法如结晶或蒸馏纯化,而产物必须是在生理条件下稳定的。
点击化学的合适的实例包括,但不限于以下内容:
(a)1,3-偶极环加成反应的无铜变体,其中例如在环辛烷环中,叠氮化物在应力的条件下与炔反应;
(b)在一个连接物上的氧亲核试剂与在另一个连接物上的环氧化物或氮丙啶反应性部分进行反应;以及
(c)Staudinger连接,其中炔部分可以由芳基膦所取代,从而产生与叠氮化物的特定反应以得到酰胺键。
任何反应性基团可在本发明中使用。反应性基团可以是适合于点击化学的一种反应性基团。反应性基团可以是在国际专利申请No.PCT/GB 10/000132(公开为WO 2010/086602)中公开反应性基团,特别是该申请中表3中的反应性基团中的任一个。
在进一步的实施例中,修饰方法使用MuA转座酶和双链MuA底物组,每个底物包括含反应性基团的至少一个突出。突出可以是任何长度且可以包括任何核苷酸的任何组合。合适的长度和核苷酸如上文所公开的。合适的反应性基团如上文讨论的。因此,本发明提供了修饰模板双链多核苷酸的方法,包括:
(a)将模板多核苷酸与MuA转座酶和双链MuA底物组接触,每个所述底物包括含反应性基团的至少一个突出,使得所述转座酶将所述模板多核苷酸片段化并将底物连接到双链片段的一端或两端,并由此制备多个片段/底物构建体;以及
(b)将所述突出使用反应性基团连接到所述构建体中的所述片段,并由此制备多个修饰的双链多核苷酸。
在模板多核苷酸中不存在的核苷
在一个实施例中,所述方法包括将模板多核苷酸与双链MuA底物组接触,每个所述底物包含(i)至少一个突出以及(ii)与所述至少一个突出在相同的链中的至少一个核苷酸,所述至少一个核苷酸包含在所述模板多核苷酸中不存在的核苷。
如上述讨论的,每个底物的双链部分优选在每条链的3'末端包括含脱氧胞苷(dC)和脱氧腺苷(dA)的二核苷酸。在一些实施例中,一条链的dC和dA二核苷酸中的一个或两个核苷酸可以被替换为如下文讨论的核苷酸,该核苷酸包括在模板多核苷酸中不存在的核苷。在优选的实施例中,模板多核苷酸包括脱氧腺苷(dA),胸苷(dT),脱氧鸟苷(dG)和脱氧胞苷(dC),而不包括脱氧尿苷(dU)并且一条链的dC和dA二核苷酸中的dA被替换为含脱氧尿苷(dU)的核苷酸。这将在下面举例说明。
所述双链部分的一条链优选包含SEQ ID NO:24所示的序列,且双链部分的另一条链优选包含与SEQ ID NO:24所示的序列互补的序列且其被修饰为包括在模板多核苷酸中不存在的至少一个核苷酸。所述“另一条链”还包括突出。在进一步优选的实施例中,双链部分的一条链包含SEQ ID NO:24所示的序列,且双链部分的另一条链包含SEQ ID NO:25(见下文)所示的序列。在SEQ ID NO:25中,在其3'末端的dC和dA二核苷酸中的dA已被替换为dU。这种双链部分(如下所示)可以在模板多核苷酸包含脱氧腺苷(dA),胸苷(dT),脱氧鸟苷(dG)和脱氧胞苷(dC),而不包含脱氧尿苷(dU)时使用。
5'-GTTTTCGCATTTATCGTGAAACGCTTTCGCGTTTTTCGTGCGCCGCTTCA-3'(SEQ 24)
3'-CAAAAGCGTAAATAGCACTTTGCGAAAGCGCAAAAAGCACGCGGCGAAGU-5'(SEQ 25)
每个底物包括至少一个突出。所述突出通常是核苷酸突出。可以在每个底物的一端或两端有突出。如果在底物的两端有突出,每个突出通常是在双链多核苷酸部分的不同链上且每条链通常包括在模板多核苷酸中不存在的核苷。突出优选位于双链部分的一条链的5'末端。
每个底物优选仅包括一个突出。唯一的突出优选位于双链部分的一条链的5'末端。这将在下面举例说明。
突出可以是至少3个,至少4个,至少5个,至少6个或至少7个核苷酸的长度。突出优选为4个核苷酸长度。突出可以包括上面讨论的任何核苷酸。
每个底物包括与突出在相同的链中的至少一个核苷酸,所述核苷酸包含在模板多核苷酸中不存在的核苷。所述核苷酸可如上所述存在于的底物的一条或两条链中。每个底物可以任何数目的核苷酸,例如2,3,4,5,6,7,8,9,10个或更多的核苷酸,所述核苷酸包括在模板多核苷酸中不存在的核苷。如果底物包括多过一个不存在于模板多核苷酸中的核苷酸,这些核苷酸通常是相同的,但也是可以不同的。
如果模板多核苷酸包含脱氧腺苷(dA),胸苷(dT),脱氧鸟苷(dG)和脱氧胞苷(dC)而不包含脱氧尿苷(dU),不存在在模板多核苷酸的核苷优选为脱氧尿苷(dU)。
在优选的实施例中,双链部分的一条链包含如SEQ ID NO:24所示的序列,且双链部分的另一条链包含如SEQ ID NO:25(见上文)所示的序列。SEQ ID NO:25中,位于3'末端的dC和dA二核苷酸中的dA已被替换为dU。突出是位于SEQ ID NO:25的5'末端,即连接到U。
在最优选的实施方案中,底物的一条链包含与SEQ ID NO:24所示的序列,且底物的另一条链包含如SEQ ID NO:26(见下文)所示的序列。所述底物(如下所示)可以在模板多核苷酸包含脱氧腺苷(dA),胸苷(dT),脱氧鸟苷(dG)和脱氧胞苷(dC),而不包含脱氧尿苷(dU)时使用。
5'-GTTTTCGCATTTATCGTGAAACGCTTTCGCGTTTTTCGTGCGCCGCTTCA-3'(SEQ 24)
3'-CAAAAGCGTAAATAGCACTTTGCGAAAGCGCAAAAAGCACGCGGCGAAGUCTAG-5'(SEQ 2 6)
如果模板多核苷酸包含脱氧腺苷(dA),脱氧尿苷(dU),脱氧鸟苷(dG)和脱氧胞苷(dC)而不是胸苷(dT),不存在于模板多核苷酸中的核苷优选为胸苷(dT)。
在所述模板多核苷酸中不存在的核苷优选是脱碱基的腺苷(A),尿苷(U),5-甲基尿苷(M5U),胞苷(C)或鸟嘌呤(G)或优选包括尿素,5,6-二羟基胸苷,胸腺嘧啶二醇,5-羟基-5-甲基乙内酰脲,尿嘧啶二醇,6-羟-5,6-二氢硫胺(dihdrothimine),甲基羟丙二酰脲,7,8-二氢-8-氧鸟嘌呤(8-鸟嘌呤),8–氧代腺嘌呤,fapy-鸟嘌呤,甲基-fapy-鸟嘌呤,fapy-腺嘌呤,黄曲霉毒素B1-fapy鸟嘌呤,5-羟基胞嘧啶,5-羟基尿嘧啶,3-甲基腺嘌呤,7-甲基鸟嘌呤,1,N6-亚乙烯基腺苷,次黄嘌呤,5-羟基尿嘧啶,5-羟甲基尿嘧啶,5-甲酰基尿嘧啶或顺式-顺式-环丁烷嘧啶二聚体。
所述至少一个核苷酸优选距离所述突出的10个或更少的核苷酸,例如9,8,7,6,5,4,3,2,1或0个核苷酸。换言之,所述至少一个核苷酸是优选位于下面的实施例中的位置A至K中的任何一个。所述至少一个核苷酸优选距离所述突出0个核苷酸(即与突出相邻)。换言之,所述至少一个核苷酸优选位于在下面的实施例的位置K。
ABCDE FGHI JKXXXX
XXXXXXXXXXX
所述至少一个核苷酸可以是在突出中的第一个核苷酸。换言之,所述至少一个核苷酸可以是位于下面的实施例的位置A。
XXXXXXXXXXAXXX
XXXXXXXXXX
在突出中的所有核苷酸可以包括在模板多核苷酸中不存在的核苷。本领域技术人员能够设计合适的底物。
本发明的方法优选包括
(a)将模板多核苷酸与MuA转座酶和双链MuA底物组接触,每个所述底物包含(i)至少一个突出以及(ii)与所述至少一个突出在相同的链中的至少一个核苷酸,所述至少一个核苷酸包含在所述模板多核苷酸中不存在的核苷,使得所述转座酶将所述模板多核苷酸片段化为多核苷酸片段,所述多核苷酸片段在其一端或两端具有突出,并将没有突出的底物链连接到双链片段的一端或两端,并由此制备多个片段/底物构建体;
(b)通过选择性地除去所述至少一个核苷酸将所述突出从所述构建体中除去,并由此制备多个包含单链缺口的双链构建体;以及
(c)修复在所述构建体中所述单链缺口,并由此制备多个修饰的双链多核苷酸。
优选的底物
在优选的实施例中,每个底物包括位于一端的突出和位于另一端前导序列和/或用于连接到膜的装置。如果底物包括前导序列和连接装置,每个通常位于双链部分的不同的链。这导致产生多个包含前导序列和/或用于连接装置的修饰的双链多核苷酸。这样的多核苷酸具有的优点如上所述。
前导序列通常是多核苷酸,如DNA或RNA,修饰的核苷酸(如脱碱基的DNA),PNA,LNA,PEG或多肽。前导优选多核苷酸,更优选单链多核苷酸。前导序列可以是上面讨论的任何多核苷酸。单链前导序列最优选是单链DNA。前导序列通常包括在模板多核苷酸存在的核苷酸。前导序列通常不包括这样的核苷,其的选择性除去是用于除去与本发明相关的突出。前导序列可以是任意长度,但通常在27至150个核苷酸长度,例如50至150个核苷酸长度。
用于将所述修饰的双链多核苷酸连接到膜的装置在下文中更详细的讨论。
每个底物优选包括位于一端的突出和位于另一端的发夹环。这导致在步骤(c)中修饰的多个双链多核苷酸的产生,其由位于一端或两端发夹环连接。这样例子示于图2、图7、图9和14中。本领域技术人员中是能够使用上面讨论的任何核苷酸制备发夹环。发夹环通常包含模板多核苷酸中相同的核苷酸。发夹环通常不包括这样的核苷,其的选择性除去是用于除去与本发明相关的突出。
或者,每个底物优选为一端具有突出并且另一端具有非互补区域的Y底物。与双链部分不同由于两条链而通常彼此不杂交,在非互补区域给予底物Y型。Y底物的使用导致在步骤(c)中的产生修饰的双链多核苷酸,其具有位于一端或两端的非互补区域。这样的例子示于图3和10中。如上所述,非互补区域可包括如上所述的在一条链中的前导序列和在另一条链中的连接装置。
或者,在优选的实施例中,一定比例的底物组中的底物具有位于一端的突出和位于另一端的发夹环,一定比例的底物组中的底物为一端具有突出且另一端具有非互补区域的Y底物。这导致至少一部分在步骤(c)中产生的修饰的双链多核苷酸具有位于一端的发夹环和位于另一端的非互补区。这种情况的例子示于图5和图12中。
或者,在优选的实施例中,一定比例的底物组中的底物具有位于一端的突出和位于另一端的发夹环,且一定比例的底物组中的底物具有位于一端的突出和位于另一端的前导序列或连接装置。这导致至少一部分在步骤(c)中产生的修饰的双链多核苷酸具有位于一端的发夹环和位于另一端的前导序列或连接装置。这种情况的例子示于图6和图13中(其中前导序列显示为不连续的波浪线)。
在最优选的实施例中,一定比例的底物组中的底物包括位于一端的突出和位于另一端的发夹环,且一定比例的底物组中的底物包含位于一端的突出和位于另一端的前导序列和连接装置。这导致至少一部分在步骤(c)中产生的修饰的双链多核苷酸具有位于一端的发夹环和位于另一端的前导序列和连接装置。这些修饰的双链多核苷酸对于表征是特别有用的,因为它们可以被连接到其中具有纳米孔的膜上,并具有促进多核苷酸旋进纳米孔的前导序列且两条链可以绕发夹环被表征。
在所有上述实施例中,一种类型的底物的比例可以是任意比例的,例如至少约5%,至少约10%,至少约20%,至少约30%,至少约40%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%或至少约95%。底物组中的剩余底物的比例通常是其他类型的底物。例如,该底物组可以包括约40%的含发夹环的底物和约60%的Y底物。这两种类型的底物的比例优选为约50%。
每个底物可以包括选择性结合部分。选择性结合部分是可以基于其结合特性被选择的部分。因此,选择性结合部分优选特异性地结合到表面的部分。如果一个选择性结合部分以比本发明中使用的任何其他部分更高的程度结合到所述表面,则该选择性结合部分特异性地结合到该表面上。在优选的实施例中,所述部分结合到本发明中使用的其他部分不结合的表面。
合适的选择性结合部分是本领域已知的。优选的选择性结合部分包括,但不限于,生物素,核酸序列,抗体,抗体片段,如Fab和ScSv,抗原,核酸结合蛋白质,聚组氨酸尾部和GST标签。最优选的选择性结合部分是生物素和选择性核酸序列。生物素特异性地结合到涂覆有抗生物素蛋白的表面上。选择性核酸序列特异性结合(即,杂交)到涂覆有同源序列的表面上。可替代地,选择性核酸序列特异性结合到涂覆有核酸结合蛋白的表面上。
连接突出
在那些实施例中,其中MuA底物包括通用核苷酸突出,方法包括将突出连接到构建体中的片段。这可以使用本领域已知的连接核苷酸的任何方法来完成。例如,它可以使用连接酶例如DNA连接酶来完成。可替代地,如果突出包括反应性基团,反应性基团可用于将突出连接到构建体中的片段。例如,包含互补反应性基团的核苷酸可以被连接到片段,且两个反应性基团可以一起反应以将突出连接到片段。可使用如上所讨论的点击化学。
选择性除去
用于从连接的构建体中选择性除去含有在模板多核苷酸中不存在的核苷的核苷酸的方法在本领域中是已知的。如果从连接的构建体除去(切除)这些核苷酸,而在连接的构建体中的其他核苷酸(即那些含有不同核苷的核苷酸)不被除去(切除),这些核苷酸是被选择性除去的。
包含脱氧尿苷(dU)的核苷酸可以使用尿嘧啶-特异性切除试剂
Figure BDA0002371324040000171
选择性地除去,所述试剂是尿嘧啶DNA糖基化酶(UDG)和DNA糖基化酶-裂解酶核酸内切酶VIII的混合物。
如图中所示,从连接的构建体中选择性除去包含在模板多核苷酸中不存在的核苷的核苷酸,将突出从构建体除去。如图8至图14中所示,除去突出产生多个含单链缺口的双链构建体。
修复缺口
在双链构建体中修复单链缺口的方法是本领域已知的。例如,可以使用聚合酶和连接酶,如DNA聚合酶和DNA连接酶修复缺口。可替代地,缺口可以使用含有足够长度的随机的寡核苷酸和连接酶修复。
分离发夹环
如上所讨论的,本发明的方法可产生多个修饰的双链多核苷酸,其链由位于一端的发夹环连接。在这种实施方式中,该方法优选还包括(d)分离至少一个修饰的双链多核苷酸的两条链,以产生至少一条单链多核苷酸,其包含被连接到修饰的双链多核苷酸的另一条链的该修饰的双链多核苷酸的一条链。两条链可以以任何方式被分离。两条链优选与如下文所讨论通过将修饰的双链多核苷酸与结合蛋白接触被分离。
本发明的产物
本发明还提供用于修饰模板多核苷酸的双链MuA底物组,其中每个底物包括至少一个通用核苷酸突出。本发明还提供用于修饰模板多核苷酸的双链MuA底物组,其中每个底物包括:(i)至少一个突出和(ii)与所述至少一个突出在相同的链的至少一个核苷酸,其含有在模板多核苷酸中不存在的核苷。底物可以是如上所描述的任何一个。底物优选包含如上所定义的双链部分。双链部分优选包含如上所述的SEQ ID NO:24和SEQ ID NO:25。双链部分更优选包含如上所述的SEQ ID NO:24和SEQ ID NO:26。本发明的优选的底物组是那些其中:
-每个底物包含位于一端的突出和位于另一端的发夹环;
-每个底物优选为一端具有突出和另一端具有非互补区域的Y底物;
-一定比例的底物组中的底物具有位于一端的突出和位于另一端的发夹环,并且一定比例的底物组中的底物为一端具有突出且另一端具有非互补区域的Y底物;
-一定比例的底物组中的底物具有位于一端的突出和位于另一端的发夹环,并且且一定比例的底物组中的底物具有位于一端的突出和位于另一端的前导序列或连接装置;以及
-一定比例的底物组中的底物包括位于一端的突出和位于另一端的发夹环,并且且一定比例的底物组中的底物包含位于一端的突出和位于另一端的前导序列和连接装置。
本发明的方法中给出的上述比例值也同样适用于本发明的底物组。
本发明还提供多个使用本发明的方法修饰的多核苷酸。所述多个多核苷酸可以是上面讨论的任何形式。优选的多个是那些包含:
-由位于一端或两端的发夹环连接的双链多核苷酸;
-具有位于一端或两端的非互补区域的双链多核苷酸;
-具有位于一端的发夹环以及位于另一端的非互补区域的双链多核苷酸。
-具有位于一端的发夹环以及位于另一端的前导序列或连接装置的双链多核苷酸;
-具有位于一端的发夹环以及位于另一端的前导序列和连接装置的双链多核苷酸。
所述底物组或所述多个底物可以被分离,基本分离,纯化或基本纯化。如果底物组或多个底物完全不含任何其他组分例如模板多核苷酸,脂质或孔,可以被分离或纯化。如果底物组或多个底物与不干扰其预期用途的载体或稀释剂混合,则被基本分离。例如,如果底物组或多个底物以含有小于10%,小于5%,小于2%或小于1%的其他组分,如脂类或孔,的形式存在,则被基本分离或基本纯化。
本发明的表征方法
本发明还提供表征使用本发明的方法修饰的至少一种多核苷酸的方法。方法包括(a)将修饰的多核苷酸与跨膜孔接触,使得多核苷酸的至少一条链穿过孔移动。方法还包括(b)随着至少一条链相对于孔的移动,获取一个或多个测量值,其中所述测量值代表所述修饰的多核苷酸的至少一条链的一个或多个特征,并由此表征所述修饰的多核苷酸。如果修饰的多核苷酸包含发夹环,方法优选包括:(a)将修饰的多核苷酸与跨膜孔接触,使得所述多核苷酸的两条链移动穿过所述孔以及(b)随着两条链相对于所述孔移动,获取一个或多个测量值,其中所述测量值代表所述修饰的多核苷酸的两条链的一个或多个特征,并由此表征所述修饰的多核苷酸。
所述方法优选在具有跨孔施加的电势下实施。所施加的电势可以是电压电势。可替代地,所施加的电势可以是化学势。这方面的例子是横两亲性层使用盐梯度。盐梯度在Holden et al.,J Am Chem Soc.2007Jul 11;129(27):8650-5中公开。在一些情况下,随着多核苷酸相对于孔移动电流流经孔被用于确定修饰的多核苷酸的序列。这是链测序。
本发明还提供表征模板多核苷酸的方法。在步骤(a)中,模板多核苷酸是使用本发明的方法被修饰的。方法随后包括(b)将每个修饰的多核苷酸与跨膜孔接触,使得每个多核苷酸的至少一条链移动穿过所述孔。方法还包括(c)随着每个多核苷酸的至少一条链相对于孔移动,获取一个或多个测量值,其中所述测量值代表每个多核苷酸的至少一条链的一个或多个特征,并由此表征所述模板多核苷酸。如果修饰的多核苷酸包含发夹环,该方法优选包括(b)将每个修饰的多核苷酸与跨膜孔接触,使得每个多核苷酸的两条链移动穿过所述孔,且(c)随着每个多核苷酸的两条链相对于孔移动,获取一个或多个测量值,其中所述测量值代表所述每个多核苷酸的两条链的一个或多个特征,并由此表征所述模板多核苷酸。
步骤(b)和(c)优选在如上所述的具有跨膜施加的电势的情况下实施。在一些情况下,随着每个多核苷酸的至少一条链相对于所述孔移动电流穿过孔被用于确定每个修饰的多核苷酸的序列。这是链测序。模板多核苷酸的序列可以随后被重建。具体地,该方法优选进一步包括d)对多个修饰的多核苷酸的序列进行比对,以产生所述模板多核苷酸的序列,并由此对模板多核苷酸进行测序。合适的方法在Baker,M.,Nature Methods,2012,9,4,333-337和Flicek,P.and Birney E.,Nature Methods Supplement,2009,6,11,S6-S12中公开。
全部或仅部分修饰的多核苷酸或模板多核苷酸使用该方法进行表征例如测序。模板多核苷酸的长度如上所讨论。
跨膜孔是一定程度跨越膜的结构。它允许通过施加的电势驱动水合离子使其跨膜流动或在膜内流动。跨膜孔通常跨越整个膜以使得水合离子可以从膜的一侧流动到所述膜的另一侧。然而,跨膜孔不是必须跨越膜。其可以在一端封闭。例如,孔可以是膜中的井,水合离子可以沿着其流动或流入。
本发明可使用任何跨膜孔。该孔可以是生物的或人造的。合适的孔包括但不限于,蛋白质孔,多核苷酸孔和固态孔。
根据本发明可使用任何膜。合适的膜是现有技术中已知的。该膜优选为两性分子层。两性分子层是一种由具有至少一个亲水性部分和至少一个亲脂性或疏水性部分的两性分子诸如磷脂质形成的层。两性分子可以是单层或双层。两性分子可以是合成的或天然存在的。非天然存在的两亲物质和形成单分子层的两亲物质是本领域已知的,并且包括嵌段共聚物(Gonzalez-Perez et al.,Langmuir,2009,25,10447-10450)。嵌段共聚物是其中两个或多个单体亚单元聚合在一起而形成单一聚合物链的聚合物材料。嵌段共聚物具有的性质通常由每个单体亚单元贡献。然而,嵌段共聚物可具有从各亚单元形成的聚合物不具备的独特的性质。嵌段共聚物可以被改造,使得该单体亚单元之一是疏水性的(即亲脂性),而其它亚单元在水介质中是亲水性的。在这种情况下,该嵌段共聚物可具有两亲特性,并且可以形成模仿生物膜的结构。嵌段共聚物可以是二嵌段共聚物(由两个单体亚单元组成),但也可以由两个以上的单体亚单元构成,以形成相当于两亲物质的更复杂的结构。所述共聚物可以为三嵌段,四嵌段或五嵌段共聚物。
两性分子层通常为平面脂质双分子层或支撑双层。
两性分子层通常是脂质双分子层。脂质双分子层为细胞膜的模型,且作为一系列实验研究的优秀的平台。例如,脂质双分子层可通过单通道记录器用于膜蛋白的体外研究。或者,脂质双分子层可作为生物传感器来检测一系列物质的存在。脂质双分子层可以为任何脂质双分子层。合适的脂质双分子层包括但不限于,平面脂质双分子层,支撑双层或脂质体。脂质双分子层优选为平面脂质双分子层。合适的脂质双分子层在国际申请No.PCT/GB08/000563(公开为WO 2008/102121),国际申请No.PCT/GB08/004127(公开为WO 2009/077734)和国际申请No.PCT/GB2006/001057(公开为WO 2006/100484)中公开。
用于形成脂质双分子层的方法是本领域已知的。在实施例中公开了合适的方法。脂质双分子层通常由Montal和Mueller的方法形成(Proc.Natl.Acad.Sci.USA.,1972;69:3561-3566),其中的脂质单分子层在穿过孔的任一侧负载在水溶液/空气界面上,所述孔垂直于所述界面。
Montal和Mueller的方法非常受欢迎,因为其成本经济并是一种相对迅速的形成具有良好质量的适合蛋白质孔嵌入的脂质双分子层的方法。形成脂质双分子层的其它常规方法包括尖浸渍(tip dipping),涂覆双分子层(painting bilayers)和膜片钳。
在优选的实施例中,形成脂质双分子层如国际申请No.PCT/GB08/004127(公开为WO 2009/077734)中所描述。
在另一个优选的实施方案中,膜是固态层。固态层不是生物来源的。换句话说,固态层不是由生物环境获得或分离出的,所述生物环境例如生物体或细胞,或生物学上可获得结构的合成制造形式。固态层可以由有机材料和无机材料形成,包括但不限于,微电子材料,绝缘材料,例如Si3N4,Al2O3和SiO,有机和无机聚合物如聚酰胺,塑料如特氟隆
Figure BDA0002371324040000201
或弹性体如双组分加成固化硅橡胶,以及玻璃。固态层可由单原子层例如石墨烯,或只有几个原子厚度的层形成。合适的石墨层在国际申请No.PCT/US2008/010637(公开为WO 2009/035647)中公开。
实施该方法通常利用(i)包含孔的人工两性分子层;(ii)分离的,天然存在的包含孔的脂质双分子层,或(iii)含有孔嵌入其中的细胞。该方法通常使用人工两性分子层,如人工脂质双分子层实施。除了孔,该分子层可包含其他跨膜和/或膜内蛋白以及其他分子。合适的设备和条件在下面讨论。本发明的方法通常在体外实施。
修饰的多核苷酸可以连接到膜上。这可以使用任何已知的方法来完成。如果膜是两性分子层,如脂质双分子层(如在上面详细讨论的),所述修饰的多核苷酸优选通过在所述膜中存在的多肽或通过在所述膜中存在的疏水锚被连接到该膜上。疏水锚优选脂质,脂肪酸,甾醇,碳纳米管或氨基酸。
修饰的多核苷酸可以直接连接到膜上。修饰的多核苷酸优选通过连接体(linker)连接到膜上。优选的连接体包括但不限于,聚合物,如多核苷酸,聚二醇(PEGs)和多肽。如果修饰的多核苷酸直接连接到所述膜,由于该膜和所述孔之间的距离,导致表征不能进行到所述多核苷酸的末端,则将丢失一些数据。如果使用连接体,则多核苷酸能够被表征完全。如果使用连接体时,可将连接体连接到所述多核苷酸的任何位置。连接体优选连接到所述多核苷酸的尾部聚合物处。
该连接可以是稳定的或暂时的。对于某些应用,该连接的暂时性的性质是是优选的。如果稳定的连接分子直接地连接到多核苷酸的5'末端或3'末端,则由于该双层和孔之间的距离,表征不能进行到多核苷酸的末端,则将会导致数据的丢失。如果连接是暂时性的,那么当连接的末端随机变成没有双层时,则多核苷酸能被表征完全。与膜形成稳定的或暂时性的连接的化学基团将在下文进行更详细的讨论。所述修饰的多核苷酸可以例如使用胆固醇或脂酰基链的脂质双分子层,暂时性的连接到两性分子层。可以使用任何具有6至30个碳原子长度的脂酰基链,例如棕榈酸。
在优选的实施例中,修饰的多核苷酸连接到两性分子层。将多核苷酸连接到合成的脂质双分子层之前已用各种不同的连接策略(tethering strategies)实施。这些策略总结于下方表1中。
表1
Figure BDA0002371324040000211
多核苷酸可以使用修饰的亚磷酰胺在合成反应中官能化,其更容易与添加的反应性基团如硫醇,胆固醇,脂质和生物素基团并存。这些不同的连接化学给予多核苷酸一系列连接选择。每个不同的修饰基团以稍微不同的方式连接到所述多核苷酸且连接并非总是持久的,所以给予多核苷酸到双层的不同的停留时间。暂时性连接的优点如上所述。
多核苷酸的连接也可以通过若干将反应性基团添加到所述多核苷酸的其他手段来实现。将反应性基团添加到DNA任一端之前已经被报道。硫醇基团可以使用多核苷酸激酶和ATPγS被添加到ssDNA的5'末端(Grant,G.P.and P.Z.Qin(2007)."A facile methodfor attaching nitroxide spin labels at the 5'terminus of nucleic acids."Nucleic Acids Res 35(10):e77)。可使用末端转移酶添加更多选择的化学基团,例如生物素,硫醇和荧光团,以将修饰的寡核苷酸结合到ssDNA的3'末端(Kumar,A.,P.Tchen,et al.(1988)."Nonradioactive labeling of synthetic oligonucleotide probes withterminal deoxynucleotidyl transferase."Anal Biochem 169(2):376-82)。
或者,反应性基团可以被认为是DNA互补短片段,其被添加到一个已经连接到双层的DNA上,使得连接可以通过杂交来实现。使用T4 RNA连接酶I进行短片段ssDNA连接已经被报道(Troutt,A.B.,M.G.McHeyzer-Williams,et al.(1992)."Ligation-anchored PCR:asimple amplification technique with single-sided specificity."Proc Natl AcadSci U S A 89(20):9823-5)。可替代地,ssDNA或dsDNA可被连接到天然(native)dsDNA上,然后通过热变性或化学变性将两条链分离。对于天然dsDNA,可以将ssDNA的一段添加到双链的一端或二端,或可以将dsDNA添加到双链的一端或二端。然后,当双链被变性时,如果ssDNA被用于连接,则每个单链将具有5'修饰或3'修饰,如果dsDNA被用于连接,则每个单链将具有5'修饰,3'修饰,或其组合。如果多核苷酸是人工合成的链,在多核苷酸的化学合成的过程中可以引入偶联化学基团。例如,多核苷酸可以使用具有反应性基团连接到其的引物来合成。
用于基因组DNA的区段扩增的常用技术是使用聚合酶链反应(PCR)。此处,使用两个合成的寡核苷酸引物,可以产生相同DNA区段的许多拷贝,其中对于每个拷贝,在双链中的每条链的5'将是合成的多核苷酸。通过使用具有反应性基团如胆固醇,硫醇,生物素或脂质的反向引物,扩增的目标DNA的每个拷贝将包含用于连接的反应性基团。
跨膜孔优选跨膜蛋白孔。跨膜蛋白孔是多肽或允许水合离子例如分析物从膜的一侧流动到膜的另一侧的一系列多肽。在本发明中,跨膜蛋白孔能够形成允许通过施加的电势驱动的水合离子流从所述膜的一侧流动到另一侧的孔。跨膜蛋白孔优选允许分析物如核苷酸从膜如脂质双分子层的一侧流动到膜的另一侧。跨膜蛋白孔允许多核苷酸,如DNA或RNA,被移动穿过孔。
跨膜蛋白孔可以为单体或低聚物。所述孔优选由数个重复亚基,如6个,7个,8个或9个亚基组成。所述孔优选为六聚体,七聚体,八聚体或九聚体。
跨膜蛋白孔通常包括离子可以流动的桶状体或通道。孔的亚基通常围绕中心轴线并向跨膜β桶状体或通道或跨膜α螺旋束或通道提供链(strands)。
跨膜蛋白孔的桶状体或通道通常包括促进与分析物相互作用的氨基酸,所述分析物如核苷酸,多核苷酸或核酸。这些氨基酸优选位于所述桶状体或通道的缢痕附近。跨膜蛋白孔通常包括一个或多个带正电荷的氨基酸,例如精氨酸,赖氨酸或组氨酸,或芳香族氨基酸如酪氨酸或色氨酸。这些氨基酸通常促进孔与核苷酸,多核苷酸或核酸之间的相互作用。
根据本法明使用的跨膜蛋白孔可以衍生自β-桶状孔或α-螺旋束孔。β-桶状孔包括由β-链形成的桶状体或通道。合适的β-桶状孔包括但不限于,β-毒素例如溶血素,炭疽毒素和杀白细胞素,以及细菌的外膜蛋白/孔蛋白例如耻垢分枝杆菌(Mycobacteriumsmegmatis)孔蛋白(MSP),例如MspA,MspB,MspC或MspD,外膜孔蛋白F(OmpF),外膜孔蛋白G(OmpG),外膜磷脂酶A和奈瑟氏菌(Neisseria)自转运脂蛋白(NalP)。α-螺旋束孔包括由α-螺旋形成的桶状物或通道。合适的α-螺旋束孔包括但不限于,内膜蛋白和α外膜蛋白,例如WZA和ClyA毒素。跨膜孔可衍生自Msp或衍生自α-溶血素(α-HL)。
跨膜蛋白孔优选衍生自Msp,优选衍生自MspA。该孔为低聚的且通常包含衍生自Msp的7个,8个,9个或10个单体。孔可以是衍生自含相同单体的MsP的同源寡聚孔。或者,孔可以是衍生自含至少一个不同于其他的单体的Msp的异源寡聚孔。优选地,孔衍生自MspA或其同源物或并系同源物(paralog)。
衍生自Msp的单体通常包含如SEQ ID NO:2或其变体的序列。SEQ ID NO:2为MspA单体的MS-(B1)8突变体。其包括以下突变:D90N,D91N,D93N,D118R,D134R和E139K。SEQ IDNO:2的变体是具有从SEQ ID NO:2变化而来的氨基酸序列且保留了其形成孔的能力的多肽。可以使用本领域已知的任何方法测定变体形成孔的能力。例如,变体可以连同其他合适的亚基被插入到两性分子层,且可以确定其寡聚化形成孔的能力。将亚基插入膜例如两亲膜的方法是本领域已知的。例如,亚基可以以纯化的形式悬浮在含有脂质双分子层的溶液中,从而使其扩散到脂质双分子层并通过结合到脂质双分子层而插入,并组装成功能状态。或者,可以使用如M.A.Holden,H.Bayley.J.Am.Chem.Soc.2005,127,6502-6503和国际申请No.PCT/GB2006/001057(公开为WO 2006/100484)中所描述的“拾取和放置”方法将亚基直接插入膜。
对于整个长度的SEQ ID NO:2的氨基酸序列,基于氨基酸同一性,变体优选与该序列具有至少50%的序列同源性。更优选地,基于氨基酸同一性,变体与整个序列的SEQ IDNO:2的氨基酸序列具有至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,更优选至少95%,97%或99%的同源性。在100或更多,例如125,150,175或200或更多的连续氨基酸长度上,具有至少为80%,例如至少85%,90%或95%的氨基酸同一性(严格同源性)。
本领域的标准方法可用于确定同源性。例如,UWGCG软件包提供BESTFIT程序,该程序可以用来计算同源性,例如在其默认设置使用(Devereux et al(1984)Nucleic AcidsResearch 12,p387-395)。PILEUP和BLAST算法可以用来计算同源性或比对序列(例如鉴定等价残基或相应的序列(通常在它们的默认设置)),如Altschul S.F.(1993)J Mol Evol36:290-300;Altschul,S.F et al(1990)J Mol Biol 215:403-10中所描述的。公众可通过国家生物技术信息中心获得用于进行BLAST分析的软件(http://www.ncbi.nlm.nih.gov/)。
SEQ ID NO:2是MspA单体的MS-(B1)8突变体。变体与MspA比较,可包括MspB,MspC或MspD单体中的任何突变。MspB,MspC和MspD的成熟形式在SEQ ID NO:5至SEQ ID NO:7中示出。特别地,变体可以包括存在于MspB中的下列取代:A138P。变体可以包括存在于MspC中的下列取代中的一个或多个:A96G,N102E和A138P。所述变体可包含存在于MspD中的下列突变中的一个或多个:G1缺失,L2V,E5Q,L8V,D13G,W21A,D22E,K47T,I49H,I68V,D91G,A96Q,N102D,S103T,V104I,S136K和G141A。所述变体可以包括来自Msp B,Msp C和Msp D的突变体和取代物中的一个或多个的组合。变体优选包含突变L88N。SEQ ID NO:2的变体具有突变L88N还具有MS-B1的所有突变,并被称为MS-(B2)8。在本发明中使用的孔优选MS-(B2)8。SEQID NO:2的变体具有突变G75S/G77S/L88N/Q126R还具有MS-B1的所有突变,并被称为MS-B2C。在本发明使用的孔优选MS-(B2)8或MS-(B2C)8。
除了以上讨论的,可对SEQ ID NO:2的氨基酸序列进行氨基酸取代,例如高达1,2,3,4,5,10,20或30个氨基酸的取代。保守取代用相似化学结构,相似化学性质或相似侧链的体积的其他氨基酸替代氨基酸。引入的氨基酸可以与它们要替代的氨基酸具有相似的极性,亲水性,疏水性,碱性,酸性,中性或带电性。或者,所述保守取代可在预先存在的芳香族或脂肪族氨基酸的位置引入其他芳香族或脂肪族氨基酸。保守氨基酸的改变是本领域公知的,并且可以根据表2中所定义的20种主要氨基酸的特性进行选择。其中,氨基酸具有相似极性,该极性可以通过参考表3中的氨基酸侧链的亲水性值而确定。
表2氨基酸的化学性质
Ala 脂肪族,疏水,中性 Met 疏水,中性
Cys 极性,疏水,中性 Asn 极性,亲水,中性
Asp 极性,亲水,带电荷(-) Pro 疏水,中性
Glu 极性,亲水,带电荷(-) Gln 极性,亲水,中性
Phe 芳香族,疏水,中性 Arg 极性,亲水,带电荷(+)
Gly 脂肪族,中性 Ser 极性,亲水性,中性
His 芳香族,极性,亲水性,带电荷(+) Thr 极性,亲水性,中性
Ile 脂肪族,疏水,中性 Val 脂肪族,疏水,中性
Lys 极性,亲水,带电荷(+) Trp 芳香族,疏水,中性
Leu 脂肪族,疏水,中性 Tyr 芳香族,极性,疏水
表3-亲水性大小
Figure BDA0002371324040000241
Figure BDA0002371324040000251
SEQ ID NO:2的氨基酸序列的一个或多个氨基酸残基可另外从上述多肽中缺失。可缺失高达1,2,3,4,5,10,20或30个或更多个氨基酸残基。
变体可包括SEQ ID NO:2的片段。这些片段保持孔形成活性。片段可以至少为50,100,150或200个氨基酸长度。这类片段可用于产生孔。片段优选包含SEQ ID NO:2的孔形成域。片段必须包含SEQ ID NO:2的残基88、90、91、105、118和134之一。通常,片段包括SEQ IDNO:2的所有残基88、90、91、105、118和134。
一个或多个氨基酸可以替代地或额外地添加到上述多肽中。可在SEQ ID NO:2或多肽变体或其片段的氨基酸序列的氨基末端或羧基末端提供延伸。所述延伸可以很短,例如,1到10个氨基酸长度。或者,延伸可以更长,例如长达50或100个氨基酸。载体蛋白可以根据本发明被融合到氨基酸序列。其他融合蛋白在下文中更详细地讨论。
如上所讨论的,变体具有从SEQ ID NO:2的氨基酸序列变化而来的氨基酸序列且保留其形成孔能力的多肽。变体通常包含负责孔形成的SEQ ID NO:2的区域。包含β-桶状体的Msp的孔形成能力由每个亚基中的β-折叠(β-sheets)提供。SEQ ID NO:2的变体通常包含SEQ ID NO:2中形成β-折叠的的区域。可对SEQ ID NO:2中形成β-折叠的区域进行一个或多个修饰,只要得到的变体保留了其形成孔的能力。SEQ ID NO:2的变体优选地包括一个或多个修饰,如在α-螺旋和/或环状区域内取代,添加或缺失。
衍生自Msp的单体可以被修饰以辅助它们的鉴定或纯化,例如通过加入组氨酸残基(组氨酸标签),天冬氨酸残基(天冬氨酸标签),链亲和素标签或Flag标签,或通过加入信号序列以促进它们从细胞中分泌,该细胞中的多肽不天然地含有该信号序列。引入遗传标签的替换方式是通过化学反应将标签连到孔上天然的或人工位点。这方面的例子是将凝胶迁移试剂与人工连接在孔外的半胱氨酸进行反应。这已被证明是用于分离溶血素异源寡聚物的方法(Chem Biol.1997Jul;4(7):497-505)。
衍生自Msp的单体可以用可显示标记物进行标记。所述显示标记物可为任何使孔可被检测的合适的标记。合适的标记物如下所述。
衍生自Msp的单体也可以使用D-氨基酸生产。例如,衍生自Msp的单体可包含L-氨基酸和D-氨基酸的混合物。这是本领域中用于生产这类蛋白质或肽常规的。
衍生自Msp的单体含有一个或多个特异性修饰以促进核苷酸区别。衍生自Msp的单体也可以含有其它非特异性修饰,只要它们不干扰孔的形成。一些非特异性侧链修饰是本领域已知的,并可以对衍生自Msp的单体的侧链进行修饰。该修饰包括,例如,通过与醛反应然后用NaBH4还原进行氨基酸的还原性烷基化,用甲基乙酰亚胺酯(methylacetimidate)进行脒基化,或用乙酸酐进行酰化。
衍生自Msp的单体可以使用本领域中已知的标准方法来制备。衍生自Msp的单体可以通过合成或重组方式制成。例如,所述孔可通过体外翻译和转录(IVTT)合成。制造孔的合适的方法在国际申请Nos.PCT/GB09/001690(公开为WO 2010/004273),PCT/GB09/001679(公开为WO 2010/004265)或PCT/GB10/000133(公开为WO 2010/086603)中描述。讨论了将孔插入膜的方法。
跨膜蛋白孔还优选衍生自α-溶血素(α-HL)。野生型α-HL孔由7个相同的单体或亚基(即它是七聚体)形成。α-溶血素-NN的一个单体或亚基的序列示于SEQ ID NO:4中。跨膜蛋白孔优选包括七个单体,每个包含SEQ ID NO:4或其变体所示的序列。SEQ ID NO:4的1,7至21,31至34,45至51,63至66,72,92至97,104至111,124至136,149至153,160至164,173至206,210至213,217,218,223至228,236至242,262至265,272至274,287至290和294位氨基酸形成环状区域。SEQ ID NO:4的残基113和147形成α-HL的桶状体或通道的缢痕部分。
在该实施例中,本发明的方法优选使用包括7个蛋白质或单体,所述蛋白质或单体各自包含SEQ ID NO:4或其变体所示的序列的孔。7个蛋白质可以是相同的(同源七聚体)或不同的(异源七聚体)。
SEQ ID NO:4的变体是具有从SEQ ID NO:4的氨基酸序列变化而来的氨基酸序列的蛋白质,并保留其形成孔能力。可以使用本领域已知的任何方法来测定变体形成孔的能力。例如,变体可以连同其他合适的亚基被插入到两性分子层如脂质双分子层,并可确定其寡聚形成孔的能力。将亚基插入两性分子层例如脂质双分子层的方法是本领域中已知的。合适的方法如上所述。
所述变体可以包括促进共价连接到构建体或与构建体作用的修饰。该变体优选地包括一个或多个反应性的半胱氨酸残基,以促进连接到构建体。例如,变体可包括在SEQ IDNO:4的8,9,17,18,19,44,45,50,51,237,239和287位点中的一个或多个,和/或在氨基或羧基末端的半胱氨酸。优选的变体包含在SEQ ID NO:4的8,9,17,237,239和287位残基用半胱氨酸进行取代(A8C,T9C,N17C,K237C,S239C或E287C)。所述变体优选为在国际申请No.PCT/GB09/001690(公开为WO 2010/004273),PCT/GB09/001679(公开为WO 2010/004265)或PCT/GB10/000133(公布为WO 2010/086603)中所描述的任何变体。
变体还可以包括任何能促进与核苷酸的相互作用的修饰。
所述变体可以是由生物体例如由葡萄球(Staphylococcus)菌天然表达的天然存在的变体。或者,变体可以体外表达或由细菌如大肠杆菌(Escherichia coli)重组表达。变体还包括由重组技术产生的非天然存在的变体。在SEQ ID NO:4整个长度的氨基酸序列上,基于氨基酸同一性,变体将优选与该序列具有至少50%的同源性。更优选地,基于氨基酸的相似性,相比于SEQ ID NO:4的整个序列的氨基酸序列,变体多肽可与该序列具有至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,以及更优选至少95%,97%或99%的同源性。在200或或更长,例如230,250,270或280或更长长度的连续氨基酸上,可以具有至少80%,例如至少85%,90%或95%的氨基酸同一性(“严格同源性”)。同源性可以如上所讨论的来确定。
除了以上讨论的,可对SEQ ID NO:4的氨基酸序列进行氨基酸取代,例如,高达1,2,3,4,5,10,20或30的取代。可以进行如上所讨论的保守取代。
SEQ ID NO:4的氨基酸序列的一个或多个氨基酸残基可以额外地从上述多肽中缺失。可以缺失高达1,2,3,4,5,10,20或30个或更多个残基。
变体可以是SEQ ID NO:4的片段。这些片段保留孔形成活性。片段可以为至少50,100,200或250个氨基酸长度。片段优选包含SEQ ID NO:4的孔形成域。片段通常包括SEQ IDNO:4的残基119,121,135,113和139。
一个或多个氨基酸可以替代地或额外地添加到上述多肽中。可在SEQ ID NO:4或变体或其片段的氨基酸序列的氨基末端或羧基末端提供延伸。所述延伸可以很短,例如,1-10个氨基酸长度。或者,延伸可以更长,例如长达50或100个氨基酸。载体蛋白可以被融合到孔或变体。
如上所述,SEQ ID NO:4的变体是具有与SEQ ID NO:4的氨基酸序列不同的氨基酸序列的亚基,并且保留其形成孔能力。变体通常包含SEQ ID NO:4的负责孔形成的区域。包含β-桶状体的α-HL的孔形成能力由每个亚基中的β-链提供。SEQ ID NO:4的变体通常包括SEQ ID NO:4的形成β-链的区域。SEQ ID NO:4的形成β-链的氨基酸序列如上所讨论。可对SEQ ID NO:4的形成β-链的区域进行一个或多个修饰,只要得到的变体保留了其形成孔的能力。可对SEQ ID NO:4的β-链区域进行如上所述的特异性修饰。
SEQ ID NO:4的变体优选包括一个或多个修饰,如在其α-螺旋和环状区域内取代,添加或缺失。形成α-螺旋和环的氨基酸如上所述。
所述变体可以被修饰以帮助对其进行如上所述的鉴定和纯化。
从α-HL衍生的孔可以参照自Msp衍生的孔进行讨论。
在一些实施例中,跨膜蛋白孔是化学修饰的。孔可以任何方式在任何位点进行化学修饰。所述跨膜蛋白孔优选通过下述进行化学修饰:将分子连接到一个或多个半胱氨酸(半胱氨酸键),将分子连接到一个或多个赖氨酸,将分子连接到一个或多个非天然氨基酸,表位的酶修饰或末端的修饰。适用于进行这些修饰的方法是本领域已知的。跨膜蛋白孔可通过连接任何分子被化学修饰。例如,孔可以通过连接染料或荧光团被化学修饰。
孔中任何数量的单体可以被化学修饰。一个或多个,例如2,3,4,5,6,7,8,9或10个单体优选进行如上所述的化学修饰。
半胱氨酸残基的反应性可以通过相邻残基的修饰而增强。例如,侧翼精氨酸,组氨酸残基或赖氨酸残基的碱性基团将半胱氨酸硫醇基团的pKa改变为更大反应性的S-基团的pKa。半胱氨酸残基的反应性可通过硫醇保护基如dTNB得到保护。这些可在连接体连接之前与孔的一个或多个半胱氨酸残基反应。
所述分子(使用其对孔进行化学修饰的)可以直接地连接到孔或通过连接体连接到孔,如国际申请No.PCT/GB09/001690(公开为WO 2010/004273),PCT/GB09/001679(公布为WO 2010/004265),PCT/GB10/000133(公开为WO 2010/086603)或PCT/GB10/000132(公开为WO2010/086602)所公开的。
本文所描述的任何蛋白质,例如跨膜蛋白孔,可以被修饰以帮助它们的鉴定和纯化,例如通过加入组氨酸残基(His标签),天冬氨酸残基(asp标签),链亲和素标签,或Flag标签,SUMO标签,GST标签或MBP标签,或通过加入信号序列以促进它们从细胞中分泌,该细胞中的多肽不天然地含有该信号序列。引入遗传标签的替换方式是通过化学反应将标签连到孔或构建体上天然或人工位点。这方面的例子是将凝胶迁移试剂与人工连接在所述孔外的的半胱氨酸反应。这已被证明是用于分离溶血素异源寡聚物的方法(ChemBiol.1997Jul;4(7):497-505)。
所述孔可以用显示标记物标记。所述显示标记物可以是使得所述孔被检测的任何合适的标记物。合适的标记物包括,但不限于,荧光分子,放射性同位素,例如125I,35S,酶,抗体,抗原,多核苷酸和配体例如生物素。
本文所描述的任何蛋白质,例如跨膜蛋白孔可以通过人工合成或重组手段制备。例如,所述孔可通过体外翻译和转录(IVTT)合成。该孔的氨基酸序列可以被修饰为包括非天然存在的氨基酸或被修饰以提高蛋白质的稳定性。当通过合成手段制备蛋白质时,可以在制备过程引入所述氨基酸。孔也可随合成或重组生产被改变。
所述孔还可以使用D-氨基酸生产。例如,孔或构建体可包含L-氨基酸和D-氨基酸的混合物。这是本领域中用于生产这类蛋白质或肽常规的。
所述孔还可以包含其他非特异性修饰,只要它们不干扰孔形成或构建体功能。一些非特异性侧链修饰是本领域中已知的,并且可以对蛋白质的侧链进行修饰。这样的修饰包括,例如,通过与醛反应然后用NaBH4还原进行氨基酸的还原性烷基化,用甲基乙酰亚胺酯进行的脒基化,或用乙酸酐进行的酰化。
本文所描述的任何蛋白质例如跨膜蛋白孔可以使用本领域已知的标准方法制备。可以使用本领域的标准方法衍生和复制编码孔或构建体的多核苷酸序列。可以使用本领域的标准技术在细菌宿主细胞中表达编码孔或构建体的多核苷酸序列。该孔可在细胞中由重组表达载体原位表达多核苷酸而产生。所述表达载体选择性地携带诱导型启动子以控制所述多肽的表达。这些方法在Sambrook,J.和Russell,D.(2001)。分子克隆:实验手册,第3版。冷泉港实验室出版社,冷泉港,纽约(Molecular Cloning:A Laboratory Manual,3rdEdition.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY)中描述。
所述孔可以从制备蛋白质的生物体或在重组表达后,通过任何蛋白质液相色谱系统进行纯化,而大规模制备。通常的蛋白质液相色谱系统包括FPLC、AKTA系统、Bio-Cad系统、Bio-Rad BioLogic系统和Gilson HPLC的系统。
本发明的方法包括测量所述修饰的多核苷酸或模板多核苷酸的一个或多个特征。该方法可以包括测量2个,3个,4个,5个或更多个多核苷酸的特征。所述一个或多个特征,优选选自(i)所述多核苷酸的长度,(ii)所述多核苷酸的同一性,(iii)所述多核苷酸的序列,(iv)所述多核苷酸的二级结构;以及(v)多核苷酸是否是经修饰的。(i)至(v)的任何组合可以根据本发明进行测量。
对于(i),多核苷酸的长度例如可以通过确定所述多核苷酸和所述孔的相互作用数量,以及多核苷酸与所述孔相互作用之间的持续时间来测定。
对于(ii),所述多核苷酸的同一性可以通过多种方式测定。多核苷酸的同一性可以联合多核苷酸的序列的测定,或不联合多核苷酸的序列的测定进行测定。前者是直接的;对所述多核苷酸进行测序,并由此进行鉴定。后者可以以几种方式来完成。例如,可以测定多核苷酸中特定模序的存在(而无需测定该多核苷酸的其余序列)。或者,方法中测定的特定的电和/或光信号可鉴定来自特定来源的多核苷酸。
对于(iii),多核苷酸的序列可以如前所述确定。合适的测序方法,特别是那些使用电测量的方法,描述于Stoddart D et al.,Proc Natl Acad Sci,12;106(19):7702-7,Lieberman KR et al,J Am Chem Soc.2010;132(50):17961-72,和国际申请WO 2000/28312中。
对于(iv),所述二级结构可以以多种方式测量。例如,如果该方法包含电测量,二级结构可以利用穿过孔的停留时间的改变或电流变化进行测量。这使得单链和双链多核苷酸的区域能够得到识别。
对于(v),可以测定任何存在或不存在修饰。该方法优选包括确定所述多核苷酸是否通过甲基化,氧化,损伤,用一个或多个蛋白质或一个或多个标记物,标签或间隔区进行了修饰。特异性修饰将导致与孔的特异性相互作用,其可以使用下面描述的方法来测定。例如,可以基于孔与每个核苷酸的相互作用过程中穿过孔的电流,识别胞嘧啶与甲基化的胞嘧啶。
可进行各种不同类型的测量。这包括但不限于:电测量和光测量。可行的电测量包括:电流测量,阻抗测量,测量隧道(Ivanov AP等人,Nano Lett.2011Jan 12;11(1):279-85),以及FET测量(国际申请WO 2005/124888)。光测量可以与电测量结合使用(Soni GV等人,Rev Sci Instrum.2010Jan;81(1):014301)。所述测量可以是跨膜电流测量例如流经所述孔的离子电流的测量。
电测量可如Stoddart D等人,Proc Natl Acad Sci,12;106(19):7702-7,Lieberman KR等人,J Am Chem Soc.2010;132(50):17961-72,和国际申请WO-2000/28312所描述的使用标准单声道记录设备进行。或者,电测量可以使用多通道系统进行,例如如在国际申请WO-2009/077734和国际申请WO-2011/067559中所描述的。
在优选的实施例中,该方法包括:
(a)将所述修饰的多核苷酸/每个修饰的多核苷酸与跨膜孔接触,使得所述修饰的多核苷酸/每个修饰的多核苷酸的至少一条链移动穿过所述孔;以及
(b)随着所述修饰的多核苷酸/每个修饰的多核苷酸的至少一条链相对于所述孔移动,获取穿过所述孔的电流,其中所述电流代表所述多核苷酸/每个多核苷酸的至少一条链的一个或多个特征,并由此表征所述修饰的多核苷酸/所述模板多核苷酸。
所述方法可以使用任何适于研究膜/孔系统(其中孔嵌入膜中)的设备进行实施,该方法可以使用适合于感测跨膜孔的设备实施。例如,所述设备包括一个室,所述室包括水溶液和将该室分割为两部分的屏障(barrier)。所述屏障通常具有缝隙,其中在缝隙中形成包括孔的膜。或者由该屏障形成其中存在孔的膜。
该方法可以使用在国际申请No.PCT/GB08/000562(WO 2008/102120)中描述的设备实施。
该方法可以包括随着多核苷酸/每个多核苷酸相对于所述孔移动,测量通过所述孔的电流。因此该装置也可以包括能够跨膜和孔施加电势并测量电流信号的电路。该方法可以使用膜片钳或电压钳实施。所述方法优选包含使用电压钳。
用于测量通过跨膜蛋白孔的离子电流的合适的条件是本领域已知的,并且在实施例中公开。该方法通过跨膜和孔施加的电压进行实施。使用的电压通常为+2V到-2V,通常-400mV到400mV。所使用的电压优选在具有以下下限和上限的范围内,所述下限的选自在-400mV,-300mV,-200mV,-150mV,-100mV,-50mV,-20mV和0mV的范围内,所述上限独立地选自+10mV,+20mV,+50mV,+100mV,+150mV,+200mV,+300mV,+400mV。所用的电压更优选在100mV到240mV的范围内并最优选在120mV到220mV的范围内。可通过对孔施加提高的电势来提高对不同核苷酸的分辨力。
该方法通常在任何载荷子,如金属盐,例如碱金属盐,卤盐,例如氯盐,如碱金属氯盐的存在下实施。载荷子可包括离子型液体或有机盐,例如四甲基氯化铵,三甲基氯化铵,氯化苯甲基铵,或1-乙基-3-甲基咪唑鎓氯化物。在上面讨论的示例性设备中,所述盐存在于所述室中的水溶液中。通常使用氯化钾(KCl),氯化钠(氯化钠)或氯化铯(CsCl)或亚铁氰化钾和铁氰化钾的混合物。优选氯化钾,氯化钠和亚铁氰化钾和铁氰化钾的混合物。盐浓度可为饱和的。盐浓度可以是3M或更低,通常为0.1M至2.5M,0.3M至1.9M,0.5M至1.8M,0.7M至1.7M,0.9M至1.6M或1M至1.4M。优选盐浓度为150mM到1M。所述方法优选使用至少为0.3M,例如至少为0.4M,至少为0.5M,至少为0.6M,至少为0.8M,至少为1.0M,至少为1.5M,至少为2.0M,至少为2.5M,或者至少为3.0M的盐浓度进行实施。高盐浓度提供了高信噪比,并使得在正常电流波动的背景下,代表核苷酸存在的电流能被识别。
该方法通常在缓冲剂存在下实施。在上面讨论的示例性设备中,缓冲剂存在所述室的水溶液中。本发明的方法可使用任何缓冲剂。通常地,缓冲剂是HEPES缓冲液。另一个合适的缓冲剂是Tris-HCl缓冲剂。该方法通常在pH值为4.0至12.0,4.5至10.0,5.0至9.0,5.5至8.8,6.0至8.7,7.0至8.8,或7.5至8.5下实施。所使用的pH优选约为7.5。
该方法可在0℃至100℃,15℃至95℃,16℃至90℃,17℃至85℃,18℃至80℃,19℃至70℃,或20℃至60℃下实施。该方法通常在室温下进行。该方法选择性地在支持酶功能的温度下,例如约37℃实施。
该方法优选进一步包括将所述修饰的多核苷酸/每个修饰的多核苷酸与多核苷酸结合蛋白质接触,使得蛋白质控制所述多核苷酸/每个多核苷酸的至少一条链穿过所述孔的移动。如果修饰的多核苷酸包含发夹环,该方法最好进一步包括将所述修饰的多核苷酸/每个修饰的多核苷酸与多核苷酸结合蛋白质接触,使得蛋白质控制所述多核苷酸/每个多核苷酸的两条链穿过所述孔的移动。
更优选,该方法包括(a)将所述修饰的多核苷酸/每个修饰的多核苷酸与跨膜孔和多核苷酸结合蛋白质接触,使得所述多核苷酸/每个多核苷酸的至少一条链移动穿过所述孔,且蛋白质控制所述多核苷酸/每个多核苷酸的至少一条链穿过孔的移动,且(b)随着所述多核苷酸/每个多核苷酸的至少一条链相对于孔移动,测量穿过所述孔的电流,其中所述电流代表所述多核苷酸/每个多核苷酸的至少一条链的一个或多个特征,并由此表征修饰的多核苷酸/模板多核苷酸。如果修饰的多核苷酸包含发夹环,所述方法更优选包括(a)将所述修饰的多核苷酸/每个修饰的多核苷酸与跨膜孔和多核苷酸结合蛋白质接触,使得所述多核苷酸/每个多核苷酸的两条链移动穿过所述孔,并且所述蛋白质控制所述修饰的多核苷酸/每个多核苷酸的两条链穿过所述孔的移动;以及(b)随着所述多核苷酸/每个多核苷酸的两条链相对于所述孔移动,测量穿过所述孔的电流,其中所述电流代表所述多核苷酸/每个多核苷酸的两条链的一个或多个特征,并由此表征所述修饰的多核苷酸/模板多核苷酸。
该多核苷酸结合蛋白质可以是能够结合到多核苷酸且控制其穿过孔的移动的任何蛋白质。在本领域中确定蛋白质是否结合到多核苷酸是简单的。该蛋白质通常与多核苷酸相互作用且修饰多核苷酸的至少一个特性。该蛋白质可以通过剪切多核苷酸形成单个的核苷酸或较短链的核苷酸,如二核苷酸或三核苷酸对其进行修饰。该部分可以通过定向多核苷酸或将其移动到特定的位置即控制它的运动,对多核苷酸进行修饰。
所述多核苷酸结合蛋白质优选多核苷酸处理酶。多核苷酸处理酶是能够与多核苷酸相互作用且修饰多核苷酸中的至少一种性质的多肽。所述酶可以通过剪切多核苷酸形成单个的核苷酸或较短链的核苷酸,如二核苷酸或三核苷酸对其进行修饰。该酶可以通过定向多核苷酸或将其移动到特定的位置对多核苷酸进行修饰。所述多核苷酸处理酶不需要显示酶活性只要其能够结合多核苷酸且控制其穿过孔的移动。例如,酶可以被修饰以除去其酶活性或在防止其作为酶工作的条件下使用。这样的条件在下面更详细地讨论。
多核苷酸处理酶优选衍生自核苷酸分解酶。在酶的构建体中使用的多核苷酸处理酶更优选衍生自任何酶分类(EC)组3.1.11、3.1.13、3.1.14、3.1.15、3.1.16、3.1.21、3.1.22、3.1.25、3.1.26、3.1.27、3.1.30和3.1.31中的成员。所述酶可为在国际申请No.PCT/GBlO/000133(公开为WO 2010/086603)中所公开的任何酶。
优选的酶是聚合酶,核酸外切酶,解旋酶和拓扑异构酶,如旋转酶。合适的酶包括,但不限于,来自大肠杆菌的核酸外切酶(SEQ ID NO:11),来自大肠杆菌的核酸外切酶III酶(SEQ ID NO:13),来自嗜热栖热菌的RecJ(SEQ ID NO:15)和λ噬菌体的核酸外切酶(SEQ IDNO:17)及其变体。包含如SEQ ID NO:15所示的序列的三个亚基或其变体相互作用以形成三聚体核酸外切酶。所述酶优选为Phi29 DNA聚合酶(SEQ ID NO:9)或其变体。所述拓扑异构酶优选是部分分类(EC)组5.99.1.2和5.99.1.3任一个的成员。
所述酶最优选衍生自解旋酶,例如Hel308 Mbu(SEQ ID NO:18),Hel308 Csy(SEQID NO:19),Hel308 Mhu(SEQ ID NO:20),TraI Eco(SEQ ID NO:21),XPD Mbu(SEQ ID NO:22)或其变体。
SEQ ID NO:9,11,13,15,17,18,19,20,21,22或23的变体是酶,所述酶具有与SEQID NO:9,11,13,15,17,18,19,20,21,22或23不同的氨基酸序列,且保持多核苷酸结合能力。这可以使用本领域已知的任何方法来测定。例如,可以将变体与多核苷酸接触,并测定其结合到多核苷酸且沿所述多核苷移动的能力。所述变体可包括修饰,所述修饰有助于多核苷酸的结合和/或有助于在高盐浓度和/或室温下的活性。
基于氨基酸同一性,变体优选与SEQ ID NO:9,11,13,15,17,18,19,20,21,22或23,在整个氨基酸序列长度上具有至少50%的同源性。更优选地,基于氨基酸同一性,所述变体多肽可以与氨基酸序列SEQ ID NO:9,11,13,15,17,18,19,20,21,22或23,在整个序列长度上具有至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,且更优选至少95%,97%或99%的同源性。在200个或更多,例如230,250,270,280,300,400,500,600,700,800,900或1000或更多个连续的氨基酸(“严格同源性”)的长度上,可以具有至少80%,例如至少85%,90%或95%的氨基酸同一性。同源性测定如上所述。参考上文的SEQ ID NO:2和SEQ ID NO:4,所述变体可以任何方式不同于如上所讨论的野生型序列。所述酶可以共价结合到所述孔。任何方法可被用于将酶共价结合到所述孔。
在链测序中,所述多核苷酸是顺着或逆着施加的电势穿过所述孔易位的。逐步或前进式作用在双链多核苷酸上的核苷酸外切酶可以在孔的顺侧使用,以将余下的单链在施加的电势供应穿过所述孔或在相反电势作用下在反侧使用。同样地,解开双链DNA的解旋酶也可以以类似的方式使用。聚合酶也可被使用。也有测序应用的可能性,该测序应用需要链逆着施加的电势移位,但该DNA必须在反向电势或没有电势的条件下先被酶“捕获”。在具有电势的情况下,结合后,电势翻转,链将从顺侧穿过孔到反侧,并在电流作用下保持伸展的构象。单链DNA核酸外切酶或单链DNA依赖性聚合酶可以作为分子马达以受控逐步的方式将最近易位的单链从反式到顺式逆着所施加的电势拉过孔。
表征修饰的多核苷酸或模板多核苷酸的方法优选包括将多核苷酸与孔和衍生自解旋酶的多核苷酸结合蛋白质接触。任何解旋酶可以在本方法中使用。解旋酶相对于孔可以两种模式工作。首先,该方法优选以下述方式使用解旋酶进行实施,使得解旋酶将所述多核苷酸在顺着施加电压产生的场下移动穿过所述孔。在这种模式下,多核苷酸的5'末端首先在孔中被捕获,且解旋酶将多核苷酸移动入孔,使得多核苷酸在顺着所述场的条件下穿过孔直到其最终易位到双层的反侧。可替代地,该方法优选以下述方式使用解旋酶进行实施,解旋酶将多核苷酸逆着施加电压产生的场移动穿过所述孔。在这种模式下,多核苷酸的3'末端首先在孔中被捕获,然后解旋酶将多核苷酸移动穿过孔,使得多核苷酸在逆着施加的场的条件下被拉出孔,直到其最终被返回双层的顺侧。
多核苷酸与多核苷酸结合蛋白质和孔可以以任何顺序接触。优选的是,当多核苷酸所述多核苷酸结合蛋白质如解旋酶,以及孔接触时,该多核苷酸首先与蛋白质形成复合体。当跨孔施加电压时,多核苷酸/蛋白质复合体随后与孔形成复合体,且控制多核苷酸穿过孔的移动。
所述方法通常在游离核苷酸或游离核苷酸类似物和辅助多核苷酸结合蛋白功能发挥的酶的辅助因子存在下实施。所述游离核苷酸可以为如上面讨论的单个核苷酸的任意一个或多个。游离核苷酸包括,但不限于,单磷酸腺苷(AMP),二磷酸腺苷(ADP),三磷酸腺苷(ATP),单磷酸鸟苷(GMP),二磷酸鸟苷(GDP),三磷酸鸟苷(GTP),单磷酸胸苷(TMP),二磷酸胸苷(TDP),三磷酸胸苷(TTP),单磷酸尿苷(UMP),二磷酸尿苷(UDP),三磷酸尿苷(UTP),单磷酸胞苷(CMP),二磷酸胞苷(CDP),三磷酸胞苷(CTP),环磷酸腺苷(cAMP),环单磷酸鸟苷(cGMP),脱氧单磷酸腺苷(dAMP),脱氧二磷酸腺苷(DADP),脱氧三磷酸腺苷(dATP),脱氧单磷酸鸟苷(dGMP),脱氧二磷酸鸟苷(dGDP),脱氧三磷酸鸟苷(dGTP),脱氧单磷酸胸苷(dTMP),脱氧二磷酸胸苷(dTDP),脱氧三磷酸胸苷(dTTP),脱氧二磷酸尿苷(dUMP),脱氧二磷酸尿苷(dUDP),脱氧三磷酸尿苷(dUTP),脱氧单磷酸胞苷(dCMP),脱氧二磷酸胞苷(dCDP)和脱氧三磷酸胞苷(dCTP)。该游离核苷酸优选选自AMP,TMP,GMP,CMP,UMP,dAMP,dTMP,dGMP或dCMP。该游离核苷酸优选三磷酸腺苷(ATP)。酶辅助因子是使构建体发挥功能的因子。所述酶辅助因子优选为二价金属阳离子。所述二价金属阳离子优选为Mg2+,Mn2+,Ca2+或Co2+。所述酶辅助因子最优选Mg2+
试剂盒
本发明还提供了用于修饰模板多核苷酸的试剂盒。试剂盒包括(a)本发明的MuA底物组,(b)MuA转座酶。上文参照本发明的方法和产品讨论的任何实施方式同样适用于所述的试剂盒。
试剂盒可进一步包括膜的组分,如两亲性层或脂质双层中的组分。所述试剂盒可进一步包括跨膜孔的组分。所述试剂盒还可以包括多核苷酸结合蛋白。合适的膜、孔和多核苷酸结合蛋白质如上文所述。
本发明的试剂盒可以另外包含使得上述提及的任何实施例能够实施的一个或多个其它试剂或仪器。这类试剂或仪器包括以下试剂或仪器中的一个或多个:合适的缓冲液(水溶液),从受体(subject)中得到样品的工具(例如包含针的容器或仪器),扩增和/或表达多核苷酸的工具,上文定义的膜或压力钳或膜片钳装置。试剂在试剂盒中可以干燥状态存在,使得流体样品重新悬浮试剂。所述试剂盒还可,可选地,包括使本发明的方法中如何使用试剂盒的说明书,或者该方法可用于何种患者的详细信息。所述试剂盒可选的可以包括核苷酸。
以下实例说明本发明。
实施例1
这个实施例说明MuA转座酶是能够将含有至少一个在模板多核苷酸中不存在的核苷的MuA底物插入模板双链多核苷酸。在这个实施例中,在模板中不存在的一个核苷酸是dUMP。
材料和方法
1.1 DNA链退火以形成MuA底物
MuA底物1和2如下面表4中所示制备。构建体A和B的样品混合物然后被加热到95℃2分钟,然后以每分钟2℃的速率冷却至16℃。使得由4个C3间隔区单元连接到SEQ ID NO:24的SEQ ID NO:27退火到SEQ ID NO:28(MuA底物1)或SEQ ID NO:26(MuA底物2)。形成的两个MuA底物的DNA底物设计在图15中示出。
表4
Figure BDA0002371324040000331
1.2使用MuA转座酶将DNA模板片段化
样品1-5的制备如下表5中所示。然后将样品在30℃温育1小时,在75℃下热失活10分钟。将样品1-5中的每个等分试样(1μL)在12000安捷伦芯片上运行,且将剩余物在0.8%TAE琼脂糖凝胶上测试(在100V下,60分钟,见图16)。凝胶中的泳道与以下样品相关-泳道1=适当的DNA梯,泳道2与样品1对应(对照显示由未修饰的SEQ ID NO:29产生的条带),泳道3与样品2对应(野生型MuA底物(MuA底物1,由4个C3间隔区单元连接到SEQ ID NO:24的SEQID NO:27,与SEQ ID NO:28杂交),样品2不含有在模板多核苷酸(SEQ ID NO:29)中不存在的至少一个核苷),泳道4与样品3对应(MuA底物含有dUMP,(MuA底物2,由4个C3间隔区单元连接到SEQ ID NO:24的SEQ ID NO:27,与SEQ ID NO:26杂交),其在模板多核苷酸(SEQ IDNO:29)中不存在),泳道5与样品4对应(宽条带表明MuA转座酶是能够将野生型MuA底物(由4个C3间隔区单元连接到SEQ ID NO:24的SEQ ID NO:27,与SEQ ID NO:28杂交)插入到模板多核苷酸(SEQ ID NO:29)中),泳道6与样品5对应(凝胶上的宽条带表明MuA转座酶能够将含有dUMP的MuA底物(由4个C3间隔区单元连接到SEQ ID NO:24的SEQ ID NO:27,与SEQ IDNO:26杂交)插入到模板多核苷酸(SEQ ID NO:29)中)。泳道3和泳道4作为额外的对照运行,在凝胶的底部产生了模糊的条带。图16显示了MuA转座酶能够将含有至少一个在模板多核甘酸(MuA底物2)中不存在的核苷的MuA底物插入。
表5
Figure BDA0002371324040000341
实施例2
本实施例描述在图17(A部分)中描述了样品制备方法。在步骤1中,ssDNA片段退火,以形成模型构建体(X)。在步骤2中,使用USERTM除去dUMP(标记为三角形)。最后,在步骤3中,使用DNA聚合酶和连接酶修复构建体x中的缺口,以产生修饰的ds-DNA多核苷酸。图17的B部分显示了构建体Y中的dsDNA的对照。
材料和方法
2.1 DNA链退火以形成构建体X和Y
构建体X和Y如下表6中所示的制备。将形成构建体X和Y的含有DNA的样品混合物,加热至95℃2分钟,然后将样品混合物以每分钟2℃的速率冷却至16℃。使得SEQ ID NO:30退火到任一SEQ ID NO:31和SEQ ID NO:32(构建体Ⅹ)或SEQ ID NO:33(构建体Y,对照)。形成的两个构建体的DNA底物设计如图17A和17B(步骤1后)中所示。
表6
试剂 构建体X 构建体Y 最终浓度
0.5uL 3uL
0.25M氯化钠,50mM Tris pH7.5 2uL 2uL 50mM,10mM
SEQ ID NO:30(100uM) 2.5uL 2.5uL 25uM
SEQ ID NO:31(100uM) 2.5uL 25uM
SEQ ID NO:32(100uM) 2.5uL 25uM
SEQ ID NO:33(100uM) 2.5uL 25uM
总计 10uL 10uL
2.2构建体X的USER消化
在前述步骤中退火的构建体X溶液的等分试液使用USERTM处理,以便从SEQ IDNO:32中除去dUMP。见下面的表7中适当的体积和浓度。然后在冰块中冷却前,样品在37℃保温30分钟。
表7
试剂 构建体X 最终浓度
22.8uL
构建体X(25uM) 1.2uL 1uM(30pmol)
10x DNA连接酶缓冲液 3uL 1x
USER(1U/uL) 3uL 3U
总计 30uL
2.3双链DNA构建体中的单链缺口的修复
使用USERTM处理后产生的构建体X样品,然后被等分为三批10μL样品。第一批仅用DNA聚合酶处理(表8中的3),第二批用DNA聚合酶和连接酶处理(表8中的4),第三批不用任何一种酶培育作为对照(表8中的2)。额外的对照实验(表8中1)也进行测试,其中ds构建体Y仅在缓冲液中进行培育(在不存在聚合酶和连接酶二者)。表8的样品1-4在16℃培育30分钟,然后将EDTA(0.5M,5μL)加入到每个样品中。QIAquickTMPCR纯化试剂盒(Qiagen,目录号28106)随后被用于纯化每个样品,其在20μL中洗脱。
表8
试剂 1 2 3 4 最终浓度
17.2uL 7.6uL 7.1uL 6.6uL
表7中的构建体X样品(1uM) 10uL 10uL 10uL 0.5uM
表7中的构建体Y样品(25uM) 0.4uL 0.5uM
10x DNA连接酶缓冲液 2uL 2uL 2uL 2uL 1x
dNTPs(10mM) 0.4uL 0.4uL 0.4uL 0.4uL 200uM
T4 DNAP外切(-) 0.5uL 0.5uL
快速连接酶(T4 DNA连接酶) 0.5uL 1x
总计 20uL 20uL 20uL 20uL
2.4 DNA样本的消化
然后将表8中样品1-4的等分样品(8.5μL)进行T7消化条件或在不存在酶的缓冲液中的对照条件下培育(见下面的表9)。将样品在37℃培育5分钟,然后将EDTA加入到各样品(0.5M,5μL)中。最后,所有的8个样本(A-H)在Agilent 1000芯片上运行(见图18)。
表9
Figure BDA0002371324040000361
Figure BDA0002371324040000371
图18显示了,由于构建体Y为不具有单链DNA缺口的ds DNA构建体,构建体Y没有被T7酶消化(图18泳道3)。构建体X易被消化,当其还没有暴露于DNA聚合酶或DNA连接酶时(见图18的栏5),或当构建体X仅暴露于DNA聚合酶时(T7酶)(图18的栏7)。当构建体x已经用DNA聚合酶处理以填补在上链的缺口,然后用连接酶处理以连接DNA的短片段,其不易被T7酶消化(图18的栏9)。因此,用USER处理构建体X,然后使用DNA聚合酶和连接酶处理,可以填补单链DNA缺口且形成DNA模板(SEQ ID NO:30)的DNA互补链(SEQ ID NO:33)。
实施例3
本实施例描述在图19中描述的样品制备方法,所述方法用于将λDNA片段化为约5-10kB的片段。由样品制备产生的该片段然后被移动穿过纳米孔,其移动由解旋酶控制。被插入到双链λDNA(SEQ ID NO:29仅显示模板链序列)中的Y型MuA底物和发夹形MuA底物(iSpC3间隔区)中存在的标记物通过特征电流区块鉴别。对特征区块的观察表明样品制备程序是成功的。
材料和方法
3.1 DNA链退火以形成Y-形及发夹形MuA底物
下表10中显示了制备Y-形MuA底物和发夹形MuA底物。含有形成Y-形MuA底物和发夹形MuA底物的DNA的样品混合物被加热至95℃2分钟,然后以每分钟2℃的速率冷却至16℃。这使SEQ ID NO:34和SEQ ID NO:35(其中SEQ ID NO:34在其3'末端由4个iSpC3间隔区单元连接至SEQ ID NO:35的5'末端)退火到SEQ ID NO:36和SEQ ID NO:37(其中SEQ IDNO:36在其3'末端由4个iSpC3间隔区单元连接至SEQ ID NO:37的5'末端),以形成Y-形MuA底物,且对于SEQ ID NO:36和SEQ ID NO:35(其中SEQ ID NO:36在其3'末端由4个iSpC3间隔区单元连接至SEQ ID NO:35的5'末端)以形成发夹环MuA底物。图20(a)中显示出形成的两个MuA底物的DNA底物设计。
表5
Figure BDA0002371324040000381
3.2使用MuA转座酶的DNA模板的片段化
将双链λDNA(SEQ ID NO:29仅显示模板链)使用MuA转座酶片段化为约5-10kB长度的链。被MuA转座酶插入的MuA底物(Y-形和发夹形MuA底物)进行如3.1节中的退火。下表11中显示了样品的制备。然后将样品在30℃下培养1小时并且在75℃下进行热失活10分钟。然后样品使用QIAquickTMPCR纯化试剂盒(Qiagen)进行进一步纯化并在26μL中洗脱。
表11
Figure BDA0002371324040000382
3.3具有插入的MuA底物的片段化λDNA的USER消化(USER digest)
为了从SEQ ID NO:36除去dUMP,从步骤3.2中得到的纯化的样品体积1随后使用USERTM消化进行处理。见下表12中适当的体积和浓度。然后将样品在37℃下培育30分钟,随后将其在冰块中冷却。
表12
试剂 样品体积2 最终浓度
样品体积1 26μL 8pmol的U
10x DNA连接酶缓冲液 3μL
USER(1U/uL) 1μL 1U
总计 30μL
3.4修复在双链λDNA构建体片段中的单链缺口
经用USERTM处理后产生的样品体积2,然后用DNA聚合酶和连接酶处理,以闭合单链缺口。样品体积3(见下表13中适当的体积和浓度)在16℃培育30分钟,然后将EDTA(0.5M,10μL)加入到样品体积3中。然后用QIAquickTMPCR纯化试剂盒来纯化各样品,将其在50μL的水中洗脱。将纯化的样品的等分样品(1μL)在Agilent 12000芯片仪上运行以对样品进行定量,添加Tris-HCl和氯化钠(pH7.5)到剩余样品直到其浓度分别为10mM和50mM。最后,SEQID NO:39(序列的3'末端具有6个iSp18间隔区,该间隔区,该间隔区连接到2个胸腺嘧啶残基和3'胆固醇TEG,0.5μM)退火到纯化的样品。
表13
试剂 样品体积3 最终浓度
6.2μL
样品体积2 30μL
10x DNA连接酶缓冲液 1μL
dNTPs(10mM) 0.8μL 200μm
T4 DNAP exo(-)(Lucigen) 1μL
连接酶(NEB;M0202M) 1μL
总计 40μL
3.5显示由解旋酶控制的纯化的和片段化的λDNA构建体的DNA移动的电生理学实验
在建立实验前,λDNA构建体(0.2nM,λDNA的5-10kB片段,其具有Y-形MuA底物和发夹形MuA底物通过MuA转座酶连接在任一端(见图20(b)示例构建体)和Trwc CBA(SEQ IDNO:40,1μM)在缓冲液(50mM CAPS,pH10.0(pH值通过加入氢氧化钠改变为pH10.0),100mM氯化钠)中一起预培育1小时。
在缓冲液中(600mM氯化钾,25mM磷酸二氢钾,75mM亚铁(II)氰化钾,25mM铁(III)氰化钾,pH值8)由插入到嵌段共聚物中的单一MspA纳米孔(MS(B1-G75S/G77S/L88N/Q126R)8MspA(SEQ ID NO:2,具有突变G75S/G77S/L88N/Q126R)取得电测量值。在双分子层中实现单孔后,则缓冲液(1mL,600mM氯化钾,25mM磷酸二氢钾,75mM亚铁(II)氰化钾中,25mM铁(III)氰化钾,pH8)流过系统以去除任何过量的MspA纳米孔(MS(B1-G75S/G77S/L88N/Q126R)8MspA(SEQ ID NO:2,具有突变G75S/G77S/L88N/Q126R)),且实验系统被放置在设置为8℃的冷却板上,给予系统约15℃的温度。将氯化镁(10mM)和dTTP(5mM)与缓冲液(600mM的氯化钾,25mM的磷酸二氢钾,75mM的亚铁(II)氰化钾,25mM的铁(III)氰化钾,pH8)混合在一起,然后加入到λDNA构建体(0.2nM),Trwc Cba(SEQ ID NO:40,1μM)缓冲液(50mM的CAPS,pH值10.0(pH值通过加入氢氧化钠改变为pH10.0),100mM氯化钠)进行预混。然后将预混物加入到单个纳米孔实验系统。进行2个小时的实验,然后进行电势翻转过程(+120mV持续30分钟,然后-100mV持续2秒钟,然后0mV持续2秒),并监控解旋酶控制的DNA的移动。
3.6结果与讨论
对于λDNA构建体观察由解旋酶控制的DNA的移动,图21中示出由解旋酶控制的DNA的移动的例子。存在于λDNA构建体中的iSpC3间隔区产生了图21中的数字1,2和3显示的特征区块水平。Y-形MuA底物在任一链中具有4个iSpC3间隔区,发夹形MuA底物也具有4个iSpC3间隔区,每个iSpC3间隔区随着λDNA构建体区域易位穿过纳米孔,使更多的电流流过。如果样品制备已经成功,则可以在λDNA构建体的初始位置、中间位置(标记模板序列和模板互补序列之间的过渡),并在最后位置观察到iSpC3间隔区事件。图21清楚地显示了对应于iSpC3间隔区的增加的电流流动的三种情况。因此,该样品制备过程有效地将MuA底物引入λDNA并产生在图20(b)中所示的λDNA构建体。
实施例4
本实施例描述在图22中描述的替换的样品制备方法,所述方法用于将λDNA片段化为约5-10kB的片段。由样品制备产生的该片段被移动穿过纳米孔,该移动由解旋酶控制。被插入到双链λDNA(SEQ ID NO:29仅显示模板链序列)中的Y型MuA底物和发夹形MuA底物(iSpC3间隔区)中存在的标记物通过特征电流区块鉴别。对特征区块的观察表明样品制备程序是成功的。
材料和方法
4.1 DNA链退火以形成Y-形和发夹形MuA底物
如上述实施例3.1所述制备Y-形底物和发夹形MUA底物。在本实施例中使用的体积,浓度和序列在下表14中详述。2个形成的构建体的DNA构建体设计示于图23(a)中。
表14
Figure BDA0002371324040000401
Figure BDA0002371324040000411
4.2使用MuA转座酶的DNA模板片段化
使用MuA转座酶,将双链λDNA(SEQ ID NO:29)片段化为约5-10kB长度的链。被MuA转座酶插入的MuA底物(Y-形2和发夹形2MuA底物)在4.1节中退火。除了所用的MuA底物为Y-形2底物和发夹形2MuA底物,用上述3.2节和表11中所描述的等同程序制备样品。在这种情况下,纯化的样本X在20μL的体积中洗脱。
4.3双链λDNA构建体片段中的缺口修复
一旦Y-形2底物和发夹形2MuA底物已插入片段化的λDNA,有必要修复链中的缺口并将肌苷加入λDNA片段以产生完整的双链λDNA片段。如下表15中描述的反应物在冰上配制。在将EDTA(10μL,0.5M)加入到样品前,将样品在16℃下培养60分钟。将得到的样品混合物使用QiaQuickTM纯化试剂盒进行纯化并在50μL的水中洗脱。纯化的样品的等分试样(1μL)在Agilent 12000芯片仪上运行以对样品进行定量,将Tris-盐酸和氯化钠(pH7.5)加入到该样品的其余部分,直到浓度分别为10mM和50mM。最后,SEQ ID NO:16(序列的3'末端具有连接到2个胸腺嘧啶残基和3'胆固醇的TEG的6个iSp18间隔区,0.5μM)退火到纯化的λDNA构建体。
表15
试剂 样品Z 最终浓度
样品X 16μL
2x DNA连接酶缓冲液 20μL 1x
连接酶(NEB;M0202M) 4μL
总计 40μL
4.4显示由解旋酶控制的纯化的和片段化的λDNA构建体的DNA移动的电生理学实验
在建立实验前,λDNA构建体(0.2nM,λDNA的5-10kB片段,其具有Y-形MuA底物和发夹形MuA底物通过MuA转座酶连接在任一端(见图23(b)示例构建体)和Trwc CBA(SEQ IDNO:40,1μM)在缓冲液(50mM CAPS,pH10.0(pH值通过加入氢氧化钠改变为pH10.0),100mM氯化钠)中一起预培育1小时。
在缓冲液中(600mM氯化钾,25mM磷酸二氢钾,75mM亚铁(II)氰化钾,25mM铁(III)氰化钾,pH值8)由插入到嵌段共聚物中的单一MspA纳米孔((MS(B1-G75S/G77S/L88N/Q126R)8MspA(具有突变G75S/G77S/L88N/Q126R的SEQ ID NO:2)取得电测量值。在双分子层中实现单孔后,则缓冲液(3mL,600mM氯化钾,25mM磷酸二氢钾,75mM亚铁(II)氰化钾中,25mM铁(III)氰化钾,pH8)流过系统以去除任何过量的MspA纳米孔(MS(B1-G75S/G77S/L88N/Q126R)8MspA(具有突变G75S/G77S/L88N/Q126R的SEQ ID NO:2),且实验系统被放置在设置为8℃的冷却板上,给予系统约15℃的温度。将氯化镁(10mM)和dTTP(5mM)与缓冲液(600mM的氯化钾,25mM的磷酸二氢钾,75mM的亚铁(II)氰化钾,25mM的铁(III)氰化钾,pH8)混合在一起,然后加入到λDNA构建体(0.2nM),Trwc Cba(SEQ ID NO:40,1μM)缓冲液(50mM的CAPS,pH值10.0(pH值通过加入氢氧化钠改变为pH10.0),100mM氯化钠)进行预混。然后将预混物加入到单个纳米孔实验系统。进行2个小时的实验,然后进行电势翻转过程(+120mV持续30分钟,然后-100mV持续2秒钟,然后0mV持续2秒),并监控解旋酶控制的DNA的移动。
4.5结果与讨论
对于λDNA构建体观察由解旋酶控制的DNA的移动,图24中示出由解旋酶控制的DNA的移动的例子。存在于λDNA构建体中的iSpC3间隔区产生了图24中的数字1-3显示的特征区块水平。Y-形2MuA底物在任一链中具有4个iSpC3间隔区,发夹形2MuA底物也具有4个iSpC3间隔区,每个iSpC3间隔区随着λDNA构建体区域易位穿过纳米孔,使更多的电流流过。如果样品制备已经成功,则可以在λDNA构建体的初始位置、中间位置(标记模板序列和模板互补序列之间的过渡),并在最后位置观察到iSpC3间隔区事件。图24清楚地显示了对应于iSpC3间隔区的增加的电流流动的三种情况。因此,该样品制备过程有效地将MuA底物引入λDNA并产生在图23(b)中所示的λDNA构建体。由于在Y-形2MuA底物和发夹形2MUA底物中使用了肌苷,样品制备程序中的步骤被减少,因为一旦MuA底物已被全部插入,仅需要封闭接近双链DNA构建体中的缺口。
序列表
<110> 牛津纳米孔技术公司
<120> 方法
<130> N119667A-WO
<150> GB 1314695.6
<151> 2013-08-16
<160> 41
<170> PatentIn version 3.5
<210> 1
<211> 558
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 耻垢分枝杆菌(Mycobacterium smegmatis) 孔蛋白A突变体
(D90N/D91N/D93N/D118R/D134R/E139K)
<400> 1
atgggtctgg ataatgaact gagcctggtg gacggtcaag atcgtaccct gacggtgcaa 60
caatgggata cctttctgaa tggcgttttt ccgctggatc gtaatcgcct gacccgtgaa 120
tggtttcatt ccggtcgcgc aaaatatatc gtcgcaggcc cgggtgctga cgaattcgaa 180
ggcacgctgg aactgggtta tcagattggc tttccgtggt cactgggcgt tggtatcaac 240
ttctcgtaca ccacgccgaa tattctgatc aacaatggta acattaccgc accgccgttt 300
ggcctgaaca gcgtgattac gccgaacctg tttccgggtg ttagcatctc tgcccgtctg 360
ggcaatggtc cgggcattca agaagtggca acctttagtg tgcgcgtttc cggcgctaaa 420
ggcggtgtcg cggtgtctaa cgcccacggt accgttacgg gcgcggccgg cggtgtcctg 480
ctgcgtccgt tcgcgcgcct gattgcctct accggcgaca gcgttacgac ctatggcgaa 540
ccgtggaata tgaactaa 558
<210> 2
<211> 184
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 耻垢分枝杆菌(Mycobacterium smegmatis)孔蛋白 A突变体
(D90N/D91N/D93N/D118R/D134R/E139K)
<400> 2
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asn Asn Gly Asn Ile Thr Ala
85 90 95
Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Arg Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Arg Val Ser Gly Ala Lys Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 3
<211> 885
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> α-溶血素突变体 E111N/K147N
<400> 3
atggcagatt ctgatattaa tattaaaacc ggtactacag atattggaag caatactaca 60
gtaaaaacag gtgatttagt cacttatgat aaagaaaatg gcatgcacaa aaaagtattt 120
tatagtttta tcgatgataa aaatcacaat aaaaaactgc tagttattag aacaaaaggt 180
accattgctg gtcaatatag agtttatagc gaagaaggtg ctaacaaaag tggtttagcc 240
tggccttcag cctttaaggt acagttgcaa ctacctgata atgaagtagc tcaaatatct 300
gattactatc caagaaattc gattgataca aaaaactata tgagtacttt aacttatgga 360
ttcaacggta atgttactgg tgatgataca ggaaaaattg gcggccttat tggtgcaaat 420
gtttcgattg gtcatacact gaactatgtt caacctgatt tcaaaacaat tttagagagc 480
ccaactgata aaaaagtagg ctggaaagtg atatttaaca atatggtgaa tcaaaattgg 540
ggaccatacg atcgagattc ttggaacccg gtatatggca atcaactttt catgaaaact 600
agaaatggtt ctatgaaagc agcagataac ttccttgatc ctaacaaagc aagttctcta 660
ttatcttcag ggttttcacc agacttcgct acagttatta ctatggatag aaaagcatcc 720
aaacaacaaa caaatataga tgtaatatac gaacgagttc gtgatgatta ccaattgcat 780
tggacttcaa caaattggaa aggtaccaat actaaagata aatggacaga tcgttcttca 840
gaaagatata aaatcgattg ggaaaaagaa gaaatgacaa attaa 885
<210> 4
<211> 293
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> α-溶血素突变体 E111N/K147N
<400> 4
Ala Asp Ser Asp Ile Asn Ile Lys Thr Gly Thr Thr Asp Ile Gly Ser
1 5 10 15
Asn Thr Thr Val Lys Thr Gly Asp Leu Val Thr Tyr Asp Lys Glu Asn
20 25 30
Gly Met His Lys Lys Val Phe Tyr Ser Phe Ile Asp Asp Lys Asn His
35 40 45
Asn Lys Lys Leu Leu Val Ile Arg Thr Lys Gly Thr Ile Ala Gly Gln
50 55 60
Tyr Arg Val Tyr Ser Glu Glu Gly Ala Asn Lys Ser Gly Leu Ala Trp
65 70 75 80
Pro Ser Ala Phe Lys Val Gln Leu Gln Leu Pro Asp Asn Glu Val Ala
85 90 95
Gln Ile Ser Asp Tyr Tyr Pro Arg Asn Ser Ile Asp Thr Lys Asn Tyr
100 105 110
Met Ser Thr Leu Thr Tyr Gly Phe Asn Gly Asn Val Thr Gly Asp Asp
115 120 125
Thr Gly Lys Ile Gly Gly Leu Ile Gly Ala Asn Val Ser Ile Gly His
130 135 140
Thr Leu Asn Tyr Val Gln Pro Asp Phe Lys Thr Ile Leu Glu Ser Pro
145 150 155 160
Thr Asp Lys Lys Val Gly Trp Lys Val Ile Phe Asn Asn Met Val Asn
165 170 175
Gln Asn Trp Gly Pro Tyr Asp Arg Asp Ser Trp Asn Pro Val Tyr Gly
180 185 190
Asn Gln Leu Phe Met Lys Thr Arg Asn Gly Ser Met Lys Ala Ala Asp
195 200 205
Asn Phe Leu Asp Pro Asn Lys Ala Ser Ser Leu Leu Ser Ser Gly Phe
210 215 220
Ser Pro Asp Phe Ala Thr Val Ile Thr Met Asp Arg Lys Ala Ser Lys
225 230 235 240
Gln Gln Thr Asn Ile Asp Val Ile Tyr Glu Arg Val Arg Asp Asp Tyr
245 250 255
Gln Leu His Trp Thr Ser Thr Asn Trp Lys Gly Thr Asn Thr Lys Asp
260 265 270
Lys Trp Thr Asp Arg Ser Ser Glu Arg Tyr Lys Ile Asp Trp Glu Lys
275 280 285
Glu Glu Met Thr Asn
290
<210> 5
<211> 184
<212> PRT
<213> 耻垢分枝杆菌(Mycobacterium smegmatis)
<400> 5
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Ala
85 90 95
Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 6
<211> 184
<212> PRT
<213> 耻垢分枝杆菌(Mycobacterium smegmatis)
<400> 6
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Gly
85 90 95
Pro Pro Phe Gly Leu Glu Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 7
<211> 183
<212> PRT
<213> 耻垢分枝杆菌(Mycobacterium smegmatis)
<400> 7
Val Asp Asn Gln Leu Ser Val Val Asp Gly Gln Gly Arg Thr Leu Thr
1 5 10 15
Val Gln Gln Ala Glu Thr Phe Leu Asn Gly Val Phe Pro Leu Asp Arg
20 25 30
Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Thr Tyr His
35 40 45
Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu Gly
50 55 60
Tyr Gln Val Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe Ser
65 70 75 80
Tyr Thr Thr Pro Asn Ile Leu Ile Asp Gly Gly Asp Ile Thr Gln Pro
85 90 95
Pro Phe Gly Leu Asp Thr Ile Ile Thr Pro Asn Leu Phe Pro Gly Val
100 105 110
Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val Ala
115 120 125
Thr Phe Ser Val Asp Val Lys Gly Ala Lys Gly Ala Val Ala Val Ser
130 135 140
Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu Arg
145 150 155 160
Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr Tyr
165 170 175
Gly Glu Pro Trp Asn Met Asn
180
<210> 8
<211> 1830
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 8
atgaaacaca tgccgcgtaa aatgtatagc tgcgcgtttg aaaccacgac caaagtggaa 60
gattgtcgcg tttgggccta tggctacatg aacatcgaag atcattctga atacaaaatc 120
ggtaacagtc tggatgaatt tatggcatgg gtgctgaaag ttcaggcgga tctgtacttc 180
cacaacctga aatttgatgg cgcattcatt atcaactggc tggaacgtaa tggctttaaa 240
tggagcgcgg atggtctgcc gaacacgtat aataccatta tctctcgtat gggccagtgg 300
tatatgattg atatctgcct gggctacaaa ggtaaacgca aaattcatac cgtgatctat 360
gatagcctga aaaaactgcc gtttccggtg aagaaaattg cgaaagattt caaactgacg 420
gttctgaaag gcgatattga ttatcacaaa gaacgtccgg ttggttacaa aatcaccccg 480
gaagaatacg catacatcaa aaacgatatc cagatcatcg cagaagcgct gctgattcag 540
tttaaacagg gcctggatcg catgaccgcg ggcagtgata gcctgaaagg tttcaaagat 600
atcatcacga ccaaaaaatt caaaaaagtg ttcccgacgc tgagcctggg tctggataaa 660
gaagttcgtt atgcctaccg cggcggtttt acctggctga acgatcgttt caaagaaaaa 720
gaaattggcg agggtatggt gtttgatgtt aatagtctgt atccggcaca gatgtacagc 780
cgcctgctgc cgtatggcga accgatcgtg ttcgagggta aatatgtttg ggatgaagat 840
tacccgctgc atattcagca catccgttgt gaatttgaac tgaaagaagg ctatattccg 900
accattcaga tcaaacgtag tcgcttctat aagggtaacg aatacctgaa aagctctggc 960
ggtgaaatcg cggatctgtg gctgagtaac gtggatctgg aactgatgaa agaacactac 1020
gatctgtaca acgttgaata catcagcggc ctgaaattta aagccacgac cggtctgttc 1080
aaagatttca tcgataaatg gacctacatc aaaacgacct ctgaaggcgc gattaaacag 1140
ctggccaaac tgatgctgaa cagcctgtat ggcaaattcg cctctaatcc ggatgtgacc 1200
ggtaaagttc cgtacctgaa agaaaatggc gcactgggtt ttcgcctggg cgaagaagaa 1260
acgaaagatc cggtgtatac cccgatgggt gttttcatta cggcctgggc acgttacacg 1320
accatcaccg cggcccaggc atgctatgat cgcattatct actgtgatac cgattctatt 1380
catctgacgg gcaccgaaat cccggatgtg attaaagata tcgttgatcc gaaaaaactg 1440
ggttattggg cccacgaaag tacgtttaaa cgtgcaaaat acctgcgcca gaaaacctac 1500
atccaggata tctacatgaa agaagtggat ggcaaactgg ttgaaggttc tccggatgat 1560
tacaccgata tcaaattcag tgtgaaatgc gccggcatga cggataaaat caaaaaagaa 1620
gtgaccttcg aaaacttcaa agttggtttc agccgcaaaa tgaaaccgaa accggtgcag 1680
gttccgggcg gtgtggttct ggtggatgat acgtttacca ttaaatctgg cggtagtgcg 1740
tggagccatc cgcagttcga aaaaggcggt ggctctggtg gcggttctgg cggtagtgcc 1800
tggagccacc cgcagtttga aaaataataa 1830
<210> 9
<211> 608
<212> PRT
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 9
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Ala Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ala Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Lys Asp Phe Lys Leu Thr Val Leu Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Tyr
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Glu Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Val Asn Ser Leu Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Arg Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Arg Ser Arg Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Leu Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr
355 360 365
Tyr Ile Lys Thr Thr Ser Glu Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Thr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Trp Ala Arg Tyr Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Glu Ile Pro Asp Val Ile Lys Asp Ile Val Asp Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Ala His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Glu Val Asp Gly Lys
500 505 510
Leu Val Glu Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Lys Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Pro Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Asp Thr Phe Thr Ile Lys Ser
565 570 575
Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser
580 585 590
Gly Gly Gly Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys
595 600 605
<210> 10
<211> 1390
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 10
atgatgaacg atggcaaaca gcagagcacc ttcctgtttc atgattatga aaccttcggt 60
acccatccgg ccctggatcg tccggcgcag tttgcggcca ttcgcaccga tagcgaattc 120
aatgtgattg gcgaaccgga agtgttttat tgcaaaccgg ccgatgatta tctgccgcag 180
ccgggtgcgg tgctgattac cggtattacc ccgcaggaag cgcgcgcgaa aggtgaaaac 240
gaagcggcgt ttgccgcgcg cattcatagc ctgtttaccg tgccgaaaac ctgcattctg 300
ggctataaca atgtgcgctt cgatgatgaa gttacccgta atatctttta tcgtaacttt 360
tatgatccgt atgcgtggag ctggcagcat gataacagcc gttgggatct gctggatgtg 420
atgcgcgcgt gctatgcgct gcgcccggaa ggcattaatt ggccggaaaa cgatgatggc 480
ctgccgagct ttcgtctgga acatctgacc aaagccaacg gcattgaaca tagcaatgcc 540
catgatgcga tggccgatgt ttatgcgacc attgcgatgg cgaaactggt taaaacccgt 600
cagccgcgcc tgtttgatta tctgtttacc caccgtaaca aacacaaact gatggcgctg 660
attgatgttc cgcagatgaa accgctggtg catgtgagcg gcatgtttgg cgcctggcgc 720
ggcaacacca gctgggtggc cccgctggcc tggcacccgg aaaatcgtaa cgccgtgatt 780
atggttgatc tggccggtga tattagcccg ctgctggaac tggatagcga taccctgcgt 840
gaacgcctgt ataccgccaa aaccgatctg ggcgataatg ccgccgtgcc ggtgaaactg 900
gttcacatta acaaatgccc ggtgctggcc caggcgaaca ccctgcgccc ggaagatgcg 960
gatcgtctgg gtattaatcg ccagcattgt ctggataatc tgaaaatcct gcgtgaaaac 1020
ccgcaggtgc gtgaaaaagt ggtggcgatc ttcgcggaag cggaaccgtt caccccgagc 1080
gataacgtgg atgcgcagct gtataacggc ttctttagcg atgccgatcg cgcggcgatg 1140
aaaatcgttc tggaaaccga accgcgcaat ctgccggcgc tggatattac ctttgttgat 1200
aaacgtattg aaaaactgct gtttaattat cgtgcgcgca attttccggg taccctggat 1260
tatgccgaac agcagcgttg gctggaacat cgtcgtcagg ttttcacccc ggaatttctg 1320
cagggttatg cggatgaact gcagatgctg gttcagcagt atgccgatga taaagaaaaa 1380
gtggcgctgc 1390
<210> 11
<211> 485
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 11
Met Met Asn Asp Gly Lys Gln Gln Ser Thr Phe Leu Phe His Asp Tyr
1 5 10 15
Glu Thr Phe Gly Thr His Pro Ala Leu Asp Arg Pro Ala Gln Phe Ala
20 25 30
Ala Ile Arg Thr Asp Ser Glu Phe Asn Val Ile Gly Glu Pro Glu Val
35 40 45
Phe Tyr Cys Lys Pro Ala Asp Asp Tyr Leu Pro Gln Pro Gly Ala Val
50 55 60
Leu Ile Thr Gly Ile Thr Pro Gln Glu Ala Arg Ala Lys Gly Glu Asn
65 70 75 80
Glu Ala Ala Phe Ala Ala Arg Ile His Ser Leu Phe Thr Val Pro Lys
85 90 95
Thr Cys Ile Leu Gly Tyr Asn Asn Val Arg Phe Asp Asp Glu Val Thr
100 105 110
Arg Asn Ile Phe Tyr Arg Asn Phe Tyr Asp Pro Tyr Ala Trp Ser Trp
115 120 125
Gln His Asp Asn Ser Arg Trp Asp Leu Leu Asp Val Met Arg Ala Cys
130 135 140
Tyr Ala Leu Arg Pro Glu Gly Ile Asn Trp Pro Glu Asn Asp Asp Gly
145 150 155 160
Leu Pro Ser Phe Arg Leu Glu His Leu Thr Lys Ala Asn Gly Ile Glu
165 170 175
His Ser Asn Ala His Asp Ala Met Ala Asp Val Tyr Ala Thr Ile Ala
180 185 190
Met Ala Lys Leu Val Lys Thr Arg Gln Pro Arg Leu Phe Asp Tyr Leu
195 200 205
Phe Thr His Arg Asn Lys His Lys Leu Met Ala Leu Ile Asp Val Pro
210 215 220
Gln Met Lys Pro Leu Val His Val Ser Gly Met Phe Gly Ala Trp Arg
225 230 235 240
Gly Asn Thr Ser Trp Val Ala Pro Leu Ala Trp His Pro Glu Asn Arg
245 250 255
Asn Ala Val Ile Met Val Asp Leu Ala Gly Asp Ile Ser Pro Leu Leu
260 265 270
Glu Leu Asp Ser Asp Thr Leu Arg Glu Arg Leu Tyr Thr Ala Lys Thr
275 280 285
Asp Leu Gly Asp Asn Ala Ala Val Pro Val Lys Leu Val His Ile Asn
290 295 300
Lys Cys Pro Val Leu Ala Gln Ala Asn Thr Leu Arg Pro Glu Asp Ala
305 310 315 320
Asp Arg Leu Gly Ile Asn Arg Gln His Cys Leu Asp Asn Leu Lys Ile
325 330 335
Leu Arg Glu Asn Pro Gln Val Arg Glu Lys Val Val Ala Ile Phe Ala
340 345 350
Glu Ala Glu Pro Phe Thr Pro Ser Asp Asn Val Asp Ala Gln Leu Tyr
355 360 365
Asn Gly Phe Phe Ser Asp Ala Asp Arg Ala Ala Met Lys Ile Val Leu
370 375 380
Glu Thr Glu Pro Arg Asn Leu Pro Ala Leu Asp Ile Thr Phe Val Asp
385 390 395 400
Lys Arg Ile Glu Lys Leu Leu Phe Asn Tyr Arg Ala Arg Asn Phe Pro
405 410 415
Gly Thr Leu Asp Tyr Ala Glu Gln Gln Arg Trp Leu Glu His Arg Arg
420 425 430
Gln Val Phe Thr Pro Glu Phe Leu Gln Gly Tyr Ala Asp Glu Leu Gln
435 440 445
Met Leu Val Gln Gln Tyr Ala Asp Asp Lys Glu Lys Val Ala Leu Leu
450 455 460
Lys Ala Leu Trp Gln Tyr Ala Glu Glu Ile Val Ser Gly Ser Gly His
465 470 475 480
His His His His His
485
<210> 12
<211> 804
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 12
atgaaatttg tctcttttaa tatcaacggc ctgcgcgcca gacctcacca gcttgaagcc 60
atcgtcgaaa agcaccaacc ggatgtgatt ggcctgcagg agacaaaagt tcatgacgat 120
atgtttccgc tcgaagaggt ggcgaagctc ggctacaacg tgttttatca cgggcagaaa 180
ggccattatg gcgtggcgct gctgaccaaa gagacgccga ttgccgtgcg tcgcggcttt 240
cccggtgacg acgaagaggc gcagcggcgg attattatgg cggaaatccc ctcactgctg 300
ggtaatgtca ccgtgatcaa cggttacttc ccgcagggtg aaagccgcga ccatccgata 360
aaattcccgg caaaagcgca gttttatcag aatctgcaaa actacctgga aaccgaactc 420
aaacgtgata atccggtact gattatgggc gatatgaata tcagccctac agatctggat 480
atcggcattg gcgaagaaaa ccgtaagcgc tggctgcgta ccggtaaatg ctctttcctg 540
ccggaagagc gcgaatggat ggacaggctg atgagctggg ggttggtcga taccttccgc 600
catgcgaatc cgcaaacagc agatcgtttc tcatggtttg attaccgctc aaaaggtttt 660
gacgataacc gtggtctgcg catcgacctg ctgctcgcca gccaaccgct ggcagaatgt 720
tgcgtagaaa ccggcatcga ctatgaaatc cgcagcatgg aaaaaccgtc cgatcacgcc 780
cccgtctggg cgaccttccg ccgc 804
<210> 13
<211> 268
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 13
Met Lys Phe Val Ser Phe Asn Ile Asn Gly Leu Arg Ala Arg Pro His
1 5 10 15
Gln Leu Glu Ala Ile Val Glu Lys His Gln Pro Asp Val Ile Gly Leu
20 25 30
Gln Glu Thr Lys Val His Asp Asp Met Phe Pro Leu Glu Glu Val Ala
35 40 45
Lys Leu Gly Tyr Asn Val Phe Tyr His Gly Gln Lys Gly His Tyr Gly
50 55 60
Val Ala Leu Leu Thr Lys Glu Thr Pro Ile Ala Val Arg Arg Gly Phe
65 70 75 80
Pro Gly Asp Asp Glu Glu Ala Gln Arg Arg Ile Ile Met Ala Glu Ile
85 90 95
Pro Ser Leu Leu Gly Asn Val Thr Val Ile Asn Gly Tyr Phe Pro Gln
100 105 110
Gly Glu Ser Arg Asp His Pro Ile Lys Phe Pro Ala Lys Ala Gln Phe
115 120 125
Tyr Gln Asn Leu Gln Asn Tyr Leu Glu Thr Glu Leu Lys Arg Asp Asn
130 135 140
Pro Val Leu Ile Met Gly Asp Met Asn Ile Ser Pro Thr Asp Leu Asp
145 150 155 160
Ile Gly Ile Gly Glu Glu Asn Arg Lys Arg Trp Leu Arg Thr Gly Lys
165 170 175
Cys Ser Phe Leu Pro Glu Glu Arg Glu Trp Met Asp Arg Leu Met Ser
180 185 190
Trp Gly Leu Val Asp Thr Phe Arg His Ala Asn Pro Gln Thr Ala Asp
195 200 205
Arg Phe Ser Trp Phe Asp Tyr Arg Ser Lys Gly Phe Asp Asp Asn Arg
210 215 220
Gly Leu Arg Ile Asp Leu Leu Leu Ala Ser Gln Pro Leu Ala Glu Cys
225 230 235 240
Cys Val Glu Thr Gly Ile Asp Tyr Glu Ile Arg Ser Met Glu Lys Pro
245 250 255
Ser Asp His Ala Pro Val Trp Ala Thr Phe Arg Arg
260 265
<210> 14
<211> 1275
<212> DNA
<213> 嗜热栖热菌(Thermus thermophilus)
<400> 14
atgtttcgtc gtaaagaaga tctggatccg ccgctggcac tgctgccgct gaaaggcctg 60
cgcgaagccg ccgcactgct ggaagaagcg ctgcgtcaag gtaaacgcat tcgtgttcac 120
ggcgactatg atgcggatgg cctgaccggc accgcgatcc tggttcgtgg tctggccgcc 180
ctgggtgcgg atgttcatcc gtttatcccg caccgcctgg aagaaggcta tggtgtcctg 240
atggaacgcg tcccggaaca tctggaagcc tcggacctgt ttctgaccgt tgactgcggc 300
attaccaacc atgcggaact gcgcgaactg ctggaaaatg gcgtggaagt cattgttacc 360
gatcatcata cgccgggcaa aacgccgccg ccgggtctgg tcgtgcatcc ggcgctgacg 420
ccggatctga aagaaaaacc gaccggcgca ggcgtggcgt ttctgctgct gtgggcactg 480
catgaacgcc tgggcctgcc gccgccgctg gaatacgcgg acctggcagc cgttggcacc 540
attgccgacg ttgccccgct gtggggttgg aatcgtgcac tggtgaaaga aggtctggca 600
cgcatcccgg cttcatcttg ggtgggcctg cgtctgctgg ctgaagccgt gggctatacc 660
ggcaaagcgg tcgaagtcgc tttccgcatc gcgccgcgca tcaatgcggc ttcccgcctg 720
ggcgaagcgg aaaaagccct gcgcctgctg ctgacggatg atgcggcaga agctcaggcg 780
ctggtcggcg aactgcaccg tctgaacgcc cgtcgtcaga ccctggaaga agcgatgctg 840
cgcaaactgc tgccgcaggc cgacccggaa gcgaaagcca tcgttctgct ggacccggaa 900
ggccatccgg gtgttatggg tattgtggcc tctcgcatcc tggaagcgac cctgcgcccg 960
gtctttctgg tggcccaggg caaaggcacc gtgcgttcgc tggctccgat ttccgccgtc 1020
gaagcactgc gcagcgcgga agatctgctg ctgcgttatg gtggtcataa agaagcggcg 1080
ggtttcgcaa tggatgaagc gctgtttccg gcgttcaaag cacgcgttga agcgtatgcc 1140
gcacgtttcc cggatccggt tcgtgaagtg gcactgctgg atctgctgcc ggaaccgggc 1200
ctgctgccgc aggtgttccg tgaactggca ctgctggaac cgtatggtga aggtaacccg 1260
gaaccgctgt tcctg 1275
<210> 15
<211> 425
<212> PRT
<213> 嗜热栖热菌(Thermus thermophilus)
<400> 15
Met Phe Arg Arg Lys Glu Asp Leu Asp Pro Pro Leu Ala Leu Leu Pro
1 5 10 15
Leu Lys Gly Leu Arg Glu Ala Ala Ala Leu Leu Glu Glu Ala Leu Arg
20 25 30
Gln Gly Lys Arg Ile Arg Val His Gly Asp Tyr Asp Ala Asp Gly Leu
35 40 45
Thr Gly Thr Ala Ile Leu Val Arg Gly Leu Ala Ala Leu Gly Ala Asp
50 55 60
Val His Pro Phe Ile Pro His Arg Leu Glu Glu Gly Tyr Gly Val Leu
65 70 75 80
Met Glu Arg Val Pro Glu His Leu Glu Ala Ser Asp Leu Phe Leu Thr
85 90 95
Val Asp Cys Gly Ile Thr Asn His Ala Glu Leu Arg Glu Leu Leu Glu
100 105 110
Asn Gly Val Glu Val Ile Val Thr Asp His His Thr Pro Gly Lys Thr
115 120 125
Pro Pro Pro Gly Leu Val Val His Pro Ala Leu Thr Pro Asp Leu Lys
130 135 140
Glu Lys Pro Thr Gly Ala Gly Val Ala Phe Leu Leu Leu Trp Ala Leu
145 150 155 160
His Glu Arg Leu Gly Leu Pro Pro Pro Leu Glu Tyr Ala Asp Leu Ala
165 170 175
Ala Val Gly Thr Ile Ala Asp Val Ala Pro Leu Trp Gly Trp Asn Arg
180 185 190
Ala Leu Val Lys Glu Gly Leu Ala Arg Ile Pro Ala Ser Ser Trp Val
195 200 205
Gly Leu Arg Leu Leu Ala Glu Ala Val Gly Tyr Thr Gly Lys Ala Val
210 215 220
Glu Val Ala Phe Arg Ile Ala Pro Arg Ile Asn Ala Ala Ser Arg Leu
225 230 235 240
Gly Glu Ala Glu Lys Ala Leu Arg Leu Leu Leu Thr Asp Asp Ala Ala
245 250 255
Glu Ala Gln Ala Leu Val Gly Glu Leu His Arg Leu Asn Ala Arg Arg
260 265 270
Gln Thr Leu Glu Glu Ala Met Leu Arg Lys Leu Leu Pro Gln Ala Asp
275 280 285
Pro Glu Ala Lys Ala Ile Val Leu Leu Asp Pro Glu Gly His Pro Gly
290 295 300
Val Met Gly Ile Val Ala Ser Arg Ile Leu Glu Ala Thr Leu Arg Pro
305 310 315 320
Val Phe Leu Val Ala Gln Gly Lys Gly Thr Val Arg Ser Leu Ala Pro
325 330 335
Ile Ser Ala Val Glu Ala Leu Arg Ser Ala Glu Asp Leu Leu Leu Arg
340 345 350
Tyr Gly Gly His Lys Glu Ala Ala Gly Phe Ala Met Asp Glu Ala Leu
355 360 365
Phe Pro Ala Phe Lys Ala Arg Val Glu Ala Tyr Ala Ala Arg Phe Pro
370 375 380
Asp Pro Val Arg Glu Val Ala Leu Leu Asp Leu Leu Pro Glu Pro Gly
385 390 395 400
Leu Leu Pro Gln Val Phe Arg Glu Leu Ala Leu Leu Glu Pro Tyr Gly
405 410 415
Glu Gly Asn Pro Glu Pro Leu Phe Leu
420 425
<210> 16
<211> 738
<212> DNA
<213> λ噬菌体(Bacteriophage lambda)
<400> 16
tccggaagcg gctctggtag tggttctggc atgacaccgg acattatcct gcagcgtacc 60
gggatcgatg tgagagctgt cgaacagggg gatgatgcgt ggcacaaatt acggctcggc 120
gtcatcaccg cttcagaagt tcacaacgtg atagcaaaac cccgctccgg aaagaagtgg 180
cctgacatga aaatgtccta cttccacacc ctgcttgctg aggtttgcac cggtgtggct 240
ccggaagtta acgctaaagc actggcctgg ggaaaacagt acgagaacga cgccagaacc 300
ctgtttgaat tcacttccgg cgtgaatgtt actgaatccc cgatcatcta tcgcgacgaa 360
agtatgcgta ccgcctgctc tcccgatggt ttatgcagtg acggcaacgg ccttgaactg 420
aaatgcccgt ttacctcccg ggatttcatg aagttccggc tcggtggttt cgaggccata 480
aagtcagctt acatggccca ggtgcagtac agcatgtggg tgacgcgaaa aaatgcctgg 540
tactttgcca actatgaccc gcgtatgaag cgtgaaggcc tgcattatgt cgtgattgag 600
cgggatgaaa agtacatggc gagttttgac gagatcgtgc cggagttcat cgaaaaaatg 660
gacgaggcac tggctgaaat tggttttgta tttggggagc aatggcgatc tggctctggt 720
tccggcagcg gttccgga 738
<210> 17
<211> 226
<212> PRT
<213> λ噬菌体(Bacteriophage lambda)
<400> 17
Met Thr Pro Asp Ile Ile Leu Gln Arg Thr Gly Ile Asp Val Arg Ala
1 5 10 15
Val Glu Gln Gly Asp Asp Ala Trp His Lys Leu Arg Leu Gly Val Ile
20 25 30
Thr Ala Ser Glu Val His Asn Val Ile Ala Lys Pro Arg Ser Gly Lys
35 40 45
Lys Trp Pro Asp Met Lys Met Ser Tyr Phe His Thr Leu Leu Ala Glu
50 55 60
Val Cys Thr Gly Val Ala Pro Glu Val Asn Ala Lys Ala Leu Ala Trp
65 70 75 80
Gly Lys Gln Tyr Glu Asn Asp Ala Arg Thr Leu Phe Glu Phe Thr Ser
85 90 95
Gly Val Asn Val Thr Glu Ser Pro Ile Ile Tyr Arg Asp Glu Ser Met
100 105 110
Arg Thr Ala Cys Ser Pro Asp Gly Leu Cys Ser Asp Gly Asn Gly Leu
115 120 125
Glu Leu Lys Cys Pro Phe Thr Ser Arg Asp Phe Met Lys Phe Arg Leu
130 135 140
Gly Gly Phe Glu Ala Ile Lys Ser Ala Tyr Met Ala Gln Val Gln Tyr
145 150 155 160
Ser Met Trp Val Thr Arg Lys Asn Ala Trp Tyr Phe Ala Asn Tyr Asp
165 170 175
Pro Arg Met Lys Arg Glu Gly Leu His Tyr Val Val Ile Glu Arg Asp
180 185 190
Glu Lys Tyr Met Ala Ser Phe Asp Glu Ile Val Pro Glu Phe Ile Glu
195 200 205
Lys Met Asp Glu Ala Leu Ala Glu Ile Gly Phe Val Phe Gly Glu Gln
210 215 220
Trp Arg
225
<210> 18
<211> 760
<212> PRT
<213> 布氏拟甲烷球菌(Methanococcoides burtonii)
<400> 18
Met Met Ile Arg Glu Leu Asp Ile Pro Arg Asp Ile Ile Gly Phe Tyr
1 5 10 15
Glu Asp Ser Gly Ile Lys Glu Leu Tyr Pro Pro Gln Ala Glu Ala Ile
20 25 30
Glu Met Gly Leu Leu Glu Lys Lys Asn Leu Leu Ala Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Leu Ala Glu Leu Ala Met Ile Lys Ala Ile
50 55 60
Arg Glu Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala
65 70 75 80
Ser Glu Lys Phe Glu Arg Phe Lys Glu Leu Ala Pro Phe Gly Ile Lys
85 90 95
Val Gly Ile Ser Thr Gly Asp Leu Asp Ser Arg Ala Asp Trp Leu Gly
100 105 110
Val Asn Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu
115 120 125
Arg Asn Gly Thr Ser Trp Met Asp Glu Ile Thr Thr Val Val Val Asp
130 135 140
Glu Ile His Leu Leu Asp Ser Lys Asn Arg Gly Pro Thr Leu Glu Val
145 150 155 160
Thr Ile Thr Lys Leu Met Arg Leu Asn Pro Asp Val Gln Val Val Ala
165 170 175
Leu Ser Ala Thr Val Gly Asn Ala Arg Glu Met Ala Asp Trp Leu Gly
180 185 190
Ala Ala Leu Val Leu Ser Glu Trp Arg Pro Thr Asp Leu His Glu Gly
195 200 205
Val Leu Phe Gly Asp Ala Ile Asn Phe Pro Gly Ser Gln Lys Lys Ile
210 215 220
Asp Arg Leu Glu Lys Asp Asp Ala Val Asn Leu Val Leu Asp Thr Ile
225 230 235 240
Lys Ala Glu Gly Gln Cys Leu Val Phe Glu Ser Ser Arg Arg Asn Cys
245 250 255
Ala Gly Phe Ala Lys Thr Ala Ser Ser Lys Val Ala Lys Ile Leu Asp
260 265 270
Asn Asp Ile Met Ile Lys Leu Ala Gly Ile Ala Glu Glu Val Glu Ser
275 280 285
Thr Gly Glu Thr Asp Thr Ala Ile Val Leu Ala Asn Cys Ile Arg Lys
290 295 300
Gly Val Ala Phe His His Ala Gly Leu Asn Ser Asn His Arg Lys Leu
305 310 315 320
Val Glu Asn Gly Phe Arg Gln Asn Leu Ile Lys Val Ile Ser Ser Thr
325 330 335
Pro Thr Leu Ala Ala Gly Leu Asn Leu Pro Ala Arg Arg Val Ile Ile
340 345 350
Arg Ser Tyr Arg Arg Phe Asp Ser Asn Phe Gly Met Gln Pro Ile Pro
355 360 365
Val Leu Glu Tyr Lys Gln Met Ala Gly Arg Ala Gly Arg Pro His Leu
370 375 380
Asp Pro Tyr Gly Glu Ser Val Leu Leu Ala Lys Thr Tyr Asp Glu Phe
385 390 395 400
Ala Gln Leu Met Glu Asn Tyr Val Glu Ala Asp Ala Glu Asp Ile Trp
405 410 415
Ser Lys Leu Gly Thr Glu Asn Ala Leu Arg Thr His Val Leu Ser Thr
420 425 430
Ile Val Asn Gly Phe Ala Ser Thr Arg Gln Glu Leu Phe Asp Phe Phe
435 440 445
Gly Ala Thr Phe Phe Ala Tyr Gln Gln Asp Lys Trp Met Leu Glu Glu
450 455 460
Val Ile Asn Asp Cys Leu Glu Phe Leu Ile Asp Lys Ala Met Val Ser
465 470 475 480
Glu Thr Glu Asp Ile Glu Asp Ala Ser Lys Leu Phe Leu Arg Gly Thr
485 490 495
Arg Leu Gly Ser Leu Val Ser Met Leu Tyr Ile Asp Pro Leu Ser Gly
500 505 510
Ser Lys Ile Val Asp Gly Phe Lys Asp Ile Gly Lys Ser Thr Gly Gly
515 520 525
Asn Met Gly Ser Leu Glu Asp Asp Lys Gly Asp Asp Ile Thr Val Thr
530 535 540
Asp Met Thr Leu Leu His Leu Val Cys Ser Thr Pro Asp Met Arg Gln
545 550 555 560
Leu Tyr Leu Arg Asn Thr Asp Tyr Thr Ile Val Asn Glu Tyr Ile Val
565 570 575
Ala His Ser Asp Glu Phe His Glu Ile Pro Asp Lys Leu Lys Glu Thr
580 585 590
Asp Tyr Glu Trp Phe Met Gly Glu Val Lys Thr Ala Met Leu Leu Glu
595 600 605
Glu Trp Val Thr Glu Val Ser Ala Glu Asp Ile Thr Arg His Phe Asn
610 615 620
Val Gly Glu Gly Asp Ile His Ala Leu Ala Asp Thr Ser Glu Trp Leu
625 630 635 640
Met His Ala Ala Ala Lys Leu Ala Glu Leu Leu Gly Val Glu Tyr Ser
645 650 655
Ser His Ala Tyr Ser Leu Glu Lys Arg Ile Arg Tyr Gly Ser Gly Leu
660 665 670
Asp Leu Met Glu Leu Val Gly Ile Arg Gly Val Gly Arg Val Arg Ala
675 680 685
Arg Lys Leu Tyr Asn Ala Gly Phe Val Ser Val Ala Lys Leu Lys Gly
690 695 700
Ala Asp Ile Ser Val Leu Ser Lys Leu Val Gly Pro Lys Val Ala Tyr
705 710 715 720
Asn Ile Leu Ser Gly Ile Gly Val Arg Val Asn Asp Lys His Phe Asn
725 730 735
Ser Ala Pro Ile Ser Ser Asn Thr Leu Asp Thr Leu Leu Asp Lys Asn
740 745 750
Gln Lys Thr Phe Asn Asp Phe Gln
755 760
<210> 19
<211> 707
<212> PRT
<213> 海绵共生古菌(Cenarchaeum symbiosum)
<400> 19
Met Arg Ile Ser Glu Leu Asp Ile Pro Arg Pro Ala Ile Glu Phe Leu
1 5 10 15
Glu Gly Glu Gly Tyr Lys Lys Leu Tyr Pro Pro Gln Ala Ala Ala Ala
20 25 30
Lys Ala Gly Leu Thr Asp Gly Lys Ser Val Leu Val Ser Ala Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Ile Ala Ala Ile Ala Met Ile Ser His Leu
50 55 60
Ser Arg Asn Arg Gly Lys Ala Val Tyr Leu Ser Pro Leu Arg Ala Leu
65 70 75 80
Ala Ala Glu Lys Phe Ala Glu Phe Gly Lys Ile Gly Gly Ile Pro Leu
85 90 95
Gly Arg Pro Val Arg Val Gly Val Ser Thr Gly Asp Phe Glu Lys Ala
100 105 110
Gly Arg Ser Leu Gly Asn Asn Asp Ile Leu Val Leu Thr Asn Glu Arg
115 120 125
Met Asp Ser Leu Ile Arg Arg Arg Pro Asp Trp Met Asp Glu Val Gly
130 135 140
Leu Val Ile Ala Asp Glu Ile His Leu Ile Gly Asp Arg Ser Arg Gly
145 150 155 160
Pro Thr Leu Glu Met Val Leu Thr Lys Leu Arg Gly Leu Arg Ser Ser
165 170 175
Pro Gln Val Val Ala Leu Ser Ala Thr Ile Ser Asn Ala Asp Glu Ile
180 185 190
Ala Gly Trp Leu Asp Cys Thr Leu Val His Ser Thr Trp Arg Pro Val
195 200 205
Pro Leu Ser Glu Gly Val Tyr Gln Asp Gly Glu Val Ala Met Gly Asp
210 215 220
Gly Ser Arg His Glu Val Ala Ala Thr Gly Gly Gly Pro Ala Val Asp
225 230 235 240
Leu Ala Ala Glu Ser Val Ala Glu Gly Gly Gln Ser Leu Ile Phe Ala
245 250 255
Asp Thr Arg Ala Arg Ser Ala Ser Leu Ala Ala Lys Ala Ser Ala Val
260 265 270
Ile Pro Glu Ala Lys Gly Ala Asp Ala Ala Lys Leu Ala Ala Ala Ala
275 280 285
Lys Lys Ile Ile Ser Ser Gly Gly Glu Thr Lys Leu Ala Lys Thr Leu
290 295 300
Ala Glu Leu Val Glu Lys Gly Ala Ala Phe His His Ala Gly Leu Asn
305 310 315 320
Gln Asp Cys Arg Ser Val Val Glu Glu Glu Phe Arg Ser Gly Arg Ile
325 330 335
Arg Leu Leu Ala Ser Thr Pro Thr Leu Ala Ala Gly Val Asn Leu Pro
340 345 350
Ala Arg Arg Val Val Ile Ser Ser Val Met Arg Tyr Asn Ser Ser Ser
355 360 365
Gly Met Ser Glu Pro Ile Ser Ile Leu Glu Tyr Lys Gln Leu Cys Gly
370 375 380
Arg Ala Gly Arg Pro Gln Tyr Asp Lys Ser Gly Glu Ala Ile Val Val
385 390 395 400
Gly Gly Val Asn Ala Asp Glu Ile Phe Asp Arg Tyr Ile Gly Gly Glu
405 410 415
Pro Glu Pro Ile Arg Ser Ala Met Val Asp Asp Arg Ala Leu Arg Ile
420 425 430
His Val Leu Ser Leu Val Thr Thr Ser Pro Gly Ile Lys Glu Asp Asp
435 440 445
Val Thr Glu Phe Phe Leu Gly Thr Leu Gly Gly Gln Gln Ser Gly Glu
450 455 460
Ser Thr Val Lys Phe Ser Val Ala Val Ala Leu Arg Phe Leu Gln Glu
465 470 475 480
Glu Gly Met Leu Gly Arg Arg Gly Gly Arg Leu Ala Ala Thr Lys Met
485 490 495
Gly Arg Leu Val Ser Arg Leu Tyr Met Asp Pro Met Thr Ala Val Thr
500 505 510
Leu Arg Asp Ala Val Gly Glu Ala Ser Pro Gly Arg Met His Thr Leu
515 520 525
Gly Phe Leu His Leu Val Ser Glu Cys Ser Glu Phe Met Pro Arg Phe
530 535 540
Ala Leu Arg Gln Lys Asp His Glu Val Ala Glu Met Met Leu Glu Ala
545 550 555 560
Gly Arg Gly Glu Leu Leu Arg Pro Val Tyr Ser Tyr Glu Cys Gly Arg
565 570 575
Gly Leu Leu Ala Leu His Arg Trp Ile Gly Glu Ser Pro Glu Ala Lys
580 585 590
Leu Ala Glu Asp Leu Lys Phe Glu Ser Gly Asp Val His Arg Met Val
595 600 605
Glu Ser Ser Gly Trp Leu Leu Arg Cys Ile Trp Glu Ile Ser Lys His
610 615 620
Gln Glu Arg Pro Asp Leu Leu Gly Glu Leu Asp Val Leu Arg Ser Arg
625 630 635 640
Val Ala Tyr Gly Ile Lys Ala Glu Leu Val Pro Leu Val Ser Ile Lys
645 650 655
Gly Ile Gly Arg Val Arg Ser Arg Arg Leu Phe Arg Gly Gly Ile Lys
660 665 670
Gly Pro Gly Asp Leu Ala Ala Val Pro Val Glu Arg Leu Ser Arg Val
675 680 685
Glu Gly Ile Gly Ala Thr Leu Ala Asn Asn Ile Lys Ser Gln Leu Arg
690 695 700
Lys Gly Gly
705
<210> 20
<211> 720
<212> PRT
<213> 科超嗜热古菌(Thermococcus gammatolerans)
<400> 20
Met Lys Val Asp Glu Leu Pro Val Asp Glu Arg Leu Lys Ala Val Leu
1 5 10 15
Lys Glu Arg Gly Ile Glu Glu Leu Tyr Pro Pro Gln Ala Glu Ala Leu
20 25 30
Lys Ser Gly Ala Leu Glu Gly Arg Asn Leu Val Leu Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Val Ser Glu Ile Val Met Val Asn Lys Leu
50 55 60
Ile Gln Glu Gly Gly Lys Ala Val Tyr Leu Val Pro Leu Lys Ala Leu
65 70 75 80
Ala Glu Glu Lys Tyr Arg Glu Phe Lys Glu Trp Glu Lys Leu Gly Leu
85 90 95
Lys Val Ala Ala Thr Thr Gly Asp Tyr Asp Ser Thr Asp Asp Trp Leu
100 105 110
Gly Arg Tyr Asp Ile Ile Val Ala Thr Ala Glu Lys Phe Asp Ser Leu
115 120 125
Leu Arg His Gly Ala Arg Trp Ile Asn Asp Val Lys Leu Val Val Ala
130 135 140
Asp Glu Val His Leu Ile Gly Ser Tyr Asp Arg Gly Ala Thr Leu Glu
145 150 155 160
Met Ile Leu Thr His Met Leu Gly Arg Ala Gln Ile Leu Ala Leu Ser
165 170 175
Ala Thr Val Gly Asn Ala Glu Glu Leu Ala Glu Trp Leu Asp Ala Ser
180 185 190
Leu Val Val Ser Asp Trp Arg Pro Val Gln Leu Arg Arg Gly Val Phe
195 200 205
His Leu Gly Thr Leu Ile Trp Glu Asp Gly Lys Val Glu Ser Tyr Pro
210 215 220
Glu Asn Trp Tyr Ser Leu Val Val Asp Ala Val Lys Arg Gly Lys Gly
225 230 235 240
Ala Leu Val Phe Val Asn Thr Arg Arg Ser Ala Glu Lys Glu Ala Leu
245 250 255
Ala Leu Ser Lys Leu Val Ser Ser His Leu Thr Lys Pro Glu Lys Arg
260 265 270
Ala Leu Glu Ser Leu Ala Ser Gln Leu Glu Asp Asn Pro Thr Ser Glu
275 280 285
Lys Leu Lys Arg Ala Leu Arg Gly Gly Val Ala Phe His His Ala Gly
290 295 300
Leu Ser Arg Val Glu Arg Thr Leu Ile Glu Asp Ala Phe Arg Glu Gly
305 310 315 320
Leu Ile Lys Val Ile Thr Ala Thr Pro Thr Leu Ser Ala Gly Val Asn
325 330 335
Leu Pro Ser Phe Arg Val Ile Ile Arg Asp Thr Lys Arg Tyr Ala Gly
340 345 350
Phe Gly Trp Thr Asp Ile Pro Val Leu Glu Ile Gln Gln Met Met Gly
355 360 365
Arg Ala Gly Arg Pro Arg Tyr Asp Lys Tyr Gly Glu Ala Ile Ile Val
370 375 380
Ala Arg Thr Asp Glu Pro Gly Lys Leu Met Glu Arg Tyr Ile Arg Gly
385 390 395 400
Lys Pro Glu Lys Leu Phe Ser Met Leu Ala Asn Glu Gln Ala Phe Arg
405 410 415
Ser Gln Val Leu Ala Leu Ile Thr Asn Phe Gly Ile Arg Ser Phe Pro
420 425 430
Glu Leu Val Arg Phe Leu Glu Arg Thr Phe Tyr Ala His Gln Arg Lys
435 440 445
Asp Leu Ser Ser Leu Glu Tyr Lys Ala Lys Glu Val Val Tyr Phe Leu
450 455 460
Ile Glu Asn Glu Phe Ile Asp Leu Asp Leu Glu Asp Arg Phe Ile Pro
465 470 475 480
Leu Pro Phe Gly Lys Arg Thr Ser Gln Leu Tyr Ile Asp Pro Leu Thr
485 490 495
Ala Lys Lys Phe Lys Asp Ala Phe Pro Ala Ile Glu Arg Asn Pro Asn
500 505 510
Pro Phe Gly Ile Phe Gln Leu Ile Ala Ser Thr Pro Asp Met Ala Thr
515 520 525
Leu Thr Ala Arg Arg Arg Glu Met Glu Asp Tyr Leu Asp Leu Ala Tyr
530 535 540
Glu Leu Glu Asp Lys Leu Tyr Ala Ser Ile Pro Tyr Tyr Glu Asp Ser
545 550 555 560
Arg Phe Gln Gly Phe Leu Gly Gln Val Lys Thr Ala Lys Val Leu Leu
565 570 575
Asp Trp Ile Asn Glu Val Pro Glu Ala Arg Ile Tyr Glu Thr Tyr Ser
580 585 590
Ile Asp Pro Gly Asp Leu Tyr Arg Leu Leu Glu Leu Ala Asp Trp Leu
595 600 605
Met Tyr Ser Leu Ile Glu Leu Tyr Lys Leu Phe Glu Pro Lys Glu Glu
610 615 620
Ile Leu Asn Tyr Leu Arg Asp Leu His Leu Arg Leu Arg His Gly Val
625 630 635 640
Arg Glu Glu Leu Leu Glu Leu Val Arg Leu Pro Asn Ile Gly Arg Lys
645 650 655
Arg Ala Arg Ala Leu Tyr Asn Ala Gly Phe Arg Ser Val Glu Ala Ile
660 665 670
Ala Asn Ala Lys Pro Ala Glu Leu Leu Ala Val Glu Gly Ile Gly Ala
675 680 685
Lys Ile Leu Asp Gly Ile Tyr Arg His Leu Gly Ile Glu Lys Arg Val
690 695 700
Thr Glu Glu Lys Pro Lys Arg Lys Gly Thr Leu Glu Asp Phe Leu Arg
705 710 715 720
<210> 21
<211> 799
<212> PRT
<213> 亨氏甲烷螺菌(Methanospirillum hungatei)
<400> 21
Met Glu Ile Ala Ser Leu Pro Leu Pro Asp Ser Phe Ile Arg Ala Cys
1 5 10 15
His Ala Lys Gly Ile Arg Ser Leu Tyr Pro Pro Gln Ala Glu Cys Ile
20 25 30
Glu Lys Gly Leu Leu Glu Gly Lys Asn Leu Leu Ile Ser Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Leu Ala Glu Met Ala Met Trp Ser Arg Ile
50 55 60
Ala Ala Gly Gly Lys Cys Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala
65 70 75 80
Ser Glu Lys Tyr Asp Glu Phe Ser Lys Lys Gly Val Ile Arg Val Gly
85 90 95
Ile Ala Thr Gly Asp Leu Asp Arg Thr Asp Ala Tyr Leu Gly Glu Asn
100 105 110
Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu Arg Asn
115 120 125
Arg Thr Pro Trp Leu Ser Gln Ile Thr Cys Ile Val Leu Asp Glu Val
130 135 140
His Leu Ile Gly Ser Glu Asn Arg Gly Ala Thr Leu Glu Met Val Ile
145 150 155 160
Thr Lys Leu Arg Tyr Thr Asn Pro Val Met Gln Ile Ile Gly Leu Ser
165 170 175
Ala Thr Ile Gly Asn Pro Ala Gln Leu Ala Glu Trp Leu Asp Ala Thr
180 185 190
Leu Ile Thr Ser Thr Trp Arg Pro Val Asp Leu Arg Gln Gly Val Tyr
195 200 205
Tyr Asn Gly Lys Ile Arg Phe Ser Asp Ser Glu Arg Pro Ile Gln Gly
210 215 220
Lys Thr Lys His Asp Asp Leu Asn Leu Cys Leu Asp Thr Ile Glu Glu
225 230 235 240
Gly Gly Gln Cys Leu Val Phe Val Ser Ser Arg Arg Asn Ala Glu Gly
245 250 255
Phe Ala Lys Lys Ala Ala Gly Ala Leu Lys Ala Gly Ser Pro Asp Ser
260 265 270
Lys Ala Leu Ala Gln Glu Leu Arg Arg Leu Arg Asp Arg Asp Glu Gly
275 280 285
Asn Val Leu Ala Asp Cys Val Glu Arg Gly Ala Ala Phe His His Ala
290 295 300
Gly Leu Ile Arg Gln Glu Arg Thr Ile Ile Glu Glu Gly Phe Arg Asn
305 310 315 320
Gly Tyr Ile Glu Val Ile Ala Ala Thr Pro Thr Leu Ala Ala Gly Leu
325 330 335
Asn Leu Pro Ala Arg Arg Val Ile Ile Arg Asp Tyr Asn Arg Phe Ala
340 345 350
Ser Gly Leu Gly Met Val Pro Ile Pro Val Gly Glu Tyr His Gln Met
355 360 365
Ala Gly Arg Ala Gly Arg Pro His Leu Asp Pro Tyr Gly Glu Ala Val
370 375 380
Leu Leu Ala Lys Asp Ala Pro Ser Val Glu Arg Leu Phe Glu Thr Phe
385 390 395 400
Ile Asp Ala Glu Ala Glu Arg Val Asp Ser Gln Cys Val Asp Asp Ala
405 410 415
Ser Leu Cys Ala His Ile Leu Ser Leu Ile Ala Thr Gly Phe Ala His
420 425 430
Asp Gln Glu Ala Leu Ser Ser Phe Met Glu Arg Thr Phe Tyr Phe Phe
435 440 445
Gln His Pro Lys Thr Arg Ser Leu Pro Arg Leu Val Ala Asp Ala Ile
450 455 460
Arg Phe Leu Thr Thr Ala Gly Met Val Glu Glu Arg Glu Asn Thr Leu
465 470 475 480
Ser Ala Thr Arg Leu Gly Ser Leu Val Ser Arg Leu Tyr Leu Asn Pro
485 490 495
Cys Thr Ala Arg Leu Ile Leu Asp Ser Leu Lys Ser Cys Lys Thr Pro
500 505 510
Thr Leu Ile Gly Leu Leu His Val Ile Cys Val Ser Pro Asp Met Gln
515 520 525
Arg Leu Tyr Leu Lys Ala Ala Asp Thr Gln Leu Leu Arg Thr Phe Leu
530 535 540
Phe Lys His Lys Asp Asp Leu Ile Leu Pro Leu Pro Phe Glu Gln Glu
545 550 555 560
Glu Glu Glu Leu Trp Leu Ser Gly Leu Lys Thr Ala Leu Val Leu Thr
565 570 575
Asp Trp Ala Asp Glu Phe Ser Glu Gly Met Ile Glu Glu Arg Tyr Gly
580 585 590
Ile Gly Ala Gly Asp Leu Tyr Asn Ile Val Asp Ser Gly Lys Trp Leu
595 600 605
Leu His Gly Thr Glu Arg Leu Val Ser Val Glu Met Pro Glu Met Ser
610 615 620
Gln Val Val Lys Thr Leu Ser Val Arg Val His His Gly Val Lys Ser
625 630 635 640
Glu Leu Leu Pro Leu Val Ala Leu Arg Asn Ile Gly Arg Val Arg Ala
645 650 655
Arg Thr Leu Tyr Asn Ala Gly Tyr Pro Asp Pro Glu Ala Val Ala Arg
660 665 670
Ala Gly Leu Ser Thr Ile Ala Arg Ile Ile Gly Glu Gly Ile Ala Arg
675 680 685
Gln Val Ile Asp Glu Ile Thr Gly Val Lys Arg Ser Gly Ile His Ser
690 695 700
Ser Asp Asp Asp Tyr Gln Gln Lys Thr Pro Glu Leu Leu Thr Asp Ile
705 710 715 720
Pro Gly Ile Gly Lys Lys Met Ala Glu Lys Leu Gln Asn Ala Gly Ile
725 730 735
Ile Thr Val Ser Asp Leu Leu Thr Ala Asp Glu Val Leu Leu Ser Asp
740 745 750
Val Leu Gly Ala Ala Arg Ala Arg Lys Val Leu Ala Phe Leu Ser Asn
755 760 765
Ser Glu Lys Glu Asn Ser Ser Ser Asp Lys Thr Glu Glu Ile Pro Asp
770 775 780
Thr Gln Lys Ile Arg Gly Gln Ser Ser Trp Glu Asp Phe Gly Cys
785 790 795
<210> 22
<211> 1756
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 22
Met Met Ser Ile Ala Gln Val Arg Ser Ala Gly Ser Ala Gly Asn Tyr
1 5 10 15
Tyr Thr Asp Lys Asp Asn Tyr Tyr Val Leu Gly Ser Met Gly Glu Arg
20 25 30
Trp Ala Gly Lys Gly Ala Glu Gln Leu Gly Leu Gln Gly Ser Val Asp
35 40 45
Lys Asp Val Phe Thr Arg Leu Leu Glu Gly Arg Leu Pro Asp Gly Ala
50 55 60
Asp Leu Ser Arg Met Gln Asp Gly Ser Asn Lys His Arg Pro Gly Tyr
65 70 75 80
Asp Leu Thr Phe Ser Ala Pro Lys Ser Val Ser Met Met Ala Met Leu
85 90 95
Gly Gly Asp Lys Arg Leu Ile Asp Ala His Asn Gln Ala Val Asp Phe
100 105 110
Ala Val Arg Gln Val Glu Ala Leu Ala Ser Thr Arg Val Met Thr Asp
115 120 125
Gly Gln Ser Glu Thr Val Leu Thr Gly Asn Leu Val Met Ala Leu Phe
130 135 140
Asn His Asp Thr Ser Arg Asp Gln Glu Pro Gln Leu His Thr His Ala
145 150 155 160
Val Val Ala Asn Val Thr Gln His Asn Gly Glu Trp Lys Thr Leu Ser
165 170 175
Ser Asp Lys Val Gly Lys Thr Gly Phe Ile Glu Asn Val Tyr Ala Asn
180 185 190
Gln Ile Ala Phe Gly Arg Leu Tyr Arg Glu Lys Leu Lys Glu Gln Val
195 200 205
Glu Ala Leu Gly Tyr Glu Thr Glu Val Val Gly Lys His Gly Met Trp
210 215 220
Glu Met Pro Gly Val Pro Val Glu Ala Phe Ser Gly Arg Ser Gln Ala
225 230 235 240
Ile Arg Glu Ala Val Gly Glu Asp Ala Ser Leu Lys Ser Arg Asp Val
245 250 255
Ala Ala Leu Asp Thr Arg Lys Ser Lys Gln His Val Asp Pro Glu Ile
260 265 270
Arg Met Ala Glu Trp Met Gln Thr Leu Lys Glu Thr Gly Phe Asp Ile
275 280 285
Arg Ala Tyr Arg Asp Ala Ala Asp Gln Arg Thr Glu Ile Arg Thr Gln
290 295 300
Ala Pro Gly Pro Ala Ser Gln Asp Gly Pro Asp Val Gln Gln Ala Val
305 310 315 320
Thr Gln Ala Ile Ala Gly Leu Ser Glu Arg Lys Val Gln Phe Thr Tyr
325 330 335
Thr Asp Val Leu Ala Arg Thr Val Gly Ile Leu Pro Pro Glu Asn Gly
340 345 350
Val Ile Glu Arg Ala Arg Ala Gly Ile Asp Glu Ala Ile Ser Arg Glu
355 360 365
Gln Leu Ile Pro Leu Asp Arg Glu Lys Gly Leu Phe Thr Ser Gly Ile
370 375 380
His Val Leu Asp Glu Leu Ser Val Arg Ala Leu Ser Arg Asp Ile Met
385 390 395 400
Lys Gln Asn Arg Val Thr Val His Pro Glu Lys Ser Val Pro Arg Thr
405 410 415
Ala Gly Tyr Ser Asp Ala Val Ser Val Leu Ala Gln Asp Arg Pro Ser
420 425 430
Leu Ala Ile Val Ser Gly Gln Gly Gly Ala Ala Gly Gln Arg Glu Arg
435 440 445
Val Ala Glu Leu Val Met Met Ala Arg Glu Gln Gly Arg Glu Val Gln
450 455 460
Ile Ile Ala Ala Asp Arg Arg Ser Gln Met Asn Leu Lys Gln Asp Glu
465 470 475 480
Arg Leu Ser Gly Glu Leu Ile Thr Gly Arg Arg Gln Leu Leu Glu Gly
485 490 495
Met Ala Phe Thr Pro Gly Ser Thr Val Ile Val Asp Gln Gly Glu Lys
500 505 510
Leu Ser Leu Lys Glu Thr Leu Thr Leu Leu Asp Gly Ala Ala Arg His
515 520 525
Asn Val Gln Val Leu Ile Thr Asp Ser Gly Gln Arg Thr Gly Thr Gly
530 535 540
Ser Ala Leu Met Ala Met Lys Asp Ala Gly Val Asn Thr Tyr Arg Trp
545 550 555 560
Gln Gly Gly Glu Gln Arg Pro Ala Thr Ile Ile Ser Glu Pro Asp Arg
565 570 575
Asn Val Arg Tyr Ala Arg Leu Ala Gly Asp Phe Ala Ala Ser Val Lys
580 585 590
Ala Gly Glu Glu Ser Val Ala Gln Val Ser Gly Val Arg Glu Gln Ala
595 600 605
Ile Leu Thr Gln Ala Ile Arg Ser Glu Leu Lys Thr Gln Gly Val Leu
610 615 620
Gly His Pro Glu Val Thr Met Thr Ala Leu Ser Pro Val Trp Leu Asp
625 630 635 640
Ser Arg Ser Arg Tyr Leu Arg Asp Met Tyr Arg Pro Gly Met Val Met
645 650 655
Glu Gln Trp Asn Pro Glu Thr Arg Ser His Asp Arg Tyr Val Ile Asp
660 665 670
Arg Val Thr Ala Gln Ser His Ser Leu Thr Leu Arg Asp Ala Gln Gly
675 680 685
Glu Thr Gln Val Val Arg Ile Ser Ser Leu Asp Ser Ser Trp Ser Leu
690 695 700
Phe Arg Pro Glu Lys Met Pro Val Ala Asp Gly Glu Arg Leu Arg Val
705 710 715 720
Thr Gly Lys Ile Pro Gly Leu Arg Val Ser Gly Gly Asp Arg Leu Gln
725 730 735
Val Ala Ser Val Ser Glu Asp Ala Met Thr Val Val Val Pro Gly Arg
740 745 750
Ala Glu Pro Ala Ser Leu Pro Val Ser Asp Ser Pro Phe Thr Ala Leu
755 760 765
Lys Leu Glu Asn Gly Trp Val Glu Thr Pro Gly His Ser Val Ser Asp
770 775 780
Ser Ala Thr Val Phe Ala Ser Val Thr Gln Met Ala Met Asp Asn Ala
785 790 795 800
Thr Leu Asn Gly Leu Ala Arg Ser Gly Arg Asp Val Arg Leu Tyr Ser
805 810 815
Ser Leu Asp Glu Thr Arg Thr Ala Glu Lys Leu Ala Arg His Pro Ser
820 825 830
Phe Thr Val Val Ser Glu Gln Ile Lys Ala Arg Ala Gly Glu Thr Leu
835 840 845
Leu Glu Thr Ala Ile Ser Leu Gln Lys Ala Gly Leu His Thr Pro Ala
850 855 860
Gln Gln Ala Ile His Leu Ala Leu Pro Val Leu Glu Ser Lys Asn Leu
865 870 875 880
Ala Phe Ser Met Val Asp Leu Leu Thr Glu Ala Lys Ser Phe Ala Ala
885 890 895
Glu Gly Thr Gly Phe Thr Glu Leu Gly Gly Glu Ile Asn Ala Gln Ile
900 905 910
Lys Arg Gly Asp Leu Leu Tyr Val Asp Val Ala Lys Gly Tyr Gly Thr
915 920 925
Gly Leu Leu Val Ser Arg Ala Ser Tyr Glu Ala Glu Lys Ser Ile Leu
930 935 940
Arg His Ile Leu Glu Gly Lys Glu Ala Val Thr Pro Leu Met Glu Arg
945 950 955 960
Val Pro Gly Glu Leu Met Glu Thr Leu Thr Ser Gly Gln Arg Ala Ala
965 970 975
Thr Arg Met Ile Leu Glu Thr Ser Asp Arg Phe Thr Val Val Gln Gly
980 985 990
Tyr Ala Gly Val Gly Lys Thr Thr Gln Phe Arg Ala Val Met Ser Ala
995 1000 1005
Val Asn Met Leu Pro Ala Ser Glu Arg Pro Arg Val Val Gly Leu
1010 1015 1020
Gly Pro Thr His Arg Ala Val Gly Glu Met Arg Ser Ala Gly Val
1025 1030 1035
Asp Ala Gln Thr Leu Ala Ser Phe Leu His Asp Thr Gln Leu Gln
1040 1045 1050
Gln Arg Ser Gly Glu Thr Pro Asp Phe Ser Asn Thr Leu Phe Leu
1055 1060 1065
Leu Asp Glu Ser Ser Met Val Gly Asn Thr Glu Met Ala Arg Ala
1070 1075 1080
Tyr Ala Leu Ile Ala Ala Gly Gly Gly Arg Ala Val Ala Ser Gly
1085 1090 1095
Asp Thr Asp Gln Leu Gln Ala Ile Ala Pro Gly Gln Ser Phe Arg
1100 1105 1110
Leu Gln Gln Thr Arg Ser Ala Ala Asp Val Val Ile Met Lys Glu
1115 1120 1125
Ile Val Arg Gln Thr Pro Glu Leu Arg Glu Ala Val Tyr Ser Leu
1130 1135 1140
Ile Asn Arg Asp Val Glu Arg Ala Leu Ser Gly Leu Glu Ser Val
1145 1150 1155
Lys Pro Ser Gln Val Pro Arg Leu Glu Gly Ala Trp Ala Pro Glu
1160 1165 1170
His Ser Val Thr Glu Phe Ser His Ser Gln Glu Ala Lys Leu Ala
1175 1180 1185
Glu Ala Gln Gln Lys Ala Met Leu Lys Gly Glu Ala Phe Pro Asp
1190 1195 1200
Ile Pro Met Thr Leu Tyr Glu Ala Ile Val Arg Asp Tyr Thr Gly
1205 1210 1215
Arg Thr Pro Glu Ala Arg Glu Gln Thr Leu Ile Val Thr His Leu
1220 1225 1230
Asn Glu Asp Arg Arg Val Leu Asn Ser Met Ile His Asp Ala Arg
1235 1240 1245
Glu Lys Ala Gly Glu Leu Gly Lys Glu Gln Val Met Val Pro Val
1250 1255 1260
Leu Asn Thr Ala Asn Ile Arg Asp Gly Glu Leu Arg Arg Leu Ser
1265 1270 1275
Thr Trp Glu Lys Asn Pro Asp Ala Leu Ala Leu Val Asp Asn Val
1280 1285 1290
Tyr His Arg Ile Ala Gly Ile Ser Lys Asp Asp Gly Leu Ile Thr
1295 1300 1305
Leu Gln Asp Ala Glu Gly Asn Thr Arg Leu Ile Ser Pro Arg Glu
1310 1315 1320
Ala Val Ala Glu Gly Val Thr Leu Tyr Thr Pro Asp Lys Ile Arg
1325 1330 1335
Val Gly Thr Gly Asp Arg Met Arg Phe Thr Lys Ser Asp Arg Glu
1340 1345 1350
Arg Gly Tyr Val Ala Asn Ser Val Trp Thr Val Thr Ala Val Ser
1355 1360 1365
Gly Asp Ser Val Thr Leu Ser Asp Gly Gln Gln Thr Arg Val Ile
1370 1375 1380
Arg Pro Gly Gln Glu Arg Ala Glu Gln His Ile Asp Leu Ala Tyr
1385 1390 1395
Ala Ile Thr Ala His Gly Ala Gln Gly Ala Ser Glu Thr Phe Ala
1400 1405 1410
Ile Ala Leu Glu Gly Thr Glu Gly Asn Arg Lys Leu Met Ala Gly
1415 1420 1425
Phe Glu Ser Ala Tyr Val Ala Leu Ser Arg Met Lys Gln His Val
1430 1435 1440
Gln Val Tyr Thr Asp Asn Arg Gln Gly Trp Thr Asp Ala Ile Asn
1445 1450 1455
Asn Ala Val Gln Lys Gly Thr Ala His Asp Val Leu Glu Pro Lys
1460 1465 1470
Pro Asp Arg Glu Val Met Asn Ala Gln Arg Leu Phe Ser Thr Ala
1475 1480 1485
Arg Glu Leu Arg Asp Val Ala Ala Gly Arg Ala Val Leu Arg Gln
1490 1495 1500
Ala Gly Leu Ala Gly Gly Asp Ser Pro Ala Arg Phe Ile Ala Pro
1505 1510 1515
Gly Arg Lys Tyr Pro Gln Pro Tyr Val Ala Leu Pro Ala Phe Asp
1520 1525 1530
Arg Asn Gly Lys Ser Ala Gly Ile Trp Leu Asn Pro Leu Thr Thr
1535 1540 1545
Asp Asp Gly Asn Gly Leu Arg Gly Phe Ser Gly Glu Gly Arg Val
1550 1555 1560
Lys Gly Ser Gly Asp Ala Gln Phe Val Ala Leu Gln Gly Ser Arg
1565 1570 1575
Asn Gly Glu Ser Leu Leu Ala Asp Asn Met Gln Asp Gly Val Arg
1580 1585 1590
Ile Ala Arg Asp Asn Pro Asp Ser Gly Val Val Val Arg Ile Ala
1595 1600 1605
Gly Glu Gly Arg Pro Trp Asn Pro Gly Ala Ile Thr Gly Gly Arg
1610 1615 1620
Val Trp Gly Asp Ile Pro Asp Asn Ser Val Gln Pro Gly Ala Gly
1625 1630 1635
Asn Gly Glu Pro Val Thr Ala Glu Val Leu Ala Gln Arg Gln Ala
1640 1645 1650
Glu Glu Ala Ile Arg Arg Glu Thr Glu Arg Arg Ala Asp Glu Ile
1655 1660 1665
Val Arg Lys Met Ala Glu Asn Lys Pro Asp Leu Pro Asp Gly Lys
1670 1675 1680
Thr Glu Leu Ala Val Arg Asp Ile Ala Gly Gln Glu Arg Asp Arg
1685 1690 1695
Ser Ala Ile Ser Glu Arg Glu Thr Ala Leu Pro Glu Ser Val Leu
1700 1705 1710
Arg Glu Ser Gln Arg Glu Arg Glu Ala Val Arg Glu Val Ala Arg
1715 1720 1725
Glu Asn Leu Leu Gln Glu Arg Leu Gln Gln Met Glu Arg Asp Met
1730 1735 1740
Val Arg Asp Leu Gln Lys Glu Lys Thr Leu Gly Gly Asp
1745 1750 1755
<210> 23
<211> 726
<212> PRT
<213> 布氏拟甲烷球菌(Methanococcoides burtonii)
<400> 23
Met Ser Asp Lys Pro Ala Phe Met Lys Tyr Phe Thr Gln Ser Ser Cys
1 5 10 15
Tyr Pro Asn Gln Gln Glu Ala Met Asp Arg Ile His Ser Ala Leu Met
20 25 30
Gln Gln Gln Leu Val Leu Phe Glu Gly Ala Cys Gly Thr Gly Lys Thr
35 40 45
Leu Ser Ala Leu Val Pro Ala Leu His Val Gly Lys Met Leu Gly Lys
50 55 60
Thr Val Ile Ile Ala Thr Asn Val His Gln Gln Met Val Gln Phe Ile
65 70 75 80
Asn Glu Ala Arg Asp Ile Lys Lys Val Gln Asp Val Lys Val Ala Val
85 90 95
Ile Lys Gly Lys Thr Ala Met Cys Pro Gln Glu Ala Asp Tyr Glu Glu
100 105 110
Cys Ser Val Lys Arg Glu Asn Thr Phe Glu Leu Met Glu Thr Glu Arg
115 120 125
Glu Ile Tyr Leu Lys Arg Gln Glu Leu Asn Ser Ala Arg Asp Ser Tyr
130 135 140
Lys Lys Ser His Asp Pro Ala Phe Val Thr Leu Arg Asp Glu Leu Ser
145 150 155 160
Lys Glu Ile Asp Ala Val Glu Glu Lys Ala Arg Gly Leu Arg Asp Arg
165 170 175
Ala Cys Asn Asp Leu Tyr Glu Val Leu Arg Ser Asp Ser Glu Lys Phe
180 185 190
Arg Glu Trp Leu Tyr Lys Glu Val Arg Ser Pro Glu Glu Ile Asn Asp
195 200 205
His Ala Ile Lys Asp Gly Met Cys Gly Tyr Glu Leu Val Lys Arg Glu
210 215 220
Leu Lys His Ala Asp Leu Leu Ile Cys Asn Tyr His His Val Leu Asn
225 230 235 240
Pro Asp Ile Phe Ser Thr Val Leu Gly Trp Ile Glu Lys Glu Pro Gln
245 250 255
Glu Thr Ile Val Ile Phe Asp Glu Ala His Asn Leu Glu Ser Ala Ala
260 265 270
Arg Ser His Ser Ser Leu Ser Leu Thr Glu His Ser Ile Glu Lys Ala
275 280 285
Ile Thr Glu Leu Glu Ala Asn Leu Asp Leu Leu Ala Asp Asp Asn Ile
290 295 300
His Asn Leu Phe Asn Ile Phe Leu Glu Val Ile Ser Asp Thr Tyr Asn
305 310 315 320
Ser Arg Phe Lys Phe Gly Glu Arg Glu Arg Val Arg Lys Asn Trp Tyr
325 330 335
Asp Ile Arg Ile Ser Asp Pro Tyr Glu Arg Asn Asp Ile Val Arg Gly
340 345 350
Lys Phe Leu Arg Gln Ala Lys Gly Asp Phe Gly Glu Lys Asp Asp Ile
355 360 365
Gln Ile Leu Leu Ser Glu Ala Ser Glu Leu Gly Ala Lys Leu Asp Glu
370 375 380
Thr Tyr Arg Asp Gln Tyr Lys Lys Gly Leu Ser Ser Val Met Lys Arg
385 390 395 400
Ser His Ile Arg Tyr Val Ala Asp Phe Met Ser Ala Tyr Ile Glu Leu
405 410 415
Ser His Asn Leu Asn Tyr Tyr Pro Ile Leu Asn Val Arg Arg Asp Met
420 425 430
Asn Asp Glu Ile Tyr Gly Arg Val Glu Leu Phe Thr Cys Ile Pro Lys
435 440 445
Asn Val Thr Glu Pro Leu Phe Asn Ser Leu Phe Ser Val Ile Leu Met
450 455 460
Ser Ala Thr Leu His Pro Phe Glu Met Val Lys Lys Thr Leu Gly Ile
465 470 475 480
Thr Arg Asp Thr Cys Glu Met Ser Tyr Gly Thr Ser Phe Pro Glu Glu
485 490 495
Lys Arg Leu Ser Ile Ala Val Ser Ile Pro Pro Leu Phe Ala Lys Asn
500 505 510
Arg Asp Asp Arg His Val Thr Glu Leu Leu Glu Gln Val Leu Leu Asp
515 520 525
Ser Ile Glu Asn Ser Lys Gly Asn Val Ile Leu Phe Phe Gln Ser Ala
530 535 540
Phe Glu Ala Lys Arg Tyr Tyr Ser Lys Ile Glu Pro Leu Val Asn Val
545 550 555 560
Pro Val Phe Leu Asp Glu Val Gly Ile Ser Ser Gln Asp Val Arg Glu
565 570 575
Glu Phe Phe Ser Ile Gly Glu Glu Asn Gly Lys Ala Val Leu Leu Ser
580 585 590
Tyr Leu Trp Gly Thr Leu Ser Glu Gly Ile Asp Tyr Arg Asp Gly Arg
595 600 605
Gly Arg Thr Val Ile Ile Ile Gly Val Gly Tyr Pro Ala Leu Asn Asp
610 615 620
Arg Met Asn Ala Val Glu Ser Ala Tyr Asp His Val Phe Gly Tyr Gly
625 630 635 640
Ala Gly Trp Glu Phe Ala Ile Gln Val Pro Thr Ile Arg Lys Ile Arg
645 650 655
Gln Ala Met Gly Arg Val Val Arg Ser Pro Thr Asp Tyr Gly Ala Arg
660 665 670
Ile Leu Leu Asp Gly Arg Phe Leu Thr Asp Ser Lys Lys Arg Phe Gly
675 680 685
Lys Phe Ser Val Phe Glu Val Phe Pro Pro Ala Glu Arg Ser Glu Phe
690 695 700
Val Asp Val Asp Pro Glu Lys Val Lys Tyr Ser Leu Met Asn Phe Phe
705 710 715 720
Met Asp Asn Asp Glu Gln
725
<210> 24
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 本发明的MuA底物的双链部分
<400> 24
gttttcgcat ttatcgtgaa acgctttcgc gtttttcgtg cgccgcttca 50
<210> 25
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 本发明的MuA底物的双链部分
<220>
<221> misc_feature
<222> (1)..(1)
<223> n 为尿苷
<400> 25
ngaagcggcg cacgaaaaac gcgaaagcgt ttcacgataa atgcgaaaac 50
<210> 26
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 本发明的MuA底物的双链的突出链
<220>
<221> misc_feature
<222> (5)..(5)
<223> n 为尿苷
<400> 26
gatcngaagc ggcgcacgaa aaacgcgaaa gcgtttcacg ataaatgcga aaac 54
<210> 27
<211> 77
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 实施例1中使用的序列
<400> 27
tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt ggttgtttct 60
gttggtgctg atattgc 77
<210> 28
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 实施例1中使用的序列
<400> 28
gatctgaagc ggcgcacgaa aaacgcgaaa gcgtttcacg ataaatgcga aaac 54
<210> 29
<211> 48502
<212> DNA
<213> 肠杆菌噬菌体λ(Enterobacteria phage lambda)
<400> 29
gggcggcgac ctcgcgggtt ttcgctattt atgaaaattt tccggtttaa ggcgtttccg 60
ttcttcttcg tcataactta atgtttttat ttaaaatacc ctctgaaaag aaaggaaacg 120
acaggtgctg aaagcgaggc tttttggcct ctgtcgtttc ctttctctgt ttttgtccgt 180
ggaatgaaca atggaagtca acaaaaagca gctggctgac attttcggtg cgagtatccg 240
taccattcag aactggcagg aacagggaat gcccgttctg cgaggcggtg gcaagggtaa 300
tgaggtgctt tatgactctg ccgccgtcat aaaatggtat gccgaaaggg atgctgaaat 360
tgagaacgaa aagctgcgcc gggaggttga agaactgcgg caggccagcg aggcagatct 420
ccagccagga actattgagt acgaacgcca tcgacttacg cgtgcgcagg ccgacgcaca 480
ggaactgaag aatgccagag actccgctga agtggtggaa accgcattct gtactttcgt 540
gctgtcgcgg atcgcaggtg aaattgccag tattctcgac gggctccccc tgtcggtgca 600
gcggcgtttt ccggaactgg aaaaccgaca tgttgatttc ctgaaacggg atatcatcaa 660
agccatgaac aaagcagccg cgctggatga actgataccg gggttgctga gtgaatatat 720
cgaacagtca ggttaacagg ctgcggcatt ttgtccgcgc cgggcttcgc tcactgttca 780
ggccggagcc acagaccgcc gttgaatggg cggatgctaa ttactatctc ccgaaagaat 840
ccgcatacca ggaagggcgc tgggaaacac tgccctttca gcgggccatc atgaatgcga 900
tgggcagcga ctacatccgt gaggtgaatg tggtgaagtc tgcccgtgtc ggttattcca 960
aaatgctgct gggtgtttat gcctacttta tagagcataa gcagcgcaac acccttatct 1020
ggttgccgac ggatggtgat gccgagaact ttatgaaaac ccacgttgag ccgactattc 1080
gtgatattcc gtcgctgctg gcgctggccc cgtggtatgg caaaaagcac cgggataaca 1140
cgctcaccat gaagcgtttc actaatgggc gtggcttctg gtgcctgggc ggtaaagcgg 1200
caaaaaacta ccgtgaaaag tcggtggatg tggcgggtta tgatgaactt gctgcttttg 1260
atgatgatat tgaacaggaa ggctctccga cgttcctggg tgacaagcgt attgaaggct 1320
cggtctggcc aaagtccatc cgtggctcca cgccaaaagt gagaggcacc tgtcagattg 1380
agcgtgcagc cagtgaatcc ccgcatttta tgcgttttca tgttgcctgc ccgcattgcg 1440
gggaggagca gtatcttaaa tttggcgaca aagagacgcc gtttggcctc aaatggacgc 1500
cggatgaccc ctccagcgtg ttttatctct gcgagcataa tgcctgcgtc atccgccagc 1560
aggagctgga ctttactgat gcccgttata tctgcgaaaa gaccgggatc tggacccgtg 1620
atggcattct ctggttttcg tcatccggtg aagagattga gccacctgac agtgtgacct 1680
ttcacatctg gacagcgtac agcccgttca ccacctgggt gcagattgtc aaagactgga 1740
tgaaaacgaa aggggatacg ggaaaacgta aaaccttcgt aaacaccacg ctcggtgaga 1800
cgtgggaggc gaaaattggc gaacgtccgg atgctgaagt gatggcagag cggaaagagc 1860
attattcagc gcccgttcct gaccgtgtgg cttacctgac cgccggtatc gactcccagc 1920
tggaccgcta cgaaatgcgc gtatggggat gggggccggg tgaggaaagc tggctgattg 1980
accggcagat tattatgggc cgccacgacg atgaacagac gctgctgcgt gtggatgagg 2040
ccatcaataa aacctatacc cgccggaatg gtgcagaaat gtcgatatcc cgtatctgct 2100
gggatactgg cgggattgac ccgaccattg tgtatgaacg ctcgaaaaaa catgggctgt 2160
tccgggtgat ccccattaaa ggggcatccg tctacggaaa gccggtggcc agcatgccac 2220
gtaagcgaaa caaaaacggg gtttacctta ccgaaatcgg tacggatacc gcgaaagagc 2280
agatttataa ccgcttcaca ctgacgccgg aaggggatga accgcttccc ggtgccgttc 2340
acttcccgaa taacccggat atttttgatc tgaccgaagc gcagcagctg actgctgaag 2400
agcaggtcga aaaatgggtg gatggcagga aaaaaatact gtgggacagc aaaaagcgac 2460
gcaatgaggc actcgactgc ttcgtttatg cgctggcggc gctgcgcatc agtatttccc 2520
gctggcagct ggatctcagt gcgctgctgg cgagcctgca ggaagaggat ggtgcagcaa 2580
ccaacaagaa aacactggca gattacgccc gtgccttatc cggagaggat gaatgacgcg 2640
acaggaagaa cttgccgctg cccgtgcggc actgcatgac ctgatgacag gtaaacgggt 2700
ggcaacagta cagaaagacg gacgaagggt ggagtttacg gccacttccg tgtctgacct 2760
gaaaaaatat attgcagagc tggaagtgca gaccggcatg acacagcgac gcaggggacc 2820
tgcaggattt tatgtatgaa aacgcccacc attcccaccc ttctggggcc ggacggcatg 2880
acatcgctgc gcgaatatgc cggttatcac ggcggtggca gcggatttgg agggcagttg 2940
cggtcgtgga acccaccgag tgaaagtgtg gatgcagccc tgttgcccaa ctttacccgt 3000
ggcaatgccc gcgcagacga tctggtacgc aataacggct atgccgccaa cgccatccag 3060
ctgcatcagg atcatatcgt cgggtctttt ttccggctca gtcatcgccc aagctggcgc 3120
tatctgggca tcggggagga agaagcccgt gccttttccc gcgaggttga agcggcatgg 3180
aaagagtttg ccgaggatga ctgctgctgc attgacgttg agcgaaaacg cacgtttacc 3240
atgatgattc gggaaggtgt ggccatgcac gcctttaacg gtgaactgtt cgttcaggcc 3300
acctgggata ccagttcgtc gcggcttttc cggacacagt tccggatggt cagcccgaag 3360
cgcatcagca acccgaacaa taccggcgac agccggaact gccgtgccgg tgtgcagatt 3420
aatgacagcg gtgcggcgct gggatattac gtcagcgagg acgggtatcc tggctggatg 3480
ccgcagaaat ggacatggat accccgtgag ttacccggcg ggcgcgcctc gttcattcac 3540
gtttttgaac ccgtggagga cgggcagact cgcggtgcaa atgtgtttta cagcgtgatg 3600
gagcagatga agatgctcga cacgctgcag aacacgcagc tgcagagcgc cattgtgaag 3660
gcgatgtatg ccgccaccat tgagagtgag ctggatacgc agtcagcgat ggattttatt 3720
ctgggcgcga acagtcagga gcagcgggaa aggctgaccg gctggattgg tgaaattgcc 3780
gcgtattacg ccgcagcgcc ggtccggctg ggaggcgcaa aagtaccgca cctgatgccg 3840
ggtgactcac tgaacctgca gacggctcag gatacggata acggctactc cgtgtttgag 3900
cagtcactgc tgcggtatat cgctgccggg ctgggtgtct cgtatgagca gctttcccgg 3960
aattacgccc agatgagcta ctccacggca cgggccagtg cgaacgagtc gtgggcgtac 4020
tttatggggc ggcgaaaatt cgtcgcatcc cgtcaggcga gccagatgtt tctgtgctgg 4080
ctggaagagg ccatcgttcg ccgcgtggtg acgttacctt caaaagcgcg cttcagtttt 4140
caggaagccc gcagtgcctg ggggaactgc gactggatag gctccggtcg tatggccatc 4200
gatggtctga aagaagttca ggaagcggtg atgctgatag aagccggact gagtacctac 4260
gagaaagagt gcgcaaaacg cggtgacgac tatcaggaaa tttttgccca gcaggtccgt 4320
gaaacgatgg agcgccgtgc agccggtctt aaaccgcccg cctgggcggc tgcagcattt 4380
gaatccgggc tgcgacaatc aacagaggag gagaagagtg acagcagagc tgcgtaatct 4440
cccgcatatt gccagcatgg cctttaatga gccgctgatg cttgaacccg cctatgcgcg 4500
ggttttcttt tgtgcgcttg caggccagct tgggatcagc agcctgacgg atgcggtgtc 4560
cggcgacagc ctgactgccc aggaggcact cgcgacgctg gcattatccg gtgatgatga 4620
cggaccacga caggcccgca gttatcaggt catgaacggc atcgccgtgc tgccggtgtc 4680
cggcacgctg gtcagccgga cgcgggcgct gcagccgtac tcggggatga ccggttacaa 4740
cggcattatc gcccgtctgc aacaggctgc cagcgatccg atggtggacg gcattctgct 4800
cgatatggac acgcccggcg ggatggtggc gggggcattt gactgcgctg acatcatcgc 4860
ccgtgtgcgt gacataaaac cggtatgggc gcttgccaac gacatgaact gcagtgcagg 4920
tcagttgctt gccagtgccg cctcccggcg tctggtcacg cagaccgccc ggacaggctc 4980
catcggcgtc atgatggctc acagtaatta cggtgctgcg ctggagaaac agggtgtgga 5040
aatcacgctg atttacagcg gcagccataa ggtggatggc aacccctaca gccatcttcc 5100
ggatgacgtc cgggagacac tgcagtcccg gatggacgca acccgccaga tgtttgcgca 5160
gaaggtgtcg gcatataccg gcctgtccgt gcaggttgtg ctggataccg aggctgcagt 5220
gtacagcggt caggaggcca ttgatgccgg actggctgat gaacttgtta acagcaccga 5280
tgcgatcacc gtcatgcgtg atgcactgga tgcacgtaaa tcccgtctct caggagggcg 5340
aatgaccaaa gagactcaat caacaactgt ttcagccact gcttcgcagg ctgacgttac 5400
tgacgtggtg ccagcgacgg agggcgagaa cgccagcgcg gcgcagccgg acgtgaacgc 5460
gcagatcacc gcagcggttg cggcagaaaa cagccgcatt atggggatcc tcaactgtga 5520
ggaggctcac ggacgcgaag aacaggcacg cgtgctggca gaaacccccg gtatgaccgt 5580
gaaaacggcc cgccgcattc tggccgcagc accacagagt gcacaggcgc gcagtgacac 5640
tgcgctggat cgtctgatgc agggggcacc ggcaccgctg gctgcaggta acccggcatc 5700
tgatgccgtt aacgatttgc tgaacacacc agtgtaaggg atgtttatga cgagcaaaga 5760
aacctttacc cattaccagc cgcagggcaa cagtgacccg gctcataccg caaccgcgcc 5820
cggcggattg agtgcgaaag cgcctgcaat gaccccgctg atgctggaca cctccagccg 5880
taagctggtt gcgtgggatg gcaccaccga cggtgctgcc gttggcattc ttgcggttgc 5940
tgctgaccag accagcacca cgctgacgtt ctacaagtcc ggcacgttcc gttatgagga 6000
tgtgctctgg ccggaggctg ccagcgacga gacgaaaaaa cggaccgcgt ttgccggaac 6060
ggcaatcagc atcgtttaac tttacccttc atcactaaag gccgcctgtg cggctttttt 6120
tacgggattt ttttatgtcg atgtacacaa ccgcccaact gctggcggca aatgagcaga 6180
aatttaagtt tgatccgctg tttctgcgtc tctttttccg tgagagctat cccttcacca 6240
cggagaaagt ctatctctca caaattccgg gactggtaaa catggcgctg tacgtttcgc 6300
cgattgtttc cggtgaggtt atccgttccc gtggcggctc cacctctgaa tttacgccgg 6360
gatatgtcaa gccgaagcat gaagtgaatc cgcagatgac cctgcgtcgc ctgccggatg 6420
aagatccgca gaatctggcg gacccggctt accgccgccg tcgcatcatc atgcagaaca 6480
tgcgtgacga agagctggcc attgctcagg tcgaagagat gcaggcagtt tctgccgtgc 6540
ttaagggcaa atacaccatg accggtgaag ccttcgatcc ggttgaggtg gatatgggcc 6600
gcagtgagga gaataacatc acgcagtccg gcggcacgga gtggagcaag cgtgacaagt 6660
ccacgtatga cccgaccgac gatatcgaag cctacgcgct gaacgccagc ggtgtggtga 6720
atatcatcgt gttcgatccg aaaggctggg cgctgttccg ttccttcaaa gccgtcaagg 6780
agaagctgga tacccgtcgt ggctctaatt ccgagctgga gacagcggtg aaagacctgg 6840
gcaaagcggt gtcctataag gggatgtatg gcgatgtggc catcgtcgtg tattccggac 6900
agtacgtgga aaacggcgtc aaaaagaact tcctgccgga caacacgatg gtgctgggga 6960
acactcaggc acgcggtctg cgcacctatg gctgcattca ggatgcggac gcacagcgcg 7020
aaggcattaa cgcctctgcc cgttacccga aaaactgggt gaccaccggc gatccggcgc 7080
gtgagttcac catgattcag tcagcaccgc tgatgctgct ggctgaccct gatgagttcg 7140
tgtccgtaca actggcgtaa tcatggccct tcggggccat tgtttctctg tggaggagtc 7200
catgacgaaa gatgaactga ttgcccgtct ccgctcgctg ggtgaacaac tgaaccgtga 7260
tgtcagcctg acggggacga aagaagaact ggcgctccgt gtggcagagc tgaaagagga 7320
gcttgatgac acggatgaaa ctgccggtca ggacacccct ctcagccggg aaaatgtgct 7380
gaccggacat gaaaatgagg tgggatcagc gcagccggat accgtgattc tggatacgtc 7440
tgaactggtc acggtcgtgg cactggtgaa gctgcatact gatgcacttc acgccacgcg 7500
ggatgaacct gtggcatttg tgctgccggg aacggcgttt cgtgtctctg ccggtgtggc 7560
agccgaaatg acagagcgcg gcctggccag aatgcaataa cgggaggcgc tgtggctgat 7620
ttcgataacc tgttcgatgc tgccattgcc cgcgccgatg aaacgatacg cgggtacatg 7680
ggaacgtcag ccaccattac atccggtgag cagtcaggtg cggtgatacg tggtgttttt 7740
gatgaccctg aaaatatcag ctatgccgga cagggcgtgc gcgttgaagg ctccagcccg 7800
tccctgtttg tccggactga tgaggtgcgg cagctgcggc gtggagacac gctgaccatc 7860
ggtgaggaaa atttctgggt agatcgggtt tcgccggatg atggcggaag ttgtcatctc 7920
tggcttggac ggggcgtacc gcctgccgtt aaccgtcgcc gctgaaaggg ggatgtatgg 7980
ccataaaagg tcttgagcag gccgttgaaa acctcagccg tatcagcaaa acggcggtgc 8040
ctggtgccgc cgcaatggcc attaaccgcg ttgcttcatc cgcgatatcg cagtcggcgt 8100
cacaggttgc ccgtgagaca aaggtacgcc ggaaactggt aaaggaaagg gccaggctga 8160
aaagggccac ggtcaaaaat ccgcaggcca gaatcaaagt taaccggggg gatttgcccg 8220
taatcaagct gggtaatgcg cgggttgtcc tttcgcgccg caggcgtcgt aaaaaggggc 8280
agcgttcatc cctgaaaggt ggcggcagcg tgcttgtggt gggtaaccgt cgtattcccg 8340
gcgcgtttat tcagcaactg aaaaatggcc ggtggcatgt catgcagcgt gtggctggga 8400
aaaaccgtta ccccattgat gtggtgaaaa tcccgatggc ggtgccgctg accacggcgt 8460
ttaaacaaaa tattgagcgg atacggcgtg aacgtcttcc gaaagagctg ggctatgcgc 8520
tgcagcatca actgaggatg gtaataaagc gatgaaacat actgaactcc gtgcagccgt 8580
actggatgca ctggagaagc atgacaccgg ggcgacgttt tttgatggtc gccccgctgt 8640
ttttgatgag gcggattttc cggcagttgc cgtttatctc accggcgctg aatacacggg 8700
cgaagagctg gacagcgata cctggcaggc ggagctgcat atcgaagttt tcctgcctgc 8760
tcaggtgccg gattcagagc tggatgcgtg gatggagtcc cggatttatc cggtgatgag 8820
cgatatcccg gcactgtcag atttgatcac cagtatggtg gccagcggct atgactaccg 8880
gcgcgacgat gatgcgggct tgtggagttc agccgatctg acttatgtca ttacctatga 8940
aatgtgagga cgctatgcct gtaccaaatc ctacaatgcc ggtgaaaggt gccgggacca 9000
ccctgtgggt ttataagggg agcggtgacc cttacgcgaa tccgctttca gacgttgact 9060
ggtcgcgtct ggcaaaagtt aaagacctga cgcccggcga actgaccgct gagtcctatg 9120
acgacagcta tctcgatgat gaagatgcag actggactgc gaccgggcag gggcagaaat 9180
ctgccggaga taccagcttc acgctggcgt ggatgcccgg agagcagggg cagcaggcgc 9240
tgctggcgtg gtttaatgaa ggcgataccc gtgcctataa aatccgcttc ccgaacggca 9300
cggtcgatgt gttccgtggc tgggtcagca gtatcggtaa ggcggtgacg gcgaaggaag 9360
tgatcacccg cacggtgaaa gtcaccaatg tgggacgtcc gtcgatggca gaagatcgca 9420
gcacggtaac agcggcaacc ggcatgaccg tgacgcctgc cagcacctcg gtggtgaaag 9480
ggcagagcac cacgctgacc gtggccttcc agccggaggg cgtaaccgac aagagctttc 9540
gtgcggtgtc tgcggataaa acaaaagcca ccgtgtcggt cagtggtatg accatcaccg 9600
tgaacggcgt tgctgcaggc aaggtcaaca ttccggttgt atccggtaat ggtgagtttg 9660
ctgcggttgc agaaattacc gtcaccgcca gttaatccgg agagtcagcg atgttcctga 9720
aaaccgaatc atttgaacat aacggtgtga ccgtcacgct ttctgaactg tcagccctgc 9780
agcgcattga gcatctcgcc ctgatgaaac ggcaggcaga acaggcggag tcagacagca 9840
accggaagtt tactgtggaa gacgccatca gaaccggcgc gtttctggtg gcgatgtccc 9900
tgtggcataa ccatccgcag aagacgcaga tgccgtccat gaatgaagcc gttaaacaga 9960
ttgagcagga agtgcttacc acctggccca cggaggcaat ttctcatgct gaaaacgtgg 10020
tgtaccggct gtctggtatg tatgagtttg tggtgaataa tgcccctgaa cagacagagg 10080
acgccgggcc cgcagagcct gtttctgcgg gaaagtgttc gacggtgagc tgagttttgc 10140
cctgaaactg gcgcgtgaga tggggcgacc cgactggcgt gccatgcttg ccgggatgtc 10200
atccacggag tatgccgact ggcaccgctt ttacagtacc cattattttc atgatgttct 10260
gctggatatg cacttttccg ggctgacgta caccgtgctc agcctgtttt tcagcgatcc 10320
ggatatgcat ccgctggatt tcagtctgct gaaccggcgc gaggctgacg aagagcctga 10380
agatgatgtg ctgatgcaga aagcggcagg gcttgccgga ggtgtccgct ttggcccgga 10440
cgggaatgaa gttatccccg cttccccgga tgtggcggac atgacggagg atgacgtaat 10500
gctgatgaca gtatcagaag ggatcgcagg aggagtccgg tatggctgaa ccggtaggcg 10560
atctggtcgt tgatttgagt ctggatgcgg ccagatttga cgagcagatg gccagagtca 10620
ggcgtcattt ttctggtacg gaaagtgatg cgaaaaaaac agcggcagtc gttgaacagt 10680
cgctgagccg acaggcgctg gctgcacaga aagcggggat ttccgtcggg cagtataaag 10740
ccgccatgcg tatgctgcct gcacagttca ccgacgtggc cacgcagctt gcaggcgggc 10800
aaagtccgtg gctgatcctg ctgcaacagg gggggcaggt gaaggactcc ttcggcggga 10860
tgatccccat gttcaggggg cttgccggtg cgatcaccct gccgatggtg ggggccacct 10920
cgctggcggt ggcgaccggt gcgctggcgt atgcctggta tcagggcaac tcaaccctgt 10980
ccgatttcaa caaaacgctg gtcctttccg gcaatcaggc gggactgacg gcagatcgta 11040
tgctggtcct gtccagagcc gggcaggcgg cagggctgac gtttaaccag accagcgagt 11100
cactcagcgc actggttaag gcgggggtaa gcggtgaggc tcagattgcg tccatcagcc 11160
agagtgtggc gcgtttctcc tctgcatccg gcgtggaggt ggacaaggtc gctgaagcct 11220
tcgggaagct gaccacagac ccgacgtcgg ggctgacggc gatggctcgc cagttccata 11280
acgtgtcggc ggagcagatt gcgtatgttg ctcagttgca gcgttccggc gatgaagccg 11340
gggcattgca ggcggcgaac gaggccgcaa cgaaagggtt tgatgaccag acccgccgcc 11400
tgaaagagaa catgggcacg ctggagacct gggcagacag gactgcgcgg gcattcaaat 11460
ccatgtggga tgcggtgctg gatattggtc gtcctgatac cgcgcaggag atgctgatta 11520
aggcagaggc tgcgtataag aaagcagacg acatctggaa tctgcgcaag gatgattatt 11580
ttgttaacga tgaagcgcgg gcgcgttact gggatgatcg tgaaaaggcc cgtcttgcgc 11640
ttgaagccgc ccgaaagaag gctgagcagc agactcaaca ggacaaaaat gcgcagcagc 11700
agagcgatac cgaagcgtca cggctgaaat ataccgaaga ggcgcagaag gcttacgaac 11760
ggctgcagac gccgctggag aaatataccg cccgtcagga agaactgaac aaggcactga 11820
aagacgggaa aatcctgcag gcggattaca acacgctgat ggcggcggcg aaaaaggatt 11880
atgaagcgac gctgaaaaag ccgaaacagt ccagcgtgaa ggtgtctgcg ggcgatcgtc 11940
aggaagacag tgctcatgct gccctgctga cgcttcaggc agaactccgg acgctggaga 12000
agcatgccgg agcaaatgag aaaatcagcc agcagcgccg ggatttgtgg aaggcggaga 12060
gtcagttcgc ggtactggag gaggcggcgc aacgtcgcca gctgtctgca caggagaaat 12120
ccctgctggc gcataaagat gagacgctgg agtacaaacg ccagctggct gcacttggcg 12180
acaaggttac gtatcaggag cgcctgaacg cgctggcgca gcaggcggat aaattcgcac 12240
agcagcaacg ggcaaaacgg gccgccattg atgcgaaaag ccgggggctg actgaccggc 12300
aggcagaacg ggaagccacg gaacagcgcc tgaaggaaca gtatggcgat aatccgctgg 12360
cgctgaataa cgtcatgtca gagcagaaaa agacctgggc ggctgaagac cagcttcgcg 12420
ggaactggat ggcaggcctg aagtccggct ggagtgagtg ggaagagagc gccacggaca 12480
gtatgtcgca ggtaaaaagt gcagccacgc agacctttga tggtattgca cagaatatgg 12540
cggcgatgct gaccggcagt gagcagaact ggcgcagctt cacccgttcc gtgctgtcca 12600
tgatgacaga aattctgctt aagcaggcaa tggtggggat tgtcgggagt atcggcagcg 12660
ccattggcgg ggctgttggt ggcggcgcat ccgcgtcagg cggtacagcc attcaggccg 12720
ctgcggcgaa attccatttt gcaaccggag gatttacggg aaccggcggc aaatatgagc 12780
cagcggggat tgttcaccgt ggtgagtttg tcttcacgaa ggaggcaacc agccggattg 12840
gcgtggggaa tctttaccgg ctgatgcgcg gctatgccac cggcggttat gtcggtacac 12900
cgggcagcat ggcagacagc cggtcgcagg cgtccgggac gtttgagcag aataaccatg 12960
tggtgattaa caacgacggc acgaacgggc agataggtcc ggctgctctg aaggcggtgt 13020
atgacatggc ccgcaagggt gcccgtgatg aaattcagac acagatgcgt gatggtggcc 13080
tgttctccgg aggtggacga tgaagacctt ccgctggaaa gtgaaacccg gtatggatgt 13140
ggcttcggtc ccttctgtaa gaaaggtgcg ctttggtgat ggctattctc agcgagcgcc 13200
tgccgggctg aatgccaacc tgaaaacgta cagcgtgacg ctttctgtcc cccgtgagga 13260
ggccacggta ctggagtcgt ttctggaaga gcacgggggc tggaaatcct ttctgtggac 13320
gccgccttat gagtggcggc agataaaggt gacctgcgca aaatggtcgt cgcgggtcag 13380
tatgctgcgt gttgagttca gcgcagagtt tgaacaggtg gtgaactgat gcaggatatc 13440
cggcaggaaa cactgaatga atgcacccgt gcggagcagt cggccagcgt ggtgctctgg 13500
gaaatcgacc tgacagaggt cggtggagaa cgttattttt tctgtaatga gcagaacgaa 13560
aaaggtgagc cggtcacctg gcaggggcga cagtatcagc cgtatcccat tcaggggagc 13620
ggttttgaac tgaatggcaa aggcaccagt acgcgcccca cgctgacggt ttctaacctg 13680
tacggtatgg tcaccgggat ggcggaagat atgcagagtc tggtcggcgg aacggtggtc 13740
cggcgtaagg tttacgcccg ttttctggat gcggtgaact tcgtcaacgg aaacagttac 13800
gccgatccgg agcaggaggt gatcagccgc tggcgcattg agcagtgcag cgaactgagc 13860
gcggtgagtg cctcctttgt actgtccacg ccgacggaaa cggatggcgc tgtttttccg 13920
ggacgtatca tgctggccaa cacctgcacc tggacctatc gcggtgacga gtgcggttat 13980
agcggtccgg ctgtcgcgga tgaatatgac cagccaacgt ccgatatcac gaaggataaa 14040
tgcagcaaat gcctgagcgg ttgtaagttc cgcaataacg tcggcaactt tggcggcttc 14100
ctttccatta acaaactttc gcagtaaatc ccatgacaca gacagaatca gcgattctgg 14160
cgcacgcccg gcgatgtgcg ccagcggagt cgtgcggctt cgtggtaagc acgccggagg 14220
gggaaagata tttcccctgc gtgaatatct ccggtgagcc ggaggctatt tccgtatgtc 14280
gccggaagac tggctgcagg cagaaatgca gggtgagatt gtggcgctgg tccacagcca 14340
ccccggtggt ctgccctggc tgagtgaggc cgaccggcgg ctgcaggtgc agagtgattt 14400
gccgtggtgg ctggtctgcc gggggacgat tcataagttc cgctgtgtgc cgcatctcac 14460
cgggcggcgc tttgagcacg gtgtgacgga ctgttacaca ctgttccggg atgcttatca 14520
tctggcgggg attgagatgc cggactttca tcgtgaggat gactggtggc gtaacggcca 14580
gaatctctat ctggataatc tggaggcgac ggggctgtat caggtgccgt tgtcagcggc 14640
acagccgggc gatgtgctgc tgtgctgttt tggttcatca gtgccgaatc acgccgcaat 14700
ttactgcggc gacggcgagc tgctgcacca tattcctgaa caactgagca aacgagagag 14760
gtacaccgac aaatggcagc gacgcacaca ctccctctgg cgtcaccggg catggcgcgc 14820
atctgccttt acggggattt acaacgattt ggtcgccgca tcgaccttcg tgtgaaaacg 14880
ggggctgaag ccatccgggc actggccaca cagctcccgg cgtttcgtca gaaactgagc 14940
gacggctggt atcaggtacg gattgccggg cgggacgtca gcacgtccgg gttaacggcg 15000
cagttacatg agactctgcc tgatggcgct gtaattcata ttgttcccag agtcgccggg 15060
gccaagtcag gtggcgtatt ccagattgtc ctgggggctg ccgccattgc cggatcattc 15120
tttaccgccg gagccaccct tgcagcatgg ggggcagcca ttggggccgg tggtatgacc 15180
ggcatcctgt tttctctcgg tgccagtatg gtgctcggtg gtgtggcgca gatgctggca 15240
ccgaaagcca gaactccccg tatacagaca acggataacg gtaagcagaa cacctatttc 15300
tcctcactgg ataacatggt tgcccagggc aatgttctgc ctgttctgta cggggaaatg 15360
cgcgtggggt cacgcgtggt ttctcaggag atcagcacgg cagacgaagg ggacggtggt 15420
caggttgtgg tgattggtcg ctgatgcaaa atgttttatg tgaaaccgcc tgcgggcggt 15480
tttgtcattt atggagcgtg aggaatgggt aaaggaagca gtaaggggca taccccgcgc 15540
gaagcgaagg acaacctgaa gtccacgcag ttgctgagtg tgatcgatgc catcagcgaa 15600
gggccgattg aaggtccggt ggatggctta aaaagcgtgc tgctgaacag tacgccggtg 15660
ctggacactg aggggaatac caacatatcc ggtgtcacgg tggtgttccg ggctggtgag 15720
caggagcaga ctccgccgga gggatttgaa tcctccggct ccgagacggt gctgggtacg 15780
gaagtgaaat atgacacgcc gatcacccgc accattacgt ctgcaaacat cgaccgtctg 15840
cgctttacct tcggtgtaca ggcactggtg gaaaccacct caaagggtga caggaatccg 15900
tcggaagtcc gcctgctggt tcagatacaa cgtaacggtg gctgggtgac ggaaaaagac 15960
atcaccatta agggcaaaac cacctcgcag tatctggcct cggtggtgat gggtaacctg 16020
ccgccgcgcc cgtttaatat ccggatgcgc aggatgacgc cggacagcac cacagaccag 16080
ctgcagaaca aaacgctctg gtcgtcatac actgaaatca tcgatgtgaa acagtgctac 16140
ccgaacacgg cactggtcgg cgtgcaggtg gactcggagc agttcggcag ccagcaggtg 16200
agccgtaatt atcatctgcg cgggcgtatt ctgcaggtgc cgtcgaacta taacccgcag 16260
acgcggcaat acagcggtat ctgggacgga acgtttaaac cggcatacag caacaacatg 16320
gcctggtgtc tgtgggatat gctgacccat ccgcgctacg gcatggggaa acgtcttggt 16380
gcggcggatg tggataaatg ggcgctgtat gtcatcggcc agtactgcga ccagtcagtg 16440
ccggacggct ttggcggcac ggagccgcgc atcacctgta atgcgtacct gaccacacag 16500
cgtaaggcgt gggatgtgct cagcgatttc tgctcggcga tgcgctgtat gccggtatgg 16560
aacgggcaga cgctgacgtt cgtgcaggac cgaccgtcgg ataagacgtg gacctataac 16620
cgcagtaatg tggtgatgcc ggatgatggc gcgccgttcc gctacagctt cagcgccctg 16680
aaggaccgcc ataatgccgt tgaggtgaac tggattgacc cgaacaacgg ctgggagacg 16740
gcgacagagc ttgttgaaga tacgcaggcc attgcccgtt acggtcgtaa tgttacgaag 16800
atggatgcct ttggctgtac cagccggggg caggcacacc gcgccgggct gtggctgatt 16860
aaaacagaac tgctggaaac gcagaccgtg gatttcagcg tcggcgcaga agggcttcgc 16920
catgtaccgg gcgatgttat tgaaatctgc gatgatgact atgccggtat cagcaccggt 16980
ggtcgtgtgc tggcggtgaa cagccagacc cggacgctga cgctcgaccg tgaaatcacg 17040
ctgccatcct ccggtaccgc gctgataagc ctggttgacg gaagtggcaa tccggtcagc 17100
gtggaggttc agtccgtcac cgacggcgtg aaggtaaaag tgagccgtgt tcctgacggt 17160
gttgctgaat acagcgtatg ggagctgaag ctgccgacgc tgcgccagcg actgttccgc 17220
tgcgtgagta tccgtgagaa cgacgacggc acgtatgcca tcaccgccgt gcagcatgtg 17280
ccggaaaaag aggccatcgt ggataacggg gcgcactttg acggcgaaca gagtggcacg 17340
gtgaatggtg tcacgccgcc agcggtgcag cacctgaccg cagaagtcac tgcagacagc 17400
ggggaatatc aggtgctggc gcgatgggac acaccgaagg tggtgaaggg cgtgagtttc 17460
ctgctccgtc tgaccgtaac agcggacgac ggcagtgagc ggctggtcag cacggcccgg 17520
acgacggaaa ccacataccg cttcacgcaa ctggcgctgg ggaactacag gctgacagtc 17580
cgggcggtaa atgcgtgggg gcagcagggc gatccggcgt cggtatcgtt ccggattgcc 17640
gcaccggcag caccgtcgag gattgagctg acgccgggct attttcagat aaccgccacg 17700
ccgcatcttg ccgtttatga cccgacggta cagtttgagt tctggttctc ggaaaagcag 17760
attgcggata tcagacaggt tgaaaccagc acgcgttatc ttggtacggc gctgtactgg 17820
atagccgcca gtatcaatat caaaccgggc catgattatt acttttatat ccgcagtgtg 17880
aacaccgttg gcaaatcggc attcgtggag gccgtcggtc gggcgagcga tgatgcggaa 17940
ggttacctgg attttttcaa aggcaagata accgaatccc atctcggcaa ggagctgctg 18000
gaaaaagtcg agctgacgga ggataacgcc agcagactgg aggagttttc gaaagagtgg 18060
aaggatgcca gtgataagtg gaatgccatg tgggctgtca aaattgagca gaccaaagac 18120
ggcaaacatt atgtcgcggg tattggcctc agcatggagg acacggagga aggcaaactg 18180
agccagtttc tggttgccgc caatcgtatc gcatttattg acccggcaaa cgggaatgaa 18240
acgccgatgt ttgtggcgca gggcaaccag atattcatga acgacgtgtt cctgaagcgc 18300
ctgacggccc ccaccattac cagcggcggc aatcctccgg ccttttccct gacaccggac 18360
ggaaagctga ccgctaaaaa tgcggatatc agtggcagtg tgaatgcgaa ctccgggacg 18420
ctcagtaatg tgacgatagc tgaaaactgt acgataaacg gtacgctgag ggcggaaaaa 18480
atcgtcgggg acattgtaaa ggcggcgagc gcggcttttc cgcgccagcg tgaaagcagt 18540
gtggactggc cgtcaggtac ccgtactgtc accgtgaccg atgaccatcc ttttgatcgc 18600
cagatagtgg tgcttccgct gacgtttcgc ggaagtaagc gtactgtcag cggcaggaca 18660
acgtattcga tgtgttatct gaaagtactg atgaacggtg cggtgattta tgatggcgcg 18720
gcgaacgagg cggtacaggt gttctcccgt attgttgaca tgccagcggg tcggggaaac 18780
gtgatcctga cgttcacgct tacgtccaca cggcattcgg cagatattcc gccgtatacg 18840
tttgccagcg atgtgcaggt tatggtgatt aagaaacagg cgctgggcat cagcgtggtc 18900
tgagtgtgtt acagaggttc gtccgggaac gggcgtttta ttataaaaca gtgagaggtg 18960
aacgatgcgt aatgtgtgta ttgccgttgc tgtctttgcc gcacttgcgg tgacagtcac 19020
tccggcccgt gcggaaggtg gacatggtac gtttacggtg ggctattttc aagtgaaacc 19080
gggtacattg ccgtcgttgt cgggcgggga taccggtgtg agtcatctga aagggattaa 19140
cgtgaagtac cgttatgagc tgacggacag tgtgggggtg atggcttccc tggggttcgc 19200
cgcgtcgaaa aagagcagca cagtgatgac cggggaggat acgtttcact atgagagcct 19260
gcgtggacgt tatgtgagcg tgatggccgg accggtttta caaatcagta agcaggtcag 19320
tgcgtacgcc atggccggag tggctcacag tcggtggtcc ggcagtacaa tggattaccg 19380
taagacggaa atcactcccg ggtatatgaa agagacgacc actgccaggg acgaaagtgc 19440
aatgcggcat acctcagtgg cgtggagtgc aggtatacag attaatccgg cagcgtccgt 19500
cgttgttgat attgcttatg aaggctccgg cagtggcgac tggcgtactg acggattcat 19560
cgttggggtc ggttataaat tctgattagc caggtaacac agtgttatga cagcccgccg 19620
gaaccggtgg gcttttttgt ggggtgaata tggcagtaaa gatttcagga gtcctgaaag 19680
acggcacagg aaaaccggta cagaactgca ccattcagct gaaagccaga cgtaacagca 19740
ccacggtggt ggtgaacacg gtgggctcag agaatccgga tgaagccggg cgttacagca 19800
tggatgtgga gtacggtcag tacagtgtca tcctgcaggt tgacggtttt ccaccatcgc 19860
acgccgggac catcaccgtg tatgaagatt cacaaccggg gacgctgaat gattttctct 19920
gtgccatgac ggaggatgat gcccggccgg aggtgctgcg tcgtcttgaa ctgatggtgg 19980
aagaggtggc gcgtaacgcg tccgtggtgg cacagagtac ggcagacgcg aagaaatcag 20040
ccggcgatgc cagtgcatca gctgctcagg tcgcggccct tgtgactgat gcaactgact 20100
cagcacgcgc cgccagcacg tccgccggac aggctgcatc gtcagctcag gaagcgtcct 20160
ccggcgcaga agcggcatca gcaaaggcca ctgaagcgga aaaaagtgcc gcagccgcag 20220
agtcctcaaa aaacgcggcg gccaccagtg ccggtgcggc gaaaacgtca gaaacgaatg 20280
ctgcagcgtc acaacaatca gccgccacgt ctgcctccac cgcggccacg aaagcgtcag 20340
aggccgccac ttcagcacga gatgcggtgg cctcaaaaga ggcagcaaaa tcatcagaaa 20400
cgaacgcatc atcaagtgcc ggtcgtgcag cttcctcggc aacggcggca gaaaattctg 20460
ccagggcggc aaaaacgtcc gagacgaatg ccaggtcatc tgaaacagca gcggaacgga 20520
gcgcctctgc cgcggcagac gcaaaaacag cggcggcggg gagtgcgtca acggcatcca 20580
cgaaggcgac agaggctgcg ggaagtgcgg tatcagcatc gcagagcaaa agtgcggcag 20640
aagcggcggc aatacgtgca aaaaattcgg caaaacgtgc agaagatata gcttcagctg 20700
tcgcgcttga ggatgcggac acaacgagaa aggggatagt gcagctcagc agtgcaacca 20760
acagcacgtc tgaaacgctt gctgcaacgc caaaggcggt taaggtggta atggatgaaa 20820
cgaacagaaa agcccactgg acagtccggc actgaccgga acgccaacag caccaaccgc 20880
gctcagggga acaaacaata cccagattgc gaacaccgct tttgtactgg ccgcgattgc 20940
agatgttatc gacgcgtcac ctgacgcact gaatacgctg aatgaactgg ccgcagcgct 21000
cgggaatgat ccagattttg ctaccaccat gactaacgcg cttgcgggta aacaaccgaa 21060
gaatgcgaca ctgacggcgc tggcagggct ttccacggcg aaaaataaat taccgtattt 21120
tgcggaaaat gatgccgcca gcctgactga actgactcag gttggcaggg atattctggc 21180
aaaaaattcc gttgcagatg ttcttgaata ccttggggcc ggtgagaatt cggcctttcc 21240
ggcaggtgcg ccgatcccgt ggccatcaga tatcgttccg tctggctacg tcctgatgca 21300
ggggcaggcg tttgacaaat cagcctaccc aaaacttgct gtcgcgtatc catcgggtgt 21360
gcttcctgat atgcgaggct ggacaatcaa ggggaaaccc gccagcggtc gtgctgtatt 21420
gtctcaggaa caggatggaa ttaagtcgca cacccacagt gccagtgcat ccggtacgga 21480
tttggggacg aaaaccacat cgtcgtttga ttacgggacg aaaacaacag gcagtttcga 21540
ttacggcacc aaatcgacga ataacacggg ggctcatgct cacagtctga gcggttcaac 21600
aggggccgcg ggtgctcatg cccacacaag tggtttaagg atgaacagtt ctggctggag 21660
tcagtatgga acagcaacca ttacaggaag tttatccaca gttaaaggaa ccagcacaca 21720
gggtattgct tatttatcga aaacggacag tcagggcagc cacagtcact cattgtccgg 21780
tacagccgtg agtgccggtg cacatgcgca tacagttggt attggtgcgc accagcatcc 21840
ggttgttatc ggtgctcatg cccattcttt cagtattggt tcacacggac acaccatcac 21900
cgttaacgct gcgggtaacg cggaaaacac cgtcaaaaac attgcattta actatattgt 21960
gaggcttgca taatggcatt cagaatgagt gaacaaccac ggaccataaa aatttataat 22020
ctgctggccg gaactaatga atttattggt gaaggtgacg catatattcc gcctcatacc 22080
ggtctgcctg caaacagtac cgatattgca ccgccagata ttccggctgg ctttgtggct 22140
gttttcaaca gtgatgaggc atcgtggcat ctcgttgaag accatcgggg taaaaccgtc 22200
tatgacgtgg cttccggcga cgcgttattt atttctgaac tcggtccgtt accggaaaat 22260
tttacctggt tatcgccggg aggggaatat cagaagtgga acggcacagc ctgggtgaag 22320
gatacggaag cagaaaaact gttccggatc cgggaggcgg aagaaacaaa aaaaagcctg 22380
atgcaggtag ccagtgagca tattgcgccg cttcaggatg ctgcagatct ggaaattgca 22440
acgaaggaag aaacctcgtt gctggaagcc tggaagaagt atcgggtgtt gctgaaccgt 22500
gttgatacat caactgcacc tgatattgag tggcctgctg tccctgttat ggagtaatcg 22560
ttttgtgata tgccgcagaa acgttgtatg aaataacgtt ctgcggttag ttagtatatt 22620
gtaaagctga gtattggttt atttggcgat tattatcttc aggagaataa tggaagttct 22680
atgactcaat tgttcatagt gtttacatca ccgccaattg cttttaagac tgaacgcatg 22740
aaatatggtt tttcgtcatg ttttgagtct gctgttgata tttctaaagt cggttttttt 22800
tcttcgtttt ctctaactat tttccatgaa atacattttt gattattatt tgaatcaatt 22860
ccaattacct gaagtctttc atctataatt ggcattgtat gtattggttt attggagtag 22920
atgcttgctt ttctgagcca tagctctgat atccaaatga agccataggc atttgttatt 22980
ttggctctgt cagctgcata acgccaaaaa atatatttat ctgcttgatc ttcaaatgtt 23040
gtattgatta aatcaattgg atggaattgt ttatcataaa aaattaatgt ttgaatgtga 23100
taaccgtcct ttaaaaaagt cgtttctgca agcttggctg tatagtcaac taactcttct 23160
gtcgaagtga tatttttagg cttatctacc agttttagac gctctttaat atcttcagga 23220
attattttat tgtcatattg tatcatgcta aatgacaatt tgcttatgga gtaatctttt 23280
aattttaaat aagttattct cctggcttca tcaaataaag agtcgaatga tgttggcgaa 23340
atcacatcgt cacccattgg attgtttatt tgtatgccaa gagagttaca gcagttatac 23400
attctgccat agattatagc taaggcatgt aataattcgt aatcttttag cgtattagcg 23460
acccatcgtc tttctgattt aataatagat gattcagtta aatatgaagg taatttcttt 23520
tgtgcaagtc tgactaactt ttttatacca atgtttaaca tactttcatt tgtaataaac 23580
tcaatgtcat tttcttcaat gtaagatgaa ataagagtag cctttgcctc gctatacatt 23640
tctaaatcgc cttgtttttc tatcgtattg cgagaatttt tagcccaagc cattaatgga 23700
tcatttttcc atttttcaat aacattattg ttataccaaa tgtcatatcc tataatctgg 23760
tttttgtttt tttgaataat aaatgttact gttcttgcgg tttggaggaa ttgattcaaa 23820
ttcaagcgaa ataattcagg gtcaaaatat gtatcaatgc agcatttgag caagtgcgat 23880
aaatctttaa gtcttctttc ccatggtttt ttagtcataa aactctccat tttgataggt 23940
tgcatgctag atgctgatat attttagagg tgataaaatt aactgcttaa ctgtcaatgt 24000
aatacaagtt gtttgatctt tgcaatgatt cttatcagaa accatatagt aaattagtta 24060
cacaggaaat ttttaatatt attattatca ttcattatgt attaaaatta gagttgtggc 24120
ttggctctgc taacacgttg ctcataggag atatggtaga gccgcagaca cgtcgtatgc 24180
aggaacgtgc tgcggctggc tggtgaactt ccgatagtgc gggtgttgaa tgatttccag 24240
ttgctaccga ttttacatat tttttgcatg agagaatttg taccacctcc caccgaccat 24300
ctatgactgt acgccactgt ccctaggact gctatgtgcc ggagcggaca ttacaaacgt 24360
ccttctcggt gcatgccact gttgccaatg acctgcctag gaattggtta gcaagttact 24420
accggatttt gtaaaaacag ccctcctcat ataaaaagta ttcgttcact tccgataagc 24480
gtcgtaattt tctatctttc atcatattct agatccctct gaaaaaatct tccgagtttg 24540
ctaggcactg atacataact cttttccaat aattggggaa gtcattcaaa tctataatag 24600
gtttcagatt tgcttcaata aattctgact gtagctgctg aaacgttgcg gttgaactat 24660
atttccttat aacttttacg aaagagtttc tttgagtaat cacttcactc aagtgcttcc 24720
ctgcctccaa acgatacctg ttagcaatat ttaatagctt gaaatgatga agagctctgt 24780
gtttgtcttc ctgcctccag ttcgccgggc attcaacata aaaactgata gcacccggag 24840
ttccggaaac gaaatttgca tatacccatt gctcacgaaa aaaaatgtcc ttgtcgatat 24900
agggatgaat cgcttggtgt acctcatcta ctgcgaaaac ttgacctttc tctcccatat 24960
tgcagtcgcg gcacgatgga actaaattaa taggcatcac cgaaaattca ggataatgtg 25020
caataggaag aaaatgatct atattttttg tctgtcctat atcaccacaa aatggacatt 25080
tttcacctga tgaaacaagc atgtcatcgt aatatgttct agcgggtttg tttttatctc 25140
ggagattatt ttcataaagc ttttctaatt taacctttgt caggttacca actactaagg 25200
ttgtaggctc aagagggtgt gtcctgtcgt aggtaaataa ctgacctgtc gagcttaata 25260
ttctatattg ttgttctttc tgcaaaaaag tggggaagtg agtaatgaaa ttatttctaa 25320
catttatctg catcatacct tccgagcatt tattaagcat ttcgctataa gttctcgctg 25380
gaagaggtag ttttttcatt gtactttacc ttcatctctg ttcattatca tcgcttttaa 25440
aacggttcga ccttctaatc ctatctgacc attataattt tttagaatgg tttcataaga 25500
aagctctgaa tcaacggact gcgataataa gtggtggtat ccagaatttg tcacttcaag 25560
taaaaacacc tcacgagtta aaacacctaa gttctcaccg aatgtctcaa tatccggacg 25620
gataatattt attgcttctc ttgaccgtag gactttccac atgcaggatt ttggaacctc 25680
ttgcagtact actggggaat gagttgcaat tattgctaca ccattgcgtg catcgagtaa 25740
gtcgcttaat gttcgtaaaa aagcagagag caaaggtgga tgcagatgaa cctctggttc 25800
atcgaataaa actaatgact tttcgccaac gacatctact aatcttgtga tagtaaataa 25860
aacaattgca tgtccagagc tcattcgaag cagatatttc tggatattgt cataaaacaa 25920
tttagtgaat ttatcatcgt ccacttgaat ctgtggttca ttacgtctta actcttcata 25980
tttagaaatg aggctgatga gttccatatt tgaaaagttt tcatcactac ttagtttttt 26040
gatagcttca agccagagtt gtctttttct atctactctc atacaaccaa taaatgctga 26100
aatgaattct aagcggagat cgcctagtga ttttaaacta ttgctggcag cattcttgag 26160
tccaatataa aagtattgtg taccttttgc tgggtcaggt tgttctttag gaggagtaaa 26220
aggatcaaat gcactaaacg aaactgaaac aagcgatcga aaatatccct ttgggattct 26280
tgactcgata agtctattat tttcagagaa aaaatattca ttgttttctg ggttggtgat 26340
tgcaccaatc attccattca aaattgttgt tttaccacac ccattccgcc cgataaaagc 26400
atgaatgttc gtgctgggca tagaattaac cgtcacctca aaaggtatag ttaaatcact 26460
gaatccggga gcactttttc tattaaatga aaagtggaaa tctgacaatt ctggcaaacc 26520
atttaacaca cgtgcgaact gtccatgaat ttctgaaaga gttacccctc taagtaatga 26580
ggtgttaagg acgctttcat tttcaatgtc ggctaatcga tttggccata ctactaaatc 26640
ctgaatagct ttaagaaggt tatgtttaaa accatcgctt aatttgctga gattaacata 26700
gtagtcaatg ctttcaccta aggaaaaaaa catttcaggg agttgactga attttttatc 26760
tattaatgaa taagtgctta cttcttcttt ttgacctaca aaaccaattt taacatttcc 26820
gatatcgcat ttttcaccat gctcatcaaa gacagtaaga taaaacattg taacaaagga 26880
atagtcattc caaccatctg ctcgtaggaa tgccttattt ttttctactg caggaatata 26940
cccgcctctt tcaataacac taaactccaa catatagtaa cccttaattt tattaaaata 27000
accgcaattt atttggcggc aacacaggat ctctctttta agttactctc tattacatac 27060
gttttccatc taaaaattag tagtattgaa cttaacgggg catcgtattg tagttttcca 27120
tatttagctt tctgcttcct tttggataac ccactgttat tcatgttgca tggtgcactg 27180
tttataccaa cgatatagtc tattaatgca tatatagtat cgccgaacga ttagctcttc 27240
aggcttctga agaagcgttt caagtactaa taagccgata gatagccacg gacttcgtag 27300
ccatttttca taagtgttaa cttccgctcc tcgctcataa cagacattca ctacagttat 27360
ggcggaaagg tatgcatgct gggtgtgggg aagtcgtgaa agaaaagaag tcagctgcgt 27420
cgtttgacat cactgctatc ttcttactgg ttatgcaggt cgtagtgggt ggcacacaaa 27480
gctttgcact ggattgcgag gctttgtgct tctctggagt gcgacaggtt tgatgacaaa 27540
aaattagcgc aagaagacaa aaatcacctt gcgctaatgc tctgttacag gtcactaata 27600
ccatctaagt agttgattca tagtgactgc atatgttgtg ttttacagta ttatgtagtc 27660
tgttttttat gcaaaatcta atttaatata ttgatattta tatcatttta cgtttctcgt 27720
tcagcttttt tatactaagt tggcattata aaaaagcatt gcttatcaat ttgttgcaac 27780
gaacaggtca ctatcagtca aaataaaatc attatttgat ttcaattttg tcccactccc 27840
tgcctctgtc atcacgatac tgtgatgcca tggtgtccga cttatgcccg agaagatgtt 27900
gagcaaactt atcgcttatc tgcttctcat agagtcttgc agacaaactg cgcaactcgt 27960
gaaaggtagg cggatcccct tcgaaggaaa gacctgatgc ttttcgtgcg cgcataaaat 28020
accttgatac tgtgccggat gaaagcggtt cgcgacgagt agatgcaatt atggtttctc 28080
cgccaagaat ctctttgcat ttatcaagtg tttccttcat tgatattccg agagcatcaa 28140
tatgcaatgc tgttgggatg gcaattttta cgcctgtttt gctttgctcg acataaagat 28200
atccatctac gatatcagac cacttcattt cgcataaatc accaactcgt tgcccggtaa 28260
caacagccag ttccattgca agtctgagcc aacatggtga tgattctgct gcttgataaa 28320
ttttcaggta ttcgtcagcc gtaagtcttg atctccttac ctctgatttt gctgcgcgag 28380
tggcagcgac atggtttgtt gttatatggc cttcagctat tgcctctcgg aatgcatcgc 28440
tcagtgttga tctgattaac ttggctgacg ccgccttgcc ctcgtctatg tatccattga 28500
gcattgccgc aatttctttt gtggtgatgt cttcaagtgg agcatcaggc agacccctcc 28560
ttattgcttt aattttgctc atgtaattta tgagtgtctt ctgcttgatt cctctgctgg 28620
ccaggatttt ttcgtagcga tcaagccatg aatgtaacgt aacggaatta tcactgttga 28680
ttctcgctgt cagaggcttg tgtttgtgtc ctgaaaataa ctcaatgttg gcctgtatag 28740
cttcagtgat tgcgattcgc ctgtctctgc ctaatccaaa ctctttaccc gtccttgggt 28800
ccctgtagca gtaatatcca ttgtttctta tataaaggtt agggggtaaa tcccggcgct 28860
catgacttcg ccttcttccc atttctgatc ctcttcaaaa ggccacctgt tactggtcga 28920
tttaagtcaa cctttaccgc tgattcgtgg aacagatact ctcttccatc cttaaccgga 28980
ggtgggaata tcctgcattc ccgaacccat cgacgaactg tttcaaggct tcttggacgt 29040
cgctggcgtg cgttccactc ctgaagtgtc aagtacatcg caaagtctcc gcaattacac 29100
gcaagaaaaa accgccatca ggcggcttgg tgttctttca gttcttcaat tcgaatattg 29160
gttacgtctg catgtgctat ctgcgcccat atcatccagt ggtcgtagca gtcgttgatg 29220
ttctccgctt cgataactct gttgaatggc tctccattcc attctcctgt gactcggaag 29280
tgcatttatc atctccataa aacaaaaccc gccgtagcga gttcagataa aataaatccc 29340
cgcgagtgcg aggattgtta tgtaatattg ggtttaatca tctatatgtt ttgtacagag 29400
agggcaagta tcgtttccac cgtactcgtg ataataattt tgcacggtat cagtcatttc 29460
tcgcacattg cagaatgggg atttgtcttc attagactta taaaccttca tggaatattt 29520
gtatgccgac tctatatcta taccttcatc tacataaaca ccttcgtgat gtctgcatgg 29580
agacaagaca ccggatctgc acaacattga taacgcccaa tctttttgct cagactctaa 29640
ctcattgata ctcatttata aactccttgc aatgtatgtc gtttcagcta aacggtatca 29700
gcaatgttta tgtaaagaaa cagtaagata atactcaacc cgatgtttga gtacggtcat 29760
catctgacac tacagactct ggcatcgctg tgaagacgac gcgaaattca gcattttcac 29820
aagcgttatc ttttacaaaa ccgatctcac tctcctttga tgcgaatgcc agcgtcagac 29880
atcatatgca gatactcacc tgcatcctga acccattgac ctccaacccc gtaatagcga 29940
tgcgtaatga tgtcgatagt tactaacggg tcttgttcga ttaactgccg cagaaactct 30000
tccaggtcac cagtgcagtg cttgataaca ggagtcttcc caggatggcg aacaacaaga 30060
aactggtttc cgtcttcacg gacttcgttg ctttccagtt tagcaatacg cttactccca 30120
tccgagataa caccttcgta atactcacgc tgctcgttga gttttgattt tgctgtttca 30180
agctcaacac gcagtttccc tactgttagc gcaatatcct cgttctcctg gtcgcggcgt 30240
ttgatgtatt gctggtttct ttcccgttca tccagcagtt ccagcacaat cgatggtgtt 30300
accaattcat ggaaaaggtc tgcgtcaaat ccccagtcgt catgcattgc ctgctctgcc 30360
gcttcacgca gtgcctgaga gttaatttcg ctcacttcga acctctctgt ttactgataa 30420
gttccagatc ctcctggcaa cttgcacaag tccgacaacc ctgaacgacc aggcgtcttc 30480
gttcatctat cggatcgcca cactcacaac aatgagtggc agatatagcc tggtggttca 30540
ggcggcgcat ttttattgct gtgttgcgct gtaattcttc tatttctgat gctgaatcaa 30600
tgatgtctgc catctttcat taatccctga actgttggtt aatacgcttg agggtgaatg 30660
cgaataataa aaaaggagcc tgtagctccc tgatgatttt gcttttcatg ttcatcgttc 30720
cttaaagacg ccgtttaaca tgccgattgc caggcttaaa tgagtcggtg tgaatcccat 30780
cagcgttacc gtttcgcggt gcttcttcag tacgctacgg caaatgtcat cgacgttttt 30840
atccggaaac tgctgtctgg ctttttttga tttcagaatt agcctgacgg gcaatgctgc 30900
gaagggcgtt ttcctgctga ggtgtcattg aacaagtccc atgtcggcaa gcataagcac 30960
acagaatatg aagcccgctg ccagaaaaat gcattccgtg gttgtcatac ctggtttctc 31020
tcatctgctt ctgctttcgc caccatcatt tccagctttt gtgaaaggga tgcggctaac 31080
gtatgaaatt cttcgtctgt ttctactggt attggcacaa acctgattcc aatttgagca 31140
aggctatgtg ccatctcgat actcgttctt aactcaacag aagatgcttt gtgcatacag 31200
cccctcgttt attatttatc tcctcagcca gccgctgtgc tttcagtgga tttcggataa 31260
cagaaaggcc gggaaatacc cagcctcgct ttgtaacgga gtagacgaaa gtgattgcgc 31320
ctacccggat attatcgtga ggatgcgtca tcgccattgc tccccaaata caaaaccaat 31380
ttcagccagt gcctcgtcca ttttttcgat gaactccggc acgatctcgt caaaactcgc 31440
catgtacttt tcatcccgct caatcacgac ataatgcagg ccttcacgct tcatacgcgg 31500
gtcatagttg gcaaagtacc aggcattttt tcgcgtcacc cacatgctgt actgcacctg 31560
ggccatgtaa gctgacttta tggcctcgaa accaccgagc cggaacttca tgaaatcccg 31620
ggaggtaaac gggcatttca gttcaaggcc gttgccgtca ctgcataaac catcgggaga 31680
gcaggcggta cgcatacttt cgtcgcgata gatgatcggg gattcagtaa cattcacgcc 31740
ggaagtgaat tcaaacaggg ttctggcgtc gttctcgtac tgttttcccc aggccagtgc 31800
tttagcgtta acttccggag ccacaccggt gcaaacctca gcaagcaggg tgtggaagta 31860
ggacattttc atgtcaggcc acttctttcc ggagcggggt tttgctatca cgttgtgaac 31920
ttctgaagcg gtgatgacgc cgagccgtaa tttgtgccac gcatcatccc cctgttcgac 31980
agctctcaca tcgatcccgg tacgctgcag gataatgtcc ggtgtcatgc tgccaccttc 32040
tgctctgcgg ctttctgttt caggaatcca agagctttta ctgcttcggc ctgtgtcagt 32100
tctgacgatg cacgaatgtc gcggcgaaat atctgggaac agagcggcaa taagtcgtca 32160
tcccatgttt tatccagggc gatcagcaga gtgttaatct cctgcatggt ttcatcgtta 32220
accggagtga tgtcgcgttc cggctgacgt tctgcagtgt atgcagtatt ttcgacaatg 32280
cgctcggctt catccttgtc atagatacca gcaaatccga aggccagacg ggcacactga 32340
atcatggctt tatgacgtaa catccgtttg ggatgcgact gccacggccc cgtgatttct 32400
ctgccttcgc gagttttgaa tggttcgcgg cggcattcat ccatccattc ggtaacgcag 32460
atcggatgat tacggtcctt gcggtaaatc cggcatgtac aggattcatt gtcctgctca 32520
aagtccatgc catcaaactg ctggttttca ttgatgatgc gggaccagcc atcaacgccc 32580
accaccggaa cgatgccatt ctgcttatca ggaaaggcgt aaatttcttt cgtccacgga 32640
ttaaggccgt actggttggc aacgatcagt aatgcgatga actgcgcatc gctggcatca 32700
cctttaaatg ccgtctggcg aagagtggtg atcagttcct gtgggtcgac agaatccatg 32760
ccgacacgtt cagccagctt cccagccagc gttgcgagtg cagtactcat tcgttttata 32820
cctctgaatc aatatcaacc tggtggtgag caatggtttc aaccatgtac cggatgtgtt 32880
ctgccatgcg ctcctgaaac tcaacatcgt catcaaacgc acgggtaatg gattttttgc 32940
tggccccgtg gcgttgcaaa tgatcgatgc atagcgattc aaacaggtgc tggggcaggc 33000
ctttttccat gtcgtctgcc agttctgcct ctttctcttc acgggcgagc tgctggtagt 33060
gacgcgccca gctctgagcc tcaagacgat cctgaatgta ataagcgttc atggctgaac 33120
tcctgaaata gctgtgaaaa tatcgcccgc gaaatgccgg gctgattagg aaaacaggaa 33180
agggggttag tgaatgcttt tgcttgatct cagtttcagt attaatatcc attttttata 33240
agcgtcgacg gcttcacgaa acatcttttc atcgccaata aaagtggcga tagtgaattt 33300
agtctggata gccataagtg tttgatccat tctttgggac tcctggctga ttaagtatgt 33360
cgataaggcg tttccatccg tcacgtaatt tacgggtgat tcgttcaagt aaagattcgg 33420
aagggcagcc agcaacaggc caccctgcaa tggcatattg catggtgtgc tccttattta 33480
tacataacga aaaacgcctc gagtgaagcg ttattggtat gcggtaaaac cgcactcagg 33540
cggccttgat agtcatatca tctgaatcaa atattcctga tgtatcgata tcggtaattc 33600
ttattccttc gctaccatcc attggaggcc atccttcctg accatttcca tcattccagt 33660
cgaactcaca cacaacacca tatgcattta agtcgcttga aattgctata agcagagcat 33720
gttgcgccag catgattaat acagcattta atacagagcc gtgtttattg agtcggtatt 33780
cagagtctga ccagaaatta ttaatctggt gaagtttttc ctctgtcatt acgtcatggt 33840
cgatttcaat ttctattgat gctttccagt cgtaatcaat gatgtatttt ttgatgtttg 33900
acatctgttc atatcctcac agataaaaaa tcgccctcac actggagggc aaagaagatt 33960
tccaataatc agaacaagtc ggctcctgtt tagttacgag cgacattgct ccgtgtattc 34020
actcgttgga atgaatacac agtgcagtgt ttattctgtt atttatgcca aaaataaagg 34080
ccactatcag gcagctttgt tgttctgttt accaagttct ctggcaatca ttgccgtcgt 34140
tcgtattgcc catttatcga catatttccc atcttccatt acaggaaaca tttcttcagg 34200
cttaaccatg cattccgatt gcagcttgca tccattgcat cgcttgaatt gtccacacca 34260
ttgattttta tcaatagtcg tagtcatacg gatagtcctg gtattgttcc atcacatcct 34320
gaggatgctc ttcgaactct tcaaattctt cttccatata tcaccttaaa tagtggattg 34380
cggtagtaaa gattgtgcct gtcttttaac cacatcaggc tcggtggttc tcgtgtaccc 34440
ctacagcgag aaatcggata aactattaca acccctacag tttgatgagt atagaaatgg 34500
atccactcgt tattctcgga cgagtgttca gtaatgaacc tctggagaga accatgtata 34560
tgatcgttat ctgggttgga cttctgcttt taagcccaga taactggcct gaatatgtta 34620
atgagagaat cggtattcct catgtgtggc atgttttcgt ctttgctctt gcattttcgc 34680
tagcaattaa tgtgcatcga ttatcagcta ttgccagcgc cagatataag cgatttaagc 34740
taagaaaacg cattaagatg caaaacgata aagtgcgatc agtaattcaa aaccttacag 34800
aagagcaatc tatggttttg tgcgcagccc ttaatgaagg caggaagtat gtggttacat 34860
caaaacaatt cccatacatt agtgagttga ttgagcttgg tgtgttgaac aaaacttttt 34920
cccgatggaa tggaaagcat atattattcc ctattgagga tatttactgg actgaattag 34980
ttgccagcta tgatccatat aatattgaga taaagccaag gccaatatct aagtaactag 35040
ataagaggaa tcgattttcc cttaattttc tggcgtccac tgcatgttat gccgcgttcg 35100
ccaggcttgc tgtaccatgt gcgctgattc ttgcgctcaa tacgttgcag gttgctttca 35160
atctgtttgt ggtattcagc cagcactgta aggtctatcg gatttagtgc gctttctact 35220
cgtgatttcg gtttgcgatt cagcgagaga atagggcggt taactggttt tgcgcttacc 35280
ccaaccaaca ggggatttgc tgctttccat tgagcctgtt tctctgcgcg acgttcgcgg 35340
cggcgtgttt gtgcatccat ctggattctc ctgtcagtta gctttggtgg tgtgtggcag 35400
ttgtagtcct gaacgaaaac cccccgcgat tggcacattg gcagctaatc cggaatcgca 35460
cttacggcca atgcttcgtt tcgtatcaca caccccaaag ccttctgctt tgaatgctgc 35520
ccttcttcag ggcttaattt ttaagagcgt caccttcatg gtggtcagtg cgtcctgctg 35580
atgtgctcag tatcaccgcc agtggtattt atgtcaacac cgccagagat aatttatcac 35640
cgcagatggt tatctgtatg ttttttatat gaatttattt tttgcagggg ggcattgttt 35700
ggtaggtgag agatctgaat tgctatgttt agtgagttgt atctatttat ttttcaataa 35760
atacaattgg ttatgtgttt tgggggcgat cgtgaggcaa agaaaacccg gcgctgaggc 35820
cgggttattc ttgttctctg gtcaaattat atagttggaa aacaaggatg catatatgaa 35880
tgaacgatgc agaggcaatg ccgatggcga tagtgggtat catgtagccg cttatgctgg 35940
aaagaagcaa taacccgcag aaaaacaaag ctccaagctc aacaaaacta agggcataga 36000
caataactac cgatgtcata tacccatact ctctaatctt ggccagtcgg cgcgttctgc 36060
ttccgattag aaacgtcaag gcagcaatca ggattgcaat catggttcct gcatatgatg 36120
acaatgtcgc cccaagacca tctctatgag ctgaaaaaga aacaccagga atgtagtggc 36180
ggaaaaggag atagcaaatg cttacgataa cgtaaggaat tattactatg taaacaccag 36240
gcatgattct gttccgcata attactcctg ataattaatc cttaactttg cccacctgcc 36300
ttttaaaaca ttccagtata tcacttttca ttcttgcgta gcaatatgcc atctcttcag 36360
ctatctcagc attggtgacc ttgttcagag gcgctgagag atggcctttt tctgatagat 36420
aatgttctgt taaaatatct ccggcctcat cttttgcccg caggctaatg tctgaaaatt 36480
gaggtgacgg gttaaaaata atatccttgg caaccttttt tatatccctt ttaaattttg 36540
gcttaatgac tatatccaat gagtcaaaaa gctccccttc aatatctgtt gcccctaaga 36600
cctttaatat atcgccaaat acaggtagct tggcttctac cttcaccgtt gttcggccga 36660
tgaaatgcat atgcataaca tcgtctttgg tggttcccct catcagtggc tctatctgaa 36720
cgcgctctcc actgcttaat gacattcctt tcccgattaa aaaatctgtc agatcggatg 36780
tggtcggccc gaaaacagtt ctggcaaaac caatggtgtc gccttcaaca aacaaaaaag 36840
atgggaatcc caatgattcg tcatctgcga ggctgttctt aatatcttca actgaagctt 36900
tagagcgatt tatcttctga accagactct tgtcatttgt tttggtaaag agaaaagttt 36960
ttccatcgat tttatgaata tacaaataat tggagccaac ctgcaggtga tgattatcag 37020
ccagcagaga attaaggaaa acagacaggt ttattgagcg cttatctttc cctttatttt 37080
tgctgcggta agtcgcataa aaaccattct tcataattca atccatttac tatgttatgt 37140
tctgagggga gtgaaaattc ccctaattcg atgaagattc ttgctcaatt gttatcagct 37200
atgcgccgac cagaacacct tgccgatcag ccaaacgtct cttcaggcca ctgactagcg 37260
ataactttcc ccacaacgga acaactctca ttgcatggga tcattgggta ctgtgggttt 37320
agtggttgta aaaacacctg accgctatcc ctgatcagtt tcttgaaggt aaactcatca 37380
cccccaagtc tggctatgca gaaatcacct ggctcaacag cctgctcagg gtcaacgaga 37440
attaacattc cgtcaggaaa gcttggcttg gagcctgttg gtgcggtcat ggaattacct 37500
tcaacctcaa gccagaatgc agaatcactg gcttttttgg ttgtgcttac ccatctctcc 37560
gcatcacctt tggtaaaggt tctaagctta ggtgagaaca tccctgcctg aacatgagaa 37620
aaaacagggt actcatactc acttctaagt gacggctgca tactaaccgc ttcatacatc 37680
tcgtagattt ctctggcgat tgaagggcta aattcttcaa cgctaacttt gagaattttt 37740
gtaagcaatg cggcgttata agcatttaat gcattgatgc cattaaataa agcaccaacg 37800
cctgactgcc ccatccccat cttgtctgcg acagattcct gggataagcc aagttcattt 37860
ttcttttttt cataaattgc tttaaggcga cgtgcgtcct caagctgctc ttgtgttaat 37920
ggtttctttt ttgtgctcat acgttaaatc tatcaccgca agggataaat atctaacacc 37980
gtgcgtgttg actattttac ctctggcggt gataatggtt gcatgtacta aggaggttgt 38040
atggaacaac gcataaccct gaaagattat gcaatgcgct ttgggcaaac caagacagct 38100
aaagatctcg gcgtatatca aagcgcgatc aacaaggcca ttcatgcagg ccgaaagatt 38160
tttttaacta taaacgctga tggaagcgtt tatgcggaag aggtaaagcc cttcccgagt 38220
aacaaaaaaa caacagcata aataaccccg ctcttacaca ttccagccct gaaaaagggc 38280
atcaaattaa accacaccta tggtgtatgc atttatttgc atacattcaa tcaattgtta 38340
tctaaggaaa tacttacata tggttcgtgc aaacaaacgc aacgaggctc tacgaatcga 38400
gagtgcgttg cttaacaaaa tcgcaatgct tggaactgag aagacagcgg aagctgtggg 38460
cgttgataag tcgcagatca gcaggtggaa gagggactgg attccaaagt tctcaatgct 38520
gcttgctgtt cttgaatggg gggtcgttga cgacgacatg gctcgattgg cgcgacaagt 38580
tgctgcgatt ctcaccaata aaaaacgccc ggcggcaacc gagcgttctg aacaaatcca 38640
gatggagttc tgaggtcatt actggatcta tcaacaggag tcattatgac aaatacagca 38700
aaaatactca acttcggcag aggtaacttt gccggacagg agcgtaatgt ggcagatctc 38760
gatgatggtt acgccagact atcaaatatg ctgcttgagg cttattcggg cgcagatctg 38820
accaagcgac agtttaaagt gctgcttgcc attctgcgta aaacctatgg gtggaataaa 38880
ccaatggaca gaatcaccga ttctcaactt agcgagatta caaagttacc tgtcaaacgg 38940
tgcaatgaag ccaagttaga actcgtcaga atgaatatta tcaagcagca aggcggcatg 39000
tttggaccaa ataaaaacat ctcagaatgg tgcatccctc aaaacgaggg aaaatcccct 39060
aaaacgaggg ataaaacatc cctcaaattg ggggattgct atccctcaaa acagggggac 39120
acaaaagaca ctattacaaa agaaaaaaga aaagattatt cgtcagagaa ttctggcgaa 39180
tcctctgacc agccagaaaa cgacctttct gtggtgaaac cggatgctgc aattcagagc 39240
ggcagcaagt gggggacagc agaagacctg accgccgcag agtggatgtt tgacatggtg 39300
aagactatcg caccatcagc cagaaaaccg aattttgctg ggtgggctaa cgatatccgc 39360
ctgatgcgtg aacgtgacgg acgtaaccac cgcgacatgt gtgtgctgtt ccgctgggca 39420
tgccaggaca acttctggtc cggtaacgtg ctgagcccgg ccaaactccg cgataagtgg 39480
acccaactcg aaatcaaccg taacaagcaa caggcaggcg tgacagccag caaaccaaaa 39540
ctcgacctga caaacacaga ctggatttac ggggtggatc tatgaaaaac atcgccgcac 39600
agatggttaa ctttgaccgt gagcagatgc gtcggatcgc caacaacatg ccggaacagt 39660
acgacgaaaa gccgcaggta cagcaggtag cgcagatcat caacggtgtg ttcagccagt 39720
tactggcaac tttcccggcg agcctggcta accgtgacca gaacgaagtg aacgaaatcc 39780
gtcgccagtg ggttctggct tttcgggaaa acgggatcac cacgatggaa caggttaacg 39840
caggaatgcg cgtagcccgt cggcagaatc gaccatttct gccatcaccc gggcagtttg 39900
ttgcatggtg ccgggaagaa gcatccgtta ccgccggact gccaaacgtc agcgagctgg 39960
ttgatatggt ttacgagtat tgccggaagc gaggcctgta tccggatgcg gagtcttatc 40020
cgtggaaatc aaacgcgcac tactggctgg ttaccaacct gtatcagaac atgcgggcca 40080
atgcgcttac tgatgcggaa ttacgccgta aggccgcaga tgagcttgtc catatgactg 40140
cgagaattaa ccgtggtgag gcgatccctg aaccagtaaa acaacttcct gtcatgggcg 40200
gtagacctct aaatcgtgca caggctctgg cgaagatcgc agaaatcaaa gctaagttcg 40260
gactgaaagg agcaagtgta tgacgggcaa agaggcaatt attcattacc tggggacgca 40320
taatagcttc tgtgcgccgg acgttgccgc gctaacaggc gcaacagtaa ccagcataaa 40380
tcaggccgcg gctaaaatgg cacgggcagg tcttctggtt atcgaaggta aggtctggcg 40440
aacggtgtat taccggtttg ctaccaggga agaacgggaa ggaaagatga gcacgaacct 40500
ggtttttaag gagtgtcgcc agagtgccgc gatgaaacgg gtattggcgg tatatggagt 40560
taaaagatga ccatctacat tactgagcta ataacaggcc tgctggtaat cgcaggcctt 40620
tttatttggg ggagagggaa gtcatgaaaa aactaacctt tgaaattcga tctccagcac 40680
atcagcaaaa cgctattcac gcagtacagc aaatccttcc agacccaacc aaaccaatcg 40740
tagtaaccat tcaggaacgc aaccgcagct tagaccaaaa caggaagcta tgggcctgct 40800
taggtgacgt ctctcgtcag gttgaatggc atggtcgctg gctggatgca gaaagctgga 40860
agtgtgtgtt taccgcagca ttaaagcagc aggatgttgt tcctaacctt gccgggaatg 40920
gctttgtggt aataggccag tcaaccagca ggatgcgtgt aggcgaattt gcggagctat 40980
tagagcttat acaggcattc ggtacagagc gtggcgttaa gtggtcagac gaagcgagac 41040
tggctctgga gtggaaagcg agatggggag acagggctgc atgataaatg tcgttagttt 41100
ctccggtggc aggacgtcag catatttgct ctggctaatg gagcaaaagc gacgggcagg 41160
taaagacgtg cattacgttt tcatggatac aggttgtgaa catccaatga catatcggtt 41220
tgtcagggaa gttgtgaagt tctgggatat accgctcacc gtattgcagg ttgatatcaa 41280
cccggagctt ggacagccaa atggttatac ggtatgggaa ccaaaggata ttcagacgcg 41340
aatgcctgtt ctgaagccat ttatcgatat ggtaaagaaa tatggcactc catacgtcgg 41400
cggcgcgttc tgcactgaca gattaaaact cgttcccttc accaaatact gtgatgacca 41460
tttcgggcga gggaattaca ccacgtggat tggcatcaga gctgatgaac cgaagcggct 41520
aaagccaaag cctggaatca gatatcttgc tgaactgtca gactttgaga aggaagatat 41580
cctcgcatgg tggaagcaac aaccattcga tttgcaaata ccggaacatc tcggtaactg 41640
catattctgc attaaaaaat caacgcaaaa aatcggactt gcctgcaaag atgaggaggg 41700
attgcagcgt gtttttaatg aggtcatcac gggatcccat gtgcgtgacg gacatcggga 41760
aacgccaaag gagattatgt accgaggaag aatgtcgctg gacggtatcg cgaaaatgta 41820
ttcagaaaat gattatcaag ccctgtatca ggacatggta cgagctaaaa gattcgatac 41880
cggctcttgt tctgagtcat gcgaaatatt tggagggcag cttgatttcg acttcgggag 41940
ggaagctgca tgatgcgatg ttatcggtgc ggtgaatgca aagaagataa ccgcttccga 42000
ccaaatcaac cttactggaa tcgatggtgt ctccggtgtg aaagaacacc aacaggggtg 42060
ttaccactac cgcaggaaaa ggaggacgtg tggcgagaca gcgacgaagt atcaccgaca 42120
taatctgcga aaactgcaaa taccttccaa cgaaacgcac cagaaataaa cccaagccaa 42180
tcccaaaaga atctgacgta aaaaccttca actacacggc tcacctgtgg gatatccggt 42240
ggctaagacg tcgtgcgagg aaaacaaggt gattgaccaa aatcgaagtt acgaacaaga 42300
aagcgtcgag cgagctttaa cgtgcgctaa ctgcggtcag aagctgcatg tgctggaagt 42360
tcacgtgtgt gagcactgct gcgcagaact gatgagcgat ccgaatagct cgatgcacga 42420
ggaagaagat gatggctaaa ccagcgcgaa gacgatgtaa aaacgatgaa tgccgggaat 42480
ggtttcaccc tgcattcgct aatcagtggt ggtgctctcc agagtgtgga accaagatag 42540
cactcgaacg acgaagtaaa gaacgcgaaa aagcggaaaa agcagcagag aagaaacgac 42600
gacgagagga gcagaaacag aaagataaac ttaagattcg aaaactcgcc ttaaagcccc 42660
gcagttactg gattaaacaa gcccaacaag ccgtaaacgc cttcatcaga gaaagagacc 42720
gcgacttacc atgtatctcg tgcggaacgc tcacgtctgc tcagtgggat gccggacatt 42780
accggacaac tgctgcggca cctcaactcc gatttaatga acgcaatatt cacaagcaat 42840
gcgtggtgtg caaccagcac aaaagcggaa atctcgttcc gtatcgcgtc gaactgatta 42900
gccgcatcgg gcaggaagca gtagacgaaa tcgaatcaaa ccataaccgc catcgctgga 42960
ctatcgaaga gtgcaaggcg atcaaggcag agtaccaaca gaaactcaaa gacctgcgaa 43020
atagcagaag tgaggccgca tgacgttctc agtaaaaacc attccagaca tgctcgttga 43080
aacatacgga aatcagacag aagtagcacg cagactgaaa tgtagtcgcg gtacggtcag 43140
aaaatacgtt gatgataaag acgggaaaat gcacgccatc gtcaacgacg ttctcatggt 43200
tcatcgcgga tggagtgaaa gagatgcgct attacgaaaa aattgatggc agcaaatacc 43260
gaaatatttg ggtagttggc gatctgcacg gatgctacac gaacctgatg aacaaactgg 43320
atacgattgg attcgacaac aaaaaagacc tgcttatctc ggtgggcgat ttggttgatc 43380
gtggtgcaga gaacgttgaa tgcctggaat taatcacatt cccctggttc agagctgtac 43440
gtggaaacca tgagcaaatg atgattgatg gcttatcaga gcgtggaaac gttaatcact 43500
ggctgcttaa tggcggtggc tggttcttta atctcgatta cgacaaagaa attctggcta 43560
aagctcttgc ccataaagca gatgaacttc cgttaatcat cgaactggtg agcaaagata 43620
aaaaatatgt tatctgccac gccgattatc cctttgacga atacgagttt ggaaagccag 43680
ttgatcatca gcaggtaatc tggaaccgcg aacgaatcag caactcacaa aacgggatcg 43740
tgaaagaaat caaaggcgcg gacacgttca tctttggtca tacgccagca gtgaaaccac 43800
tcaagtttgc caaccaaatg tatatcgata ccggcgcagt gttctgcgga aacctaacat 43860
tgattcaggt acagggagaa ggcgcatgag actcgaaagc gtagctaaat ttcattcgcc 43920
aaaaagcccg atgatgagcg actcaccacg ggccacggct tctgactctc tttccggtac 43980
tgatgtgatg gctgctatgg ggatggcgca atcacaagcc ggattcggta tggctgcatt 44040
ctgcggtaag cacgaactca gccagaacga caaacaaaag gctatcaact atctgatgca 44100
atttgcacac aaggtatcgg ggaaataccg tggtgtggca aagcttgaag gaaatactaa 44160
ggcaaaggta ctgcaagtgc tcgcaacatt cgcttatgcg gattattgcc gtagtgccgc 44220
gacgccgggg gcaagatgca gagattgcca tggtacaggc cgtgcggttg atattgccaa 44280
aacagagctg tgggggagag ttgtcgagaa agagtgcgga agatgcaaag gcgtcggcta 44340
ttcaaggatg ccagcaagcg cagcatatcg cgctgtgacg atgctaatcc caaaccttac 44400
ccaacccacc tggtcacgca ctgttaagcc gctgtatgac gctctggtgg tgcaatgcca 44460
caaagaagag tcaatcgcag acaacatttt gaatgcggtc acacgttagc agcatgattg 44520
ccacggatgg caacatatta acggcatgat attgacttat tgaataaaat tgggtaaatt 44580
tgactcaacg atgggttaat tcgctcgttg tggtagtgag atgaaaagag gcggcgctta 44640
ctaccgattc cgcctagttg gtcacttcga cgtatcgtct ggaactccaa ccatcgcagg 44700
cagagaggtc tgcaaaatgc aatcccgaaa cagttcgcag gtaatagtta gagcctgcat 44760
aacggtttcg ggatttttta tatctgcaca acaggtaaga gcattgagtc gataatcgtg 44820
aagagtcggc gagcctggtt agccagtgct ctttccgttg tgctgaatta agcgaatacc 44880
ggaagcagaa ccggatcacc aaatgcgtac aggcgtcatc gccgcccagc aacagcacaa 44940
cccaaactga gccgtagcca ctgtctgtcc tgaattcatt agtaatagtt acgctgcggc 45000
cttttacaca tgaccttcgt gaaagcgggt ggcaggaggt cgcgctaaca acctcctgcc 45060
gttttgcccg tgcatatcgg tcacgaacaa atctgattac taaacacagt agcctggatt 45120
tgttctatca gtaatcgacc ttattcctaa ttaaatagag caaatcccct tattgggggt 45180
aagacatgaa gatgccagaa aaacatgacc tgttggccgc cattctcgcg gcaaaggaac 45240
aaggcatcgg ggcaatcctt gcgtttgcaa tggcgtacct tcgcggcaga tataatggcg 45300
gtgcgtttac aaaaacagta atcgacgcaa cgatgtgcgc cattatcgcc tagttcattc 45360
gtgaccttct cgacttcgcc ggactaagta gcaatctcgc ttatataacg agcgtgttta 45420
tcggctacat cggtactgac tcgattggtt cgcttatcaa acgcttcgct gctaaaaaag 45480
ccggagtaga agatggtaga aatcaataat caacgtaagg cgttcctcga tatgctggcg 45540
tggtcggagg gaactgataa cggacgtcag aaaaccagaa atcatggtta tgacgtcatt 45600
gtaggcggag agctatttac tgattactcc gatcaccctc gcaaacttgt cacgctaaac 45660
ccaaaactca aatcaacagg cgccggacgc taccagcttc tttcccgttg gtgggatgcc 45720
taccgcaagc agcttggcct gaaagacttc tctccgaaaa gtcaggacgc tgtggcattg 45780
cagcagatta aggagcgtgg cgctttacct atgattgatc gtggtgatat ccgtcaggca 45840
atcgaccgtt gcagcaatat ctgggcttca ctgccgggcg ctggttatgg tcagttcgag 45900
cataaggctg acagcctgat tgcaaaattc aaagaagcgg gcggaacggt cagagagatt 45960
gatgtatgag cagagtcacc gcgattatct ccgctctggt tatctgcatc atcgtctgcc 46020
tgtcatgggc tgttaatcat taccgtgata acgccattac ctacaaagcc cagcgcgaca 46080
aaaatgccag agaactgaag ctggcgaacg cggcaattac tgacatgcag atgcgtcagc 46140
gtgatgttgc tgcgctcgat gcaaaataca cgaaggagtt agctgatgct aaagctgaaa 46200
atgatgctct gcgtgatgat gttgccgctg gtcgtcgtcg gttgcacatc aaagcagtct 46260
gtcagtcagt gcgtgaagcc accaccgcct ccggcgtgga taatgcagcc tccccccgac 46320
tggcagacac cgctgaacgg gattatttca ccctcagaga gaggctgatc actatgcaaa 46380
aacaactgga aggaacccag aagtatatta atgagcagtg cagatagagt tgcccatatc 46440
gatgggcaac tcatgcaatt attgtgagca atacacacgc gcttccagcg gagtataaat 46500
gcctaaagta ataaaaccga gcaatccatt tacgaatgtt tgctgggttt ctgttttaac 46560
aacattttct gcgccgccac aaattttggc tgcatcgaca gttttcttct gcccaattcc 46620
agaaacgaag aaatgatggg tgatggtttc ctttggtgct actgctgccg gtttgttttg 46680
aacagtaaac gtctgttgag cacatcctgt aataagcagg gccagcgcag tagcgagtag 46740
catttttttc atggtgttat tcccgatgct ttttgaagtt cgcagaatcg tatgtgtaga 46800
aaattaaaca aaccctaaac aatgagttga aatttcatat tgttaatatt tattaatgta 46860
tgtcaggtgc gatgaatcgt cattgtattc ccggattaac tatgtccaca gccctgacgg 46920
ggaacttctc tgcgggagtg tccgggaata attaaaacga tgcacacagg gtttagcgcg 46980
tacacgtatt gcattatgcc aacgccccgg tgctgacacg gaagaaaccg gacgttatga 47040
tttagcgtgg aaagatttgt gtagtgttct gaatgctctc agtaaatagt aatgaattat 47100
caaaggtata gtaatatctt ttatgttcat ggatatttgt aacccatcgg aaaactcctg 47160
ctttagcaag attttccctg tattgctgaa atgtgatttc tcttgatttc aacctatcat 47220
aggacgtttc tataagatgc gtgtttcttg agaatttaac atttacaacc tttttaagtc 47280
cttttattaa cacggtgtta tcgttttcta acacgatgtg aatattatct gtggctagat 47340
agtaaatata atgtgagacg ttgtgacgtt ttagttcaga ataaaacaat tcacagtcta 47400
aatcttttcg cacttgatcg aatatttctt taaaaatggc aacctgagcc attggtaaaa 47460
ccttccatgt gatacgaggg cgcgtagttt gcattatcgt ttttatcgtt tcaatctggt 47520
ctgacctcct tgtgttttgt tgatgattta tgtcaaatat taggaatgtt ttcacttaat 47580
agtattggtt gcgtaacaaa gtgcggtcct gctggcattc tggagggaaa tacaaccgac 47640
agatgtatgt aaggccaacg tgctcaaatc ttcatacaga aagatttgaa gtaatatttt 47700
aaccgctaga tgaagagcaa gcgcatggag cgacaaaatg aataaagaac aatctgctga 47760
tgatccctcc gtggatctga ttcgtgtaaa aaatatgctt aatagcacca tttctatgag 47820
ttaccctgat gttgtaattg catgtataga acataaggtg tctctggaag cattcagagc 47880
aattgaggca gcgttggtga agcacgataa taatatgaag gattattccc tggtggttga 47940
ctgatcacca taactgctaa tcattcaaac tatttagtct gtgacagagc caacacgcag 48000
tctgtcactg tcaggaaagt ggtaaaactg caactcaatt actgcaatgc cctcgtaatt 48060
aagtgaattt acaatatcgt cctgttcgga gggaagaacg cgggatgttc attcttcatc 48120
acttttaatt gatgtatatg ctctcttttc tgacgttagt ctccgacggc aggcttcaat 48180
gacccaggct gagaaattcc cggacccttt ttgctcaaga gcgatgttaa tttgttcaat 48240
catttggtta ggaaagcgga tgttgcgggt tgttgttctg cgggttctgt tcttcgttga 48300
catgaggttg ccccgtattc agtgtcgctg atttgtattg tctgaagttg tttttacgtt 48360
aagttgatgc agatcaatta atacgatacc tgcgtcataa ttgattattt gacgtggttt 48420
gatggcctcc acgcacgttg tgatatgtag atgataatca ttatcacttt acgggtcctt 48480
tccggtgatc cgacaggtta cg 48502
<210> 30
<211> 85
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 实施例2中使用的序列
<400> 30
ttatcgtgaa actccggagc gtttttcgtg cgccgcttca ccggtatcag gtagcagtag 60
ctcgcaatat cagcaccaac agaaa 85
<210> 31
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 实施例2中使用的序列
<400> 31
tttctgttgg tgctgatatt gcgagctact gctacctgat 40
<210> 32
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 实施例2中使用的序列
<220>
<221> misc_feature
<222> (5)..(5)
<223> n 为尿苷
<400> 32
gatcngaagc ggcgcacgaa aaacgctccg gagtttcacg ataa 44
<210> 33
<211> 85
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 实施例2中使用的SEQ ID NO:30的互补序列
<400> 33
tttctgttgg tgctgatatt gcgagctact gctacctgat accggtgaag cggcgcacga 60
aaaacgctcc ggagtttcac gataa 85
<210> 34
<211> 77
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 实施例3和4中使用的序列
<400> 34
tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt ggttgtttct 60
gttggtgctg atattgc 77
<210> 35
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 实施例3和4中使用的序列
<400> 35
gttttcgcat ttatcgtgaa acgctttcgc gtttttcgtg cgccgcttca 50
<210> 36
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 实施例3中使用的序列
<220>
<221> misc_feature
<222> (5)..(5)
<223> n 为尿苷
<400> 36
gatcngaagc ggcgcacgaa aaacgcgaaa gcgtttcacg ataaatgcga aaac 54
<210> 37
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 实施例3和4中使用的序列
<400> 37
tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 50
<210> 38
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 实施例3中使用的序列
<400> 38
gaagcggcgc acgaaaaacg cgaaagcgtt tcacgataaa tgcgaaaac 49
<210> 39
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 实施例3和4中使用的序列
<400> 39
gcaatatcag caccaacaga aacaacctt 29
<210> 40
<211> 970
<212> PRT
<213> 肉毒杆菌(Clostridium botulinum)
<400> 40
Met Leu Ser Val Ala Asn Val Arg Ser Pro Ser Ala Ala Ala Ser Tyr
1 5 10 15
Phe Ala Ser Asp Asn Tyr Tyr Ala Ser Ala Asp Ala Asp Arg Ser Gly
20 25 30
Gln Trp Ile Gly Asp Gly Ala Lys Arg Leu Gly Leu Glu Gly Lys Val
35 40 45
Glu Ala Arg Ala Phe Asp Ala Leu Leu Arg Gly Glu Leu Pro Asp Gly
50 55 60
Ser Ser Val Gly Asn Pro Gly Gln Ala His Arg Pro Gly Thr Asp Leu
65 70 75 80
Thr Phe Ser Val Pro Lys Ser Trp Ser Leu Leu Ala Leu Val Gly Lys
85 90 95
Asp Glu Arg Ile Ile Ala Ala Tyr Arg Glu Ala Val Val Glu Ala Leu
100 105 110
His Trp Ala Glu Lys Asn Ala Ala Glu Thr Arg Val Val Glu Lys Gly
115 120 125
Met Val Val Thr Gln Ala Thr Gly Asn Leu Ala Ile Gly Leu Phe Gln
130 135 140
His Asp Thr Asn Arg Asn Gln Glu Pro Asn Leu His Phe His Ala Val
145 150 155 160
Ile Ala Asn Val Thr Gln Gly Lys Asp Gly Lys Trp Arg Thr Leu Lys
165 170 175
Asn Asp Arg Leu Trp Gln Leu Asn Thr Thr Leu Asn Ser Ile Ala Met
180 185 190
Ala Arg Phe Arg Val Ala Val Glu Lys Leu Gly Tyr Glu Pro Gly Pro
195 200 205
Val Leu Lys His Gly Asn Phe Glu Ala Arg Gly Ile Ser Arg Glu Gln
210 215 220
Val Met Ala Phe Ser Thr Arg Arg Lys Glu Val Leu Glu Ala Arg Arg
225 230 235 240
Gly Pro Gly Leu Asp Ala Gly Arg Ile Ala Ala Leu Asp Thr Arg Ala
245 250 255
Ser Lys Glu Gly Ile Glu Asp Arg Ala Thr Leu Ser Lys Gln Trp Ser
260 265 270
Glu Ala Ala Gln Ser Ile Gly Leu Asp Leu Lys Pro Leu Val Asp Arg
275 280 285
Ala Arg Thr Lys Ala Leu Gly Gln Gly Met Glu Ala Thr Arg Ile Gly
290 295 300
Ser Leu Val Glu Arg Gly Arg Ala Trp Leu Ser Arg Phe Ala Ala His
305 310 315 320
Val Arg Gly Asp Pro Ala Asp Pro Leu Val Pro Pro Ser Val Leu Lys
325 330 335
Gln Asp Arg Gln Thr Ile Ala Ala Ala Gln Ala Val Ala Ser Ala Val
340 345 350
Arg His Leu Ser Gln Arg Glu Ala Ala Phe Glu Arg Thr Ala Leu Tyr
355 360 365
Lys Ala Ala Leu Asp Phe Gly Leu Pro Thr Thr Ile Ala Asp Val Glu
370 375 380
Lys Arg Thr Arg Ala Leu Val Arg Ser Gly Asp Leu Ile Ala Gly Lys
385 390 395 400
Gly Glu His Lys Gly Trp Leu Ala Ser Arg Asp Ala Val Val Thr Glu
405 410 415
Gln Arg Ile Leu Ser Glu Val Ala Ala Gly Lys Gly Asp Ser Ser Pro
420 425 430
Ala Ile Thr Pro Gln Lys Ala Ala Ala Ser Val Gln Ala Ala Ala Leu
435 440 445
Thr Gly Gln Gly Phe Arg Leu Asn Glu Gly Gln Leu Ala Ala Ala Arg
450 455 460
Leu Ile Leu Ile Ser Lys Asp Arg Thr Ile Ala Val Gln Gly Ile Ala
465 470 475 480
Gly Ala Gly Lys Ser Ser Val Leu Lys Pro Val Ala Glu Val Leu Arg
485 490 495
Asp Glu Gly His Pro Val Ile Gly Leu Ala Ile Gln Asn Thr Leu Val
500 505 510
Gln Met Leu Glu Arg Asp Thr Gly Ile Gly Ser Gln Thr Leu Ala Arg
515 520 525
Phe Leu Gly Gly Trp Asn Lys Leu Leu Asp Asp Pro Gly Asn Val Ala
530 535 540
Leu Arg Ala Glu Ala Gln Ala Ser Leu Lys Asp His Val Leu Val Leu
545 550 555 560
Asp Glu Ala Ser Met Val Ser Asn Glu Asp Lys Glu Lys Leu Val Arg
565 570 575
Leu Ala Asn Leu Ala Gly Val His Arg Leu Val Leu Ile Gly Asp Arg
580 585 590
Lys Gln Leu Gly Ala Val Asp Ala Gly Lys Pro Phe Ala Leu Leu Gln
595 600 605
Arg Ala Gly Ile Ala Arg Ala Glu Met Ala Thr Asn Leu Arg Ala Arg
610 615 620
Asp Pro Val Val Arg Glu Ala Gln Ala Ala Ala Gln Ala Gly Asp Val
625 630 635 640
Arg Lys Ala Leu Arg His Leu Lys Ser His Thr Val Glu Ala Arg Gly
645 650 655
Asp Gly Ala Gln Val Ala Ala Glu Thr Trp Leu Ala Leu Asp Lys Glu
660 665 670
Thr Arg Ala Arg Thr Ser Ile Tyr Ala Ser Gly Arg Ala Ile Arg Ser
675 680 685
Ala Val Asn Ala Ala Val Gln Gln Gly Leu Leu Ala Ser Arg Glu Ile
690 695 700
Gly Pro Ala Lys Met Lys Leu Glu Val Leu Asp Arg Val Asn Thr Thr
705 710 715 720
Arg Glu Glu Leu Arg His Leu Pro Ala Tyr Arg Ala Gly Arg Val Leu
725 730 735
Glu Val Ser Arg Lys Gln Gln Ala Leu Gly Leu Phe Ile Gly Glu Tyr
740 745 750
Arg Val Ile Gly Gln Asp Arg Lys Gly Lys Leu Val Glu Val Glu Asp
755 760 765
Lys Arg Gly Lys Arg Phe Arg Phe Asp Pro Ala Arg Ile Arg Ala Gly
770 775 780
Lys Gly Asp Asp Asn Leu Thr Leu Leu Glu Pro Arg Lys Leu Glu Ile
785 790 795 800
His Glu Gly Asp Arg Ile Arg Trp Thr Arg Asn Asp His Arg Arg Gly
805 810 815
Leu Phe Asn Ala Asp Gln Ala Arg Val Val Glu Ile Ala Asn Gly Lys
820 825 830
Val Thr Phe Glu Thr Ser Lys Gly Asp Leu Val Glu Leu Lys Lys Asp
835 840 845
Asp Pro Met Leu Lys Arg Ile Asp Leu Ala Tyr Ala Leu Asn Val His
850 855 860
Met Ala Gln Gly Leu Thr Ser Asp Arg Gly Ile Ala Val Met Asp Ser
865 870 875 880
Arg Glu Arg Asn Leu Ser Asn Gln Lys Thr Phe Leu Val Thr Val Thr
885 890 895
Arg Leu Arg Asp His Leu Thr Leu Val Val Asp Ser Ala Asp Lys Leu
900 905 910
Gly Ala Ala Val Ala Arg Asn Lys Gly Glu Lys Ala Ser Ala Ile Glu
915 920 925
Val Thr Gly Ser Val Lys Pro Thr Ala Thr Lys Gly Ser Gly Val Asp
930 935 940
Gln Pro Lys Ser Val Glu Ala Asn Lys Ala Glu Lys Glu Leu Thr Arg
945 950 955 960
Ser Lys Ser Lys Thr Leu Asp Phe Gly Ile
965 970
<210> 41
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 实施例4中使用的序列
<220>
<221> misc_feature
<222> (1)..(5)
<223> n 为肌苷
<400> 41
nnnnntgaag cggcgcacga aaaacgcgaa agcgtttcac gataaatgcg aaaac 55

Claims (18)

1.一种用于修饰模板双链多核苷酸的方法,包括:
(a)将模板多核苷酸与MuA转座酶和双链MuA底物组接触,每个所述底物包含(i)至少一个突出以及(ii)与所述至少一个突出在相同的链中的至少一个核苷酸,所述核苷酸包含在所述模板多核苷酸中不存在的核苷,使得所述转座酶将所述模板多核苷酸片段化并将底物连接到双链片段的一端或两端,并由此制备多个片段/底物构建体;
(b)通过选择性地除去所述至少一个核苷酸将所述突出从所述构建体中除去,并由此制备多个包含单链缺口的双链构建体;以及
(c)修复在所述构建体中所述单链缺口,并由此制备多个修饰的双链多核苷酸。
2.根据权利要求1所述的方法,其中所述模板多核苷酸包含脱氧腺苷核苷(dA),脱氧尿苷核苷(dU)和/或胸苷核苷(dT),脱氧鸟苷核苷(dG)和脱氧胞苷核苷(dC)。
3.根据权利要求1所述的方法,其中在所述模板多核苷酸中不存在的核苷是脱碱基的腺苷(A),尿苷(U),5-甲基尿苷(M5U),胞苷(C)或鸟苷(G)或包含尿素的5,6-二羟基胸腺嘧啶,胸腺嘧啶二醇,5-羟基-5-甲基乙内酰脲,尿嘧啶二醇,6-羟基5,6-二氢硫胺,甲基羟丙二酰脲,7,8-二氢-8-氧鸟嘌呤(8-氧鸟嘌呤),8–氧腺嘌呤,fapy-鸟嘌呤,甲基-fapy-鸟嘌呤,fapy-腺嘌呤,黄曲霉毒素B1-fapy鸟嘌呤,5-羟基-胞嘧啶,5-羟基-尿嘧啶,3-甲基腺嘌呤,7-甲基鸟嘌呤,1,N6-亚乙烯基腺嘌呤,次黄嘌呤,5-羟基尿嘧啶,5-羟甲基尿嘧啶,5-甲酰基尿嘧啶或顺-顺-环丁烷嘧啶二聚体。
4.根据权利要求1所述的方法,其中所述至少一个核苷酸是距离所述突出的10个或10以下的核苷酸。
5.根据权利要求1所述的方法,其中所述至少一个核苷酸是所述突出中的第一个核苷酸。
6.根据权利要求1所述的方法,其中所述突出中的所有核苷酸包括在所述模板多核苷酸中不存在的核苷。
7.根据权利要求1所述的方法,其中每个底物包括位于一端的突出和位于另一端的发夹环,且其中由所述方法制备的所述修饰的双链多核苷酸的两条链通过位于一端或两端的所述发夹环连接。
8.根据权利要求1所述的方法,其中每个底物是一端具有突出和另一端具有非互补区域的Y-底物,且其中通过所述方法制备的所述修饰的双链多核苷酸在一端或两端具有非互补区域。
9.根据权利要求1所述的方法,其中所述底物组中的部分底物包含位于一端的突出和位于另一端的发夹环,且所述底物组中的部分底物是一端具有突出和另一端具有非互补区域的Y-底物,并且其中至少一些由所述方法制备的所述修饰的双链多核苷酸具有位于一端的发夹环和位于另一端的非互补区域。
10.根据权利要求1所述的方法,其中所述底物包括选择性结合部分。
11.根据权利要求7所述的方法,其中所述方法进一步包括分离至少一个修饰的双链多核苷酸的两条链,以产生至少一个单链多核苷酸,所述单链多核苷酸包含所述修饰的双链多核苷酸的一条链,该链连接到所述修饰的双链多核苷酸的另一条链。
12.一种表征至少一种使用根据权利要求1所述方法进行修饰的多核苷酸的方法,包含:
a)将所述修饰的多核苷酸与跨膜孔接触,使得所述多核苷酸的至少一条链移动穿过所述孔;以及
b)随着所述至少一条链相对于所述孔移动,获取一个或多个测量值,其中所述测量值代表所述至少一条链的一个或多个特征,并由此表征所述修饰的多核苷酸。
13.一种表征模板多核苷酸的方法,包括:
a)使用根据权利要求1所述的方法修饰所述模板多核苷酸,以产生多个修饰的多核苷酸;
b)将每个修饰的多核苷酸与跨膜孔接触,使得每个多核苷酸的至少一条链移动穿过所述孔;以及
c)随着所述每个多核苷酸的至少一条链相对于所述孔移动,获取一个或多个测量值,其中所述测量值代表所述每个多核苷酸的至少一条链的一个或多个特征,并由此表征所述模板多核苷酸。
14.根据权利要求13所述的方法,其中所述一个或多个特征选自(i)所述多核苷酸的长度,(ii)所述多核苷酸的同一性,(iii)所述多核苷酸的序列,(ⅳ)所述多核苷酸的二级结构,以及(v)所述多核苷酸是否是经修饰的。
15.根据权利要求13所述的方法,其中步骤(b)进一步包括将每个修饰的多核苷酸与多核苷酸结合蛋白质接触,使得所述蛋白质控制每个修饰的多核苷酸的至少一条链穿过所述孔的移动。
16.根据权利要求15所述的方法,其中所述方法包括(a)将每个修饰的多核苷酸与跨膜孔和多核苷酸结合蛋白质接触,使得每个修饰的多核苷酸的至少一条链移动穿过所述孔,并且所述蛋白质控制每个修饰的多核苷酸的至少一条链穿过所述孔的移动;以及
(b)随着每个修饰的多核苷酸的至少一条链相对于所述孔移动,测量流经所述孔的电流,其中所述电流代表每个修饰的多核苷酸的至少一条链的一个或多个特征,并由此表征所述模板多核苷酸。
17.根据权利要求15所述的方法,其中所述多核苷酸结合蛋白质衍生自解旋酶。
18.一种用于修饰模板多核苷酸的试剂盒,包含(a)如根据权利要求1定义的MuA底物组,以及(b)MuA转座酶。
CN202010051452.8A 2013-08-16 2014-08-14 方法 Pending CN111235245A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1314695.6 2013-08-16
GBGB1314695.6A GB201314695D0 (en) 2013-08-16 2013-08-16 Method
CN201480056806.0A CN105705656B (zh) 2013-08-16 2014-08-14 方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201480056806.0A Division CN105705656B (zh) 2013-08-16 2014-08-14 方法

Publications (1)

Publication Number Publication Date
CN111235245A true CN111235245A (zh) 2020-06-05

Family

ID=49301814

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201480056806.0A Active CN105705656B (zh) 2013-08-16 2014-08-14 方法
CN202010051452.8A Pending CN111235245A (zh) 2013-08-16 2014-08-14 方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201480056806.0A Active CN105705656B (zh) 2013-08-16 2014-08-14 方法

Country Status (5)

Country Link
US (3) US10501767B2 (zh)
EP (1) EP3033435B1 (zh)
CN (2) CN105705656B (zh)
GB (1) GB201314695D0 (zh)
WO (1) WO2015022544A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021253410A1 (zh) * 2020-06-19 2021-12-23 北京齐碳科技有限公司 一种Pif1-like解旋酶及其应用

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5843614B2 (ja) 2009-01-30 2016-01-13 オックスフォード ナノポア テクノロジーズ リミテッド 膜貫通配列決定における核酸構築物のためのアダプター
WO2012164270A1 (en) 2011-05-27 2012-12-06 Oxford Nanopore Technologies Limited Coupling method
CN103827320B (zh) 2011-07-25 2017-04-26 牛津纳米孔技术有限公司 使用跨膜孔进行双链多核苷酸测序的发夹环方法
KR20140090633A (ko) 2011-10-21 2014-07-17 옥스포드 나노포어 테크놀로지즈 리미티드 포어 및 hel308 헬리카제를 사용하여 표적 폴리뉴클레오티드를 특성화하는 방법
US9777049B2 (en) 2012-04-10 2017-10-03 Oxford Nanopore Technologies Ltd. Mutant lysenin pores
WO2014013259A1 (en) 2012-07-19 2014-01-23 Oxford Nanopore Technologies Limited Ssb method
EP2875128B8 (en) 2012-07-19 2020-06-24 Oxford Nanopore Technologies Limited Modified helicases
GB201314695D0 (en) 2013-08-16 2013-10-02 Oxford Nanopore Tech Ltd Method
CN105209634B (zh) 2013-03-08 2020-05-12 牛津纳米孔技术公司 酶停滞方法
GB201313477D0 (en) 2013-07-29 2013-09-11 Univ Leuven Kath Nanopore biosensors for detection of proteins and nucleic acids
EP3058088A2 (en) 2013-10-18 2016-08-24 Oxford Nanopore Technologies Limited Modified enzymes
GB201406155D0 (en) 2014-04-04 2014-05-21 Oxford Nanopore Tech Ltd Method
AU2015208919B9 (en) 2014-01-22 2021-04-01 Oxford Nanopore Technologies Limited Method for attaching one or more polynucleotide binding proteins to a target polynucleotide
GB201403096D0 (en) 2014-02-21 2014-04-09 Oxford Nanopore Tech Ltd Sample preparation method
WO2015150786A1 (en) 2014-04-04 2015-10-08 Oxford Nanopore Technologies Limited Method for characterising a double stranded nucleic acid using a nano-pore and anchor molecules at both ends of said nucleic acid
EP3137627A1 (en) 2014-05-02 2017-03-08 Oxford Nanopore Technologies Limited Method of improving the movement of a target polynucleotide with respect to a transmembrane pore
GB201417712D0 (en) 2014-10-07 2014-11-19 Oxford Nanopore Tech Ltd Method
KR20170042794A (ko) 2014-09-01 2017-04-19 브이아이비 브이지더블유 돌연변이체 csgg 포어
WO2016055778A1 (en) 2014-10-07 2016-04-14 Oxford Nanopore Technologies Limited Mutant pores
GB201418159D0 (en) * 2014-10-14 2014-11-26 Oxford Nanopore Tech Ltd Method
GB201418469D0 (en) 2014-10-17 2014-12-03 Oxford Nanopore Tech Ltd Method
GB201502809D0 (en) 2015-02-19 2015-04-08 Oxford Nanopore Tech Ltd Mutant pore
GB201502810D0 (en) 2015-02-19 2015-04-08 Oxford Nanopore Tech Ltd Method
US11169138B2 (en) 2015-04-14 2021-11-09 Katholieke Universiteit Leuven Nanopores with internal protein adaptors
JP7237586B2 (ja) 2015-12-08 2023-03-13 カトリック ユニヴェルシテット ルーヴェン カーユー ルーヴェン リサーチ アンド ディベロップメント 修飾ナノポア、それを含む組成物およびその使用
CN108884150A (zh) 2016-03-02 2018-11-23 牛津纳米孔技术公司 突变孔
JP7364333B2 (ja) 2016-04-06 2023-10-18 オックスフォード ナノポール テクノロジーズ ピーエルシー 変異体ポア
GB201609221D0 (en) 2016-05-25 2016-07-06 Oxford Nanopore Tech Ltd Method
US20190203288A1 (en) 2016-05-25 2019-07-04 Oxford Nanopore Technologies Ltd. Method
GB201609220D0 (en) * 2016-05-25 2016-07-06 Oxford Nanopore Tech Ltd Method
GB201616590D0 (en) 2016-09-29 2016-11-16 Oxford Nanopore Technologies Limited Method
GB201620450D0 (en) 2016-12-01 2017-01-18 Oxford Nanopore Tech Ltd Method
GB201707140D0 (en) 2017-05-04 2017-06-21 Oxford Nanopore Tech Ltd Method
WO2019002893A1 (en) 2017-06-30 2019-01-03 Vib Vzw NEW PROTEIN PORES
GB201807793D0 (en) * 2018-05-14 2018-06-27 Oxford Nanopore Tech Ltd Method
GB201808558D0 (en) 2018-05-24 2018-07-11 Oxford Nanopore Tech Ltd Method
GB201809323D0 (en) 2018-06-06 2018-07-25 Oxford Nanopore Tech Ltd Method
JP2020031557A (ja) * 2018-08-28 2020-03-05 株式会社日立ハイテクノロジーズ 生体分子分析装置
CN111154837B (zh) * 2019-09-02 2021-05-18 浙江大学 一种全转录组范围单碱基分辨率检测rna n6-甲基腺嘌呤修饰的方法
GB201913997D0 (en) * 2019-09-27 2019-11-13 Oxford Nanopore Tech Ltd Method
WO2022243692A1 (en) 2021-05-19 2022-11-24 Oxford Nanopore Technologies Plc Methods for complement strand sequencing
WO2023223033A1 (en) 2022-05-18 2023-11-23 Oxford Nanopore Technologies Plc Compositions and methods for nucleic acid extraction and purification

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060019301A1 (en) * 2004-07-20 2006-01-26 Novozymes A/S Methods of producing mutant polynucleotides
US20110287435A1 (en) * 2008-10-24 2011-11-24 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
CN102264914A (zh) * 2008-10-24 2011-11-30 阿霹震中科技公司 用于修饰核酸的转座子末端组合物和方法
US20130017978A1 (en) * 2011-07-11 2013-01-17 Finnzymes Oy Methods and transposon nucleic acids for generating a dna library
US20130023423A1 (en) * 2011-07-20 2013-01-24 Finnzymes Oy Transposon nucleic acids comprising a calibration sequence for dna sequencing
WO2013098561A1 (en) * 2011-12-29 2013-07-04 Oxford Nanopore Technologies Limited Method for characterising a polynucelotide by using a xpd helicase

Family Cites Families (171)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IE56026B1 (en) 1982-10-19 1991-03-27 Cetus Corp Cysteine-depleted muteins of biologically active proteins
GB8924338D0 (en) 1989-10-28 1989-12-13 Atomic Energy Authority Uk Electrodes
US5215899A (en) 1989-11-09 1993-06-01 Miles Inc. Nucleic acid amplification employing ligatable hairpin probe and transcription
US5424413A (en) 1992-01-22 1995-06-13 Gen-Probe Incorporated Branched nucleic acid probes
FR2703693B1 (fr) 1993-04-06 1995-07-13 Pasteur Institut Procédé rapide de détermination d'une séquence d'ADN et application au séquençage et au diagnostic.
US5777078A (en) 1993-04-28 1998-07-07 Worcester Foundation For Experimental Biology Triggered pore-forming agents
JPH09500102A (ja) 1993-04-28 1997-01-07 ウォーセスター ファウンデーション フォー エクスペリメンタル バイオロジー 細胞指向性溶解孔形成剤
DE4320201A1 (de) 1993-06-18 1995-01-12 Asta Medica Ag Verwendung von Cetrorelix und weiteren Nona- und Dekapeptiden zur Herstellung eines Arzneimittels zur Bekämpfung von Aids und zur Wachstumsstimulation
US5561043A (en) 1994-01-31 1996-10-01 Trustees Of Boston University Self-assembling multimeric nucleic acid constructs
US7569341B2 (en) 1994-01-31 2009-08-04 Trustees Of Boston University Nucleic acid directed immobilization arrays and methods of assembly
US5795782A (en) 1995-03-17 1998-08-18 President & Fellows Of Harvard College Characterization of individual polymer molecules based on monomer-interface interactions
US6362002B1 (en) 1995-03-17 2002-03-26 President And Fellows Of Harvard College Characterization of individual polymer molecules based on monomer-interface interactions
US6395887B1 (en) 1995-08-01 2002-05-28 Yale University Analysis of gene expression by display of 3'-end fragments of CDNAS
US5866336A (en) 1996-07-16 1999-02-02 Oncor, Inc. Nucleic acid amplification oligonucleotides with molecular energy transfer labels and methods based thereon
AU8586298A (en) 1997-07-25 1999-02-16 University Of Massachusetts Designed protein pores as components for biosensors
US6087099A (en) 1997-09-08 2000-07-11 Myriad Genetics, Inc. Method for sequencing both strands of a double stranded DNA in a single sequencing reaction
US6127166A (en) 1997-11-03 2000-10-03 Bayley; Hagan Molluscan ligament polypeptides and genes encoding them
JPH11137260A (ja) 1997-11-06 1999-05-25 Soyaku Gijutsu Kenkyusho:Kk 抗インフルエンザウイルス環状ダンベル型rna−dnaキメラ化合物及び抗インフルエンザウイルス剤
US6123819A (en) 1997-11-12 2000-09-26 Protiveris, Inc. Nanoelectrode arrays
DE19826758C1 (de) 1998-06-15 1999-10-21 Soft Gene Gmbh Darstellung von linearen kovalent geschlossenen DNA-Molekülen als Expressionskonstrukte
US6743605B1 (en) 1998-06-24 2004-06-01 Enzo Life Sciences, Inc. Linear amplification of specific nucleic acid sequences
US7588900B2 (en) 2001-07-03 2009-09-15 The Regents Of The University Of California Mammalian sweet and amino acid heterodimeric taste receptors
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
US6235502B1 (en) 1998-09-18 2001-05-22 Molecular Staging Inc. Methods for selectively isolating DNA using rolling circle amplification
US6267872B1 (en) 1998-11-06 2001-07-31 The Regents Of The University Of California Miniature support for thin films containing single channels or nanopores and methods for using same
US6426231B1 (en) 1998-11-18 2002-07-30 The Texas A&M University System Analyte sensing mediated by adapter/carrier molecules
US6465193B2 (en) 1998-12-11 2002-10-15 The Regents Of The University Of California Targeted molecular bar codes and methods for using the same
NO986133D0 (no) 1998-12-23 1998-12-23 Preben Lexow FremgangsmÕte for DNA-sekvensering
US7056661B2 (en) 1999-05-19 2006-06-06 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
EP1192453B1 (en) 1999-06-22 2012-02-15 President and Fellows of Harvard College Molecular and atomic scale evaluation of biopolymers
EP1196434A2 (en) 1999-06-29 2002-04-17 University Health Network Peptide conjugates for the stabilization of membrane proteins and interactions with biological membranes
JP2003527087A (ja) 1999-08-13 2003-09-16 イェール・ユニバーシティ バイナリーコード化配列タグ
US6682649B1 (en) 1999-10-01 2004-01-27 Sophion Bioscience A/S Substrate and a method for determining and/or monitoring electrophysiological properties of ion channels
AU1804001A (en) 1999-12-02 2001-06-12 Molecular Staging, Inc. Generation of single-strand circular dna from linear self-annealing segments
WO2001059453A2 (en) 2000-02-11 2001-08-16 The Texas A & M University System Biosensor compositions and methods of use
AU2001250912B2 (en) 2000-03-21 2007-01-04 Curagen Corporation VEGF-modulated genes and methods employing them
DK1265914T3 (da) 2000-03-22 2008-03-10 Curagen Corp WNT-1-relaterede polypeptider og nukleinsyrer, der koder for samme
US6596488B2 (en) 2000-03-30 2003-07-22 City Of Hope Tumor suppressor gene
US6387624B1 (en) 2000-04-14 2002-05-14 Incyte Pharmaceuticals, Inc. Construction of uni-directionally cloned cDNA libraries from messenger RNA for improved 3′ end DNA sequencing
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
US20020132350A1 (en) * 2000-09-14 2002-09-19 Pioneer Hi-Bred International, Inc. Targeted genetic manipulation using Mu bacteriophage cleaved donor complex
US6936433B2 (en) 2000-11-27 2005-08-30 The Regents Of The University Of California Methods and devices for characterizing duplex nucleic acid molecules
US20020197618A1 (en) 2001-01-20 2002-12-26 Sampson Jeffrey R. Synthesis and amplification of unstructured nucleic acids for rapid sequencing
US20030087232A1 (en) 2001-01-25 2003-05-08 Fred Christians Methods for screening polypeptides
US7807408B2 (en) 2001-03-19 2010-10-05 President & Fellows Of Harvard College Directed evolution of proteins
US6863833B1 (en) 2001-06-29 2005-03-08 The Board Of Trustees Of The Leland Stanford Junior University Microfabricated apertures for supporting bilayer lipid membranes
US6852492B2 (en) 2001-09-24 2005-02-08 Intel Corporation Nucleic acid sequencing by raman monitoring of uptake of precursors during molecular replication
US7413854B2 (en) 2002-03-15 2008-08-19 Nuevolution A/S Method for synthesising templated molecules
AU2003245272A1 (en) 2002-05-10 2003-11-11 The Texas A And M University System Stochastic sensing through covalent interactions
WO2004065582A2 (en) 2003-01-15 2004-08-05 Dana-Farber Cancer Institute, Inc. Amplification of dna in a hairpin structure, and applications
EP1592810A2 (en) 2003-02-12 2005-11-09 Genizon Svenska AB Methods and means for nucleic acid sequencing
US7745116B2 (en) 2003-04-08 2010-06-29 Pacific Biosciences Of California, Inc. Composition and method for nucleic acid sequencing
US7163658B2 (en) 2003-04-23 2007-01-16 Rouvain Bension Rapid sequencing of polymers
US7344882B2 (en) 2003-05-12 2008-03-18 Bristol-Myers Squibb Company Polynucleotides encoding variants of the TRP channel family member, LTRPC3
WO2005056750A2 (en) 2003-12-11 2005-06-23 Quark Biotech, Inc. Inversion-duplication of nucleic acids and libraries prepared thereby
US7238485B2 (en) 2004-03-23 2007-07-03 President And Fellows Of Harvard College Methods and apparatus for characterizing polynucleotides
GB2413796B (en) 2004-03-25 2006-03-29 Global Genomics Ab Methods and means for nucleic acid sequencing
US20050227239A1 (en) 2004-04-08 2005-10-13 Joyce Timothy H Microarray based affinity purification and analysis device coupled with solid state nanopore electrodes
US7618778B2 (en) 2004-06-02 2009-11-17 Kaufman Joseph C Producing, cataloging and classifying sequence tags
WO2005124888A1 (en) 2004-06-08 2005-12-29 President And Fellows Of Harvard College Suspended carbon nanotube field effect transistor
US7700281B2 (en) 2004-06-30 2010-04-20 Usb Corporation Hot start nucleic acid amplification
WO2006020775A2 (en) 2004-08-13 2006-02-23 Harvard University An ultra high-throughput opti-nanopore dna readout platform
US20060086626A1 (en) 2004-10-22 2006-04-27 Joyce Timothy H Nanostructure resonant tunneling with a gate voltage source
EP1842061A4 (en) 2004-12-21 2009-05-13 Texas A & M Univ Sys HIGH-TEMPERATURE ION CHANNELS AND ION PORES
US7890268B2 (en) 2004-12-28 2011-02-15 Roche Molecular Systems, Inc. De-novo sequencing of nucleic acids
GB0505971D0 (en) 2005-03-23 2005-04-27 Isis Innovation Delivery of molecules to a lipid bilayer
US7507575B2 (en) 2005-04-01 2009-03-24 3M Innovative Properties Company Multiplex fluorescence detection device having removable optical modules
WO2007145612A1 (en) 2005-06-06 2007-12-21 454 Life Sciences Corporation Paired end sequencing
US20070020640A1 (en) 2005-07-21 2007-01-25 Mccloskey Megan L Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis
US20070031857A1 (en) 2005-08-02 2007-02-08 Rubicon Genomics, Inc. Compositions and methods for processing and amplification of DNA, including using multiple enzymes in a single reaction
WO2007024997A2 (en) 2005-08-22 2007-03-01 Fermalogic, Inc. Methods of increasing production of secondary metabolites
GB0523282D0 (en) 2005-11-15 2005-12-21 Isis Innovation Methods using pores
CA2633476C (en) 2005-12-22 2015-04-21 Pacific Biosciences Of California, Inc. Active surface coupled polymerases
US7932029B1 (en) 2006-01-04 2011-04-26 Si Lok Methods for nucleic acid mapping and identification of fine-structural-variations in nucleic acids and utilities
WO2007098427A2 (en) 2006-02-18 2007-08-30 Michael Strathmann Massively multiplexed sequencing
US8673567B2 (en) 2006-03-08 2014-03-18 Atila Biosystems, Inc. Method and kit for nucleic acid sequence detection
DK2002017T3 (en) 2006-04-04 2015-09-07 Keygene Nv High-capacity detection of molecular markers based on restriction fragments
CN101495656B (zh) 2006-06-07 2017-02-08 纽约哥伦比亚大学理事会 采用带修饰的核苷酸通过纳米通道进行dna序列测定
JP4876766B2 (ja) 2006-08-10 2012-02-15 トヨタ自動車株式会社 燃料電池
CA2663047A1 (en) 2006-09-06 2008-03-13 Phase Bioscience, Inc. Therapeutic elastin-like polypeptide (elp) fusion proteins
WO2008045575A2 (en) 2006-10-13 2008-04-17 J. Craig Venter Institute, Inc. Sequencing method
WO2008051530A2 (en) 2006-10-23 2008-05-02 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
GB2445016B (en) 2006-12-19 2012-03-07 Microsaic Systems Plc Microengineered ionisation device
AU2008217579A1 (en) 2007-02-20 2008-08-28 Oxford Nanopore Technologies Limited Formation of lipid bilayers
EP3798317B1 (en) 2007-04-04 2024-01-03 The Regents of the University of California Compositions, devices, systems, and methods for using a nanopore
EP2195648B1 (en) 2007-09-12 2019-05-08 President and Fellows of Harvard College High-resolution molecular graphene sensor comprising an aperture in the graphene layer
GB2453377A (en) 2007-10-05 2009-04-08 Isis Innovation Transmembrane protein pores and molecular adapters therefore.
KR101414713B1 (ko) 2007-10-11 2014-07-03 삼성전자주식회사 리가제 및 엔도뉴클레아제의 존재하에서 롤링서클 증폭에의하여 표적 핵산을 증폭하는 방법
GB0724736D0 (en) 2007-12-19 2008-01-30 Oxford Nanolabs Ltd Formation of layers of amphiphilic molecules
EP2232233B1 (en) 2007-12-31 2014-03-12 Fujirebio Inc. Clusters of microresonators for cavity mode optical sensing
US8852864B2 (en) 2008-01-17 2014-10-07 Sequenom Inc. Methods and compositions for the analysis of nucleic acids
US8231969B2 (en) 2008-03-26 2012-07-31 University Of Utah Research Foundation Asymmetrically functionalized nanoparticles
CA2991818C (en) 2008-03-28 2022-10-11 Pacific Biosciences Of California, Inc. Compositions and methods for nucleic acid sequencing
US8236499B2 (en) 2008-03-28 2012-08-07 Pacific Biosciences Of California, Inc. Methods and compositions for nucleic acid sample preparation
US8628940B2 (en) 2008-09-24 2014-01-14 Pacific Biosciences Of California, Inc. Intermittent detection during analytical reactions
WO2009132124A2 (en) 2008-04-24 2009-10-29 The Trustees Of Columbia University In The City Of New York Geometric patterns and lipid bilayers for dna molecule organization and uses thereof
US20090269771A1 (en) 2008-04-24 2009-10-29 Life Technologies Corporation Method of sequencing and mapping target nucleic acids
CN102144037A (zh) 2008-07-07 2011-08-03 牛津纳米孔技术有限公司 检测碱基的孔
EP2682460B1 (en) 2008-07-07 2017-04-26 Oxford Nanopore Technologies Limited Enzyme-pore constructs
US20100092960A1 (en) 2008-07-25 2010-04-15 Pacific Biosciences Of California, Inc. Helicase-assisted sequencing with molecular beacons
EP2344891B1 (en) 2008-09-22 2016-03-16 University Of Washington Msp nanopores and related methods
WO2010036287A1 (en) 2008-09-24 2010-04-01 Pacific Biosciences Of California, Inc. Intermittent detection during analytical reactions
US8383369B2 (en) 2008-09-24 2013-02-26 Pacific Biosciences Of California, Inc. Intermittent detection during analytical reactions
US8486630B2 (en) 2008-11-07 2013-07-16 Industrial Technology Research Institute Methods for accurate sequence data and modified base position determination
GB0820927D0 (en) 2008-11-14 2008-12-24 Isis Innovation Method
EP2370598B1 (en) 2008-12-11 2017-02-15 Pacific Biosciences Of California, Inc. Classification of nucleic acid templates
JP5843614B2 (ja) 2009-01-30 2016-01-13 オックスフォード ナノポア テクノロジーズ リミテッド 膜貫通配列決定における核酸構築物のためのアダプター
WO2010086603A1 (en) 2009-01-30 2010-08-05 Oxford Nanopore Technologies Limited Enzyme mutant
AU2010213510B2 (en) 2009-02-16 2014-05-01 Epicentre Technologies Corporation Template-independent ligation of single-stranded DNA
BRPI1011384A2 (pt) 2009-02-23 2016-03-15 Cytomx Therapeutics Inc pro-proteinas e seus metodos de uso
FR2943656A1 (fr) 2009-03-25 2010-10-01 Air Liquide Procede et installation de production d'hydrogene mettant en oeuvre un compresseur thermocinetique
GB0905140D0 (en) 2009-03-25 2009-05-06 Isis Innovation Method
WO2010117470A2 (en) 2009-04-10 2010-10-14 Pacific Biosciences Of California, Inc. Nanopore sequencing devices and methods
CN102405410B (zh) 2009-04-20 2014-06-25 牛津楠路珀尔科技有限公司 脂质双层传感器阵列
GB0910302D0 (en) 2009-06-15 2009-07-29 Lumora Ltd Nucleic acid amplification
JP5873023B2 (ja) 2009-12-01 2016-03-01 オックスフォード ナノポール テクノロジーズ リミテッド 生化学分析機器
WO2011090556A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Methods for determining fraction of fetal nucleic acid in maternal samples
FR2955773B1 (fr) 2010-02-01 2017-05-26 Commissariat A L'energie Atomique Complexe moleculaire de ciblage des antigenes vers les cellules presentatrices d'antigene et ses applications pour la vaccination
KR20110100963A (ko) 2010-03-05 2011-09-15 삼성전자주식회사 미세 유동 장치 및 이를 이용한 표적 핵산의 염기 서열 결정 방법
US20110224106A1 (en) 2010-03-10 2011-09-15 Ibis Biosciences, Inc. Production Of Single-Stranded Circular Nucleic Acid
US8652779B2 (en) 2010-04-09 2014-02-18 Pacific Biosciences Of California, Inc. Nanopore sequencing using charge blockade labels
US20120244525A1 (en) 2010-07-19 2012-09-27 New England Biolabs, Inc. Oligonucleotide Adapters: Compositions and Methods of Use
EP2614156B1 (en) 2010-09-07 2018-08-01 The Regents of The University of California Control of dna movement in a nanopore at one nucleotide precision by a processive enzyme
EP2635679B1 (en) 2010-11-05 2017-04-19 Illumina, Inc. Linking sequence reads using paired code tags
ES2641871T3 (es) 2010-12-17 2017-11-14 The Trustees Of Columbia University In The City Of New York Secuenciación de ADN mediante síntesis usando nucleótidos modificados y detección con nanoporos
CN103688131B (zh) 2011-01-18 2019-04-02 R·K·斯瓦密 用于三角形解的多用途仪器、称为三计量器的测量和几何应用
US9402808B2 (en) 2011-01-19 2016-08-02 Panacea Biotec Limited Liquid oral composition of lanthanum salts
DK3037536T3 (da) 2011-01-28 2020-01-13 Illumina Inc Oligonukleotiderstatning for di-taggede og retnings biblioteker
US20120196279A1 (en) 2011-02-02 2012-08-02 Pacific Biosciences Of California, Inc. Methods and compositions for nucleic acid sample preparation
CN103460040B (zh) 2011-02-11 2016-08-17 牛津纳米孔技术有限公司 突变型孔
WO2012164270A1 (en) 2011-05-27 2012-12-06 Oxford Nanopore Technologies Limited Coupling method
CN103827320B (zh) 2011-07-25 2017-04-26 牛津纳米孔技术有限公司 使用跨膜孔进行双链多核苷酸测序的发夹环方法
US9632102B2 (en) 2011-09-25 2017-04-25 Theranos, Inc. Systems and methods for multi-purpose analysis
EP3269825B1 (en) 2011-09-23 2020-02-19 Oxford Nanopore Technologies Limited Analysis of a polymer comprising polymer units
US20140308661A1 (en) 2011-09-25 2014-10-16 Theranos, Inc. Systems and methods for multi-analysis
US9810704B2 (en) 2013-02-18 2017-11-07 Theranos, Inc. Systems and methods for multi-analysis
KR20140090633A (ko) 2011-10-21 2014-07-17 옥스포드 나노포어 테크놀로지즈 리미티드 포어 및 hel308 헬리카제를 사용하여 표적 폴리뉴클레오티드를 특성화하는 방법
CN104126018B (zh) * 2011-12-29 2021-09-14 牛津纳米孔技术公司 酶方法
NO2694769T3 (zh) 2012-03-06 2018-03-03
US9777049B2 (en) 2012-04-10 2017-10-03 Oxford Nanopore Technologies Ltd. Mutant lysenin pores
GB2557509A (en) 2012-06-08 2018-06-20 Pacific Biosciences California Inc Modified base detection with nanopore sequencing
TWI655213B (zh) 2012-07-13 2019-04-01 目立康股份有限公司 自我組織化肽衍生物的製造方法
WO2014013259A1 (en) 2012-07-19 2014-01-23 Oxford Nanopore Technologies Limited Ssb method
WO2014013262A1 (en) 2012-07-19 2014-01-23 Oxford Nanopore Technologies Limited Enzyme construct
EP2875128B8 (en) 2012-07-19 2020-06-24 Oxford Nanopore Technologies Limited Modified helicases
WO2014041337A1 (en) 2012-09-14 2014-03-20 Oxford Nanopore Technologies Limited Sample preparation method
GB201313121D0 (en) 2013-07-23 2013-09-04 Oxford Nanopore Tech Ltd Array of volumes of polar medium
CA2889664C (en) 2012-10-26 2020-12-29 Oxford Nanopore Technologies Limited Droplet interfaces
WO2014074922A1 (en) 2012-11-09 2014-05-15 Stratos Genomics, Inc. Concentrating a target molecule for sensing by a nanopore
US9683230B2 (en) 2013-01-09 2017-06-20 Illumina Cambridge Limited Sample preparation on a solid support
US20140206842A1 (en) 2013-01-22 2014-07-24 Muhammed Majeed Peptides Modified with Triterpenoids and Small Organic Molecules: Synthesis and use in Cosmeceutical
GB201314695D0 (en) 2013-08-16 2013-10-02 Oxford Nanopore Tech Ltd Method
GB201318465D0 (en) 2013-10-18 2013-12-04 Oxford Nanopore Tech Ltd Method
CN105209634B (zh) 2013-03-08 2020-05-12 牛津纳米孔技术公司 酶停滞方法
EP3312295A1 (en) 2013-03-19 2018-04-25 Directed Genomics, LLC Enrichment of target sequences
CN105992634B (zh) 2013-08-30 2019-06-14 华盛顿大学商业中心 选择性修饰聚合物亚单位以改进基于纳米孔的分析
EP3058088A2 (en) 2013-10-18 2016-08-24 Oxford Nanopore Technologies Limited Modified enzymes
GB201406151D0 (en) 2014-04-04 2014-05-21 Oxford Nanopore Tech Ltd Method
AU2015208919B9 (en) 2014-01-22 2021-04-01 Oxford Nanopore Technologies Limited Method for attaching one or more polynucleotide binding proteins to a target polynucleotide
GB201403096D0 (en) 2014-02-21 2014-04-09 Oxford Nanopore Tech Ltd Sample preparation method
US10131944B2 (en) 2014-03-24 2018-11-20 The Regents Of The University Of California Molecular adapter for capture and manipulation of transfer RNA
SG11201610357UA (en) 2014-06-13 2017-01-27 Illumina Cambridge Ltd Methods and compositions for preparing sequencing libraries
US10017759B2 (en) 2014-06-26 2018-07-10 Illumina, Inc. Library preparation of tagged nucleic acid
US10577603B2 (en) 2014-06-30 2020-03-03 Illumina, Inc. Methods and compositions using one-sided transposition
WO2016022557A1 (en) 2014-08-05 2016-02-11 Twist Bioscience Corporation Cell free cloning of nucleic acids
WO2016028887A1 (en) 2014-08-19 2016-02-25 Pacific Biosciences Of California, Inc. Compositions and methods for enrichment of nucleic acids
GB201418159D0 (en) 2014-10-14 2014-11-26 Oxford Nanopore Tech Ltd Method
CN107208162B (zh) 2015-02-26 2020-12-29 株式会社日立高新技术 核酸分子的构建方法
GB201609220D0 (en) 2016-05-25 2016-07-06 Oxford Nanopore Tech Ltd Method
CN107488656B (zh) 2016-06-13 2020-07-17 陆欣华 一种核酸等温自扩增方法
GB201807793D0 (en) 2018-05-14 2018-06-27 Oxford Nanopore Tech Ltd Method

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060019301A1 (en) * 2004-07-20 2006-01-26 Novozymes A/S Methods of producing mutant polynucleotides
US20110287435A1 (en) * 2008-10-24 2011-11-24 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
CN102264914A (zh) * 2008-10-24 2011-11-30 阿霹震中科技公司 用于修饰核酸的转座子末端组合物和方法
US20130017978A1 (en) * 2011-07-11 2013-01-17 Finnzymes Oy Methods and transposon nucleic acids for generating a dna library
US20130023423A1 (en) * 2011-07-20 2013-01-24 Finnzymes Oy Transposon nucleic acids comprising a calibration sequence for dna sequencing
WO2013098561A1 (en) * 2011-12-29 2013-07-04 Oxford Nanopore Technologies Limited Method for characterising a polynucelotide by using a xpd helicase

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NICHOLAS J. HEREDIA等: "In vitro double transposition for DNA identification" *
李青等: "玉米CACTA型转座子携带宿主基因片段转移新功能的发现与特性分析" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021253410A1 (zh) * 2020-06-19 2021-12-23 北京齐碳科技有限公司 一种Pif1-like解旋酶及其应用
CN114599666A (zh) * 2020-06-19 2022-06-07 北京齐碳科技有限公司 一种Pif1-like解旋酶及其应用

Also Published As

Publication number Publication date
EP3033435A1 (en) 2016-06-22
EP3033435B1 (en) 2019-07-24
WO2015022544A1 (en) 2015-02-19
US10501767B2 (en) 2019-12-10
US11186857B2 (en) 2021-11-30
US20160194677A1 (en) 2016-07-07
CN105705656B (zh) 2020-02-21
GB201314695D0 (en) 2013-10-02
US20220186274A1 (en) 2022-06-16
US20200131549A1 (en) 2020-04-30
CN105705656A (zh) 2016-06-22

Similar Documents

Publication Publication Date Title
CN105705656B (zh) 方法
US11560589B2 (en) Enzyme stalling method
CN106460061B (zh) 在双链核酸分子的两端使用纳米孔和锚分子来表征所述双链核酸的方法
US11542551B2 (en) Sample preparation method
CN107109483B (zh) 一种修饰模板双链多核苷酸的方法
JP6799072B2 (ja) 変異体ポア
EP2895618B1 (en) Sample preparation method
AU2014379438B2 (en) Method for controlling the movement of a polynucleotide through a transmembrane pore
CN106459159B (zh) 突变孔
CN109312401B (zh) 连接的核酸的纳米孔测序方法
CA3062111A1 (en) Transmembrane pore consisting of two csgg pores
CN111534504A (zh) 将一个或多个多核苷酸结合蛋白连接到靶多核苷酸的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: oxford

Applicant after: Oxford nanopore Technology Public Co.,Ltd.

Address before: Oxfordshire

Applicant before: OXFORD NANOPORE TECHNOLOGIES LTD.

CB02 Change of applicant information