CN109219665B - 修饰模板双链多核苷酸以用于表征的方法 - Google Patents

修饰模板双链多核苷酸以用于表征的方法 Download PDF

Info

Publication number
CN109219665B
CN109219665B CN201780034561.5A CN201780034561A CN109219665B CN 109219665 B CN109219665 B CN 109219665B CN 201780034561 A CN201780034561 A CN 201780034561A CN 109219665 B CN109219665 B CN 109219665B
Authority
CN
China
Prior art keywords
polynucleotide
leu
seq
gly
helicase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780034561.5A
Other languages
English (en)
Other versions
CN109219665A (zh
Inventor
戴维·杰克逊·斯托达特
詹姆斯·怀特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oxford Nanopore Technology Public Co ltd
Original Assignee
Oxford Nanopore Technologies PLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oxford Nanopore Technologies PLC filed Critical Oxford Nanopore Technologies PLC
Publication of CN109219665A publication Critical patent/CN109219665A/zh
Application granted granted Critical
Publication of CN109219665B publication Critical patent/CN109219665B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/513Winding/unwinding enzyme, e.g. helicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2522/00Reaction characterised by the use of non-enzymatic proteins
    • C12Q2522/10Nucleic acid binding proteins
    • C12Q2522/101Single or double stranded nucleic acid binding proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/155Modifications characterised by incorporating/generating a new priming site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/60Detection means characterised by use of a special device
    • C12Q2565/631Detection means characterised by use of a special device being a biochannel or pore

Abstract

本发明涉及修饰模板双链多核苷酸的方法,特别是用于使用纳米孔测序的表征。该方法从模板产生多个修饰的双链多核苷酸。然后可以表征这些修饰的多核苷酸。

Description

修饰模板双链多核苷酸以用于表征的方法
技术领域
本发明涉及修饰模板双链多核苷酸的方法,特别是用于使用纳米孔测序的表征。
背景技术
有许多商业情况需要制备核酸文库。这通常使用转座酶实现。取决于用于制备文库的转座酶,可能需要可以使用文库之前在体外修复转座事件,例如在测序中。
当前在广泛的应用范围内需要快速且便宜的核酸(例如,DNA或RNA)测序和鉴定技术。现有技术缓慢且昂贵,主要是因为它们依赖于扩增技术来产生大量多核苷酸并且需要大量用于信号检测的专用荧光化学品。
跨膜孔(纳米孔)作为聚合物和各种小分子的直接电子生物传感器具有巨大的潜力。具体地,最近关注作为潜在的DNA测序技术的纳米孔。
当跨纳米孔施加电势时,当如核苷酸等分析物在桶中暂时停留一段时间时,电流会发生变化。纳米孔检测核苷酸给出已知特征和持续时间的电流变化。在链测序方法中,使单个多核苷酸链通过孔并且衍生出核苷酸的同一性。链测序可以涉及使用分子刹车来控制移动所述多核苷酸通过孔。
国际申请号PCT/GB2014/052505(公开为WO 2015/022544)公开了一种使用MuA转座酶和MuA底物群,以从模板双链多核苷酸产生多个更短的、经修饰的双链多核苷酸。可以设计修饰的多核苷酸,使得它们各自比原始模板多核苷酸更容易表征,例如通过链测序。MuA转座酶通过热灭活。
发明内容
本发明涉及修饰模板双链多核苷酸的方法,特别是用于使用纳米孔测序的表征。该方法从模板产生多个修饰的双链多核苷酸。然后可以表征这些修饰的多核苷酸。
发明人惊奇地证明,可以使用转位酶从修饰的多核苷酸中除去MuA转座酶。这避免了加热使MuA转座酶失活的需要,其也可以灭活用于制备或表征修饰的多核苷酸的任何其他酶或蛋白质。去除热灭活步骤还省去了用于加热样品的额外设备,例如热循环仪或水浴。
因此,本发明提供了修饰模板双链多核苷酸的方法,包括:
(a)使模板多核苷酸与MuA转座酶和双链MuA底物群接触,每个底物在一条链的一端或两端包含突出端,使得转座酶将模板多核苷酸片段化并将底物连接到双链片段的一端或两端,从而产生多个片段/底物构建体;和
(b)使用转位酶从构建体中除去MuA转座酶,从而产生多个修饰的双链多核苷酸。
附图说明
图1显示了Agilent 2100Bioanalyser曲线。下标记标记为X,上标记标记为Y。当在室温下在不存在酶的情况下孵育时,在转座体1(标记为1)或转座体2(标记为2)的上部和下部标记之间未观察到PhiX峰。
图2显示了Agilent 2100Bioanalyser曲线。下标记标记为X,上标记标记为Y。当在75℃温育10分钟时,在转座体1(标记为1)的上部和下部标记之间观察到PhiX峰。
图3显示了Agilent 2100Bioanalyser曲线。下标记标记为X,上标记标记为Y。当在75℃温育10分钟时,在转座体2(标记为1)的上部和下部标记之间观察到PhiX峰。
图4显示了Agilent 2100Bioanalyser曲线。下标记标记为X,上标记标记为Y。当与Hel308Mbu-E284C/S615C-STrEP(C)(SEQ ID NO:10,具有突变E284C/S615C,在其C末端连接有链霉亲和素标签)孵育时,在转座体1(标记为1)的上部和下部标记之间未观察到PhiX峰。
图5显示了Agilent 2100Bioanalyser曲线。下标记标记为X,上标记标记为Y。当与Hel308Mbu-E284C/S615C-STrEP(SEQ ID NO:10,具有突变E284C/S615C,在其C末端连接有链霉亲和素标签)孵育时,在转座体2(标记为1)的上部和下部标记之间观察到PhiX峰。
图6显示了Agilent 2100Bioanalyser曲线。下标记标记为X,上标记标记为Y。当与A)Hel308Mbu-E284C/S615C-STrEP(C)(SEQ ID NO:10,具有突变E284C/S615C,在其C末端连接有链霉亲和素标签)或B)在75℃孵育10分钟时,在转座体2(标记为1)的上部和下部标记之间观察到PhiX峰。PhiX与经加热和Hel308处理的转座体2的比较。红色经过热处理,蓝色经过Hel308处理。
图7显示了Agilent 2100Bioanalyser曲线。下标记标记为X,上标记标记为Y。线1对应于对照样品(i),其在室温下在不存在转位酶的情况下孵育。没有观察到样品(i)的标记(tragmentation)峰。线2对应于已在75℃温育的样品(ii)。对样品(ii)在上标记和下标记之间观察到标记(tagmentation)峰。
图8显示了Agilent 2100Bioanalyser曲线。下标记标记为X,上标记标记为Y。线1对应于对照样品(i),其在室温下在不存在转位酶的情况下孵育。没有观察到样品(i)的标记(tragmentation)峰。线3对应于样品(iii),其在室温下与Hel308Mbu-E284C-STrEP(C)(具有突变E284C的SEQ ID NO:10,其C末端连接有链霉亲和素标签)一起温育。对样品(iii)在上标记和下标记之间观察到标记峰。
图9显示了Agilent 2100Bioanalyser曲线。下标记标记为X,上标记标记为Y。线1对应于对照样品(i),其在室温下在不存在转位酶的情况下孵育。没有观察到样品(i)的标记(tragmentation)峰。线4对应于样品(iv),其在室温下与T4Dda-(E94C/F98W/C109A/C136A/A360C)(SEQ ID NO:97,具有突变E94C/F98W/C109A/C136A/A360C、然后(ΔM1)G1G2(其中(ΔM1)G1G2=M1删除,然后加入G1和G2)一起孵育。对样品(iv)在上标记物和下标记物之间观察到标记峰。
图10显示了Agilent 2100Bioanalyser曲线。下标记标记为X,上标记标记为Y。线1对应于对照样品(i),其在室温下在不存在转位酶的情况下孵育。没有观察到样品(i)的标记(tragmentation)峰。线5对应于样品(v),其在室温下与UvrD Eco-(E117C/M380C)-STrEP(具有突变E177C/M380C的SEQ ID NO:122,其中链霉亲和素标签连接在C末端)孵育。对样品(v)在上标记和下标记之间观察到标记峰。
图11显示样品1-3的通量的条形图(y轴标记=kb/纳米孔/小时)(样品1=在室温下与Hel308Mbu-E284C/S615C-STrEP(C)使用具有3'突出端的转座体孵育,样品2=在75℃温育10分钟,样品3=在不存在Hel308Mbu-E284C/S615C-STrEP(C)下室温温育)。
图12显示了用于从构建体中去除MuA转座酶的转位酶的卡通图示。MuA转座酶(标记为A)与双链MuA底物(标记为B)结合,该底物在一条链的每个末端具有两个标记为C的突出端。在步骤1中,MuA将模板多核苷酸片段化并将双链MuA底物连接到一端,产生构建体D。在步骤2中,使转座酶(标记为E)在突出端之一处与构建体结合。在步骤3中,转位酶从构建体中除去MuA,产生修饰的双链多核苷酸。在步骤4中,将前导序列连接到双链多核苷酸上,所述双链多核苷酸具有预先结合的酶(标记为F),其能够控制多核苷酸通过纳米孔的运动。
应理解的是,附图仅用于说明本发明的具体实施例而并不旨在是限制性的。
序列表的描述
SEQ ID NO:1示出了编码MS-B1突变体MspA单体的密码子优化的多核苷酸序列。此突变体缺乏信号序列,并且包含以下突变:D90N、D91N、D93N、D118R、D134R和E139K。
SEQ ID NO:2示出了MspA单体的MS-B1突变体的成熟形式的氨基酸序列。此突变体缺乏信号序列,并且包含以下突变:D90N、D91N、D93N、D118R、D134R和E139K。
SEQ ID NO:3示出编码α-溶血素-E111N/K147N(α-HL-NN的一种单体的多核苷酸序列;Stoddart等人,PNAS,2009;106(19):7702-7707)。
SEQ ID NO:4示出了α-HL-NN的一种单体的氨基酸序列。
SEQ ID No:5到SEQ ID No:7示出了MspB、MspC和MspD的氨基酸序列。
SEQ ID NO:8示出了Hel308基序的氨基酸序列。
SEQ ID NO:9示出了扩展Hel308基序的氨基酸序列。
SEQ ID NO:10至58显示表1中Hel308解旋酶的氨基酸序列。
SEQ ID NO:59显示RecD样基序I。
SEQ ID NOs:60至62显示扩展的RecD样基序I。
SEQ ID NO:63显示RecD基序I。
SEQ ID NO:64显示优选的RecD基序I,即G-G-P-G-T-G-K-T。
SEQ ID NOs:65至67显示扩展的RecD基序I。
SEQ ID NO:68显示RecD样基序V。
SEQ ID NO:69显示RecD基序V。
SEQ ID NOs:70至77显示了MobF基序III。
SEQ ID NO:78至84显示MobQ基序III。
SEQ ID NO:85显示TraI Eco的氨基酸序列。
SEQ ID NO:86显示了TraI Eco的RecD样基序I。
SEQ ID NO:87显示了TraI Eco的RecD样基序V。
SEQ ID NO:88显示了TraI Eco的MobF基序III。
SEQ ID NO:89显示XPD基序V。
SEQ ID NO:90显示XPD基序VI。
SEQ ID NO:91显示XPD Mbu的氨基酸序列。
SEQ ID NO:92显示XPD Mbu的XPD基序V。
SEQ ID NO:93显示XPD Mbu的XPD基序VI。
SEQ ID NO:94显示了本发明的MuA底物的双链部分的多核苷酸序列。
SEQ ID NO:95显示了本发明的MuA底物的双链部分的多核苷酸序列。该序列与SEQID NO:94互补,除了它在3'末端含有U。
SEQ ID NO:96显示了本发明的双链MuA底物的突出链的多核苷酸序列。
SEQ ID NO:97示出了Dda 1993的氨基酸序列。
SEQ ID NO:98-112显示了用于本发明的其他Dda解旋酶的氨基酸序列。
SEQ ID NO:113示出了编码来自大肠杆菌株K-12亚株MC4100的野生型CsgG单体的密码子优化的多核苷酸序列。此单体缺乏信号序列。
SEQ ID NO:114示出了来自大肠杆菌株K-12亚株MC4100的野生型CsgG单体的成熟形式的氨基酸序列。此单体缺乏信号序列。对于此使用的缩写为CsgG=CsgG-Eco。
SEQ ID NO:115至121显示实施例中使用的多核苷酸序列。
SEQ ID NO:122显示了UvrD-Eco野生型的氨基酸序列。
应理解,序列不是限制性的。
具体实施方式
应理解的是,所公开的产品和方法的不同应用可以根据本领域的特定需要而定制。还应理解的是,在本文使用的术语仅出于描述本发明的具体实施例的目的而并不旨在是限制性的。
另外,除非内容另外明确指明,否则如本说明书和所附权利要求书中所使用的,单数形式“一个/一种(a/an)”和“所述(the)”包含复数指示物。因此,例如,提及“多核苷酸”包括“多核苷酸”复数,提及“底物”包括两种或更多种这样的底物,提及“跨膜蛋白孔”包括两种或更多种这样的孔等。
在本说明书中,特定位置处的不同氨基酸用符号“/”分开,符号“/”意指“或”。例如,P108R/K意指P108R或P108K。在本说明书中,不同的位置或不同的取代被符号“/”分开,“/”符号意指“和”。例如,E94/P108意指E94和P108,或者E94D/R108K意指E94D和P108K。
本文中(无论是上文还是下文)所引用的所有公开、专利和专利申请特此通过引用以其全部内容并入。
修饰方法
本发明提供了修饰模板多核苷酸的方法。可以出于任何目的修饰模板。该方法优选用于修饰模板多核苷酸用于表征,例如用于链测序。模板多核苷酸通常是根据本发明最终将被表征或测序的多核苷酸。在下文中更详细地论述这一点。
所提供的方法是用于修饰双链多核苷酸模板的方法,包括:(a)在双链MuA底物存在下使多核苷酸模板与MuA转座酶接触,所述双链MuA底物在一条链的一端或两端包含突出端,使得MuA转座酶(i)处理模板多核苷酸以产生多个双链片段和(ii)将双链MuA底物连接到多个双链片段的一端或两端,从而产生与MuA转座酶结合的连接产物;(b)使连接产物与转位酶接触,使得转位酶处理连接产物以除去MuA转座酶,从而产生多个修饰的双链多核苷酸。
该方法涉及形成多个修饰的双链多核苷酸。这些修饰的双链多核苷酸通常比模板多核苷酸更容易表征,尤其是使用链测序。多个修饰的双链多核苷酸本身可以进行表征,以便于表征模板多核苷酸。例如,模板多核苷酸的序列可以通过对每个修饰的双链多核苷酸进行测序来确定。
修饰的双链多核苷酸比模板多核苷酸短,因此使用链测序表征它们更直接。修饰的双链多核苷酸可以是任何长度。长度由模板多核苷酸的长度和片段化多核苷酸的MuA转座酶的作用决定。通常,修饰的双链多核苷酸小于约5000kb。
可以通过在MuA底物中包含标记来选择性地标记修饰的双链多核苷酸。标记是选择性的,因为仅标记由MuA转座酶产生的修饰的双链多核苷酸。标签是能够对修饰的双链多核苷酸进行样品鉴定、条形码和/或跟踪的实体。合适的标记包括但不限于校准序列、偶联部分和衔接子结合的酶。偶联部分的实例包括,例如,叠氮化物、DBCO、吡啶基二硫醇和马来酰胺。校准序列包括已知组合物的任何序列。衔接子结合的酶包括例如转位酶、聚合酶、解旋酶和其他多核苷酸结合蛋白。
在一些实施方案中,该方法将双链多核苷酸引入修饰,其使用链测序促进其表征。已经充分确定的是,将多核苷酸偶联到含有纳米孔的膜上降低了允许其表征或测序所需的多核苷酸量的几个数量级。这一点在国际申请PCT/GB2012/051191(公开为WO 2012/164270)中讨论。本发明的方法允许产生多个双链多核苷酸,每个双链多核苷酸包括将多核苷酸偶联到膜上的手段。在下文中更详细地论述这一点。
使用纳米孔的双链多核苷酸的表征通常需要存在设计成优先穿入纳米孔的前导序列。本发明的方法允许产生多个双链多核苷酸,每个双链多核苷酸包括单链前导序列。在下文中更详细地论述这一点。
还充分确定的是,通过桥连部分(例如发夹环)连接双链多核苷酸的两条链,允许多核苷酸的两条链被纳米孔表征或测序。这是有利的,因为它加倍了从单个双链多核苷酸获得的信息的量。此外,因为模板互补链中的序列必然与模板链的序列正交,所以来自两个链的信息可以在信息上组合。因此,这个机制提供了正交校对能力,其提供更高的可信度意见。这一点在国际申请PCT/GB2012/051786号(公开为WO 2013/014451)中讨论。本发明的方法允许生产多个修饰的双链多核苷酸,其中每个多核苷酸的两条链使用发夹环连接。
模板多核苷酸
本发明的方法修饰模板双链多核苷酸,优选用于表征。模板多核苷酸通常是根据本发明最终将被表征或测序的多核苷酸。它也可以称为靶双链多核苷酸或目标双链多核苷酸。
如核酸等多核苷酸是包括两个或更多个核苷酸的大分子。多核苷酸或核酸可以包括任何核苷酸的任何组合。核苷酸可以是天然存在的或人工的。模板多核苷酸中的一或多个核苷酸可以是氧化或甲基化的。模板多核苷酸中的一或多个核苷酸可以是受损的。例如,多核苷酸可以包括嘧啶二聚体。此类二聚体通常与紫外线损伤有关并且是皮肤黑色素瘤的主要病因。模板多核苷酸中的一或多个核苷酸可以例如用标记或标签修饰。合适的标记在下文描述。模板多核苷酸可包含一或多个间隔子。
核苷酸通常含有核碱基、糖和至少一个磷酸基。核碱基和糖形成核苷。
核碱基通常是杂环的。核碱基包括(但不限于)嘌呤和嘧啶,且更详细地说腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)、尿嘧啶(U)和胞嘧啶(C)。
糖通常是戊糖。核苷酸糖包括(但不限于)核糖和脱氧核糖。糖优选地是脱氧核糖。
模板双链多核苷酸优选地包含以下核苷:脱氧腺苷(dA)、脱氧尿苷(dU)和/或胸苷(dT)、脱氧鸟苷(dG)和脱氧胞苷(dC)。
核苷酸通常是核糖核苷酸或脱氧核糖核苷酸。核苷酸优选为脱氧核糖核苷酸。核苷酸通常含有单磷酸、二磷酸或三磷酸。磷酸可连接在核苷酸的5'或3'侧上。
核苷酸包括(但不限于):单磷酸腺苷(AMP)、单磷酸鸟苷(GMP)、单磷酸胸苷(TMP)、单磷酸尿苷(UMP)、单磷酸5-甲基胞啶、单磷酸5-羟基甲基胞苷、单磷酸胞嘧啶核苷(CMP)、环单磷酸腺苷(cAMP)、环单磷酸鸟苷(cGMP)、单磷酸脱氧腺苷(dAMP)、单磷酸脱氧鸟苷(dGMP)、单磷酸脱氧胸苷(dTMP)、单磷酸脱氧尿苷(dUMP)和单磷酸脱氧胞苷(dCMP)。核苷酸优选地是选自AMP、TMP、GMP、CMP、UMP、dAMP、dTMP、dGMP、dCMP和dUMP。核苷酸最优选地是选自dAMP、dTMP、dGMP、dCMP和dUMP。
模板双链多核苷酸优选包含以下核苷酸:dAMP、dUMP和/或dTMP、dGMP和dCMP。
核苷酸可以无碱基的(即缺乏核碱基)。核苷酸还可缺乏核碱基和糖(即是C3间隔子)。
模板多核苷酸中的核苷酸可以任何方式彼此连接。核苷酸通常通过其糖和磷酸基附接,如在核酸中那样。核苷酸可以通过其核碱基连接,如在嘧啶二聚体中那样。
模板多核苷酸是双链的。模板多核苷酸可含有一些单链区域,但模板多核苷酸的至少一部分是双链的。
模板多核苷酸可以是核酸,如脱氧核糖核酸(DNA)或核糖核酸(RNA)。模板多核苷酸可以包含与一条DNA链杂交的一条RNA链。多核苷酸可以是所属领域中已知的任何合成核酸,如肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁核酸(LNA)或具有核苷酸侧链的其它合成聚合物。
模板多核苷酸可以是任何长度的。例如,多核苷酸的长度可以是至少10个、至少50个、至少100个、至少150个、至少200个、至少250个、至少300个、至少400个或至少500个核苷酸对。多核苷酸的长度可以是1000个或更多个核苷酸对、5000个或更多个核苷酸对、或100000个或更多个核苷酸对。
模板多核苷酸通常存在于任何合适样品中。通常在已知含有或疑似含有模板多核苷酸的样品进行上本发明。替代地,可在确认一个或多个模板多核苷酸的同一性的样品上进行本发明,已知或预期所述多核苷酸在样品中存在。
样品可以是生物样品。可使用从任何生物体或微生物获得或提取的样品在活体外进行本发明。生物体或微生物通常是古细菌、原核或真核微生物,且通常属于以下五界中的一个:植物界、动物界、真菌界、原核生物界和原生生物界。可以对从任何病毒中获得或提取的样品体外进行本发明。样品优选地是流体样品。样品通常包括患者的体液。样品可以是尿液、淋巴液、唾液、粘液或羊膜液,但优选地是血液、血浆或血清。通常,样品是人类来源的;但替代地其可以是来自另一哺乳动物,如来自商业养殖动物,如马、牛、绵羊、鱼、鸡或猪;或替代地可以是宠物,如猫或狗。替代地,样品可以是植物来源的,如从经济作物获得的样品,如谷物、豆科植物、果实或植物,例如小麦、大麦、燕麦、芥花、玉米、大豆、稻谷、大黃、香蕉、苹果、蕃茄、马铃薯、葡萄、烟草、菜豆、小扁豆、甘蔗、可可、西兰花或棉花。
样品可以是非生物样品。非生物样品优选地是流体样品。非生物样品的实例包括手术液、水(如饮用水、海水或河水)和实验室测试用试剂。
通常在于本发明中使用之前处理样品,例如通过离心或通过穿过滤出不需要的分子或细胞(如红细胞)的膜。可以在紧接着取得样品之后对其进行测量。通常还可以在分析之前优选地在低于-70℃下储存样品。
MuA和条件
使模板多核苷酸与MuA转座酶接触。这种接触在允许转座酶起作用的条件下发生,例如使模板多核苷酸片段化并将MuA底物连接到片段的一端或两端。MuA转座酶可商购获得,例如来自Thermo Scientific(目录号F-750C,20μL(1.1μg/μL))。MuA转位酶可以是野生型MuA转位酶或修饰的MuA转位酶。MuA转座酶起作用的条件是本领域已知的。合适条件的实例描述于实施例中。
底物群
使模板多核苷酸与双链MuA底物群接触。MuA底物含有已知的MuA识别序列。用MuA孵育模板多核苷酸和MuA底物导致衔接子形成。双链底物是多核苷酸底物,并且可以由上面讨论的任何核苷酸或核酸形成。除了通用核苷酸或至少一个包含模板多核苷酸中不存在的核苷的核苷酸外,MuA底物通常由与模板多核苷酸相同的核苷酸形成。
底物群通常是均质的(即通常含有多个相同的底物)。底物群可以是异质的(即可以包含多个不同的底物)。
用于MuA转座酶的合适底物是本领域已知的(Saariaho和Savilahti,NucleicAcids Research,2006;34(10):3139-3149以及Lee和Harshey,J.Mol.Biol.,2001;314:433-444)。
每个底物通常包含双链部分,其提供其作为MuA转座酶底物的活性。双链部分在每个底物中通常是相同的。底物群可包含不同的双链部分。
每个底物中的双链部分的长度通常为至少50个核苷酸对,例如长度为至少55个、至少60个或至少65个核苷酸对。双链部分可具有至多10kb的长度,例如5kb、1kb或100个碱基对。每个底物中的双链部分优选包含在每条链的3'末端包含脱氧胞苷(dC)和脱氧腺苷(dA)的二核苷酸。dC和dA在双链部分的两条链中通常具有不同的取向,即当从5'至3'读取时,在3'端一条链具有dC/dA而另一条链具有dA/dC。
双链部分的一条链优选包含SEQ ID NO:94所示的序列,双链部分的另一条链优选包含与SEQ ID NO:94所示序列互补的序列。
突出端
每个底物在一条链的一端或两端包含突出端,即在一条链上具有至少一个突出端。在一端或两端具有突出端的双链底物中的一条链也称为一个底物链。
如果仅有一个突出端,则优选位于一个底物链的5'端。在模板多核苷酸片段化并将MuA底物连接到模板多核苷酸的片段(标记)后,形成包含模板多核苷酸片段和一个或多个MuA底物的构建体。在此类实施方案中,可以使用在5'至3'中移动的转位酶从构建体中除去MuA转座酶。
如果有两个突出端,即在一个底物链的每一端有一个,则可以使用在任一方向上移动的转位酶,即5'至3'或3'至5',从结构体中除去MuA转座酶。
每个底物优选包含双链部分,其包含SEQ ID NO:94中所示的序列,其与SEQ IDNO:94中所示序列互补的序列杂交。一个突出端优选位于序列的5'末端,该序列与SEQ IDNO:94中所示的序列互补。与SEQ ID NO:94中所示序列互补的序列可在两端具有突出端。与SEQ ID NO:94中所示序列互补的序列是一个底物链。
突出端的长度可以是至少3个、至少4个、至少5个、至少6个或至少7个核苷酸。突出端可具有至多约200个核苷酸的长度,例如约100、50、25或10个核苷酸。突出端的长度优选地是5个核苷酸。突出端可包含上文讨论的任何核苷酸。
如果在形成构建体后一个底物链的5'末端的突出端未闭合,则转位酶将除去MuA转座酶和一个底物链,即具有突出端的底物链。如果在形成构建体后关闭一个底物链的5'末端的突出端,则转位酶将仅去除MuA转座酶。
例如,突出端的5'末端连接到模板多核苷酸片段的链的相邻3'末端,从而发生突出端的闭合。
通用核苷酸
在一个实施方案中,每个底物在一条链的两端包含突出端,并且在5'末端的突出端由通用核苷酸形成。突出端优选由通用核苷酸组成。这允许在形成构建体后关闭突出端。每个底物优选包含双链部分,其包含SEQ ID NO:94中所示的序列,其与SEQ ID NO:94中所示序列互补的序列杂交。由通用核苷酸形成的突出端位于序列的5'末端,其与SEQ ID NO:94中所示的序列互补。
突出端的长度可以是至少3个、至少4个、至少5个、至少6个或至少7个核苷酸。突出端的长度优选地是5个核苷酸。
通用核苷酸是在某种程度上与模板多核苷酸中的所有核苷酸杂交的核苷酸。通用核苷酸优选地是在某种程度上与包括核苷腺苷(A)、胸腺嘧啶(T)、尿嘧啶(U)、鸟嘌呤(G)和胞嘧啶(C)的核苷酸杂交的核苷酸。通用核苷酸与某些核苷酸的杂交的强度大于与其它核苷酸的杂交的强度。例如,包括核苷、2’-脱氧的通用核苷酸(I)将显示I-C>I-A>I-G近似=I-T的配对的优先顺序。出于本发明的目的,仅需要寡聚体中使用的通用核苷酸与模板多核苷酸中的所有核苷酸杂交。
通用核苷酸优选地包括以下核碱基中的一个:次黄嘌呤、4-硝基吲哚、5-硝基吲哚、6-硝基吲哚、3-硝基吡咯、硝基咪唑、4-硝基吡唑、4-硝基苯并咪唑、5-硝基吲唑、4-氨基苯并咪唑或苯基(C6-芳环)。通用核苷酸更优选地包括以下核苷中的一个:2’-脱氧肌苷、肌苷、7-脱氮-2’-脱氧肌苷、7-脱氮-肌苷、2-氮杂-脱氧肌苷、2-氮杂-肌苷、4-硝基吲哚2’-脱氧核苷、4-硝基吲哚核苷、5-硝基吲哚2’--脱氧核苷、5-硝基吲哚核苷、6-硝基吲哚2’-脱氧核苷、6-硝基吲哚核苷、3-硝基吡咯2’-脱氧核苷、3-硝基吡咯核苷、次黄嘌呤的非环糖类似物、硝基咪唑2’-脱氧核苷、硝基咪唑核苷、4-硝基吡唑2’-脱氧核苷、4-硝基吡唑核苷、4-硝基苯并咪唑2’-脱氧核苷、4-硝基苯并咪唑核苷、5-硝基吲唑2’-脱氧核苷、5-硝基吲唑核苷、4-氨基苯并咪唑2’-脱氧核苷、4-氨基苯并咪唑核苷、苯基C-核苷或苯基C-2’-脱氧核糖基核苷。通用核苷酸最优选包含2'-脱氧肌苷。
每个突出端中的通用核苷酸可以彼此不同。每个突出端中的通用核苷酸优选是相同的。底物群中的所有通用核苷酸优选是相同的通用核苷酸。
本发明的方法优选包括
(a)使模板多核苷酸与MuA转座酶和双链MuA底物群接触,每个底物在一条链的两端包含突出端,其中一条链的5'末端的突出端由通用核苷酸组成,使得转座酶将模板多核苷酸片段化成片段,并将底物连接到双链片段的一端或两端,从而产生多个片段/底物构建体;
(b)允许由通用核苷酸组成的突出端与构建体中的相对片段链杂交;
(c)将由通用核苷酸组成的突出端连接到构建体中的相邻片段链上;和
(d)使用转位酶从构建体中除去MuA转座酶,从而产生多个修饰的双链多核苷酸。在该实施方案中,转位酶与构建体中一个底物链的3'末端的突出端结合,并移动3'至5'以除去MuA转座酶。由于5'突出端是封闭的,因此一个底物链保留在构建体中。
通用核苷酸的突出端可以进一步包含反应性基团,优选在5'末端。如下所述,反应性基团可用于将突出端连接到构建体中的片段。反应性基团可用于使用点击化学将片段连接到突出端。点击化学是Kolb等人2001年首先提出的术语,它描述了一套扩展的强大的选择性和模块化结构单元,可在小规模和大规模应用中可靠地工作(Kolb HC,Finn,MG,Sharpless KB,Click chemistry:diverse chemical function from a few goodreactions,Angew.Chem.Int.Ed.40(2001)2004–2021)。他们已经定义了一系列严格的点击化学标准:“反应必须是模块化的,范围广,产率非常高,只产生可以通过非色谱方法去除的无害副产物,并且是立体特异性的(但不一定是对映选择性的)。所需的工艺特性包括简单的反应条件(理想情况下,该工艺应对氧气和水不敏感),易于获得的原料和试剂,不使用溶剂或良性溶剂(如水)或易于除去,以及简单的产品分离。如果需要,必须通过非色谱方法进行纯化,例如结晶或蒸馏,并且产物必须在生理条件下稳定”。
点击化学的合适实例包括但不限于以下:
(a)1,3-偶极环加成反应的无铜变体,其中叠氮化物在应变下与炔烃反应,例如在环辛烷环中;
(b)一个接头上的氧亲核试剂与另一个上的环氧化物或氮丙啶反应性部分的反应;和
(c)施陶丁格连接,其中炔部分可以被芳基膦取代,导致与叠氮化物的特异性反应,得到酰胺键。
任何反应性基团均可用于本发明。反应性基团可以是适合点击化学的基团。反应性基团可以是国际申请号PCT/GB10/000132(公布为WO2010/086602)中公开的那些中的任一种,特别是该申请的表4中。
在进一步的实施方案中,修饰方法使用MuA转座酶和MuA底物群,每个底物包含至少一个包含反应性基团的突出端。突出端可以是任何长度,并且可以包含任何核苷酸的任何组合。合适的长度和核苷酸如上所述。上面讨论了合适的反应性基团。因此,本发明提供了一种修饰模板双链多核苷酸的方法,包括:
(a)使模板多核苷酸与MuA转座酶和双链MuA底物群接触,每个底物在一条链的两端包含突出端,其中一条链的5'末端的突出端包含反应性基团,使得转座酶将模板多核苷酸片段化,并将底物连接到双链片段的一端或两端,从而产生多个片段/底物构建体;和
(b)使用反应性基团连接突出端至构建体中的片段;
(c)使用转位酶从构建体中除去MuA转座酶,从而产生多个修饰的双链多核苷酸。在该实施方案中,转位酶与构建体中一个底物链的3'末端的突出端结合,并移动3'至5'以除去MuA转座酶。由于5'突出端是封闭的,因此一个底物链保留在构建体中。
不存在于模板多核苷酸中的核苷
在一个实施方案中,每个底物包含(i)在一条链的两端的突出端和(ii)离所述一条链的5'末端的突出端10个核苷酸或更少核苷酸的至少一个核苷酸,其包含在模板多核苷酸中不存在的核苷。例如,模板多核苷酸中不存在的核苷酸通常是非天然核苷酸,其中模板多核苷酸仅包含天然核苷酸。
如上所述,每个底物中的双链部分优选包含在每条链的3'末端包含脱氧胞苷(dC)和脱氧腺苷(dA)的二核苷酸和在每条链的5'末端包含胸苷(dT)和脱氧鸟苷(dG)的二核苷酸。在一些实施方案中,一个底物链的dT和dG二核苷酸中的一个或两个核苷酸可以被包含核苷的核苷酸替换,所述核苷不存在于模板多核苷酸中,如下所述。在一个优选的实施方案中,模板多核苷酸包含脱氧腺苷(dA)、胸苷(dT)、脱氧鸟苷(dG)和脱氧胞苷(dC),但不包括脱氧尿苷(dU),并且一条链的dC和dA二核苷酸中的dA被替换为包含脱氧尿苷(dU)的核苷酸。这在下面举例说明。
双链部分优选包含SEQ ID NO:94中所示的序列和与SEQ ID NO:94中所示序列互补的序列,并且其被修饰为包括至少一个不存在于模板多核苷酸中的核苷酸。与SEQ IDNO:94互补的序列还包含突出端,即是一个底物链。在更优选的实施方案中,双链部分包含SEQ ID NO:94中所示的序列和SEQ ID NO:95中所示的序列(参见下文)。在SEQ ID NO:27中,5'末端的dT和dG二核苷酸中的dT已被dU取代。当模板多核苷酸包含脱氧腺苷(dA)、胸苷(dT)、脱氧鸟苷(dG)和脱氧胞苷(dC)但不包括脱氧尿苷(dU)时,可以使用该双链部分(如下所示)。
5’-GTTTTCGCATTTATCGTGAAACGCTTTCGCGTTTTTCGTGCGCCGCTTCA-3’(SEQ 94)
3’-CAAAAGCGTAAATAGCACTTTGCGAAAGCGCAAAAAGCACGCGGCGAAGU-5’(SEQ 95)
突出端的长度可以是至少3个、至少4个、至少5个、至少6个或至少7个核苷酸。突出端的长度优选为4个核苷酸。突出端可包含上文讨论的任何核苷酸。
每个底物包含一个底物链中的至少一个核苷酸,其在5'末端距离突出端10个核苷酸或更少,并且包含模板多核苷酸中不存在的核苷。每个底物可包含任何数目的核苷酸,其包含模板多核苷酸中不存在的核苷,例如2、3、4、5、6、7、8、9、10或更多。如果底物包含多于一种不存在于模板多核苷酸中的核苷酸,那些核苷酸通常是相同的,但可以是不同的。
如果模板多核苷酸包含脱氧腺苷(dA)、胸苷(dT)、脱氧鸟苷(dG)和脱氧胞苷(dC)但不包含脱氧尿苷(dU),则模板多核苷酸中不存在的核苷优选为脱氧尿苷(dU)。
在优选的实施方案中,双链部分的一条链包含SEQ ID NO:94中所示的序列,双链部分的另一条链包含SEQ ID NO:95中所示的序列(参见上文)。在SEQ ID NO:95中,5'末端的dT和dG二核苷酸中的dT已被dU取代。SEQ ID NO:95的5'末端的突出端连接于U。
在最优选的实施方案中,每个底物包含SEQ ID NO:94中所示的序列和SEQ ID NO:96中所示的序列(参见下文)。当模板多核苷酸包含脱氧腺苷(dA)、胸苷(dT)、脱氧鸟苷(dG)和脱氧胞苷(dC)但不包括脱氧尿苷(dU)时,可以使用该底物(如下所示)。
5’-GTTTTCGCATTTATCGTGAAACGCTTTCGCGTTTTTCGTGCGCCGCTTCA-3’(SEQ 94)
3’-CAAAAGCGTAAATAGCACTTTGCGAAAGCGCAAAAAGCACGCGGCGAAGUCTAG-5’(SEQ 96)
每个底物还包含SEQ ID NO:96中所示序列的3'末端的突出端。
如果模板多核苷酸包含脱氧腺苷(dA)、脱氧尿苷(dU)、脱氧鸟苷(dG)和脱氧胞苷(dC)但不包含胸苷(dT),则模板多核苷酸中不存在的核苷优选为胸苷(dT)。
不存在于模板多核苷酸中的核苷优选地是无碱基核苷、腺苷(A)、尿苷(U)、5-甲基尿苷(m5U)、胞苷(C)或鸟苷(G),或优选地包含脲、5,6二羟基胸苷、胸苷乙二醇、5-羟基-5甲基乙内酰脲、尿嘧啶乙二醇、6-羟基-5,6-二羟基胸苷、甲基酒石酰脲、7,8-二氢-8-氧代鸟嘌呤(8-氧代鸟嘌呤)、8-氧代腺嘌呤、fapy-鸟嘌呤、甲基-fapy-鸟嘌呤、fapy-腺嘌呤、黄霉毒素B1-fapy-鸟嘌呤、5-羟基-胞嘧啶、5-羟基-尿嘧啶、3-甲基腺嘌呤、7-甲基鸟嘌呤、1,N6-亚乙烯基腺嘌呤、次黄嘌呤、5-羟基尿嘧啶、5-羟甲基尿嘧啶、5-甲酰基尿嘧啶或顺-syn-环丁烷嘧啶二聚体。
所述至少一个核苷酸距离5'端的突出端10个核苷酸或更少,例如距离突出端9、8、7、6、5、4、3、2、1或0个核苷酸。换句话说,至少一个核苷酸优选在以下实施例中的A至K位置中的任何位置。所述至少一个核苷酸优选距突出端0个核苷酸(即与突出端相邻)。换句话说,至少一个核苷酸优选在下面的实施例中的K位。
XXXXXXXXXXX
ABCDEFGHIJKXXXX
至少一个核苷酸是突出端中的第一个核苷酸。换句话说,至少一个核苷酸可以在下面的实施例中的位置A。
XXXXXXXXXX
XXXXXXXXXXAXXX
突出端中的所有核苷酸可以包含不存在于模板多核苷酸中的核苷。本领域技术人员能够设计合适的底物。
本发明的方法优选包括
(a)使模板多核苷酸与MuA转座酶和双链MuA底物群接触,每个底物包含(i)一条链的两端处的突出端和(ii)距离所述一条链的5'末端的突出端10个核苷酸或更少核苷酸的至少一个核苷酸,其包含模板多核苷酸中不存在的核苷,使得转座酶将模板多核苷酸片段化成片段并在双链片段的一端或两端连接底物,从而产生多个片段/底物构建体;
(b)通过选择性地去除所述至少一个核苷酸从构建体去除一个底物链的5'端的突出端,并由此生成多个包括单链缺口的双链构建体;
(c)修复构建体中的单链缺口;和
(d)使用转位酶从构建体中除去MuA转座酶,从而产生多个修饰的双链多核苷酸。
连接突出物
在那些其中MuA底物包含通用核苷酸的突出端的实施方案中,该方法包括连接突出端至在构建体中的片段。这可以使用本领域已知的任何连接核苷酸的方法来完成。例如,可以使用连接酶例如DNA连接酶进行。或者,如果突出端包含反应性基团,则可以使用反应性基团将突出端连接到构建体中的片段。例如,包含互补反应性基团的核苷酸可以连接到片段上,并且两个反应性基团可以一起反应以将突出端连接到片段上。如上所述,可以使用点击化学。
选择性去除
本领域已知用于从连接的构建体中选择性除去包含未存在于模板多核苷酸中的核苷的核苷酸的方法。如果从连接的构建体中除去(或切除)核苷酸,则选择性地除去核苷酸,但不除去(或切除)连接的构建体中的其他核苷酸(即包含不同核苷的那些核苷酸)。
可以使用尿嘧啶特异性切除试剂
Figure GDA0003502100900000121
选择性地除去包含脱氧尿苷(dU)的核苷酸,尿嘧啶特异性切除试剂是尿嘧啶DNA糖基化酶(UDG)和DNA糖基化酶-裂解酶核酸内切酶VIII的混合物。
修复缺口
本领域已知用于修复双链构建体中的单链缺口的方法。例如,可以使用聚合酶和连接酶(例如DNA聚合酶和DNA连接酶)修复缺口。或者,可以使用足够长度的随机寡核苷酸修复缺口以产生缺口和连接酶。
转位酶
任何能够去除MuA转座酶的转位酶都可用于本发明。例如,这可能由于双链多核苷酸通过转位酶解开而发生。
转位酶优选是解旋酶。合适的解旋酶在本领域中是众所周知的(M.E.Fairman-Williams等人,Curr.Opin.Struct Biol.,2010,20(3),313-324,T.M.Lohman等人,NatureReviews Molecular Cell Biology,2008,9,391-401)。
解旋酶优选为超家族1或超家族2的成员。解旋酶更优选为以下家族之一的成员:Pif1样、Upf1样、UvrD/Rep、Ski样、Rad3/XPD、NS3/NPH-II、DEAD、DEAH/RHA、RecG样、REcQ样、T1R样、Swi/Snf样和Rig-I样。这些家庭的前三个是超家族1,后十个家庭是超家族2。解旋酶更优选为以下亚家族之一的成员:RecD、Upf1(RNA)、PcrA、Rep、UvrD、Hel308、Mtr4(RNA)、XPD、NS3(RNA)、Mss116(RNA)、Prp43(RNA)、RecG、RecQ、T1R、RapA和Hef(RNA)。这些亚家族中的前五个属于超家族1,而后十一个亚家族属于超家族2。Upf1、Mtr4、NS3、Mss116、Prp43和Hef亚家族的成员是RNA解旋酶。其余亚家族的成员是DNA解旋酶。解旋酶可以是Srs2。解旋酶可以是RecBCD。
解旋酶优选为Hel308解旋酶。根据本发明可以使用任何Hel308解旋酶。Hel308解旋酶也称为ski2样解旋酶,这两个术语可以互换使用。合适的Hel308解旋酶公开于国际申请号PCT/GB2012/052579(公开为WO 2013/057495)的表4中。
Hel308解旋酶通常包含氨基酸基序Q-X1-X2-G-R-A-G-R(下文称为Hel308基序;SEQ ID NO:8)。Hel308基序通常是解旋酶基序VI的一部分(Tuteja和Tuteja,Eur.J.Biochem.271,1849–1863(2004))。X1可以是C、M或L.X1优选为C。X2可以是任何氨基酸残基。X2通常是疏水或中性残基。X2可以是A、F、M、C、V、L、I、S、T、P或R。X2优选为A、F、M、C、V、L、I、S、T或P。X2更优选为A、M或L。X2最优选为A或M。
Hel308解旋酶优选包含基序Q-X1-X2-G-R-A-G-R-P(下文称为扩展的Hel308基序;SEQ ID NO:9),其中X1和X2如上所述。
最优选的Hel308解旋酶、Hel308基序和扩展的Hel308基序显示在下表1中。
表1-优选的Hel308解旋酶及其基序
Figure GDA0003502100900000131
Figure GDA0003502100900000141
Figure GDA0003502100900000151
Figure GDA0003502100900000161
最优选的Hel308基序如SEQ ID NO:17所示。最优选的扩展的Hel308基序如SEQ IDNO:18所示。
Hel308解旋酶优选包含序列SEQ ID NO:10、13、16、19、22、25、28、29、32、33、34、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55或58或其变体。
Hel308解旋酶的变体是具有不同于野生型解旋酶的氨基酸序列并且保留多核苷酸结合活性的酶。特别地,SEQ ID NO:10、13、16、19、22、25、28、29、32、33、34、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55或58的变体是具有不同于SEQ ID NO:10、13、16、19、22、25、28、29、32、33、34、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55或58的氨基酸序列并保留多核苷酸结合活性的氨基酸序列的酶。可以使用本领域已知的方法测定多核苷酸结合活性。合适的方法包括但不限于荧光各向异性、色氨酸荧光和电泳迁移率变动分析(EMSA)。例如,可以如实施例中所述测定变体结合单链多核苷酸的能力。
该变体保留了解旋酶活性。这可以以各种方式测量。例如,可以使用电生理学、荧光测定或ATP水解测量变体沿多核苷酸易位的能力。
变体可以包含便于操纵编码解旋酶的多核苷酸和/或便于其在高盐浓度和/或室温下活性的修饰。变体通常不同于上文讨论的Hel308基序或扩展的Hel308基序之外的区域中的野生型解旋酶。然而,变体可包括这些基序内的修饰。
基于氨基酸同一性,在SEQ ID NO:10、13、16、19、22、25、28、29、32、33、34、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55或58的氨基酸序列的整个长度上,变体将优选地与所述序列至少30%同源。更优选地,基于氨基酸同一性,变体多肽可在整个序列上与SEQ ID NO:10、13、16、19、22、25、28、29、32、33、34、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55或58的氨基酸序列至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,并且更优选地至少95%、97%或99%同源。在150个或更多个,例如200、300、400、500、600、700、800、900或1000个或更多个邻接氨基酸的延伸段上,可存在至少70%,例如至少80%、至少85%、90%或95%氨基酸同一性(“硬同源性”)。如下文所描述的确定同源性。变体可以与下文参考SEQ ID NO:2和SEQ ID NO:4论述的任何方式不同于野生型序列。
SEQ ID NO:10、13、16、19、22、25、28、29、32、33、34、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55或58的变体优选地包含如上表1中所示的野生型序列的Hel308基序或扩展的Hel308基序。然而,变体可包含来自不同野生型序列的Hel308基序或扩展的Hel308基序。例如,SEQ ID NO:10的变体可包含来自SEQ ID NO:13的Hel308基序或扩展的Hel308基序(即SEQ ID NO:14或15)。SEQ ID NO:10、13、16、19、22、25、28、29、32、33、34、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55或58的变体也可包括相关野生型序列的Hel308基序或扩展Hel308基序内的修饰。上面在定义两个基序时讨论了在X1和X2处的合适修饰。SEQ ID NO:10、13、16、19、22、25、28、29、32、33、34、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55或58的变体包含一个或多个取代的半胱氨酸残基和/或一个或多个取代的Faz残基,以促进如上所述的连接。
SEQ ID NO:10的变体可缺少SEQ ID NO:10的前19个氨基酸和/或缺少SEQ ID NO:10的最后33个氨基酸。基于氨基酸同一性,SEQ ID NO:10的变体优选包含与SEQ ID NO:10的氨基酸20至211或20至727至少70%、至少75%、至少80%、至少85%、至少90%或更优选至少95%、至少97%或至少99%同源的序列。
Hel308解旋酶可按国际申请号PCT/GB2015/051925(公开为WO 2014/013260)中的描述进行修饰。特别地,解旋酶上的两个或更多个部分可以连接以减小多核苷酸结构域中的开口的大小,多核苷酸可以通过该开口从解旋酶解除绑定,并且其中解旋酶保留其控制多核苷酸运动的能力。在Hel308解旋酶中,可以在结构域2(ATP酶结构域之一)和结构域4(棘轮结构域)以及结构域2和结构域5(分子刹车)之间发现多核苷酸结构域和开口。根据本发明连接的两个或更多个部分优选是(a)结构域2中的任何氨基酸和结构域4中的任何氨基酸或(b)结构域2中的任何氨基酸和结构域5中的任何氨基酸。在各种Hel308解旋酶中定义结构域2、4和5的氨基酸残基列于下表2中。
表2-在各种Hel308解旋酶中对应于结构域2、4和5的氨基酸残基。
Figure GDA0003502100900000171
Figure GDA0003502100900000181
Hel308解旋酶优选包含Hel308 Mbu序列(即SEQ ID NO:10)或其变体。在Hel308Mbu中,可以在结构域2(ATP酶结构域之一)和结构域4(棘轮结构域)以及结构域2和结构域5(分子刹车)之间发现多核苷酸结构域和开口。连接的Hel308 Mbu的两个或更多个部分优选是(a)结构域2中的任何氨基酸和结构域4中的任何氨基酸或(b)结构域2中的任何氨基酸和结构域5中的任何氨基酸。定义Hel308 Mbu的结构域2、4和5的氨基酸残基列于上表2中。连接的Hel308 Mbu的两个或更多个部分优选为SEQ ID NO:10中的氨基酸284和615。这些氨基酸优选被半胱氨酸(即E284C和S615C)取代,使得它们可以通过半胱氨酸键连接。
本发明可以使用突变体Hel308 Mbu蛋白,其包含SEQ ID NO:10的变体,其中E284和S615被修饰。E284和S615优选被取代。E284和S615更优选被半胱氨酸取代(即E284C和S615C)。只要E284和S615被修饰,变体可以在除E284和S615之外的位置与SEQ ID NO:10不同。基于氨基酸同一性,变体优选与SEQ ID NO:10至少30%同源,如下文更详细讨论的。不必连接E284和S615。或者,可以连接E284和S615。
Hel308解旋酶更优选包含(a)Hel308Tga序列(即SEQ ID NO:33)或其变体,(b)Hel308 Csy序列(即SEQ ID NO:22)或其变体或(c)Hel308 Mhu的序列(即SEQ ID NO:52)或其变体。
SEQ ID NO:10(Hel308 Mbu)含有五个天然半胱氨酸残基。然而,所有这些残基都位于酶的DNA结合树丛内或周围。一旦DNA链结合在酶内,这些天然半胱氨酸残基变得不易进行外部修饰。这允许设计SEQ ID NO:10的特定半胱氨酸突变体并使用如上所述的半胱氨酸键连接至该部分。SEQ ID NO:10的优选变体具有一个或多个以下取代:A29C、Q221C、Q442C、T569C、A577C、A700C和S708C。如上所述,在这些位置中的一个或多个处引入半胱氨酸残基有利于半胱氨酸连接。SEQ ID NO:10的其他优选变体具有一个或多个以下取代:M2Faz、R10Faz、F15Faz、A29Faz、R185Faz、A268Faz、E284Faz、Y387Faz、F400Faz、Y455Faz、E464Faz、E573Faz、A577Faz、E649Faz、A700Faz、Y720Faz、Q442Faz和S708Faz。如上所述,在这些位置中的一个或多个处引入Faz残基有助于Faz连接。
通过在对应于Hel308 Mbu(SEQ ID NO:10)中的D272、N273、D274、G281、E284、E285、E287、S288、T289、G290、E291、D293、T294、N300、R303、K304、N314、S315、N316、H317、R318、K319、L320、E322、R326、N328、S615、K717、Y720、N721和S724的一个或多个位置处引入一个或多个半胱氨酸残基和/或一个或多个非天然氨基酸修饰Hel308解旋酶,其中解旋酶保留其控制多核苷酸运动的能力。优选通过取代引入一个或多个半胱氨酸残基和/或一个或多个非天然氨基酸。
这些修饰不会阻止解旋酶与多核苷酸结合。例如,解旋酶可以通过内部核苷酸或在其一个末端与多核苷酸结合。这些修饰降低了多核苷酸与解旋酶解除绑定或脱离的能力,特别是来自多核苷酸的内部核苷酸。换句话说,一种或多种修饰通过防止与多核苷酸链的解离而增加Hel308解旋酶的持续合成能力。酶的热稳定性也通过一种或多种修饰而增加,从而使其具有改进的结构稳定性,这有利于链测序。本发明的修饰的Hel308解旋酶具有上面讨论的所有优点和用途。
修饰的Hel308解旋酶具有控制多核苷酸运动的能力。这可以如上所述进行测量。修饰的Hel308解旋酶是人工或非天然的。
Hel308解旋酶优选包含上表1中所示的一种解旋酶的变体,其在对应于Hel308Mbu(SEQ ID NO:10)中的D272、N273、D274、G281、E284、E285、E287、S288、T289、G290、E291、D293、T294、N300、R303、K304、N314、S315、N316、H317、R318、K319、L320、E322、R326、N328、S615、K717、Y720、N721和S724的一个或多个位置处包含一个或多个半胱氨酸残基和/或一个或多个非天然氨基酸。Hel308解旋酶优选包含SEQ ID NO:10、13、16、19、22、25、28、29、32、33、34、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55和58的变体,其在对应于Hel308 Mbu(SEQ ID NO:10)中的D272、N273、D274、G281、E284、E285、E287、S288、T289、G290、E291、D293、T294、N300、R303、K304、N314、S315、N316、H317、R318、K319、L320、E322、R326、N328、S615、K717、Y720、N721和S724的一个或多个位置处包含一个或多个半胱氨酸残基和/或一个或多个非天然氨基酸。
Hel308解旋酶优选包含SEQ ID NO:10、13、16、19、22、25、28、29、32、33、34、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55和58的变体,其在对应于Hel308Mbu(SEQ ID NO:10)中的D274、E284、E285、E287、S288、T289、G290、E291、N316、K319、S615、K717或Y720的一个或多个位置处包含一个或多个半胱氨酸残基和/或一个或多个非天然氨基酸。
下表3a和3b显示其他Hel308解旋酶中的位置,其对应于Hel308 Mbu(SEQ ID NO:10)中的D274、E284、E285、S288、S615、K717、Y720、E287、T289、G290、E291、N316和K319。例如,在Hel308 Hvo(SEQ ID NO:16)中,E283对应于Hel308 Mbu中的D274,E293对应于Hel308Mbu中的E284,I294对应于Hel308 Mbu中的E285,V297对应于Hel308 Mbu中的S288,D671对应于Hel308 Mbu中的S615,K775对应于Hel308 Mbu中的K717,而E778对应于Hel308 Mbu中的Y720。另一个Hel308解旋酶缺乏相应的位置标记为“-”。
表3a-对应于Hel308 Mbu(SEQ ID NO:10)中的D274、E284、E285、S288、S615、K717和Y720的位置。
Figure GDA0003502100900000201
Figure GDA0003502100900000211
表3b-对应于Hel308 Mbu(SEQ ID NO:10)中的E287、T289、G290、E291、N316和K319的位置。
Figure GDA0003502100900000212
Figure GDA0003502100900000221
Hel308解旋酶更优选包含SEQ ID NO:10、13、16、19、22、25、28、29、32、33、34、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55和58的变体,其在对应于Hel308 Mbu(SEQ ID NO:10)中的D274、E284、E285、S288、S615、K717和Y720的一个或多个位置处包含一个或多个半胱氨酸残基和/或一个或多个非天然氨基酸。相关位置显示在上表3a中的A至G列中。
解旋酶可在对应于Hel308 Mbu(SEQ ID NO:10)中的D274、E284、E285、S288、S615、K717和Y720的位置的一个、两个、三个、四个、五个、六个或七个位置包含半胱氨酸残基。这些位置的任何组合可以用半胱氨酸取代。例如,对于上表3a的每一行,本发明的解旋酶可以在该行中标记为A至G的位置的以下任何组合中包含半胱氨酸:{A}、{B}、{C}、{D}、{G}、{E}、{F}、{A和B}、{A和C}、{A和D}、{A和G}、{A和E}、{A和F}、{B和C}、{B和D}、{B和G}、{B和E}、{B和F}、{C和D}、{C和G}、{C和E}、{C和F}、{D和G}、{D和E}、{D和F}、{G和E}、{G和F}、{E和F}、{A、B和C}、{A、B和D}、{A、B和G}、{A、B和E}、{A、B和F}、{A、C和D}、{A、C和G}、{A、C和E}、{A、C和F}、{A、D和G}、{A、D和E}、{A、D和F}、{A、G和E}、{A、G和F}、{A、E和F}、{B、C和D}、{B、C和G}、{B、C和E}、{B、C和F}、{B、D和G}、{B、D和E}、{B、D和F}、{B、G和E}、{B、G和F}、{B、E和F}、{C、D和G}、{C、D和E}、{C、D和F}、{C、G和E}、{C、G和F}、{C、E和F}、{D、G和E}、{D、G和F}、{D、E和F}、{G、E和F}、{A、B、C和D}、{A、B、C和G}、{A、B、C和E}、{A、B、C和F}、{A、B、D和G}、{A、B、D和E}、{A、B、D和F}、{A、B、G和E}、{A、B、G和F}、{A、B、E和F}、{A、C、D和G}、{A、C、D和E}、{A、C、D和F}、{A、C、G和E}、{A、C、G和F}、{A、C、E和F}、{A、D、G和E}、{A、D、G和F}、{A、D、E和F}、{A、G、E和F}、{B、C、D和G}、{B、C、D和E}、{B、C、D和F}、{B、C、G和E}、{B、C、G和F}、{B、C、E和F}、{B、D、G和E}、{B、D、G和F}、{B、D、E和F}、{B、G、E和F}、{C、D、G和E}、{C、D、G和F}、{C、D、E和F}、{C、G、E和F}、{D、G、E和F}、{A、B、C、D和G}、{A、B、C、D和E}、{A、B、C、D和F}、{A、B、C、G和E}、{A、B、C、G和F}、{A、B、C、E和F}、{A、B、D、G和E}、{A、B、D、G和F}、{A、B、D、E和F}、{A、B、G、E和F}、{A、C、D、G和E}、{A、C、D、G和F}、{A、C、D、E和F}、{A、C、G、E和F}、{A、D、G、E和F}、{B、C、D、G和E}、{B、C、D、G和F}、{B、C、D、E和F}、{B、C、G、E和F}、{B、D、G、E和F}、{C、D、G、E和F}、{A、B、C、D、G和E}、{A、B、C、D、G和F}、{A、B、C、D、E和F}、{A、B、C、G、E和F}、{A、B、D、G、E和F}、{A、C、D、G、E和F}、{B、C、D、G、E和F}、或{A、B、C、D、G、E和F}。
解旋酶可在对应于Hel308 Mbu(SEQ ID NO:10)中的D274、E284、E285、S288、S615、K717和Y720的位置的一个、两个、三个、四个、五个、六个或七个位置包含非天然氨基酸,例如Faz。这些位置的任何组合可以用非天然氨基酸取代,例如Faz。例如,对于上表3a的每一行,本发明的解旋酶可以在上述标记为A至G的位置的任何组合中包含非天然氨基酸,例如Faz。
解旋酶可在对应于Hel308 Mbu(SEQ ID NO:10)中的D274、E284、E285、S288、S615、K717和Y720的位置的两个或多个位置包含一个或多个半胱氨酸和一个或多个非天然氨基酸(例如Faz)的组合。一个或多个半胱氨酸残基和一个或多个非天然氨基酸(例如Faz)的任何组合可以存在于相关位置。例如,对于上述表3a和3b的每一行,本发明的解旋酶可以在上述标记为A至G的位置的任何组合中包含一个或多个半胱氨酸和一个或多个非天然氨基酸,例如Faz。
Hel308解旋酶更优选包含SEQ ID NO:10、13、16、19、22、25、28、29、32、33、34、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55和58的变体,其在对应于Hel308 Mbu(SEQ ID NO:10)中的D274、E284、E285、S288和S615的一个或多个位置处包含一个或多个半胱氨酸残基和/或一个或多个非天然氨基酸。相关位置显示在上表3a中的A至E列中。
解旋酶可在对应于Hel308 Mbu(SEQ ID NO:10)中的D274、E284、E285、S288、S615、K717和Y720的位置的一个、两个、三个、四个、或五个、六个或七个位置包含半胱氨酸残基。这些位置的任何组合可以用半胱氨酸取代。例如,对于上表3a的每一行,本发明的解旋酶可以在该行标记为A至E的位置的任一以下组合处包含半胱氨酸:{A}、{B}、{C}、{D}、{E}、{A和B}、{A和C}、{A和D}、{A和E}、{B和C}、{B和D}、{B和E}、{C和D}、{C和E}、{D和E}、{A、B和C}、{A、B和D}、{A、B和E}、{A、C和D}、{A、C和E}、{A、D和E}、{B、C和D}、{B、C和E}、{B、D和E}、{C、D和E}、{A、B、C和D}、{A、B、C和E}、{A、B、D和E}、{A、C、D和E}、{B、C、D和E}或{A、B、C、D和E}。
解旋酶可在对应于Hel308 Mbu(SEQ ID NO:10)中的D274、E284、E285、S288、S615、K717和Y720的位置的一个、两个、三个、四个、或五个位置包含非天然氨基酸,例如Faz。这些位置的任何组合可以用非天然氨基酸取代,例如Faz。例如,对于上表3a的每一行,本发明的解旋酶可以在上述标记为A至E的位置的任何组合中包含非天然氨基酸,例如Faz。
解旋酶可在对应于Hel308 Mbu(SEQ ID NO:10)中的D274、E284、E285、S288和S615的位置的两个或多个位置包含一个或多个半胱氨酸和一个或多个非天然氨基酸(例如Faz)的组合。一个或多个半胱氨酸残基和一个或多个非天然氨基酸(例如Faz)的任何组合可以存在于相关位置。例如,对于上述表3a的每一行,本发明的解旋酶可以在上述标记为A至E的位置的任何组合中包含一个或多个半胱氨酸和一个或多个非天然氨基酸,例如Faz。
Hel308解旋酶优选包含Hel308 Mbu(即SEQ ID NO:10)的序列的变体,其在D272、N273、D274、G281、E284、E285、E287、S288、T289、G290、E291、D293、T294、N300、R303、K304、N314、S315、N316、H317、R318、K319、L320、E322、R326、N328、S615、K717、Y720、N721和S724处包含一个或多个半胱氨酸残基和/或一个或多个非天然氨基酸。所述变体优选地包括D272C、N273C、D274C、G281C、E284C、E285C、E287C、S288C、T289C、G290C、E291C、D293C、T294C、N300C、R303C、K304C、N314C、S315C、N316C、H317C、R318C、K319C、L320C、E322C、R326C、N328C、S615C、K717C、Y720C、N721C或S724C。该变体优选包含D272Faz、D272Faz、N273Faz、D274Faz、G281Faz、E284Faz、E285Faz、E287Faz、S288Faz、T289Faz、G290Faz、E291Faz、D293Faz、T294Faz、N300Faz、R303Faz、K304Faz、N314Faz、S315Faz、N316Faz、H317Faz、R318Faz、K319Faz、L320Faz、E322Faz、R326Faz、N328Faz、S615Faz、K717Faz、Y720Faz、N721Faz或S724Faz。
Hel308解旋酶优选包含Hel308 Mbu(即SEQ ID NO:10)的序列的变体,其在D274、E284、E285、S288、S615、K717和Y720处包含一个或多个半胱氨酸残基和/或一个或多个非天然氨基酸。本发明的解旋酶可以在上述标记为A至G的位置的任何组合中包含一个或多个半胱氨酸、一个或多个非天然氨基酸,例如Faz,或其组合。
Hel308解旋酶优选包含Hel308 Mbu(即SEQ ID NO:10)的序列的变体,其在D274、E284、E285、S288、和S615的一个或多个处包含一个或多个半胱氨酸残基和/或一个或多个非天然氨基酸。例如,对于Hel308 Mbu(SEQ ID NO:10),本发明的解旋酶可以在以下任何位置组合中包含半胱氨酸或非天然氨基酸,例如Faz:{D274}、{E284}、{E285}、{S288}、{S615}、{D274和E284}、{D274和E285}、{D274和S288}、{D274和S615}、{E284和E285}、{E284和S288}、{E284和S615}、{E285和S288}、{E285和S615}、{S288和S615}、{D274、E284和E285}、{D274、E284和S288}、{D274、E284和S615}、{D274、E285和S288}、{D274、E285和S615}、{D274、S285和S615}、{E284、E285和S288}、{E284、E285和S615}、{E284、S288和S615}、{E285、S288}和S615}、{D274、E284、E285和S288}、{D274、E284、E285和S615}、{D274、E284、S288和S615}、{D274、E285、S288和S615}、{E284、E285、S288和S615}或{D274、E284、E285、S288和S615}。
解旋酶优选包含SEQ ID NO:10的变体,其包含(a)E284C和S615C,(b)E284Faz和S615Faz,(c)E284C和S615Faz或(d)E284Faz和S615C。
解旋酶更优选包含SEQ ID NO:10中所示的序列,其具有E284C和S615C。
用于本发明的优选的非天然氨基酸包含但不限于:4-叠氮基-L-苯丙氨酸(Faz)、4-乙酰基-L-苯丙氨酸、3-乙酰基-L-苯丙氨酸、4-乙酰乙酰基-L-苯丙氨酸、O-烯丙基-L-酪氨酸、3-(苯基乙烯基)-L-丙氨酸、O-2-丙炔-1-基-L-酪氨酸、4-(二羟基硼基)-L-苯丙氨酸、4-[(乙基硫烷基)羰基]-L-苯丙氨酸、(2S)-2-氨基-3-4-[(丙-2-基硫烷基)羰基]苯基}丙酸、(2S)-2-氨基-3-4-[(2-氨基-3-硫烷基丙酰基)氨基]苯基}丙酸、O-甲基-L-酪氨酸、4-氨基-L-苯丙氨酸、4-氰基-L-苯丙氨酸、3-氰基-L-苯丙氨酸、4-氟-L-苯丙氨酸、4-碘-L-苯丙氨酸、4-溴-L-苯丙氨酸、O-(三氟甲基)酪氨酸、4-硝基-L-苯丙氨酸、3-羟基-L-酪氨酸、3-氨基-L-酪氨酸、3-碘-L-酪氨酸、4-异丙基-L-苯丙氨酸、3-(2-萘基)-L-丙氨酸、4-苯基-L-苯丙氨酸、(2S)-2-氨基-3-(萘-2-基氨基)丙酸、6-(甲基硫烷基)正亮氨酸、6-氧代-L-赖氨酸、D-酪氨酸、(2R)-2-羟基-3-(4-羟基苯基)丙酸、(2R)-2-氨基辛酸酯3-(2,2’-联吡啶-5-基)-D-丙氨酸、2-氨基-3-(8-羟基-3-喹啉基)丙酸、4-苯甲酰基-L-苯丙氨酸、S-(2-硝基苄基)半胱氨酸、(2R)-2-氨基-3-[(2-硝基苄基)硫烷基]丙酸、(2S)-2-氨基-3-[(2-硝基苄基)氧基]丙酸、O-(4,5-二甲氧基-2-硝基苄基)-L-丝氨酸、(2S)-2-氨基-6-([(2-硝基苄基)氧基]羰基}氨基)己酸、O-(2-硝基苄基)-L-酪氨酸、2-硝基苯丙氨酸、4-[(E)-苯基二氮烯基]-L-苯丙氨酸、4-[3-(三氟甲基)-3H-二氮杂环庚烷-3-基]-D-苯丙氨酸、2-氨基-3-[[5-(二甲基氨基)-1-萘基]磺酰基氨基]丙酸、(2S)-2-氨基-4-(7-羟基-2-氧代-2H-苯并吡喃-4-基)丁酸、(2S)-3-[(6-乙酰基萘乙酰胺-2-基)氨基]-2-氨基丙酸、4-(羧甲基)苯丙氨酸、3-硝基-L-酪氨酸、O-磺基-L-酪氨酸、(2R)-6-乙酰氨基-2-氨基己酸、1-甲基组氨酸、2-氨基壬酸、2-氨基癸酸、-L-高半胱氨酸、5-硫烷基正缬氨酸、6-硫烷基-L-正亮氨酸、5-(甲硫基)-L-正缬氨酸、N6-[(2R,3R)-3-甲基-3,4-二氢-2H-吡咯-2-基]羰基}-L-赖氨酸、N6-[(苄氧基)羰基]赖氨酸、(2S)-2-氨基-6-[(环戊基羰基)氨基]己酸、N6-[(环戊基氧基)羰基]-L-赖氨酸、(2S)-2-氨基-6-[(2R)-四氢呋喃-2-基羰基]氨基}己酸、(2S)-2-氨基-8-[(2R,3S)-3-乙炔基四氢呋喃-2-基]-8-氧代辛酸、N6-(叔丁氧羰基)-L-赖氨酸、(2S)-2-羟基-6-([(2-甲基-2-丙基)氧基]羰基}氨基)己酸、N6-[(烯丙氧基)羰基]赖氨酸、(2S)-2-氨基6-([(2-叠氮基苄基)氧基]羰基}氨基)己酸、N6-L-脯氨酰基-L-赖氨酸、(2S)-2-氨基-6-[(丙-2-炔-1-基氧基)羰基]氨基}己酸以及N6-[(2-叠氮基乙氧基)羰基]-L-赖氨酸。
最优选的非天然氨基酸是4-叠氮基-L-苯丙氨酸(Faz)。
如上所述,Hel308解旋酶的变体是具有不同于野生型解旋酶的氨基酸序列并且保留多核苷酸结合活性的酶。SEQ ID NO:10、13、16、19、22、25、28、29、32、33、34、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55和58之一的变体可以包含额外的修饰,只要它在对应于Hel308 Mbu(SEQ ID NO:10)中的D272、N273、D274、G281、E284、E285、E287、S288、T289、G290、E291、D293、T294、N300、R303、K304、N314、S315、N316、H317、R318、K319、L320、E322、R326、N328、S615、K717、Y720、N721和S724的一个或多个位置处包含一个或多个半胱氨酸残基和/或一个或多个非天然氨基酸。以上参考具有连接的两个或更多个部分的实施方案讨论了合适的修饰和变体。
变体可以包含在Woodman等人(J.Mol.Biol.(2007)374,1139–1144)中公开的结构域5中的突变。这些突变对应于SEQ ID NO:10中的R685A、R687A和R689A。
两个或更多个部分可以以任何方式连接。连接可以是瞬时的,例如非共价的。甚至瞬时连接也会减小开口的大小并减少多核苷酸从解旋酶通过开口的解绑。
两个或更多个部分优选通过亲和分子连接。合适的亲和分子是本领域已知的。亲和分子优选是(a)互补多核苷酸(国际申请PCT/GB10/000132(公布为WO2010/086602),(b)抗体或其片段和互补表位(Biochemistry第六版,W.H.Freeman及合作者(2007)pp953-954),(c)肽拉链(O'Shea等人,Science 254(5031):539-544),(d)能够通过β-折叠增强相互作用(Remaut和Waksman Trends Biochem.Sci.(2006)31 436-444),(e)能够氢键合、π堆叠或形成盐桥,(f)轮烷(Xiang Ma and He Tian Chem.Soc.Rev.,2010,39,70-80),(g)适配子和互补蛋白(James,W.在Encyclopedia of Analytical Chemistry,R.A.Meyers(Ed.)第4848–4871页,John Wiley&Sons Ltd,Chichester,2000)或(h)半螯合剂(Hammerstein等人,J Biol Chem.2011April 22;286(16):14324–14334)。对于(e),在与电负性原子键合的质子和另一个电负性原子之间发生氢键合。π堆叠需要两个芳环,它们可以堆叠在一起,其中环的平面是平行的。盐桥位于可以使其电子在几个原子上离域的基团之间,例如在天冬氨酸和精氨酸之间。
两个或更多个部分可以通过hexa-his标签或Ni-NTA瞬时连接。还可以修饰两个或更多个部分,使得它们瞬时地彼此连接。
优选地,两个或更多个部件永久地连接。在本发明的上下文中,如果在使用解旋酶时没有破坏,或者在没有用户干预部分的情况下不能破坏,例如使用还原打开–S-S-键,则连接是永久性的。
两个或更多个部分优选共价连接。可以使用本领域已知的任何方法共价连接两个或更多个部分。
两个或更多个部分可以通过其天然存在的氨基酸共价连接,例如半胱氨酸、苏氨酸、丝氨酸、天冬氨酸、天冬酰胺、谷氨酸和谷氨酰胺。可以修饰天然存在的氨基酸以促进连接。例如,天然存在的氨基酸可以通过酰化、磷酸化、糖基化或法尼基化来修饰。其他合适的修饰是本领域中已知的。对天然存在的氨基酸的修饰可以是翻译后修饰。两个或更多个部分可以通过已经引入其序列的氨基酸连接。这些氨基酸优选通过取代引入。引入的氨基酸可以是促进连接的半胱氨酸或非天然氨基酸。适当的非天然氨基酸包含但不限于4-叠氮基-L-苯丙氨酸(Faz)和Liu C.C.和Schultz P.G.,Annu.Rev.Biochem.,2010,79,413-444的图1中包括的编号为1-71的氨基酸的任一种或下列任何一种氨基酸。引入的氨基酸可以如上所述进行修饰。
在优选的实施方案中,使用接头连接两个或更多个部分。下文更详细地论述了接头分子。一种合适的连接方法是半胱氨酸连接。在下文中更详细地论述这一点。两个或更多个部分优选使用一个或多个例如两个或三个接头连接。如上所述,一个或多个接头可以设计成减小开口的尺寸或闭合开口。如果如上所述使用一个或多个接头来封闭开口,则一个或多个接头的至少一部分优选被定向,使得当它被解旋酶结合时它不与多核苷酸平行。更优选地,所有接头都以这种方式取向。如果如上所述使用一个或多个接头封闭开口,则一个或多个接头的至少一部分优选以与解旋酶结合时不平行于多核苷酸的取向穿过开口。更优选地,所有接头以这种方式穿过开口。在这些实施方案中,一个或多个接头的至少一部分可以垂直于多核苷酸。这种取向有效地封闭开口,使得多核苷酸不能通过开口与解旋酶解除绑定。
每个接头可以具有两个或更多个功能末端,例如两个、三个或四个功能末端。接头中末端的合适构型是本领域熟知的。
一个或多个接头的一个或多个末端优选与解旋酶共价连接。如果一端共价连接,则一个或多个接头可以瞬时连接两个或更多个部分,如上所述。如果两个或所有末端共价连接,则一个或多个接头永久地连接两个或更多个部分。
优选修饰两个或更多个部分中的至少一个以促进一个或多个接头的连接。可以进行任何修饰。所述接头可连接到在两个或更多个部分中的一个或多个反应性半胱氨酸残基、赖氨酸残基或非天然的氨基酸。非天然氨基酸可以是上面讨论的任何一种。非天然氨基酸优选为4-叠氮基-L-苯丙氨酸(Faz)。两个或多个部分中的至少一个氨基酸优选被半胱氨酸或非天然氨基酸(例如Faz)取代。
一个或多个接头优选是氨基酸序列和/或化学交联剂。
合适的氨基酸接头,例如肽接头,是本领域已知的。氨基酸或肽接头的长度、柔韧性和亲水性通常被设计成使得它减少了开口的大小,但不扰乱解旋酶的功能。优选的柔性肽接头是2个到20个,如4个、6个、8个、10个或16个丝氨酸和/或甘氨酸的延伸段。更优选的柔性接头包含(SG)1、(SG)2、(SG)3、(SG)4、(SG)5、(SG)8、(SG)10、(SG)15或SG)20,其中S是丝氨酸且G是甘氨酸。优选的刚性接头是2个到30个,如4个、6个、8个、16个或24个脯氨酸的延伸段。更优选的刚性接头包含(P)12,其中P是脯氨酸。接头的氨基酸序列优选包含多核苷酸结合部分。下面讨论这些部分和与其使用相关的优点。
适当的化学交联剂在本领域中是众所周知的。合适的化学交联剂包括但不限于包括以下官能团的那些:马来酰亚胺、活性酯、琥珀酰亚胺、叠氮化物、炔烃(如二苯并环辛炔醇(DIBO或DBCO)、二氟环炔烃和直链炔烃)、膦(如用于无痕和非无痕Staudinger连接的那些)、卤代乙酰基(如碘乙酰胺)、光气型试剂、磺酰氯试剂、异硫氰酸酯、酰卤、肼、二硫化物、乙烯基砜、氮丙啶和光反应试剂(如芳基叠氮化物、二氮杂环丙烷)。
氨基酸和官能团之间的反应可以是自发的,例如半胱氨酸/马来酰亚胺,或者可能需要外部试剂,例如Cu(I),用于连接叠氮化物和直链炔烃。
接头可包含延伸所需距离的任何分子。接头的长度可以从一个碳(光气型接头)到许多埃。直链分子的实例包括但不限于聚乙二醇(PEG)、多肽、多糖、脱氧核糖核酸(DNA)、肽核酸(PNA)、苏糖核酸(TNA)、甘油核酸(GNA)、饱和和不饱和烃、聚酰胺。这些接头可以是惰性的或反应性的,特别是它们可以在限定的位置化学裂解,或者可以用荧光团或配体自身修饰。优选地,接头对二硫苏糖醇(DTT)具有抗性。
优选的交联剂包括2,5-二氧代吡咯烷-1-基3-(吡啶-2-基二硫烷基)丙酸酯、2,5-二氧代吡咯烷-1-基4-(吡啶-2-基二硫烷基)丁酸酯和2,5-二氧代吡咯烷-1-8-(吡啶-2-基二硫烷基)辛酸酯,二马来酰亚胺PEG 1k、二马来酰亚胺PEG 3.4k、二马来酰亚胺PEG 5k、二马来酰亚胺PEG 10k、双(马来酰亚胺基)乙烷(BMOE)、双马来酰亚胺己烷(BMH)、1,4-双-马来酰亚胺丁烷(BMB)、1,4-双马来酰亚胺基-2,3-二羟基丁烷(BMDB),BM[PEO]2(1,8-双-马来酰亚胺二甘醇)、BM[PEO]3(1,11-双-马来酰亚胺基三甘醇)、三[2-马来酰亚胺基乙基]胺(TMEA)、DTME二硫代马来酰亚胺基乙烷、双马来酰亚胺PEG3、双马来酰亚胺PEG11、DBCO-马来酰亚胺、DBCO-PEG4-马来酰亚胺、DBCO-PEG4-NH2、DBCO-PEG4-NHS、DBCO-NHS、DBCO-PEG-DBCO 2.8kDa、DBCO-PEG-DBCO 4.0kDa、DBCO-15原子-DBCO、DBCO-26原子-DBCO、DBCO-35原子-DBCO、DBCO-PEG4-S-S-PEG3-生物素、DBCO-S-S-PEG3-生物素、DBCO-S-S-PEG11-生物素(琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯(SPDP)和马来酰亚胺-PEG(2kDa)-马来酰亚胺(α,Ω-双-马来酰亚胺基聚(乙二醇))。最优选的交联剂是实施例中使用的马来酰亚胺-丙基-SRDFWRS-(1,2-二氨基乙烷)-丙基-马来酰亚胺。
一个或多个接头可以是可切割的。在下文中更详细地论述这一点。
可以使用彼此特异性的两个不同的接头来连接两个或更多个部分。其中一个接头连接到一个部分而另一个连接到另一个部分。接头应反应以形成本发明的修饰的解旋酶。可以使用国际申请PCT/GB10/000132(公开为WO 2010/086602)中描述的杂交接头连接两个或更多个部分。具体地,可以使用两个或更多个接头连接两个或更多个部分,每个接头包含可杂交区域和能够形成共价键的基团。接头中的可杂交区域杂交并连接两个或更多个部分。然后通过在基团之间形成共价键来偶联连接的部分。国际申请PCT/GB10/000132(公布为WO2010/086602)中公开的任何特定接头可以根据本发明使用。
可以对两个或更多个部分进行修饰,然后使用对两种修饰特异性的化学交联剂进行连接。可以使用上文论述的任何交联剂。
接头可以被标记。适当的标记包含但不限于荧光
分子(例如Cy3或
Figure GDA0003502100900000281
);放射性同位素,例如,125I、35S、酶、抗体、抗原、多核苷酸和如生物素等配体。此类标记允许量化接头的量。标记也可以是可切割的纯化标签,例如生物素,或在鉴定方法中显示的特定序列,例如蛋白质中本身不存在但通过胰蛋白酶消化释放的肽。
连接两个或多个部分的优选方法是通过半胱氨酸键连接。这可以通过双功能化学交联剂或通过具有末端呈递的半胱氨酸残基的氨基酸接头介导。连接可以通过解旋酶中的天然半胱氨酸发生。或者,可以将半胱氨酸引入解旋酶的两个或更多个部分。如果两个或更多个部分通过半胱氨酸键连接,则优选通过取代将一个或多个半胱氨酸引入两个或更多个部分。
可以设计任何双功能接头的长度、反应性、特异性、刚性和溶解度以确保开口的尺寸充分减小并保持解旋酶的功能。合适的接头包括双马来酰亚胺交联剂,例如1,4-双(马来酰亚胺基)丁烷(BMB)或双(马来酰亚胺基)己烷。如果优选在特定位点连接,则双功能接头的一个缺点是解旋酶不需要包含其他表面可接近的半胱氨酸残基,因为双功能接头与表面可接近的半胱氨酸残基的结合可能难以控制并且可能影响底物结合或活性。如果解旋酶确实含有几个可接近的半胱氨酸残基,则可能需要修饰解旋酶以除去它们,同时确保修饰不影响解旋酶的折叠或活性。这一点在国际申请PCT/GB10/000133(公开为WO 2010/086603)中讨论。可以通过修饰相邻残基例如肽接头来增强半胱氨酸残基的反应性。例如,侧接精氨酸、组氨酸或赖氨酸残基的碱性基团将半胱氨酸巯基的pKa改变更具反应性的S-基的pKa。可以通过如5,5'-二硫代双-(2-硝基苯甲酸)(dTNB)等巯基保护基来保护半胱氨酸残基的反应性。在附接接头之前,这些可以与解旋酶的一个或多个半胱氨酸残基反应。使用固定在珠子上的还原剂(例如固定的三(2-羧乙基)膦,TCEP),可以选择性地去保护表面可接近的半胱氨酸。下面更详细地讨论两个或更多个部分的半胱氨酸键。
连接两个或多个部分的另一种优选方法是通过4-叠氮基-L-苯丙氨酸(Faz)连接。这可以通过双功能化学接头或通过具有末端存在的Faz残基的多肽接头介导。优选通过取代将一个或多个Faz残基引入解旋酶。下面更详细地讨论两个或更多个解旋酶的Faz连接。
解旋酶优选是RecD解旋酶。根据本发明可以使用任何RecD解旋酶。RecD解旋酶的结构是本领域已知的(FEBS J.2008年4月;275(8):1835-51,Epub 2008年3月9日。RecD的ATP酶活性对于南极假单胞菌丁香假单胞菌Lz4W在低温下的生长至关重要。Satapathy AK,Pavankumar TL,Bhattacharjya S,Sankaranarayanan R,Ray MK;EMS MicrobiolRev.2009年5月;33(3):657-87。结合松弛酶的多样性及其在质粒分类中的应用(Thediversity of conjugative relaxases and its application in plasmidclassification)。Garcillán-Barcia MP,Francia MV,de la Cruz F;J Biol Chem.2011年4月8日;286(14):12670-82。Epub 2011年2月2日.多结构域F质粒TraI松弛酶-解旋酶的功能表征(Functional characterization of the multidomain F plasmid TraIrelaxase-helicase)。Cheng Y,McNamara DE,Miley MJ,Nash RP,Redinbo MR)。
RecD解旋酶通常包含氨基酸基序X1-X2-X3-G-X4-X5-X6-X7(下文称为RecD样基序I;SEQ ID NO:59),其中X1是G、S或A,X2是任何氨基酸,X3是P、A、S或G,X4是T、A、V、S或C,X5是G或A,X6是K或R,X7是T或S。X1优选为G。X2优选为G、I、Y或A。X2更优选为G。X3优选为P或A。X4优选为T、A、V或C。X4优选为T、V或C。X5优选为G。X6优选为K。X7优选为T或S。RecD解旋酶优选包含Q-(X8)16-18-X1-X2-X3-G-X4-X5-X6-X7(下文称为扩展的RecD样基序I;SEQ ID NO:60、61和62),其中X1至X7如上所定义,X8是任何氨基酸。优选16个X8残基(即(X8)16)在扩展的RecD样基序I(SEQ ID NO:60)中。(X8)16的合适序列可以在美国专利61/581,332的SEQ IDNO:14、17、20、23、26、29、32、35、38、41、44、47和50中以及国际申请PCT/GB2012/053274(公开为WO 2012/098562)的SEQ ID NOs:18、21、24、25、28、30、32、35、37、39、41、42和44中鉴定。
RecD解旋酶优选包含氨基酸基序G-G-P-G-Xa-G-K-Xb(下文称为RecD基序I;SEQID NO:63),其中Xa是T、V或C,Xb是T或S。Xa优选为T。Xb优选为T。Rec-D解旋酶优选包含序列G-G-P-G-T-G-K-T(SEQ ID NO:64)。RecD解旋酶更优选包含氨基酸基序Q-(X8)16-18-G-G-P-G-Xa-G-K-Xb(下文称为扩展的RecD基序I;SEQ ID NO:65、66和67),其中Xa和Xb如上定义,X8是任何氨基酸。优选16个X8残基(即(X8)16)在扩展的RecD基序I(SEQ ID NO:65)中。(X8)16的合适序列可以在美国专利61/581,332的SEQ ID NO:14、17、20、23、26、29、32、35、38、41、44、47和50中以及国际申请PCT/GB2012/053274(公开为WO 2012/098562)的SEQ IDNOs:18、21、24、25、28、30、32、35、37、39、41、42和44中鉴定。
RecD解旋酶通常包含氨基酸基序X1-X2-X3-X4-X5-(X6)3-Q-X7(下文称为RecD样基序V;SEQ ID NO:68),其中X1为Y、W或F,X2是A、T、S、M、C或V,X3是任何氨基酸,X4是T、N或S,X5是A、T、G、S、V或I,X6是任何氨基酸,X7是G或S。X1优选为Y。X2优选为A、M、C或V。X2更优选为A。X3优选为I、M或L。X3更优选为I或L。X4优选为T或S。X4更优选为T。X5优选为A、V或I。X5更优选为V或I。X5最优选为V。(X6)3优选为H-K-S、H-M-A、H-G-A或H-R-S。(X6)3更优选为H-K-S。X7优选为G。RecD解旋酶优选包含氨基酸基序Xa-Xb-Xc-Xd-Xe-H-K-S-Q-G(下文称为RecD基序V;SEQ ID NO:69),其中Xa是Y、W或F,Xb是A、M、C或V,Xc是I、M或L,Xd是T或S,Xe是V或I。Xa优选为Y。Xb优选为A。Xd优选为T。Xd优选为V。优选的RecD基序I显示在美国专利申请61/581,332的表5中。优选的RecD样基序I显示在美国专利申请61/581,332和国际申请PCT/GB2012/053274(公开为WO 2012/098562)的表7中。优选的RecD样基序V显示在美国专利申请61/581,332和国际申请PCT/GB2012/053274(公开为WO 2012/098562)的表5和7中。
RecD解旋酶优选是显示在美国专利申请61/581,332和国际申请PCT/GB2012/053274(公开为WO 2012/098562)的表4或5中解旋酶之一或其变体。变体描述于美国专利申请61/581,332和国际申请PCT/GB2012/053274(公开为WO 2012/098562)中。
RecD解旋酶优选是TraI解旋酶或TraI亚组解旋酶。TraI解旋酶和TraI亚组解旋酶可含有两个RecD解旋酶结构域、一个松弛酶结构域和一个C-末端结构域。TraI亚组解旋酶优选是TrwC解旋酶。TraI解旋酶或TraI亚组解旋酶优选是显示在美国专利申请61/581,332和国际申请PCT/GB2012/053274(公开为WO 2012/098562)的表6中解旋酶之一或其变体。变体描述于美国专利申请61/581,332和国际申请PCT/GB2012/053274(公开为WO 2012/098562)中。
TraI解旋酶或TraI亚组解旋酶通常包含如上定义的RecD样基序I(SEQ ID NO:59)和/或如上定义的RecD样基序V(SEQ ID NO:68)。TraI解旋酶或TraI亚组解旋酶优选包含RecD样基序I(SEQ ID NO:59)和RecD样基序V(SEQ ID NO:68)。TraI解旋酶或TraI亚组解旋酶通常还包含以下两个基序之一:
-氨基酸基序H-(X1)2-X2-R-(X3)5-12-H-X4-H(下文称为MobF基序III;SEQ ID NO:70至77),其中X1和X2是任何氨基酸以及X2和X4独立地选自除D、E、K和R之外的任何氨基酸。(X1)2当然是X1a-X1b。X1a和X1b可以是相同或不同的氨基酸。X1a优选为D或E。X1b优选为T或D。(X1)2优选为DT或ED。(X1)2最优选为DT。(X3)5-12中的5至12个氨基酸可以相同或不同。X2和X4独立地选自G、P、A、V、L、I、M、C、F、Y、W、H、Q、N、S和T。X2和X4优选不带电荷。X2和X4优选不是H。X2更优选为N、S或A。X2最优选为N。X4最优选为F或T。(X3)5-12的长度优选为6或10个残基。(X3)5-12的合适实施方案可以衍生自美国专利申请61/581,332的表7中所示的SEQID NO:58、62、66和70,和国际申请PCT/GB2012/053274(公开为WO 2012/098562)的SEQ IDNOs:61、65、69、73、74、82、86、90、94、98、102、110、112、113,114、117、121、124、125、129、133、136、140、144、147、151、152、156、160、164和168。
-氨基酸基序G-X1-X2-X3-X4-X5-X6-X7-H-(X8)6-12-H-X9(下文称为MobQ基序III;SEQ ID NO:78至84),其中X1、X2、X3、X5、X6、X7和X9独立地选自除D、E、K和R外的任何氨基酸,X4是D或E,X8是任何氨基酸。X1、X2、X3、X5、X6、X7和X9独立地选自G、P、A、V、L、I、M、C、F、Y、W、H、Q、N、S和T。X1、X2、X3、X5、X6、X7和X9优选地不带电荷。X1、X2、X3、X5、X6、X7和X9优选地不是H。(X8)6-12中的6至12个氨基酸可以相同或不同。优选的MobF样基序III显示在美国专利申请61/581,332和国际申请PCT/GB2012/053274(公开为WO 2012/098562)的表7中。
TraI解旋酶或TraI亚组解旋酶更优选是显示在美国专利申请61/581,332和国际申请PCT/GB2012/053274(公开为WO 2012/098562)的表6或7中解旋酶之一或其变体。TraI解旋酶最优选地包括SEQ ID NO:85中所示序列或其变体。SEQ ID NO:85是TraI Eco(NCBI参考序列:NP_061483.1;Genbank AAQ98619.1;SEQ ID NO:85)。TraI Eco包含以下基序:RecD样基序I(GYAGVGKT;SEQ ID NO:86)、RecD样基序V(YAITAHGAQG;SEQ ID NO:87)和MobF基序III(HDTSRDQEPQLHTH;SEQ ID NO:88)。
TraI解旋酶或TraI亚组解旋酶更优选包含下表4中所示的一个解旋酶的序列,即SEQ ID NO:85、126、134和138之一,或其变体。
表4-更优选的TraI解旋酶和TraI亚组解旋酶
Figure GDA0003502100900000301
Figure GDA0003502100900000311
如上文针对Hel308解旋酶所讨论的,可连接RecD解旋酶、TraI解旋酶或TraI亚组解旋酶上的两个或更多个部分以减小多核苷酸结构域中的开口的大小,多核苷酸可以通过该开口从解旋酶解除绑定,并且其中解旋酶保留其控制多核苷酸运动的能力。以上针对Hel308解旋酶讨论的任何实施方案同样适用于RecD解旋酶、TraI解旋酶或TraI亚组解旋酶。连接的TrwC Cba的两个或更多个部分优选是(a)SEQ ID NO:126中的氨基酸691和346;(b)SEQ ID NO:126中的氨基酸657和339;(c)SEQ ID NO:126中的氨基酸691和350;或(d)SEQ ID NO:126中的氨基酸690和350。这些氨基酸优选被半胱氨酸取代,使得它们可以通过半胱氨酸键连接。
本发明可以使用突变体TrwC Cba蛋白,其包含SEQ ID NO:126的变体,其中氨基酸691和346;657和339;691和350;或690和350被修饰。氨基酸优选被取代。氨基酸更优选被半胱氨酸取代。变体可以与SEQ ID NO:126在691和346;657和339;691和350;或者690和350以外的位置不同,只要相关的氨基酸被修饰。基于氨基酸同一性,变体优选与SEQ ID NO:126至少10%同源,如下文更详细讨论的。氨基酸691和346;657和339;691和350;或690和350未连接。这些突变TrwC Cba蛋白可用于形成修饰的解旋酶,其中连接有修饰的氨基酸。
RecD解旋酶、TraI解旋酶或TraI亚组解旋酶的变体是具有不同于野生型解旋酶的氨基酸序列并且保留多核苷酸结合活性的酶。这可以如上所述进行测量。特别地,SEQ IDNO:85、126、134或138的变体是具有不同于SEQ ID NO:85、126、134或138的氨基酸序列并且保留多核苷酸结合活性的酶。该变体保留了解旋酶活性。该变体必须在下面讨论的两种模式中的至少一种中起作用。优选地,变体以两种模式工作。变体可以包含便于操纵编码解旋酶的多核苷酸和/或便于其在高盐浓度和/或室温下活性的修饰。变体通常不同于上文讨论的基序之外的区域中的野生型解旋酶。然而,变体可包括这些基序内的修饰。
在SEQ ID NO:85、126、134和138的氨基酸序列的整个长度内,基于氨基酸同一性,变体将优选地与所述序列至少10%同源。更优选地,基于氨基酸同一性,变体多肽可以在整个序列内与SEQ ID NO:85、126、134和138的任一种的氨基酸序列至少20%、至少25%、至少30%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,并且更优选地至少95%、97%或99%同源。在150个或更多个,例如200、300、400、500、600、700、800、900或1000个或更多个邻接氨基酸的延伸段上,可存在至少70%,例如至少80%、至少85%、90%或95%氨基酸同一性(“硬同源性”)。如下文所描述的确定同源性。变体可以与上文参考SEQ ID NO:2和SEQ ID NO:4论述的任何方式不同于野生型序列。
SEQ ID NO:85、126、134和138中任一个的变体优选包含野生型序列的RecD样基序I和/或RecD样基序V。然而,SEQ ID NO:85、126、134和138的变体可包含来自不同野生型序列的RecD样基序I和/或扩展的RecD样基序V。例如,变体可包括显示在美国专利申请61/581,332和国际申请PCT/GB2012/053274(公开为WO 2012/098562)的表5和7中的任何一种优选基序。SEQ ID NOs:85、126、134和138的变体还可以包括野生型序列的RecD样基序I和V内的修饰。SEQ ID NO:85、126、134或138的变体优选包含一个或多个取代的半胱氨酸残基和/或一个或多个取代的Faz残基以促进如上所述的连接。
解旋酶优选是XPD解旋酶。根据本发明可以使用任何XPD解旋酶。XPD解旋酶也称为Rad3解旋酶,这两个术语可互换使用。
XPD解旋酶的结构是本领域已知的(Cell.2008年5月30;133(5):801-12.Structure of the DNA repair helicase XPD.Liu H,Rudolf J,Johnson KA,McMahonSA,Oke M,Carter L,McRobbie AM,Brown SE,Naismith JH,White MF)。XPD解旋酶通常包含氨基酸基序X1-X2-X3-G-X4-X5-X6-E-G(下文称为XPD基序V;SEQ ID NO:89)。X1、X2、X5和X6独立地选自除D、E、K和R之外的任何氨基酸。X1、X2、X5和X6独立地选自G、P、A、V、L、I、M、C、F、Y、W、H、Q、N、S和T。X1、X2、X5和X6优选不带电荷。X1、X2、X5和X6优选不是H。X1更优选为V、L、I、S或Y。X5更优选为V、L、I、N或F。X6更优选为S或A。X3和X4可以是任何氨基酸残基。X4优选为K、R或T。
XPD解旋酶通常包含氨基酸基序Q-Xa-Xb-G-R-Xc-Xd-R-(Xe)3-Xf-(Xg)7-D-Xh-R(下文称为XPD基序VI;SEQ ID NO:90)。Xa、Xe和Xg可以是任何氨基酸残基。Xb、Xc和Xd独立地选自除D、E、K和R之外的任何氨基酸。Xb、Xc和Xd通常独立地选自G、P、A、V、L、I、M、C、F、Y、W、H、Q、N、S和T。Xb、Xc和Xd优选不带电荷。Xb、Xc和Xd优选不是H。Xb更优选为V、A、L、I或M。Xc更优选为V、A、L、I、M或C。Xd更优选为I、H、L、F、M或V。Xf可以是D或E。(Xg)7是Xg1、Xg2、Xg3、Xg4、Xg5、Xg6和Xg7。Xg2优选为G、A、S或C。Xg5优选为F、V、L、I、M、A、W或Y。Xg6优选为L、F、Y、M、I或V。Xg7优选为A、C、V、L、I、M或S。
XPD解旋酶优选包含XPD基序V和VI。最优选的XPD基序V和VI显示在美国专利申请61/581,340和国际申请PCT/GB2012/053273(公开为WO 2012/098561)的表5中。
XPD解旋酶优选还包含两个Walker A和B基序(基序I和II)之间的硫化铁(FeS)核。FeS核通常包含在半胱氨酸残基的硫化物基团之间配位的铁原子。FeS核通常是四面体。
XPD解旋酶优选是国际申请PCT/GB2012/053273(公布为WO2012/098561)的表4或5中所示的解旋酶之一或其变体。XPD解旋酶最优选地包括SEQ ID NO:91中所示序列或其变体。SEQ ID NO:91是XPD Mbu(Methanococcoides burtonii;YP_566221.1;GI:91773529)。XPD Mbu包含YLWGTLSEG(Motif V;SEQ ID NO:92)和QAMGRVVRSPTDYGARILLDGR(Motif VI;SEQ ID NO:93)。
XPD解旋酶的变体是具有不同于野生型解旋酶的氨基酸序列并且保留多核苷酸结合活性的酶。这可以如上所述进行测量。特别地,SEQ ID NO:91的变体是具有不同于SEQ IDNO:91的氨基酸序列并且保留多核苷酸结合活性的酶。该变体保留了解旋酶活性。该变体必须在下面讨论的两种模式中的至少一种中起作用。优选地,变体以两种模式工作。变体可以包含便于操纵编码解旋酶的多核苷酸和/或便于其在高盐浓度和/或室温下活性的修饰。变体通常不同于上面讨论的XPD基序V和VI之外的区域中的野生型解旋酶。然而,变体可以包括这些基序中的一个或两个内的修饰。
在SEQ ID NO:91例如SEQ ID NO:10的氨基酸序列的整个长度内,基于氨基酸同一性,变体将优选地与所述序列至少10%、优选30%同源。更优选地,基于氨基酸同一性,变体多肽可以在整个序列内与SEQ ID NO:91的氨基酸序列至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,并且更优选地至少95%、97%或99%同源。在150个或更多个,例如200、300、400、500、600、700、800、900或1000个或更多个邻接氨基酸的延伸段上,可存在至少70%,例如至少80%、至少85%、90%或95%氨基酸同一性(“硬同源性”)。如下文所描述的确定同源性。变体可以与上文参考SEQ ID NO:2和SEQ ID NO:4论述的任何方式不同于野生型序列。
SEQ ID NO:91的变体优选包含野生型序列的XPD基序V和/或XPD基序VI。SEQ IDNO:91的变体更优选包含SEQ ID NO:91的XPD基序V和VI。然而,SEQ ID NO:91的变体可包含来自不同野生型序列的XPD基序V和/或VI。例如,SEQ ID NO:91的变体可包含美国专利申请61/581,340和国际申请PCT/GB2012/053273(公开为WO 2012/098561)的表5中所示的任何一种优选基序。SEQ ID NO:91的变体还可以包括野生型序列的XPD基序V和/或XPD基序VI内的修饰。上面在定义两个基序时讨论了这些基序的合适修饰。如上文针对Hel308解旋酶所讨论的,可连接XPD上的两个或更多个部分以减小多核苷酸结构域中的开口的大小,多核苷酸可以通过该开口从解旋酶解除绑定,并且其中解旋酶保留其控制多核苷酸运动的能力。以上针对Hel308解旋酶讨论的任何实施方案同样适用于XPD解旋酶。SEQ ID NO:91的变体优选包含一个或多个取代的半胱氨酸残基和/或一个或多个取代的Faz残基,以促进如上所述的连接。
解旋酶优选是UvrD解旋酶。可在本发明中使用任何UvrD解旋酶。UvrD解旋酶优选地包括SEQ ID NO:122中所示序列或其变体。上文定义了变体。在SEQ ID NO:122中任一个的氨基酸序列的整个长度内,基于氨基酸相似性或同一性,变体将优选地与所述序列至少20%同源。更优选地,基于氨基酸同一性,变体多肽可以在整个序列内与SEQ ID NO:122的任一个的氨基酸序列至少30%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,并且更优选地至少95%、97%或99%同源。在100个或更多个,例如150、200、300、400、或500或更多个邻接氨基酸的延伸段上,可存在至少70%,例如至少80%、至少85%、90%或95%氨基酸同一性(“硬同源性”)。如下所述确定同源性或相似性。
解旋酶优选是Dda解旋酶。可在本发明中使用任何Dda解旋酶。Dda解旋酶通常包括以下五个结构域:1A(RecA样马达蛋白)结构域、2A(RecA样马达蛋白)结构域、塔结构域、针结构域和钩结构域(Xiaoping He等,2012,Structure;20:1189-1200)。可以使用以下鉴定结构域:蛋白质建模、结晶状态的蛋白质的X射线衍射测量(Rupp B(2009).BiomolecularCrystallography:Principles,Practice and Application to Structural Biology.NewYork:Garland Science.),溶液中蛋白质的核磁共振(NMR)光谱(Mark Rance;Cavanagh,John;Wayne J.Fairbrother;Arthur W.Hunt III;Skelton,NNicholas J.(2007).ProteinNMR spectroscopy:principles and practice(2nd ed.).Boston:Academic Press.),或冷冻水合状态的蛋白质的冷冻电子显微镜检查(van Heel M,Gowen B,Matadeen R,OrlovaEV,Finn R,Pape T,Cohen D,Stark H,Schmidt R,Schatz M,Patwardhan A(2000)."Single-particle electron cryo-microscopy:towards atomic resolution.".Q RevBiophys.33:307–69)。通过上述方法测定的蛋白质的结构信息可从蛋白质库(PDB)数据库公开获得。
优选的Dda解旋酶如下表5所示。
Figure GDA0003502100900000341
Figure GDA0003502100900000351
Figure GDA0003502100900000361
Dda解旋酶更优选包含上表5中所示的一个解旋酶的序列,即SEQ ID NO:97-112之一,或其变体。上文定义了变体。在SEQ ID Nos:97-112中任一个的氨基酸序列的整个长度内,基于氨基酸相似性或同一性,变体将优选地与所述序列至少20%同源。更优选地,基于氨基酸同一性,变体多肽可以在整个序列内与SEQ ID Nos:97-112的任一个的氨基酸序列至少30%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,并且更优选地至少95%、97%或99%同源。在100个或更多个,例如150、200、300、400、或500或更多个邻接氨基酸的延伸段上,可存在至少70%,例如至少80%、至少85%、90%或95%氨基酸同一性(“硬同源性”)。如下所述确定同源性或相似性。
SEQ ID NOs:97-112中任一个的优选变体在氨基-(N-)末端和/或羧基(C-)末端具有非天然氨基酸,例如Faz。SEQ ID NO:8至23中任一个的优选变体在氨基-(N-)末端和/或羧基(C-)末端具有半胱氨酸残基。SEQ ID NO:8至23中任一个的优选变体在氨基-(N-)末端具有半胱氨酸残基,在羧基(C-末端)具有非天然氨基酸,例如Faz,反之亦然。SEQ ID NO:8的优选变体含有一个或多个,例如所有以下修饰E54G、D151E、I196N和G357A。
Dda解旋酶优选包含国际申请PCT/GB2014/052736和PCT/GB2015/052916(公开为WO/2015/055981和WO 2016/055777)中公开的任何修饰。
SEQ ID NO:97的优选的变体包括:(a)E94C和A360C;或(b)E94C、A360C、C109A和C136A,并且然后任选地(ΔM1)G1(即缺失M1并且然后添加G1)。它也可以称为M1G。上面讨论的任何变体可以进一步包括M1G。
如上文针对Hel308解旋酶所讨论的,可连接Dda上的两个或更多个部分以减小多核苷酸结构域中的开口的大小,多核苷酸可以通过该开口从解旋酶解除绑定,并且其中解旋酶保留其控制多核苷酸运动的能力。以上针对Hel308解旋酶讨论的任何实施方案同样适用于Dda解旋酶。
转位酶优选是剥除酶(strippase)。剥除酶优选为INO80染色质重塑复合物或FtsK/SpoIIIE转运蛋白。
在一个实施方案中,在通过MuA转座酶产生剥除酶后,使转座酶与构建体接触。在另一个实施方案中,在底物与模板多核苷酸接触之前,转位酶与底物结合。
发夹环
在模板多核苷酸片段化并将MuA底物连接到模板多核苷酸的片段(标记)后,形成包含模板多核苷酸片段和一个或多个MuA底物的构建体。每个构建体的两条链优选在一端通过发夹环连接。在该实施方案中,将发夹环添加到由MuA转座酶产生的模板多核苷酸的每个片段中。可以使用本领域中已知的方法来设计合适发夹环。发夹环可以是任何长度。发夹环的长度通常为110个或更少个核苷酸,如100个或更少个核苷酸、90个或更少个核苷酸、80个或更少个核苷酸、70个或更少个核苷酸、60个或更少个核苷酸、50个或更少个核苷酸、40个或更少个核苷酸、30个或更少个核苷酸、20个或更少个核苷酸、或10个或更少个核苷酸。发夹环的长度优选地为约1个到110个、2个到100个、5个到80个或6个到50个核苷酸。如果环涉及不同的衔接子的选择能力,则如50个到110个核苷酸等较长长度的发夹环是优选的。类似地,如果环不涉及如下文所论述的可选择结合,则如1个到5个核苷酸等较短长度的发夹环是优选的。
发夹环优选地包括可选择结合部分。这允许构建体被纯化或分离。可选择结合部分是可以基于其结合性质而选择的部分。因此,可选择结合部分优选地是特异性结合于表面的部分。如果可选择结合部分以比在本发明中使用的任何其它部分高许多的程度结合于表面,则其特异性结合于表面。在优选的实施方案中,所述部分与本发明中没有其它部分结合的表面结合。
合适的选择性结合部分在本领域中是已知的。优选选择性结合部分包括(但不限于):生物素;多核苷酸序列;抗体;抗体片段,如Fab和ScSv;抗原;多核苷酸结合蛋白;聚组氨酸尾部和GST标签。最优选的选择性结合部分是生物素和可选择多核苷酸序列。生物素特异性结合于涂覆有抗生物素蛋白的表面。可选择多核苷酸序列特异性地结合(即杂交)于涂布有同源序列的表面。替代地,可选择多核苷酸序列特异性结合于涂布有多核苷酸结合蛋白的表面。
发夹环和/或可选择结合部分可以包括可以进行剪切、切割、裂解或水解的区。可以设计这种区以允许构建体在纯化或分离后从其结合的表面除去。合适的区在本领域中是已知的。合适区包括(但不限于)RNA区、包含脱硫生物素和抗生蛋白链菌素的区、二硫键和可光裂解区。
发夹环可以在多核苷酸的任一端处提供,即5’端或3’端。可以使用本领域已知的任何方法将发夹环连接到多核苷酸。可以使用连接酶,如T4 DNA连接酶、大肠杆菌DNA连接酶、Taq DNA连接酶、Tma DNA连接酶和9°N DNA连接酶来连接发夹环。发夹环可以添加到构建体中,如在国际申请号PCT/GB2014/052505(公开为WO 2015/022544)中描述的。
分子刹车
该方法优选还包括将一个或多个分子刹车连接到非底物链。非底物链是MuA双链底物的链,其不构成突出端。分子刹车可以在它们与模板多核苷酸和MuA转座酶接触之前连接到底物中的非底物链上。在通过MuA转座酶产生它们之后,分子刹车可以从保留在构建体中的底物连接到其他链上。
分子刹车优选与Y衔接子结合,所述Y衔接子包含前导序列和/或一个或多个能够将衔接子偶联到膜上的锚,并且Y衔接子在步骤(c)中连接到其他链。
Y衔接子通常是多核苷酸衔接子。其可以由上文所论述的任一个多核苷酸形成。
Y衔接子通常包含(a)双链区和(b)单链区或在另一端处不互补的区。如果Y衔接子包含单链区,那么其可被描述为具有突出端。Y衔接子中非互补区的存在给予衔接子其Y形状,这是由于不同于双链部分,两条链通常不彼此杂交。Y衔接子可包括一个或多个锚。
可以使用本领域已知的任何方法将Y衔接子和/或发夹环连接到多核苷酸。可以使用接合酶,如T4 DNA接合酶、大肠杆菌DNA接合酶、Taq DNA接合酶、Tma DNA接合酶和9°NDNA接合酶来接合衔接子中的一个或两个。或者,衔接子可以添加到构建体中,如在国际申请号PCT/GB2014/052505(公开为WO 2015/022544)中描述的。
Y衔接子可以具有前导序列,其优先穿入孔中。前导序列有助于本发明的方法。前导序列被设计成优选地穿入孔中,并且由此有助于多核苷酸通过孔的移动。前导序列还可以用于将多核苷酸连接到如下文所论述的一个或多个锚。
前导序列通常包括聚合物。聚合物优选地是带负电的。聚合物优选地是:多核苷酸,如DNA或RNA;修饰多核苷酸(如无碱基DNA);PNA;LNA;聚乙二醇(PEG)或多肽。前导优选地包括多核苷酸,并且更优选地包括单链多核苷酸。前导序列可以包括上文所论述的任一个多核苷酸。单链前导序列最优选地包括DNA的单链,如聚dT区段。前导序列优选地包括一个或多个间隔区。
前导序列可以是任何长度,但其长度通常是10个到150个核苷酸,如20个到150个核苷酸。前导的长度通常取决于所述方法中使用的跨膜孔。
Y衔接子优选地包括如上文所论述的可选结合部分。Y衔接子和/或可选择的结合部分可以包括可以如上文所论述的进行剪切、切割、裂解或水解的区。
所述方法包括使靶多核苷酸与分子刹车接触,所述分子刹车控制靶多核苷酸通过孔的移动。可以使用任何分子刹车,包含国际申请PCT/GB2014/052737(公开为WO 2015/110777)中公开的那些的任一种。
分子刹车优选地是多核苷酸结合蛋白。多核苷酸结合蛋白可以是能够结合到多核苷酸并且控制其移动穿过跨膜孔的任何蛋白质,如下更详细讨论的。在本领域中确定蛋白质是否结合到多核苷酸是很简单的。蛋白质通常与多核苷酸的至少一种性质相互作用并且修饰其至少一种性质。蛋白质可通过裂解多核苷酸形成个别核苷酸或较短核苷酸链(如二或三核苷酸)来修饰多核苷酸。所述部分可通过将多核苷酸定位或移动到特异性位置(即控制其移动)来修饰多核苷酸。
多核苷酸结合蛋白优选地衍生自多核苷酸操作酶。多核苷酸操作酶是能够与多核苷酸相互作用并且修饰其的至少一个性质的多肽。酶可以通过裂解多核苷酸以形成单个核苷酸或如二核苷酸或三核苷酸等更短的核苷酸链来修饰多核苷酸。所述酶可以通过将多核苷酸定向或将其移动到特定位置来修饰多核苷酸。多核苷酸操作酶并不需要显示酶促活性,只要其能够结合多核苷酸并且控制其移动通过孔即可。例如,酶可以进行修饰以移除其酶促活性或可以在防止其充当酶的条件下使用。下文更详细地论述了这种条件。
多核苷酸处理酶优选地衍生自溶核酶。在酶的构建体中使用的多核苷酸处理酶更优选地衍生自以下酶分类(EC)组中的任何组的成员:3.1.11、3.1.13、3.1.14、3.1.15、3.1.16、3.1.21、3.1.22、3.1.25、3.1.26、3.1.27、3.1.30和3.1.31。所述酶可以是国际申请PCT/GB10/000133(公开为WO 2010/086603)中公开的那些的任一种。
优选的酶是聚合酶、核酸外切酶、解旋酶和拓扑异构酶,如旋转酶。合适酶包括(但不限于)来自大肠杆菌的核酸外切酶I(SEQ ID NO:11)、来自大肠杆菌的核酸外切酶III(SEQ ID NO:13)、来自极端嗜热菌的RecJ(SEQ ID NO:15)和噬菌体λ核酸外切酶(SEQ IDNO:17)、TatD核酸外切酶和其变体。包括SEQ ID NO:15中所示序列的三个亚基或其变体相互作用以形成三聚体核酸外切酶。聚合酶可以是
Figure GDA0003502100900000391
3173DNA聚合酶(其可商购自
Figure GDA0003502100900000392
公司)、SD聚合酶(可商购自
Figure GDA0003502100900000393
)或其变体。酶优选地是Phi29 DNA聚合酶(SEQID NO:9)或其变体。拓扑异构酶优选地是酶分类(EC)组5.99.1.2和5.99.1.3中的任一个的成员。
所述酶最优选地衍生自解旋酶。解旋酶可以是或衍生自Hel308解旋酶、如Tral解旋酶或TrwC解旋酶等RecD解旋酶、XPD解旋酶或Dda解旋酶。解旋酶可以是或衍生自Hel308Mbu(SEQ ID NO:18)、Hel308 Csy(SEQ ID NO:19)、Hel308 Tga(SEQ ID NO:20)、Hel308Mhu(SEQ ID NO:21)、TraI Eco(SEQ ID NO:22)、XPD Mbu(SEQ ID NO:23)或其变体。
解旋酶可以是在以下国际申请号中公开的解旋酶、经修饰解旋酶或解旋酶构建体中的任一者:PCT/GB2012/052579(公开为WO 2013/057495);PCT/GB2012/053274(公开为WO2013/098562);PCT/GB2012/053273(公开为WO2013098561);PCT/GB2013/051925(公开为WO2014/013260);PCT/GB2013/051924(公开为WO 2014/013259);PCT/GB2013/051928(公开为WO 2014/013262)以及PCT/GB2014/052736(公开为WO/2015/055981)。
解旋酶优选地包括SEQ ID NO:25中所示的序列(Trwc Cba)或其变体、SEQ ID NO:18中所示的序列(Hel308 Mbu)或其变体、或SEQ ID NO:24中所示的序列(Dda)或其变体。变体可以以下文论述的用于跨膜孔的任何方式与天然序列不同。SEQ ID NO:24的优选的变体包括:(a)E94C和A360C;或(b)E94C、A360C、C109A和C136A,并且然后任选地(ΔM1)G1(即缺失M1并且然后添加G1)。它也可以称为M1G。上面讨论的任何变体可以进一步包括M1G。
Dda解旋酶优选包含国际申请PCT/GB2014/052736和PCT/GB2015/052916(公开为WO/2015/055981和WO 2016/055777)中公开的任何修饰。
根据本发明可以使用任何数量的解旋酶。例如,可以使用1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个解旋酶。在一些实施例中,可以使用不同数量的解旋酶。
本发明的方法优选包括将两个或更多个解旋酶连接到其他链。两个或更多个解旋酶通常是相同的解旋酶。两个或更多个解旋酶可以是不同的解旋酶。
两个或更多个解旋酶可以是上文提到的解旋酶的任何组合。两个或更多个解旋酶可以是两个或更多个Dda解旋酶。两个或更多个解旋酶可以是一个或多个Dda解旋酶和一个或多个TrwC解旋酶。两个或更多个解旋酶可以是相同解旋酶的不同变体。
两个或更多个解旋酶优选地彼此连接。两个或更多个解旋酶更优选地彼此共价连接。解旋酶可以按任何次序和使用任何方法连接。用于本发明中的优选的解旋酶构建体描述于以下国际申请号中:PCT/GB2013/051925号(公开为WO 2014/013260);PCT/GB2013/051924(公开为WO 2014/013259);第PCT/GB2013/051928号(公开为WO 2014/013262)和第PCT/GB2014/052736号。
SEQ ID NO:9、11、13、15、17、18、19、20、21、22、23、24或25的变体是具有不同于SEQID NO:9、11、13、15、17、18、19、20、21、22、23、24或25的氨基酸序列并且保留多核苷酸结合能力的酶。这可以使用本领域中已知的任何方法来测量。例如,可以使变体与多核苷酸接触,并且可以测量其结合到多核苷酸和沿所述多核苷酸移动的能力。变体可以包含便于多核苷酸结合和/或便于其在高盐浓度和/或室温下活性的修饰。变体可进行修饰,使得其结合多核苷酸(即保持多核苷酸结合能力)但不充当解旋酶(即当具备所有便于移动的必需组分(例如ATP和Mg2+)时不沿多核苷酸移动)。这种修饰是本领域中已知的。例如,解旋酶中的Mg2+结合域的修饰通常产生不充当解旋酶的变体。这些变体类型可以充当分子刹车(参见下文)。
基于氨基酸同一性,在SEQ ID NO:9、11、13、15、17、18、19、20、21、22、23、24或25的氨基酸序列的整个长度上,变体将优选地与所述序列至少50%同源。更优选地,基于氨基酸同一性,变体多肽可在整个序列上与SEQ ID NO:9、11、13、15、17、18、19、20、21、22、23、24或25的氨基酸序列,至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,并且更优选地至少95%、97%或99%同源。在200个或更多个,例如230、250、270、280、300、400、500、600、700、800、900或1000个或更多个邻接氨基酸的延伸段上,可存在至少80%,例如至少85%、90%或95%氨基酸同源性(“硬同源性”)。如上文所描述的确定同源性。变体可以与上文参考SEQ ID NO:2和SEQ ID NO:4论述的任何方式不同于野生型序列。酶可以共价附接于孔。任何方法可以用于将酶共价附接于孔。
优选分子刹车是TrwC Cba-Q594A(具有突变Q594A的SEQ ID NO:25)。变体并不充当解旋酶(即当具备所有便于移动的必需组分(例如ATP和Mg2+)时,结合多核苷酸但并不沿其移动)。
在链测序中,通过所施加的电势或抵抗所施加的电势,多核苷酸通过纳米孔易位。在双链多核苷酸上逐渐或逐步起作用的外切核酸酶可以在孔的顺式侧使用,以在施加的电势下供给剩余的单链或在反向电势下供给反式侧。同样,使双链DNA解旋的解旋酶还可以以类似的方式使用。还可以使用聚合酶。还存在需要抵抗所施加的电势的链易位的测序应用的可能性,但是DNA必须首先在相反或无电势下由酶“捕获”。随着电势随后在结合后转回,链将以顺式到反式的方式穿过孔并且通过电流保持处于延长的构形。单链DNA核酸外切酶或单链DNA依赖性聚合酶可充当分子马达,所述分子马达抵抗施加的电势将最近易位的单链以逐步受控方式(反式到顺式)牵拉回反式通过孔。
所述方法中可以使用任何解旋酶。解旋酶可以相对于孔的两种模式来起作用。首先,优选地使用解旋酶来进行所述方法,使得在由所施加电压造成的场的情况下,所述解旋酶使多核苷酸移动通过孔。在这种模式中,多核苷酸的5’端首先在孔中被捕获,并且解旋酶使多核苷酸移动到孔中,使得其在场的情况下通过孔,直到其最终易位通过到膜的反式侧为止。可替代地,优选地进行所述方法,使得抵抗由所施加电压造成的场的情况下,解旋酶使多核苷酸移动通过孔。在这种模式中,多核苷酸的3’端首先在孔中被捕获,并且解旋酶使多核苷酸移动通过孔,使得其抵抗所施加场的情况下牵拉出孔,直到其最终推回到膜的顺式侧为止。
还可以在相反的方向上进行所述方法。多核苷酸的3’端可以首先在孔中被捕获,并且解旋酶可以使多核苷酸移动到孔中,使得其在场的情况下通过孔,直到其最终易位通过到膜的反式侧为止。
当解旋酶不具备便于移动的必需组分或进行修饰以阻止或防止其移动时,所述解旋酶可以结合多核苷酸并且当多核苷酸被施加的场拉入孔中时起到减慢多核苷酸移动的作用。在非活性模式中,多核苷酸是否被3’或5’向下捕获无关紧要,其是通过充当刹车的酶朝向反式侧将多核苷酸拉入孔中的所施加的场。当在非活动模式中时,通过解旋酶对多核苷酸的移动控制可以多种方式(包括棘轮、滑动和制动)描述。还可以以这种方式来使用缺乏解旋酶活性的解旋酶变体。
分子刹车可以作为去除MuA转座酶的转位酶起作用。优选地,除了转位酶之外还使用分子刹车。分子刹车和转位酶可以是相同的酶或不同的酶。在分子刹车和转录酶是相同的酶的情况下,酶的一个分子可以充当分子刹车,并且酶的另一个分子可以充当转位酶以去除MuA转座酶。
可以按任何次序使多核苷酸与分子刹车和孔接触。优选的是,当使多核苷酸与分子刹车(如解旋酶)和孔接触时,多核苷酸首先与蛋白质形成复合体。当跨孔施加电压时,多核苷酸/蛋白质复合物然后与孔形成复合物并且控制多核苷酸通过孔的移动。
使用多核苷酸结合蛋白的方法中的任何步骤通常在游离核苷酸或游离核苷酸类似物和促进多核苷酸结合蛋白作用的酶辅因子存在下进行。游离核苷酸可以是上文论述的任何单个核苷酸中的一种或多种。游离核苷酸包含但不限于:单磷酸腺苷(AMP)、二磷酸腺苷(ADP)、三磷酸腺苷(ATP)、单磷酸鸟苷(GMP)、二磷酸鸟苷(GDP)、三磷酸鸟苷(GTP)、单磷酸胸苷(TMP)、二磷酸胸苷(TDP)、三磷酸胸苷(TTP)、单磷酸尿苷(UMP)、二磷酸尿苷(UDP)、三磷酸尿苷(UTP)、单磷酸胞苷(CMP)、二磷酸胞苷(CDP)、三磷酸胞苷(CTP)、环单磷酸腺苷(cAMP)、环单磷酸鸟苷(cGMP)、单磷酸脱氧腺苷(dAMP)、二磷酸脱氧腺苷(dADP)、三磷酸脱氧腺苷(dATP)、单磷酸脱氧鸟苷(dGMP)、二磷酸脱氧鸟苷(dGDP)、三磷酸脱氧鸟苷(dGTP)、单磷酸脱氧胸苷(dTMP)、二磷酸脱氧胸苷(dTDP)、三磷酸脱氧胸苷(dTTP)、单磷酸脱氧尿苷(dUMP)、二磷酸脱氧尿苷(dUDP)、三磷酸脱氧尿苷(dUTP)、单磷酸脱氧胞苷(dCMP)、二磷酸脱氧胞苷(dCDP)和三磷酸脱氧胞苷(dCTP)。游离核苷酸优选地选自AMP、TMP、GMP、CMP、UMP、dAMP、dTMP、dGMP或dCMP。游离核苷酸优选地是三磷酸腺苷(ATP)。酶辅因子是允许构建体起作用的因子。酶辅因子优选地是二价金属阳离子。二价金属阳离子优选地是Mg2+、Mn2+、Ca2+或Co2+。酶辅因子最优选地是Mg2+
分子刹车可以是结合多核苷酸并且减缓多核苷酸通过孔的移动的任何化合物或分子。分子刹车可以是上文论述的任何一种。分子刹车优选地包括与多核苷酸结合的化合物。所述化合物优选地是大环化合物。合适的大环化合物包含但不限于环糊精、杯芳烃、环肽、冠醚、葫芦脲、柱状芳烃、其衍生物或其组合。环糊精或其衍生物可以是在Eliseev,A.V.和Schneider,H-J.(1994年),《美国化学学会期刊志(J.Am.Chem.Soc.)》,116,6081-6088中公开的那些中的任一种。环糊精更优选地是七-6-氨基-β-环糊精(am7-βCD)、6-单脱氧-6-单氨基-β-环糊精(am1-βCD)或七-(6-脱氧-6-胍基)-环糊精(gu7-βCD)。
缺乏加热
本发明的方法优选不包括使MuA转座酶失活的热。热灭活还可以使用于制备或表征修饰的多核苷酸的任何其他酶或蛋白质失活。去除热灭活步骤还省去了用于加热样品的加热所需额外设备,例如热循环仪、热块或水浴。因此,本发明的方法可以用于各种不同的设置,包括那些没有电力供应的设置。
本发明产品
本发明还提供双链MuA底物群,用于修改模板多核苷酸,其中每个底物包括在一端或两端的突出端和结合于突出端的转位酶。上文所讨论的实施方案中的任一种同样适用于本发明的所述群。
本发明还提供了使用本发明方法修饰的多个多核苷酸。多个多核苷酸可以是上面讨论的任何形式。
可以分离、基本上分离、纯化或基本纯化所述群或所述多个。如果群或多个完全不含任何其他组分,例如模板多核苷酸、脂质或孔,则分离或纯化了群。如果群或多个与将不干扰其既定用途的载体或稀释剂混合,则其是基本上分离的。例如,如果群或多个以包括小于10%、小于5%、小于2%或小于1%的其它组分如脂质或孔的形式存在,则其是基本上分离的或基本上纯化的。
本发明的表征方法
本发明还包括表征使用本发明方法修饰的至少一种多核苷酸的方法。使修饰的多核苷酸与跨膜孔接触,使得多核苷酸的至少一条链穿过孔。当至少一条链相对于孔移动时,采用指示多核苷酸的一种或多种特征的一种或多种测量。
本发明还提供了表征模板多核苷酸的方法。使用本发明的方法修饰模板多核苷酸以产生多个修饰的多核苷酸。使每个修饰的多核苷酸与跨膜孔接触,使得每个多核苷酸的至少一条链移动通过孔。指示多核苷酸的一个或多个特征的一个或多个测量值被认为是每个多核苷酸的至少一条链相对于孔移动。
如果所述/每个修饰的多核苷酸包含发夹环,则该方法优选包括使所述/每个修饰的多核苷酸与跨膜孔接触,使得多核苷酸的两条链移动通过孔。如果分子刹车存在于所述/每个修饰的多核苷酸上,则分子刹车可以控制所述/每个修饰的多核苷酸通过孔的运动和/或分离所述/每个修饰的多核苷酸的两条链。
跨膜孔通常在膜中。根据本发明可以使用任何膜。合适膜在所属领域中是众所周知的。膜优选地是两亲层。两亲层是由两亲分子形成的层,所述两亲分子如磷脂,其具有亲水性和亲脂性特性两种。两亲分子可以是合成的或天然存在的。非天然存在的两亲物和形成单层的两亲物在所属领域中是已知的,且包括例如嵌段共聚物(Gonzalez-Perez等人,Langmuir,2009,25,10447-10450)。嵌段共聚物是两个或更多个单体亚基聚合在一起以产生单个聚合物链的聚合材料。嵌段共聚物通常具有通过每个单体亚基贡献的性质。然而,嵌段共聚物可以具有由单独的亚基形成的聚合物不拥有的独特性质。嵌段共聚物可以被工程化为使得单体亚基之一在水性介质中是疏水性的(即亲脂性),而一个或多个其它亚基是亲水性的。在这种情况下,嵌段共聚物可以拥有两亲性质,并且可以形成模拟生物膜的结构。嵌段共聚物可以是二嵌段(其由两个单体亚基组成),但也可以由多于两个单体亚基构造以形成表现为两亲物的更复杂布置。共聚物可以是三嵌段、四嵌段或五嵌段共聚物。膜优选地是三嵌段共聚物膜。
古细菌双极四醚脂质是天然存在的脂质,其被构建使得脂质形成单层膜。这些脂质一般发现于存活于苛刻生物环境中的极端条件的生物、嗜热菌、嗜盐菌和嗜酸菌中。认为其稳定性是源于最终双层的融合性质。通过产生具有一般基序亲水性-疏水性-亲水性的三嵌段聚合物来构筑模拟这些生物实体的嵌段共聚物材料,是直接了当的。这种材料可形成表现类似于脂质双层且涵盖囊泡到层状膜的一系列阶段表现的单体膜。由这些三嵌段共聚物形成的膜在生物脂质膜上保持若干优势。因为合成三嵌段共聚物,所以可小心地控制准确的构筑,以提供形成膜和与孔和其它蛋白质相互作用所需的正确链长度和特性。
还可由不分类为脂质亚材料的子单元来构筑嵌段共聚物,例如可由硅氧烷或其它非基于烃的单体来制成疏水性聚合物。嵌段共聚物的亲水性小节还可拥有很低的蛋白质结合特性,此允许产生当暴露于原始生物样品时具有高度抗性的膜。这种头基单元还可来源于非经典的脂质头基。
与生物脂质膜进行比较,三嵌段共聚物膜还具有增加的机械和环境稳定性,例如高许多的操作温度或pH范围。嵌段共聚物的合成性质提供定制用于广泛范围应用的基于聚合物的膜的平台。
膜最优选地是国际申请第PCT/GB2013/052766号或第PCT/GB2013/052767号中所公开的膜中的一个。
两亲分子可进行化学修饰或官能化,以便于偶联多核苷酸。
两亲层可以是单层或双层。两亲层通常是平坦的。两亲层可以是弯曲的。两亲层可以是支撑式的。两亲层可以是凹曲的。两亲层可以悬浮于升高的柱,使得两亲层的外围区高于中心的两亲层区。这可以允许微粒如上文所描述的沿着膜行进、移动、滑动或滚动。
两亲膜通常天然地是流动的,基本上以大致10-8cm s-1的脂质扩散速率充当二维液体。这意味着孔和偶联的多核苷酸可通常在两亲膜内移动。
膜可以是脂质双层。脂质双层是细胞膜的模型,且用作一系列实验研究的极佳平台。例如,脂质双层可以用于通过单通道记录对膜蛋白进行体外研究。可替代地,脂质双层可以用作检测一系列物质的存在的生物传感器。脂质双层可以是任何脂质双层。适当的脂质双层包含但不限于平坦脂质双层、支撑双层或脂质体。脂质双层优选地是平坦脂质双层。在以下文献中公开了适当的脂质双层:国际申请号PCT/GB08/000563(公开为WO 2008/102121)、国际申请号PCT/GB08/004127(公开为WO 2009/077734)以及国际申请号PCT/GB2006/001057(公开为WO 2006/100484)。
用于形成脂质双层的方法在所属领域中是已知的。脂质双层通常通过Montal和Mueller的方法(Proc.Natl.Acad.Sci.USA.,1972;69:3561-3566)来形成,其中脂质单层携载于通过开孔两侧的水溶液/空气界面上,所述开孔垂直于所述界面。通常通过首先将脂质溶解在有机溶剂中,且接着使在开孔两侧上的水溶液的表面上蒸发一滴溶剂,来将脂质添加到水性电解质溶液的表面。一旦有机溶剂已蒸发,那么开孔两侧上的溶液/空气界面来回物理地移动通过开孔,直到形成双层为止。可跨越膜中的开孔或跨越凹槽中的开口形成平坦脂质双层。
Montal和Mueller的方法是常用的,这是因为是节约成本的,且是形成适合于蛋白孔插入的良好品质脂质双层的相对直接了当的方法。双层形成的其它常见方法包括脂质体双层的尖端浸没、双层涂刷和贴片夹持。
尖端浸没双层形成需要使开孔表面(例如移液管尖端)接触到携载脂质单层的测试溶液的表面。同样,通过将溶解于有机溶剂中的一滴脂质在溶液表面处蒸发来首先在溶液/空气界面处产生脂质单层。接着,通过朗缪尔-沙佛(Langmuir-Schaefer)过程形成双层,且需要机械自动以使开孔相对于溶液表面移动。
对于涂刷的双层,将溶解于有机溶剂中的一滴脂质直接应用于开孔,所述开孔浸没在水性测试溶液中。使用笔刷或等效物使脂质溶液稀薄地扩散在开孔内。溶剂的薄化导致脂质双层的形成。然而,从双层完全移除溶剂是非常困难的,并且因此通过这种方法形成的双层较不稳定且更倾向于在电化学测量期间具有噪声。
贴片夹持是在生物细胞膜研究中常用的。通过抽汲将细胞膜夹持到移液管的端,并且膜贴片变为附接在开孔上。所述方法已经适用于通过夹持脂质体来产生脂质双层,然后脂质体破裂以留下密封在移液管开孔上的脂质双层。所述方法需要稳定的、巨大的和单层的脂质体以及在具有玻璃表面的材料中制造小开孔。
可通过超声处理、挤压或Mozafari方法来形成脂质体(Colas等人(2007)《Micron》38:841-847)。
在优选的实施方案中,脂质双层如国际申请号PCT/GB08/004127(公开为WO 2009/077734)中所描述形成脂质双层。在此方法中有利的是,由干燥脂质形成脂质双层。在一最优选实施方案中,跨越开口形成脂质双层,如WO2009/077734(PCT/GB08/004127)中所描述。
由脂质的两个相对层形成脂质双层。两个脂质层被布置成使得其疏水性尾基面朝彼此以形成疏水性的内部。脂质的亲水性头基向外朝向双层各侧上的水环境。双层可存在于多种脂质阶段中,所述阶段包括(但不限于)液体无序阶段(液体片层)、液体有序阶段、固体有序阶段(片层凝胶阶段、交错结合的凝胶阶段)和平坦双层晶体(片层亚凝胶阶段、片层结晶阶段)。
可以使用形成脂质双层的任何脂质组合物。选择脂质组合物,使得脂质双层具有所需的性质,如表面电荷、支持膜蛋白的能力、充填密度或所形成的机械性质。脂质组合物可以包括一或多种不同脂质。例如,脂质组合物可以含有多达100种脂质。脂质组合物优选地含有1种到10种脂质。脂质组合物可以包括天然存在的脂质和/或人工脂质。
脂质通常包括头基、界面部分和可以相同或不同的两个疏水性尾基。合适头基包括(但不限于):中性头基,如二酰基甘油酯(DG)和脑酰胺(CM);两性离子头基,如磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)和鞘磷脂(SM);带负电头基,如磷脂酰甘油(PG)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)、磷脂酸(PA)和心磷脂(CA);和带正电头基,如三甲基铵丙烷(TAP)。合适界面部分包括(但不限于)天然存在的界面部分,如基于甘油或基于脑酰胺的部分。合适疏水尾部基团包括(但不限于):饱和烃链,如月桂酸(正十二烷酸)、肉豆蔻酸(正十四烷酸)、棕榈酸(正十六烷酸)、硬脂酸(正十八烷酸)和花生酸(正二十烷酸);不饱和烃链,如油酸(顺-9-十八烷酸);和分支链烃链,如植烷酰基。链的长度和不饱和烃链中的双键的位置与数量可以变化。链的长度和分支链烃链中的分支(如甲基)的位置和数量可变化。疏水性尾基可以作为醚或酯连接于界面部分。脂质可以是分枝菌酸。
脂质还可以进行化学修饰。脂质的头基或尾部基团可以进行化学修饰。头基已进行化学修饰的合适脂质包括(但不限于):PEG修饰的脂质,如1,2-二酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000];官能化的PEG脂质,如1,2-二硬脂酰基-sn-甘油-3磷酸乙醇胺-N-[生物素基(聚乙二醇)2000];和针对结合修饰的脂质,如1,2-二油酰基-sn-甘油-3-磷酸乙醇胺-N-(丁二酰基)和1,2-二棕榈酰基-sn-甘油-3-磷酸乙醇胺-N-(生物素基)。尾部基团已进行化学修饰的合适脂质包括(但不限于):可聚合脂质,如1,2-双(10,12-三辅二炔基)-sn-甘油-3-磷酸胆碱;氟化脂质,如1-软脂酰基-2-(16-氟软脂酰基)-sn-甘油-3-磷酸胆碱;氘化脂质,如1,2-二棕榈酰基-D62-sn-甘油-3-磷酸胆碱;和醚连接的脂质,如1,2-二-O-植烷基-sn-甘油-3-磷酸胆碱。脂质可以进行化学修饰或官能化以便于偶联多核苷酸。
两亲层,例如脂质组合物,通常包括将影响层的性质的一个或多个添加剂。合适添加剂包括(但不限于):脂肪酸,如棕榈酸、肉豆蔻酸和油酸;脂肪醇,如棕榈醇、肉豆蔻醇和油醇;固醇,如胆固醇、麦角固醇、羊毛固醇、谷固醇和豆固醇;溶血磷脂,如1-酰基-2-羟基-sn-甘油-3-磷酸胆碱;和脑酰胺。
在另一个优选的实施方案中,膜是固态层。固态层可以由有机材料和无机材料形成,所述材料包含但不限于:微电子材料、如HfO2、Si3N4、A12O3和SiO等绝缘材料、如聚酰胺等有机聚合物和无机聚合物、如
Figure GDA0003502100900000451
等塑料或如二组分加成固化的硅橡胶等弹性体、以及玻璃。固态层可以通过原子层沉积(ALD)。ALD固态层可以包括HfO2和A12O3的交替层。固态层可以由如石墨烯等单原子层或仅几个原子厚的层形成。在国际申请号PCT/US2008/010637(作为WO2009/035647公开)中公开了合适的石墨烯层。Yusko等,Nature Nanotechnology,2011;6:253-260和美国专利申请号2013/0048499描述了在不使用微粒的情况下将蛋白质递送至固态层中的跨膜孔。本发明的方法可用于改进这些文献中公开的方法中的递送。
通常使用下列项来进行所述方法:(i)包括孔的人工两亲形层;(ii)包括孔的分离的天然存在的脂质双层;或(iii)具有插入其中的孔的细胞。通常使用人工两亲层,如人工三嵌段共聚物层来进行所述方法。所述层可以包括其它跨膜和/或膜内蛋白质以及除孔以外的其它分子。下文论述了适当的设备和条件。通常在体外进行本发明的方法。
跨膜孔
跨膜孔是在某种程度上穿过膜的结构。通常,跨膜孔包括第一开口和第二开口,其中内腔在第一开口与第二开口之间延伸。跨膜孔允许由施加的电势驱动的水合离子流过膜或膜内。跨膜孔通常穿过整个膜,使得水合离子可以从膜的一侧流到膜的另一侧。然而,跨膜孔不必穿过膜。其可能在一端关闭。例如,孔可以是膜中的阱、间隙、通道、沟槽或狭缝,水合离子可以沿着所述孔流动或流入其中。
任何跨膜孔可以用于本发明。孔可以是生物的或人造的。合适的孔包含但不限于蛋白质孔、多核苷酸孔和固态孔。孔可以是DNA折纸孔(Langecker等人,《科学(Science)》,2012年;338:932-936)。
跨膜孔优选地是跨膜蛋白质孔。跨膜蛋白孔是多肽或多肽的集合,其允许如多核苷酸等水合离子从膜的一侧流到膜的另一侧。在本发明中,跨膜蛋白孔能够形成孔,所述孔允许由施加的电势驱动的水合离子从膜的一侧流到另一侧。跨膜蛋白孔优选地允许多核苷酸从膜的一侧,如三嵌段共聚物膜流到另一侧。跨膜蛋白孔允许如DNA或RNA等多核苷酸移动通过孔。
跨膜蛋白孔可以是单体或寡聚体。孔优选地由几个重复的亚基组成,如至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个或至少16个亚基。孔优选地为六聚体、七聚体、八聚体或非三聚体孔。孔可以是同源寡聚体或异源寡聚体。
跨膜蛋白孔通常包括离子可以流过的桶或通道。孔的亚基通常围绕中心轴线并且为跨膜β桶或通道或跨膜α-螺旋束或通道提供链。
跨膜蛋白孔的桶或通道通常包括促进与s相互作用的氨基酸,如核苷酸、多核苷酸或核酸。这些氨基酸优选地位于桶或通道的收缩部附近。跨膜蛋白孔通常包括一个或多个带正电荷的如精氨酸、赖氨酸或组氨酸等氨基酸,或如酪氨酸或色氨酸等芳香族氨基酸。这些氨基酸通常促进孔与核苷酸、多核苷酸或核酸之间的相互作用。
根据本发明使用的跨膜蛋白孔可以衍生自β桶孔或α螺旋束孔。β-桶孔包括由β-链形成的桶或通道。合适的β-桶孔包含但不限于β-毒素,如α-溶血素、炭疽毒素和白细胞素,以及细菌的外膜蛋白/孔蛋白,如耻垢分枝杆菌孔蛋白(Msp),例如MspA、MspB、MspC或MspD、CsgG,外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG)、外膜磷脂酶A和奈瑟氏球菌自转运蛋白(NalP)以及其它孔隙,如胞溶素(lysenin)。α-螺旋束孔包括由α-螺旋形成的桶或通道。合适的α螺旋束孔包含但不限于内膜蛋白和α外膜蛋白,如WZA和ClyA毒素。跨膜孔可以衍生自胞溶素。衍生自CsgG的合适的孔在国际申请号PCT/EP2015/069965中公开。衍生自胞溶素的合适的孔在国际申请PCT/GB2013/050667(公开为WO 2013/153359)中公开。跨膜孔可以衍生自或基于Msp、α-溶血素(α-HL)、胞溶素、CsgG、ClyA、Sp1和溶血性蛋白质fragaceatoxinC(FraC)。野生型α-溶血素孔由7个相同的单体或亚基形成(即,其是七聚体)。α-溶血素-NN的一个单体或亚基的序列显示在SEQ ID NO:4中。
跨膜蛋白孔优选地衍生自Msp,更优选衍生自MspA。这种孔是寡聚的并且通常包括衍生自Msp的7个、8个、9个或10个单体。孔可以是衍生自Msp的同源寡聚孔,其包括相同的单体。可替代地,孔可以是衍生自Msp的异源寡聚孔,其包括至少一种不同于其它单体的单体。优选地,孔衍生自MspA或其同源物或旁系同源物。
衍生自Msp的单体通常包括SEQ ID NO:2中所示的序列或其变体。SEQ ID NO:2是MspA单体的MS-(B1)8突变体。其包含以下突变:D90N、D91N、D93N、D118R、D134R和E139K。SEQID NO:2的变体是具有不同于SEQ ID NO:2的氨基酸序列并且保持其形成孔的能力的多肽。可以使用本领域中已知的任何方法来测定变体形成孔的能力。例如,可以将变体连同其它适当的亚基一起插入到两亲层中,并且可以确定其寡聚形成孔的能力。用于将亚基插入到膜(如两亲层)中的方法在本领域中已知。例如,可以将纯化形式的亚基悬浮于含有三嵌段共聚物膜的溶液中,使得其扩散到膜中并且通过与膜结合和组装成功能性状态来插入。可替代地,可以使用M.A.Holden,H.Bayley.J.Am.Chem.Soc.2005,127,6502-6503和国际申请号PCT/GB2006/001057(公开为WO 2006/100484)中描述的“拾取且放置”方法,将亚基直接插入膜中。
在SEQ ID NO:2的氨基酸序列的整个长度内,基于氨基酸相似性或同一性,变体将优选地与所述序列至少50%同源。更优选地,基于氨基酸相似性或同一性,变体可以在整个序列内与SEQ ID NO:2的氨基酸序列至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,并且更优选地至少95%、97%或99%同源。在100个或更多个、例如125个、150个、175个或200个或更多个连续氨基酸的段内,可能存在至少80%、例如至少85%、90%或95%的氨基酸相似性或同一性(“硬同源性(hard homology)”)。
本领域中的标准方法可以用于确定同源性。例如,UWGCG程序包提供了BESTFIT程序,其可以用于计算同源性,例如根据其默认设置使用(Devereux等人(1984年)《核酸研究(Nucleic Acids Research)》第12卷,第387到395页)。PILEUP和BLAST算法可以用于计算同源性或对序列进行排序(如识别等同残基或对应序列(通常根据其默认设置),例如如Altschul S.F.(1993)《分子进化杂志(J Mol Evol)》36:290-300;Altschul,S.F等人(1990)《分子进化杂志》215:403-10中所描述。用于执行BLAST分析的软件可通过美国国家生物技术信息中心(National Center for Biotechnology Information)(http://www.ncbi.nlm.nih.gov/)公开获得。相似性可以使用成对同一性或通过应用如BLOSUM62等评分矩阵并且转换为等效同一性来测量。由于其表示功能变化而非演化变化,所以在确定同源性时将掩盖故意突变的位置。通过在蛋白序列的综合数据库上使用例如PSIBLAST来应用位置特异性评分矩阵,可以更灵敏地确定相似性。可以使用反映氨基酸化学-物理性质而不是演化时间尺度(例如,电荷)内的取代频率的不同评分矩阵。
SEQ ID NO:2是MspA单体的MS-(B1)8突变体。与MspA相比,变体可以包括MspB、MspC或MspD单体中的任何突变。MspB、MspC和MspD的成熟形式显示在SEQ ID NO:5到SEQ IDNO:7中。具体地,所述变体可以包括MspB中存在的以下取代:A138P。变体可以包括MspC中存在的一种或多种以下取代:A96G、N102E和A138P。变体可以包括MspD中存在的一种或多种以下突变:G1、L2V、E5Q、L8V、D13G、W21A、D22E、K47T、I49H、I68V、D91G、A96Q、N102D、S103T、V104I、S136K以及G141A的缺失。变体可以包括来自Msp B、Msp C和Msp D的突变和取代中的一个或多个的组合。变体优选地包括突变L88N。除了MS-B1的所有突变之外,SEQ ID NO:2的变体还具有突变L88N,并且被称为MS-(B2)8。本发明中使用的孔优选为MS-(B2)8。SEQ IDNO:2的变体优选地包括D56N、D56F、E59R、G75S、G77S、A96D和Q126R中的一种或多种。除了MS-B1的所有突变之外,SEQ ID NO:2的变体还具有突变G75S/G77S/L88N/Q126R,并且被称为MS-B2C。本发明中使用的孔优选地为MS-(B2)8或MS-(B2C)8。SEQ ID NO:2的变体优选地包括N93D。变体更优选包括突变G75S/G77S/L88N/N93D/Q126R。
可以对SEQ ID NO:2的氨基酸序列进行除了上文所论述的取代之外的氨基酸取代,例如高达1个、2个、3个、4个、5个、10个、20个或30个取代。保守取代使用具有类似化学结构、类似化学性质或类似侧链体积的其它氨基酸来代替氨基酸。所引入的氨基酸可以具有与其所代替的氨基酸类似的极性、亲水性、疏水性、碱性、酸性、电中性或电荷。可替代地,保守取代可以引入另一芳香族或脂肪族氨基酸代替预先存在的芳香族或脂肪族氨基酸。
跨膜蛋白孔优选地衍生自CsgG,更优选地来自大肠杆菌菌株K-12亚株MC4100。这种孔将是寡聚的并且通常包括衍生自CsgG的7个、8个、9个或10个单体。孔可以是衍生自CsgG的同源寡聚孔,其包括相同的单体。可替代地,孔可以是衍生自CsgG的异源寡聚孔,其包括至少一种不同于其它单体的单体。
衍生自CsgG的单体通常包括SEQ ID NO:114中所示的序列或其变体。SEQ ID NO:114的变体是具有不同于SEQ ID NO:114的氨基酸序列并且保持其形成孔的能力的多肽。可以使用如上文所论述的本领域中已知的任何方法来测定变体形成孔的能力。
在SEQ ID NO:114中任一个的氨基酸序列的整个长度内,基于氨基酸相似性或同一性,变体将优选地与所述序列至少50%同源。更优选地,基于氨基酸相似性或同一性,变体可以在整个序列内与SEQ ID NO:114的氨基酸序列至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,并且更优选地至少95%、97%或99%同源。在100个或更多个、例如125个、150个、175个或200个或更多个连续氨基酸的延伸段内,可能存在至少80%、例如至少85%、90%或95%的氨基酸相似性或同一性(“硬同源性(hardhomology)”)。可以如上所述测量同源性。
SEQ ID NO:114的变体可包含国际申请PCT/GB2015/069965(公开为WO 2016/034591)中公开的任何突变。SEQ ID NO:114的变体优选地包括以下中的一种或多种(i)在以下位置处的一或多个突变(即在以下位置中的一或多个处的突变):N40、D43、E44、S54、S57、Q62、R97、E101、E124、E131、R142、T150和R192,如在以下位置处的一或多个突变(即在以下位置中的一或多个处的突变)N40、D43、E44、S54、S57、Q62、E101、E131和T150或N40、D43、E44、E101和E131;(ii)在Y51/N55、Y51/F56、N55/F56或Y51/N55/F56处的突变;(iii)Q42R或Q42K;(iv)K49R;(v)N102R、N102F、N102Y或N102W;(vi)D149N、D149Q或D149R;(vii)E185N、E185Q或E185R;(viii)D195N、D195Q或D195R;(ix)E201N、E201Q或E201R;(x)E203N、E203Q或E203R;以及(xi)以下位置中的一或多个的缺失:F48、K49、P50、Y51、P52、A53、S54、N55、F56和S57。变体可包含(i)到(xi)的任何组合。如果变体包含(i)和(iii)到(xi)中的任一个,那么其可进一步包含在Y51、N55和F56中的一或多个处的突变,如在Y51、N55、F56、Y51/N55、Y51/F56、N55/F56或Y51/N55/F56处。
形成孔的SEQ ID NO:114的优选的变体,其中当多核苷酸移动通过孔时较少的核苷酸对电流起作用,包括Y51A/F56A、Y51A/F56N、Y51I/F56A、Y51L/F56A、Y51T/F56A、Y51I/F56N、Y51L/F56N或Y51T/F56N,或更优选地Y51I/F56A、Y51L/F56A或Y51T/F56A。
形成显示增加范围的孔的SEQ ID NO:114的优选的变体包括在以下位置处的突变:
Y51、F56、D149、E185、E201和E203;
N55和F56;
Y51和F56;
Y51、N55和F56;或
F56和N102。
形成显示增加范围的孔的SEQ ID NO:114的优选的变体包括:
Y51N、F56A、D149N、E185R、E201N和E203N;
N55S和F56Q;
Y51A和F56A;
Y51A和F56N;
Y51I和F56A;
Y51L和F56A;
Y51T和F56A;
Y51I和F56N;
Y51L和F56N;
Y51T和F56N;
Y51T和F56Q;
Y51A、N55S和F56A;
Y51A、N55S和F56N;
Y51T、N55S和F56Q;或
F56Q和N102R。
形成孔的SEQ ID NO:114的优选的变体,其中当多核苷酸移动通过孔时较少的核苷酸对电流起作用,包括在以下位置的突变:
N55和F56,如N55X和F56Q,其中X是任何氨基酸;或
Y51和F56,如Y51X和F56Q,其中X是任何氨基酸。
形成显示增加的通量的孔的SEQ ID NO:114的优选的变体包括在以下位置的突变:
D149、E185和E203;
D149、E185、E201和E203;或
D149、E185、D195、E201和E203。
形成显示增加的通量的孔的优选的变体包括:
D149N、E185N和E203N;
D149N、E185N、E201N和E203N;
D149N、E185R、D195N、E201N和E203N;或
D149N、E185R、D195N、E201R和E203N。
形成孔的SEQ ID NO:7的优选的变体,其中多核苷酸的捕获增加包括以下突变:
D43N/Y51T/F56Q;
E44N/Y51T/F56Q;
D43N/E44N/Y51T/F56Q;
Y51T/F56Q/Q62R;
D43N/Y51T/F56Q/Q62R;
E44N/Y51T/F56Q/Q62R;或
D43N/E44N/Y51T/F56Q/Q62R。
SEQ ID NO:114的优选变体包含以下突变:
D149R/E185R/E201R/E203R或Y51T/F56Q/D149R/E185R/E201R/E203R;
D149N/E185N/E201N/E203N或Y51T/F56Q/D149N/E185N/E201N/E203N;
E201R/E203R或Y51T/F56Q/E201R/E203R;
E201N/E203R或Y51T/F56Q/E201N/E203R;
E203R或Y51T/F56Q/E203R;
E203N或Y51T/F56Q/E203N;
E201R或Y51T/F56Q/E201R;
E201N或Y51T/F56Q/E201N;
E185R或Y51T/F56Q/E185R;
E185N或Y51T/F56Q/E185N;
D149R或Y51T/F56Q/D149R;
D149N或Y51T/F56Q/D149N;
R142E或Y51T/F56Q/R142E;
R142N或Y51T/F56Q/R142N;
R192E或Y51T/F56Q/R192E;或
R192N或Y51T/F56Q/R192N。
SEQ ID NO:114的优选变体包含以下突变:
Y51A/F56Q/E101N/N102R;
Y51A/F56Q/R97N/N102G;
Y51A/F56Q/R97N/N102R;
Y51A/F56Q/R97N;
Y51A/F56Q/R97G;
Y51A/F56Q/R97L;
Y51A/F56Q/N102R;
Y51A/F56Q/N102F;
Y51A/F56Q/N102G;
Y51A/F56Q/E101R;
Y51A/F56Q/E101F;
Y51A/F56Q/E101N;或
Y51A/F56Q/E101G
SEQ ID NO:114的变体可以包括存在于另一个CsgG同源物中的取代中的任一个。优选的CsgG同源物显示在国际申请PCT/GB2015/069965(公布为WO 2016/034591)中的SEQID NOs:3-7和26-41中。
例如通过添加组氨酸残基(his标签)、天冬氨酸残基(asp标签)、抗生蛋白链菌素标签、flag标签、SUMO标签、GST标签或MBP标签、或通过添加信号序列以促进其从细胞分泌,其中多肽不天然地含有这样的序列,可以修饰本文所描述的如跨膜蛋白孔等任何蛋白质以帮助其鉴定或纯化。引入基因标签的替代性方案是将标签化学反应到孔上的原生的或工程化的位置上。这种操作的实例将是使凝胶迁移试剂与孔外部上的工程化半胱氨酸反应。这已经被显示为一种用于分离溶血素异源寡聚物的方法(《生物化学(Chem Biol)》,1997年7月,第4卷,第7期,第497到505页)。
单体可以用显露标记来进行标记。显露标记可以是允许孔被检测到的任何适当标记。适当的标记包含但不限于荧光分子;放射性同位素,例如,125I、35S、酶、抗体、抗原、多核苷酸和如生物素等配体。
本文所描述的如跨膜蛋白孔等任何蛋白质可以合成制备或通过重组方法制备。例如,可以通过体外转译和转录(IVTT)来合成蛋白质。可以修饰孔的氨基酸序列以包含非天然存在的氨基酸或增加蛋白质的稳定性。当通过合成手段来生产蛋白质时,可以在生产期间引入此类氨基酸。在合成或重组生产后,孔也可以改变。
本文所描述的如跨膜蛋白孔等任何蛋白质可以使用本领域已知的标准方法生产。编码孔或构建体的多核苷酸序列可以使用本领域的标准方法衍生和复制。编码孔或构建体的多核苷酸序列可以使用本领域的标准技术在细菌宿主细胞中表达。可以通过从重组表达载体原位表达多肽在细胞中产生孔。表达载体任选地携带诱导型启动子以控制多肽的表达。这些方法在Sambrook,J.和Russell,D.(2001).《分子克隆实验指南(MolecularCloning:A Laboratory Manual)》第3版,纽约冷泉港冷泉港实验室出版社(Cold SpringHarbor Laboratory Press)中描述。
可以在从蛋白质产生生物体通过任何蛋白质液相色谱系统纯化之后或在重组表达之后,大规模生产孔。典型的蛋白质液相色谱系统包含FPLC、AKTA系统、Bio-Cad系统、Bio-Rad生物系统和Gilson HPLC系统。
偶联
所述/每种修饰的多核苷酸优选包含一个或多个能够与膜偶联的锚。所述方法优选地另外包括使用一种或多种锚将靶多核苷酸偶联到膜。
锚包括与多核苷酸偶联(或结合)的基团和与膜偶联(或结合)的基团。各锚可与多核苷酸和/或膜共价偶联(或结合)。该基团可以是化学基团和/或官能团。
可以使用任何数量的锚将多核苷酸偶联到膜上,如2个、3个、4个或更多个锚。例如,可以使用两个锚将多核苷酸偶联到膜上,每个锚分别与多核苷酸和膜偶联(或结合)。
一个或多个锚可包含一种或多种分子刹车或多核苷酸结合蛋白。每个锚可包含一种或多种分子刹车或多核苷酸结合蛋白。分子刹车或多核苷酸结合蛋白可以是下面讨论的任何一种。
如果膜是如三嵌段共聚物膜等两亲层,则一种或多种锚优选地包括存在于膜中的多肽锚和/或存在于膜中的疏水性锚。疏水性锚优选地是脂质、脂肪酸、固醇、碳纳米管、多肽、蛋白质或氨基酸,例如胆固醇、棕榈酸或生育酚。在优选的实施方案中,一个或多个锚不是孔。
如两亲分子、共聚物或脂质等膜的组分可以进行化学修饰或官能化以形成一个或多个锚。下文更详细地论述合适的化学修饰和使膜组分官能化的合适方式的实施例。可以对任何比例的膜组分进行官能化,例如至少0.01%、至少0.1%、至少1%、至少10%、至少25%、至少50%或100%。
多核苷酸可以直接与膜偶联。用于将多核苷酸与膜偶联的一或多个锚优选地包含接头。一或多个锚可包含一或多个接头,如2、3、4个或更多个。可以使用一个接头将多于一个,如2个、3个、4个或更多个多核苷酸偶联到膜上。
优选接头包括(但不限于)聚合物,如多核苷酸、聚乙二醇(PEG)、多糖和多肽。这些接头可以是线性、分支链或环状的。举例来说,接头可以是环状多核苷酸。多核苷酸可以与环状多核苷酸接头上的互补序列杂交。
一或多个锚或一或多个接头可以包括可以进行剪切或分解的组分,如限制位点或光不稳定性基团。
官能化接头和其可以偶联分子的方式在本领域中是已知的。例如,用马来酰亚胺基团官能化的接头将与蛋白质中的半胱氨酸残基反应并且附接。在本发明的上下文中,蛋白质可以存在于膜中,可以是多核苷酸本身或可以用于偶联(或结合)多核苷酸。在下文中更详细地论述这一点。
可以使用“锁和钥”布置来避免多核苷酸的交联。各接头的仅一端可一起反应形成较长接头,且接头的另一端各自分别与多核苷酸或膜反应。此类接头描述于国际申请第PCT/GB10/000132号(公开为WO 2010/086602)中。
在下文论述的测序实施方案中,使用接头是优选的。如果在与孔相互作用时,多核苷酸是永久性地直接偶联到膜上,从某种意义上说所述多核苷酸不会解耦,则由于膜与孔之间的距离,测序运行不能继续到多核苷酸的端,因此一些序列数据将丢失。如果使用接头,则多核苷酸可以得到完全处理。
偶联可以是永久的或稳定的。换句话说,偶联可以使得多核苷酸在与孔相互作用时保持与膜偶联。
偶联可以是暂时的。换句话说,偶联可以使得多核苷酸在与孔相互作用时可以与膜解耦。对于如适体检测和多核苷酸测序等某些应用,暂时性质的偶联是优选的。如果永久性或稳定接头直接连接到多核苷酸的5’端或3’端,并且接头比膜与跨膜孔的通道之间的距离短,则在测序操作不能持续到多核苷酸的端时,一些序列数据将丢失。如果偶联是暂时的,然后当偶联的端随机变为不含膜时,则多核苷酸可以得到处理完全。形成永久性/稳定或暂时连接的化学基团在下文更详细地论述。使用胆固醇或脂肪酰基链,多核苷酸可以与两亲层或三嵌段共聚物膜暂时偶联。可以使用长度为6个到30个碳原子的任何脂肪酰基链,如十六烷酸。
在优选实施方案中,多核苷酸(如核酸)与两亲层(如三嵌段共聚物膜或脂质双层)偶联。先前已经用各种不同网络共享的策略进行核酸与合成脂质双层的偶联。这些总结在下文表3中。
表3
Figure GDA0003502100900000521
合成多核苷酸和/或接头可在合成反应中使用修饰胺基磷酸酯来官能化,所述修饰胺基磷酸酯容易地与直接添加合适锚定基团相容,所述锚定基团如,胆固醇、生育酚、棕榈酸、巯基、脂质和生物素基团。这些不同的附接化学物质为多核苷酸的附接提供了一套选择。每个不同的修饰基团以稍微不同的方式偶联多核苷酸,并且偶联未必总是永久性的,因此给予多核苷酸到膜的不同停留时间。暂时偶联的优势在上文论述。
多核苷酸与接头或与官能化膜的偶联还可可通过多种其它手段来实现,其限制条件为可向多核苷酸中添加互补反应性基团或锚定基团。先前已经报道了向多核苷酸的任一端添加反应性基团。可使用T4多核苷酸激酶和ATPγS向ssDNA或dsDNA的5'中添加巯基(Grant,G.P.和P.Z.Qin(2007年),“《一种用于在核酸的5’末端处附接氮氧化物自旋标记的简易方法(A facile method for attaching nitroxide spin labels at the 5’terminus of nucleic acids)》”,Nucleic Acids Res35(10):e77)。可以使用T4多核苷酸激酶和γ-[2-叠氮基乙基]-ATP或γ-[6-叠氮基己基]-ATP向ssDNA或dsDNA的5’-磷酸中添加叠氮基团。使用巯基或点击化学,含有巯基、碘乙酰胺OPSS或马来酰亚胺基团(与巯基具有反应性)或DIBO(二苯并环氧磷)或炔基(与叠氮化物具有反应性)中的任一个的系链,可共价连接于多核苷酸。可使用末端转移酶将修饰寡核苷酸并入到ssDNA的3'中,来添加更多样的化学基团选择(如生物素、巯基和荧光团)(Kumar,A.、P.Tchen等人(1988年),“《通过末端脱氧核苷酸转移酶对合成寡核苷酸探针进行非放射性标记(Nonradioactive labelingof synthetic oligonucleotide probes with terminal deoxynucleotidyltransferase)》”.Anal Biochem 169(2):376-82)。抗生蛋白链菌素/生物素和/或抗生蛋白链菌素/脱硫生物素偶联可以用于任何其它多核苷酸。使用链霉抗生物素蛋白/生物素和链霉抗生物素蛋白/脱硫生物素将多核苷酸偶联到膜上。也有可能,可使用末端转移酶(例如胆固醇或棕榈酸)向具有合适修饰的核苷酸的多核苷酸中直接添加锚。
一个或多个锚优选地通过杂交将多核苷酸偶联到膜上。杂交可以存在于一个或多个锚的任何部分中,如在一个或多个锚与多核苷酸之间,在一个或多个锚内或在一个或多个锚与膜之间。如上文所论述的,在一个或多个锚中的杂交允许以暂时方式进行偶联。举例来说,接头可包含两个或更多个杂交在一起的多核苷酸,如3、4或5个多核苷酸。一或多个锚可以与多核苷酸杂交。一个或多个锚可以直接与多核苷酸杂交,或直接与Y衔接子和/或附接于多核苷酸的前导序列杂交,或直接与附接于多核苷酸的发夹环衔接子杂交(如下文所论述的)。可替代地,一个或多个锚可以与一个或多个(如2个或3个)中间多核苷酸(或“夹板”)杂交,所述中间多核苷酸与多核苷酸杂交,与附接于多核苷酸的Y衔接子和/或前导序列杂交,或与附接于多核苷酸的发夹环衔接子杂交(如下文所论述的)。
一个或多个锚可以包括单链或双链多核苷酸。锚的一部分可以连接到单链或双链多核苷酸分析物上。已经使用T4 RNA连接酶I报道了短片ssDNA的连接(Troutt,A.B.,M.G.McHeyzer-Williams等人,(1992年),“《接合锚定的PCR:具有单侧特异性的简单扩增技术(Ligation-anchored PCR:a simple amplification technique with single-sidedspecificity)》”.Proc Natl Acad Sci U S A 89(20):9823-5)。可替代地,可以将单链或双链多核苷酸连接到双链多核苷酸上,然后通过热或化学变性分离两条链。对于双链多核苷酸,可以将一条单链多核苷酸添加到双链体的一个或两个端,或将双链多核苷酸添加到一个或两个端。为了将单链多核苷酸添加到双链多核苷酸中,这可以使用T4 RNA连接酶I实现,用于连接到单链多核苷酸的其它区。为了将双链多核苷酸添加到双链多核苷酸中,在多核苷酸上分别添加3’dA/dT尾部和所添加的多核苷酸(对于许多样品制备应用常规进行以防止多联体或二聚体形成)或使用通过限制性消化多核苷酸和连接相容的衔接子生成的“粘稠端”,则连接可以是“平端的”。接着,如果单链多核苷酸用于在5’端、3’端或两端(当双链多核苷酸用于接合时)处的接合或修饰,那么当双螺旋熔融时,各单链将具有5'或3'修饰。
如果多核苷酸是合成链,则可在化学合成多核苷酸期间结合一或多个锚。例如,可以使用具有附接于其的反应性基团的引物来合成多核苷酸。
腺苷酸化多核苷酸是接合反应中的中间物,其中单磷酸腺苷附接于多核苷酸的5’-磷酸。用于生成这种中间物的各种试剂盒是可获得的,如来自NEB的5’DNA腺苷酰化试剂盒。通过在反应中对于修饰核苷酸三磷酸进行取代ATP,那么可以向多核苷酸的5'中添加反应性基团(如巯基、胺、生物素、叠氮化物等)。还可以使用具有适当修饰的核苷酸(例如胆固醇或棕榈酸酯)的5’DNA腺苷酸化试剂盒将锚直接添加到多核苷酸中。
用于扩增基因组DNA区段的常见技术是使用聚合酶链式反应(PCR)。这里,使用两个合成的寡核苷酸引物,可以生成相同DNA区段的许多拷贝,其中对于每个拷贝,双链体中每条链的5’将是合成的多核苷酸。可以通过采用聚合酶将单个或多个核苷酸添加到单链或双链DNA的3’端。可以使用的聚合酶的实例包含但不限于末端转移酶、Klenow和大肠杆菌Poly(A)聚合酶)。通过在反应中用ATP取代修饰的三磷酸核苷酸,然后可以将如胆固醇、硫醇、胺、叠氮化物、生物素或脂质等锚结合到双链多核苷酸中。因此,扩增的多核苷酸的每个拷贝都含有锚。
理想地,多核苷酸与膜偶联而不必使多核苷酸官能化。这可以通过将一种或多种如多核苷酸结合蛋白或化学基团等锚偶联到膜上并且使一种或多种锚与多核苷酸相互作用或通过使膜功能化来实现。一个或多个锚可以通过本文描述的任何方法偶联到膜。特定来说,一或多个锚可包含一或多个接头,如马来酰亚胺官能化接头。
在此实施例中,多核苷酸通常是RNA、DNA、PNA、TNA或LNA,并且可以是双链或单链的。此实施例特别适用于基因组DNA多核苷酸。
所述一个或多个锚可以包括与单链或双链多核苷酸、多核苷酸内的特定核苷酸序列或多核苷酸内修饰的核苷酸的模式,或多核苷酸上存在的任何其它配体偶联、结合或相互作用的任何基团。
用于锚中的合适结合蛋白包括(但不限于):大肠杆菌单链结合蛋白、P5单链结合蛋白、T4 gp32单链结合蛋白、TOPO V dsDNA结合区、人类组蛋白、大肠杆菌HU DNA结合蛋白,和其它古细菌、原核或真核单链或双链多核苷酸(或核酸)结合蛋白,包括下文所列的那些。
特异性核苷酸序列可以是由转录因子、核糖体、核酸内切酶、拓扑异构酶或复制起始因子识别的序列。修饰核苷酸的模式可以是甲基化模式或损坏模式。
所述一个或多个锚可以包括与多核苷酸偶联、结合、插入或相互作用的任何基团。基团可通过静电、氢结合或范德华力相互作用插入多核苷酸中或与其相互作用。此类基团包括赖氨酸单体、聚赖氨酸(其将与ssDNA或dsDNA相互作用)、溴化乙锭(其插入dsDNA)、通用碱基或通用核苷酸(其可与任何多核苷酸杂交)和锇络合物(其可与甲基化碱基反应)。因此,多核苷酸可以使用附接到膜的一或多个通用核苷酸而与膜偶联。各通用核苷酸可使用一或多个接头而与膜偶联。通用核苷酸优选地包含以下核碱基中的一个:次黄嘌呤、4-硝基吲哚、5-硝基吲哚、6-硝基吲哚、甲酰基吲哚、3-硝基吡咯、硝基咪唑、4-硝基吡唑、4-硝基苯并咪唑、5-硝基吲唑、4-氨基苯并咪唑或苯基(C6-芳环)。通用核苷酸更优选地包括以下核苷中的一个:2’-脱氧肌苷、肌苷、7-脱氮-2’-脱氧肌苷、7-脱氮-肌苷、2-氮杂-脱氧肌苷、2-氮杂-肌苷、2-O’-甲基肌苷、4-硝基吲哚2’-脱氧核苷、4-硝基吲哚核苷、5-硝基吲哚2’--脱氧核苷、5-硝基吲哚核苷、6-硝基吲哚2’--脱氧核苷、6-硝基吲哚核苷、3-硝基吡咯2’--脱氧核苷、3-硝基吡咯核苷、次黄嘌呤的非环糖类似物、硝基咪唑2’--脱氧核苷、硝基咪唑核苷、4-硝基吡唑2’--脱氧核苷、4-硝基吡唑核苷、4-硝基苯并咪唑2’--脱氧核苷、4-硝基苯并咪唑核苷、5-硝基吲唑2’--脱氧核苷、5-硝基吲唑核苷、4-氨基苯并咪唑2’--脱氧核苷、4-氨基苯并咪唑核苷、苯基C-核苷、苯基C-2’-脱氧核糖基核苷、2’-脱氧烟云杯伞素、2’-脱氧异鸟苷、K-2’-脱氧核苷、P-2’-脱氧核苷和吡咯烷。通用核苷酸更优选地包括2’-脱氧肌苷。通用核苷酸更优选地是IMP或dIMP。通用核苷酸最优选地是dPMP(2'-脱氧-P-核苷单磷酸)或dKMP(N6-甲氧基-2,6-二氨基嘌呤单磷酸)。
一或多个锚可通过Hoogsteen氢键(其中两个核碱基通过氢键保持在一起)或反向Hoogsteen氢键(其中一个核碱基相对于其它核碱基旋转180°)与多核苷酸偶联(或结合)。例如,一或多个锚可以包括与多核苷酸形成Hoogsteen氢键或反向Hoogsteen氢键的一或多个核苷酸、一或多个寡核苷酸或一或多个多核苷酸。这些类型的氢键允许第三多核苷酸链缠绕双链螺旋并且形成三链体。通过与双链双螺旋形成三链螺旋,一或多个锚可与双链多核苷酸偶联(或结合)。
在此实施例中,至少1%、至少10%、至少25%、至少50%或100%的膜组分可以进行官能化。
当一个或多个锚包括蛋白质时,所述一或多个锚可以能够直接锚定到膜中而无需进一步官能化,例如当其已具有与膜相容的外部疏水区时。此类蛋白质的实例包括(但不限于)跨膜蛋白质、膜内蛋白质和膜蛋白。可替代地,蛋白质可以用与膜相容的遗传融合的疏水区表达。这种疏水蛋白质区是本领域已知的。
优选地在递送到膜之前将一种或多种锚与多核苷酸混合,但是一种或多种锚可以与膜接触并且随后与多核苷酸接触。
在另一方面,可以使用上文所描述的方法使多核苷酸官能化,使得其可以被特异性结合基团识别。具体地说,多核苷酸可以用配体进行官能化,所述配体如,生物素(用于结合于抗生蛋白链菌素)、直链淀粉(用于结合于麦芽糖结合蛋白或融合蛋白)、Ni-NTA(用于结合于聚组氨酸或聚组氨酸标签的蛋白质)或肽(如抗原)。
根据优选的实施例,一个或多个锚可以用于当多核苷酸附接到前导序列时将多核苷酸与膜偶联,所述前导序列优选地螺旋到孔中。前导序列在下文更详细地论述。较佳地,多核苷酸连接(如接合)于优选地螺旋到孔中的前导序列。这种前导序列可以包括同聚多核苷酸或无碱基区。前导序列通常设计成直接与一或多个锚杂交,或通过一或多个中间多核苷酸(或夹板)与所述一或多个锚杂交。在此类情况下,一或多个锚通常包含与前导序列中的序列或一或多个中间多核苷酸(或夹板)中的序列互补的多核苷酸序列。在此类情况下,一个或多个夹板通常包括与前导序列中的序列互补的多核苷酸序列。
上文论述的用于将多核苷酸偶联到如两亲层等膜上的任何方法当然可以应用于其它多核苷酸和膜组合。在一些实施方案中,氨基酸、肽、多肽或蛋白质与如三嵌段共聚物层或脂质双层等两亲层偶联。可以获得这些多核苷酸的化学附接的各种方法。化学附接中使用的分子的实例是EDC(1-乙基-3-[3-二甲基胺基丙基]碳化二亚胺盐酸盐)。还可使用可商购的试剂盒(Thermo Pierce,产品号22980),来向多核苷酸的5'中添加反应性基团。合适的方法包含但不限于使用组氨酸残基和Ni-NTA的暂时亲和力附接,以及通过反应性半胱氨酸、赖氨酸或非天然氨基酸的更稳健的共价附接。
多核苷酸表征
可以研究任何数量的多核苷酸。例如,本发明的方法可以涉及表征两种或更多种多核苷酸,如3种或更多种、4种或更多种、5种或更多种、6种或更多种、7种或更多种、8种或更多种、9种或更多种、10种或更多种、20种或更多种、30种或更多种、50种或更多种、100种或更多种、500种或更多种、1,000种或更多种、5,000种或更多种、10,000种或更多种、100,000种或更多种、1000,000种或更多种、或5000,000种或更多种多核苷酸。可以使用相同的微粒或不同的微粒递送两种或更多种多核苷酸。
微粒是微观粒子,其大小通常以微米(μm)测量。微粒也可以被称为微球或微珠。微粒可以是纳米颗粒。纳米颗粒是微观颗粒,其大小通常以纳米(nm)测量。
微粒通常具有约0.001μm到约500μm的粒径。例如,纳米颗粒可以具有约0.01μm到约200μm或约0.1μm到约100μm的粒径。更常见的是,微粒具有约0.5μm到约100μm,或例如约1μm到约50μm的粒径。微粒可以具有约1nm到约1000nm,如约10nm到约500nm、约20nm到约200nm或约30nm到约100nm的粒径。
如果表征两种或更多种多核苷酸,它们可以彼此不同。两种或更多种多核苷酸可以是相同多核苷酸的两种或更多种实例。这允许校对。
多核苷酸可以是天然存在的或人工的。例如,所述方法可以用于验证两种或更多种制造的寡核苷酸的序列。所述方法通常在体外进行。
所述方法可以涉及测量每种多核苷酸的两个、三个、四个或五个或更多个特性。一个或多个特性优选地是选自:(i)多核苷酸的长度,(ii)多核苷酸的一致性,(iii)多核苷酸的序列,(iv)多核苷酸的二级结构,以及(v)多核苷酸是否被修饰。可以根据本发明来测量(i)到(v)的任何组合,如:{i}、{ii}、{iii}、{iv}、{v}、{i,ii}、{i,iii}、{i,iv}、{i,v}、{ii,iii}、{ii,iv}、{ii,v}、{iii,iv}、{iii,v}、{iv,v}、{i,ii,iii}、{i,ii,iv}、{i,ii,v}、{i,iii,iv}、{i,iii,v}、{i,iv,v}、{ii,iii,iv}、{ii,iii,v}、{ii,iv,v}、{iii,iv,v}、{i,ii,iii,iv}、{i,ii,iii,v}、{i,ii,iv,v}、{i,iii,iv,v}、{ii,iii,iv,v}或{i,ii,iii,iv,v}。
对于(i),可以例如通过确定多核苷酸与孔之间的相互作用的数量或多核苷酸与孔之间的相互作用的持续时间来测量多核苷酸的长度。
对于(ii),可以以多种方式来测量多核苷酸的一致性。可以结合测量多核苷酸的序列或不测量多核苷酸的序列来测量多核苷酸的一致性。前者是很简单的;测序多核苷酸并且由此进行鉴定。可以以若干方式进行后者。举例来说,可测量多核苷酸中的特定基序的存在(而不测量多核苷酸的残余序列)。可替代地,所述方法中的特定电子信号和/或光学信号的测量可以鉴定来自特定来源的多核苷酸。
对于(iii),可如先前所描述来测定多核苷酸的序列。在Stoddart D等人,《美国国家科学院院刊(Proc Natl Acad Sci)》,2012年,第106卷,第19期,第7702到7707页;Lieberman KR等人,《美国化学会志(J Am Chem Soc)》,2010年,132(50):17961-72,以及国际申请号WO 2000/28312中描述了适当的测序方法,尤其是使用电测量的测序方法。
对于(iv),可以以多种方式测量二级结构。例如,如果所述方法涉及电测量,则可以使用停留时间的变化或流过孔的电流的变化来测量二级结构。这允许区分单链多核苷酸和双链多核苷酸的区。
对于(v),可测量是否存在任何修饰。所述方法优选地包括,用一或多个蛋白质或用一或多个标记、标签或间隔区确定多核苷酸是否通过甲基化、通过氧化、通过损坏来修饰。特异性修饰将引起与可以使用下文所描述的方法测量的孔的特异性相互作用。例如,可以基于在孔与各核苷酸相互作用期间流过孔的电流将甲基胞嘧啶与胞嘧啶区分开。
可以使用适合于研究膜/孔系统的任何设备来进行所述方法,其中孔存在于膜中。可以使用适合于跨膜孔感测的任何设备来进行所述方法。例如,设备包括腔室,所述腔室包括水溶液和将腔室分成两个区段的屏障。屏障通常具有开孔,在开孔中形成含有孔的膜。可替代地,屏障形成其中存在孔的膜。
可以使用在国际申请号PCT/GB08/000562(WO 2008/102120)中描述的设备执行所述方法。
可以进行各种不同类型的测量。这包含但不限于:电测量和光学测量。在Am.Chem.Soc.2009,131 1652-1653公开了涉及荧光测量的适当光学方法。可能的电测量包含:电流测量、阻抗测量、隧道测量(Ivanov AP et al.,Nano Lett.2011Jan 12;11(1):279-85)和FET测量(国际申请WO 2005/124888)。可以将光学测量与点测量组合(Soni GV等人,《科学仪器综述(Rev Sci Instrum)》,2010年1月;81(1):014301)。测量可以是跨膜电流测量,如对流过孔的离子电流的测量。
可以使用如以下文献中描述的标准单通道记录设备来进行电测量:
Stoddart D等人,《美国国家科学院院刊(Proc Natl Acad Sci)》,2012年,第106卷,第19期,第7702到7707页;Lieberman KR等人,《美国化学会志(J Am Chem Soc)》,2010;132(50):17961-72,和国际申请
WO 2000/28312。可替代地,可以使用多通道系统来进行电测量,
例如如国际申请号WO 2009/077734和国际申请号WO 2011/067559中所描述的。
所述方法优选地在跨膜施加电势的情况下进行。所施加的电势可以为电压电势。可替代地,所施加的电势可以为化学电势。此的实例是在膜(如两亲层)两端使用盐梯度。盐梯度在Holden等人,《美国化学学会期刊》2007年7月11日;129(27):8650-5中公开。在一些例子中,在多核苷酸相对于孔移动时穿过孔的电流用于评估或确定多核苷酸的序列。这是链测序。
所述方法可以涉及在多核苷酸相对于孔移动时测量穿过孔的电流。因此,所述设备还可以包括能够施加电势并且测量跨膜和孔的电信号的电路。可以使用贴片钳或电压钳来进行所述方法。所述方法优选地涉及使用电压钳。
在优选实施方案中,所述方法包括:
(a)使所述/每个修饰的多核苷酸与跨膜孔接触,使得所述/每个多核苷酸的至少一条链移动通过所述孔;和
(b)在所述/每个多核苷酸的至少一条链相对于所述孔移动时,测量穿过所述孔的电流,其中所述电流指示所述/每个多核苷酸的至少一条链的一或多个特征,且从而表征所述修饰/模板多核苷酸。
本发明的方法可以涉及在多核苷酸相对于孔移动时测量穿过孔的电流。用于测量通过跨膜蛋白孔的离子电流的适当条件在本领域中是已知的并且在实施例中公开。所述方法通常在跨膜和孔施加电压的情况下进行。所使用的电压通常是+5V到-5V,如+4V到-4V、+3V到-3V,或+2V到-2V。所使用的电压通常是-600mV到+600mV或-400mV到+400mV。所使用的电压优选地在具有下限和上限的范围内,下限选自:-400mV、-300mV、-200mV、-150mV、-100mV、-50mV、-20mV和0mV,上限独立地选自:+10mV、+20mV、+50mV、+100mV、+150mV、+200mV、+300mV和+400mV。所使用的电压更优选地在100mV到240mV的范围内,并且最优选在120mV到220mV的范围内。通过使用增加的施加电势,可以通过孔增加不同核苷酸之间的区分。
通常在存在任何电荷载流子的情况下进行所述方法,所述电荷载流子如金属盐,例如碱金属盐;卤盐,例如如碱金属氯化物盐等氯化物盐。电荷载流子可以包含离子液体或有机盐,例如四甲基氯化铵、三甲基苯基氯化铵、苯基三甲基氯化铵或1-乙基-3-甲基氯化咪唑鎓。在上文论述的示例性设备中,盐存在于腔室中的水溶液中。通常使用氯化钾(KCl)、氯化钠(NaCl)、氯化铯(CsCl),或亚铁氰化钾和铁氰化钾的混合物。优选的KCl、NaCl以及亚铁氰化钾和铁氰化钾的混合物。电荷载流子可以是跨膜不对称的。例如,电荷载流子的类型和/或浓度可以在膜的各侧上不同。
盐浓度可以是饱和的。盐浓度可以是3M或更低,并且通常0.1到2.5M、0.3到1.9M、0.5到1.8M、0.7到1.7M、0.9到1.6M或1M到1.4M。盐浓度优选地是150mM到1M。优选地使用至少0.3M的盐浓度来进行所述方法,如至少0.4M、至少0.5M、至少0.6M、至少0.8M、至少1.0M、至少1.5M、至少2.0M、至少2.5M或至少3.0M。高盐浓度提供高信噪比并且允许在正常电流波动的背景下识别指示核苷酸存在的电流。
通常在存在缓冲液的情况下进行所述方法。在上文论述的示例性设备中,缓冲液存在于腔室中的水溶液中。在本发明的方法中可以使用任何缓冲液。通常,缓冲液是磷酸盐缓冲液。其它合适的缓冲液是HEPES和Tris-HCl缓冲液。通常在以下的pH下来进行所述方法:4.0到12.0、4.5到10.0、5.0到9.0、5.5到8.8、6.0到8.7或7.0到8.8或7.5到8.5。所使用的pH优选地为约7.5。
可以在以下温度下进行所述方法:0℃到100℃、15℃到95℃、16℃到90℃、17℃到85℃、18℃到80℃、19℃到70℃或20℃到60℃。通常在室温下进行所述方法。任选地在支持酶功能的温度进行所述方法,如约37℃下进行。
试剂盒
本发明还提供了用于修饰模板多核苷酸的试剂盒。该试剂盒包含(a)如上定义的MuA底物群,(b)MuA转座酶和(c)转位酶。上文参考本发明方法和产品论述的实施方案中任一个同样适用于试剂盒。
试剂盒可以进一步包括膜的组分,如两亲层或脂质双层的组分。试剂盒可以进一步包含跨膜孔的组分。该试剂盒可以进一步包括分子刹车。上面讨论了合适的膜、孔和分子刹车。
所述试剂盒可进一步包含Y衔接子,其包含前导序列和/或能够将衔接子偶联至膜的一个或多个锚。上面讨论了合适的Y衔接子、前导序列和锚。
本发明的试剂盒可以另外包括一种或多种其它试剂或仪器,所述试剂或仪器能够实施上述实施方案中的任一个。此类试剂或仪器包含以下各项中的一项或多项:一种或多种适当的缓冲液(水溶液)、用于从受试者获得样品的装置(如包括针的容器或仪器)、用于扩增和/或表达多核苷酸序列的装置、如上文限定的膜或者电压钳或贴片钳设备。试剂可以以干态存在于试剂盒中,使得流体样品使试剂再悬浮。试剂盒还可以任选地包括使试剂盒能够在本发明的方法使用的说明书或关于所述方法可以用于哪些患者的详情。试剂盒可以任选地包括核苷酸。
以下实施例说明本发明。
实施例1
MuA以四聚体的形式与转座子结合,非常稳定;在转座子的链转移后保持紧密结合。如果未从DNA中除去MuA,则这可以使用纳米孔系统抑制表征。通过加热至75℃可以除去MuA。然而,这依赖于使用热循环仪或水浴并且可能损坏溶液中的其他组分。在这里,我们描述了一种替代技术,用于在不需要加热反应的情况下使用解旋酶去除MuA。Hel308Mbu-E284C/S615C-STrEP(SEQ ID NO:10,具有突变E284C/S615C,在其C末端连接有链霉亲和素标签)是一种进程性解旋酶,其与单链DNA结合并在3'至5'方向移动。当转座子在底链上具有3'突出端时,Hel308Mbu-E284C/S615C-STrEP(SEQ ID NO:10,具有突变E284C/S615C,在其C末端连接有链霉亲和素标签)可以结合并且在沿着DNA移动时,迫使MuA复合物与DNA分离。
材料和方法
酶制剂:
使用10mM DTT在2ml蛋白质低结合Eppendorf中降低Hel308Mbu-E284C/S615C-STrEP(C)(20uM,SEQ ID NO:10,具有突变E284C/S615C,在其C末端连接有链霉亲和素标签)并在Hula振荡器(ThermoFisher Scientific)上旋转1小时,10转/分钟,无振动。然后根据制造商的方案,使用Zeba旋转脱盐柱7K MWCO,0.5ml(ThermoFisher Scientific)将酶缓冲液交换到100mM磷酸钠,500mM NaCl,5mM EDTA和0.1%Tween-20pH8.0中。将样品稀释至10μM并加入50μM 1,11-双(马来酰亚胺基)三甘醇。然后将样品在Hula振荡器上旋转另外2小时。这导致了一个封闭的复合解旋酶,它能够在3'末端加载到DNA上。
衔接子退火
转座子顶链的序列是(SEQ ID NO:115)。将其与SEQ ID NO:116退火以形成转座子1或与SEQ ID NO:117退火以形成转座子2,其在底链上具有3'突出端。
转座子顶链也与转座子前导序列退火(30个iSpC3间隔区在5'末端连接在SEQ IDNO:118的3'末端,其3'末端连接到4个iSp18间隔区的5'末端,其在3'末端连接SEQ ID NO:119的5'末端。
转座子(10uM)在50mM NaCl,10mM Tris.HCl pH8.0中退火。将转座子序列加热至95℃2分钟,然后缓慢冷却(每0.1℃降低6秒)至4℃。
转座体形成
将转座子1、转座子2和前导转座子各自在40ul中混合至2uM,用浓MuA转座酶(20ul,1.1mg/ml,ThermoFisher Scientific)在25mM Tris.HCl pH8,110mM NaCl,0.5mMEDTA,10%甘油和0.05%Triton-X100中混合。然后将它们在30℃温育90分钟,分别以2μM形成转座体1、转座体2和前导体转座体。
转位
将转座体1和转座体2各自与1.5μg PhiX174RFI DNA(New England Biolabs)在25mM Tris.HCl pH8,110mM NaCl和10mM MgCl2中在0.2ml PCR管中以30ul反应混合至50nM。将每个反应物在室温下温育2分钟,然后分成两半,形成3管,每管10μl。将每个转座体的1个管在75℃温育5分钟,将每个转座体的1个管在室温下放置5分钟,不添加任何物质。将Hel308Mbu-E284C/S615C-STrEP(C)(1uM)与10mM ATP(Sigma-Aldrich)一起加入到最终管中,并在室温下温育5分钟。然后在Agilent 2100Bioanalyser 12,000bp设置下分析1ul每种反应,以及1ul未修饰的PhiX。
电生理学
用1.5μgλDNA(New England Biolabs)和120nM前导转座体在25mM Tris.HCl pH8,110mM NaCl和10mM MgCl2中制备60ul样品,并通过倒置混合样品。将样品在室温下温育10分钟。然后将样品分成3组20ul反应。将nH20(4ul,ThermoFisher Scientific)加入到样品1中,并将样品在75℃下加热10分钟。将Hel308Mbu-E284C/S615C-STrEP(C)(2ul,10uM)和ATP(2ul,100mM,Sigma-Aldrich)加入到样品2中,并将其在室温下温育10分钟。将nH20(4ul,ThermoFisher Scientific)加入到样品3中,并将样品在室温下温育10分钟。将AgencourtAMPure XP SPRI珠(24ul)加入每个样品(1-3)中,并将样品在室温下温育5分钟。然后将样品转移到磁架上并在室温下温育2分钟。然后除去上清液并从每个样品中丢弃。向每个样品中加入缓冲液(50μl,750mM NaCl,10%PEG8000和50mM Tris.HCl pH8)。然后取出洗涤缓冲液并从每个样品中丢弃。然后将缓冲液1(6ul,10mM Tris.HCl,20mM NaCl)加入每个样品中,然后混合每个样品以重悬珠子。然后将每个样品旋转下来并返回磁架。然后除去6ul各样品,并向每个样品中加入1.5μl缓冲液2(1μM的SEQ ID NO:20'(其3'末端连接有6个iSp18间隔区),750mM KCl,5mM EDTA,125mM Kpi pH8)。然后将样品在室温下温育10分钟。向每个样品中加入T4 Dda-(E94C/C109A/C136A/A360C)(SEQ ID NO:97,具有突变E94C/C109A/C136A/A360C,然后(ΔM1)G1G2(其中(ΔM1)G1G2=M1的缺失然后添加G1和G2,1.25ul,5μM)、25mM磷酸钾、150mM KCl、5%甘油、1mM EDTA、pH7,然后将各样品在室温下温育5分钟。然后向每个样品中加入缓冲液(1.25μl,800μMTMAD),然后将各自在室温下温育5分钟。最后,向每个样品中加入6ul燃料混合物(75mM ATP,75mM MgCl2)和284ul缓冲液(25mM磷酸钾,500mM氯化钾,pH8)。
从插入在缓冲液(25mM磷酸钾缓冲液,150mM亚铁氰化钾(II),150mM铁氰化钾(III),pH 8.0)中的嵌段共聚物中的的单一MspA纳米孔获取电测量。在达到插入在嵌段共聚物中的单一孔之后,随后缓冲液(pH 8.0的2mL,25mM磷酸钾缓冲液、150mM亚铁(II)氰化钾、150mM铁(III)氰化钾,)流过系统以移除任何过量的MspA纳米孔。然后使pH8.0的150μL的500mM KCl、25mM磷酸钾流过系统。10分钟后,再将150uL上述样品流入单个纳米孔实验系统。实验在-140mV下进行,并且监测解旋酶控制的DNA移动。
结果
安捷伦分析
当没有从转座体1(图1中标记为1的线)或转座体2(图1,标记为2的线)中移除MuA转座体时,例如其中两个转座体在室温下孵育(样品3)的对照,未观察到上标记(标记为Y)和下标记(标记为X)之间的痕迹上的峰值。这是因为MuA仍然与DNA结合,这阻止了转座体(1和2)进入Agilent 2100Bioanalyser系统的凝胶基质。
当样品加热至75℃10分钟时,在上部(Y)和下部(X)标记之间的两个转座体(图2(转座体1)和图3(转座体2))都可以看到峰。这表示线性化的PhiX没有与其结合的MuA转座酶。
用Hel308Mbu-E284C/S615C-STrEP(C)处理不会导致转座体1的PhiX峰,因为酶没有3'突出端加载,因此MuA保持结合(参见图4)。对于转座体2,在加入Hel308Mbu-E284C/S615C-STrEP(C)后观察到PhiX峰,因为转座体2具有3'突出端以使酶加载到其上(参见图5)。这表明Hel308能够成功地从转座子中去除MuA转座酶。
图6显示用Hel308Mbu-E284C/S615C-STrEP(C)处理和热处理后的转座体2。两个PhiX峰具有相似的高度,表明Hel308在去除MuA转座酶时与热一样有效。
电生理学分析
如上所述进行电生理学实验,并比较样品3(在没有Hel308Mbu-E284C/S615C-STrEP(C)的情况下在室温下孵育)、样品2(在75℃温育10分钟)和样品1(在室温下用Hel308Mbu-E284C/S615C-STrEP(C)孵育,使用具有3'突出端的转座体)的实验吞吐量(千碱基/每纳米孔/小时)。图11显示样品1-3的吞吐量图。样品3显示约20kb/纳米孔/小时的吞吐量,其显著低于样品1和2,表明由于不去除MuA转座酶,使用纳米孔系统的表征被抑制。样品2(热处理)和样品3产生了高得多的吞吐量值,对样品2大约80kb/纳米孔/小时,对样品3为85kb/纳米孔/小时。这表明使用Hel308Mbu-E284C/S615C-STrEP(C)去除MuA转座酶与热处理一样有效。使用Hel308Mbu-E284C/S615C-STrEP(C)去除MuA转座酶导致使用纳米孔系统的改善的表征。
实施例2
该实施例描述了使用许多不同的转位酶来去除MuA转座酶。
材料和方法
衔接子退火
将由SEQ ID NO:117和121组成的MuA衔接子在10mM Tris-HCl(pH7.5),50mM NaCl中,以2℃/分钟从95℃至22℃退火至10μM。该衔接子含有最小的MuA识别序列,具有预先形成的5'底链襟翼,以及顶部链上的12nt 5'尾和底部链上的10nt 3'尾。
转座体形成
形成转座体复合物,但加入1μlMuA衔接子,4.5μl无核酸酶水,2μl的5x转座子缓冲液(125mM Tris pH 8,550mM NaCl,2.5mM EDTA,50%甘油,0.25%Triton-X100)和2.5ul浓缩的MuA转座酶(Thermofisher)。然后将混合物在30℃下温育1.5小时。
转位
然后进行含有10μl的5x转座酶缓冲液(125mM Tris pH8,550mM NaCl,50mMMgCl2),5μl转座体,2.5μg的PhiXRFI(NEB)和无核酸酶至50μl的转位反应,在室温下持续10分钟。10分钟后,加入6.25μl100mM rATP,将反应物分成5×11.25μl。向样品(i)和(ii)加入1.25ul无核酸酶的水;向样品(iii)加入1.25μl的Hel308Mbu-E284C-STrEP(C)(具有突变E284C的SEQ ID NO:10,其C末端连接有链霉亲和素标签);向样品(iv)加入1.25ul T4 Dda-(E94C/F98W/C109A/C136A/A360C)(具有突变E94C/F98W/C109A/C136A/A360C的SEQ ID NO:97,然后是(ΔM1)G1G2(其中(ΔM1))G1G2=M1的缺失,然后加入G1和G2);向样品(v)加入1.25μl的UvrDEco-(E117C/M380C)-STrEP(具有突变E177C/M380C的SEQ ID NO:122,其C末端连接有链霉亲和素标签)。然后将样品(i)、(iii)、(iv)和(v)在室温下放置10分钟,同时将样品(ii)在75℃下放置10分钟。然后将所有样品加载到12000Agilent DNA芯片上以寻找标签化产品。
结果
图7至10显示了样品(i)-(v)的许多安捷伦痕迹。样品(i)是对照,没有加入转位酶,样品不加热。图7至10均显示对照显示该样品未观察到标记峰,这是因为MuA仍然与DNA结合,这阻止了转座体移动进入Agilent 2100生物分析仪系统的凝胶基质。图7还显示样品(ii)(线2),其显示当将样品加热至75℃以除去MuA转座酶时的明显标记峰。
图8显示样品(iii,线3)和对照样品(i,线1)。当用Hel308Mbu-E284C-STrEP(C)加热样品以除去MuA转座酶时,样品(iii)显示清晰的标记峰。这表明Hel308Mbu-E284C-STrEP(C)能够成功地从转座子中去除MuA转座酶。
图9显示样品(iv,线4)和对照样品(i,线1)。当样品用T4Dda-(E94C/F98W/C109A/C136A/A360C)加热以除去MuA转座酶时,样品(iv)显示清晰的标记峰。这表明T4 Dda-(E94C/F98W/C109A/C136A/A360C)能够成功地从转座子中去除MuA转座酶。
图10显示样品(v,线5)和对照样品(i,线1)。当样品用UvrD Eco-(E117C/M380C)-STrEP加热以除去MuA转座酶时,样品(v)显示清晰的标记峰。这表明UvrD Eco-(E117C/M380C)-STrEP能够成功地从转座子中去除MuA转座酶。
序列表
<110> 牛津纳米孔技术公司
<120> 方法
<130> N408272WO
<140> TBC
<141> 2017-05-25
<150> GB 1609220.7
<151> 2016-05-25
<160> 122
<170> PatentIn version 3.5
<210> 1
<211> 558
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 耻垢分枝杆菌卟啉A突变体
(D90N/D91N/D93N/D118R/D134R/E139K)
<400> 1
atgggtctgg ataatgaact gagcctggtg gacggtcaag atcgtaccct gacggtgcaa 60
caatgggata cctttctgaa tggcgttttt ccgctggatc gtaatcgcct gacccgtgaa 120
tggtttcatt ccggtcgcgc aaaatatatc gtcgcaggcc cgggtgctga cgaattcgaa 180
ggcacgctgg aactgggtta tcagattggc tttccgtggt cactgggcgt tggtatcaac 240
ttctcgtaca ccacgccgaa tattctgatc aacaatggta acattaccgc accgccgttt 300
ggcctgaaca gcgtgattac gccgaacctg tttccgggtg ttagcatctc tgcccgtctg 360
ggcaatggtc cgggcattca agaagtggca acctttagtg tgcgcgtttc cggcgctaaa 420
ggcggtgtcg cggtgtctaa cgcccacggt accgttacgg gcgcggccgg cggtgtcctg 480
ctgcgtccgt tcgcgcgcct gattgcctct accggcgaca gcgttacgac ctatggcgaa 540
ccgtggaata tgaactaa 558
<210> 2
<211> 184
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 耻垢分枝杆菌卟啉A突变体
(D90N/D91N/D93N/D118R/D134R/E139K)
<400> 2
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asn Asn Gly Asn Ile Thr Ala
85 90 95
Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Arg Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Arg Val Ser Gly Ala Lys Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 3
<211> 885
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> alpha-溶血素突变体E111N/K147N
<400> 3
atggcagatt ctgatattaa tattaaaacc ggtactacag atattggaag caatactaca 60
gtaaaaacag gtgatttagt cacttatgat aaagaaaatg gcatgcacaa aaaagtattt 120
tatagtttta tcgatgataa aaatcacaat aaaaaactgc tagttattag aacaaaaggt 180
accattgctg gtcaatatag agtttatagc gaagaaggtg ctaacaaaag tggtttagcc 240
tggccttcag cctttaaggt acagttgcaa ctacctgata atgaagtagc tcaaatatct 300
gattactatc caagaaattc gattgataca aaaaactata tgagtacttt aacttatgga 360
ttcaacggta atgttactgg tgatgataca ggaaaaattg gcggccttat tggtgcaaat 420
gtttcgattg gtcatacact gaactatgtt caacctgatt tcaaaacaat tttagagagc 480
ccaactgata aaaaagtagg ctggaaagtg atatttaaca atatggtgaa tcaaaattgg 540
ggaccatacg atcgagattc ttggaacccg gtatatggca atcaactttt catgaaaact 600
agaaatggtt ctatgaaagc agcagataac ttccttgatc ctaacaaagc aagttctcta 660
ttatcttcag ggttttcacc agacttcgct acagttatta ctatggatag aaaagcatcc 720
aaacaacaaa caaatataga tgtaatatac gaacgagttc gtgatgatta ccaattgcat 780
tggacttcaa caaattggaa aggtaccaat actaaagata aatggacaga tcgttcttca 840
gaaagatata aaatcgattg ggaaaaagaa gaaatgacaa attaa 885
<210> 4
<211> 293
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> alpha-溶血素突变体E111N/K147N
<400> 4
Ala Asp Ser Asp Ile Asn Ile Lys Thr Gly Thr Thr Asp Ile Gly Ser
1 5 10 15
Asn Thr Thr Val Lys Thr Gly Asp Leu Val Thr Tyr Asp Lys Glu Asn
20 25 30
Gly Met His Lys Lys Val Phe Tyr Ser Phe Ile Asp Asp Lys Asn His
35 40 45
Asn Lys Lys Leu Leu Val Ile Arg Thr Lys Gly Thr Ile Ala Gly Gln
50 55 60
Tyr Arg Val Tyr Ser Glu Glu Gly Ala Asn Lys Ser Gly Leu Ala Trp
65 70 75 80
Pro Ser Ala Phe Lys Val Gln Leu Gln Leu Pro Asp Asn Glu Val Ala
85 90 95
Gln Ile Ser Asp Tyr Tyr Pro Arg Asn Ser Ile Asp Thr Lys Asn Tyr
100 105 110
Met Ser Thr Leu Thr Tyr Gly Phe Asn Gly Asn Val Thr Gly Asp Asp
115 120 125
Thr Gly Lys Ile Gly Gly Leu Ile Gly Ala Asn Val Ser Ile Gly His
130 135 140
Thr Leu Asn Tyr Val Gln Pro Asp Phe Lys Thr Ile Leu Glu Ser Pro
145 150 155 160
Thr Asp Lys Lys Val Gly Trp Lys Val Ile Phe Asn Asn Met Val Asn
165 170 175
Gln Asn Trp Gly Pro Tyr Asp Arg Asp Ser Trp Asn Pro Val Tyr Gly
180 185 190
Asn Gln Leu Phe Met Lys Thr Arg Asn Gly Ser Met Lys Ala Ala Asp
195 200 205
Asn Phe Leu Asp Pro Asn Lys Ala Ser Ser Leu Leu Ser Ser Gly Phe
210 215 220
Ser Pro Asp Phe Ala Thr Val Ile Thr Met Asp Arg Lys Ala Ser Lys
225 230 235 240
Gln Gln Thr Asn Ile Asp Val Ile Tyr Glu Arg Val Arg Asp Asp Tyr
245 250 255
Gln Leu His Trp Thr Ser Thr Asn Trp Lys Gly Thr Asn Thr Lys Asp
260 265 270
Lys Trp Thr Asp Arg Ser Ser Glu Arg Tyr Lys Ile Asp Trp Glu Lys
275 280 285
Glu Glu Met Thr Asn
290
<210> 5
<211> 184
<212> PRT
<213> 耻垢分枝杆菌(Mycobacterium smegmatis)
<400> 5
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Ala
85 90 95
Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 6
<211> 184
<212> PRT
<213> 耻垢分枝杆菌(Mycobacterium smegmatis)
<400> 6
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Gly
85 90 95
Pro Pro Phe Gly Leu Glu Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 7
<211> 183
<212> PRT
<213> 耻垢分枝杆菌(Mycobacterium smegmatis)
<400> 7
Val Asp Asn Gln Leu Ser Val Val Asp Gly Gln Gly Arg Thr Leu Thr
1 5 10 15
Val Gln Gln Ala Glu Thr Phe Leu Asn Gly Val Phe Pro Leu Asp Arg
20 25 30
Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Thr Tyr His
35 40 45
Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu Gly
50 55 60
Tyr Gln Val Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe Ser
65 70 75 80
Tyr Thr Thr Pro Asn Ile Leu Ile Asp Gly Gly Asp Ile Thr Gln Pro
85 90 95
Pro Phe Gly Leu Asp Thr Ile Ile Thr Pro Asn Leu Phe Pro Gly Val
100 105 110
Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val Ala
115 120 125
Thr Phe Ser Val Asp Val Lys Gly Ala Lys Gly Ala Val Ala Val Ser
130 135 140
Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu Arg
145 150 155 160
Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr Tyr
165 170 175
Gly Glu Pro Trp Asn Met Asn
180
<210> 8
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> He1308基序的氨基酸序列
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa = C、M或L
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa = 任何氨基酸
<400> 8
Gln Xaa Xaa Gly Arg Ala Gly Arg
1 5
<210> 9
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 扩展的He1308基序的氨基酸序列
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa = C、M或L
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa = 任何氨基酸
<400> 9
Gln Xaa Xaa Gly Arg Ala Gly Arg Pro
1 5
<210> 10
<211> 760
<212> PRT
<213> 布氏拟甲烷球菌(Methanococcoides burtonii)
<400> 10
Met Met Ile Arg Glu Leu Asp Ile Pro Arg Asp Ile Ile Gly Phe Tyr
1 5 10 15
Glu Asp Ser Gly Ile Lys Glu Leu Tyr Pro Pro Gln Ala Glu Ala Ile
20 25 30
Glu Met Gly Leu Leu Glu Lys Lys Asn Leu Leu Ala Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Leu Ala Glu Leu Ala Met Ile Lys Ala Ile
50 55 60
Arg Glu Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala
65 70 75 80
Ser Glu Lys Phe Glu Arg Phe Lys Glu Leu Ala Pro Phe Gly Ile Lys
85 90 95
Val Gly Ile Ser Thr Gly Asp Leu Asp Ser Arg Ala Asp Trp Leu Gly
100 105 110
Val Asn Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu
115 120 125
Arg Asn Gly Thr Ser Trp Met Asp Glu Ile Thr Thr Val Val Val Asp
130 135 140
Glu Ile His Leu Leu Asp Ser Lys Asn Arg Gly Pro Thr Leu Glu Val
145 150 155 160
Thr Ile Thr Lys Leu Met Arg Leu Asn Pro Asp Val Gln Val Val Ala
165 170 175
Leu Ser Ala Thr Val Gly Asn Ala Arg Glu Met Ala Asp Trp Leu Gly
180 185 190
Ala Ala Leu Val Leu Ser Glu Trp Arg Pro Thr Asp Leu His Glu Gly
195 200 205
Val Leu Phe Gly Asp Ala Ile Asn Phe Pro Gly Ser Gln Lys Lys Ile
210 215 220
Asp Arg Leu Glu Lys Asp Asp Ala Val Asn Leu Val Leu Asp Thr Ile
225 230 235 240
Lys Ala Glu Gly Gln Cys Leu Val Phe Glu Ser Ser Arg Arg Asn Cys
245 250 255
Ala Gly Phe Ala Lys Thr Ala Ser Ser Lys Val Ala Lys Ile Leu Asp
260 265 270
Asn Asp Ile Met Ile Lys Leu Ala Gly Ile Ala Glu Glu Val Glu Ser
275 280 285
Thr Gly Glu Thr Asp Thr Ala Ile Val Leu Ala Asn Cys Ile Arg Lys
290 295 300
Gly Val Ala Phe His His Ala Gly Leu Asn Ser Asn His Arg Lys Leu
305 310 315 320
Val Glu Asn Gly Phe Arg Gln Asn Leu Ile Lys Val Ile Ser Ser Thr
325 330 335
Pro Thr Leu Ala Ala Gly Leu Asn Leu Pro Ala Arg Arg Val Ile Ile
340 345 350
Arg Ser Tyr Arg Arg Phe Asp Ser Asn Phe Gly Met Gln Pro Ile Pro
355 360 365
Val Leu Glu Tyr Lys Gln Met Ala Gly Arg Ala Gly Arg Pro His Leu
370 375 380
Asp Pro Tyr Gly Glu Ser Val Leu Leu Ala Lys Thr Tyr Asp Glu Phe
385 390 395 400
Ala Gln Leu Met Glu Asn Tyr Val Glu Ala Asp Ala Glu Asp Ile Trp
405 410 415
Ser Lys Leu Gly Thr Glu Asn Ala Leu Arg Thr His Val Leu Ser Thr
420 425 430
Ile Val Asn Gly Phe Ala Ser Thr Arg Gln Glu Leu Phe Asp Phe Phe
435 440 445
Gly Ala Thr Phe Phe Ala Tyr Gln Gln Asp Lys Trp Met Leu Glu Glu
450 455 460
Val Ile Asn Asp Cys Leu Glu Phe Leu Ile Asp Lys Ala Met Val Ser
465 470 475 480
Glu Thr Glu Asp Ile Glu Asp Ala Ser Lys Leu Phe Leu Arg Gly Thr
485 490 495
Arg Leu Gly Ser Leu Val Ser Met Leu Tyr Ile Asp Pro Leu Ser Gly
500 505 510
Ser Lys Ile Val Asp Gly Phe Lys Asp Ile Gly Lys Ser Thr Gly Gly
515 520 525
Asn Met Gly Ser Leu Glu Asp Asp Lys Gly Asp Asp Ile Thr Val Thr
530 535 540
Asp Met Thr Leu Leu His Leu Val Cys Ser Thr Pro Asp Met Arg Gln
545 550 555 560
Leu Tyr Leu Arg Asn Thr Asp Tyr Thr Ile Val Asn Glu Tyr Ile Val
565 570 575
Ala His Ser Asp Glu Phe His Glu Ile Pro Asp Lys Leu Lys Glu Thr
580 585 590
Asp Tyr Glu Trp Phe Met Gly Glu Val Lys Thr Ala Met Leu Leu Glu
595 600 605
Glu Trp Val Thr Glu Val Ser Ala Glu Asp Ile Thr Arg His Phe Asn
610 615 620
Val Gly Glu Gly Asp Ile His Ala Leu Ala Asp Thr Ser Glu Trp Leu
625 630 635 640
Met His Ala Ala Ala Lys Leu Ala Glu Leu Leu Gly Val Glu Tyr Ser
645 650 655
Ser His Ala Tyr Ser Leu Glu Lys Arg Ile Arg Tyr Gly Ser Gly Leu
660 665 670
Asp Leu Met Glu Leu Val Gly Ile Arg Gly Val Gly Arg Val Arg Ala
675 680 685
Arg Lys Leu Tyr Asn Ala Gly Phe Val Ser Val Ala Lys Leu Lys Gly
690 695 700
Ala Asp Ile Ser Val Leu Ser Lys Leu Val Gly Pro Lys Val Ala Tyr
705 710 715 720
Asn Ile Leu Ser Gly Ile Gly Val Arg Val Asn Asp Lys His Phe Asn
725 730 735
Ser Ala Pro Ile Ser Ser Asn Thr Leu Asp Thr Leu Leu Asp Lys Asn
740 745 750
Gln Lys Thr Phe Asn Asp Phe Gln
755 760
<210> 11
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性Hel308基序
<400> 11
Gln Met Ala Gly Arg Ala Gly Arg
1 5
<210> 12
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性扩展的Hel308基序
<400> 12
Gln Met Ala Gly Arg Ala Gly Arg Pro
1 5
<210> 13
<211> 720
<212> PRT
<213> 激烈火球菌(Pyrococcus furiosus)
<400> 13
Met Arg Val Asp Glu Leu Arg Val Asp Glu Arg Ile Lys Ser Thr Leu
1 5 10 15
Lys Glu Arg Gly Ile Glu Ser Phe Tyr Pro Pro Gln Ala Glu Ala Leu
20 25 30
Lys Ser Gly Ile Leu Glu Gly Lys Asn Ala Leu Ile Ser Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Ile Ala Glu Ile Ala Met Val His Arg Ile
50 55 60
Leu Thr Gln Gly Gly Lys Ala Val Tyr Ile Val Pro Leu Lys Ala Leu
65 70 75 80
Ala Glu Glu Lys Phe Gln Glu Phe Gln Asp Trp Glu Lys Ile Gly Leu
85 90 95
Arg Val Ala Met Ala Thr Gly Asp Tyr Asp Ser Lys Asp Glu Trp Leu
100 105 110
Gly Lys Tyr Asp Ile Ile Ile Ala Thr Ala Glu Lys Phe Asp Ser Leu
115 120 125
Leu Arg His Gly Ser Ser Trp Ile Lys Asp Val Lys Ile Leu Val Ala
130 135 140
Asp Glu Ile His Leu Ile Gly Ser Arg Asp Arg Gly Ala Thr Leu Glu
145 150 155 160
Val Ile Leu Ala His Met Leu Gly Lys Ala Gln Ile Ile Gly Leu Ser
165 170 175
Ala Thr Ile Gly Asn Pro Glu Glu Leu Ala Glu Trp Leu Asn Ala Glu
180 185 190
Leu Ile Val Ser Asp Trp Arg Pro Val Lys Leu Arg Arg Gly Val Phe
195 200 205
Tyr Gln Gly Phe Val Thr Trp Glu Asp Gly Ser Ile Asp Arg Phe Ser
210 215 220
Ser Trp Glu Glu Leu Val Tyr Asp Ala Ile Arg Lys Lys Lys Gly Ala
225 230 235 240
Leu Ile Phe Val Asn Met Arg Arg Lys Ala Glu Arg Val Ala Leu Glu
245 250 255
Leu Ser Lys Lys Val Lys Ser Leu Leu Thr Lys Pro Glu Ile Arg Ala
260 265 270
Leu Asn Glu Leu Ala Asp Ser Leu Glu Glu Asn Pro Thr Asn Glu Lys
275 280 285
Leu Ala Lys Ala Ile Arg Gly Gly Val Ala Phe His His Ala Gly Leu
290 295 300
Gly Arg Asp Glu Arg Val Leu Val Glu Glu Asn Phe Arg Lys Gly Ile
305 310 315 320
Ile Lys Ala Val Val Ala Thr Pro Thr Leu Ser Ala Gly Ile Asn Thr
325 330 335
Pro Ala Phe Arg Val Ile Ile Arg Asp Ile Trp Arg Tyr Ser Asp Phe
340 345 350
Gly Met Glu Arg Ile Pro Ile Ile Glu Val His Gln Met Leu Gly Arg
355 360 365
Ala Gly Arg Pro Lys Tyr Asp Glu Val Gly Glu Gly Ile Ile Val Ser
370 375 380
Thr Ser Asp Asp Pro Arg Glu Val Met Asn His Tyr Ile Phe Gly Lys
385 390 395 400
Pro Glu Lys Leu Phe Ser Gln Leu Ser Asn Glu Ser Asn Leu Arg Ser
405 410 415
Gln Val Leu Ala Leu Ile Ala Thr Phe Gly Tyr Ser Thr Val Glu Glu
420 425 430
Ile Leu Lys Phe Ile Ser Asn Thr Phe Tyr Ala Tyr Gln Arg Lys Asp
435 440 445
Thr Tyr Ser Leu Glu Glu Lys Ile Arg Asn Ile Leu Tyr Phe Leu Leu
450 455 460
Glu Asn Glu Phe Ile Glu Ile Ser Leu Glu Asp Lys Ile Arg Pro Leu
465 470 475 480
Ser Leu Gly Ile Arg Thr Ala Lys Leu Tyr Ile Asp Pro Tyr Thr Ala
485 490 495
Lys Met Phe Lys Asp Lys Met Glu Glu Val Val Lys Asp Pro Asn Pro
500 505 510
Ile Gly Ile Phe His Leu Ile Ser Leu Thr Pro Asp Ile Thr Pro Phe
515 520 525
Asn Tyr Ser Lys Arg Glu Phe Glu Arg Leu Glu Glu Glu Tyr Tyr Glu
530 535 540
Phe Lys Asp Arg Leu Tyr Phe Asp Asp Pro Tyr Ile Ser Gly Tyr Asp
545 550 555 560
Pro Tyr Leu Glu Arg Lys Phe Phe Arg Ala Phe Lys Thr Ala Leu Val
565 570 575
Leu Leu Ala Trp Ile Asn Glu Val Pro Glu Gly Glu Ile Val Glu Lys
580 585 590
Tyr Ser Val Glu Pro Gly Asp Ile Tyr Arg Ile Val Glu Thr Ala Glu
595 600 605
Trp Leu Val Tyr Ser Leu Lys Glu Ile Ala Lys Val Leu Gly Ala Tyr
610 615 620
Glu Ile Val Asp Tyr Leu Glu Thr Leu Arg Val Arg Val Lys Tyr Gly
625 630 635 640
Ile Arg Glu Glu Leu Ile Pro Leu Met Gln Leu Pro Leu Val Gly Arg
645 650 655
Arg Arg Ala Arg Ala Leu Tyr Asn Ser Gly Phe Arg Ser Ile Glu Asp
660 665 670
Ile Ser Gln Ala Arg Pro Glu Glu Leu Leu Lys Ile Glu Gly Ile Gly
675 680 685
Val Lys Thr Val Glu Ala Ile Phe Lys Phe Leu Gly Lys Asn Val Lys
690 695 700
Ile Ser Glu Lys Pro Arg Lys Ser Thr Leu Asp Tyr Phe Leu Lys Ser
705 710 715 720
<210> 14
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性Hel308基序
<400> 14
Gln Met Leu Gly Arg Ala Gly Arg
1 5
<210> 15
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性扩展的Hel308基序
<400> 15
Gln Met Leu Gly Arg Ala Gly Arg Pro
1 5
<210> 16
<211> 829
<212> PRT
<213> Haloferax volcanii
<400> 16
Met Arg Thr Ala Asp Leu Thr Gly Leu Pro Thr Gly Ile Pro Glu Ala
1 5 10 15
Leu Arg Asp Glu Gly Ile Glu Glu Leu Tyr Pro Pro Gln Ala Glu Ala
20 25 30
Val Glu Ala Gly Leu Thr Asp Gly Glu Ser Leu Val Ala Ala Val Pro
35 40 45
Thr Ala Ser Gly Lys Thr Leu Ile Ala Glu Leu Ala Met Leu Ser Ser
50 55 60
Val Ala Arg Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu Arg Ala Leu
65 70 75 80
Ala Ser Glu Lys Lys Ala Glu Phe Glu Arg Trp Glu Glu Tyr Gly Ile
85 90 95
Asp Val Gly Val Ser Thr Gly Asn Tyr Glu Ser Asp Gly Glu Trp Leu
100 105 110
Ser Ser Arg Asp Ile Ile Val Ala Thr Ser Glu Lys Val Asp Ser Leu
115 120 125
Val Arg Asn Asn Ala Ala Trp Met Asp Gln Leu Thr Cys Val Val Ala
130 135 140
Asp Glu Val His Leu Val Asp Asp Arg His Arg Gly Pro Thr Leu Glu
145 150 155 160
Val Thr Leu Ala Lys Leu Arg Arg Leu Asn Thr Asn Leu Gln Val Val
165 170 175
Ala Leu Ser Ala Thr Val Gly Asn Ala Gly Val Val Ser Asp Trp Leu
180 185 190
Asp Ala Glu Leu Val Lys Ser Asp Trp Arg Pro Ile Asp Leu Lys Met
195 200 205
Gly Val His Tyr Gly Asn Ala Val Ser Phe Ala Asp Gly Ser Gln Arg
210 215 220
Glu Val Pro Val Gly Arg Gly Glu Arg Gln Thr Pro Ala Leu Val Ala
225 230 235 240
Asp Ala Leu Glu Gly Asp Gly Glu Gly Asp Gln Gly Ser Ser Leu Val
245 250 255
Phe Val Asn Ser Arg Arg Asn Ala Glu Ser Ala Ala Arg Arg Met Ala
260 265 270
Asp Val Thr Glu Arg Tyr Val Thr Gly Asp Glu Arg Ser Asp Leu Ala
275 280 285
Glu Leu Ala Ala Glu Ile Arg Asp Val Ser Asp Thr Glu Thr Ser Asp
290 295 300
Asp Leu Ala Asn Ala Val Ala Lys Gly Ala Ala Phe His His Ala Gly
305 310 315 320
Leu Ala Ala Glu His Arg Thr Leu Val Glu Asp Ala Phe Arg Asp Arg
325 330 335
Leu Ile Lys Cys Ile Cys Ala Thr Pro Thr Leu Ala Ala Gly Val Asn
340 345 350
Thr Pro Ser Arg Arg Val Val Val Arg Asp Trp Gln Arg Tyr Asp Gly
355 360 365
Asp Tyr Gly Gly Met Lys Pro Leu Asp Val Leu Glu Val His Gln Met
370 375 380
Met Gly Arg Ala Gly Arg Pro Gly Leu Asp Pro Tyr Gly Glu Ala Val
385 390 395 400
Leu Leu Ala Lys Asp Ala Asp Ala Arg Asp Glu Leu Phe Glu Arg Tyr
405 410 415
Ile Trp Ala Asp Ala Glu Asp Val Arg Ser Lys Leu Ala Ala Glu Pro
420 425 430
Ala Leu Arg Thr His Leu Leu Ala Thr Val Ala Ser Gly Phe Ala His
435 440 445
Thr Arg Glu Gly Leu Leu Glu Phe Leu Asp Gln Thr Leu Tyr Ala Thr
450 455 460
Gln Thr Asp Asp Pro Glu Arg Leu Gly Gln Val Thr Asp Arg Val Leu
465 470 475 480
Asp Tyr Leu Glu Val Asn Gly Phe Val Glu Phe Glu Gly Glu Thr Ile
485 490 495
Gln Ala Thr Pro Val Gly His Thr Val Ser Arg Leu Tyr Leu Asp Pro
500 505 510
Met Ser Ala Ala Glu Ile Ile Asp Gly Leu Glu Trp Ala Ala Asp His
515 520 525
Arg Thr Glu Lys Leu Arg Ala Leu Ala Gly Glu Thr Pro Glu Lys Pro
530 535 540
Thr Arg Asp Arg Ser Glu Ser Asp Glu Ser Gly Gly Phe Gln Arg Ala
545 550 555 560
Ser Glu Met Val Ala Asp Asp Gly Asp Gly Gly Gly Gly Glu Asp Gly
565 570 575
Val Gly Ala Asn Gly Asp Gly Asp Ser Asp Asp Ala Asp Gly Val Glu
580 585 590
Thr Asp Arg Thr Tyr Pro Thr Pro Leu Gly Leu Tyr His Leu Val Cys
595 600 605
Arg Thr Pro Asp Met Tyr Gln Leu Tyr Leu Lys Ser Gly Asp Arg Glu
610 615 620
Thr Tyr Thr Glu Leu Cys Tyr Glu Arg Glu Pro Glu Phe Leu Gly Arg
625 630 635 640
Val Pro Ser Glu Tyr Glu Asp Val Ala Phe Glu Asp Trp Leu Ser Ala
645 650 655
Leu Lys Thr Ala Lys Leu Leu Glu Asp Trp Val Gly Glu Val Asp Glu
660 665 670
Asp Arg Ile Thr Glu Arg Tyr Gly Val Gly Pro Gly Asp Ile Arg Gly
675 680 685
Lys Val Glu Thr Ser Glu Trp Leu Leu Gly Ala Ala Glu Arg Leu Ala
690 695 700
Thr Glu Leu Asp Leu Asp Ser Val Tyr Ala Val Arg Glu Ala Lys Lys
705 710 715 720
Arg Val Glu Tyr Gly Val Arg Glu Glu Leu Leu Asp Leu Ala Gly Val
725 730 735
Arg Gly Val Gly Arg Lys Arg Ala Arg Arg Leu Phe Glu Ala Gly Val
740 745 750
Glu Thr Arg Ala Asp Leu Arg Glu Ala Asp Lys Pro Arg Val Leu Ala
755 760 765
Ala Leu Arg Gly Arg Arg Lys Thr Ala Glu Asn Ile Leu Glu Ala Ala
770 775 780
Gly Arg Lys Asp Pro Ser Met Asp Ala Val Asp Glu Asp Asp Ala Pro
785 790 795 800
Asp Asp Ala Val Pro Asp Asp Ala Gly Phe Glu Thr Ala Lys Glu Arg
805 810 815
Ala Asp Gln Gln Ala Ser Leu Gly Asp Phe Glu Gly Ser
820 825
<210> 17
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性Hel308基序
<400> 17
Gln Met Met Gly Arg Ala Gly Arg
1 5
<210> 18
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性扩展的Hel308基序
<400> 18
Gln Met Met Gly Arg Ala Gly Arg Pro
1 5
<210> 19
<211> 824
<212> PRT
<213> 湖渊盐红菌(Halorubrum lacusprofundi)
<400> 19
Met Gln Pro Ser Ser Leu Ser Gly Leu Pro Ala Gly Val Gly Glu Ala
1 5 10 15
Leu Glu Ala Glu Gly Val Ala Glu Leu Tyr Pro Pro Gln Glu Ala Ala
20 25 30
Val Glu Ala Gly Val Ala Asp Gly Glu Ser Leu Val Ala Ala Val Pro
35 40 45
Thr Ala Ser Gly Lys Thr Leu Ile Ala Glu Leu Ala Met Leu Ser Ser
50 55 60
Ile Glu Arg Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu Arg Ala Leu
65 70 75 80
Ala Ser Glu Lys Lys Thr Glu Phe Glu Arg Trp Glu Glu Phe Gly Val
85 90 95
Thr Val Gly Val Ser Thr Gly Asn Tyr Glu Ser Asp Gly Glu Trp Leu
100 105 110
Ala Thr Arg Asp Ile Ile Val Ala Thr Ser Glu Lys Val Asp Ser Leu
115 120 125
Ile Arg Asn Gly Ala Pro Trp Ile Asp Asp Leu Thr Cys Val Val Ser
130 135 140
Asp Glu Val His Leu Val Asp Asp Pro Asn Arg Gly Pro Thr Leu Glu
145 150 155 160
Val Thr Leu Ala Lys Leu Arg Lys Val Asn Pro Gly Leu Gln Thr Val
165 170 175
Ala Leu Ser Ala Thr Val Gly Asn Ala Asp Val Ile Ala Glu Trp Leu
180 185 190
Asp Ala Glu Leu Val Glu Ser Asp Trp Arg Pro Ile Asp Leu Arg Met
195 200 205
Gly Val His Phe Gly Asn Ala Ile Asp Phe Ala Asp Gly Ser Lys Arg
210 215 220
Glu Val Pro Val Glu Arg Gly Glu Asp Gln Thr Ala Arg Leu Val Ala
225 230 235 240
Asp Ala Leu Asp Thr Glu Glu Asp Gly Gln Gly Gly Ser Ser Leu Val
245 250 255
Phe Val Asn Ser Arg Arg Asn Ala Glu Ser Ser Ala Arg Lys Leu Thr
260 265 270
Asp Val Thr Gly Pro Arg Leu Thr Asp Asp Glu Arg Asp Gln Leu Arg
275 280 285
Glu Leu Ala Asp Glu Ile Arg Ser Gly Ser Asp Thr Asp Thr Ala Ser
290 295 300
Asp Leu Ala Asp Ala Val Glu Gln Gly Ser Ala Phe His His Ala Gly
305 310 315 320
Leu Arg Ser Glu Asp Arg Ala Arg Val Glu Asp Ala Phe Arg Asp Arg
325 330 335
Leu Ile Lys Cys Ile Ser Ala Thr Pro Thr Leu Ala Ala Gly Val Asn
340 345 350
Thr Pro Ala Arg Arg Val Ile Val Arg Asp Trp Arg Arg Tyr Asp Gly
355 360 365
Glu Phe Gly Gly Met Lys Pro Leu Asp Val Leu Glu Val His Gln Met
370 375 380
Cys Gly Arg Ala Gly Arg Pro Gly Leu Asp Pro Tyr Gly Glu Ala Val
385 390 395 400
Leu Leu Ala Asn Asp Ala Asp Thr Lys Glu Glu Leu Phe Glu Arg Tyr
405 410 415
Leu Trp Ala Asp Pro Glu Pro Val Arg Ser Lys Leu Ala Ala Glu Pro
420 425 430
Ala Leu Arg Thr His Val Leu Ala Thr Val Ala Ser Gly Phe Ala Ser
435 440 445
Thr Arg Asp Gly Leu Leu Ser Phe Leu Asp Asn Thr Leu Tyr Ala Thr
450 455 460
Gln Thr Asp Asp Glu Gly Arg Leu Ala Ala Val Thr Asp Thr Val Leu
465 470 475 480
Asp Tyr Leu Ala Val Asn Asp Phe Ile Glu Arg Asp Arg Asp Gly Gly
485 490 495
Ser Glu Ser Leu Thr Ala Thr Gly Ile Gly His Thr Val Ser Arg Leu
500 505 510
Tyr Leu Asp Pro Met Ser Ala Ala Glu Met Ile Asp Gly Leu Arg Ser
515 520 525
Val Ala Arg Asp Ala Ala Asp Thr Gly Ala Ser Ala Glu Ala Asp Asn
530 535 540
Gly Glu Phe Val Arg Thr Gly Asp Ala Asp Asp Ala Ser Gly Gly Asp
545 550 555 560
Glu Pro Gly Phe Gly Thr Tyr Thr Arg Ala Gly Asp Asp Glu Ser Gly
565 570 575
Glu Arg Glu Thr Glu Asn Glu Glu Thr Asp Glu Glu Glu Thr Glu Ala
580 585 590
Ser Glu Val Thr Pro Leu Gly Leu Tyr His Leu Ile Ser Arg Thr Pro
595 600 605
Asp Met Tyr Glu Leu Tyr Leu Lys Ser Gly Asp Arg Glu Thr Tyr Thr
610 615 620
Glu Leu Cys Tyr Glu Arg Glu Thr Glu Phe Leu Gly Asp Val Pro Ser
625 630 635 640
Glu Tyr Glu Asp Val Arg Phe Glu Asp Trp Leu Ala Ser Leu Lys Thr
645 650 655
Ala Arg Leu Leu Glu Asp Trp Val Asn Glu Val Asp Glu Asp Arg Ile
660 665 670
Thr Glu Arg Tyr Gly Val Gly Pro Gly Asp Ile Arg Gly Lys Val Asp
675 680 685
Thr Ala Glu Trp Leu Leu Arg Ala Ala Glu Thr Leu Ala Arg Asp Val
690 695 700
Glu Gly Val Asp Gly Asp Val Val Val Ala Val Arg Glu Ala Arg Lys
705 710 715 720
Arg Ile Glu Tyr Gly Val Arg Glu Glu Leu Leu Asp Leu Ala Gly Val
725 730 735
Arg Asn Val Gly Arg Lys Arg Ala Arg Arg Leu Phe Glu Ala Gly Ile
740 745 750
Glu Thr Arg Ala Asp Leu Arg Glu Ala Asp Lys Ala Val Val Leu Gly
755 760 765
Ala Leu Arg Gly Arg Glu Arg Thr Ala Glu Arg Ile Leu Glu His Ala
770 775 780
Gly Arg Glu Asp Pro Ser Met Asp Asp Val Arg Pro Asp Lys Ser Ala
785 790 795 800
Ser Ala Ala Ala Thr Ala Gly Ser Ala Ser Asp Glu Asp Gly Glu Gly
805 810 815
Gln Ala Ser Leu Gly Asp Phe Arg
820
<210> 20
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性Hel308基序
<400> 20
Gln Met Cys Gly Arg Ala Gly Arg
1 5
<210> 21
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性扩展的Hel308基序
<400> 21
Gln Met Cys Gly Arg Ala Gly Arg Pro
1 5
<210> 22
<211> 707
<212> PRT
<213> Cenarchaeum symbiosum
<400> 22
Met Arg Ile Ser Glu Leu Asp Ile Pro Arg Pro Ala Ile Glu Phe Leu
1 5 10 15
Glu Gly Glu Gly Tyr Lys Lys Leu Tyr Pro Pro Gln Ala Ala Ala Ala
20 25 30
Lys Ala Gly Leu Thr Asp Gly Lys Ser Val Leu Val Ser Ala Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Ile Ala Ala Ile Ala Met Ile Ser His Leu
50 55 60
Ser Arg Asn Arg Gly Lys Ala Val Tyr Leu Ser Pro Leu Arg Ala Leu
65 70 75 80
Ala Ala Glu Lys Phe Ala Glu Phe Gly Lys Ile Gly Gly Ile Pro Leu
85 90 95
Gly Arg Pro Val Arg Val Gly Val Ser Thr Gly Asp Phe Glu Lys Ala
100 105 110
Gly Arg Ser Leu Gly Asn Asn Asp Ile Leu Val Leu Thr Asn Glu Arg
115 120 125
Met Asp Ser Leu Ile Arg Arg Arg Pro Asp Trp Met Asp Glu Val Gly
130 135 140
Leu Val Ile Ala Asp Glu Ile His Leu Ile Gly Asp Arg Ser Arg Gly
145 150 155 160
Pro Thr Leu Glu Met Val Leu Thr Lys Leu Arg Gly Leu Arg Ser Ser
165 170 175
Pro Gln Val Val Ala Leu Ser Ala Thr Ile Ser Asn Ala Asp Glu Ile
180 185 190
Ala Gly Trp Leu Asp Cys Thr Leu Val His Ser Thr Trp Arg Pro Val
195 200 205
Pro Leu Ser Glu Gly Val Tyr Gln Asp Gly Glu Val Ala Met Gly Asp
210 215 220
Gly Ser Arg His Glu Val Ala Ala Thr Gly Gly Gly Pro Ala Val Asp
225 230 235 240
Leu Ala Ala Glu Ser Val Ala Glu Gly Gly Gln Ser Leu Ile Phe Ala
245 250 255
Asp Thr Arg Ala Arg Ser Ala Ser Leu Ala Ala Lys Ala Ser Ala Val
260 265 270
Ile Pro Glu Ala Lys Gly Ala Asp Ala Ala Lys Leu Ala Ala Ala Ala
275 280 285
Lys Lys Ile Ile Ser Ser Gly Gly Glu Thr Lys Leu Ala Lys Thr Leu
290 295 300
Ala Glu Leu Val Glu Lys Gly Ala Ala Phe His His Ala Gly Leu Asn
305 310 315 320
Gln Asp Cys Arg Ser Val Val Glu Glu Glu Phe Arg Ser Gly Arg Ile
325 330 335
Arg Leu Leu Ala Ser Thr Pro Thr Leu Ala Ala Gly Val Asn Leu Pro
340 345 350
Ala Arg Arg Val Val Ile Ser Ser Val Met Arg Tyr Asn Ser Ser Ser
355 360 365
Gly Met Ser Glu Pro Ile Ser Ile Leu Glu Tyr Lys Gln Leu Cys Gly
370 375 380
Arg Ala Gly Arg Pro Gln Tyr Asp Lys Ser Gly Glu Ala Ile Val Val
385 390 395 400
Gly Gly Val Asn Ala Asp Glu Ile Phe Asp Arg Tyr Ile Gly Gly Glu
405 410 415
Pro Glu Pro Ile Arg Ser Ala Met Val Asp Asp Arg Ala Leu Arg Ile
420 425 430
His Val Leu Ser Leu Val Thr Thr Ser Pro Gly Ile Lys Glu Asp Asp
435 440 445
Val Thr Glu Phe Phe Leu Gly Thr Leu Gly Gly Gln Gln Ser Gly Glu
450 455 460
Ser Thr Val Lys Phe Ser Val Ala Val Ala Leu Arg Phe Leu Gln Glu
465 470 475 480
Glu Gly Met Leu Gly Arg Arg Gly Gly Arg Leu Ala Ala Thr Lys Met
485 490 495
Gly Arg Leu Val Ser Arg Leu Tyr Met Asp Pro Met Thr Ala Val Thr
500 505 510
Leu Arg Asp Ala Val Gly Glu Ala Ser Pro Gly Arg Met His Thr Leu
515 520 525
Gly Phe Leu His Leu Val Ser Glu Cys Ser Glu Phe Met Pro Arg Phe
530 535 540
Ala Leu Arg Gln Lys Asp His Glu Val Ala Glu Met Met Leu Glu Ala
545 550 555 560
Gly Arg Gly Glu Leu Leu Arg Pro Val Tyr Ser Tyr Glu Cys Gly Arg
565 570 575
Gly Leu Leu Ala Leu His Arg Trp Ile Gly Glu Ser Pro Glu Ala Lys
580 585 590
Leu Ala Glu Asp Leu Lys Phe Glu Ser Gly Asp Val His Arg Met Val
595 600 605
Glu Ser Ser Gly Trp Leu Leu Arg Cys Ile Trp Glu Ile Ser Lys His
610 615 620
Gln Glu Arg Pro Asp Leu Leu Gly Glu Leu Asp Val Leu Arg Ser Arg
625 630 635 640
Val Ala Tyr Gly Ile Lys Ala Glu Leu Val Pro Leu Val Ser Ile Lys
645 650 655
Gly Ile Gly Arg Val Arg Ser Arg Arg Leu Phe Arg Gly Gly Ile Lys
660 665 670
Gly Pro Gly Asp Leu Ala Ala Val Pro Val Glu Arg Leu Ser Arg Val
675 680 685
Glu Gly Ile Gly Ala Thr Leu Ala Asn Asn Ile Lys Ser Gln Leu Arg
690 695 700
Lys Gly Gly
705
<210> 23
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性Hel308基序
<400> 23
Gln Leu Cys Gly Arg Ala Gly Arg
1 5
<210> 24
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性扩展的Hel308基序
<400> 24
Gln Leu Cys Gly Arg Ala Gly Arg Pro
1 5
<210> 25
<211> 715
<212> PRT
<213> 硫磺矿硫化叶菌( Sulfolobus solfataricus)
<400> 25
Met Ser Leu Glu Leu Glu Trp Met Pro Ile Glu Asp Leu Lys Leu Pro
1 5 10 15
Ser Asn Val Ile Glu Ile Ile Lys Lys Arg Gly Ile Lys Lys Leu Asn
20 25 30
Pro Pro Gln Thr Glu Ala Val Lys Lys Gly Leu Leu Glu Gly Asn Arg
35 40 45
Leu Leu Leu Thr Ser Pro Thr Gly Ser Gly Lys Thr Leu Ile Ala Glu
50 55 60
Met Gly Ile Ile Ser Phe Leu Leu Lys Asn Gly Gly Lys Ala Ile Tyr
65 70 75 80
Val Thr Pro Leu Arg Ala Leu Thr Asn Glu Lys Tyr Leu Thr Phe Lys
85 90 95
Asp Trp Glu Leu Ile Gly Phe Lys Val Ala Met Thr Ser Gly Asp Tyr
100 105 110
Asp Thr Asp Asp Ala Trp Leu Lys Asn Tyr Asp Ile Ile Ile Thr Thr
115 120 125
Tyr Glu Lys Leu Asp Ser Leu Trp Arg His Arg Pro Glu Trp Leu Asn
130 135 140
Glu Val Asn Tyr Phe Val Leu Asp Glu Leu His Tyr Leu Asn Asp Pro
145 150 155 160
Glu Arg Gly Pro Val Val Glu Ser Val Thr Ile Arg Ala Lys Arg Arg
165 170 175
Asn Leu Leu Ala Leu Ser Ala Thr Ile Ser Asn Tyr Lys Gln Ile Ala
180 185 190
Lys Trp Leu Gly Ala Glu Pro Val Ala Thr Asn Trp Arg Pro Val Pro
195 200 205
Leu Ile Glu Gly Val Ile Tyr Pro Glu Arg Lys Lys Lys Glu Tyr Asn
210 215 220
Val Ile Phe Lys Asp Asn Thr Thr Lys Lys Val His Gly Asp Asp Ala
225 230 235 240
Ile Ile Ala Tyr Thr Leu Asp Ser Leu Ser Lys Asn Gly Gln Val Leu
245 250 255
Val Phe Arg Asn Ser Arg Lys Met Ala Glu Ser Thr Ala Leu Lys Ile
260 265 270
Ala Asn Tyr Met Asn Phe Val Ser Leu Asp Glu Asn Ala Leu Ser Glu
275 280 285
Ile Leu Lys Gln Leu Asp Asp Ile Glu Glu Gly Gly Ser Asp Glu Lys
290 295 300
Glu Leu Leu Lys Ser Leu Ile Ser Lys Gly Val Ala Tyr His His Ala
305 310 315 320
Gly Leu Ser Lys Ala Leu Arg Asp Leu Ile Glu Glu Gly Phe Arg Gln
325 330 335
Arg Lys Ile Lys Val Ile Val Ala Thr Pro Thr Leu Ala Ala Gly Val
340 345 350
Asn Leu Pro Ala Arg Thr Val Ile Ile Gly Asp Ile Tyr Arg Phe Asn
355 360 365
Lys Lys Ile Ala Gly Tyr Tyr Asp Glu Ile Pro Ile Met Glu Tyr Lys
370 375 380
Gln Met Ser Gly Arg Ala Gly Arg Pro Gly Phe Asp Gln Ile Gly Glu
385 390 395 400
Ser Ile Val Val Val Arg Asp Lys Glu Asp Val Asp Arg Val Phe Lys
405 410 415
Lys Tyr Val Leu Ser Asp Val Glu Pro Ile Glu Ser Lys Leu Gly Ser
420 425 430
Glu Arg Ala Phe Tyr Thr Phe Leu Leu Gly Ile Leu Ser Ala Glu Gly
435 440 445
Asn Leu Ser Glu Lys Gln Leu Glu Asn Phe Ala Tyr Glu Ser Leu Leu
450 455 460
Ala Lys Gln Leu Val Asp Val Tyr Phe Asp Arg Ala Ile Arg Trp Leu
465 470 475 480
Leu Glu His Ser Phe Ile Lys Glu Glu Gly Asn Thr Phe Ala Leu Thr
485 490 495
Asn Phe Gly Lys Arg Val Ala Asp Leu Tyr Ile Asn Pro Phe Thr Ala
500 505 510
Asp Ile Ile Arg Lys Gly Leu Glu Gly His Lys Ala Ser Cys Glu Leu
515 520 525
Ala Tyr Leu His Leu Leu Ala Phe Thr Pro Asp Gly Pro Leu Val Ser
530 535 540
Val Gly Arg Asn Glu Glu Glu Glu Leu Ile Glu Leu Leu Glu Asp Leu
545 550 555 560
Asp Cys Glu Leu Leu Ile Glu Glu Pro Tyr Glu Glu Asp Glu Tyr Ser
565 570 575
Leu Tyr Ile Asn Ala Leu Lys Val Ala Leu Ile Met Lys Asp Trp Met
580 585 590
Asp Glu Val Asp Glu Asp Thr Ile Leu Ser Lys Tyr Asn Ile Gly Ser
595 600 605
Gly Asp Leu Arg Asn Met Val Glu Thr Met Asp Trp Leu Thr Tyr Ser
610 615 620
Ala Tyr His Leu Ser Arg Glu Leu Lys Leu Asn Glu His Ala Asp Lys
625 630 635 640
Leu Arg Ile Leu Asn Leu Arg Val Arg Asp Gly Ile Lys Glu Glu Leu
645 650 655
Leu Glu Leu Val Gln Ile Ser Gly Val Gly Arg Lys Arg Ala Arg Leu
660 665 670
Leu Tyr Asn Asn Gly Ile Lys Glu Leu Gly Asp Val Val Met Asn Pro
675 680 685
Asp Lys Val Lys Asn Leu Leu Gly Gln Lys Leu Gly Glu Lys Val Val
690 695 700
Gln Glu Ala Ala Arg Leu Leu Asn Arg Phe His
705 710 715
<210> 26
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性Hel308基序
<400> 26
Gln Met Ser Gly Arg Ala Gly Arg
1 5
<210> 27
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性扩展的Hel308基序
<400> 27
Gln Met Ser Gly Arg Ala Gly Arg Pro
1 5
<210> 28
<211> 685
<212> PRT
<213> 嗜冷产甲烷菌(Methanogenium frigidum)
<400> 28
Met Asp Leu Ser Leu Pro Lys Ala Phe Ile Gln Tyr Tyr Lys Asp Lys
1 5 10 15
Gly Ile Glu Ser Leu Tyr Pro Pro Gln Ser Glu Cys Ile Glu Asn Gly
20 25 30
Leu Leu Asp Gly Ala Asp Leu Leu Val Ala Ile Pro Thr Ala Ser Gly
35 40 45
Lys Thr Leu Ile Ala Glu Met Ala Met His Ala Ala Ile Ala Arg Gly
50 55 60
Gly Met Cys Leu Tyr Ile Val Pro Leu Lys Ala Leu Ala Thr Glu Lys
65 70 75 80
Ala Gln Glu Phe Lys Gly Lys Gly Ala Glu Ile Gly Val Ala Thr Gly
85 90 95
Asp Tyr Asp Gln Lys Glu Lys Arg Leu Gly Ser Asn Asp Ile Val Ile
100 105 110
Ala Thr Ser Glu Lys Val Asp Ser Leu Leu Arg Asn Gly Val Pro Trp
115 120 125
Leu Ser Gln Val Thr Cys Leu Val Val Asp Glu Val His Leu Ile Asp
130 135 140
Asp Glu Ser Arg Gly Pro Thr Leu Glu Met Val Ile Thr Lys Leu Arg
145 150 155 160
His Ala Ser Pro Asp Met Gln Val Ile Gly Leu Ser Ala Thr Ile Gly
165 170 175
Asn Pro Lys Glu Leu Ala Gly Trp Leu Gly Ala Asp Leu Ile Thr Ser
180 185 190
Asp Trp Arg Pro Val Asp Leu Arg Glu Gly Ile Cys Tyr His Asn Thr
195 200 205
Ile Tyr Phe Asp Asn Glu Asp Lys Glu Ile Pro Ala Pro Ala Lys Thr
210 215 220
Glu Asp Ile Asn Leu Leu Leu Asp Cys Val Ala Asp Gly Gly Gln Cys
225 230 235 240
Leu Val Phe Val Ser Ser Arg Arg Asn Ala Glu Gly Tyr Ala Lys Arg
245 250 255
Ala Ala Thr Ala Leu Lys Cys Ser His Ala Ala Leu Asp Ser Ile Ala
260 265 270
Glu Lys Leu Glu Ala Ala Ala Glu Thr Asp Met Gly Arg Val Leu Ala
275 280 285
Thr Cys Val Lys Lys Gly Ala Ala Phe His His Ala Gly Met Asn Arg
290 295 300
Met Gln Arg Thr Leu Val Glu Gly Gly Phe Arg Asp Gly Phe Ile Lys
305 310 315 320
Ser Ile Ser Ser Thr Pro Thr Leu Ala Ala Gly Leu Asn Leu Pro Ala
325 330 335
Arg Arg Val Ile Ile Arg Asp Tyr Leu Arg Tyr Ser Gly Gly Glu Gly
340 345 350
Met Arg Pro Ile Pro Val Arg Glu Tyr Arg Gln Met Ala Gly Arg Ala
355 360 365
Gly Arg Pro His Leu Asp Pro Tyr Gly Glu Ala Ile Leu Ile Ala Lys
370 375 380
Thr Glu Tyr Ala Val Asn Asp Leu His Glu Glu Tyr Val Glu Ala Pro
385 390 395 400
Asp Glu Asp Val Thr Ser Arg Cys Gly Glu Lys Gly Val Leu Thr Ala
405 410 415
His Ile Leu Ser Leu Ile Ala Thr Gly Tyr Ala Arg Ser Tyr Asp Glu
420 425 430
Leu Met Ala Phe Leu Glu Lys Thr Leu Tyr Ala Tyr Gln His Thr Gly
435 440 445
Lys Lys Ala Leu Thr Arg Thr Leu Asp Asp Ala Leu Gly Phe Leu Thr
450 455 460
Glu Ala Glu Met Val Thr Asp Leu Ser Gly Met Leu His Ala Thr Glu
465 470 475 480
Tyr Gly Asp Leu Thr Ser Arg Leu Tyr Ile Asp Pro His Ser Ala Glu
485 490 495
Ile Ile Thr Thr Ala Leu Arg Glu Glu Gly Glu Leu Thr Asp Leu Ala
500 505 510
Leu Leu Gln Leu Leu Cys Met Thr Pro Asp Met Phe Thr Leu Tyr Val
515 520 525
Lys Lys Asn Asp Leu Gly Thr Leu Glu Lys Phe Phe Phe Glu His Glu
530 535 540
Glu Glu Phe Arg Thr Glu Phe Ser Tyr Asp Glu Met Glu Asp Phe Phe
545 550 555 560
Arg Ser Leu Lys Thr Ala Met Leu Leu Ser Asp Trp Thr Asp Glu Ile
565 570 575
Gly Asp Asp Thr Ile Cys Thr Arg Phe Gly Val Gly Pro Gly Asp Ile
580 585 590
Phe Asn Ala Val Gln Gly Ile Ser Trp Leu Leu His Ala Ser Gly Arg
595 600 605
Leu Ala Arg Leu Val Ala Pro Glu His Arg Asp Ala Val Glu Glu Thr
610 615 620
Thr Leu Arg Val Arg His Gly Ile Arg Arg Glu Leu Ile Pro Leu Val
625 630 635 640
Arg Val Lys Gly Ile Gly Arg Val Arg Ala Arg Arg Leu Phe Asn Asn
645 650 655
Gly Ile Thr Gly Pro Glu Leu Leu Ala Ala Ala Asp Pro Ser Val Val
660 665 670
Gly His Ile Val Gly Gly Lys Thr Ala Glu Ser Ile Ile
675 680 685
<210> 29
<211> 775
<212> PRT
<213> 冲绳甲烷球菌(Methanothermococcus okinawensis)
<400> 29
Met Leu Met Leu Met Glu Val Leu Lys Glu Asn Gly Ile Ala Glu Leu
1 5 10 15
Arg Pro Pro Gln Lys Lys Val Val Glu Gly Gly Leu Leu Asn Lys Asn
20 25 30
Lys Asn Phe Leu Ile Cys Ile Pro Thr Ala Ser Gly Lys Thr Leu Ile
35 40 45
Gly Glu Met Ala Phe Ile Asn His Leu Leu Asp Asn Asn Lys Thr Pro
50 55 60
Thr Asn Lys Lys Gly Leu Phe Ile Val Pro Leu Lys Ala Leu Ala Asn
65 70 75 80
Glu Lys Tyr Glu Glu Phe Lys Gly Lys Tyr Glu Lys Tyr Gly Leu Lys
85 90 95
Ile Ala Leu Ser Ile Gly Asp Phe Asp Glu Lys Glu Asp Leu Lys Gly
100 105 110
Tyr Asp Leu Ile Ile Thr Thr Ala Glu Lys Leu Asp Ser Leu Ile Arg
115 120 125
His Lys Val Glu Trp Ile Lys Asp Ile Ser Val Val Val Ile Asp Glu
130 135 140
Ile His Leu Ile Gly Asp Glu Ser Arg Gly Gly Thr Leu Glu Val Leu
145 150 155 160
Leu Thr Lys Leu Lys Thr Lys Lys Thr Ile Gln Ile Ile Gly Leu Ser
165 170 175
Ala Thr Ile Gly Asn Pro Glu Glu Leu Ala Lys Trp Leu Asn Ala Glu
180 185 190
Leu Ile Val Asp Glu Trp Arg Pro Val Lys Leu Lys Lys Gly Ile Gly
195 200 205
Tyr Gly Asn Lys Ile Met Phe Ile Asp Asp Asn Gly Asn Thr Ile Asn
210 215 220
Glu Val Ile Val Asp Glu Ile Ser Lys Asn Asn Met Phe Asn Leu Val
225 230 235 240
Val Asp Ser Ile Leu Lys Asp Gly Ser Cys Ile Ile Phe Cys Asn Ser
245 250 255
Lys Arg Gly Ala Val Gly Glu Ala Lys Lys Leu Asn Leu Lys Lys Tyr
260 265 270
Leu Ser Pro Asp Glu Ile Ser Glu Leu Arg His Leu Lys Glu Glu Val
275 280 285
Leu Ser Val Leu Asp Asn Pro Thr Lys Thr Cys Lys Asp Leu Ala Glu
290 295 300
Cys Ile Glu Lys Gly Val Ala Phe His His Ala Gly Leu Thr Tyr Glu
305 310 315 320
Gln Arg Lys Ile Val Glu Glu Gly Phe Arg Lys Lys Leu Ile Lys Ala
325 330 335
Ile Cys Cys Thr Pro Thr Leu Ser Ala Gly Ile Asn Met Pro Cys Arg
340 345 350
Arg Ala Ile Ile Arg Asp Leu Lys Arg Phe Ser Ser Arg Gly Tyr Ile
355 360 365
Pro Ile Pro Lys Met Glu Ile His Gln Cys Ile Gly Arg Ala Gly Arg
370 375 380
Pro Asn Leu Asp Pro Tyr Gly Glu Gly Ile Ile Tyr Ile Asn Asn Thr
385 390 395 400
Glu Asn Pro Glu Leu Ile Glu Asn Ala Lys Asn Tyr Leu Ile Gly Asn
405 410 415
Val Glu Glu Ile Tyr Ser Lys Leu Ser Asn Gln Lys Val Leu Arg Thr
420 425 430
His Met Leu Gly Leu Ile Thr Thr Gly Asp Ile Lys Asn Lys Asn Asp
435 440 445
Leu Glu Glu Phe Ile Lys Asn Thr Phe Tyr Ala Tyr Gln Tyr Gln Asn
450 455 460
Thr Lys Lys Ile Leu Glu Asn Ile Tyr Glu Ile Thr Asn Phe Leu Glu
465 470 475 480
Lys Asn Gly Phe Ile Glu Leu Asn Tyr Arg Arg Asp Glu Asn Lys Asp
485 490 495
Lys Ser Asn Asn Ser His Asn Asn Lys Lys Asn Ile Ser Asn Thr Asn
500 505 510
Asn Ser Ile Lys Met Leu Val Leu Asp Asn Asn Asn Ser Leu Thr Ile
515 520 525
Lys Ser Arg His Glu Glu Asp Val Tyr Tyr Asn Ile Thr Pro Leu Gly
530 535 540
Lys Lys Val Ser Glu Leu Tyr Ile Asp Pro Leu Ser Ala Glu Tyr Ile
545 550 555 560
Ile Asp Gly Leu Lys Asn Leu His Lys Lys Thr Leu Ser Asn Pro Lys
565 570 575
Asn Met Glu Cys Tyr Ile Leu His Ile Leu Tyr Ile Ile Ser Lys Thr
580 585 590
Thr Glu Met Gln Pro Val Leu Arg Val Arg Arg Lys Glu Glu Asn Asp
595 600 605
Leu Ile Asn Asp Met Ile Lys Leu Asp Ile Asp Val Asp Asp Val Ile
610 615 620
Tyr Gly Ile Ser Ser Glu Asn Leu Glu Tyr Phe Lys Asn Ala Lys Leu
625 630 635 640
Phe Tyr Asp Trp Ile Asn Glu Ile Pro Glu Glu Glu Leu Leu Leu Gly
645 650 655
Tyr Asn Ile Glu Pro Gly Ile Leu Arg Tyr Asn Val Glu Gln Ala Lys
660 665 670
Trp Met Ile His Ser Ala Lys Glu Ile Phe Asn Leu Leu Asn Ile Asp
675 680 685
Asn Lys Val Ile Lys Asp Cys Leu Asn Asp Leu Glu Ile Arg Met Glu
690 695 700
Tyr Gly Ala Lys Gln Asp Ile Ile Glu Leu Leu Lys Ile Lys His Ile
705 710 715 720
Gly Arg Ala Arg Ala Arg Ile Leu Tyr Asn Ala Gly Ile Lys Asn Ala
725 730 735
Asn Asp Ile Ile Asn Asn Gln Lys Asn Ile Ile Asn Leu Leu Gly Glu
740 745 750
Lys Ile Ala Arg Lys Ile Leu Ser Glu Leu Gly Val Asp Thr Lys Phe
755 760 765
Gly Gln Met Arg Leu Ser Ile
770 775
<210> 30
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性Hel308基序
<400> 30
Gln Cys Ile Gly Arg Ala Gly Arg
1 5
<210> 31
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性扩展的Hel308基序
<400> 31
Gln Cys Ile Gly Arg Ala Gly Arg Pro
1 5
<210> 32
<211> 699
<212> PRT
<213> Methanotorris igneus
<400> 32
Met Gln Lys Tyr Ser His Val Phe Glu Val Leu Lys Glu Asn Gly Ile
1 5 10 15
Lys Glu Leu Arg Pro Pro Gln Lys Lys Val Ile Glu Lys Gly Leu Leu
20 25 30
Asn Lys Glu Lys Asn Phe Leu Ile Cys Ile Pro Thr Ala Ser Gly Lys
35 40 45
Thr Leu Ile Gly Glu Met Ala Leu Ile Asn His Leu Leu Asp Glu Asn
50 55 60
Lys Thr Pro Thr Asn Lys Lys Gly Leu Phe Ile Val Pro Leu Lys Ala
65 70 75 80
Leu Ala Ser Glu Lys Tyr Glu Glu Phe Lys Arg Lys Tyr Glu Lys Tyr
85 90 95
Gly Leu Lys Val Ala Leu Ser Ile Gly Asp Tyr Asp Glu Lys Glu Asp
100 105 110
Leu Ser Ser Tyr Asn Ile Ile Ile Thr Thr Ala Glu Lys Leu Asp Ser
115 120 125
Leu Met Arg His Glu Ile Asp Trp Leu Asn Tyr Val Ser Val Ala Ile
130 135 140
Val Asp Glu Ile His Met Ile Asn Asp Glu Lys Arg Gly Gly Thr Leu
145 150 155 160
Glu Val Leu Leu Thr Lys Leu Lys Asn Leu Asp Val Gln Ile Ile Gly
165 170 175
Leu Ser Ala Thr Ile Gly Asn Pro Glu Glu Leu Ala Glu Trp Leu Asn
180 185 190
Ala Glu Leu Ile Ile Asp Asn Trp Arg Pro Val Lys Leu Arg Lys Gly
195 200 205
Ile Phe Phe Gln Asn Lys Ile Met Tyr Leu Asn Gly Ala Cys Lys Glu
210 215 220
Leu Pro Asn Phe Ser Asn Asn Pro Met Leu Asn Leu Val Leu Asp Cys
225 230 235 240
Val Lys Glu Gly Gly Cys Cys Leu Val Phe Cys Asn Ser Lys Asn Gly
245 250 255
Ala Val Ser Glu Ala Lys Lys Leu Asn Leu Lys Lys Tyr Leu Ser Asn
260 265 270
Ser Glu Lys Tyr Glu Leu Gln Lys Leu Lys Glu Glu Ile Leu Ser Ile
275 280 285
Leu Asp Pro Pro Thr Glu Thr Cys Lys Thr Leu Ala Glu Cys Leu Glu
290 295 300
Lys Gly Val Ala Phe His His Ala Gly Leu Thr Tyr Glu His Arg Lys
305 310 315 320
Ile Val Glu Glu Gly Phe Arg Asn Lys Leu Ile Lys Val Ile Cys Cys
325 330 335
Thr Pro Thr Leu Ser Ala Gly Ile Asn Ile Pro Cys Arg Arg Ala Ile
340 345 350
Val Arg Asp Leu Met Arg Phe Ser Asn Gly Arg Met Lys Pro Ile Pro
355 360 365
Ile Met Glu Ile His Gln Cys Ile Gly Arg Ala Gly Arg Pro Gly Leu
370 375 380
Asp Pro Tyr Gly Glu Gly Ile Ile Phe Val Lys Asn Glu Arg Asp Leu
385 390 395 400
Glu Arg Ala Glu Gln Tyr Leu Glu Gly Lys Pro Glu Tyr Ile Tyr Ser
405 410 415
Lys Leu Ser Asn Gln Ala Val Leu Arg Thr Gln Leu Leu Gly Met Ile
420 425 430
Ala Thr Arg Glu Ile Glu Asn Glu Phe Asp Leu Ile Ser Phe Ile Lys
435 440 445
Asn Thr Phe Tyr Ala His Gln Tyr Gly Asn Leu Gly Gly Val Leu Arg
450 455 460
Asn Ile Lys Glu Val Ile Asn Phe Leu Glu Glu Asn Asp Phe Ile Ala
465 470 475 480
Asp Tyr Phe Pro Thr Lys Leu Gly Lys Arg Val Ser Glu Leu Tyr Ile
485 490 495
Asp Pro Leu Ser Ala Lys Ile Ile Ile Asp Gly Leu Lys Glu Met Gly
500 505 510
Asn Val Asp Asn Glu Glu Leu Tyr Tyr Leu Tyr Leu Ile Ser Lys Thr
515 520 525
Leu Glu Met Met Pro Leu Leu Arg Val Asn Ser Phe Glu Glu Leu Asp
530 535 540
Leu Ile Leu Glu Met Glu Glu Ala Gly Ile Tyr Asp Arg Thr Tyr Asp
545 550 555 560
Asp Leu Ala Ala Phe Lys Asn Ala Lys Met Leu Tyr Asp Trp Ile Asn
565 570 575
Glu Val Pro Glu Asp Glu Ile Leu Lys Lys Tyr Lys Ile Glu Pro Gly
580 585 590
Ile Leu Arg Tyr Lys Val Glu Gln Ala Lys Trp Met Ile Tyr Ser Thr
595 600 605
Lys Glu Ile Ala Lys Leu Leu Asn Arg Asn Ile Asp Thr Leu Ser Lys
610 615 620
Leu Glu Ile Arg Leu Glu Tyr Gly Ala Lys Glu Asp Ile Ile Glu Leu
625 630 635 640
Leu Lys Ile Lys Tyr Val Gly Arg Ala Arg Ala Arg Lys Leu Tyr Asp
645 650 655
Ala Gly Ile Arg Ser Val Glu Asp Ile Ile Asn Asn Pro Lys Lys Val
660 665 670
Ala Ser Leu Leu Gly Glu Lys Ile Ala Lys Lys Ile Leu Gly Glu Leu
675 680 685
Gly Met Lys Phe Gly Gln Gln Thr Leu Gln Ile
690 695
<210> 33
<211> 720
<212> PRT
<213> Thermococcus gammatolerans
<400> 33
Met Lys Val Asp Glu Leu Pro Val Asp Glu Arg Leu Lys Ala Val Leu
1 5 10 15
Lys Glu Arg Gly Ile Glu Glu Leu Tyr Pro Pro Gln Ala Glu Ala Leu
20 25 30
Lys Ser Gly Ala Leu Glu Gly Arg Asn Leu Val Leu Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Val Ser Glu Ile Val Met Val Asn Lys Leu
50 55 60
Ile Gln Glu Gly Gly Lys Ala Val Tyr Leu Val Pro Leu Lys Ala Leu
65 70 75 80
Ala Glu Glu Lys Tyr Arg Glu Phe Lys Glu Trp Glu Lys Leu Gly Leu
85 90 95
Lys Val Ala Ala Thr Thr Gly Asp Tyr Asp Ser Thr Asp Asp Trp Leu
100 105 110
Gly Arg Tyr Asp Ile Ile Val Ala Thr Ala Glu Lys Phe Asp Ser Leu
115 120 125
Leu Arg His Gly Ala Arg Trp Ile Asn Asp Val Lys Leu Val Val Ala
130 135 140
Asp Glu Val His Leu Ile Gly Ser Tyr Asp Arg Gly Ala Thr Leu Glu
145 150 155 160
Met Ile Leu Thr His Met Leu Gly Arg Ala Gln Ile Leu Ala Leu Ser
165 170 175
Ala Thr Val Gly Asn Ala Glu Glu Leu Ala Glu Trp Leu Asp Ala Ser
180 185 190
Leu Val Val Ser Asp Trp Arg Pro Val Gln Leu Arg Arg Gly Val Phe
195 200 205
His Leu Gly Thr Leu Ile Trp Glu Asp Gly Lys Val Glu Ser Tyr Pro
210 215 220
Glu Asn Trp Tyr Ser Leu Val Val Asp Ala Val Lys Arg Gly Lys Gly
225 230 235 240
Ala Leu Val Phe Val Asn Thr Arg Arg Ser Ala Glu Lys Glu Ala Leu
245 250 255
Ala Leu Ser Lys Leu Val Ser Ser His Leu Thr Lys Pro Glu Lys Arg
260 265 270
Ala Leu Glu Ser Leu Ala Ser Gln Leu Glu Asp Asn Pro Thr Ser Glu
275 280 285
Lys Leu Lys Arg Ala Leu Arg Gly Gly Val Ala Phe His His Ala Gly
290 295 300
Leu Ser Arg Val Glu Arg Thr Leu Ile Glu Asp Ala Phe Arg Glu Gly
305 310 315 320
Leu Ile Lys Val Ile Thr Ala Thr Pro Thr Leu Ser Ala Gly Val Asn
325 330 335
Leu Pro Ser Phe Arg Val Ile Ile Arg Asp Thr Lys Arg Tyr Ala Gly
340 345 350
Phe Gly Trp Thr Asp Ile Pro Val Leu Glu Ile Gln Gln Met Met Gly
355 360 365
Arg Ala Gly Arg Pro Arg Tyr Asp Lys Tyr Gly Glu Ala Ile Ile Val
370 375 380
Ala Arg Thr Asp Glu Pro Gly Lys Leu Met Glu Arg Tyr Ile Arg Gly
385 390 395 400
Lys Pro Glu Lys Leu Phe Ser Met Leu Ala Asn Glu Gln Ala Phe Arg
405 410 415
Ser Gln Val Leu Ala Leu Ile Thr Asn Phe Gly Ile Arg Ser Phe Pro
420 425 430
Glu Leu Val Arg Phe Leu Glu Arg Thr Phe Tyr Ala His Gln Arg Lys
435 440 445
Asp Leu Ser Ser Leu Glu Tyr Lys Ala Lys Glu Val Val Tyr Phe Leu
450 455 460
Ile Glu Asn Glu Phe Ile Asp Leu Asp Leu Glu Asp Arg Phe Ile Pro
465 470 475 480
Leu Pro Phe Gly Lys Arg Thr Ser Gln Leu Tyr Ile Asp Pro Leu Thr
485 490 495
Ala Lys Lys Phe Lys Asp Ala Phe Pro Ala Ile Glu Arg Asn Pro Asn
500 505 510
Pro Phe Gly Ile Phe Gln Leu Ile Ala Ser Thr Pro Asp Met Ala Thr
515 520 525
Leu Thr Ala Arg Arg Arg Glu Met Glu Asp Tyr Leu Asp Leu Ala Tyr
530 535 540
Glu Leu Glu Asp Lys Leu Tyr Ala Ser Ile Pro Tyr Tyr Glu Asp Ser
545 550 555 560
Arg Phe Gln Gly Phe Leu Gly Gln Val Lys Thr Ala Lys Val Leu Leu
565 570 575
Asp Trp Ile Asn Glu Val Pro Glu Ala Arg Ile Tyr Glu Thr Tyr Ser
580 585 590
Ile Asp Pro Gly Asp Leu Tyr Arg Leu Leu Glu Leu Ala Asp Trp Leu
595 600 605
Met Tyr Ser Leu Ile Glu Leu Tyr Lys Leu Phe Glu Pro Lys Glu Glu
610 615 620
Ile Leu Asn Tyr Leu Arg Asp Leu His Leu Arg Leu Arg His Gly Val
625 630 635 640
Arg Glu Glu Leu Leu Glu Leu Val Arg Leu Pro Asn Ile Gly Arg Lys
645 650 655
Arg Ala Arg Ala Leu Tyr Asn Ala Gly Phe Arg Ser Val Glu Ala Ile
660 665 670
Ala Asn Ala Lys Pro Ala Glu Leu Leu Ala Val Glu Gly Ile Gly Ala
675 680 685
Lys Ile Leu Asp Gly Ile Tyr Arg His Leu Gly Ile Glu Lys Arg Val
690 695 700
Thr Glu Glu Lys Pro Lys Arg Lys Gly Thr Leu Glu Asp Phe Leu Arg
705 710 715 720
<210> 34
<211> 755
<212> PRT
<213> Thermococcus barophilus
<400> 34
Met Leu Ser Thr Lys Pro Lys Ala Tyr Lys Arg Phe Ser Pro Ile Gly
1 5 10 15
Tyr Ala Met Gln Val Asp Glu Leu Ser Lys Phe Gly Val Asp Glu Arg
20 25 30
Ile Ile Arg Lys Ile Lys Glu Arg Gly Ile Ser Glu Phe Tyr Pro Pro
35 40 45
Gln Ala Glu Ala Leu Arg Ser Gly Val Leu Asn Gly Glu Asn Leu Leu
50 55 60
Leu Ala Ile Pro Thr Ala Ser Gly Lys Thr Leu Val Ala Glu Ile Val
65 70 75 80
Met Leu His Lys Leu Phe Thr Gly Gly Gly Lys Ala Val Tyr Leu Val
85 90 95
Pro Leu Lys Ala Leu Ala Glu Glu Lys Tyr Arg Glu Phe Lys Thr Trp
100 105 110
Glu Asp Leu Gly Val Arg Val Ala Val Thr Thr Gly Asp Tyr Asp Ser
115 120 125
Ser Glu Glu Trp Leu Gly Lys Tyr Asp Ile Ile Ile Ala Thr Ser Glu
130 135 140
Lys Phe Asp Ser Leu Leu Arg His Lys Ser Arg Trp Ile Arg Asp Val
145 150 155 160
Thr Leu Ile Val Ala Asp Glu Ile His Leu Leu Gly Ser Tyr Asp Arg
165 170 175
Gly Ala Thr Leu Glu Met Ile Leu Ser His Met Leu Gly Lys Ala Gln
180 185 190
Ile Leu Gly Leu Ser Ala Thr Val Gly Asn Ala Glu Glu Leu Ala Glu
195 200 205
Trp Leu Asn Ala Lys Leu Val Val Ser Asp Trp Arg Pro Val Lys Leu
210 215 220
Arg Lys Gly Val Phe Ala His Gly Gln Leu Ile Trp Glu Asp Gly Lys
225 230 235 240
Val Asp Lys Phe Pro Pro Gln Trp Asp Ser Leu Val Ile Asp Ala Val
245 250 255
Lys Lys Gly Lys Gln Ala Leu Val Phe Val Asn Thr Arg Arg Ser Ala
260 265 270
Glu Lys Glu Ala Gly Met Leu Gly Lys Lys Val Arg Arg Leu Leu Thr
275 280 285
Lys Pro Glu Ala Arg Arg Leu Lys Glu Leu Ala Glu Ser Leu Glu Ser
290 295 300
Asn Pro Thr Asn Asp Lys Leu Lys Glu Val Leu Val Asn Gly Ala Ala
305 310 315 320
Phe His His Ala Gly Leu Gly Arg Ala Glu Arg Thr Leu Ile Glu Asp
325 330 335
Ala Phe Arg Glu Gly Leu Ile Lys Val Leu Thr Ala Thr Pro Thr Leu
340 345 350
Ala Met Gly Val Asn Leu Pro Ser Phe Arg Val Ile Ile Arg Asp Thr
355 360 365
Lys Arg Tyr Ser Thr Phe Gly Trp Ser Asp Ile Pro Val Leu Glu Ile
370 375 380
Gln Gln Met Ile Gly Arg Ala Gly Arg Pro Lys Tyr Asp Lys Glu Gly
385 390 395 400
Glu Ala Ile Ile Val Ala Lys Thr Glu Lys Pro Glu Glu Leu Met Glu
405 410 415
Lys Tyr Ile Phe Gly Lys Pro Glu Lys Leu Phe Ser Met Leu Ser Asn
420 425 430
Asp Ala Ala Phe Arg Ser Gln Val Leu Ala Leu Ile Thr Asn Phe Gly
435 440 445
Val Glu Ser Phe Arg Glu Leu Ile Gly Phe Leu Glu Lys Thr Phe Tyr
450 455 460
Tyr His Gln Arg Lys Asp Leu Glu Ile Leu Glu Gly Lys Ala Lys Ser
465 470 475 480
Ile Val Tyr Phe Leu Leu Glu Asn Glu Phe Ile Asp Ile Asp Leu Asn
485 490 495
Asp Ser Phe Ile Ala Leu Pro Phe Gly Ile Arg Thr Ser Gln Leu Tyr
500 505 510
Leu Asp Pro Leu Thr Ala Lys Lys Phe Lys Asp Ala Leu Pro Gln Ile
515 520 525
Glu Glu Asn Pro Asn Pro Leu Gly Ile Phe Gln Leu Leu Ala Ser Thr
530 535 540
Pro Asp Met Gly Thr Leu Ser Ile Lys Arg Lys Glu Gln Glu Ser Tyr
545 550 555 560
Leu Asp Tyr Ala Tyr Glu Met Glu Asp Tyr Leu Tyr Arg Ser Ile Pro
565 570 575
Tyr Trp Glu Asp Tyr Glu Phe Gln Lys Phe Leu Ser Glu Val Lys Thr
580 585 590
Ala Lys Leu Leu Leu Asp Trp Ile Asn Glu Val Ser Glu Ala Lys Leu
595 600 605
Ile Glu Ala Tyr Gly Ile Asp Thr Gly Asp Leu Tyr Arg Ile Ile Glu
610 615 620
Leu Ala Asp Trp Leu Met Tyr Ser Leu Ile Glu Leu Ala Lys Val Leu
625 630 635 640
Asn Ala Gly Gly Glu Thr Ile Lys Tyr Leu Arg Arg Leu His Leu Arg
645 650 655
Leu Lys His Gly Val Arg Glu Glu Leu Leu Glu Leu Val Glu Leu Pro
660 665 670
Met Ile Gly Arg Arg Arg Ala Arg Ala Leu Tyr Asn Ala Gly Phe Lys
675 680 685
Asn Val Asn Asp Ile Val Lys Ala Lys Pro Ser Glu Leu Leu Ala Val
690 695 700
Glu Gly Ile Gly Val Lys Val Leu Glu Arg Ile Tyr Arg His Phe Gly
705 710 715 720
Val Glu Leu Pro Leu Leu Lys Asn Ile Lys Asp Pro Asp Lys Pro Glu
725 730 735
Asp Lys Pro Lys Glu Lys Pro Lys Pro Lys Lys Gly Thr Leu Asp Tyr
740 745 750
Phe Leu Lys
755
<210> 35
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性Hel308基序
<400> 35
Gln Met Ile Gly Arg Ala Gly Arg
1 5
<210> 36
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性扩展的Hel308基序
<400> 36
Gln Met Ile Gly Arg Ala Gly Arg Pro
1 5
<210> 37
<211> 744
<212> PRT
<213> 西伯利亚热球菌( Thermococcus sibiricus)
<400> 37
Met Lys Leu Asn Lys Leu Lys Ser Tyr Ile Asn Ala Phe Leu Leu Gly
1 5 10 15
Met Val Met Ser Met Lys Val Asp Glu Leu Lys Ser Leu Gly Val Asp
20 25 30
Glu Arg Ile Leu Arg Leu Leu Arg Glu Arg Gly Ile Glu Glu Leu Tyr
35 40 45
Pro Pro Gln Ala Asp Ala Leu Lys Thr Glu Val Leu Lys Gly Lys Asn
50 55 60
Leu Val Leu Ala Ile Pro Thr Ala Ser Gly Lys Thr Leu Val Ala Glu
65 70 75 80
Ile Val Met Ile Asn Lys Ile Leu Arg Glu Gly Gly Lys Thr Val Tyr
85 90 95
Leu Val Pro Leu Lys Ala Leu Ala Glu Glu Lys Tyr Lys Glu Phe Lys
100 105 110
Phe Trp Glu Lys Leu Gly Ile Arg Ile Ala Met Thr Thr Gly Asp Tyr
115 120 125
Asp Ser Thr Glu Glu Trp Leu Gly Lys Tyr Asp Ile Ile Ile Ala Thr
130 135 140
Ser Glu Lys Phe Asp Ser Leu Leu Arg His Lys Ser Pro Trp Ile Lys
145 150 155 160
Asp Ile Asn Leu Val Ile Ala Asp Glu Ile His Leu Leu Gly Ser Tyr
165 170 175
Asp Arg Gly Ala Thr Leu Glu Met Ile Leu Ala His Leu Asp Asp Lys
180 185 190
Ala Gln Ile Leu Gly Leu Ser Ala Thr Val Gly Asn Ala Glu Glu Val
195 200 205
Ala Glu Trp Leu Asn Ala Asp Leu Val Met Ser Glu Trp Arg Pro Val
210 215 220
Ala Leu Arg Lys Gly Val Phe Tyr His Gly Glu Leu Phe Trp Glu Asp
225 230 235 240
Gly Ser Ile Glu Arg Phe Pro Thr Gln Trp Asp Ser Leu Val Ile Asp
245 250 255
Ala Leu Lys Lys Gly Lys Gln Ala Leu Val Phe Val Asn Thr Arg Arg
260 265 270
Ser Ala Glu Lys Glu Ala Leu Leu Leu Ala Gly Lys Ile Gln Arg Phe
275 280 285
Leu Thr Lys Pro Glu Glu Arg Lys Leu Lys Gln Leu Ala Asp Gly Leu
290 295 300
Asp Thr Thr Pro Thr Asn Gln Lys Leu Lys Glu Ala Leu Thr Lys Gly
305 310 315 320
Val Ala Phe His His Ala Gly Leu Gly Arg Thr Glu Arg Ser Ile Ile
325 330 335
Glu Asp Ala Phe Arg Glu Gly Leu Ile Lys Val Ile Thr Ala Thr Pro
340 345 350
Thr Leu Ser Ala Gly Val Asn Leu Pro Ala Tyr Arg Val Ile Ile Arg
355 360 365
Asp Thr Lys Arg Tyr Ser Asn Phe Gly Trp Val Asp Ile Pro Val Leu
370 375 380
Glu Ile Gln Gln Met Met Gly Arg Ala Gly Arg Pro Lys Tyr Asp Ile
385 390 395 400
Glu Gly Gln Ala Ile Ile Ile Ala Lys Thr Glu Lys Pro Glu Asp Leu
405 410 415
Met Lys Arg Tyr Val Leu Gly Lys Pro Glu Lys Leu Phe Ser Met Leu
420 425 430
Ser Asn Glu Ala Ser Phe Arg Ser Gln Val Leu Ala Leu Ile Thr Asn
435 440 445
Phe Gly Val Gly Asn Phe Lys Glu Leu Val Asn Phe Leu Glu Arg Thr
450 455 460
Phe Tyr Tyr His Gln Arg Lys Asn Leu Glu Ala Leu Glu Gly Lys Ala
465 470 475 480
Lys Ser Ile Val Tyr Phe Leu Phe Glu Asn Glu Phe Ile Asp Ile Asp
485 490 495
Leu Asn Asp Gln Phe Met Pro Leu Pro Leu Gly Ile Arg Thr Ser Gln
500 505 510
Leu Tyr Leu Asp Pro Val Thr Ala Lys Lys Phe Lys Asp Ala Phe Glu
515 520 525
Lys Leu Glu Lys Asn Pro Asn Pro Leu Gly Ile Phe Gln Leu Leu Ala
530 535 540
Ser Thr Pro Asp Met Ser Ser Leu Arg Val Lys Arg Lys Glu Gln Glu
545 550 555 560
Asp Leu Leu Asp Tyr Ala Tyr Glu Met Glu Glu Tyr Leu Tyr Gln Asn
565 570 575
Ile Pro Tyr Trp Glu Asp Tyr Lys Phe Glu Lys Phe Leu Gly Glu Thr
580 585 590
Lys Thr Ala Lys Leu Leu Leu Asp Trp Ile Asn Glu Val Asn Asp Val
595 600 605
Lys Ile Leu Glu Thr Tyr Glu Ile Asp Thr Gly Asp Leu Tyr Arg Ile
610 615 620
Leu Glu Leu Val Asp Trp Leu Met Tyr Ser Leu Ile Glu Leu Tyr Lys
625 630 635 640
Leu Phe Asp Pro Lys Pro Glu Val Leu Asp Phe Leu Lys Lys Leu His
645 650 655
Ile Arg Val Lys His Gly Val Arg Glu Glu Leu Leu Glu Leu Ile Thr
660 665 670
Leu Pro Met Ile Gly Arg Lys Arg Ala Arg Ala Leu Tyr Asn Ala Gly
675 680 685
Phe Lys Gly Ile Asp Asp Ile Val Arg Ala Lys Ala Ser Glu Leu Leu
690 695 700
Lys Val Glu Gly Ile Gly Ile Gly Val Ile Glu Lys Ile Tyr Gln His
705 710 715 720
Phe Gly Val Glu Leu Pro Thr Asn Glu Lys Lys Lys Lys Val Lys Lys
725 730 735
Gly Thr Leu Asp Glu Phe Phe Lys
740
<210> 38
<211> 729
<212> PRT
<213> 巴氏甲烷八叠球菌fusaro(Methanosarcina barkeri fusaro)
<400> 38
Met Lys Ile Glu Ser Leu Asp Leu Pro Asp Glu Val Lys Gln Phe Tyr
1 5 10 15
Leu Asn Ser Gly Ile Met Glu Leu Tyr Pro Pro Gln Ala Glu Ala Val
20 25 30
Glu Lys Gly Leu Leu Glu Gly Arg Asn Leu Leu Ala Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Leu Ala Glu Leu Ala Met Leu Lys Ser Ile
50 55 60
Leu Ala Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala
65 70 75 80
Ser Glu Lys Phe Arg Arg Phe Arg Glu Phe Ser Glu Leu Gly Ile Arg
85 90 95
Val Gly Ile Ser Thr Gly Asp Tyr Asp Leu Arg Asp Glu Gly Leu Gly
100 105 110
Val Asn Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu
115 120 125
Arg Asn Glu Thr Val Trp Met Gln Glu Ile Ser Val Val Val Ala Asp
130 135 140
Glu Val His Leu Ile Asp Ser Pro Asp Arg Gly Pro Thr Leu Glu Val
145 150 155 160
Thr Leu Ala Lys Leu Arg Lys Met Asn Pro Ser Cys Gln Ile Leu Ala
165 170 175
Leu Ser Ala Thr Val Gly Asn Ala Asp Glu Leu Ala Val Trp Leu Glu
180 185 190
Ala Glu Leu Val Val Ser Glu Trp Arg Pro Thr Glu Leu Leu Glu Gly
195 200 205
Val Phe Phe Asn Gly Thr Phe Tyr Cys Lys Asp Arg Glu Lys Thr Val
210 215 220
Glu Gln Ser Thr Lys Asp Glu Ala Val Asn Leu Ala Leu Asp Thr Leu
225 230 235 240
Lys Lys Asp Gly Gln Cys Leu Val Phe Glu Ser Ser Arg Lys Asn Cys
245 250 255
Met Ala Phe Ala Lys Lys Ala Ala Ser Thr Val Lys Lys Thr Leu Ser
260 265 270
Ala Glu Asp Arg Asn Ala Leu Ala Gly Ile Ala Asp Glu Ile Leu Glu
275 280 285
Asn Ser Glu Thr Asp Thr Ser Thr Asn Leu Ala Val Cys Ile Arg Ser
290 295 300
Gly Thr Ala Phe His His Ala Gly Leu Thr Thr Pro Leu Arg Glu Leu
305 310 315 320
Val Glu Asp Gly Phe Arg Ala Gly Arg Ile Lys Leu Ile Ser Ser Thr
325 330 335
Pro Thr Leu Ala Ala Gly Leu Asn Leu Pro Ala Arg Arg Val Ile Ile
340 345 350
Arg Asn Tyr Arg Arg Tyr Ser Ser Glu Asp Gly Met Gln Pro Ile Pro
355 360 365
Val Leu Glu Tyr Lys Gln Met Ala Gly Arg Ala Gly Arg Pro Arg Leu
370 375 380
Asp Pro Tyr Gly Glu Ala Val Leu Val Ala Lys Ser Tyr Lys Glu Phe
385 390 395 400
Val Phe Leu Phe Glu Asn Tyr Ile Glu Ala Asn Ala Glu Asp Ile Trp
405 410 415
Ser Lys Leu Gly Thr Glu Asn Ala Leu Arg Thr His Val Leu Ser Thr
420 425 430
Ile Ser Asn Gly Phe Ala Arg Thr Tyr Asp Glu Leu Met Asp Phe Leu
435 440 445
Glu Ala Thr Phe Phe Ala Phe Gln Tyr Ser Asn Phe Gly Leu Ser Thr
450 455 460
Val Val Asn Glu Cys Leu Asn Phe Leu Arg Gln Glu Gly Met Leu Glu
465 470 475 480
Lys Asp Asp Ala Leu Ile Pro Thr Ser Phe Gly Lys Leu Val Ser Arg
485 490 495
Leu Tyr Ile Asp Pro Leu Ser Ala Ala Arg Ile Ala Lys Gly Leu Lys
500 505 510
Gly Ala Lys Ser Leu Ser Glu Leu Thr Leu Leu His Leu Val Cys Ser
515 520 525
Thr Pro Asp Met Arg Leu Leu Tyr Met Arg Ser His Asp Tyr Gln Asp
530 535 540
Ile Asn Asp Tyr Val Met Ala His Ala Ser Glu Phe Val Lys Val Pro
545 550 555 560
Ser Pro Phe Asp Thr Thr Glu Tyr Glu Trp Phe Leu Gly Glu Val Lys
565 570 575
Thr Ser Leu Leu Leu Leu Asp Trp Ile His Glu Lys Ser Glu Asn Glu
580 585 590
Ile Cys Leu Lys Phe Gly Thr Gly Glu Gly Asp Ile His Ser Ile Ala
595 600 605
Asp Ile Ala Glu Trp Ile Met His Val Thr Ser Gln Leu Ala Gly Leu
610 615 620
Leu Asp Leu Lys Gly Ala Arg Glu Ala Ala Glu Leu Glu Lys Arg Ile
625 630 635 640
His Tyr Gly Ala Ala Pro Glu Leu Ile Asp Leu Leu Asn Ile Arg Gly
645 650 655
Ile Gly Arg Val Arg Ala Arg Lys Leu Tyr Glu Ala Gly Phe Lys Ser
660 665 670
Ser Ala Glu Leu Ala Glu Val Asp Pro Glu Lys Val Ala Ala Leu Leu
675 680 685
Gly Pro Lys Ile Ala Asp Arg Ile Phe Lys Gln Ile Arg Gly Arg Gly
690 695 700
Thr Ser Ser Gly Ile Ile Ala Ser Glu Pro Pro Glu Lys Ser Pro Tyr
705 710 715 720
Ser Gly Gln Lys Thr Ile Ser Asp Tyr
725
<210> 39
<211> 730
<212> PRT
<213> 乙酸甲烷八叠球菌(Methanosarcina acetivorans)
<400> 39
Met Lys Ile Glu Ser Leu Asp Leu Pro Asp Glu Val Lys Arg Phe Tyr
1 5 10 15
Glu Asn Ser Gly Ile Pro Glu Leu Tyr Pro Pro Gln Ala Glu Ala Val
20 25 30
Glu Lys Gly Leu Leu Glu Gly Lys Asn Leu Leu Ala Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Leu Ala Glu Leu Ala Met Leu Lys Ser Val
50 55 60
Leu Ala Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala
65 70 75 80
Ser Glu Lys Phe Arg Arg Phe Gln Asp Phe Ser Glu Leu Gly Ile Arg
85 90 95
Val Gly Ile Ser Thr Gly Asp Tyr Asp Arg Arg Asp Glu Gly Leu Gly
100 105 110
Ile Asn Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu
115 120 125
Arg Asn Glu Thr Ala Trp Met Gln Glu Ile Ser Val Val Val Val Asp
130 135 140
Glu Val His Leu Ile Asp Ser Ala Asp Arg Gly Pro Thr Leu Glu Val
145 150 155 160
Thr Leu Ala Lys Leu Arg Lys Met Asn Pro Phe Cys Gln Ile Leu Ala
165 170 175
Leu Ser Ala Thr Val Gly Asn Ala Asp Glu Leu Ala Ala Trp Leu Asp
180 185 190
Ala Glu Leu Val Leu Ser Glu Trp Arg Pro Thr Asp Leu Met Glu Gly
195 200 205
Val Phe Phe Asp Gly Thr Phe Phe Cys Lys Asp Lys Glu Lys Leu Ile
210 215 220
Glu Gln Pro Thr Lys Asp Glu Ala Ile Asn Leu Val Leu Asp Thr Leu
225 230 235 240
Arg Glu Gly Gly Gln Cys Leu Val Phe Glu Ser Ser Arg Lys Asn Cys
245 250 255
Met Gly Phe Ala Lys Lys Ala Thr Ser Ala Val Lys Lys Thr Leu Ser
260 265 270
Ala Glu Asp Lys Glu Lys Leu Ala Gly Ile Ala Asp Glu Ile Leu Glu
275 280 285
Asn Ser Glu Thr Asp Thr Ala Ser Val Leu Ala Ser Cys Val Arg Ala
290 295 300
Gly Thr Ala Phe His His Ala Gly Leu Thr Ser Pro Leu Arg Glu Leu
305 310 315 320
Val Glu Thr Gly Phe Arg Glu Gly Tyr Val Lys Leu Ile Ser Ser Thr
325 330 335
Pro Thr Leu Ala Ala Gly Leu Asn Leu Pro Ala Arg Arg Val Ile Ile
340 345 350
Arg Ser Tyr Arg Arg Tyr Ser Ser Asp Ser Gly Met Gln Pro Ile Pro
355 360 365
Val Leu Glu Tyr Lys Gln Met Ala Gly Arg Ala Gly Arg Pro Arg Leu
370 375 380
Asp Pro Tyr Gly Glu Ala Val Leu Leu Ala Lys Ser Tyr Glu Glu Leu
385 390 395 400
Leu Phe Leu Phe Glu Lys Tyr Ile Glu Ala Gly Ala Glu Asp Ile Trp
405 410 415
Ser Lys Leu Gly Thr Glu Asn Ala Leu Arg Thr His Val Leu Ser Thr
420 425 430
Ile Ser Asn Gly Phe Ala Arg Thr Lys Glu Glu Leu Met Asp Phe Leu
435 440 445
Glu Ala Thr Phe Phe Ala Tyr Gln Tyr Ser Asn Phe Gly Leu Ser Val
450 455 460
Val Val Asp Glu Cys Leu Asn Phe Leu Arg Gln Glu Gly Met Leu Glu
465 470 475 480
Gln Asp Ser Asp Ala Leu Ile Ser Thr Met Phe Gly Lys Leu Val Ser
485 490 495
Arg Leu Tyr Ile Asp Pro Leu Ser Ala Ala Leu Ile Ala Lys Gly Leu
500 505 510
Arg Glu Ala Gly Thr Leu Thr Glu Leu Thr Leu Leu His Leu Val Cys
515 520 525
Ser Thr Pro Asp Met Arg Leu Met Tyr Met Arg Ser Gln Asp Tyr Gln
530 535 540
Asp Ile Asn Asp Phe Val Met Ala His Ala Glu Glu Phe Ser Lys Val
545 550 555 560
Pro Ser Pro Phe Asn Ile Val Glu Tyr Glu Trp Phe Leu Ser Glu Val
565 570 575
Lys Thr Ser Leu Leu Leu Met Asp Trp Ile His Glu Lys Pro Glu Asn
580 585 590
Glu Ile Cys Leu Lys Phe Gly Thr Gly Glu Gly Asp Ile His Thr Thr
595 600 605
Ala Asp Ile Ala Glu Trp Ile Met His Val Ala Thr Gln Leu Ala Arg
610 615 620
Leu Leu Asp Leu Lys Gly Ala Lys Glu Ala Ala Glu Leu Glu Lys Arg
625 630 635 640
Ile His Tyr Gly Ala Gly Pro Glu Leu Met Asp Leu Leu Asp Ile Arg
645 650 655
Gly Ile Gly Arg Val Arg Ala Arg Lys Leu Tyr Gly Ala Gly Phe Lys
660 665 670
Ser Thr Ala Asp Leu Ala Gly Ala Thr Pro Glu Lys Val Ala Ala Leu
675 680 685
Val Gly Pro Lys Ile Ala Glu Arg Ile Phe Arg Gln Ile Gly Arg Arg
690 695 700
Glu Ala Val Ser Glu Ile Ser Asp Ser Glu Arg Leu Glu Lys Ser Ser
705 710 715 720
Gln Asp Gly Gln Ser Thr Ile Ser Asp Phe
725 730
<210> 40
<211> 729
<212> PRT
<213> 马氏甲烷嗜盐菌(Methanohalophilus mahii)
<400> 40
Met Lys Ile Glu Glu Leu Asp Leu Pro Ser Glu Ala Ile Glu Val Tyr
1 5 10 15
Leu Gln Ala Gly Ile Glu Glu Leu Tyr Pro Pro Gln Ala Asp Ala Val
20 25 30
Glu Lys Gly Leu Leu Gln Gly Glu Asn Leu Leu Ala Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Leu Ala Glu Met Ala Met Leu Lys Ala Ile
50 55 60
Lys Lys Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala
65 70 75 80
Ser Glu Lys Phe Arg Asp Phe Lys Arg Phe Glu Ser Leu Gly Ile Lys
85 90 95
Thr Ala Ile Ser Thr Gly Asp Phe Asp Ser Arg Asp Glu Trp Leu Gly
100 105 110
Ser Asn Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu
115 120 125
Arg Asn Ser Thr Pro Trp Met Lys Asp Ile Thr Ala Val Ile Val Asp
130 135 140
Glu Val His Leu Leu Asp Ser Ala Asn Arg Gly Pro Thr Leu Glu Val
145 150 155 160
Thr Leu Ala Lys Leu Lys Arg Leu Asn Pro Gly Ala Gln Val Val Ala
165 170 175
Leu Ser Ala Thr Val Gly Asn Ala Met Glu Ile Ala Gln Trp Leu Glu
180 185 190
Ala Lys Leu Val Leu Ser Glu Trp Arg Pro Thr Tyr Leu His Glu Gly
195 200 205
Ile Phe Tyr Gly Asp Ala Ile Asn Phe Asp Glu Asp Gln Thr Phe Ile
210 215 220
Glu Arg Arg His Lys Glu Asp Ser Val Asn Leu Val Ile Asp Thr Val
225 230 235 240
Ile Gln Gly Gly Gln Cys Leu Val Phe Asp Ser Ser Arg Arg Asn Cys
245 250 255
Val Gly Phe Ala Lys Lys Cys Ala Pro Ala Val Gly Glu Leu Leu Asp
260 265 270
Arg Gln Asn Arg Asn Glu Leu Glu Glu Val Ala Lys Glu Val Leu Glu
275 280 285
Asn Gly Glu Thr Lys Leu Thr Glu Thr Leu Ala Tyr Cys Ile Lys Lys
290 295 300
Gly Val Ala Phe His His Ala Gly Leu Asn Ser Ala His Arg Arg Ile
305 310 315 320
Val Glu Asp Ala Phe Arg Asn Asn Leu Ile Lys Met Ile Cys Ser Thr
325 330 335
Pro Thr Leu Ala Ala Gly Leu Asn Leu Pro Ala Arg Arg Val Ile Ile
340 345 350
Arg Ser Tyr Lys Arg Tyr Asp Pro Asn Ala Gly Met Gln Pro Ile Pro
355 360 365
Val Leu Asp Tyr Lys Gln Met Ala Gly Arg Ala Gly Arg Pro His Leu
370 375 380
Asp Pro Tyr Gly Glu Ala Val Val Ile Val Lys Thr Tyr Glu Glu Phe
385 390 395 400
Thr Asp Val Leu Glu Arg Tyr Ile Ser Ala Ser Ala Glu Asp Ile Trp
405 410 415
Ser Lys Leu Gly Thr Glu Asn Ala Leu Arg Thr His Ile Leu Ser Thr
420 425 430
Ile Ala Ser Gly Phe Ala Asn Cys His Arg Glu Ile Leu Thr Phe Leu
435 440 445
Gly Ser Thr Phe Phe Ala His Gln Gln Gln Ser Trp Asn Phe Glu Glu
450 455 460
Leu Leu Glu Asp Cys Leu Ile Phe Leu Lys Asn Glu Gly Met Leu Glu
465 470 475 480
Gln Asp Asn Glu Thr Ile Arg Ala Thr Glu Leu Gly Lys Met Ile Ser
485 490 495
Ser Leu Tyr Ile Asp Pro Leu Ser Ala Ser Lys Ile Ile Arg Gly Leu
500 505 510
Glu Lys Thr Thr His Val Thr Asp Met Thr Leu Leu Gln Leu Ile Cys
515 520 525
Ser Thr Pro Asp Met Arg Leu Leu Tyr Leu Arg Asn Arg Asp Tyr Glu
530 535 540
Ile Ile Asn Asp Tyr Val Met Asn His Thr Glu Glu Phe Ile Glu Val
545 550 555 560
Pro Ser Pro Phe Lys Gln Ile Glu Tyr Glu Trp Phe Leu Ser Glu Val
565 570 575
Lys Thr Ala Leu Leu Leu Leu Glu Trp Ile Asn Glu Lys Ser Leu Glu
580 585 590
Lys Ile Val Glu Asn Tyr Gln Val Gly Glu Gly Asp Ile Tyr Ala Ser
595 600 605
Ser Asp Ile Ala Glu Trp Leu Met His Ala Thr Gln Arg Ile Ala Ser
610 615 620
Arg Ile Asn Pro Gln Leu Glu Thr Glu Cys Ala Lys Leu Glu Lys Arg
625 630 635 640
Ile His Tyr Gly Ala Gly Ser Glu Leu Ile Glu Leu Val Glu Ile Pro
645 650 655
Asn Val Gly Arg Ala Arg Ala Arg Lys Leu Phe Lys Lys Gly Tyr Arg
660 665 670
Ser Arg Gln Lys Leu Ala Thr Ala Asp Glu Lys Gln Leu Ala Gly Ile
675 680 685
Val Gly Pro Lys Ile Ala Gln Lys Ile Leu Ser Tyr Leu Gly Arg Glu
690 695 700
Thr Asp Ser Asn Gly Tyr Val Glu Pro Glu Thr Leu Glu Asn Lys Lys
705 710 715 720
Gln Gln Lys Thr Phe Gln Asp Phe Ile
725
<210> 41
<211> 730
<212> PRT
<213> 马氏甲烷八叠球菌(Methanosarcina mazei)
<400> 41
Met Lys Ile Glu Ser Leu Asp Leu Pro Asp Glu Ile Lys Arg Phe Tyr
1 5 10 15
Glu Asn Ser Gly Ile Leu Glu Leu Tyr Pro Pro Gln Ala Glu Ala Val
20 25 30
Glu Lys Gly Leu Leu Glu Gly Lys Asn Leu Leu Ala Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Leu Ala Glu Leu Ala Met Leu Lys Ser Val
50 55 60
Leu Asn Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala
65 70 75 80
Ser Glu Lys Phe Arg Arg Phe Gln Glu Phe Ser Val Leu Gly Met Arg
85 90 95
Val Gly Ile Ser Thr Gly Asp Tyr Asp Arg Arg Asp Glu Gly Leu Gly
100 105 110
Ile Asn Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu
115 120 125
Arg Asn Glu Thr Ala Trp Met Gln Glu Ile Ser Val Val Val Ala Asp
130 135 140
Glu Val His Leu Ile Asp Ser Pro Asp Arg Gly Pro Thr Leu Glu Ile
145 150 155 160
Thr Leu Ser Lys Leu Arg Arg Met Asn Pro Ser Cys Gln Val Leu Ala
165 170 175
Leu Ser Ala Thr Val Gly Asn Ala Asp Glu Leu Ala Ala Trp Leu Asp
180 185 190
Ala Glu Leu Val Leu Ser Glu Trp Arg Pro Thr Asp Leu Met Glu Gly
195 200 205
Val Phe Tyr Asn Gly Ile Phe Tyr Cys Lys Asp Lys Glu Lys Pro Val
210 215 220
Gly Gln Pro Thr Lys Asp Glu Ala Val Asn Leu Val Leu Asp Thr Ile
225 230 235 240
Lys Glu Gly Gly Gln Cys Leu Val Phe Glu Ser Ser Arg Lys Asn Cys
245 250 255
Met Gly Phe Ala Lys Lys Ala Val Ser Ala Val Lys Lys Thr Leu Ser
260 265 270
Asn Glu Asp Arg Glu Thr Leu Ala Gly Ile Ala Asp Glu Ile Ile Glu
275 280 285
Asn Ser Glu Thr Asp Val Ser Ser Val Leu Ala Thr Cys Val Arg Ser
290 295 300
Gly Thr Ala Phe His His Ala Gly Leu Thr Thr Pro Leu Arg Glu Leu
305 310 315 320
Val Glu Asn Gly Phe Arg Glu Gly Arg Ile Lys Ile Ile Ser Ser Thr
325 330 335
Pro Thr Leu Ala Ala Gly Leu Asn Leu Pro Ala Arg Arg Val Ile Ile
340 345 350
Arg Ser Tyr Arg Arg Tyr Ser Ser Asp Ser Gly Met Gln Pro Ile Pro
355 360 365
Val Leu Glu Tyr Lys Gln Met Ala Gly Arg Ala Gly Arg Pro Arg Leu
370 375 380
Asp Pro Tyr Gly Glu Ala Val Leu Leu Ala Lys Ser Tyr Glu Glu Phe
385 390 395 400
Val Phe Leu Phe Glu Lys Tyr Ile Glu Ala Gly Ala Glu Asp Ile Trp
405 410 415
Ser Lys Leu Gly Thr Glu Asn Ala Leu Arg Thr His Ile Leu Ser Thr
420 425 430
Ile Ser Asn Gly Phe Ala Arg Thr Arg Glu Glu Leu Met Asp Phe Leu
435 440 445
Glu Ala Thr Phe Phe Ala Phe Gln Tyr Ser Asn Phe Gly Leu Ser Ala
450 455 460
Val Val Asp Glu Cys Leu Asp Phe Leu Arg Arg Glu Gly Met Leu Glu
465 470 475 480
Lys Asp Pro Asp Ala Leu Val Ser Thr Val Phe Gly Lys Leu Val Ser
485 490 495
Arg Leu Tyr Ile Asp Pro Leu Ser Ala Ala Leu Ile Ala Lys Gly Leu
500 505 510
Arg Glu Ala Gly Thr Leu Thr Glu Leu Thr Leu Leu His Leu Ile Cys
515 520 525
Ser Thr Pro Asp Met Arg Leu Met Tyr Met Arg Ser Gln Asp Tyr Gln
530 535 540
Glu Val Asn Asp Tyr Val Met Ala His Ala Gly Glu Phe Ser Lys Val
545 550 555 560
Pro Asn Pro Phe Asn Ile Ala Glu Tyr Glu Trp Phe Leu Gly Glu Val
565 570 575
Lys Thr Ser Leu Leu Leu Met Asp Trp Ile His Glu Lys Pro Glu Asn
580 585 590
Glu Ile Cys Leu Lys Phe Gly Ile Gly Glu Gly Asp Ile His Ala Thr
595 600 605
Ala Asp Ile Ala Glu Trp Ile Met His Val Thr Ala Gln Leu Ala Gly
610 615 620
Leu Leu Asp Leu Lys Gly Ala Lys Glu Ala Ser Glu Leu Glu Lys Arg
625 630 635 640
Ile Arg Tyr Gly Ala Ala Pro Glu Leu Met Asp Leu Leu Asp Ile Arg
645 650 655
Ser Val Gly Arg Val Arg Ala Arg Lys Leu Tyr Glu Ala Gly Phe Lys
660 665 670
Ser Thr Ala Glu Leu Ala Ala Ala Ser Pro Glu His Ile Ala Val Leu
675 680 685
Val Gly Pro Lys Ile Thr Glu Arg Ile Phe Lys Gln Ile Gly Arg Arg
690 695 700
Glu Ala Val Ser Glu Phe Ser Asp Ile Glu Pro Leu Glu Lys Gly Ser
705 710 715 720
Ser Asp Gly Gln Arg Thr Ile Ser Asp Tyr
725 730
<210> 42
<211> 693
<212> PRT
<213> 嗜热甲壳菌(Methanosaeta thermophila)
<400> 42
Met Leu Thr Ile Arg Asp Leu Ile Arg Trp Leu Pro Glu Ser Val Ile
1 5 10 15
Glu Leu Tyr Glu Ala Leu Gly Ile Asp Glu Leu Tyr Pro Pro Gln Ala
20 25 30
Glu Ala Ile Glu Arg Gly Leu Leu Asp Gly Arg Asn Met Ile Ile Ser
35 40 45
Val Pro Thr Ala Ala Gly Lys Thr Leu Leu Ala Glu Leu Ala Met Leu
50 55 60
Arg Gly Ala Leu Ser Gly Lys Arg Ser Leu Tyr Ile Val Pro Leu Arg
65 70 75 80
Ala Leu Ala Ser Glu Lys Phe Glu Ser Phe Ser Arg Phe Ser Lys Leu
85 90 95
Gly Leu Arg Val Gly Ile Ser Thr Gly Asp Phe Glu Lys Arg Asp Glu
100 105 110
Arg Leu Gly Arg Asn Asp Ile Ile Ile Ala Thr Ser Glu Lys Ala Asp
115 120 125
Ser Leu Ile Arg Asn Gly Ala Ser Trp Val Arg Arg Ile Gly Val Leu
130 135 140
Val Val Asp Glu Ile His Leu Leu Asp Ser Ala Asn Arg Gly Pro Thr
145 150 155 160
Leu Glu Met Thr Met Thr Lys Leu Met His Leu Asn Pro Glu Met Gln
165 170 175
Val Ile Gly Leu Ser Ala Thr Ile Ala Asn Gly Arg Glu Ile Ala Asp
180 185 190
Trp Ile Lys Gly Glu Ile Val Ser Ser Asp Trp Arg Pro Val Arg Leu
195 200 205
Arg Glu Gly Val Leu Leu Glu Asp Arg Leu Val Phe Pro Asp Gly Glu
210 215 220
Ile Gln Leu Glu Asn Arg Asn Arg Asp Pro Val Leu Asn Leu Val Leu
225 230 235 240
Asp Thr Val Asp Gln Gly Gly Gln Met Leu Ile Phe Glu Ser Thr Arg
245 250 255
Arg Asn Ala Glu Ser Met Ala Lys Lys Val Ser Gly Ala Leu Gln Glu
260 265 270
Ser Gly Glu Thr Ile Glu Leu Ala Glu Arg Leu Ser Gly Glu Gly Lys
275 280 285
Thr Ala Lys Lys Leu Ala Met Cys Leu Arg His Gly Ala Ala Phe His
290 295 300
His Ala Gly Leu Leu Pro Glu Gln Arg Arg Leu Ile Glu Leu Gly Phe
305 310 315 320
Arg Gln Asn Val Val Lys Val Ile Ala Cys Thr Pro Thr Leu Ala Ala
325 330 335
Gly Leu Asn Leu Pro Ala Arg Arg Val Leu Ile Arg Ser Tyr Lys Arg
340 345 350
Tyr Glu Ala Gly Leu Gly Thr Arg Pro Ile Pro Val Met Glu Tyr Arg
355 360 365
Gln Met Ala Gly Arg Ala Gly Arg Pro Gly Leu Asp Pro Tyr Gly Glu
370 375 380
Ser Leu Ile Met Ala Arg Ser Glu Ser Glu Leu Gln Lys Leu Met Asp
385 390 395 400
His Tyr Val Met Gly Glu Pro Glu Asp Ile Trp Ser Lys Leu Ala Ser
405 410 415
Glu Arg Ala Leu Arg Thr His Val Leu Ala Thr Ile Ala Ser Arg Phe
420 425 430
Ala Asp Ser Val Asp Ser Leu Ser Arg Leu Met Ala Ser Thr Phe Tyr
435 440 445
Ala Arg Gln Gln Asp Pro Ser Tyr Leu Gly Glu Thr Ile Ala Ser Val
450 455 460
Leu Glu Phe Leu Val Arg Ser Asp Met Ile Asp Lys Asp Leu Thr Pro
465 470 475 480
Thr Pro Leu Gly Ala Leu Val Ser Arg Leu Tyr Ile Asp Pro Leu Ser
485 490 495
Ala Met Val Met Ile Gln Glu Ile Arg Gly Ile Arg Arg Pro Thr Val
500 505 510
Leu Thr Leu Leu His Val Ile Thr Met Thr Pro Asp Met Glu Leu Leu
515 520 525
Phe Val Gln Gln Ser Asp Asn Trp Leu Glu Asp Phe Ile Ser Glu His
530 535 540
Ser Ser Glu Leu Gly Asn Glu Lys Asn Phe Asp Trp Leu Leu Arg Glu
545 550 555 560
Val Lys Thr Ala Ser Met Leu Met Asp Trp Ile Asn Glu Val His Glu
565 570 575
Asp Arg Ile Glu Asp Arg Tyr Ser Ile Ser Pro Gly Asp Leu Val Arg
580 585 590
Ile Ala Glu Thr Ala Glu Trp Leu Met Ser Ala Leu His Arg Ile Ser
595 600 605
Lys His Met Asp Leu Gly Val Thr Tyr Leu Ala Glu Arg Leu Ala Leu
610 615 620
Arg Ile His Tyr Gly Ala Gly Asp Glu Leu Leu Gln Leu Leu Glu Leu
625 630 635 640
Lys Gly Ile Gly Arg Val Arg Ala Arg Lys Leu Tyr Gln Ala Gly Tyr
645 650 655
Arg Ser Leu Glu Asp Leu Lys Ala Ala Asp Lys Ser Thr Leu Ser Glu
660 665 670
Ile Leu Gly Pro Lys Ile Ala Glu Gly Val Ile Ser Gln Leu Lys Glu
675 680 685
Pro Gly Val Ser Ala
690
<210> 43
<211> 739
<212> PRT
<213> 朱丽娜盐地甲烷菌(Methanosalsum zhilinae)
<400> 43
Met Asn Ile Asn Asn Leu Asn Leu Pro Glu Lys Val Lys Lys Tyr Tyr
1 5 10 15
Thr Asp Thr Gly Ile Val Asp Leu Tyr Pro Pro Gln Arg Glu Ala Val
20 25 30
Asp Lys Gly Leu Leu Asp Gly Glu Asn Ile Val Ala Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Leu Ala Glu Leu Cys Met Leu Lys Ser Ile
50 55 60
Gly Met Gly Gly Lys Cys Leu Tyr Ile Val Pro Leu Lys Ala Leu Ala
65 70 75 80
Ser Glu Lys Tyr Ser Arg Phe Arg Glu Phe Glu Ser Leu Gly Ile Lys
85 90 95
Val Gly Ile Ala Thr Gly Asp Leu Asp Ser Arg Glu Glu Trp Leu Gly
100 105 110
Lys Asn Asp Ile Ile Ile Ala Thr Ser Glu Lys Val Asp Ser Leu Leu
115 120 125
Arg Asn Glu Ser Ser Trp Met Lys Glu Ile Asn Thr Val Val Ala Asp
130 135 140
Glu Val His Leu Leu Asn Ser Val Asn Arg Gly Pro Thr Leu Glu Ile
145 150 155 160
Thr Leu Ala Lys Leu Ile His Leu Asn Pro Gly Ser Gln Ile Ile Ala
165 170 175
Leu Ser Ala Thr Ile Gly Asn Pro Glu Asp Ile Ala Gly Trp Leu Gly
180 185 190
Ala Arg Leu Val Val Ser Glu Trp Arg Pro Thr Asp Leu Tyr Glu Gly
195 200 205
Ile Leu Leu Asp Gly Leu Leu His Ile Gly Asn Ile Lys Lys Asp Ile
210 215 220
Gln Asp Glu Ser Arg Asp Asp Ala Val Asn Leu Val Ile Asp Thr Val
225 230 235 240
Lys Asp Lys Gly Gln Cys Leu Val Phe Glu Ser Ser Arg Arg Asn Cys
245 250 255
Met Gly Phe Ala Lys Lys Ala Gly Lys Trp Val Ser Lys Ile Leu Asp
260 265 270
Glu His Asp Thr Ile Gln Leu Lys Ser Leu Ser Gln Glu Ile Gly Glu
275 280 285
Ala Gly Glu Thr Glu Ile Ala Asp Val Leu Ser Arg Cys Val Arg Gln
290 295 300
Gly Val Ala Phe His His Ala Gly Leu Asn Ser Glu His Arg Arg Met
305 310 315 320
Val Glu Glu Gly Phe Arg Lys Asn Leu Ile Lys Met Ile Ser Ser Thr
325 330 335
Pro Thr Leu Ala Ala Gly Leu Asn Leu Pro Ala Arg Arg Val Ile Ile
340 345 350
Arg Ser Tyr Lys Arg Tyr Asp Pro Asn Phe Gly Met Lys Pro Ile Pro
355 360 365
Val Leu Glu Tyr Lys Gln Met Ala Gly Arg Ala Gly Arg Pro His Leu
370 375 380
Asp Pro Tyr Gly Glu Ser Val Leu Ile Ala Arg Ser Tyr Asp Glu Phe
385 390 395 400
Met Asp Ile Met Glu Asn Tyr Val Asn Ala Asp Pro Glu Asp Ile Trp
405 410 415
Ser Lys Leu Gly Thr Glu Asn Ala Leu Arg Thr His Val Leu Ser Thr
420 425 430
Ile Val Asn Gly Phe Ala Tyr Thr Tyr Arg Gly Leu Met Asp Phe Val
435 440 445
Lys Met Thr Phe Phe Ala Tyr Gln Lys Glu Ala Ser Asp Leu His Asp
450 455 460
Val Ile Glu Glu Cys Val Arg Phe Leu Ile Asp Asn Glu Met Ile Ile
465 470 475 480
Ser Asp Ser Asn Asp Ile Leu Pro Glu Ser Ala Phe Arg Ser Thr Ala
485 490 495
Thr Gly Lys Leu Ile Ser Met Leu Tyr Ile Asp Pro Leu Ser Gly Ser
500 505 510
Leu Ile Met Asp Gly Ile Arg Lys Ala Asp Tyr Phe Glu Asp Ile Thr
515 520 525
Met Met His Leu Ile Cys Ser Thr Pro Asp Met Lys Asn Leu Tyr Met
530 535 540
Arg Ser Ser Asp Tyr Glu Asn Val Asn Met Tyr Val Leu Gln Asn Lys
545 550 555 560
Asp Lys Phe Ile Ser Met Pro Ser Pro Phe Lys Met Ile Glu Tyr Glu
565 570 575
Trp Phe Leu Gly Glu Val Lys Thr Ala Leu Leu Leu Leu Asp Trp Ile
580 585 590
Asn Glu Val Pro Ala Asp Asp Ile Cys Lys Lys Tyr Gly Ile Gly Glu
595 600 605
Gly Asp Ile Arg Met Phe Ser Glu Thr Ala Val Trp Leu Met His Ala
610 615 620
Thr Ser Arg Leu Ser Gly Leu Leu Lys Val Ser Glu Ala Ser Glu Lys
625 630 635 640
Ser Lys Glu Leu Glu Lys Arg Leu Ser Tyr Gly Ile Asn Ser Glu Leu
645 650 655
Val Asn Ile Val Ala Leu Lys Gly Ile Gly Arg Val Arg Ala Arg Lys
660 665 670
Ile Tyr Glu Asn Gly Tyr Arg Ser Ile Asp Asp Leu Lys Lys Ala Asp
675 680 685
Pro Leu Lys Leu Ser Lys Ile Val Gly Ser Lys Ile Ser Gln Lys Ile
690 695 700
Leu Lys Gln Leu Asp Ile Asp Val Asp Ile Ser Glu Ile Lys Glu Lys
705 710 715 720
Asp Ser Asp Thr Val Pro Glu Pro Glu Ser Ser Gln Lys Thr Ile Ser
725 730 735
Asp Phe Thr
<210> 44
<211> 733
<212> PRT
<213> Methanohalobium evestigatum
<400> 44
Met Glu Thr Gly Lys Leu Glu Leu Pro Glu Tyr Val Ile Gln Phe Tyr
1 5 10 15
Leu Asp Thr Gly Ile Glu Lys Leu Tyr Pro Pro Gln Ala Glu Ala Val
20 25 30
Glu Lys Gly Leu Leu Asp Asn Lys Asn Leu Leu Ala Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Ile Ser Glu Leu Ala Met Leu Lys Ser Ile
50 55 60
Ser Asn Gly Gly Lys Cys Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala
65 70 75 80
Ser Glu Lys Phe Glu Arg Phe Lys Gln Phe Ser Ser Ile Gly Val Asn
85 90 95
Ile Gly Ile Ser Thr Gly Asp Phe Asp Ser Thr Asp Glu Trp Leu Gly
100 105 110
Ser Asn Asp Ile Ile Val Ala Thr Ser Glu Lys Ala Asp Ser Leu Leu
115 120 125
Arg Asn Glu Thr Ser Trp Met Lys Asp Ile Thr Thr Ile Val Val Asp
130 135 140
Glu Ile His Leu Leu Asp Ser Ala Asp Arg Gly Pro Thr Leu Glu Ile
145 150 155 160
Thr Ile Ala Lys Leu Leu Arg Leu Asn Pro Asn Ser Gln Ile Ile Gly
165 170 175
Leu Ser Ala Thr Ile Gly Asn Ala Glu Glu Ile Ala Gly Trp Leu Asp
180 185 190
Ala Glu Leu Val Gln Ser Gln Trp Arg Pro Ile Glu Leu Tyr Glu Gly
195 200 205
Val Phe Leu Glu Asp Asn Ile Asn Phe Lys Gln Ser Gln Lys Pro Ile
210 215 220
Lys Asn Ile Val Lys Asp Thr Ala Val Asn Leu Val Leu Asp Thr Ile
225 230 235 240
Asp Glu Asn Gly Gln Cys Leu Val Phe Glu Ser Ser Arg Arg Asn Cys
245 250 255
Ala Gly Phe Ala Lys Lys Ala Lys Ser Lys Val Gly Lys Ser Leu Asp
260 265 270
Lys Gly Leu Leu Ala Glu Leu Asn Asn Ile Ala Glu Glu Val Leu Glu
275 280 285
Thr Ser Asp Thr Glu Thr Thr Lys Glu Leu Ala Ser Cys Ile Lys Arg
290 295 300
Gly Thr Ala Phe His His Ala Gly Leu Asn Ser Ala Gln Arg Lys Ile
305 310 315 320
Val Glu Asp Asn Phe Arg Asn Asn Lys Ile Lys Val Ile Ser Ser Thr
325 330 335
Pro Thr Leu Ala Ala Gly Leu Asn Leu Pro Ala Arg Arg Val Ile Val
340 345 350
Arg Asn Tyr Lys Arg Tyr Asp Pro Asn Phe Gly Met Gln Pro Ile Pro
355 360 365
Val Leu Asp Tyr Lys Gln Met Ala Gly Arg Ala Gly Arg Pro Ser Leu
370 375 380
Asp Pro Tyr Gly Glu Ser Val Leu Ile Ser His Thr Tyr Asn Glu Phe
385 390 395 400
Thr Asp Leu Leu Asp Arg Tyr Ile Asp Ala Glu Pro Glu Asp Ile Leu
405 410 415
Ser Lys Leu Gly Thr Glu Asn Ala Leu Arg Thr His Val Leu Ser Thr
420 425 430
Ile Val Asn Gly Phe Ala Thr Thr Arg Gln Gly Met Val Asp Phe Met
435 440 445
Gly Ser Ser Phe Phe Ala Tyr Gln Gln Gln Lys Trp Ser Leu Ile Asp
450 455 460
Val Val Asp Asp Cys Ile Glu Phe Leu Gln Asp Asn Glu Met Ile Lys
465 470 475 480
Asp Asp Gly Glu Arg Leu Tyr Ala Thr Arg Leu Gly Gln Val Ile Ser
485 490 495
Thr Leu Tyr Ile Asp Pro Leu Ser Gly Ala Ile Ile Ile Asp Lys Leu
500 505 510
Lys Lys Ala Asp Lys Val Thr Asp Met Thr Met Leu His Ile Ile Cys
515 520 525
Ser Thr Pro Asp Met Arg Gln Leu Tyr Leu Arg Ser Lys Glu Tyr Glu
530 535 540
Lys Ile Asn Glu Tyr Val Met Thr His Ser Asp Glu Phe Val Glu Val
545 550 555 560
Pro Asn Pro Phe Lys Ser Ile Glu Tyr Glu Trp Phe Leu Gly Glu Val
565 570 575
Lys Thr Ala Leu Leu Ile Asn Glu Trp Ile Asp Glu Lys Thr Leu Asp
580 585 590
Asp Ile Thr Ala Glu Phe Gly Val Gly Glu Gly Asp Ile Asn Ala Leu
595 600 605
Ser Asp Ile Ser Glu Trp Leu Met His Ser Ala Val Asn Leu Ala Asn
610 615 620
Leu Thr Asp Leu Asp Ala Asp Lys Ala Gln Glu Leu Glu Lys Arg Ile
625 630 635 640
His His Gly Val Asn Lys Asp Leu Ile Gln Leu Val Ser Ile Ser Asn
645 650 655
Ile Gly Arg Val Arg Ala Arg Lys Leu Tyr Glu Ala Gly Ile Gln Ser
660 665 670
Val Ser Asp Ile Lys Asn Thr Lys Leu His Ile Leu Ser Asn Tyr Leu
675 680 685
Gly Arg Lys Thr Ala Tyr Lys Val Leu Glu Gln Leu Gly Val Glu Pro
690 695 700
Glu Asp Asn Gln Gln Ile Asp Glu Glu Pro Glu Ser Ile Lys Ser Tyr
705 710 715 720
Ser Gly Asn Asp Gln Gly Gln Lys Thr Phe Asn Asp Phe
725 730
<210> 45
<211> 747
<212> PRT
<213> 海藻产甲烷球菌(Methanococcus maripaludis)
<400> 45
Met His Val Leu Asp Leu Leu Lys Glu Asn Lys Ile Thr Glu Leu Arg
1 5 10 15
Pro Pro Gln Lys Lys Val Ile Asp Glu Gly Leu Phe Asp Lys Thr Lys
20 25 30
Asn Phe Leu Ile Cys Ile Pro Thr Ala Ser Gly Lys Thr Leu Ile Gly
35 40 45
Glu Met Ala Leu Leu Asn His Ile Leu Asp Glu Asn Lys Asn Leu Thr
50 55 60
Gly Lys Lys Gly Leu Phe Ile Val Pro Leu Lys Ala Leu Ala Asn Glu
65 70 75 80
Lys Phe Asp Glu Phe Arg Glu Lys Tyr Glu Lys Tyr Gly Ile Lys Val
85 90 95
Gly Leu Ser Ile Gly Asp Phe Asp Thr Lys Glu Asn Leu Ser Lys Phe
100 105 110
His Ile Ile Ile Thr Thr Ser Glu Lys Leu Asp Ser Leu Met Arg His
115 120 125
Asn Val Glu Trp Ile Asn Asp Val Ser Leu Ala Val Ile Asp Glu Ile
130 135 140
His Leu Ile Gly Asp Asn Glu Arg Gly Gly Thr Leu Glu Val Ile Leu
145 150 155 160
Thr Lys Leu Lys Asn Leu Asn Ala Gln Ile Val Gly Leu Ser Ala Thr
165 170 175
Ile Gly Asn Pro Glu Glu Leu Ser Asn Trp Leu Asn Ala Lys Leu Ile
180 185 190
Val Asp Gly Trp Arg Pro Val Glu Leu Lys Lys Gly Ile Tyr Phe Glu
195 200 205
Asn Glu Leu Glu Phe Leu Lys Asn Pro Ala Lys Lys Ile Lys Gln Val
210 215 220
Ser Arg Asn Asn Leu Thr Asp Leu Ile Val Asp Ser Val Glu Glu Lys
225 230 235 240
Gly Ser Cys Leu Ile Phe Cys Asn Ser Lys Arg Asn Ala Val Gly Glu
245 250 255
Ala Lys Lys His Asn Leu Ala Lys Tyr Leu Thr Arg Thr Glu Gln His
260 265 270
Glu Leu Asn Lys Leu Ser Glu Glu Ile Leu Ser Ile Leu Asp Arg Pro
275 280 285
Val Glu Thr Cys Lys Ala Leu Ser Lys Cys Ile Gln Asn Gly Val Ala
290 295 300
Phe His His Ala Gly Leu Thr Tyr Lys His Arg Lys Ile Val Glu Asp
305 310 315 320
Gly Phe Arg Asn Arg Leu Ile Lys Val Ile Cys Cys Thr Pro Thr Leu
325 330 335
Ser Ala Gly Leu Asn Leu Pro Cys Arg Arg Ala Ile Val Arg Asp Ile
340 345 350
Lys Arg Tyr Ser Gln Asn Gly Leu Val Asp Ile Pro Arg Met Glu Ile
355 360 365
Gln Gln Cys Ile Gly Arg Ala Gly Arg Pro Gly Leu Asp Pro Tyr Gly
370 375 380
Glu Gly Ile Ile Tyr Ile Lys Asn Glu Arg Asp Ala Glu Lys Ala Tyr
385 390 395 400
Glu Ile Leu Thr Gly Ser Val Glu Asn Ile Tyr Ser Lys Leu Ala Asn
405 410 415
Gln Lys Val Leu Arg Ile His Ile Leu Gly Leu Ile Ser Thr Gly Glu
420 425 430
Ile Lys Asp Gly Gln Asn Leu Val Asn Phe Met Lys Asn Thr Phe Tyr
435 440 445
Ala His Gln Phe Gly Asn Ile Gly Ala Val Leu Leu Asn Val Ser Glu
450 455 460
Val Val Glu Phe Leu Glu Lys Asn Lys Phe Leu Glu Thr Thr Ile His
465 470 475 480
Lys Lys Thr Glu Asn Lys Val Arg Glu Leu Ser Phe Asp Ser Ser Asn
485 490 495
Asn Leu Val Leu Asp Ser Lys Glu Thr Ser Phe Asp Leu Thr Asn Pro
500 505 510
Asn Ser Asn Ile Glu Phe Arg Ser Thr Lys Leu Gly Lys Arg Ile Ser
515 520 525
Glu Leu Tyr Ile Asp Pro Met Ser Ser Glu Ile Ile Ile Glu Glu Leu
530 535 540
His Glu Leu Lys Lys Lys Cys Asp Gln Leu Asp Arg Ser Lys Ile Asp
545 550 555 560
Gln Tyr Leu Phe Tyr Leu Ile Ser Lys Thr Asn Glu Met Arg Pro Leu
565 570 575
Leu Arg Ile Arg Pro Asn Glu Glu Leu Asp Leu Ile Leu Glu Met Asp
580 585 590
Lys Met Gly Leu Lys Asp Tyr Ser Ile Glu Asn Ile Glu Ala Phe Lys
595 600 605
Asn Ser Lys Met Phe Cys Asp Trp Val Ser Glu Ile Pro Glu Glu Ile
610 615 620
Ile Leu Glu Lys Tyr Gly Val Glu Pro Gly Ile Leu Arg Tyr Lys Val
625 630 635 640
Glu Gln Ala Lys Trp Met Ile Tyr Ser Thr Lys Glu Ile Ala Lys Leu
645 650 655
Ile His Leu Asp Asn Ser Glu Ile Tyr Lys Ser Leu Leu Lys Met Glu
660 665 670
Val Arg Ile Glu Tyr Gly Ala Lys Glu Glu Leu Ile Glu Leu Leu Asn
675 680 685
Val Lys Asn Val Gly Arg Ile Arg Ser Arg Lys Leu Tyr Asp Ala Gly
690 695 700
Ile Arg Ser Lys Ile Glu Ile Asn Lys Asn Pro Glu Lys Ile Leu Glu
705 710 715 720
Leu Phe Gly Glu Lys Ile Gly Lys Lys Ile Leu Gly Glu His Gly Met
725 730 735
Lys Tyr Gly Gln Gln Thr Leu Leu Asn Phe Asn
740 745
<210> 46
<211> 799
<212> PRT
<213> Natrialba magadii
<400> 46
Met Asn Val Glu Glu Leu Ser Gly Leu Pro Pro Gly Ala Arg Ser His
1 5 10 15
Phe Gln Glu Gln Gly Ile Glu Glu Leu Tyr Pro Pro Gln Ala Glu Ala
20 25 30
Val Glu Ala Gly Ala Thr Glu Gly Glu Asn Leu Val Ala Ala Val Pro
35 40 45
Thr Ala Ser Gly Lys Thr Met Ile Ala Ala Leu Ser Met Leu Ser Ala
50 55 60
Val Gln Arg Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu Arg Ala Leu
65 70 75 80
Ala Ser Glu Lys Lys Ala Glu Phe Asp Ala Tyr Glu Glu Phe Gly Val
85 90 95
Thr Thr Gly Val Ala Thr Gly Asn Tyr Glu Ser Thr Ser Glu Trp Leu
100 105 110
Ala Thr Lys Asp Ile Ile Val Ala Thr Ser Glu Lys Val Asp Ser Leu
115 120 125
Val Arg Asn Gly Ala Asp Trp Leu Ser Asp Leu Thr Cys Val Val Ser
130 135 140
Asp Glu Val His Leu Ile Asp Asp Arg Asn Arg Gly Pro Thr Leu Glu
145 150 155 160
Val Thr Leu Ala Lys Leu Arg Arg Leu Asn Pro Gln Leu Gln Val Val
165 170 175
Ala Leu Ser Ala Thr Val Gly Asn Ala Asp Glu Leu Ala Asp Trp Leu
180 185 190
Asp Ala Glu Leu Val Asp Thr Asp Trp Arg Pro Ile Asp Leu Gln Met
195 200 205
Gly Val His Tyr Gly Asn Ala Leu Asn Phe Asp Asp Gly Glu Thr Arg
210 215 220
Glu Val Pro Val Glu Ala Gly Glu Lys Gln Glu Ala Ala Leu Val Arg
225 230 235 240
Asp Ile Leu Gln Glu Gly Gly Ser Ser Leu Val Phe Val Asn Ser Arg
245 250 255
Arg Asn Ala Glu Ala Ala Ala Arg Arg Leu Gly Gln Val Ser Ser Arg
260 265 270
Glu Leu Thr Ala Gly Glu Gln Asn Asp Leu Ala Ala Leu Ala Thr Glu
275 280 285
Ile Arg Glu Asp Ser Asp Thr Glu Thr Ser Gln Asp Leu Ala Asp Cys
290 295 300
Val Glu Arg Gly Ala Ala Phe His His Ala Gly Leu Ser Ser Thr Gln
305 310 315 320
Arg Ser Leu Val Glu Asp Ala Phe Arg Asp Arg Leu Leu Lys Val Ile
325 330 335
Ser Ala Thr Pro Thr Leu Ala Ala Gly Val Asn Thr Pro Ala Arg Arg
340 345 350
Val Ile Val Arg Asp Trp Arg Arg Phe Asp Pro Ser Ala Gly Gly Met
355 360 365
Ala Pro Leu Asp Val Leu Glu Val His Gln Met Met Gly Arg Ala Gly
370 375 380
Arg Pro Gly Leu Asp Pro Tyr Gly Glu Ala Val Leu Leu Ala Lys Ser
385 390 395 400
His Asp Glu Ser Gln Glu Leu Phe Asp Arg Tyr Val Trp Ala Asp Pro
405 410 415
Glu Pro Val Arg Ser Lys Leu Ala Ala Glu Pro Ala Leu Arg Thr His
420 425 430
Val Leu Ala Thr Ile Ala Ser Gly Phe Ala Arg Thr Arg Glu Gly Leu
435 440 445
Leu Glu Phe Leu Glu Ala Thr Leu Tyr Ala Ser Gln Ser Ser Glu Gly
450 455 460
Gly Arg Leu Glu Arg Val Thr Asp Asp Val Leu Ser Tyr Leu Glu Arg
465 470 475 480
Asn Asp Phe Ile Glu Arg Ser Gly Gly Pro Glu Asp Thr Leu Asn Ser
485 490 495
Glu Ala Asp Ala Ala Ser Ala Phe Thr Ser Ala Ala Asp Leu Ala Asp
500 505 510
Ser Asp Gly Gly Asp Ser Gly Gly Thr Thr Gly Gln Glu Glu Asp Leu
515 520 525
Glu Ala Thr Ser Leu Gly His Thr Val Ser Arg Leu Tyr Leu Asp Pro
530 535 540
Met Ser Ala Ala Glu Ile Val His Gly Leu Glu Asp Ala Asp Glu Arg
545 550 555 560
Pro Thr Ala Leu Gly Leu Tyr Gln Leu Val Ser Arg Thr Pro Asp Met
565 570 575
Tyr Glu Leu Tyr Leu Arg Ser Gly Glu Asp Glu Lys Phe Gly Glu Leu
580 585 590
Tyr Tyr Glu Arg Glu Arg Glu Leu Leu Gly Asp Ala Pro Ser Glu Phe
595 600 605
Glu Glu Glu Arg Phe Glu Asp Trp Leu Ala Ala Leu Lys Thr Gly Lys
610 615 620
Leu Leu Glu Asp Trp Ala Thr Glu Asp Asp Glu Glu Gln Ile Thr Glu
625 630 635 640
Arg Tyr Lys Ile Gly Pro Gly Asp Leu Arg Gly Lys Val Asp Thr Ala
645 650 655
Glu Trp Leu Leu Gly Ala Ala Glu Ser Leu Ala Ser Glu Ile Asp Ser
660 665 670
Glu Trp Ala Val Ala Val Arg Glu Ala Arg Ala Arg Val Glu His Gly
675 680 685
Val Gly Glu Glu Leu Leu Glu Leu Val Ser Val Ser Gly Ile Gly Arg
690 695 700
Lys Arg Ala Arg Arg Leu Tyr Ala Ala Gly Ile Glu Glu Pro Ala Ala
705 710 715 720
Leu Arg Ser Ala Asp Lys Gly Val Ile Leu His Val Leu Lys Gly Glu
725 730 735
Lys Thr Ala Glu Asn Ile Leu Glu Asn Ala Gly Arg Glu Glu Pro Ser
740 745 750
Met Asp Gly Val Glu Pro Ile Pro Val Glu Gly Gly Ser Gly Ser Gly
755 760 765
Ser Ser Asn Ser Ser Gly Ser Ser Glu Pro Asn Ala Asp Ala Asn Ala
770 775 780
Thr Glu Asp Asp Ala Asp Asp Asn Gln Ser Ser Leu Gly Asp Phe
785 790 795
<210> 47
<211> 723
<212> PRT
<213> Methanoregula boonei
<400> 47
Met Gln Ile Gln Asp Leu Ala Ile Pro Glu Pro Leu Arg Gln Gln Tyr
1 5 10 15
Leu Gly Leu Gly Ile Arg Glu Leu Tyr Pro Pro Gln Ala Ala Cys Val
20 25 30
Glu Arg Gly Leu Leu Asp Gly Lys Asn Leu Leu Val Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Ile Ala Glu Met Ala Met His Arg His Ile
50 55 60
Ala Asn Gly Gly Lys Cys Leu Tyr Ile Val Pro Leu Lys Ala Leu Ala
65 70 75 80
Ser Glu Lys Tyr Glu Glu Phe Gly Asn Lys Gly Val Lys Val Gly Leu
85 90 95
Ser Thr Gly Asp Leu Asp Arg Arg Asp Asp Ala Leu Gly Lys Asn Asp
100 105 110
Ile Ile Val Ala Thr Ser Glu Lys Val Asp Ser Leu Leu Arg Asn Gly
115 120 125
Ala Arg Trp Ile Pro Asp Ile Thr Leu Val Val Ile Asp Glu Ile His
130 135 140
Leu Ile Asp Ser Pro Asp Arg Gly Pro Thr Leu Glu Met Val Ile Ala
145 150 155 160
Lys Met Arg Ser Lys Asn Pro Gly Met Gln Leu Ile Gly Leu Ser Ala
165 170 175
Thr Ile Gly Asn Pro Lys Val Leu Ala Gly Trp Leu Asp Ala Glu Leu
180 185 190
Val Thr Ser Ser Trp Arg Pro Val Asp Leu Arg Gln Gly Val Phe Tyr
195 200 205
Asp Asn Arg Ile Gln Phe Ala Glu Arg Met Arg Pro Val Lys Gln Val
210 215 220
Ser Lys Asn Tyr Asp Asp Leu Asn Leu Cys Leu Asp Thr Ile Ala Glu
225 230 235 240
Gly Gly Gln Cys Leu Val Phe Val Ser Ser Arg Arg Asn Ala Glu Ala
245 250 255
Phe Ala Lys Arg Ala Ala Gly Ala Ile Lys Ser Glu Asp Ala Ala Leu
260 265 270
Ala Ala Cys Ala Glu Arg Leu Leu Glu Gly Thr Pro Thr Glu Met Val
275 280 285
Lys Thr Leu Ala Ala Cys Val Ala Lys Gly Ala Ala Phe His His Ala
290 295 300
Gly Leu Ser Arg Lys Glu Arg Ser Ile Val Glu Glu Ala Phe Arg Lys
305 310 315 320
Asn Leu Leu Lys Cys Ile Ser Ser Thr Pro Thr Leu Ala Ala Gly Leu
325 330 335
Asn Leu Pro Ala Arg Arg Val Ile Ile Arg Asp Tyr Leu Arg Phe Ser
340 345 350
Ala Gly Glu Gly Met Gln Pro Ile Pro Val Ser Glu Tyr Arg Gln Met
355 360 365
Ala Gly Arg Ala Gly Arg Pro Arg Leu Asp Pro Tyr Gly Glu Ala Val
370 375 380
Leu Ile Ala Lys Glu Ala Glu Gln Val Pro Glu Leu Phe Glu Val Tyr
385 390 395 400
Ile Glu Ala Glu Ala Glu Asp Val His Ser Arg Ile Ala Glu Pro Thr
405 410 415
Ala Leu Tyr Thr His Val Leu Ser Leu Val Ala Ser Gly Phe Ala Gly
420 425 430
Thr Arg Gly Glu Leu Thr Glu Phe Met Asn Arg Ser Phe Tyr Val His
435 440 445
Glu His Lys Gln Gly Arg Leu Ile His Arg Ala Ile Asp Glu Ala Leu
450 455 460
Gln Phe Leu Ile Thr Ala Glu Met Val Val Glu Val Gly Glu His Ile
465 470 475 480
Gly Ala Thr Glu Leu Gly Thr Leu Val Ser Arg Met Tyr Ile Asp Pro
485 490 495
Arg Ser Ala Phe Ala Ile Val Thr Thr Leu Arg Glu Gln Glu Lys Tyr
500 505 510
Ala Asp Leu Gly Leu Ile Gln Leu Ile Cys Thr Thr Pro Asp Met Pro
515 520 525
Thr Leu Tyr Ala Lys Asn Ala Asp Leu Pro Ala Leu Ser Arg Met Leu
530 535 540
Glu Val Arg Gly Ala Asp Ile Trp Leu Pro Pro Pro Leu Asp Asp Asp
545 550 555 560
Ala Ala Glu Thr Tyr Tyr Arg Ala Val Lys Thr Ala Met Leu Leu Ser
565 570 575
Asp Trp Thr Asp Glu Leu Ser Glu Glu Lys Ile Cys Glu Arg Tyr Gly
580 585 590
Val Gly Pro Gly Asp Val Phe Gly Met Val Glu Asn Ile Asn Trp Leu
595 600 605
Leu His Ala Thr Ser Gln Leu Ala Arg Met Phe Val Pro Lys Phe Tyr
610 615 620
Gly Gln Ile Ala Asp Cys Glu Ile Cys Met Lys Asn Gly Ile Arg Arg
625 630 635 640
Glu Leu Leu Pro Leu Val Arg Leu Arg Gly Ile Gly Arg Val Arg Ala
645 650 655
Arg Arg Leu Phe Asn Asn Gly Ile Thr Ser Pro Glu Glu Leu Ser Arg
660 665 670
His Lys Lys Glu Asp Leu Val Lys Ile Leu Gly Ser Gly Ile Ala Glu
675 680 685
Gln Val Leu Glu Gln Leu His Pro Ser Lys Asp Thr Gly Lys Lys Glu
690 695 700
Pro Pro Ser Gly Asp Lys Asn Thr Asn Pro Gly Gln Ser Thr Leu Phe
705 710 715 720
His Phe Gly
<210> 48
<211> 681
<212> PRT
<213> 酸阿尔曼铁原体(Ferroplasma acidarmanus)
<400> 48
Met Lys Leu Ser Glu Ile Thr Pro Ser Glu Phe Leu Lys Val Thr Asp
1 5 10 15
Asn Asn Asp Phe Thr Leu Tyr Glu His Gln Glu Glu Ala Val Ala Lys
20 25 30
Leu Arg Glu Asn Lys Asn Val Ile Val Ser Val Pro Thr Ala Ser Gly
35 40 45
Lys Thr Leu Ile Gly Tyr Ile Ser Ile Tyr Asp Thr Tyr Leu Lys Gly
50 55 60
Lys Lys Ser Met Tyr Ile Val Pro Leu Arg Ser Leu Ala Met Glu Lys
65 70 75 80
Phe Ser Glu Leu Leu Ser Leu Arg Asn Leu Gly Val Lys Val Thr Met
85 90 95
Ser Ile Gly Asp Tyr Asp Val Pro Pro Ser Phe Val Lys Asn Tyr Asp
100 105 110
Val Ile Ile Ala Thr Ser Glu Arg Ala Asp Ser Met Leu His Arg Asp
115 120 125
Pro Asp Ile Leu Asn Tyr Phe Gly Leu Val Ile Ile Asp Glu Ile His
130 135 140
Met Ile Ser Asp Pro Ser Arg Gly Pro Arg Leu Glu Thr Val Ile Ser
145 150 155 160
Ser Leu Leu Tyr Leu Asn Pro Glu Ile Leu Leu Leu Gly Leu Ser Ala
165 170 175
Thr Val Ser Asn Ile Gln Glu Ile Ala Glu Trp Met Asn Ala Glu Thr
180 185 190
Val Val Ser Asn Phe Arg Ala Val Pro Leu Glu Thr Gly Ile Ile Phe
195 200 205
Lys Gly Asn Leu Ile Thr Asp Gly Glu Lys Lys His Leu Gly Arg Asp
210 215 220
Asp Glu Val Ser Leu Ile Lys Glu Ser Ile Glu Ser Gly Gly Gln Ala
225 230 235 240
Leu Val Phe Arg Asn Ser Arg Arg Asn Ala Glu Lys Tyr Ala Gln Ser
245 250 255
Met Val Asn Phe Phe Asp Phe Gln Asn Asp Phe Glu Lys Leu Glu Ile
260 265 270
Pro Pro Asp Leu Phe Asn Glu Ala Gln Ala Asn Met Val Ala His Gly
275 280 285
Val Met Phe His His Ala Gly Leu Ser Asn Asp Gln Arg Thr Met Ile
290 295 300
Glu Lys Leu Phe Lys Gln Gly Tyr Ile Lys Ile Leu Thr Ala Thr Pro
305 310 315 320
Thr Leu Ala Ala Gly Val Asn Leu Pro Ala Arg Thr Val Ile Ile Arg
325 330 335
Asp Ile Thr Arg Phe Ser Asp Gly Tyr Ser Lys Pro Ile Ser Gly Ile
340 345 350
Glu Ile Gln Gln Met Ile Gly Arg Ala Gly Arg Pro Lys Tyr Asp Lys
355 360 365
Lys Gly Tyr Gly Tyr Ile Tyr Ala Ala Ser Pro Gly Met Leu Arg Val
370 375 380
Ala Glu Gly Tyr Leu Thr Gly Glu Leu Glu Pro Val Ile Ser Arg Met
385 390 395 400
Asp Ser Asn Ser Leu Ile Arg Phe Asn Val Leu Ala Leu Ile Ser Ser
405 410 415
Gly Ile Ala Thr Asp Leu Lys Gly Ile Gln Asp Phe Tyr Gly Lys Thr
420 425 430
Leu Leu Ala Ala Gln Asn Asp Ile Asp Gly Tyr Glu Leu Ala Phe Glu
435 440 445
Ser Ala Leu Tyr Phe Leu Lys Asp Asn Asp Phe Ile Thr Glu Glu Asn
450 455 460
Asp Ile Tyr Ser Ala Thr Lys Phe Gly Arg Leu Thr Ser Asp Leu Tyr
465 470 475 480
Ile Asp Pro Val Ser Ser Leu Ile Leu Lys Lys Cys Leu Asp Leu Glu
485 490 495
Phe Ser Glu Glu Leu Tyr Leu Tyr Tyr Ile Ser Lys Thr Pro Asp Met
500 505 510
Leu Thr Phe Asn Tyr Arg Ala Ser Asp Tyr Glu Tyr Leu Glu Glu Phe
515 520 525
Leu Asp Arg His Asn Ile Ser Asp Phe Ser Glu Glu Ser Met Gly Ala
530 535 540
Ala Lys Thr Ala Ile Ile Leu Asn Glu Trp Ile Asn Glu Val Pro Ile
545 550 555 560
Asn Thr Ile Ala Glu Thr Phe Gly Ile Gly Pro Gly Asp Ile Gln Ala
565 570 575
Lys Ala Ser Ser Ala Asp Trp Ile Ser Tyr Ser Leu Tyr Arg Leu Gly
580 585 590
Ser Met Phe Asp Lys Glu Asn Glu Asn Asn Leu Leu His Leu Asn Ile
595 600 605
Arg Ile Lys Glu Gly Val Lys Glu Glu Ile Ile Arg Ile Ile Glu Ile
610 615 620
Pro Gln Val Gly Arg Val Arg Gly Arg Arg Leu Tyr Asn Asn Gly Phe
625 630 635 640
Lys Ser Ile Asp Asp Ile Ala Asn Ala Arg Val Glu Asp Ile Ser Arg
645 650 655
Ile Phe Gly Phe Ser Thr Lys Leu Ala Lys Asp Ile Ile Glu Asn Ala
660 665 670
Gly Lys Leu Asn Asn Arg Tyr Tyr Arg
675 680
<210> 49
<211> 696
<212> PRT
<213> Methanocaldococcus fervens
<400> 49
Met Pro Thr Asn Lys Ile Leu Glu Ile Leu Lys Asp Phe Gly Ile Glu
1 5 10 15
Glu Leu Arg Pro Pro Gln Lys Lys Ala Leu Glu Lys Gly Leu Leu Asp
20 25 30
Lys Asn Lys Asn Phe Leu Ile Ser Ile Pro Thr Ala Ser Gly Lys Thr
35 40 45
Leu Ile Gly Glu Met Ala Leu Ile Asn His Leu Leu Asp Glu Asn Lys
50 55 60
Asn Pro Thr Asn Lys Lys Gly Ile Phe Ile Val Pro Leu Lys Ala Leu
65 70 75 80
Ala Ser Glu Lys Tyr Glu Glu Phe Lys Asn Lys Tyr Glu Arg Tyr Gly
85 90 95
Leu Arg Val Ala Leu Ser Ile Gly Asp Tyr Asp Glu Asp Glu Asp Leu
100 105 110
Ser Arg Tyr His Leu Ile Ile Thr Thr Ala Glu Lys Leu Asp Ser Leu
115 120 125
Trp Arg His Lys Ile Asp Trp Ile Asp Asp Val Ser Val Val Val Val
130 135 140
Asp Glu Ile His Leu Ile Asn Asp Glu Ser Arg Gly Gly Thr Leu Glu
145 150 155 160
Ile Leu Leu Thr Lys Leu Lys Lys Phe Asn Ile Gln Ile Ile Gly Leu
165 170 175
Ser Ala Thr Ile Gly Asn Pro Glu Glu Leu Ala Asn Trp Leu Asn Ala
180 185 190
Glu Leu Ile Val Asp Asp Trp Arg Pro Val Glu Leu Lys Lys Gly Ile
195 200 205
Tyr Lys Asn Gly Ile Ile Glu Phe Ile Asn Gly Glu Asn Arg Glu Ile
210 215 220
Lys Ala Ile Asn Asn Asn Asp Ile Tyr Asn Leu Val Val Asp Cys Val
225 230 235 240
Lys Asp Gly Gly Cys Cys Ile Val Phe Cys Asn Thr Lys Arg Gly Ala
245 250 255
Val Asn Glu Ala Lys Lys Leu Asn Leu Lys Lys Phe Leu Thr Asn Glu
260 265 270
Glu Lys Arg Lys Leu Lys Glu Val Ala Glu Glu Ile Leu Ser Ile Leu
275 280 285
Glu Pro Pro Thr Glu Met Cys Lys Thr Leu Ala Glu Cys Ile Leu Asn
290 295 300
Gly Ser Ala Phe His His Ala Gly Leu Thr Tyr Gln His Arg Lys Ile
305 310 315 320
Val Glu Asp Ala Phe Arg Asn Lys Leu Ile Lys Val Ile Cys Cys Thr
325 330 335
Pro Thr Leu Ser Val Gly Leu Asn Leu Pro Cys Arg Arg Ala Ile Val
340 345 350
Lys Asp Leu Thr Arg Tyr Thr Asn Arg Gly Met Arg Tyr Ile Pro Ile
355 360 365
Met Glu Ile Gln Gln Cys Ile Gly Arg Ala Gly Arg Leu Gly Leu Asp
370 375 380
Pro Tyr Gly Glu Gly Ile Ile Val Ala Lys Asn Asp Arg Asp Tyr Leu
385 390 395 400
Arg Ser Tyr Gln Val Leu Thr Gln Lys Pro Glu Pro Ile Tyr Ser Lys
405 410 415
Leu Ser Asn Gln Ala Val Leu Arg Thr Gln Leu Leu Gly Leu Ile Ala
420 425 430
Thr Ile Glu Ile Arg Asp Glu Tyr Asp Leu Glu Trp Phe Ile Arg Asn
435 440 445
Thr Phe Tyr Ala Tyr Gln Tyr Gly Asn Leu Arg Glu Val Ala Lys Asn
450 455 460
Ile Asn Glu Val Ile Arg Phe Leu Glu Glu Lys Glu Phe Met Ile Asp
465 470 475 480
Phe Ile Pro Thr Glu Leu Gly Lys Arg Val Ala Glu Leu Tyr Ile Asp
485 490 495
Pro Leu Ser Ala Lys Tyr Met Ile Asp Gly Leu Asn Glu Met Glu Asn
500 505 510
Glu Asp Asp Ile Tyr Tyr Leu Tyr Leu Ile Ser Lys Thr Leu Glu Met
515 520 525
Met Pro Asn Leu Arg Val Tyr Lys Ser Glu Glu Leu Asn Leu Ile Asp
530 535 540
Glu Met Glu Asn Leu Gly Ile Lys Ser Phe Glu Ile Glu Asp Leu Glu
545 550 555 560
Ala Phe Lys Thr Ala Lys Met Leu Tyr Asp Trp Ile Ser Glu Val Pro
565 570 575
Glu Asp Glu Ile Leu Lys Lys Tyr Lys Ile Glu Pro Gly Ile Leu Arg
580 585 590
Tyr Lys Val Glu Asn Ala Val Trp Leu Met His Ala Leu Lys Glu Met
595 600 605
Ala Lys Ile Ile Gly Lys Asn Ser Glu Ile Pro Glu Lys Leu Glu Ile
610 615 620
Arg Leu Glu Tyr Gly Ala Lys Glu Asp Ile Ile Glu Leu Leu Asn Val
625 630 635 640
Lys Tyr Ile Gly Arg Val Arg Ala Arg Lys Leu Tyr Asn Ala Gly Ile
645 650 655
Arg Asn Val Glu Asp Ile Ile Asn Asn Pro Ser Lys Val Ala Ser Ile
660 665 670
Ile Gly Glu Lys Ile Thr Lys Lys Ile Leu Glu Asp Leu Gly Ile Lys
675 680 685
Phe Gly Gln Gln Lys Leu Ile Phe
690 695
<210> 50
<211> 729
<212> PRT
<213> 詹氏甲烷球菌(Methanocaldococcus jannaschii)
<400> 50
Met Asp Lys Ile Leu Glu Ile Leu Lys Asp Phe Gly Ile Val Glu Leu
1 5 10 15
Arg Pro Pro Gln Lys Lys Ala Leu Glu Arg Gly Leu Leu Asp Lys Asn
20 25 30
Lys Asn Phe Leu Ile Ser Ile Pro Thr Ala Ser Gly Lys Thr Leu Ile
35 40 45
Gly Glu Met Ala Leu Ile Asn His Leu Leu Asp Gly Asn Lys Asn Pro
50 55 60
Thr Asn Lys Lys Gly Ile Phe Ile Val Pro Leu Lys Ala Leu Ala Ser
65 70 75 80
Glu Lys Tyr Glu Glu Phe Lys Ser Lys Tyr Glu Arg Tyr Gly Leu Arg
85 90 95
Ile Ala Leu Ser Ile Gly Asp Tyr Asp Glu Asp Glu Asp Leu Ser Lys
100 105 110
Tyr His Leu Ile Ile Thr Thr Ala Glu Lys Leu Asp Ser Leu Trp Arg
115 120 125
His Lys Ile Asp Trp Ile Asn Asp Val Ser Val Val Val Val Asp Glu
130 135 140
Ile His Leu Ile Asn Asp Glu Thr Arg Gly Gly Thr Leu Glu Ile Leu
145 150 155 160
Leu Thr Lys Leu Lys Glu Phe Asn Val Gln Ile Ile Gly Leu Ser Ala
165 170 175
Thr Ile Gly Asn Pro Asp Glu Leu Ala Glu Trp Leu Asn Ala Glu Leu
180 185 190
Ile Val Asp Asp Trp Arg Pro Val Glu Leu Lys Lys Gly Ile Tyr Lys
195 200 205
Asn Glu Ala Ile Glu Phe Ile Asn Gly Glu Ile Arg Glu Ile Lys Ala
210 215 220
Val Asp Asn Asn Asp Ile Tyr Asn Leu Val Val Asp Cys Val Lys Glu
225 230 235 240
Gly Gly Cys Cys Leu Val Phe Cys Asn Thr Lys Arg Asn Ala Val Asn
245 250 255
Glu Ala Lys Lys Leu Asn Leu Lys Lys Phe Leu Thr Glu Glu Glu Lys
260 265 270
Ile Arg Leu Lys Glu Ile Ala Glu Glu Ile Leu Ser Ile Leu Glu Pro
275 280 285
Pro Thr Glu Met Cys Lys Thr Leu Ala Glu Cys Ile Leu Asn Gly Ser
290 295 300
Ala Phe His His Ala Gly Leu Thr Tyr Gln His Arg Lys Ile Val Glu
305 310 315 320
Asp Ala Phe Arg Lys Arg Leu Ile Lys Val Ile Cys Cys Thr Pro Thr
325 330 335
Leu Ser Ala Gly Leu Asn Leu Pro Cys Arg Arg Ala Ile Val Lys Asp
340 345 350
Leu Thr Arg Phe Thr Asn Lys Gly Met Arg Tyr Ile Pro Ile Met Glu
355 360 365
Ile Gln Gln Cys Ile Gly Arg Ala Gly Arg Pro Gly Leu Asp Pro Tyr
370 375 380
Gly Glu Gly Ile Ile Val Ala Lys Asn Asp Arg Asp Tyr Leu Arg Ala
385 390 395 400
Tyr Gln Ala Leu Thr Gln Lys Pro Glu Pro Ile Tyr Ser Lys Leu Ser
405 410 415
Asn Gln Ala Val Leu Arg Thr Gln Leu Leu Gly Leu Ile Ala Thr Gly
420 425 430
Glu Ile Arg Asp Glu Tyr Asp Leu Glu Trp Phe Ile Arg Asn Thr Phe
435 440 445
Tyr Ala His Gln Tyr Gly Asn Leu Arg Glu Val Ala Lys Asn Ile Asn
450 455 460
Glu Val Ile Arg Phe Leu Glu Glu Asn Glu Phe Ile Ile Asp Phe Met
465 470 475 480
Pro Thr Glu Leu Gly Lys Arg Val Ser Glu Leu Tyr Ile Asp Pro Leu
485 490 495
Ser Ala Lys Phe Ile Ile Asp Gly Leu Glu Glu Met Glu Asn Glu Glu
500 505 510
Glu Ile Tyr Tyr Leu Tyr Leu Ile Ser Lys Thr Leu Glu Met Met Pro
515 520 525
Asn Leu Arg Val Tyr Asn Ser Glu Glu Leu Asn Leu Ile Asp Glu Met
530 535 540
Asp Ser Leu Gly Ile Lys Ser Phe Glu Ile Glu Asp Leu Glu Ala Phe
545 550 555 560
Lys Thr Ala Lys Met Leu Tyr Asp Trp Ile Asn Glu Val Pro Glu Asp
565 570 575
Glu Ile Leu Lys Arg Tyr Lys Ile Glu Pro Gly Ile Leu Arg Tyr Lys
580 585 590
Val Glu Asn Ala Val Trp Ile Met His Ala Leu Lys Glu Ile Ala Lys
595 600 605
Leu Ile Gly Lys Ser Ser Asp Ile Pro Glu Lys Leu Glu Ile Arg Leu
610 615 620
Glu Tyr Gly Ala Lys Glu Asp Ile Ile Glu Leu Leu Ser Ile Lys Tyr
625 630 635 640
Ile Gly Arg Val Arg Ala Arg Lys Leu Tyr Asn Ala Gly Ile Arg Ser
645 650 655
Ile Glu Asp Ile Ile Asn Asn Pro Ser Lys Val Ala Ser Ile Ile Gly
660 665 670
Glu Lys Ile Ala Lys Lys Ile Leu Asp Glu Leu Gly Val Lys Phe Gly
675 680 685
Gln Gln Lys Leu Ser Phe Ser Gly Gly Ser Ala Trp Ser His Pro Gln
690 695 700
Phe Glu Lys Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser Ala Trp
705 710 715 720
Ser His Pro Gln Phe Glu Lys Lys Leu
725
<210> 51
<211> 670
<212> PRT
<213> Methanocaldococcus infernus
<400> 51
Met Asp Glu Ile Leu Lys Phe Leu Gly Ile Lys Glu Leu Arg Pro Pro
1 5 10 15
Gln Lys Lys Ala Leu Glu Leu Gly Ile Leu Asp Lys Lys Lys Asn Phe
20 25 30
Leu Ile Ser Ile Pro Thr Gly Ala Gly Lys Thr Val Ile Ala Glu Met
35 40 45
Ala Leu Ile Asn His Leu Leu Leu Asp Lys Gly Lys Lys Gly Val Tyr
50 55 60
Ile Val Pro Leu Lys Ala Leu Ala Ser Glu Lys Tyr Glu Glu Phe Lys
65 70 75 80
Lys Lys Tyr Glu Lys Phe Gly Val Arg Val Ala Leu Ser Ile Gly Asp
85 90 95
Tyr Asp Glu Asp Glu Asp Leu Glu Asn Tyr Asp Leu Ile Ile Thr Thr
100 105 110
Ala Glu Lys Phe Asp Ser Leu Trp Arg His Gly Ile Lys Leu Ser Asp
115 120 125
Ile Ser Val Val Val Val Asp Glu Ile His Val Ile Gly Asp Ser Glu
130 135 140
Arg Gly Gly Thr Leu Glu Val Leu Leu Thr Lys Leu Lys Glu Leu Asp
145 150 155 160
Val Gln Ile Ile Gly Leu Ser Ala Thr Ile Gly Asn Pro Glu Glu Leu
165 170 175
Ser Glu Trp Leu Asn Ala Glu Leu Leu Leu Asp Asn Trp Arg Pro Val
180 185 190
Glu Leu Arg Lys Gly Ile Tyr Arg Glu Gly Val Ile Glu Tyr Leu Asp
195 200 205
Gly Glu Val Lys Glu Cys Gln Asp Ile Val Lys Glu Val Val Lys Asp
210 215 220
Asn Gly Ser Val Ile Ile Phe Cys Pro Thr Lys Lys Lys Ala Glu Asn
225 230 235 240
Arg Ala Leu Ser Leu Asp Leu Ser Asp Leu Leu Lys Lys Ser Glu Lys
245 250 255
Arg Lys Leu Glu Glu Ile Ser Glu Glu Leu Leu Ser Leu Phe Asp Pro
260 265 270
Pro Thr Glu Leu Cys Lys Lys Leu Ala Ser Cys Val Arg Lys Gly Ile
275 280 285
Ala Phe His His Ser Gly Leu Thr Tyr Glu His Arg Lys Ile Ile Glu
290 295 300
Lys Ala Phe Arg Glu Arg Ile Leu Lys Val Ile Cys Ser Thr Thr Thr
305 310 315 320
Leu Ala Phe Gly Leu Asn Leu Pro Cys Arg Arg Val Ile Ile Ser Glu
325 330 335
Leu Lys Arg Tyr Thr Arg Arg Gly Leu Thr Tyr Ile Pro Ile Met Glu
340 345 350
Val Gln Gln Cys Ile Gly Arg Ala Gly Arg Pro Gly Leu Asp Glu Tyr
355 360 365
Gly Glu Gly Ile Leu Val Ala Lys Asp Glu Arg Asp Tyr Leu Arg Ala
370 375 380
Leu Gln Cys Leu Thr Gln Lys Pro Glu Pro Ile Tyr Ser Lys Leu Ser
385 390 395 400
Asn Asp Ser Val Leu Arg Thr Gln Ile Leu Gly Leu Ile Ala Thr Arg
405 410 415
Tyr Val Leu Asp Glu Tyr Asp Leu Glu Glu Phe Ile Lys Asn Thr Phe
420 425 430
Tyr Ala Tyr Gln Tyr Lys Asn Leu Asp Glu Ile Lys Lys Lys Ile Lys
435 440 445
Glu Ile Ile Glu Phe Leu Glu Asp Cys Asn Phe Ile Lys Asn Phe Glu
450 455 460
Val Thr Pro Leu Gly Lys Lys Val Ser Asn Leu Tyr Leu Asp Pro Leu
465 470 475 480
Ser Ala Lys Ile Met Ile Asp Asn Ile Glu Val Lys Asp Asp Leu His
485 490 495
Leu Leu Tyr Ile Leu Cys Lys Cys Ile Glu Met Lys Pro Leu Leu Arg
500 505 510
Val Tyr Arg Lys Glu Glu Glu Glu Leu Ala Glu Glu Leu Leu Asn Tyr
515 520 525
Glu Ile Phe Ile Ser Tyr Glu Asn Leu Glu Glu Phe Lys Thr Ala Lys
530 535 540
Met Leu Tyr Asp Trp Ile Asn Glu Val Pro Glu Asp Glu Ile Leu Lys
545 550 555 560
Thr Tyr Lys Val Glu Pro Gly Ile Leu Arg Tyr Lys Val Glu Val Ala
565 570 575
Lys Trp Leu Ser Tyr Ser Leu Lys Glu Ile Ala Lys Ile Leu Asn Lys
580 585 590
Glu Val Pro Asn Leu Glu Leu Arg Leu Glu Tyr Gly Ala Lys Glu Glu
595 600 605
Leu Leu Glu Leu Leu Lys Ile Lys Tyr Ile Gly Arg Val Arg Ala Arg
610 615 620
Lys Leu Tyr Ser Ala Gly Ile Arg Asn Arg Glu Asp Ile Ile Lys Asn
625 630 635 640
Pro Lys Lys Val Ala Asn Ile Leu Gly Glu Lys Ile Ser Lys Lys Ile
645 650 655
Phe Glu Glu Leu Gly Val Arg Tyr Gly Gln Gln Arg Leu Ile
660 665 670
<210> 52
<211> 799
<212> PRT
<213> 亨氏甲烷螺菌(Methanospirillum hungatei)
<400> 52
Met Glu Ile Ala Ser Leu Pro Leu Pro Asp Ser Phe Ile Arg Ala Cys
1 5 10 15
His Ala Lys Gly Ile Arg Ser Leu Tyr Pro Pro Gln Ala Glu Cys Ile
20 25 30
Glu Lys Gly Leu Leu Glu Gly Lys Asn Leu Leu Ile Ser Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Leu Ala Glu Met Ala Met Trp Ser Arg Ile
50 55 60
Ala Ala Gly Gly Lys Cys Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala
65 70 75 80
Ser Glu Lys Tyr Asp Glu Phe Ser Lys Lys Gly Val Ile Arg Val Gly
85 90 95
Ile Ala Thr Gly Asp Leu Asp Arg Thr Asp Ala Tyr Leu Gly Glu Asn
100 105 110
Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu Arg Asn
115 120 125
Arg Thr Pro Trp Leu Ser Gln Ile Thr Cys Ile Val Leu Asp Glu Val
130 135 140
His Leu Ile Gly Ser Glu Asn Arg Gly Ala Thr Leu Glu Met Val Ile
145 150 155 160
Thr Lys Leu Arg Tyr Thr Asn Pro Val Met Gln Ile Ile Gly Leu Ser
165 170 175
Ala Thr Ile Gly Asn Pro Ala Gln Leu Ala Glu Trp Leu Asp Ala Thr
180 185 190
Leu Ile Thr Ser Thr Trp Arg Pro Val Asp Leu Arg Gln Gly Val Tyr
195 200 205
Tyr Asn Gly Lys Ile Arg Phe Ser Asp Ser Glu Arg Pro Ile Gln Gly
210 215 220
Lys Thr Lys His Asp Asp Leu Asn Leu Cys Leu Asp Thr Ile Glu Glu
225 230 235 240
Gly Gly Gln Cys Leu Val Phe Val Ser Ser Arg Arg Asn Ala Glu Gly
245 250 255
Phe Ala Lys Lys Ala Ala Gly Ala Leu Lys Ala Gly Ser Pro Asp Ser
260 265 270
Lys Ala Leu Ala Gln Glu Leu Arg Arg Leu Arg Asp Arg Asp Glu Gly
275 280 285
Asn Val Leu Ala Asp Cys Val Glu Arg Gly Ala Ala Phe His His Ala
290 295 300
Gly Leu Ile Arg Gln Glu Arg Thr Ile Ile Glu Glu Gly Phe Arg Asn
305 310 315 320
Gly Tyr Ile Glu Val Ile Ala Ala Thr Pro Thr Leu Ala Ala Gly Leu
325 330 335
Asn Leu Pro Ala Arg Arg Val Ile Ile Arg Asp Tyr Asn Arg Phe Ala
340 345 350
Ser Gly Leu Gly Met Val Pro Ile Pro Val Gly Glu Tyr His Gln Met
355 360 365
Ala Gly Arg Ala Gly Arg Pro His Leu Asp Pro Tyr Gly Glu Ala Val
370 375 380
Leu Leu Ala Lys Asp Ala Pro Ser Val Glu Arg Leu Phe Glu Thr Phe
385 390 395 400
Ile Asp Ala Glu Ala Glu Arg Val Asp Ser Gln Cys Val Asp Asp Ala
405 410 415
Ser Leu Cys Ala His Ile Leu Ser Leu Ile Ala Thr Gly Phe Ala His
420 425 430
Asp Gln Glu Ala Leu Ser Ser Phe Met Glu Arg Thr Phe Tyr Phe Phe
435 440 445
Gln His Pro Lys Thr Arg Ser Leu Pro Arg Leu Val Ala Asp Ala Ile
450 455 460
Arg Phe Leu Thr Thr Ala Gly Met Val Glu Glu Arg Glu Asn Thr Leu
465 470 475 480
Ser Ala Thr Arg Leu Gly Ser Leu Val Ser Arg Leu Tyr Leu Asn Pro
485 490 495
Cys Thr Ala Arg Leu Ile Leu Asp Ser Leu Lys Ser Cys Lys Thr Pro
500 505 510
Thr Leu Ile Gly Leu Leu His Val Ile Cys Val Ser Pro Asp Met Gln
515 520 525
Arg Leu Tyr Leu Lys Ala Ala Asp Thr Gln Leu Leu Arg Thr Phe Leu
530 535 540
Phe Lys His Lys Asp Asp Leu Ile Leu Pro Leu Pro Phe Glu Gln Glu
545 550 555 560
Glu Glu Glu Leu Trp Leu Ser Gly Leu Lys Thr Ala Leu Val Leu Thr
565 570 575
Asp Trp Ala Asp Glu Phe Ser Glu Gly Met Ile Glu Glu Arg Tyr Gly
580 585 590
Ile Gly Ala Gly Asp Leu Tyr Asn Ile Val Asp Ser Gly Lys Trp Leu
595 600 605
Leu His Gly Thr Glu Arg Leu Val Ser Val Glu Met Pro Glu Met Ser
610 615 620
Gln Val Val Lys Thr Leu Ser Val Arg Val His His Gly Val Lys Ser
625 630 635 640
Glu Leu Leu Pro Leu Val Ala Leu Arg Asn Ile Gly Arg Val Arg Ala
645 650 655
Arg Thr Leu Tyr Asn Ala Gly Tyr Pro Asp Pro Glu Ala Val Ala Arg
660 665 670
Ala Gly Leu Ser Thr Ile Ala Arg Ile Ile Gly Glu Gly Ile Ala Arg
675 680 685
Gln Val Ile Asp Glu Ile Thr Gly Val Lys Arg Ser Gly Ile His Ser
690 695 700
Ser Asp Asp Asp Tyr Gln Gln Lys Thr Pro Glu Leu Leu Thr Asp Ile
705 710 715 720
Pro Gly Ile Gly Lys Lys Met Ala Glu Lys Leu Gln Asn Ala Gly Ile
725 730 735
Ile Thr Val Ser Asp Leu Leu Thr Ala Asp Glu Val Leu Leu Ser Asp
740 745 750
Val Leu Gly Ala Ala Arg Ala Arg Lys Val Leu Ala Phe Leu Ser Asn
755 760 765
Ser Glu Lys Glu Asn Ser Ser Ser Asp Lys Thr Glu Glu Ile Pro Asp
770 775 780
Thr Gln Lys Ile Arg Gly Gln Ser Ser Trp Glu Asp Phe Gly Cys
785 790 795
<210> 53
<211> 702
<212> PRT
<213> 富贵古菌(Archaeoglobus fulgidus)
<400> 53
Met Lys Val Glu Glu Leu Ala Glu Ser Ile Ser Ser Tyr Ala Val Gly
1 5 10 15
Ile Leu Lys Glu Glu Gly Ile Glu Glu Leu Phe Pro Pro Gln Ala Glu
20 25 30
Ala Val Glu Lys Val Phe Ser Gly Lys Asn Leu Leu Leu Ala Met Pro
35 40 45
Thr Ala Ala Gly Lys Thr Leu Leu Ala Glu Met Ala Met Val Arg Glu
50 55 60
Ala Ile Lys Gly Gly Lys Ser Leu Tyr Val Val Pro Leu Arg Ala Leu
65 70 75 80
Ala Gly Glu Lys Tyr Glu Ser Phe Lys Lys Trp Glu Lys Ile Gly Leu
85 90 95
Arg Ile Gly Ile Ser Thr Gly Asp Tyr Glu Ser Arg Asp Glu His Leu
100 105 110
Gly Asp Cys Asp Ile Ile Val Thr Thr Ser Glu Lys Ala Asp Ser Leu
115 120 125
Ile Arg Asn Arg Ala Ser Trp Ile Lys Ala Val Ser Cys Leu Val Val
130 135 140
Asp Glu Ile His Leu Leu Asp Ser Glu Lys Arg Gly Ala Thr Leu Glu
145 150 155 160
Ile Leu Val Thr Lys Met Arg Arg Met Asn Lys Ala Leu Arg Val Ile
165 170 175
Gly Leu Ser Ala Thr Ala Pro Asn Val Thr Glu Ile Ala Glu Trp Leu
180 185 190
Asp Ala Asp Tyr Tyr Val Ser Asp Trp Arg Pro Val Pro Leu Val Glu
195 200 205
Gly Val Leu Cys Glu Gly Thr Leu Glu Leu Phe Asp Gly Ala Phe Ser
210 215 220
Thr Ser Arg Arg Val Lys Phe Glu Glu Leu Val Glu Glu Cys Val Ala
225 230 235 240
Glu Asn Gly Gly Val Leu Val Phe Glu Ser Thr Arg Arg Gly Ala Glu
245 250 255
Lys Thr Ala Val Lys Leu Ser Ala Ile Thr Ala Lys Tyr Val Glu Asn
260 265 270
Glu Gly Leu Glu Lys Ala Ile Leu Glu Glu Asn Glu Gly Glu Met Ser
275 280 285
Arg Lys Leu Ala Glu Cys Val Arg Lys Gly Ala Ala Phe His His Ala
290 295 300
Gly Leu Leu Asn Gly Gln Arg Arg Val Val Glu Asp Ala Phe Arg Arg
305 310 315 320
Gly Asn Ile Lys Val Val Val Ala Thr Pro Thr Leu Ala Ala Gly Val
325 330 335
Asn Leu Pro Ala Arg Arg Val Ile Val Arg Ser Leu Tyr Arg Phe Asp
340 345 350
Gly Tyr Ser Lys Arg Ile Lys Val Ser Glu Tyr Lys Gln Met Ala Gly
355 360 365
Arg Ala Gly Arg Pro Gly Met Asp Glu Arg Gly Glu Ala Ile Ile Ile
370 375 380
Val Gly Lys Arg Asp Arg Glu Ile Ala Val Lys Arg Tyr Ile Phe Gly
385 390 395 400
Glu Pro Glu Arg Ile Thr Ser Lys Leu Gly Val Glu Thr His Leu Arg
405 410 415
Phe His Ser Leu Ser Ile Ile Cys Asp Gly Tyr Ala Lys Thr Leu Glu
420 425 430
Glu Leu Glu Asp Phe Phe Ala Asp Thr Phe Phe Phe Lys Gln Asn Glu
435 440 445
Ile Ser Leu Ser Tyr Glu Leu Glu Arg Val Val Arg Gln Leu Glu Asn
450 455 460
Trp Gly Met Val Val Glu Asp His His Leu Ala Pro Thr Lys Leu Gly
465 470 475 480
Ser Leu Val Ser Arg Leu Tyr Ile Asp Pro Leu Thr Gly Phe Ile Phe
485 490 495
His Asp Val Leu Ser Arg Met Glu Leu Ser Asp Ile Gly Ala Leu His
500 505 510
Leu Ile Cys Arg Thr Pro Asp Met Glu Arg Leu Thr Val Arg Lys Thr
515 520 525
Asp Ser Trp Val Glu Glu Glu Ala Phe Arg Leu Arg Lys Glu Leu Ser
530 535 540
Tyr Tyr Pro Ser Asp Phe Ser Val Glu Tyr Asp Trp Phe Leu Ser Glu
545 550 555 560
Val Lys Thr Ala Leu Cys Leu Lys Asp Trp Ile Glu Glu Lys Asp Glu
565 570 575
Asp Glu Ile Cys Ala Lys Tyr Gly Ile Ala Pro Gly Asp Leu Arg Arg
580 585 590
Ile Val Glu Thr Ala Glu Trp Leu Ser Asn Ala Met Asn Arg Ile Ala
595 600 605
Glu Glu Val Gly Asn Thr Ser Val Ser Gly Leu Thr Glu Arg Ile Lys
610 615 620
His Gly Val Lys Glu Glu Leu Leu Glu Leu Val Arg Ile Arg His Ile
625 630 635 640
Gly Arg Val Arg Ala Arg Lys Leu Tyr Asn Ala Gly Ile Arg Asn Ala
645 650 655
Glu Asp Ile Val Arg His Arg Glu Lys Val Ala Ser Leu Ile Gly Arg
660 665 670
Gly Ile Ala Glu Arg Val Val Glu Gly Ile Ser Val Lys Ser Leu Asn
675 680 685
Pro Glu Ser Ala Ala Ala Leu Glu His His His His His His
690 695 700
<210> 54
<211> 791
<212> PRT
<213> Haloterrigena turkmenica
<400> 54
Met Asn Leu Glu Glu Leu Thr Gly Leu Pro Pro Gly Ala Thr Asp His
1 5 10 15
Phe Arg Gly Glu Gly Ile Glu Glu Leu Tyr Pro Pro Gln Ala Asp Ala
20 25 30
Val Glu Ala Gly Ala Thr Asp Gly Glu Asn Leu Val Ala Ala Val Pro
35 40 45
Thr Ala Ser Gly Lys Thr Met Ile Ala Ala Leu Ser Met Leu Ser Ala
50 55 60
Val Gln Arg Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu Arg Ala Leu
65 70 75 80
Ala Ser Glu Lys Lys Glu Glu Phe Glu Ala Tyr Glu Glu Phe Gly Val
85 90 95
Thr Thr Gly Val Thr Thr Gly Asn Tyr Glu Ser Thr Asp Asp Trp Leu
100 105 110
Ala Thr Lys Asp Ile Ile Val Ala Thr Ser Glu Lys Val Asp Ser Leu
115 120 125
Val Arg Asn Gly Ala Asp Trp Leu Ser Glu Leu Thr Cys Val Val Ser
130 135 140
Asp Glu Val His Leu Ile Asp Asp Arg Asn Arg Gly Pro Thr Leu Glu
145 150 155 160
Val Thr Leu Ala Lys Leu Arg Arg Leu Asn Pro Gly Met Gln Val Val
165 170 175
Ala Leu Ser Ala Thr Val Gly Asn Ala Asp Glu Ile Ala Asp Trp Leu
180 185 190
Asp Ala Ser Leu Val Asp Thr Asp Trp Arg Pro Ile Asp Leu Gln Met
195 200 205
Gly Val His Tyr Gly Asn Ala Leu Asn Phe Asp Asp Gly Ser Thr Arg
210 215 220
Glu Val Pro Val Glu Gly Ser Glu Lys Gln Glu Ala Ala Leu Val Arg
225 230 235 240
Asp Ile Leu Arg Glu Gly Gly Ser Ser Leu Val Phe Val Asn Ser Arg
245 250 255
Arg Asn Ala Glu Gly Ala Ala Lys Arg Leu Gly Gln Val Ser Ser Arg
260 265 270
Glu Ile Thr Glu Asp Glu Arg Ala Glu Leu Ala Glu Leu Ala Asp Asp
275 280 285
Ile Arg Asp Asp Ser Asp Thr Glu Thr Ser Ala Asp Leu Ala Asp Cys
290 295 300
Val Glu Arg Gly Ala Ala Phe His His Ala Gly Leu Ser Ser Thr Gln
305 310 315 320
Arg Ser Leu Val Glu Asp Ala Phe Arg Asp Arg Leu Leu Lys Val Ile
325 330 335
Ser Ala Thr Pro Thr Leu Ala Ala Gly Val Asn Thr Pro Ala Arg Arg
340 345 350
Val Ile Val Arg Asp Trp Arg Arg Phe Asp Pro Ser Ala Gly Gly Met
355 360 365
Ala Pro Leu Asp Val Leu Glu Val His Gln Met Met Gly Arg Ala Gly
370 375 380
Arg Pro Gly Leu Asp Pro Tyr Gly Glu Ala Val Leu Leu Ala Lys Ser
385 390 395 400
His Asp Glu Ser Glu Glu Leu Phe Asp Arg Tyr Ile Trp Ala Asp Pro
405 410 415
Glu Pro Val Arg Ser Lys Leu Ala Ala Glu Pro Ala Leu Arg Thr His
420 425 430
Val Leu Ala Thr Ile Ala Ser Gly Phe Ala Arg Thr Arg Gly Gly Leu
435 440 445
Leu Glu Phe Leu Glu Ala Thr Leu Tyr Ala Ser Gln Ser Ser Glu Ala
450 455 460
Gly Arg Leu Glu Ser Val Thr Asp Asp Val Leu Asp Tyr Leu Glu Arg
465 470 475 480
Asn Asp Phe Ile Glu Arg Ser Arg Asp Asp Glu Ala Glu Asp Ser Gly
485 490 495
Glu Asp Asp Gly Pro Phe Thr Ser Ala Ala Asp Leu Ala Glu Gln Gln
500 505 510
Ala Ala Lys Arg Glu Glu Thr Leu Glu Ala Thr Ser Leu Gly His Thr
515 520 525
Val Ser Arg Leu Tyr Leu Asp Pro Met Ser Ala Ala Glu Ile Val His
530 535 540
Gly Leu Glu Arg Ala Asp Glu Arg Pro Thr Ala Leu Gly Leu Tyr Gln
545 550 555 560
Leu Val Ser Arg Thr Pro Asp Met Tyr Glu Leu Tyr Leu Arg Ser Gly
565 570 575
Glu Asp Glu Lys Phe Gly Glu Leu Phe Tyr Glu Arg Glu Thr Glu Leu
580 585 590
Leu Gly Asp Ala Pro Ser Glu Tyr Glu Glu Asp Arg Phe Glu Asp Trp
595 600 605
Leu Ala Ala Leu Lys Thr Gly Lys Leu Leu Glu Asp Trp Ala Asp Glu
610 615 620
Thr Asp Glu Glu Thr Ile Thr Asp Arg Tyr Lys Ile Gly Pro Gly Asp
625 630 635 640
Leu Arg Gly Lys Val Asp Thr Ala Glu Trp Leu Leu Gly Ala Ala Glu
645 650 655
Ser Leu Ala Ala Glu Ile Asp Ser Glu Trp Thr Val Ala Val Arg Glu
660 665 670
Ala Arg Ala Arg Val Glu His Gly Val Gly Glu Glu Leu Leu Glu Leu
675 680 685
Val Ser Val Gly Gly Val Gly Arg Lys Arg Ala Arg Arg Leu Tyr Asp
690 695 700
Ala Gly Ile Glu Glu Pro Ala Asp Leu Arg Ser Ala Asp Lys Gly Ile
705 710 715 720
Val Leu Ser Val Leu Lys Gly Glu Lys Thr Ala Glu Asn Ile Leu Glu
725 730 735
Asn Ala Gly Arg Glu Asp Pro Ser Met Asp Gly Val Glu Pro Ala Asp
740 745 750
Gly Gly Pro Ala Val Gly Ala Ala Thr Asn Gly Ser Ser Gly Gly Ser
755 760 765
Glu Thr Asp Glu Thr Gly Arg Ala Asp Ala Ala Glu Ser Asp Asp Ser
770 775 780
Gln Ser Ser Leu Gly Asp Phe
785 790
<210> 55
<211> 752
<212> PRT
<213> Haladaptatus paucihalophilus
<400> 55
Met Asn Val Ala Asp Leu Thr Gly Leu Pro Asp Gly Val Pro Glu His
1 5 10 15
Phe His Ala Gln Gly Ile Glu Glu Leu Tyr Pro Pro Gln Ala Glu Ala
20 25 30
Val Glu Ala Gly Ile Thr Glu Gly Glu Ser Val Val Ala Ser Ile Pro
35 40 45
Thr Ala Ser Gly Lys Thr Phe Ile Ala Glu Leu Ala Met Leu Ser Ser
50 55 60
Val Ala Arg Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu Arg Ala Leu
65 70 75 80
Ala Ser Glu Lys Lys Glu Glu Phe Glu Glu Phe Glu Gln Tyr Gly Val
85 90 95
Ser Ile Gly Val Ser Thr Gly Asn Tyr Glu Ser Asp Gly Asp Trp Leu
100 105 110
Ala Ser Arg Asp Ile Ile Val Ala Thr Ser Glu Lys Val Asp Ser Leu
115 120 125
Val Arg Asn Gly Ala Lys Trp Ile Asp Asp Leu Ser Cys Val Val Ala
130 135 140
Asp Glu Val His Leu Val Asn Asp Ala His Arg Gly Pro Thr Leu Glu
145 150 155 160
Val Thr Leu Ala Lys Leu Arg Arg Val Asn Pro Asp Leu Gln Thr Val
165 170 175
Ala Leu Ser Ala Thr Val Gly Asn Ala Gly Glu Met Ala Asp Trp Leu
180 185 190
Asp Ala Thr Leu Val Asp Ser Thr Trp Arg Pro Ile Asp Leu Arg Lys
195 200 205
Gly Val Leu Tyr Gly Gln Ala Leu His Phe Asp Asp Gly Thr Gln Gln
210 215 220
Glu Leu Ala Arg Gly Asn Glu Lys Glu Thr Ala Ala Leu Val Arg Asp
225 230 235 240
Thr Leu Glu Asp Gly Gly Ser Ser Leu Val Phe Val Asn Ser Arg Arg
245 250 255
Asn Ala Glu Ala Ala Ala Lys Arg Leu Ala Asp Val Thr Lys Thr His
260 265 270
Leu Thr Asp Asp Glu Arg Arg Asp Leu Leu Asp Ile Ala Asp Gln Ile
275 280 285
Arg Asp Val Ser Asp Thr Glu Thr Ser Asp Asp Leu Ala Thr Ala Ile
290 295 300
Glu Lys Gly Ala Ala Phe His His Ala Gly Leu Ala Ser Asp His Arg
305 310 315 320
Ser Leu Val Glu Asp Ala Phe Arg Asp Lys Leu Ile Lys Val Ile Ser
325 330 335
Ala Thr Pro Thr Leu Ala Ala Gly Val Asn Thr Pro Ser Arg Arg Val
340 345 350
Ile Val Arg Asp Trp Arg Arg Tyr Asp Gly Asp Ile Gly Gly Met Gln
355 360 365
Pro Leu Asp Val Leu Glu Val His Gln Met Phe Gly Arg Ala Gly Arg
370 375 380
Pro Gly Leu Asp Pro His Gly Glu Ala Val Leu Ile Ala Lys Ser His
385 390 395 400
Asp Glu Leu Gln Glu Leu Phe Asp Gln Tyr Val Trp Ala Asp Pro Glu
405 410 415
Pro Val His Ser Lys Leu Ala Ala Glu Pro Ala Leu Arg Thr His Ile
420 425 430
Leu Ala Thr Val Ala Ser Gly Phe Ala Gly Thr Glu Glu Glu Leu Leu
435 440 445
Asp Phe Leu Glu Arg Thr Leu Tyr Ala Thr Gln Thr Asp Glu Thr Gly
450 455 460
Arg Leu Glu Thr Val Thr Gln His Val Leu Asp Tyr Leu Asp Arg Asn
465 470 475 480
Gly Phe Leu Glu Arg Asp Asp Arg Leu Arg Ala Thr Gly Leu Gly His
485 490 495
Arg Val Ser Gln Leu Tyr Leu Asp Pro Met Ser Ala Ala Glu Ile Ile
500 505 510
Asp Gly Leu Arg Asp Ala Asp Gly Lys Pro Thr Ala Leu Gly Leu Tyr
515 520 525
His Leu Val Ser Arg Thr Pro Asp Met Tyr Gln Leu Tyr Leu Arg Ser
530 535 540
Gly Asp Arg Glu Arg Tyr Thr Glu Ile Ala Tyr Glu Arg Glu Pro Glu
545 550 555 560
Phe Leu Gly His Met Pro Ser Glu Phe Glu Asp Asn Ala Phe Glu Asp
565 570 575
Trp Leu Ser Ala Leu Lys Thr Ala Arg Leu Leu Glu Asp Trp Ala Ser
580 585 590
Glu Leu Asp Glu Asp Arg Ile Thr Glu Arg Tyr Ala Ile Gly Pro Gly
595 600 605
Asp Ile Arg Gly Lys Val Glu Thr Ala Gln Trp Leu Leu Asn Ala Ala
610 615 620
Glu Arg Leu Ala Ala Glu Leu Gln Arg Asp Asp Ala Glu Gly Ile Pro
625 630 635 640
Ser Ala Thr Thr Thr Ala Val Arg Glu Ala Arg Lys Arg Val Glu Tyr
645 650 655
Gly Val Glu Glu Glu Leu Leu Asp Leu Ala Gly Val Arg Asn Val Gly
660 665 670
Arg Lys Arg Ala Arg Arg Leu Tyr Glu Ala Gly Ile Glu Ser Arg Ala
675 680 685
Asp Leu Arg Glu Ala Asp Lys Ser Val Val Leu Gly Ala Leu Arg Gly
690 695 700
Arg Lys Lys Thr Ala Glu Asn Ile Leu Glu Asn Val Gly Arg Gln Asp
705 710 715 720
Pro Ser Leu Asp Asp Val Glu Ala Asp Ala Glu Thr Ala Ala Thr Ser
725 730 735
Ala Arg Ala Thr Asn Asp Gly Gly Gln Gln Ser Leu Gly Asp Phe Glu
740 745 750
<210> 56
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性Hel308基序
<400> 56
Gln Met Phe Gly Arg Ala Gly Arg
1 5
<210> 57
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性扩展的Hel308基序
<400> 57
Gln Met Phe Gly Arg Ala Gly Arg Pro
1 5
<210> 58
<211> 783
<212> PRT
<213> 盐杆菌属NRC-1(Halobacterium sp. NRC-1)
<400> 58
Met Arg Val Ala Asp Val Pro Gly Leu Pro Gly Gly Val Ala Asp His
1 5 10 15
Phe Glu Gly Glu Gly Val Glu Glu Leu Tyr Pro Pro Gln Ala Glu Ala
20 25 30
Val Glu Arg Gly Val Thr Glu Gly Ala Asn Leu Val Ala Ser Val Pro
35 40 45
Thr Ala Ser Gly Lys Thr Leu Ile Ala Gln Leu Ala Met Leu Ser Ala
50 55 60
Ile Ala Glu Gly Gly Asp Ser Pro Thr Phe Ser Gly Asp Gly Thr Ala
65 70 75 80
Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala Gly Glu Lys Ala Gln Glu
85 90 95
Phe Glu Ala Phe Glu Arg Phe Gly Leu Ser Val Gly Val Ser Thr Gly
100 105 110
Asn Tyr Glu Arg Asp Gly Ala Arg Leu Ala Asp Asn Asp Ile Val Val
115 120 125
Ala Thr Ser Glu Lys Val Asp Ser Leu Val Arg Asn Gly Ala Gly Trp
130 135 140
Ile Asp Asp Leu Ser Cys Val Val Ala Asp Glu Val His Leu Val Asp
145 150 155 160
Asp Asp His Arg Gly Pro Thr Leu Glu Val Thr Leu Ala Lys Leu Arg
165 170 175
Gln Gln Val Ala Asp Leu Gln Val Val Ala Leu Ser Ala Thr Val Gly
180 185 190
Asn Ala Gly Glu Leu Ala Ala Trp Leu Asp Ala Glu Leu Val Asp Ser
195 200 205
Asp Trp Arg Pro Ile Glu Leu Arg Thr Gly Val His Tyr Gly Gln Ser
210 215 220
Leu His Tyr Asp Asp Gly Thr Gln Ala Glu Leu Ser Val Gly Ser Gly
225 230 235 240
Ser Gln Thr Ala Ala Val Val Ala Asp Thr Leu Ala Asp Asp Gly Ser
245 250 255
Thr Leu Val Phe Val Asn Ser Arg Arg Asn Ala Glu Ala Ser Ala Arg
260 265 270
Arg Leu Ala Asp Val Thr Gly Asn Ala Leu Ser Ser Ala Glu Arg Glu
275 280 285
Arg Leu Ala Asp Ile Ala Ala Glu Ile Arg Gly Val Ser Asp Thr Glu
290 295 300
Thr Ser Asp Glu Leu Ala Asp Ala Val Ala Ser Gly Ala Ala Phe His
305 310 315 320
His Ala Gly Leu Ala Arg Glu His Arg Glu Leu Val Glu Glu Ala Phe
325 330 335
Arg Asp Arg Leu Val Lys Ala Val Ser Ala Thr Pro Thr Leu Ala Ala
340 345 350
Gly Val Asn Thr Pro Ala Arg Arg Val Val Val Arg Asp Trp Gln Arg
355 360 365
Tyr Asp Gly Thr Ala Gly Gly Met Gln Pro Leu Asp Val Leu Glu Val
370 375 380
His Gln Met Phe Gly Arg Ala Gly Arg Pro Gly Leu Asp Pro Tyr Gly
385 390 395 400
Glu Ala Val Leu Leu Ala Asn Ser His Asp Glu Leu Glu Glu Leu Phe
405 410 415
Asp Arg Tyr Val Tyr Ala Asp Pro Glu Pro Val Arg Ser Lys Leu Ala
420 425 430
Ala Glu Pro Ala Leu Arg Thr His Val Leu Ala Ala Ile Ala Thr Gly
435 440 445
Phe Thr Thr Thr Glu Asp Gly Leu His Glu Phe Leu Gly Gly Thr Leu
450 455 460
Tyr Ala Thr Gln Thr Asp Asp Thr Gly Arg Leu Arg Ser Val Thr Gly
465 470 475 480
Asp Val Leu Arg Tyr Leu Asp Arg Asn Gly Phe Val Glu Arg Asp Gly
485 490 495
Ala Ala Leu Arg Ala Thr Ala Thr Gly Gln Leu Val Ser Arg Leu Tyr
500 505 510
Val Asp Pro Met Ser Ala Ala Thr Ile Ile Asp Gly Leu Arg Asp Ala
515 520 525
Ala Arg Asp Ala Thr Glu Thr Asp Asp Glu Gly Ala Phe Arg Pro Ala
530 535 540
Ser Glu Leu Gly Asp Asp Ala Ala Leu Pro Ala Asp Ala Ser Val Glu
545 550 555 560
Pro Thr Pro Leu Gly Leu Tyr His Leu Val Ser Arg Thr Pro Asp Met
565 570 575
Tyr Glu Leu Tyr Leu Arg Ser Gly Asp Arg Glu Gln Tyr Thr Glu Val
580 585 590
Ala Tyr Glu His Glu Asp Glu Leu Leu Gly Ala Thr Pro Arg Glu Glu
595 600 605
Gln Ala Glu Phe Glu Asp Trp Leu Ser Ala Leu Lys Thr Ala Arg Leu
610 615 620
Met Ala Asp Trp Ala Ser Glu Leu Asp Glu Glu Arg Ile Ala Glu Arg
625 630 635 640
Tyr Asp Val Gly Pro Gly Asp Ile Arg Gly Lys Val Glu Thr Ala Glu
645 650 655
Trp Leu Leu Asn Ala Ala Glu Arg Leu Ala Gly Glu Leu Asp Val Glu
660 665 670
Cys Gly Pro Ala Val Arg Glu Ala Arg Lys Arg Val Gln Tyr Gly Val
675 680 685
Arg Glu Glu Leu Leu Gly Leu Ala Gly Val Arg Asn Val Gly Arg Lys
690 695 700
Arg Ala Arg Arg Leu Tyr Asn Ala Gly Val Glu Ser Arg Ala Asp Leu
705 710 715 720
Arg Asn Ala Asp Lys Gly Val Val Leu Gly Ala Val Arg Gly Arg Ala
725 730 735
Ala Thr Ala Glu Arg Ile Leu Glu Thr Val Gly His Pro Asp Pro Gly
740 745 750
Met Asp Gly Val Ala Ala Asp Thr Asp Ala Ala Pro Glu Ser Gly Gly
755 760 765
Glu Ala Gly Gly Asp Glu Gly Gln Ala Ser Leu Gly Asp Phe Ser
770 775 780
<210> 59
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> RecD样基序 I
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa = G, S 或 A
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa = P, A, S 或 G
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = T, A, V, S 或 C
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa = G 或 A
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa = K 或 R
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa =T 或 S
<400> 59
Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa
1 5
<210> 60
<211> 25
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 扩展的RecD样基序 I
<220>
<221> MISC_FEATURE
<222> (2)..(17)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (18)..(18)
<223> Xaa =G, S 或 A
<220>
<221> MISC_FEATURE
<222> (19)..(19)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (20)..(20)
<223> Xaa = P, A, S或G
<220>
<221> MISC_FEATURE
<222> (22)..(22)
<223> Xaa = T, A, V, S或C
<220>
<221> MISC_FEATURE
<222> (23)..(23)
<223> Xaa = G或A
<220>
<221> MISC_FEATURE
<222> (24)..(24)
<223> Xaa = K或R
<220>
<221> MISC_FEATURE
<222> (25)..(25)
<223> Xaa = T或S
<400> 60
Gln Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa
20 25
<210> 61
<211> 26
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 扩展的RecD样基序 I
<220>
<221> MISC_FEATURE
<222> (2)..(18)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (19)..(19)
<223> Xaa = G, S或A
<220>
<221> MISC_FEATURE
<222> (20)..(20)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (21)..(21)
<223> Xaa = P, A, S或G
<220>
<221> MISC_FEATURE
<222> (23)..(23)
<223> Xaa = T, A, V, S或C
<220>
<221> MISC_FEATURE
<222> (24)..(24)
<223> Xaa = G或A
<220>
<221> MISC_FEATURE
<222> (25)..(25)
<223> Xaa = K或A
<220>
<221> MISC_FEATURE
<222> (26)..(26)
<223> Xaa = T或S
<400> 61
Gln Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa
20 25
<210> 62
<211> 27
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 扩展的RecD样基序 I
<220>
<221> MISC_FEATURE
<222> (2)..(19)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (20)..(20)
<223> Xaa = G, S或A
<220>
<221> MISC_FEATURE
<222> (21)..(21)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (22)..(22)
<223> Xaa =P, A, S或G
<220>
<221> MISC_FEATURE
<222> (24)..(24)
<223> Xaa = T, A, V, S或C
<220>
<221> MISC_FEATURE
<222> (25)..(25)
<223> Xaa =G或A
<220>
<221> MISC_FEATURE
<222> (26)..(26)
<223> Xaa =K或R
<220>
<221> MISC_FEATURE
<222> (27)..(27)
<223> Xaa = T或S
<400> 62
Gln Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa
20 25
<210> 63
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> RecD基序 I
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = T, V或C
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa = T或S
<400> 63
Gly Gly Pro Gly Xaa Gly Lys Xaa
1 5
<210> 64
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 优选的RecD基序 I
<400> 64
Gly Gly Pro Gly Thr Gly Lys Thr
1 5
<210> 65
<211> 25
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 扩展的RecD基序 I
<220>
<221> MISC_FEATURE
<222> (2)..(17)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (22)..(22)
<223> Xaa = T, V或C
<220>
<221> MISC_FEATURE
<222> (25)..(25)
<223> Xaa = T或S
<400> 65
Gln Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Gly Gly Pro Gly Xaa Gly Lys Xaa
20 25
<210> 66
<211> 26
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 扩展的RecD基序 I
<220>
<221> MISC_FEATURE
<222> (2)..(18)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (23)..(23)
<223> Xaa = T, V或C
<220>
<221> MISC_FEATURE
<222> (26)..(26)
<223> Xaa = T或S
<400> 66
Gln Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Gly Gly Pro Gly Xaa Gly Lys Xaa
20 25
<210> 67
<211> 27
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 扩展的RecD基序 I
<220>
<221> MISC_FEATURE
<222> (2)..(19)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (24)..(24)
<223> Xaa = T, V或C
<220>
<221> MISC_FEATURE
<222> (27)..(27)
<223> Xaa = T或S
<400> 67
Gln Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Gly Gly Pro Gly Xaa Gly Lys Xaa
20 25
<210> 68
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> RecD样基序 V
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa = Y, W或F
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa = A, T, S, M, C或V
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = T, N或S
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = A, T, G, S, V或I
<220>
<221> MISC_FEATURE
<222> (6)..(8)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa = G或S
<400> 68
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gln Xaa
1 5 10
<210> 69
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> RecD基序 V
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa = Y, W或F
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa = A, M, C或V
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa = I, M或L
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = T或S
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = V或I
<400> 69
Xaa Xaa Xaa Xaa Xaa His Lys Ser Gln Gly
1 5 10
<210> 70
<211> 13
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MobF基序 III
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = 任何氨基酸 除了D, E, R和K
<220>
<221> MISC_FEATURE
<222> (6)..(10)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (12)..(12)
<223> Xaa = 任何氨基酸 除了D, E, R和K
<400> 70
His Xaa Xaa Xaa Arg Xaa Xaa Xaa Xaa Xaa His Xaa His
1 5 10
<210> 71
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MobF基序 III
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = 任何氨基酸 除了D, E, R和K
<220>
<221> MISC_FEATURE
<222> (6)..(11)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> Xaa = 任何氨基酸 除了D, E, R和K
<400> 71
His Xaa Xaa Xaa Arg Xaa Xaa Xaa Xaa Xaa Xaa His Xaa His
1 5 10
<210> 72
<211> 15
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MobF基序 III
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = 任何氨基酸 除了D, E, R和K
<220>
<221> MISC_FEATURE
<222> (6)..(12)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> Xaa = 任何氨基酸 除了D, E, R和K
<400> 72
His Xaa Xaa Xaa Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa His
1 5 10 15
<210> 73
<211> 16
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MobF基序 III
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = 任何氨基酸 除了D, E, R 和K
<220>
<221> MISC_FEATURE
<222> (6)..(13)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> Xaa = 任何氨基酸 除了D, E, R 和K
<400> 73
His Xaa Xaa Xaa Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa His
1 5 10 15
<210> 74
<211> 17
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MobF基序 III
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = 任何氨基酸 除了D, E, R 和K
<220>
<221> MISC_FEATURE
<222> (6)..(14)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (16)..(16)
<223> Xaa = 任何氨基酸 除了D, E, R 和K
<400> 74
His Xaa Xaa Xaa Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa
1 5 10 15
His
<210> 75
<211> 18
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MobF基序 III
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = 任何氨基酸 除了D, E, R和K
<220>
<221> MISC_FEATURE
<222> (6)..(15)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (17)..(17)
<223> Xaa = 任何氨基酸 除了D, E, R和K
<400> 75
His Xaa Xaa Xaa Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His
1 5 10 15
Xaa His
<210> 76
<211> 19
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MobF基序 III
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = 任何氨基酸 除了D, E, R和K
<220>
<221> MISC_FEATURE
<222> (6)..(16)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (18)..(18)
<223> Xaa = 任何氨基酸 除了D, E, R和K
<400> 76
His Xaa Xaa Xaa Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
His Xaa His
<210> 77
<211> 20
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MobF基序 III
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = 任何氨基酸 除了D, E, R和K
<220>
<221> MISC_FEATURE
<222> (6)..(17)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (19)..(19)
<223> Xaa = 任何氨基酸
<400> 77
His Xaa Xaa Xaa Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa His Xaa His
20
<210> 78
<211> 17
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MobQ基序 III
<220>
<221> MISC_FEATURE
<222> (2)..(4)
<223> Xaa = 任何氨基酸 除了D, E, K和R
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = D或E
<220>
<221> MISC_FEATURE
<222> (6)..(8)
<223> Xaa = 任何氨基酸 除了D, E, K和R
<220>
<221> MISC_FEATURE
<222> (10)..(15)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (17)..(17)
<223> Xaa = 任何氨基酸 除了D, E, K和R
<400> 78
Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Xaa Xaa Xaa His
1 5 10 15
Xaa
<210> 79
<211> 18
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MobQ基序 III
<220>
<221> MISC_FEATURE
<222> (2)..(4)
<223> Xaa = 任何氨基酸 除了D, E, K和R
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = D或E
<220>
<221> MISC_FEATURE
<222> (6)..(8)
<223> Xaa = 任何氨基酸 除了D, E, K和R
<220>
<221> MISC_FEATURE
<222> (10)..(16)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (18)..(18)
<223> Xaa = 任何氨基酸 除了D, E, K和R
<400> 79
Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
His Xaa
<210> 80
<211> 19
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MobQ基序 III
<220>
<221> MISC_FEATURE
<222> (2)..(4)
<223> Xaa = 任何氨基酸 除了D, E, K和R
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = D或E
<220>
<221> MISC_FEATURE
<222> (6)..(8)
<223> Xaa = 任何氨基酸 除了D, E, K和R
<220>
<221> MISC_FEATURE
<222> (10)..(17)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (19)..(19)
<223> Xaa = 任何氨基酸 除了D, E, K和R
<400> 80
Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa His Xaa
<210> 81
<211> 20
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MobQ基序 III
<220>
<221> MISC_FEATURE
<222> (2)..(4)
<223> Xaa = 任何氨基酸 除了D, E, K和R
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = D或E
<220>
<221> MISC_FEATURE
<222> (6)..(8)
<223> Xaa = 任何氨基酸 除了D, E, K和R
<220>
<221> MISC_FEATURE
<222> (10)..(18)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (20)..(20)
<223> Xaa = 任何氨基酸 除了D, E, K和R
<400> 81
Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa His Xaa
20
<210> 82
<211> 21
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MobQ基序 III
<220>
<221> MISC_FEATURE
<222> (2)..(4)
<223> Xaa = 任何氨基酸 除了D, E, K和R
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = D或E
<220>
<221> MISC_FEATURE
<222> (6)..(8)
<223> Xaa = 任何氨基酸 除了D, E, K和R
<220>
<221> MISC_FEATURE
<222> (10)..(19)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (21)..(21)
<223> Xaa =任何氨基酸
<400> 82
Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa His Xaa
20
<210> 83
<211> 22
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MobQ基序 III
<220>
<221> MISC_FEATURE
<222> (2)..(4)
<223> Xaa = 任何氨基酸 除了D, E, K和R
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = D或E
<220>
<221> MISC_FEATURE
<222> (6)..(8)
<223> Xaa = 任何氨基酸 除了D, E, K和R
<220>
<221> MISC_FEATURE
<222> (10)..(20)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (22)..(22)
<223> Xaa = 任何氨基酸 除了D, E, K和R
<400> 83
Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa His Xaa
20
<210> 84
<211> 23
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> MobQ基序 III
<220>
<221> MISC_FEATURE
<222> (2)..(4)
<223> Xaa = 任何氨基酸 除了D, E, K和R
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = D或E
<220>
<221> MISC_FEATURE
<222> (6)..(8)
<223> Xaa = 任何氨基酸 除了D, E, K和R
<220>
<221> MISC_FEATURE
<222> (10)..(21)
<223> Xaa = 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (23)..(23)
<223> Xaa = 任何氨基酸 除了D, E, K和R
<400> 84
Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa His Xaa
20
<210> 85
<211> 1756
<212> PRT
<213> Escherichia coli
<400> 85
Met Met Ser Ile Ala Gln Val Arg Ser Ala Gly Ser Ala Gly Asn Tyr
1 5 10 15
Tyr Thr Asp Lys Asp Asn Tyr Tyr Val Leu Gly Ser Met Gly Glu Arg
20 25 30
Trp Ala Gly Lys Gly Ala Glu Gln Leu Gly Leu Gln Gly Ser Val Asp
35 40 45
Lys Asp Val Phe Thr Arg Leu Leu Glu Gly Arg Leu Pro Asp Gly Ala
50 55 60
Asp Leu Ser Arg Met Gln Asp Gly Ser Asn Lys His Arg Pro Gly Tyr
65 70 75 80
Asp Leu Thr Phe Ser Ala Pro Lys Ser Val Ser Met Met Ala Met Leu
85 90 95
Gly Gly Asp Lys Arg Leu Ile Asp Ala His Asn Gln Ala Val Asp Phe
100 105 110
Ala Val Arg Gln Val Glu Ala Leu Ala Ser Thr Arg Val Met Thr Asp
115 120 125
Gly Gln Ser Glu Thr Val Leu Thr Gly Asn Leu Val Met Ala Leu Phe
130 135 140
Asn His Asp Thr Ser Arg Asp Gln Glu Pro Gln Leu His Thr His Ala
145 150 155 160
Val Val Ala Asn Val Thr Gln His Asn Gly Glu Trp Lys Thr Leu Ser
165 170 175
Ser Asp Lys Val Gly Lys Thr Gly Phe Ile Glu Asn Val Tyr Ala Asn
180 185 190
Gln Ile Ala Phe Gly Arg Leu Tyr Arg Glu Lys Leu Lys Glu Gln Val
195 200 205
Glu Ala Leu Gly Tyr Glu Thr Glu Val Val Gly Lys His Gly Met Trp
210 215 220
Glu Met Pro Gly Val Pro Val Glu Ala Phe Ser Gly Arg Ser Gln Ala
225 230 235 240
Ile Arg Glu Ala Val Gly Glu Asp Ala Ser Leu Lys Ser Arg Asp Val
245 250 255
Ala Ala Leu Asp Thr Arg Lys Ser Lys Gln His Val Asp Pro Glu Ile
260 265 270
Arg Met Ala Glu Trp Met Gln Thr Leu Lys Glu Thr Gly Phe Asp Ile
275 280 285
Arg Ala Tyr Arg Asp Ala Ala Asp Gln Arg Thr Glu Ile Arg Thr Gln
290 295 300
Ala Pro Gly Pro Ala Ser Gln Asp Gly Pro Asp Val Gln Gln Ala Val
305 310 315 320
Thr Gln Ala Ile Ala Gly Leu Ser Glu Arg Lys Val Gln Phe Thr Tyr
325 330 335
Thr Asp Val Leu Ala Arg Thr Val Gly Ile Leu Pro Pro Glu Asn Gly
340 345 350
Val Ile Glu Arg Ala Arg Ala Gly Ile Asp Glu Ala Ile Ser Arg Glu
355 360 365
Gln Leu Ile Pro Leu Asp Arg Glu Lys Gly Leu Phe Thr Ser Gly Ile
370 375 380
His Val Leu Asp Glu Leu Ser Val Arg Ala Leu Ser Arg Asp Ile Met
385 390 395 400
Lys Gln Asn Arg Val Thr Val His Pro Glu Lys Ser Val Pro Arg Thr
405 410 415
Ala Gly Tyr Ser Asp Ala Val Ser Val Leu Ala Gln Asp Arg Pro Ser
420 425 430
Leu Ala Ile Val Ser Gly Gln Gly Gly Ala Ala Gly Gln Arg Glu Arg
435 440 445
Val Ala Glu Leu Val Met Met Ala Arg Glu Gln Gly Arg Glu Val Gln
450 455 460
Ile Ile Ala Ala Asp Arg Arg Ser Gln Met Asn Leu Lys Gln Asp Glu
465 470 475 480
Arg Leu Ser Gly Glu Leu Ile Thr Gly Arg Arg Gln Leu Leu Glu Gly
485 490 495
Met Ala Phe Thr Pro Gly Ser Thr Val Ile Val Asp Gln Gly Glu Lys
500 505 510
Leu Ser Leu Lys Glu Thr Leu Thr Leu Leu Asp Gly Ala Ala Arg His
515 520 525
Asn Val Gln Val Leu Ile Thr Asp Ser Gly Gln Arg Thr Gly Thr Gly
530 535 540
Ser Ala Leu Met Ala Met Lys Asp Ala Gly Val Asn Thr Tyr Arg Trp
545 550 555 560
Gln Gly Gly Glu Gln Arg Pro Ala Thr Ile Ile Ser Glu Pro Asp Arg
565 570 575
Asn Val Arg Tyr Ala Arg Leu Ala Gly Asp Phe Ala Ala Ser Val Lys
580 585 590
Ala Gly Glu Glu Ser Val Ala Gln Val Ser Gly Val Arg Glu Gln Ala
595 600 605
Ile Leu Thr Gln Ala Ile Arg Ser Glu Leu Lys Thr Gln Gly Val Leu
610 615 620
Gly His Pro Glu Val Thr Met Thr Ala Leu Ser Pro Val Trp Leu Asp
625 630 635 640
Ser Arg Ser Arg Tyr Leu Arg Asp Met Tyr Arg Pro Gly Met Val Met
645 650 655
Glu Gln Trp Asn Pro Glu Thr Arg Ser His Asp Arg Tyr Val Ile Asp
660 665 670
Arg Val Thr Ala Gln Ser His Ser Leu Thr Leu Arg Asp Ala Gln Gly
675 680 685
Glu Thr Gln Val Val Arg Ile Ser Ser Leu Asp Ser Ser Trp Ser Leu
690 695 700
Phe Arg Pro Glu Lys Met Pro Val Ala Asp Gly Glu Arg Leu Arg Val
705 710 715 720
Thr Gly Lys Ile Pro Gly Leu Arg Val Ser Gly Gly Asp Arg Leu Gln
725 730 735
Val Ala Ser Val Ser Glu Asp Ala Met Thr Val Val Val Pro Gly Arg
740 745 750
Ala Glu Pro Ala Ser Leu Pro Val Ser Asp Ser Pro Phe Thr Ala Leu
755 760 765
Lys Leu Glu Asn Gly Trp Val Glu Thr Pro Gly His Ser Val Ser Asp
770 775 780
Ser Ala Thr Val Phe Ala Ser Val Thr Gln Met Ala Met Asp Asn Ala
785 790 795 800
Thr Leu Asn Gly Leu Ala Arg Ser Gly Arg Asp Val Arg Leu Tyr Ser
805 810 815
Ser Leu Asp Glu Thr Arg Thr Ala Glu Lys Leu Ala Arg His Pro Ser
820 825 830
Phe Thr Val Val Ser Glu Gln Ile Lys Ala Arg Ala Gly Glu Thr Leu
835 840 845
Leu Glu Thr Ala Ile Ser Leu Gln Lys Ala Gly Leu His Thr Pro Ala
850 855 860
Gln Gln Ala Ile His Leu Ala Leu Pro Val Leu Glu Ser Lys Asn Leu
865 870 875 880
Ala Phe Ser Met Val Asp Leu Leu Thr Glu Ala Lys Ser Phe Ala Ala
885 890 895
Glu Gly Thr Gly Phe Thr Glu Leu Gly Gly Glu Ile Asn Ala Gln Ile
900 905 910
Lys Arg Gly Asp Leu Leu Tyr Val Asp Val Ala Lys Gly Tyr Gly Thr
915 920 925
Gly Leu Leu Val Ser Arg Ala Ser Tyr Glu Ala Glu Lys Ser Ile Leu
930 935 940
Arg His Ile Leu Glu Gly Lys Glu Ala Val Thr Pro Leu Met Glu Arg
945 950 955 960
Val Pro Gly Glu Leu Met Glu Thr Leu Thr Ser Gly Gln Arg Ala Ala
965 970 975
Thr Arg Met Ile Leu Glu Thr Ser Asp Arg Phe Thr Val Val Gln Gly
980 985 990
Tyr Ala Gly Val Gly Lys Thr Thr Gln Phe Arg Ala Val Met Ser Ala
995 1000 1005
Val Asn Met Leu Pro Ala Ser Glu Arg Pro Arg Val Val Gly Leu
1010 1015 1020
Gly Pro Thr His Arg Ala Val Gly Glu Met Arg Ser Ala Gly Val
1025 1030 1035
Asp Ala Gln Thr Leu Ala Ser Phe Leu His Asp Thr Gln Leu Gln
1040 1045 1050
Gln Arg Ser Gly Glu Thr Pro Asp Phe Ser Asn Thr Leu Phe Leu
1055 1060 1065
Leu Asp Glu Ser Ser Met Val Gly Asn Thr Glu Met Ala Arg Ala
1070 1075 1080
Tyr Ala Leu Ile Ala Ala Gly Gly Gly Arg Ala Val Ala Ser Gly
1085 1090 1095
Asp Thr Asp Gln Leu Gln Ala Ile Ala Pro Gly Gln Ser Phe Arg
1100 1105 1110
Leu Gln Gln Thr Arg Ser Ala Ala Asp Val Val Ile Met Lys Glu
1115 1120 1125
Ile Val Arg Gln Thr Pro Glu Leu Arg Glu Ala Val Tyr Ser Leu
1130 1135 1140
Ile Asn Arg Asp Val Glu Arg Ala Leu Ser Gly Leu Glu Ser Val
1145 1150 1155
Lys Pro Ser Gln Val Pro Arg Leu Glu Gly Ala Trp Ala Pro Glu
1160 1165 1170
His Ser Val Thr Glu Phe Ser His Ser Gln Glu Ala Lys Leu Ala
1175 1180 1185
Glu Ala Gln Gln Lys Ala Met Leu Lys Gly Glu Ala Phe Pro Asp
1190 1195 1200
Ile Pro Met Thr Leu Tyr Glu Ala Ile Val Arg Asp Tyr Thr Gly
1205 1210 1215
Arg Thr Pro Glu Ala Arg Glu Gln Thr Leu Ile Val Thr His Leu
1220 1225 1230
Asn Glu Asp Arg Arg Val Leu Asn Ser Met Ile His Asp Ala Arg
1235 1240 1245
Glu Lys Ala Gly Glu Leu Gly Lys Glu Gln Val Met Val Pro Val
1250 1255 1260
Leu Asn Thr Ala Asn Ile Arg Asp Gly Glu Leu Arg Arg Leu Ser
1265 1270 1275
Thr Trp Glu Lys Asn Pro Asp Ala Leu Ala Leu Val Asp Asn Val
1280 1285 1290
Tyr His Arg Ile Ala Gly Ile Ser Lys Asp Asp Gly Leu Ile Thr
1295 1300 1305
Leu Gln Asp Ala Glu Gly Asn Thr Arg Leu Ile Ser Pro Arg Glu
1310 1315 1320
Ala Val Ala Glu Gly Val Thr Leu Tyr Thr Pro Asp Lys Ile Arg
1325 1330 1335
Val Gly Thr Gly Asp Arg Met Arg Phe Thr Lys Ser Asp Arg Glu
1340 1345 1350
Arg Gly Tyr Val Ala Asn Ser Val Trp Thr Val Thr Ala Val Ser
1355 1360 1365
Gly Asp Ser Val Thr Leu Ser Asp Gly Gln Gln Thr Arg Val Ile
1370 1375 1380
Arg Pro Gly Gln Glu Arg Ala Glu Gln His Ile Asp Leu Ala Tyr
1385 1390 1395
Ala Ile Thr Ala His Gly Ala Gln Gly Ala Ser Glu Thr Phe Ala
1400 1405 1410
Ile Ala Leu Glu Gly Thr Glu Gly Asn Arg Lys Leu Met Ala Gly
1415 1420 1425
Phe Glu Ser Ala Tyr Val Ala Leu Ser Arg Met Lys Gln His Val
1430 1435 1440
Gln Val Tyr Thr Asp Asn Arg Gln Gly Trp Thr Asp Ala Ile Asn
1445 1450 1455
Asn Ala Val Gln Lys Gly Thr Ala His Asp Val Leu Glu Pro Lys
1460 1465 1470
Pro Asp Arg Glu Val Met Asn Ala Gln Arg Leu Phe Ser Thr Ala
1475 1480 1485
Arg Glu Leu Arg Asp Val Ala Ala Gly Arg Ala Val Leu Arg Gln
1490 1495 1500
Ala Gly Leu Ala Gly Gly Asp Ser Pro Ala Arg Phe Ile Ala Pro
1505 1510 1515
Gly Arg Lys Tyr Pro Gln Pro Tyr Val Ala Leu Pro Ala Phe Asp
1520 1525 1530
Arg Asn Gly Lys Ser Ala Gly Ile Trp Leu Asn Pro Leu Thr Thr
1535 1540 1545
Asp Asp Gly Asn Gly Leu Arg Gly Phe Ser Gly Glu Gly Arg Val
1550 1555 1560
Lys Gly Ser Gly Asp Ala Gln Phe Val Ala Leu Gln Gly Ser Arg
1565 1570 1575
Asn Gly Glu Ser Leu Leu Ala Asp Asn Met Gln Asp Gly Val Arg
1580 1585 1590
Ile Ala Arg Asp Asn Pro Asp Ser Gly Val Val Val Arg Ile Ala
1595 1600 1605
Gly Glu Gly Arg Pro Trp Asn Pro Gly Ala Ile Thr Gly Gly Arg
1610 1615 1620
Val Trp Gly Asp Ile Pro Asp Asn Ser Val Gln Pro Gly Ala Gly
1625 1630 1635
Asn Gly Glu Pro Val Thr Ala Glu Val Leu Ala Gln Arg Gln Ala
1640 1645 1650
Glu Glu Ala Ile Arg Arg Glu Thr Glu Arg Arg Ala Asp Glu Ile
1655 1660 1665
Val Arg Lys Met Ala Glu Asn Lys Pro Asp Leu Pro Asp Gly Lys
1670 1675 1680
Thr Glu Leu Ala Val Arg Asp Ile Ala Gly Gln Glu Arg Asp Arg
1685 1690 1695
Ser Ala Ile Ser Glu Arg Glu Thr Ala Leu Pro Glu Ser Val Leu
1700 1705 1710
Arg Glu Ser Gln Arg Glu Arg Glu Ala Val Arg Glu Val Ala Arg
1715 1720 1725
Glu Asn Leu Leu Gln Glu Arg Leu Gln Gln Met Glu Arg Asp Met
1730 1735 1740
Val Arg Asp Leu Gln Lys Glu Lys Thr Leu Gly Gly Asp
1745 1750 1755
<210> 86
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> TraI Eco的RecD样基序 I
<400> 86
Gly Tyr Ala Gly Val Gly Lys Thr
1 5
<210> 87
<211> 10
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> TraI Eco的RecD样基序 V
<400> 87
Tyr Ala Ile Thr Ala His Gly Ala Gln Gly
1 5 10
<210> 88
<211> 14
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> TraI Eco的MobF 基序 III
<400> 88
His Asp Thr Ser Arg Asp Gln Glu Pro Gln Leu His Thr His
1 5 10
<210> 89
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> XPD基序 V
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> 任何氨基酸 除了D, E, K或R. 优选地不带电荷或H.
更优选地 V, L, I, S或Y.
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> 任何氨基酸 除了D, E, K或R. 优选地不带电荷或H.
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> 任何氨基酸.
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> 任何氨基酸. 优选地 K, R或T.
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> 任何氨基酸 除了D, E, K或R. 优选地不带电荷或H.
更优选地 V, L, I, N或F.
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> 任何氨基酸 除了D, E, K或R. 优选地不带电荷或H.
更优选地 S或A.
<400> 89
Xaa Xaa Xaa Gly Xaa Xaa Xaa Glu Gly
1 5
<210> 90
<211> 22
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> XPD基序 VI
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> 任何氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> 任何氨基酸 除了D, E, K, R. 通常G, P, A, V, L, I, M,
C, F, Y, W, H, Q, N, S或T. 优选地不带电荷. 优选地
不是H. 更优选地 V, A, L, I或M.
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> 任何氨基酸 除了D, E, K, R. 通常G, P, A, V, L, I, M,
C, F, Y, W, H, Q, N, S或T. 优选地不带电荷. 优选地
不是H. 更优选地 V, A, L, I, M或C.
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> 任何氨基酸 除了D, E, K, R. 通常G, P, A, V, L, I, M,
C, F, Y, W, H, Q, N, S或T. 优选地不带电荷. 优选地
不是H. 更优选地 I, H, L, F, M或V.
<220>
<221> MISC_FEATURE
<222> (9)..(11)
<223> 任何氨基酸.
<220>
<221> MISC_FEATURE
<222> (12)..(12)
<223> D或E
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> 任何氨基酸.
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> 任何氨基酸. 优选地 G, A, S或C
<220>
<221> MISC_FEATURE
<222> (15)..(16)
<223> 任何氨基酸.
<220>
<221> MISC_FEATURE
<222> (17)..(17)
<223> 任何氨基酸. 优选地 F, V, L, I, M, A, W或Y
<220>
<221> MISC_FEATURE
<222> (18)..(18)
<223> 任何氨基酸. 优选地 L, F, Y, M, I或V.
<220>
<221> MISC_FEATURE
<222> (19)..(19)
<223> 任何氨基酸. 优选地 A, C, V, L, I, M或S.
<400> 90
Gln Xaa Xaa Gly Arg Xaa Xaa Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Asp Asn Arg
20
<210> 91
<211> 726
<212> PRT
<213> 布氏拟甲烷球菌(Methanococcoides burtonii)
<400> 91
Met Ser Asp Lys Pro Ala Phe Met Lys Tyr Phe Thr Gln Ser Ser Cys
1 5 10 15
Tyr Pro Asn Gln Gln Glu Ala Met Asp Arg Ile His Ser Ala Leu Met
20 25 30
Gln Gln Gln Leu Val Leu Phe Glu Gly Ala Cys Gly Thr Gly Lys Thr
35 40 45
Leu Ser Ala Leu Val Pro Ala Leu His Val Gly Lys Met Leu Gly Lys
50 55 60
Thr Val Ile Ile Ala Thr Asn Val His Gln Gln Met Val Gln Phe Ile
65 70 75 80
Asn Glu Ala Arg Asp Ile Lys Lys Val Gln Asp Val Lys Val Ala Val
85 90 95
Ile Lys Gly Lys Thr Ala Met Cys Pro Gln Glu Ala Asp Tyr Glu Glu
100 105 110
Cys Ser Val Lys Arg Glu Asn Thr Phe Glu Leu Met Glu Thr Glu Arg
115 120 125
Glu Ile Tyr Leu Lys Arg Gln Glu Leu Asn Ser Ala Arg Asp Ser Tyr
130 135 140
Lys Lys Ser His Asp Pro Ala Phe Val Thr Leu Arg Asp Glu Leu Ser
145 150 155 160
Lys Glu Ile Asp Ala Val Glu Glu Lys Ala Arg Gly Leu Arg Asp Arg
165 170 175
Ala Cys Asn Asp Leu Tyr Glu Val Leu Arg Ser Asp Ser Glu Lys Phe
180 185 190
Arg Glu Trp Leu Tyr Lys Glu Val Arg Ser Pro Glu Glu Ile Asn Asp
195 200 205
His Ala Ile Lys Asp Gly Met Cys Gly Tyr Glu Leu Val Lys Arg Glu
210 215 220
Leu Lys His Ala Asp Leu Leu Ile Cys Asn Tyr His His Val Leu Asn
225 230 235 240
Pro Asp Ile Phe Ser Thr Val Leu Gly Trp Ile Glu Lys Glu Pro Gln
245 250 255
Glu Thr Ile Val Ile Phe Asp Glu Ala His Asn Leu Glu Ser Ala Ala
260 265 270
Arg Ser His Ser Ser Leu Ser Leu Thr Glu His Ser Ile Glu Lys Ala
275 280 285
Ile Thr Glu Leu Glu Ala Asn Leu Asp Leu Leu Ala Asp Asp Asn Ile
290 295 300
His Asn Leu Phe Asn Ile Phe Leu Glu Val Ile Ser Asp Thr Tyr Asn
305 310 315 320
Ser Arg Phe Lys Phe Gly Glu Arg Glu Arg Val Arg Lys Asn Trp Tyr
325 330 335
Asp Ile Arg Ile Ser Asp Pro Tyr Glu Arg Asn Asp Ile Val Arg Gly
340 345 350
Lys Phe Leu Arg Gln Ala Lys Gly Asp Phe Gly Glu Lys Asp Asp Ile
355 360 365
Gln Ile Leu Leu Ser Glu Ala Ser Glu Leu Gly Ala Lys Leu Asp Glu
370 375 380
Thr Tyr Arg Asp Gln Tyr Lys Lys Gly Leu Ser Ser Val Met Lys Arg
385 390 395 400
Ser His Ile Arg Tyr Val Ala Asp Phe Met Ser Ala Tyr Ile Glu Leu
405 410 415
Ser His Asn Leu Asn Tyr Tyr Pro Ile Leu Asn Val Arg Arg Asp Met
420 425 430
Asn Asp Glu Ile Tyr Gly Arg Val Glu Leu Phe Thr Cys Ile Pro Lys
435 440 445
Asn Val Thr Glu Pro Leu Phe Asn Ser Leu Phe Ser Val Ile Leu Met
450 455 460
Ser Ala Thr Leu His Pro Phe Glu Met Val Lys Lys Thr Leu Gly Ile
465 470 475 480
Thr Arg Asp Thr Cys Glu Met Ser Tyr Gly Thr Ser Phe Pro Glu Glu
485 490 495
Lys Arg Leu Ser Ile Ala Val Ser Ile Pro Pro Leu Phe Ala Lys Asn
500 505 510
Arg Asp Asp Arg His Val Thr Glu Leu Leu Glu Gln Val Leu Leu Asp
515 520 525
Ser Ile Glu Asn Ser Lys Gly Asn Val Ile Leu Phe Phe Gln Ser Ala
530 535 540
Phe Glu Ala Lys Arg Tyr Tyr Ser Lys Ile Glu Pro Leu Val Asn Val
545 550 555 560
Pro Val Phe Leu Asp Glu Val Gly Ile Ser Ser Gln Asp Val Arg Glu
565 570 575
Glu Phe Phe Ser Ile Gly Glu Glu Asn Gly Lys Ala Val Leu Leu Ser
580 585 590
Tyr Leu Trp Gly Thr Leu Ser Glu Gly Ile Asp Tyr Arg Asp Gly Arg
595 600 605
Gly Arg Thr Val Ile Ile Ile Gly Val Gly Tyr Pro Ala Leu Asn Asp
610 615 620
Arg Met Asn Ala Val Glu Ser Ala Tyr Asp His Val Phe Gly Tyr Gly
625 630 635 640
Ala Gly Trp Glu Phe Ala Ile Gln Val Pro Thr Ile Arg Lys Ile Arg
645 650 655
Gln Ala Met Gly Arg Val Val Arg Ser Pro Thr Asp Tyr Gly Ala Arg
660 665 670
Ile Leu Leu Asp Gly Arg Phe Leu Thr Asp Ser Lys Lys Arg Phe Gly
675 680 685
Lys Phe Ser Val Phe Glu Val Phe Pro Pro Ala Glu Arg Ser Glu Phe
690 695 700
Val Asp Val Asp Pro Glu Lys Val Lys Tyr Ser Leu Met Asn Phe Phe
705 710 715 720
Met Asp Asn Asp Glu Gln
725
<210> 92
<211> 9
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 基序 V
<400> 92
Tyr Leu Trp Gly Thr Leu Ser Glu Gly
1 5
<210> 93
<211> 22
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 基序 VI
<400> 93
Gln Ala Met Gly Arg Val Val Arg Ser Pro Thr Asp Tyr Gly Ala Arg
1 5 10 15
Ile Leu Leu Asp Gly Arg
20
<210> 94
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Double stranded portion of MuA substrate
<400> 94
gttttcgcat ttatcgtgaa acgctttcgc gtttttcgtg cgccgcttca 50
<210> 95
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Double stranded portion of MuA substrate with U at 3' end
<220>
<221> misc_feature
<222> (50)..(50)
<223> n = U
<400> 95
caaaagcgta aatagcactt tgcgaaagcg caaaaagcac gcggcgaagn 50
<210> 96
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 双链MuA底物的突出端链
<220>
<221> misc_feature
<222> (50)..(50)
<223> n = U
<400> 96
caaaagcgta aatagcactt tgcgaaagcg caaaaagcac gcggcgaagn ctag 54
<210> 97
<211> 439
<212> PRT
<213> 肠杆菌噬菌体 T4(Enterobacteria phage T4)
<400> 97
Met Thr Phe Asp Asp Leu Thr Glu Gly Gln Lys Asn Ala Phe Asn Ile
1 5 10 15
Val Met Lys Ala Ile Lys Glu Lys Lys His His Val Thr Ile Asn Gly
20 25 30
Pro Ala Gly Thr Gly Lys Thr Thr Leu Thr Lys Phe Ile Ile Glu Ala
35 40 45
Leu Ile Ser Thr Gly Glu Thr Gly Ile Ile Leu Ala Ala Pro Thr His
50 55 60
Ala Ala Lys Lys Ile Leu Ser Lys Leu Ser Gly Lys Glu Ala Ser Thr
65 70 75 80
Ile His Ser Ile Leu Lys Ile Asn Pro Val Thr Tyr Glu Glu Asn Val
85 90 95
Leu Phe Glu Gln Lys Glu Val Pro Asp Leu Ala Lys Cys Arg Val Leu
100 105 110
Ile Cys Asp Glu Val Ser Met Tyr Asp Arg Lys Leu Phe Lys Ile Leu
115 120 125
Leu Ser Thr Ile Pro Pro Trp Cys Thr Ile Ile Gly Ile Gly Asp Asn
130 135 140
Lys Gln Ile Arg Pro Val Asp Pro Gly Glu Asn Thr Ala Tyr Ile Ser
145 150 155 160
Pro Phe Phe Thr His Lys Asp Phe Tyr Gln Cys Glu Leu Thr Glu Val
165 170 175
Lys Arg Ser Asn Ala Pro Ile Ile Asp Val Ala Thr Asp Val Arg Asn
180 185 190
Gly Lys Trp Ile Tyr Asp Lys Val Val Asp Gly His Gly Val Arg Gly
195 200 205
Phe Thr Gly Asp Thr Ala Leu Arg Asp Phe Met Val Asn Tyr Phe Ser
210 215 220
Ile Val Lys Ser Leu Asp Asp Leu Phe Glu Asn Arg Val Met Ala Phe
225 230 235 240
Thr Asn Lys Ser Val Asp Lys Leu Asn Ser Ile Ile Arg Lys Lys Ile
245 250 255
Phe Glu Thr Asp Lys Asp Phe Ile Val Gly Glu Ile Ile Val Met Gln
260 265 270
Glu Pro Leu Phe Lys Thr Tyr Lys Ile Asp Gly Lys Pro Val Ser Glu
275 280 285
Ile Ile Phe Asn Asn Gly Gln Leu Val Arg Ile Ile Glu Ala Glu Tyr
290 295 300
Thr Ser Thr Phe Val Lys Ala Arg Gly Val Pro Gly Glu Tyr Leu Ile
305 310 315 320
Arg His Trp Asp Leu Thr Val Glu Thr Tyr Gly Asp Asp Glu Tyr Tyr
325 330 335
Arg Glu Lys Ile Lys Ile Ile Ser Ser Asp Glu Glu Leu Tyr Lys Phe
340 345 350
Asn Leu Phe Leu Gly Lys Thr Ala Glu Thr Tyr Lys Asn Trp Asn Lys
355 360 365
Gly Gly Lys Ala Pro Trp Ser Asp Phe Trp Asp Ala Lys Ser Gln Phe
370 375 380
Ser Lys Val Lys Ala Leu Pro Ala Ser Thr Phe His Lys Ala Gln Gly
385 390 395 400
Met Ser Val Asp Arg Ala Phe Ile Tyr Thr Pro Cys Ile His Tyr Ala
405 410 415
Asp Val Glu Leu Ala Gln Gln Leu Leu Tyr Val Gly Val Thr Arg Gly
420 425 430
Arg Tyr Asp Val Phe Tyr Val
435
<210> 98
<211> 678
<212> PRT
<213> 海栖热袍菌(Rhodothermus marinus)
<400> 98
Met Glu Glu Leu Ser Asn Glu Gln Gln Arg Val Leu Asp His Val Leu
1 5 10 15
Ala Trp Leu Glu Arg Asn Asp Ala Pro Pro Ile Phe Ile Leu Thr Gly
20 25 30
Ser Ala Gly Thr Gly Lys Thr Leu Leu Ile Arg His Leu Val Arg Ala
35 40 45
Leu Gln Asp Arg Arg Ile His Tyr Ala Leu Ala Ala Pro Thr Gly Arg
50 55 60
Ala Ala Arg Ile Leu Ser Glu Arg Thr Gly Asp His Ala Arg Thr Leu
65 70 75 80
His Ser Leu Ile Tyr Ile Phe Asp Arg Tyr Gln Leu Val Glu Glu Ala
85 90 95
Asp Arg Gln Thr Asp Glu Pro Leu Ser Leu Gln Leu His Phe Ala Leu
100 105 110
Arg Ser Ala Glu His Asp Ala Arg Leu Ile Ile Val Asp Glu Ala Ser
115 120 125
Met Val Ser Asp Thr Ala Gly Glu Glu Glu Leu Tyr Arg Phe Gly Ser
130 135 140
Gly Arg Leu Leu Asn Asp Leu Leu Thr Phe Ala Arg Leu Ile Pro Lys
145 150 155 160
Arg Asp Arg Pro Pro Thr Thr Arg Leu Leu Phe Val Gly Asp Pro Ala
165 170 175
Gln Leu Pro Pro Val Gly Gln Ser Val Ser Pro Ala Leu Ser Ala Gln
180 185 190
Tyr Leu Arg Asp Thr Phe Gly Leu Ser Ala Glu Thr Ala His Leu Arg
195 200 205
Ser Val Tyr Arg Gln Arg Lys Gly His Pro Ile Leu Glu Thr Ala Thr
210 215 220
Ala Leu Arg Asn Ala Leu Glu Lys Gly His Tyr His Thr Phe Arg Leu
225 230 235 240
Pro Glu Gln Pro Pro Asp Leu Arg Pro Val Gly Leu Glu Glu Ala Ile
245 250 255
Glu Thr Thr Ala Thr Asp Phe Arg Arg Gln Asn Pro Ser Val Leu Leu
260 265 270
Cys Arg Thr Asn Ala Leu Ala Arg Lys Leu Asn Ala Ala Val Arg Ala
275 280 285
Arg Leu Trp Gly Arg Glu Gly Leu Pro Pro Gln Pro Gly Asp Leu Leu
290 295 300
Leu Val Asn Arg Asn Ala Pro Leu His Gly Leu Phe Asn Gly Asp Leu
305 310 315 320
Val Leu Val Glu Thr Val Gly Pro Leu Glu His Arg Arg Val Gly Arg
325 330 335
Arg Gly Arg Pro Pro Val Asp Leu Tyr Phe Arg Asp Val Glu Leu Leu
340 345 350
Tyr Pro His Glu Lys Pro Arg Asn Arg Ile Arg Cys Lys Leu Leu Glu
355 360 365
Asn Leu Leu Glu Ser Pro Asp Gly Gln Leu Ser Pro Asp Ile Ile Gln
370 375 380
Ala Leu Leu Ile Asp Phe Tyr Arg Arg His Pro Ser Leu Lys His Gly
385 390 395 400
Ser Ser Glu Phe Arg Leu Met Leu Ala Asn Asp Ala Tyr Phe Asn Ala
405 410 415
Leu His Val Arg Tyr Gly Tyr Ala Met Thr Val His Lys Ala Gln Gly
420 425 430
Gly Glu Trp Lys Arg Ala Thr Val Val Phe Asn Asp Trp Arg His Phe
435 440 445
Arg His Ala Glu Phe Phe Arg Trp Ala Tyr Thr Ala Ile Thr Arg Ala
450 455 460
Arg Glu Glu Leu Leu Thr Ile Gly Ala Pro Ser Phe Glu Ala Leu Ser
465 470 475 480
Asp Met Arg Trp Gln Pro Ala Pro Ser Val Pro Ala Pro Glu Gln Ala
485 490 495
Ala Glu Asn Ala Thr Arg Phe Pro Leu Lys Ala Leu Glu Thr Tyr His
500 505 510
Gln Arg Leu Ser Glu Ala Leu Thr Ala Ala Gly Ile Glu Thr Thr Gly
515 520 525
Val Glu Leu Leu Gln Tyr Ala Val Arg Tyr His Leu Ala Arg Ala Asp
530 535 540
Arg Thr Thr Arg Ile Gln Tyr Tyr Tyr Arg Gly Asp Gly Gln Ile Ser
545 550 555 560
Arg Ile Val Thr Leu Gly Gly Ala Asp Asp Pro Glu Leu Thr Gln Gln
565 570 575
Ala Tyr Ala Leu Phe Glu Arg Ile Leu Ser Glu Pro Pro Ala Asp Ser
580 585 590
Gly Glu Leu Pro Glu Asn Pro Leu Leu Arg Glu Phe Leu Glu Arg Ala
595 600 605
His Leu Arg Leu Glu Gly Ser Gly Ile Arg Ile Val His Trp Lys Glu
610 615 620
Met Pro Tyr Ala Leu Arg Leu Tyr Phe Ser Ala Asp Gly Glu Asn Val
625 630 635 640
Thr Ile Asp Phe Tyr Tyr Asn Arg Arg Gly Val Trp Thr His Ala Gln
645 650 655
Glu Val Gly Arg Ser Ser Ser Gly Ala Leu Phe Ala Arg Ile Gln Ser
660 665 670
Leu Leu Gln Ala Asp Ser
675
<210> 99
<211> 496
<212> PRT
<213> 蓝丝菌ATCC51142(Cyanothece ATCC51142)
<400> 99
Met Ser Gln Ser Val Val Val Pro Asp Glu Leu Gly Glu Ile Ile Thr
1 5 10 15
Ala Val Ile Glu Phe Tyr Gln Asp Ala Val Asp Lys Ile Glu Pro Lys
20 25 30
Ile Val Phe Leu Glu Leu Arg Lys Asn Val Val Asp Trp Val Ser Arg
35 40 45
Thr Gln Leu Lys Ile Glu Glu Lys Glu Ile Gln Ala Thr Gly Leu Thr
50 55 60
Arg Gln Gln Gln Thr Ala Tyr Lys Glu Met Ile Asn Phe Ile Glu Asn
65 70 75 80
Ser Ser Glu Gln Tyr Phe Arg Leu Ser Gly Tyr Ala Gly Thr Gly Lys
85 90 95
Ser Phe Leu Met Ala Lys Val Ile Glu Trp Leu Lys Gln Glu Asp Tyr
100 105 110
Lys Tyr Ser Val Ala Ala Pro Thr Asn Lys Ala Ala Lys Asn Leu Thr
115 120 125
Gln Ile Ala Arg Ser Gln Gly Ile Lys Ile Glu Ala Thr Thr Val Ala
130 135 140
Lys Leu Leu Lys Leu Gln Pro Thr Ile Asp Val Asp Thr Gly Gln Gln
145 150 155 160
Ser Phe Glu Phe Asn Ser Glu Lys Glu Leu Glu Leu Lys Asp Tyr Asp
165 170 175
Val Ile Ile Ile Asp Glu Tyr Ser Met Leu Asn Lys Asp Asn Phe Arg
180 185 190
Asp Leu Gln Gln Ala Val Lys Gly Gly Glu Ser Lys Phe Ile Phe Val
195 200 205
Gly Asp Ser Ser Gln Leu Pro Pro Val Lys Glu Lys Glu Pro Ile Val
210 215 220
Ala Asn His Pro Asp Ile Arg Lys Ser Ala Asn Leu Thr Gln Ile Val
225 230 235 240
Arg Tyr Asp Gly Glu Ile Val Lys Val Ala Glu Ser Ile Arg Arg Asn
245 250 255
Pro Arg Trp Asn His Gln Thr Tyr Pro Phe Glu Thr Val Ala Asp Gly
260 265 270
Thr Ile Ile Lys Leu Asn Thr Glu Asp Trp Leu Gln Gln Ala Leu Ser
275 280 285
His Phe Glu Lys Glu Asp Trp Leu Ser Asn Pro Asp Tyr Val Arg Met
290 295 300
Ile Thr Trp Arg Asn Lys Thr Ala Asp Lys Tyr Asn Gln Ala Ile Arg
305 310 315 320
Glu Ala Leu Tyr Gly Glu Asn Val Glu Gln Leu Val Val Gly Asp Arg
325 330 335
Leu Ile Ala Lys Lys Pro Val Phe Arg Ser Leu Pro Gly Gly Lys Lys
340 345 350
Lys Glu Lys Lys Ile Ile Leu Asn Asn Ser Glu Glu Cys Lys Val Ile
355 360 365
Glu Thr Pro Lys Ile Asn Tyr Asn Glu Lys Tyr Lys Trp Glu Phe Tyr
370 375 380
Gln Val Lys Val Arg Thr Asp Glu Gly Gly Met Ile Glu Leu Arg Ile
385 390 395 400
Leu Thr Ser Glu Ser Glu Glu Lys Arg Gln Lys Lys Leu Lys Glu Leu
405 410 415
Ala Lys Arg Ala Arg Glu Glu Glu Asn Tyr Ser Glu Lys Lys Lys Gln
420 425 430
Trp Ala Ile Tyr Tyr Glu Leu Asp Glu Leu Phe Asp Asn Met Ala Tyr
435 440 445
Ala Tyr Ala Leu Thr Cys His Lys Ala Gln Gly Ser Ser Ile Asp Asn
450 455 460
Val Phe Leu Leu Val Ser Asp Met His Tyr Cys Arg Asp Lys Thr Lys
465 470 475 480
Met Ile Tyr Thr Gly Leu Thr Arg Ala Lys Lys Cys Cys Tyr Val Gly
485 490 495
<210> 100
<211> 421
<212> PRT
<213> Salinibacter ruber
<400> 100
Met Ser Thr Phe Ala Asp Ala Pro Phe Thr Glu Asp Gln Glu Glu Ala
1 5 10 15
Tyr Asp His Val Tyr Asp Arg Leu Ala Gln Gly Glu Arg Phe Thr Gly
20 25 30
Leu Arg Gly Tyr Ala Gly Thr Gly Lys Thr Tyr Leu Val Ser Arg Leu
35 40 45
Val Glu Gln Leu Leu Asp Glu Asp Cys Thr Val Thr Val Cys Ala Pro
50 55 60
Thr His Lys Ala Val Gln Val Leu Ser Asp Glu Leu Gly Asp Ala Pro
65 70 75 80
Val Gln Met Gln Thr Leu His Ser Phe Leu Gly Leu Arg Leu Gln Pro
85 90 95
Lys Gln Asp Gly Glu Tyr Glu Leu Val Ala Glu Glu Glu Arg Asn Phe
100 105 110
Ala Glu Gly Val Val Ile Val Asp Glu Ala Ser Met Ile Gly Arg Glu
115 120 125
Glu Trp Ser His Ile Gln Asp Ala Pro Phe Trp Val Gln Trp Leu Phe
130 135 140
Val Gly Asp Pro Ala Gln Leu Pro Pro Val Asn Glu Asp Pro Ser Pro
145 150 155 160
Ala Leu Asp Val Pro Gly Pro Thr Leu Glu Thr Ile His Arg Gln Ala
165 170 175
Ala Asp Asn Pro Ile Leu Glu Leu Ala Thr Lys Ile Arg Thr Gly Ala
180 185 190
Asp Gly Arg Phe Gly Ser Thr Phe Glu Asp Gly Lys Gly Val Ala Val
195 200 205
Thr Arg Asn Arg Glu Glu Phe Leu Asp Ser Ile Leu Arg Ala Phe Asp
210 215 220
Ala Asp Ala Phe Ala Glu Asp Ala Thr His Ala Arg Val Leu Ala Tyr
225 230 235 240
Arg Asn Lys Thr Val Arg Arg Tyr Asn Arg Glu Ile Arg Ala Glu Arg
245 250 255
Tyr Gly Ala Asp Ala Asp Arg Phe Val Glu Gly Glu Trp Leu Val Gly
260 265 270
Thr Glu Thr Trp Tyr Tyr Asp Gly Val Gln Arg Leu Thr Asn Ser Glu
275 280 285
Glu Val Arg Val Lys Lys Ala Gln Val Glu Thr Phe Glu Ala Asp Asp
290 295 300
Gln Ser Glu Trp Thr Val Trp Glu Leu Lys Ile Arg Thr Pro Gly Arg
305 310 315 320
Gly Leu Thr Arg Thr Ile His Val Leu His Glu Glu Glu Arg Glu Arg
325 330 335
Tyr Glu Asn Ala Leu Glu Arg Arg Arg Gly Lys Ala Glu Asp Asp Pro
340 345 350
Ser Lys Trp Asp Arg Phe Phe Glu Leu Arg Glu Arg Phe Ala Arg Val
355 360 365
Asp Tyr Ala Tyr Ala Thr Thr Val His Arg Ala Gln Gly Ser Thr Tyr
370 375 380
Asp Thr Val Phe Val Asp His Arg Asp Leu Arg Val Cys Arg Gly Glu
385 390 395 400
Glu Arg Gly Ala Leu Leu Tyr Val Ala Val Thr Arg Pro Ser Arg Arg
405 410 415
Leu Ala Leu Leu Val
420
<210> 101
<211> 500
<212> PRT
<213> Sulfurimonas gotlandica GD1
<400> 101
Met Lys Ile Leu Asn Lys Glu Thr Tyr Lys Leu Ser Leu His Gln Glu
1 5 10 15
Glu Val Phe Thr Gln Ile Val Ser Gln Leu Asp Thr Lys Val Ser Ser
20 25 30
Ile Leu Lys Ser Thr Asn Ile Glu Asp Tyr Leu Leu Ser Leu Thr Gly
35 40 45
Pro Ala Gly Thr Gly Lys Thr Phe Leu Thr Thr Gln Ile Ala Lys Tyr
50 55 60
Leu Val Glu Lys Arg Lys Glu Ser Glu Tyr Pro Met Ser Ser Asp Phe
65 70 75 80
Asp Phe Thr Ile Thr Ala Pro Thr His Lys Ala Val Gly Val Leu Ser
85 90 95
Lys Leu Leu Arg Glu Asn Asn Ile Gln Ser Ser Cys Lys Thr Ile His
100 105 110
Ser Phe Leu Gly Ile Lys Pro Phe Ile Asp Tyr Thr Thr Gly Glu Glu
115 120 125
Lys Phe Val Val Asp Lys Thr Asn Lys Arg Lys Asp Arg Thr Ser Ile
130 135 140
Leu Ile Val Asp Glu Ser Ser Met Ile Gly Asn Thr Leu Tyr Glu Tyr
145 150 155 160
Ile Leu Glu Ala Ile Glu Asp Lys Arg Val Asn Val Val Leu Phe Ile
165 170 175
Gly Asp Pro Tyr Gln Leu Leu Pro Ile Glu Asn Ser Lys Asn Glu Ile
180 185 190
Tyr Asp Leu Pro Asn Arg Phe Phe Leu Ser Glu Val Val Arg Gln Ala
195 200 205
Glu Asn Ser Tyr Ile Ile Arg Val Ala Thr Lys Leu Arg Glu Arg Ile
210 215 220
Lys Asn Gln Asp Phe Ile Ser Leu Gln Gln Phe Phe Gln Glu Asn Met
225 230 235 240
Glu Asp Glu Ile Thr Phe Phe His Asn Lys Glu Ala Phe Leu Glu Asp
245 250 255
Phe Tyr Lys Glu Glu Glu Trp Tyr Lys Glu Asn Lys Ile Leu Ala Thr
260 265 270
Tyr Lys Asn Lys Asp Val Asp Ala Phe Asn Lys Ile Ile Arg Asn Lys
275 280 285
Phe Trp Glu Gln Lys Gly Asn Thr Thr Pro Ser Thr Leu Leu Ala Gly
290 295 300
Asp Met Ile Arg Phe Lys Asp Ala Tyr Thr Val Gly Asp Ile Thr Ile
305 310 315 320
Tyr His Asn Gly Gln Glu Leu Gln Leu Gly Ser Thr Glu Val Lys Tyr
325 330 335
His Asp Ser Leu His Ile Glu Tyr Trp Glu Cys Lys Ser Ile Tyr Ala
340 345 350
Leu Glu Gln Gln Val Phe Arg Val Val Asn Pro Asp Ser Glu Ala Val
355 360 365
Phe Asn Gln Lys Leu Gln Ser Leu Ala Thr Lys Ala Lys Gln Ala Lys
370 375 380
Phe Pro Asp Asn Lys Lys Leu Trp Lys Leu Tyr Tyr Glu Thr Arg Asn
385 390 395 400
Met Phe Ala Asn Val Gln Tyr Ile His Ala Ser Thr Ile His Lys Leu
405 410 415
Gln Gly Ser Thr Tyr Asp Val Ser Tyr Ile Asp Ile Phe Ser Leu Val
420 425 430
His Asn His Tyr Met Ser Asp Glu Glu Lys Tyr Arg Leu Leu Tyr Val
435 440 445
Ala Ile Thr Arg Ala Ser Lys Asp Ile Lys Ile Phe Met Ser Ala Phe
450 455 460
Asp Arg Thr Ser Asp Glu Lys Val Ile Ile Asn Asn Gln Asn Ser Glu
465 470 475 480
Thr Met Asn Thr Leu Lys Gln Leu His Asp Ile Asp Ile Ile Leu Lys
485 490 495
Asp Leu Asp Leu
500
<210> 102
<211> 450
<212> PRT
<213> 亨利特弧菌噬菌体 12B8(Vibrio phage henriette 12B8)
<400> 102
Met Ala Asp Phe Glu Leu Thr Leu Gly Gln Lys Thr Val Leu Gly Glu
1 5 10 15
Val Ile Ser Thr Ile Leu Lys Pro Val Asn Leu Asn Asp Thr Ser Arg
20 25 30
Phe His Thr Met His Gly Pro Ala Gly Ser Gly Lys Thr Thr Val Leu
35 40 45
Gln Arg Ile Ile Ser Gln Ile Pro Ala Tyr Lys Thr Ile Gly Phe Cys
50 55 60
Ser Pro Thr His Lys Ser Val Lys Val Ile Arg Arg Met Ala Arg Glu
65 70 75 80
Ala Gly Ile Ser His Arg Val Asp Ile Arg Thr Ile His Ser Ala Leu
85 90 95
Gly Leu Val Met Lys Pro Val Arg Gly Asp Glu Val Leu Val Lys Glu
100 105 110
Pro Phe Ala Glu Glu Arg Ile Tyr Asp Val Leu Ile Ile Asp Glu Ala
115 120 125
Gly Met Leu Asn Asp Glu Leu Ile Met Tyr Ile Leu Glu Ser Gln Ser
130 135 140
Ser Lys Val Ile Phe Val Gly Asp Met Cys Gln Ile Gly Pro Ile Gln
145 150 155 160
Ser Asn Leu Pro Glu Glu Asp Gly Tyr Thr Pro Thr Ser Thr Asp Asp
165 170 175
Val Ser Lys Val Phe Thr Glu Val Glu Met Met Ser Ala Leu Thr Glu
180 185 190
Val Val Arg Gln Ala Glu Gly Ser Pro Ile Ile Gln Leu Ala Thr Glu
195 200 205
Phe Arg Leu Ala Gln Asp Asp Ile Tyr Ala Asp Leu Pro Arg Ile Val
210 215 220
Thr Asn Thr Thr Pro Asp Gly Asn Gly Ile Ile Thr Met Pro Asn Gly
225 230 235 240
Asn Trp Val Asp Ser Ala Val Ala Arg Phe Gln Ser Asp Gln Phe Lys
245 250 255
Glu Asp Pro Asp His Cys Arg Ile Val Cys Tyr Thr Asn Ala Met Val
260 265 270
Asp Leu Cys Asn Asp Leu Val Arg Lys Arg Leu Phe Gly Ala Asp Val
275 280 285
Pro Glu Trp Leu Glu Asp Glu Ile Leu Val Ala Gln Glu Met Gly Ser
290 295 300
Thr Trp Asn Asn Ala Asp Glu Leu Arg Ile Val Ser Ile Asp Asp His
305 310 315 320
Phe Asp Gln Gln Tyr Glu Val Pro Cys Trp Arg Met Gln Leu Glu Ser
325 330 335
Val Glu Asp His Lys Leu His Asn Ala Leu Val Val Lys Gly Asp Tyr
340 345 350
Ile Glu Asp Phe Lys Phe Arg Leu Asn Ala Ile Ala Glu Arg Ala Asn
355 360 365
Thr Asp Lys Asn Met Ser Gly Met His Trp Lys Glu Phe Trp Gly Met
370 375 380
Arg Lys Lys Phe Asn Thr Phe Lys Asn Val Tyr Ala Gly Thr Ala His
385 390 395 400
Lys Ser Gln Gly Ser Thr Phe Asp Tyr Thr Tyr Val Phe Thr Pro Asp
405 410 415
Phe Tyr Lys Phe Gly Ala Thr Met Thr Ile Lys Arg Leu Leu Tyr Thr
420 425 430
Ala Ile Thr Arg Ser Arg Tyr Thr Thr Tyr Phe Ala Met Asn Thr Gly
435 440 445
Ala Gln
450
<210> 103
<211> 421
<212> PRT
<213> 弧菌噬菌体 phi-pp2(Vibrio phage phi-pp2)
<400> 103
Met Gly Leu Thr Asn Cys Gln Gln Gly Ala Met Asp Ala Phe Leu Glu
1 5 10 15
Ser Asp Gly His Met Thr Ile Ser Gly Pro Ala Gly Ser Gly Lys Thr
20 25 30
Phe Leu Met Lys Ser Ile Leu Glu Ala Leu Glu Ser Lys Gly Lys Asn
35 40 45
Val Thr Met Val Thr Pro Thr His Gln Ala Lys Asn Val Leu His Lys
50 55 60
Ala Thr Gly Gln Glu Val Ser Thr Ile His Ser Leu Leu Lys Ile His
65 70 75 80
Pro Asp Thr Tyr Glu Asp Gln Lys His Phe Thr Gln Ser Gly Glu Val
85 90 95
Glu Gly Leu Asp Glu Ile Asp Val Leu Val Val Glu Glu Ala Ser Met
100 105 110
Val Asp Glu Glu Leu Phe Gln Ile Thr Gly Arg Thr Met Pro Arg Lys
115 120 125
Cys Arg Ile Leu Ala Val Gly Asp Lys Tyr Gln Leu Gln Pro Val Lys
130 135 140
His Asp Pro Gly Val Ile Ser Pro Phe Phe Thr Lys Phe Thr Thr Phe
145 150 155 160
Glu Met Asn Glu Val Val Arg Gln Ala Lys Asp Asn Pro Leu Ile Gln
165 170 175
Val Ala Thr Glu Val Arg Asn Gly Gln Trp Leu Arg Thr Asn Trp Ser
180 185 190
Lys Glu Arg Arg Gln Gly Val Leu His Val Pro Asn Val Asn Lys Met
195 200 205
Leu Asp Thr Tyr Leu Ser Lys Val Asn Ser Pro Glu Asp Leu Leu Asp
210 215 220
Tyr Arg Ile Leu Ala Tyr Thr Asn Asp Cys Val Asp Thr Phe Asn Gly
225 230 235 240
Ile Ile Arg Glu His Val Tyr Asn Thr Ser Glu Pro Phe Ile Pro Gly
245 250 255
Glu Tyr Leu Val Thr Gln Met Pro Val Met Val Ser Asn Gly Lys Tyr
260 265 270
Pro Val Cys Val Ile Glu Asn Gly Glu Val Val Lys Ile Leu Asp Val
275 280 285
Arg Gln Lys Thr Ile Asp Gly Met Leu Pro Lys Val Asp Asn Glu Ala
290 295 300
Phe Asp Val Ala Val Leu Thr Val Glu Lys Glu Asp Gly Asn Val Tyr
305 310 315 320
Glu Phe Thr Val Leu Trp Asp Asp Leu Gln Lys Glu Arg Phe Ala Arg
325 330 335
Tyr Leu Ser Val Ala Ala Gly Thr Tyr Lys Ser Met Arg Gly Asn Thr
340 345 350
Lys Arg Tyr Trp Arg Ala Phe Trp Gly Leu Lys Glu Gln Met Ile Glu
355 360 365
Thr Lys Ser Leu Gly Ala Ser Thr Val His Lys Ser Gln Gly Thr Thr
370 375 380
Val Lys Gly Val Cys Leu Tyr Thr Gln Asp Met Gly Tyr Ala Glu Pro
385 390 395 400
Glu Ile Leu Gln Gln Leu Val Tyr Val Gly Leu Thr Arg Pro Thr Asp
405 410 415
Trp Ala Leu Tyr Asn
420
<210> 104
<211> 434
<212> PRT
<213> 嗜水气单胞菌噬菌体 65(Aeromonas phage 65)
<400> 104
Met Ser Glu Ser Glu Ile Thr Leu Thr Pro Ser Gln Asn Met Ala Val
1 5 10 15
Asn Glu Val Lys Asn Gly Thr Gly His Ile Thr Ile Ser Gly Pro Pro
20 25 30
Gly Ser Gly Lys Thr Phe Leu Val Lys Tyr Leu Ile Lys Met Leu Gly
35 40 45
Asp Glu Leu Gly Thr Val Leu Ala Ala Pro Thr His Gln Ala Lys Ile
50 55 60
Val Leu Thr Glu Met Ser Gly Ile Glu Ala Cys Thr Ile His Ser Leu
65 70 75 80
Met Lys Ile His Pro Glu Thr Leu Glu Asp Ile Gln Ile Phe Asp Gln
85 90 95
Ser Lys Leu Pro Asp Leu Ser Asn Ile Arg Tyr Leu Ile Val Glu Glu
100 105 110
Ala Ser Met His Ser Lys Thr Leu Phe Lys Ile Thr Met Lys Ser Ile
115 120 125
Pro Pro Thr Cys Arg Ile Ile Ala Ile Gly Asp Lys Asp Gln Ile Gln
130 135 140
Pro Glu Glu His Ala Gln Gly Glu Leu Ser Pro Tyr Phe Thr Asp Pro
145 150 155 160
Arg Phe Ser Gln Ile Arg Leu Thr Asp Ile Met Arg Gln Ser Leu Asp
165 170 175
Asn Pro Ile Ile Gln Val Ala Thr Lys Ile Arg Glu Gly Gly Trp Ile
180 185 190
Glu Pro Asn Trp Asn Arg Asp Thr Lys Thr Gly Val Tyr Lys Val Ser
195 200 205
Gly Ile Thr Asp Leu Val Asn Ser Tyr Leu Arg Ala Val Lys Thr Pro
210 215 220
Glu Asp Leu Thr Lys Tyr Arg Phe Leu Ala Tyr Thr Asn Lys Val Val
225 230 235 240
Asn Lys Val Asn Ser Ile Val Arg Glu His Val Tyr Lys Thr Lys Leu
245 250 255
Pro Phe Ile Glu Gly Glu Lys Ile Val Leu Gln Glu Pro Val Met Val
260 265 270
Glu His Glu Asp Asp Thr Ile Glu Thr Ile Phe Thr Asn Gly Glu Val
275 280 285
Val Thr Ile Asn Glu Ile Glu Val Phe Asp Arg Thr Ile Arg Ile Asp
290 295 300
Gly Ser Pro Glu Phe Lys Val Asn Ala Ala Lys Leu Ser Val Ser Ser
305 310 315 320
Asp Tyr Ser Gly Ile Glu His Asp Phe Cys Val Leu Tyr Gly Ser Glu
325 330 335
Ser Arg Leu Glu Phe Glu Tyr Gln Leu Ser Glu Ser Ala Gly Asn Ile
340 345 350
Lys Gln Met Gly Lys Gly Gly Asn Gln Arg Ser Ala Trp Lys Ser Phe
355 360 365
Trp Ala Ala Lys Lys Met Phe Ile Glu Thr Lys Ser Leu Gly Ala Ser
370 375 380
Thr Ile His Lys Ser Gln Gly Ser Thr Val Lys Gly Val Trp Leu Ala
385 390 395 400
Leu His Asp Ile His Tyr Ala Asp Glu Glu Leu Lys Gln Gln Leu Val
405 410 415
Tyr Val Gly Val Thr Arg Pro Thr Asp Phe Cys Leu Tyr Phe Asp Gly
420 425 430
Thr Lys
<210> 105
<211> 420
<212> PRT
<213> 嗜水气单胞菌噬菌体 CC2(Aeromonas phage CC2)
<400> 105
Met Ala Val Asp Ala Val Gln Ser Gly Thr Gly His Ile Thr Ile Ser
1 5 10 15
Gly Pro Pro Gly Ser Gly Lys Thr Phe Leu Val Lys Tyr Ile Ile Lys
20 25 30
Met Leu Gly Asp Glu Leu Gly Thr Val Leu Ala Ala Pro Thr His Gln
35 40 45
Ala Lys Ile Val Leu Thr Glu Met Ser Gly Ile Glu Ala Cys Thr Ile
50 55 60
His Ser Leu Met Lys Ile His Pro Glu Thr Leu Glu Asp Ile Gln Ile
65 70 75 80
Phe Asp Gln Ser Lys Met Pro Asp Leu Ser Thr Val Arg Tyr Leu Ile
85 90 95
Ile Glu Glu Ala Ser Met His Ser Lys Ala Leu Phe Asn Ile Thr Met
100 105 110
Lys Ser Ile Pro Pro Thr Cys Arg Ile Ile Ala Ile Gly Asp Lys Asp
115 120 125
Gln Ile Gln Pro Val Asp His Ala Pro Gly Glu Leu Ser Pro Tyr Phe
130 135 140
Thr Asp Ser Arg Phe Thr Gln Ile Arg Met Thr Asp Ile Met Arg Gln
145 150 155 160
Ser Leu Asp Asn Pro Ile Ile Gln Val Ala Thr Thr Ile Arg Glu Gly
165 170 175
Gly Trp Ile Tyr Gln Asn Trp Asn Lys Glu Lys Lys Ser Gly Val Tyr
180 185 190
Lys Val Lys Ser Ile Thr Asp Leu Ile Asn Ser Tyr Leu Arg Val Val
195 200 205
Lys Thr Pro Glu Asp Leu Thr Lys Tyr Arg Phe Leu Ala Phe Thr Asn
210 215 220
Lys Val Val Asp Lys Val Asn Ser Ile Val Arg Lys His Val Tyr Lys
225 230 235 240
Thr Asp Leu Pro Phe Ile Glu Gly Glu Lys Leu Val Leu Gln Glu Pro
245 250 255
Val Met Val Glu Tyr Asp Asp Asp Thr Ile Glu Thr Ile Phe Thr Asn
260 265 270
Gly Glu Val Val Thr Val Asp Glu Ile Glu Val Ser Asp Met Asn Ile
275 280 285
Arg Ile Asp Gly Ser Pro Ala Phe Ser Ile Ser Val Ala Lys Leu Lys
290 295 300
Val Thr Ser Asp Phe Ser Gly Val Thr His Asp Ile Met Ser Val Tyr
305 310 315 320
Gly Glu Asp Ser Lys Ala Glu Phe Asn Tyr Gln Leu Ser Glu Ala Ala
325 330 335
Ala Val Ile Lys Gln Met Gln Arg Gly Gln Thr Lys Ala Ala Trp Ala
340 345 350
Ser Phe Trp Asp Ala Lys Lys Thr Phe Thr Glu Thr Lys Ser Leu Gly
355 360 365
Ala Cys Thr Ile His Lys Ser Gln Gly Ser Thr Val Lys Gly Val Trp
370 375 380
Leu Gly Leu His Asp Ile Ser Tyr Ala Asp Thr Asp Leu Gln Gln Gln
385 390 395 400
Leu Val Tyr Val Gly Val Thr Arg Pro Thr Asp Phe Cys Leu Tyr Phe
405 410 415
Asp Gly Ser Lys
420
<210> 106
<211> 443
<212> PRT
<213> Cronobacter噬菌体 vB CsaM GAP161(Cronobacter phage vB CsaMGAP161)
<400> 106
Met Ser Glu Leu Thr Phe Asp Asp Leu Ser Asp Asp Gln Lys Ser Ala
1 5 10 15
His Asp Arg Val Ile His Asn Ile Gln Asn Ala Ile His Thr Thr Ile
20 25 30
Thr Gly Gly Pro Gly Val Gly Lys Thr Thr Leu Val Lys Phe Val Phe
35 40 45
Asn Thr Leu Lys Gly Leu Gly Ile Ser Gly Ile Trp Leu Thr Ala Pro
50 55 60
Thr His Gln Ala Lys Asn Val Leu Ala Ala Ala Thr Gly Met Asp Ala
65 70 75 80
Thr Thr Ile His Ser Ala Leu Lys Ile Ser Pro Val Thr Asn Glu Glu
85 90 95
Leu Arg Val Phe Glu Gln Gln Lys Gly Lys Lys Ala Pro Asp Leu Ser
100 105 110
Thr Cys Arg Val Phe Val Val Glu Glu Val Ser Met Val Asp Met Asp
115 120 125
Leu Phe Arg Ile Ile Arg Arg Ser Ile Pro Ser Asn Ala Val Ile Leu
130 135 140
Gly Leu Gly Asp Lys Asp Gln Ile Arg Pro Val Asn Ala Asp Gly Arg
145 150 155 160
Val Glu Leu Ser Pro Phe Phe Asp Glu Glu Ile Phe Asp Val Ile Arg
165 170 175
Met Asp Lys Ile Met Arg Gln Ala Glu Gly Asn Pro Ile Ile Gln Val
180 185 190
Ser Arg Ala Val Arg Asp Gly Lys Met Leu Lys Pro Met Ser Val Gly
195 200 205
Asp Leu Gly Val Phe Gln His Ala Asn Ala Val Asp Phe Leu Arg Gln
210 215 220
Tyr Phe Arg Arg Val Lys Thr Pro Asp Asp Leu Ile Glu Asn Arg Met
225 230 235 240
Phe Ala Tyr Thr Asn Asp Asn Val Asp Lys Leu Asn Ala Thr Ile Arg
245 250 255
Lys His Leu Tyr Lys Thr Thr Glu Pro Phe Ile Leu Asp Glu Val Ile
260 265 270
Val Met Gln Glu Pro Leu Val Gln Glu Met Arg Leu Asn Gly Gln Ile
275 280 285
Phe Thr Glu Ile Val Tyr Asn Asn Asn Glu Lys Ile Arg Val Leu Glu
290 295 300
Ile Ile Pro Arg Arg Glu Val Ile Lys Ala Glu Lys Cys Asp Glu Lys
305 310 315 320
Ile Glu Ile Glu Phe Tyr Leu Leu Lys Thr Val Ser Leu Glu Glu Glu
325 330 335
Thr Glu Ala Gln Ile Gln Val Val Val Asp Pro Val Met Lys Asp Arg
340 345 350
Leu Gly Asn Tyr Leu Ala Tyr Val Ala Ser Thr Tyr Lys Arg Ile Lys
355 360 365
Gln Gln Thr Gly Tyr Lys Ala Pro Trp His Ser Phe Trp Ala Ile Lys
370 375 380
Asn Lys Phe Gln Asp Val Lys Pro Leu Pro Val Cys Thr Tyr His Lys
385 390 395 400
Ser Gln Gly Ser Thr Tyr Asp His Ala Tyr Met Tyr Thr Arg Asp Ala
405 410 415
Tyr Ala Phe Ala Asp Tyr Asp Leu Cys Lys Gln Leu Ile Tyr Val Gly
420 425 430
Val Thr Arg Ala Arg Tyr Thr Val Asp Tyr Val
435 440
<210> 107
<211> 442
<212> PRT
<213> 克雷伯氏菌噬菌体 KP15(Klebsiella phage KP15)
<400> 107
Met Ser Glu Leu Thr Phe Asp Asp Leu Ser Glu Asp Gln Lys Asn Ala
1 5 10 15
His Asp Arg Val Ile Lys Asn Ile Arg Asn Lys Ile His Thr Thr Ile
20 25 30
Thr Gly Gly Pro Gly Val Gly Lys Thr Thr Leu Val Lys Phe Val Phe
35 40 45
Glu Thr Leu Lys Lys Leu Gly Ile Ser Gly Ile Trp Leu Thr Ala Pro
50 55 60
Thr His Gln Ala Lys Asn Val Leu Ser Glu Ala Val Gly Met Asp Ala
65 70 75 80
Thr Thr Ile His Ser Ala Leu Lys Ile Ser Pro Val Thr Asn Glu Glu
85 90 95
Leu Arg Val Phe Glu Gln Gln Lys Gly Lys Lys Ala Ala Asp Leu Ser
100 105 110
Glu Cys Arg Val Phe Val Val Glu Glu Val Ser Met Val Asp Lys Glu
115 120 125
Leu Phe Arg Ile Ile Lys Arg Thr Ile Pro Ser Cys Ala Val Ile Leu
130 135 140
Gly Leu Gly Asp Lys Asp Gln Ile Arg Pro Val Asn Thr Glu Gly Ile
145 150 155 160
Thr Glu Leu Ser Pro Phe Phe Asp Glu Glu Ile Phe Asp Val Ile Arg
165 170 175
Met Asp Lys Ile Met Arg Gln Ala Glu Gly Asn Pro Ile Ile Gln Val
180 185 190
Ser Arg Ala Ile Arg Asp Gly Lys Pro Leu Met Pro Leu Met Asn Gly
195 200 205
Glu Leu Gly Val Met Lys His Glu Asn Ala Ser Asp Phe Leu Arg Arg
210 215 220
Tyr Phe Ser Arg Val Lys Thr Pro Asp Asp Leu Asn Asn Asn Arg Met
225 230 235 240
Phe Ala Tyr Thr Asn Ala Asn Val Asp Lys Leu Asn Ala Val Ile Arg
245 250 255
Lys His Leu Tyr Lys Thr Asp Gln Pro Phe Ile Val Gly Glu Val Val
260 265 270
Val Met Gln Glu Pro Leu Val Thr Glu Gly Arg Val Asn Gly Val Ser
275 280 285
Phe Val Glu Val Ile Tyr Asn Asn Asn Glu Gln Ile Lys Ile Leu Glu
290 295 300
Ile Ile Pro Arg Ser Asp Thr Ile Lys Ala Asp Arg Cys Asp Pro Val
305 310 315 320
Gln Ile Asp Tyr Phe Leu Met Lys Thr Glu Ser Met Phe Glu Asp Thr
325 330 335
Lys Ala Asp Ile Gln Val Ile Ala Asp Pro Val Met Gln Glu Arg Leu
340 345 350
Gly Asp Tyr Leu Asn Tyr Val Ala Phe Gln Tyr Lys Lys Met Lys Gln
355 360 365
Glu Thr Gly Tyr Lys Ala Pro Trp Tyr Ser Phe Trp Gln Ile Lys Asn
370 375 380
Lys Phe Gln Thr Val Lys Ala Leu Pro Val Cys Thr Tyr His Lys Gly
385 390 395 400
Gln Gly Ser Thr Tyr Asp His Ser Tyr Met Tyr Thr Arg Asp Ala Tyr
405 410 415
Ala Tyr Ala Asp Tyr Glu Leu Cys Lys Gln Leu Leu Tyr Val Gly Thr
420 425 430
Thr Arg Ala Arg Phe Thr Val Asp Tyr Val
435 440
<210> 108
<211> 438
<212> PRT
<213> 寡养单胞菌噬菌体 IME13(Stenotrophomonas phage IME13)
<400> 108
Met Val Thr Tyr Asp Asp Leu Thr Val Gly Gln Lys Asp Ala Ile Glu
1 5 10 15
Lys Ala Leu Gln Ala Met Arg Thr Lys Arg His Ile Thr Ile Arg Gly
20 25 30
Pro Ala Gly Ser Gly Lys Thr Thr Met Thr Arg Phe Leu Leu Glu Arg
35 40 45
Leu Phe Gln Thr Gly Gln Gln Gly Ile Val Leu Thr Ala Pro Thr His
50 55 60
Gln Ala Lys Lys Glu Leu Ser Lys His Ala Leu Arg Lys Ser Tyr Thr
65 70 75 80
Ile Gln Ser Val Leu Lys Ile Asn Pro Ser Thr Leu Glu Glu Asn Gln
85 90 95
Ile Phe Glu Gln Lys Gly Thr Pro Asp Phe Ser Lys Thr Arg Val Leu
100 105 110
Ile Cys Asp Glu Val Ser Phe Tyr Thr Arg Lys Leu Phe Asp Ile Leu
115 120 125
Met Arg Asn Val Pro Ser His Cys Val Val Ile Gly Ile Gly Asp Lys
130 135 140
Ala Gln Ile Arg Gly Val Ser Glu Asp Asp Thr His Glu Leu Ser Pro
145 150 155 160
Phe Phe Thr Asp Asn Arg Phe Glu Gln Val Glu Leu Thr Glu Val Lys
165 170 175
Arg His Gln Gly Pro Ile Ile Glu Val Ala Thr Asp Ile Arg Asn Gly
180 185 190
Lys Trp Ile Tyr Glu Lys Leu Asp Asp Ser Gly Asn Gly Val Lys Gln
195 200 205
Phe His Thr Val Lys Asp Phe Leu Ser Lys Tyr Phe Glu Arg Thr Lys
210 215 220
Thr Pro Asn Asp Leu Leu Glu Asn Arg Ile Met Ala Tyr Thr Asn Asn
225 230 235 240
Ser Val Asp Lys Leu Asn Ser Val Ile Arg Lys Gln Leu Tyr Gly Ala
245 250 255
Asn Ala Ala Pro Phe Leu Pro Asp Glu Ile Leu Val Met Gln Glu Pro
260 265 270
Leu Met Phe Asp Ile Asp Ile Gly Gly Gln Thr Leu Lys Glu Val Ile
275 280 285
Phe Asn Asn Gly Gln Asn Val Arg Val Ile Asn Val Lys Pro Ser Arg
290 295 300
Lys Thr Leu Lys Ala Lys Gly Val Gly Glu Ile Glu Val Glu Cys Thr
305 310 315 320
Met Leu Glu Cys Glu Ser Tyr Glu Glu Asp Glu Asp Asp Tyr Arg Arg
325 330 335
Ala Trp Phe Thr Val Val His Asp Gln Asn Thr Gln Tyr Ala Ile Asn
340 345 350
Glu Phe Leu Ser Ile Ile Ala Glu Lys Tyr Arg Ser Arg Glu Val Phe
355 360 365
Pro Asn Trp Lys Asp Phe Trp Ala Ile Arg Asn Thr Phe Val Lys Val
370 375 380
Arg Pro Leu Gly Ala Met Thr Phe His Lys Ser Gln Gly Ser Thr Phe
385 390 395 400
Asp Asn Ala Tyr Leu Phe Thr Pro Cys Leu His Gln Tyr Cys Arg Asp
405 410 415
Pro Asp Val Ala Gln Glu Leu Ile Tyr Val Gly Asn Thr Arg Ala Arg
420 425 430
Lys Asn Val Cys Phe Val
435
<210> 109
<211> 442
<212> PRT
<213> 不动杆菌噬菌体Ac42(Acinetobacter phage Ac42)
<400> 109
Met Asn Phe Glu Asp Leu Thr Glu Gly Gln Lys Asn Ala Tyr Thr Ala
1 5 10 15
Ala Ile Lys Ala Ile Glu Thr Val Pro Ser Ser Ser Ala Glu Lys Arg
20 25 30
His Leu Thr Ile Asn Gly Pro Ala Gly Thr Gly Lys Thr Thr Leu Thr
35 40 45
Lys Phe Leu Ile Ala Glu Leu Ile Arg Arg Gly Glu Arg Gly Val Tyr
50 55 60
Leu Ala Ala Pro Thr His Gln Ala Lys Lys Val Leu Ser Gln His Ala
65 70 75 80
Gly Met Glu Ala Ser Thr Ile His Ser Leu Leu Lys Ile Asn Pro Thr
85 90 95
Thr Tyr Glu Asp Ser Thr Thr Phe Glu Gln Lys Asp Val Pro Asp Met
100 105 110
Ser Glu Cys Arg Val Leu Ile Cys Asp Glu Ala Ser Met Tyr Asp Leu
115 120 125
Lys Leu Phe Gln Ile Leu Met Ser Ser Ile Pro Leu Cys Cys Thr Val
130 135 140
Ile Ala Leu Gly Asp Ile Ala Gln Ile Arg Pro Val Glu Pro Gly Ala
145 150 155 160
Phe Glu Gly Gln Val Ser Pro Phe Phe Thr Tyr Glu Lys Phe Glu Gln
165 170 175
Val Ser Leu Thr Glu Val Met Arg Ser Asn Ala Pro Ile Ile Asp Val
180 185 190
Ala Thr Ser Ile Arg Thr Gly Asn Trp Ile Tyr Glu Asn Val Ile Asp
195 200 205
Gly Ala Gly Val His Asn Leu Thr Ser Glu Arg Ser Val Lys Ser Phe
210 215 220
Met Glu Lys Tyr Phe Ser Ile Val Lys Thr Pro Glu Asp Leu Phe Glu
225 230 235 240
Asn Arg Leu Leu Ala Phe Thr Asn Lys Ser Val Asp Asp Leu Asn Lys
245 250 255
Ile Val Arg Lys Lys Ile Tyr Asn Thr Leu Glu Pro Phe Ile Asp Gly
260 265 270
Glu Val Leu Val Met Gln Glu Pro Leu Ile Lys Ser Tyr Thr Tyr Glu
275 280 285
Gly Lys Lys Val Ser Glu Ile Val Phe Asn Asn Gly Glu Met Val Lys
290 295 300
Val Leu Cys Cys Ser Gln Thr Ser Asp Glu Ile Ser Val Arg Gly Cys
305 310 315 320
Ser Thr Lys Tyr Met Val Arg Tyr Trp Gln Leu Asp Leu Gln Ser Leu
325 330 335
Asp Asp Pro Asp Leu Thr Gly Ser Ile Asn Val Ile Val Asp Glu Ala
340 345 350
Glu Ile Asn Lys Leu Asn Leu Val Leu Gly Lys Ser Ala Glu Gln Phe
355 360 365
Lys Ser Gly Ala Val Lys Ala Ala Trp Ala Asp Trp Trp Lys Leu Lys
370 375 380
Arg Asn Phe His Lys Val Lys Ala Leu Pro Cys Ser Thr Ile His Lys
385 390 395 400
Ser Gln Gly Thr Ser Val Asp Asn Val Phe Leu Tyr Thr Pro Cys Ile
405 410 415
His Lys Ala Asp Ser Gln Leu Ala Gln Gln Leu Leu Tyr Val Gly Ala
420 425 430
Thr Arg Ala Arg His Asn Val Tyr Tyr Ile
435 440
<210> 110
<211> 442
<212> PRT
<213> 志贺氏菌噬菌体 SP18(Shigella phage SP18)
<400> 110
Met Ile Lys Phe Glu Asp Leu Asn Thr Gly Gln Lys Glu Ala Phe Asp
1 5 10 15
Tyr Ile Thr Glu Ala Ile Gln Arg Arg Ser Gly Glu Cys Ile Thr Leu
20 25 30
Asn Gly Pro Ala Gly Thr Gly Lys Thr Thr Leu Thr Lys Phe Val Ile
35 40 45
Asp His Leu Val Arg Asn Gly Val Met Gly Ile Val Leu Ala Ala Pro
50 55 60
Thr His Gln Ala Lys Lys Val Leu Ser Lys Leu Ser Gly Gln Thr Ala
65 70 75 80
Asn Thr Ile His Ser Ile Leu Lys Ile Asn Pro Thr Thr Tyr Glu Asp
85 90 95
Gln Asn Ile Phe Glu Gln Arg Glu Met Pro Asp Met Ser Lys Cys Asn
100 105 110
Val Leu Val Cys Asp Glu Ala Ser Met Tyr Asp Gly Ser Leu Phe Lys
115 120 125
Ile Ile Cys Asn Ser Val Pro Glu Trp Cys Thr Ile Leu Gly Ile Gly
130 135 140
Asp Met His Gln Leu Gln Pro Val Asp Pro Gly Ser Thr Gln Gln Lys
145 150 155 160
Ile Ser Pro Phe Phe Thr His Pro Lys Phe Lys Gln Ile His Leu Thr
165 170 175
Glu Val Met Arg Ser Asn Ala Pro Ile Ile Glu Val Ala Thr Glu Ile
180 185 190
Arg Asn Gly Gly Trp Phe Arg Asp Cys Met Tyr Asp Gly His Gly Val
195 200 205
Gln Gly Phe Thr Ser Gln Thr Ala Leu Lys Asp Phe Met Val Asn Tyr
210 215 220
Phe Gly Ile Val Lys Asp Ala Asp Met Leu Met Glu Asn Arg Met Tyr
225 230 235 240
Ala Tyr Thr Asn Lys Ser Val Glu Lys Leu Asn Asn Ile Ile Arg Arg
245 250 255
Lys Leu Tyr Glu Thr Asp Lys Ala Phe Leu Pro Tyr Glu Val Leu Val
260 265 270
Met Gln Glu Pro His Met Lys Glu Leu Glu Phe Glu Gly Lys Lys Phe
275 280 285
Ser Glu Thr Ile Phe Asn Asn Gly Gln Leu Val Arg Ile Lys Asp Cys
290 295 300
Lys Tyr Thr Ser Thr Ile Leu Arg Cys Lys Gly Glu Ser His Gln Leu
305 310 315 320
Val Ile Asn Tyr Trp Asp Leu Glu Val Glu Ser Ile Asp Glu Asp Glu
325 330 335
Glu Tyr Gln Val Asp Arg Ile Lys Val Leu Pro Glu Asp Gln Gln Pro
340 345 350
Lys Phe Gln Ala Tyr Leu Ala Lys Val Ala Asp Thr Tyr Lys Gln Met
355 360 365
Lys Ala Ala Gly Lys Arg Pro Glu Trp Lys Asp Phe Trp Lys Ala Arg
370 375 380
Arg Thr Phe Leu Lys Val Arg Ala Leu Pro Val Ser Thr Ile His Lys
385 390 395 400
Ala Gln Gly Val Ser Val Asp Lys Ala Phe Ile Tyr Thr Pro Cys Ile
405 410 415
His Met Ala Glu Ala Ser Leu Ala Ser Gln Leu Ala Tyr Val Gly Ile
420 425 430
Thr Arg Ala Arg Tyr Asp Ala Tyr Tyr Val
435 440
<210> 111
<211> 439
<212> PRT
<213> 耶尔森氏菌噬菌体 phiR1-RT(Yersinia phage phiR1-RT)
<400> 111
Met Ile Thr Tyr Asp Asp Leu Thr Asp Gly Gln Lys Ser Ala Phe Asp
1 5 10 15
Asn Thr Met Glu Ala Ile Lys Asn Lys Lys Gly His Ile Thr Ile Asn
20 25 30
Gly Pro Ala Gly Thr Gly Lys Thr Thr Leu Thr Lys Phe Ile Ile Asp
35 40 45
His Leu Ile Lys Thr Gly Glu Ala Gly Ile Ile Leu Cys Ala Pro Thr
50 55 60
His Gln Ala Lys Lys Val Leu Ser Lys Leu Ser Gly Met Asp Ala Ser
65 70 75 80
Thr Ile His Ser Val Leu Lys Ile Asn Pro Thr Thr Tyr Glu Glu Asn
85 90 95
Gln Ile Phe Glu Gln Arg Glu Val Pro Asp Leu Ala Ala Cys Arg Val
100 105 110
Leu Ile Cys Asp Glu Ala Ser Phe Tyr Asp Arg Lys Leu Phe Gly Ile
115 120 125
Ile Leu Ala Thr Val Pro Ser Trp Cys Thr Val Ile Ala Leu Gly Asp
130 135 140
Lys Asp Gln Leu Arg Pro Val Thr Pro Gly Glu Ser Glu Gln Gln Leu
145 150 155 160
Ser Pro Phe Phe Ser His Ala Lys Phe Lys Gln Val His Leu Thr Glu
165 170 175
Ile Lys Arg Ser Asn Gly Pro Ile Ile Gln Val Ala Thr Asp Ile Arg
180 185 190
Asn Gly Gly Trp Leu Ser Glu Asn Ile Val Asp Gly Glu Gly Val His
195 200 205
Ala Phe Asn Ser Asn Thr Ala Leu Lys Asp Phe Met Ile Arg Tyr Phe
210 215 220
Asp Val Val Lys Thr Ala Asp Asp Leu Ile Glu Ser Arg Met Leu Ala
225 230 235 240
Tyr Thr Asn Lys Ser Val Asp Lys Leu Asn Gly Ile Ile Arg Arg Lys
245 250 255
Leu Tyr Glu Thr Asp Lys Pro Phe Ile Asn Gly Glu Val Leu Val Met
260 265 270
Gln Glu Pro Leu Met Lys Glu Leu Glu Phe Asp Gly Lys Lys Phe His
275 280 285
Glu Ile Val Phe Asn Asn Gly Gln Leu Val Lys Ile Leu Tyr Ala Ser
290 295 300
Glu Thr Ser Thr Phe Ile Ser Ala Arg Asn Val Pro Gly Glu Tyr Met
305 310 315 320
Ile Arg Tyr Trp Asn Leu Glu Val Glu Thr Ala Asp Ser Asp Asp Asp
325 330 335
Tyr Ala Thr Ser Gln Ile Gln Val Ile Cys Asp Pro Ala Glu Met Thr
340 345 350
Lys Phe Gln Met Phe Leu Ala Lys Thr Ala Asp Thr Tyr Lys Asn Ser
355 360 365
Gly Val Lys Ala Tyr Trp Lys Asp Phe Trp Ser Val Lys Asn Lys Phe
370 375 380
Lys Lys Val Lys Ala Leu Pro Val Ser Thr Ile His Lys Ser Gln Gly
385 390 395 400
Cys Thr Val Asn Asn Thr Phe Leu Tyr Thr Pro Cys Ile His Met Ala
405 410 415
Asp Ala Gln Leu Ala Lys Gln Leu Leu Tyr Val Gly Ala Thr Arg Ala
420 425 430
Arg Thr Asn Leu Tyr Tyr Ile
435
<210> 112
<211> 441
<212> PRT
<213> 沙门氏菌噬菌体 S16(Salmonella phage S16)
<400> 112
Met Ile Thr Phe Glu Gln Leu Thr Ser Gly Gln Lys Leu Ala Phe Asp
1 5 10 15
Glu Thr Ile Arg Ala Ile Lys Glu Lys Lys Asn His Val Thr Ile Asn
20 25 30
Gly Pro Ala Gly Thr Gly Lys Thr Thr Leu Thr Lys Phe Ile Met Glu
35 40 45
His Leu Val Ser Thr Gly Glu Thr Gly Ile Ile Leu Thr Ala Pro Thr
50 55 60
His Ala Ala Lys Lys Val Leu Thr Lys Leu Ser Gly Met Glu Ala Asn
65 70 75 80
Thr Ile His Lys Ile Leu Lys Ile Asn Pro Thr Thr Tyr Glu Glu Ser
85 90 95
Met Leu Phe Glu Gln Lys Glu Val Pro Asp Leu Ala Ser Cys Arg Val
100 105 110
Leu Ile Cys Asp Glu Ala Ser Met Trp Asp Arg Lys Leu Phe Lys Ile
115 120 125
Leu Met Ala Ser Ile Pro Lys Trp Cys Thr Ile Val Ala Ile Gly Asp
130 135 140
Val Ala Gln Ile Arg Pro Val Asp Pro Gly Glu Thr Glu Ala His Ile
145 150 155 160
Ser Pro Phe Phe Ile His Lys Asp Phe Lys Gln Leu Asn Leu Thr Glu
165 170 175
Val Met Arg Ser Asn Ala Pro Ile Ile Asp Val Ala Thr Asp Ile Arg
180 185 190
Asn Gly Ser Trp Ile Tyr Glu Lys Thr Val Asp Gly His Gly Val His
195 200 205
Gly Phe Thr Ser Thr Thr Ala Leu Lys Asp Phe Met Met Gln Tyr Phe
210 215 220
Ser Ile Val Lys Ser Pro Glu Asp Leu Phe Glu Asn Arg Met Leu Ala
225 230 235 240
Phe Thr Asn Lys Ser Val Asp Lys Leu Asn Ser Ile Ile Arg Arg Arg
245 250 255
Leu Tyr Gln Thr Glu Glu Ala Phe Val Val Gly Glu Val Ile Val Met
260 265 270
Gln Glu Pro Leu Met Arg Glu Leu Val Phe Glu Gly Lys Lys Phe His
275 280 285
Glu Thr Leu Phe Thr Asn Gly Gln Tyr Val Arg Ile Leu Ser Ala Asp
290 295 300
Tyr Thr Ser Ser Phe Leu Gly Ala Lys Gly Val Ser Gly Glu His Leu
305 310 315 320
Ile Arg His Trp Val Leu Asp Val Glu Thr Tyr Asp Asp Glu Glu Tyr
325 330 335
Ala Arg Glu Lys Ile Asn Val Ile Ser Asp Glu Gln Glu Met Asn Lys
340 345 350
Phe Gln Phe Phe Leu Ala Lys Thr Ala Asp Thr Tyr Lys Asn Trp Asn
355 360 365
Lys Gly Gly Lys Ala Pro Trp Ser Glu Phe Trp Asp Ala Lys Arg Lys
370 375 380
Phe His Lys Val Lys Ala Leu Pro Cys Ser Thr Phe His Lys Ala Gln
385 390 395 400
Gly Ile Ser Val Asp Ser Ser Phe Ile Tyr Thr Pro Cys Ile His Val
405 410 415
Ser Ser Asp Asn Lys Phe Lys Leu Glu Leu Leu Tyr Val Gly Ala Thr
420 425 430
Arg Gly Arg His Asp Val Phe Phe Val
435 440
<210> 113
<211> 786
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 113
tgtctgaccg caccgccgaa agaagcggca cgtccgaccc tgatgccgcg tgcacagtct 60
tataaagatc tgacccatct gccggctccg acgggcaaaa tttttgttag cgtctataac 120
atccaggacg aaaccggtca atttaaaccg tacccggcga gtaatttctc cacggccgtt 180
ccgcagagtg caaccgctat gctggtcacg gcactgaaag attcccgttg gttcattccg 240
ctggaacgcc agggcctgca aaacctgctg aatgaacgta aaattatccg cgcagctcag 300
gaaaacggta ccgtggccat taacaatcgt attccgctgc aaagcctgac cgccgcaaac 360
atcatggttg aaggctctat catcggttac gaatcaaacg tcaaatcggg cggtgtgggc 420
gcacgttatt ttggcattgg tgctgatacc cagtaccaac tggaccagat cgcagttaac 480
ctgcgcgtgg ttaatgtcag caccggcgaa attctgagct ctgtgaatac cagcaaaacg 540
atcctgtctt acgaagtgca ggctggtgtt tttcgtttca ttgattatca acgcctgctg 600
gaaggcgaag tcggttacac ctcaaacgaa ccggtgatgc tgtgtctgat gtcggcgatt 660
gaaacgggtg ttattttcct gatcaatgat ggcatcgacc gtggtctgtg ggatctgcag 720
aacaaagccg aacgtcaaaa tgacattctg gtgaaatacc gccacatgag tgttccgccg 780
gaatcc 786
<210> 114
<211> 262
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 114
Cys Leu Thr Ala Pro Pro Lys Glu Ala Ala Arg Pro Thr Leu Met Pro
1 5 10 15
Arg Ala Gln Ser Tyr Lys Asp Leu Thr His Leu Pro Ala Pro Thr Gly
20 25 30
Lys Ile Phe Val Ser Val Tyr Asn Ile Gln Asp Glu Thr Gly Gln Phe
35 40 45
Lys Pro Tyr Pro Ala Ser Asn Phe Ser Thr Ala Val Pro Gln Ser Ala
50 55 60
Thr Ala Met Leu Val Thr Ala Leu Lys Asp Ser Arg Trp Phe Ile Pro
65 70 75 80
Leu Glu Arg Gln Gly Leu Gln Asn Leu Leu Asn Glu Arg Lys Ile Ile
85 90 95
Arg Ala Ala Gln Glu Asn Gly Thr Val Ala Ile Asn Asn Arg Ile Pro
100 105 110
Leu Gln Ser Leu Thr Ala Ala Asn Ile Met Val Glu Gly Ser Ile Ile
115 120 125
Gly Tyr Glu Ser Asn Val Lys Ser Gly Gly Val Gly Ala Arg Tyr Phe
130 135 140
Gly Ile Gly Ala Asp Thr Gln Tyr Gln Leu Asp Gln Ile Ala Val Asn
145 150 155 160
Leu Arg Val Val Asn Val Ser Thr Gly Glu Ile Leu Ser Ser Val Asn
165 170 175
Thr Ser Lys Thr Ile Leu Ser Tyr Glu Val Gln Ala Gly Val Phe Arg
180 185 190
Phe Ile Asp Tyr Gln Arg Leu Leu Glu Gly Glu Val Gly Tyr Thr Ser
195 200 205
Asn Glu Pro Val Met Leu Cys Leu Met Ser Ala Ile Glu Thr Gly Val
210 215 220
Ile Phe Leu Ile Asn Asp Gly Ile Asp Arg Gly Leu Trp Asp Leu Gln
225 230 235 240
Asn Lys Ala Glu Arg Gln Asn Asp Ile Leu Val Lys Tyr Arg His Met
245 250 255
Ser Val Pro Pro Glu Ser
260
<210> 115
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 转座子顶链
<400> 115
gttttcgcat ttatcgtgaa acgctttcgc gtttttcgtg cgccgcttca 50
<210> 116
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 衔接子退火序列以形成转座子1
<220>
<221> misc_feature
<222> (50)..(50)
<223> n = U
<400> 116
caaaagcgta aatagcactt tgcgaaagcg caaaaagcac gcggcgaagn ctag 54
<210> 117
<211> 64
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 衔接子退火序列以形成转座子2
<400> 117
gatctgaagc ggcgcacgaa aaacgcgaaa gcgtttcacg ataaatgcga aaactttttt 60
tttt 64
<210> 118
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 连接在iSpC3间隔子的5'端至3'端的衔接子退火序列
<400> 118
tttttttttt tt 12
<210> 119
<211> 77
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 连接在iSp18间隔子的5'端至3'端的衔接子退火序列
<400> 119
ggttgtttct gttggtgctg atattgcgtt ttcgcattta tcgtgaaacg ctttcgcgtt 60
tttcgtgcgc cgcttca 77
<210> 120
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 实施例中使用的多核苷酸
<400> 120
gcaatatcag caccaacaga aacaacctt 29
<210> 121
<211> 62
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 实施例中使用的多核苷酸
<400> 121
tgctgatatt gcgttttcgc atttatcgtg aaacgctttc gcgtttttcg tgcgccgctt 60
ca 62
<210> 122
<211> 753
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 122
Met Asp Val Ser Tyr Leu Leu Asp Ser Leu Asn Asp Lys Gln Arg Glu
1 5 10 15
Ala Val Ala Ala Pro Arg Ser Asn Leu Leu Val Leu Ala Gly Ala Gly
20 25 30
Ser Gly Lys Thr Arg Val Leu Val His Arg Ile Ala Trp Leu Met Ser
35 40 45
Val Glu Asn Cys Ser Pro Tyr Ser Ile Met Ala Val Thr Phe Thr Asn
50 55 60
Lys Ala Ala Ala Glu Met Arg His Arg Ile Gly Gln Leu Met Gly Thr
65 70 75 80
Ser Gln Gly Gly Met Trp Val Gly Thr Phe His Gly Leu Ala His Arg
85 90 95
Leu Leu Arg Ala His His Met Asp Ala Asn Leu Pro Gln Asp Phe Gln
100 105 110
Ile Leu Asp Ser Glu Asp Gln Leu Arg Leu Leu Lys Arg Leu Ile Lys
115 120 125
Ala Met Asn Leu Asp Glu Lys Gln Trp Pro Pro Arg Gln Ala Met Trp
130 135 140
Tyr Ile Asn Ser Gln Lys Asp Glu Gly Leu Arg Pro His His Ile Gln
145 150 155 160
Ser Tyr Gly Asn Pro Val Glu Gln Thr Trp Gln Lys Val Tyr Gln Ala
165 170 175
Tyr Gln Glu Ala Cys Asp Arg Ala Gly Leu Val Asp Phe Ala Glu Leu
180 185 190
Leu Leu Arg Ala His Glu Leu Trp Leu Asn Lys Pro His Ile Leu Gln
195 200 205
His Tyr Arg Glu Arg Phe Thr Asn Ile Leu Val Asp Glu Phe Gln Asp
210 215 220
Thr Asn Asn Ile Gln Tyr Ala Trp Ile Arg Leu Leu Ala Gly Asp Thr
225 230 235 240
Gly Lys Val Met Ile Val Gly Asp Asp Asp Gln Ser Ile Tyr Gly Trp
245 250 255
Arg Gly Ala Gln Val Glu Asn Ile Gln Arg Phe Leu Asn Asp Phe Pro
260 265 270
Gly Ala Glu Thr Ile Arg Leu Glu Gln Asn Tyr Arg Ser Thr Ser Asn
275 280 285
Ile Leu Ser Ala Ala Asn Ala Leu Ile Glu Asn Asn Asn Gly Arg Leu
290 295 300
Gly Lys Lys Leu Trp Thr Asp Gly Ala Asp Gly Glu Pro Ile Ser Leu
305 310 315 320
Tyr Cys Ala Phe Asn Glu Leu Asp Glu Ala Arg Phe Val Val Asn Arg
325 330 335
Ile Lys Thr Trp Gln Asp Asn Gly Gly Ala Leu Ala Glu Cys Ala Ile
340 345 350
Leu Tyr Arg Ser Asn Ala Gln Ser Arg Val Leu Glu Glu Ala Leu Leu
355 360 365
Gln Ala Ser Met Pro Tyr Arg Ile Tyr Gly Gly Met Arg Phe Phe Glu
370 375 380
Arg Gln Glu Ile Lys Asp Ala Leu Ser Tyr Leu Arg Leu Ile Ala Asn
385 390 395 400
Arg Asn Asp Asp Ala Ala Phe Glu Arg Val Val Asn Thr Pro Thr Arg
405 410 415
Gly Ile Gly Asp Arg Thr Leu Asp Val Val Arg Gln Thr Ser Arg Asp
420 425 430
Arg Gln Leu Thr Leu Trp Gln Ala Cys Arg Glu Leu Leu Gln Glu Lys
435 440 445
Ala Leu Ala Gly Arg Ala Ala Ser Ala Leu Gln Arg Phe Met Glu Leu
450 455 460
Ile Asp Ala Leu Ala Gln Glu Thr Ala Asp Met Pro Leu His Val Gln
465 470 475 480
Thr Asp Arg Val Ile Lys Asp Ser Gly Leu Arg Thr Met Tyr Glu Gln
485 490 495
Glu Lys Gly Glu Lys Gly Gln Thr Arg Ile Glu Asn Leu Glu Glu Leu
500 505 510
Val Thr Ala Thr Arg Gln Phe Ser Tyr Asn Glu Glu Asp Glu Asp Leu
515 520 525
Met Pro Leu Gln Ala Phe Leu Ser His Ala Ala Leu Glu Ala Gly Glu
530 535 540
Gly Gln Ala Asp Thr Trp Gln Asp Ala Val Gln Leu Met Thr Leu His
545 550 555 560
Ser Ala Lys Gly Leu Glu Phe Pro Gln Val Phe Ile Val Gly Met Glu
565 570 575
Glu Gly Met Phe Pro Ser Gln Met Ser Leu Asp Glu Gly Gly Arg Leu
580 585 590
Glu Glu Glu Arg Arg Leu Ala Tyr Val Gly Val Thr Arg Ala Met Gln
595 600 605
Lys Leu Thr Leu Thr Tyr Ala Glu Thr Arg Arg Leu Tyr Gly Lys Glu
610 615 620
Val Tyr His Arg Pro Ser Arg Phe Ile Gly Glu Leu Pro Glu Glu Cys
625 630 635 640
Val Glu Glu Val Arg Leu Arg Ala Thr Val Ser Arg Pro Val Ser His
645 650 655
Gln Arg Met Gly Thr Pro Met Val Glu Asn Asp Ser Gly Tyr Lys Leu
660 665 670
Gly Gln Arg Val Arg His Ala Lys Phe Gly Glu Gly Thr Ile Val Asn
675 680 685
Met Glu Gly Ser Gly Glu His Ser Arg Leu Gln Val Ala Phe Gln Gly
690 695 700
Gln Gly Ile Lys Trp Leu Val Ala Ala Tyr Ala Arg Leu Glu Ser Val
705 710 715 720
Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly
725 730 735
Ser Gly Gly Gly Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu
740 745 750
Lys

Claims (26)

1.一种修饰模板双链多核苷酸以用于表征的方法,包括:
(a)使模板多核苷酸与MuA转座酶和双链MuA底物群接触,每个底物在一条链的一端或两端包含突出端,使得转座酶将模板多核苷酸片段化并将底物连接到双链片段的一端或两端,从而产生多个片段/底物构建体;和
(b)使用转位酶从构建体中除去MuA转座酶,从而产生多个修饰的双链多核苷酸。
2.根据权利要求1所述的方法,其中所述转位酶使所述构建体解旋以除去所述MuA转座酶。
3.根据权利要求1或2所述的方法,其中在通过MuA转座酶产生构建体后,使转位酶与构建体接触。
4.根据权利要求1或2所述的方法,其中在底物与模板多核苷酸接触之前,转位酶与底物结合。
5.根据权利要求1所述的方法,其中所述转位酶是解旋酶。
6.根据权利要求5所述的方法,其中解旋酶来自超家族1或超家族2。
7.根据权利要求5所述的方法,其中所述解旋酶是以下家族之一的成员:Pif1样、Upf1样、UvrD、Rep、Ski样、Rad3/XPD、NS3/NPH-II、DEAD、DEAH/RHA、RecG样、REcQ样、T1R样、Swi/Snf样和Rig-I样。
8.根据权利要求5所述的方法,其中所述解旋酶是UvrD解旋酶、Hel308解旋酶、Tral解旋酶、Tral子组解旋酶、XPD解旋酶或Dda解旋酶。
9.根据权利要求5所述的方法,其中所述解旋酶是Hel308解旋酶。
10.根据权利要求9所述的方法,其中所述Hel308解旋酶如SEQ ID NO:10所示,具有突变E284C和S615C,由双马来酰亚胺PEG11接头连接所述突变E284C和S615C。
11.根据权利要求1所述的方法,其中所述转位酶是剥除酶。
12.根据权利要求11所述的方法,其中所述剥除酶是INO80染色质重塑复合物或FtsK/SpoIIIE转运蛋白。
13.根据权利要求1所述的方法,其中每个构建体的两条链在一端由发夹环连接。
14.根据权利要求1所述的方法,其中所述方法还包括(c)连接分子刹车至在底物上的不包括突出端的链。
15.根据权利要求14所述的方法,其中所述分子刹车在与模板多核苷酸和MuA转座酶接触之前连接至在底物上的不包括突出端的链。
16.根据权利要求14所述的方法,其中所述分子刹车在通过MuA转座酶创建之后连接至残留在构建体中的底物上的不包括突出端的链。
17.根据权利要求14所述的方法,其中所述分子刹车被结合至Y衔接子,所述Y衔接子包含前导序列和/或一个或多个能够将衔接子偶联到膜上的锚,并且Y衔接子在步骤(c)中连接至在底物上的不包括突出端的链。
18.根据权利要求14-17中任一项所述的方法,其中所述分子刹车衍生自聚合酶、解旋酶或外切核酸酶。
19.根据权利要求1所述的方法,其中所述方法不包括热灭活MuA转座酶。
20.一种表征至少一种使用根据权利要求1-19中任一项所述的方法修饰的多核苷酸的方法,其包括:
a)使所述修饰的多核苷酸与跨膜孔接触,使得多核苷酸的至少一条链穿过孔;和
b)当至少一条链相对于孔移动时进行一次或多次测量,其指示多核苷酸的一或多个特征,从而表征所述修饰的多核苷酸。
21.一种表征模板多核苷酸的方法,其包含:
a)根据权利要求1至19中任一项所述的方法修饰所述模板多核苷酸,以产生多个修饰的多核苷酸;
b)使每个修饰的多核苷酸与跨膜孔接触,使得每个多核苷酸的至少一条链移动通过所述孔;和
(c)在每个多核苷酸的至少一条链相对于所述孔移动时,进行一或多个测量,其指示多核苷酸的一或多个特征,从而表征所述修饰的多核苷酸。
22.根据权利要求21所述的方法,其中所述一或多个特征是选自(i)所述多核苷酸的长度、(ii)所述多核苷酸的身份、(iii)所述多核苷酸的序列、(iv)所述多核苷酸的二级结构和(v)所述多核苷酸是否经修饰。
23.根据权利要求20至22中任一项所述的方法,其中所述方法包括当所述至少一条链或每个多核苷酸相对于所述孔移动时测量通过所述孔的电流。
24.根据权利要求20至22中任一项所述的方法,其中所述测量包括光学测量。
25.一种用于修饰模板多核苷酸的试剂盒,其包含(a)如权利要求1中限定的MuA底物群、(b)MuA转座酶和(c)如SEQ ID NO:10所示的Hel308解旋酶,具有突变E284C和S615C,由双马来酰亚胺PEG11接头连接所述突变E284C和S615C。
26.根据权利要求25所述的试剂盒,其中所述试剂盒进一步包含多核苷酸蛋白和/或Y衔接子,其包含前导序列和/或能够将衔接子偶联至膜的一个或多个锚。
CN201780034561.5A 2016-05-25 2017-05-25 修饰模板双链多核苷酸以用于表征的方法 Active CN109219665B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1609220.7 2016-05-25
GBGB1609220.7A GB201609220D0 (en) 2016-05-25 2016-05-25 Method
PCT/GB2017/051490 WO2017203267A1 (en) 2016-05-25 2017-05-25 Method

Publications (2)

Publication Number Publication Date
CN109219665A CN109219665A (zh) 2019-01-15
CN109219665B true CN109219665B (zh) 2022-05-10

Family

ID=56369957

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780034561.5A Active CN109219665B (zh) 2016-05-25 2017-05-25 修饰模板双链多核苷酸以用于表征的方法

Country Status (5)

Country Link
US (2) US11649480B2 (zh)
EP (1) EP3464615B1 (zh)
CN (1) CN109219665B (zh)
GB (1) GB201609220D0 (zh)
WO (1) WO2017203267A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5843614B2 (ja) 2009-01-30 2016-01-13 オックスフォード ナノポア テクノロジーズ リミテッド 膜貫通配列決定における核酸構築物のためのアダプター
JP6298404B2 (ja) 2011-07-25 2018-03-20 オックスフォード ナノポール テクノロジーズ リミテッド 膜貫通ポアを用いる二重鎖ポリヌクレオチド配列決定のためのヘアピンループ方法
US11155860B2 (en) 2012-07-19 2021-10-26 Oxford Nanopore Technologies Ltd. SSB method
BR112015021788B1 (pt) 2013-03-08 2023-02-28 Oxford Nanopore Technologies Plc Métodos para mover uma ou mais helicases imobilizadas, para controlar o movimento de um polinucleotídeo alvo, para caracterizar um polinucleotídeo alvo e para controlar o carregamento de uma ou mais helicases em um polinucleotídeo alvo, uso de um poro de transmembrana e de um potencial aplicado e de um ou mais espaçadores, complexo, e, kit
GB201314695D0 (en) 2013-08-16 2013-10-02 Oxford Nanopore Tech Ltd Method
GB201403096D0 (en) 2014-02-21 2014-04-09 Oxford Nanopore Tech Ltd Sample preparation method
GB201418159D0 (en) 2014-10-14 2014-11-26 Oxford Nanopore Tech Ltd Method
GB201609220D0 (en) 2016-05-25 2016-07-06 Oxford Nanopore Tech Ltd Method
EP3731959A4 (en) 2017-12-29 2021-10-13 Clear Labs Inc. AUTOMATED PRIMING AND LIBRARY LOADER
GB201807793D0 (en) 2018-05-14 2018-06-27 Oxford Nanopore Tech Ltd Method
BR112022014144A2 (pt) * 2020-06-19 2022-12-27 Qitan Tech Ltd Beijing Helicase do tipo pif1, constructo, ácido nucleico, vetor de expressão, célula hospedeira, método para controlar o movimento de um polinucleotídeo, método de caracterização de um polinucleotídeo alvo, produto para caracterizar um polinucleotídeo alvo e uso da helicase do tipo pif1
GB202205617D0 (en) * 2022-04-14 2022-06-01 Oxford Nanopore Tech Plc Novel modified protein pores and enzymes
WO2024023219A1 (en) * 2022-07-27 2024-02-01 Illumina Cambridge Limited Tagmentation workflow

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012103545A1 (en) * 2011-01-28 2012-08-02 Illumina, Inc. Oligonucleotide replacement for di-tagged and directional libraries
WO2015022544A1 (en) * 2013-08-16 2015-02-19 Oxford Nanopore Technologies Limited Method
WO2015110813A1 (en) * 2014-01-22 2015-07-30 Oxford Nanopore Technologies Limited Method for attaching one or more polynucleotide binding proteins to a target polynucleotide
CN105209634A (zh) * 2013-03-08 2015-12-30 牛津纳米孔技术公司 酶停滞方法
WO2016059363A1 (en) * 2014-10-14 2016-04-21 Oxford Nanopore Technologies Limited Method

Family Cites Families (189)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IE56026B1 (en) 1982-10-19 1991-03-27 Cetus Corp Cysteine-depleted muteins of biologically active proteins
GB8924338D0 (en) 1989-10-28 1989-12-13 Atomic Energy Authority Uk Electrodes
US5215899A (en) 1989-11-09 1993-06-01 Miles Inc. Nucleic acid amplification employing ligatable hairpin probe and transcription
US5424413A (en) 1992-01-22 1995-06-13 Gen-Probe Incorporated Branched nucleic acid probes
FR2703693B1 (fr) 1993-04-06 1995-07-13 Pasteur Institut Procédé rapide de détermination d'une séquence d'ADN et application au séquençage et au diagnostic.
US5714320A (en) 1993-04-15 1998-02-03 University Of Rochester Rolling circle synthesis of oligonucleotides and amplification of select randomized circular oligonucleotides
US5777078A (en) 1993-04-28 1998-07-07 Worcester Foundation For Experimental Biology Triggered pore-forming agents
EP0753071A1 (en) 1993-04-28 1997-01-15 Worcester Foundation For Experimental Biology Cell-targeted lytic pore-forming agents
DE4320201A1 (de) 1993-06-18 1995-01-12 Asta Medica Ag Verwendung von Cetrorelix und weiteren Nona- und Dekapeptiden zur Herstellung eines Arzneimittels zur Bekämpfung von Aids und zur Wachstumsstimulation
US5561043A (en) 1994-01-31 1996-10-01 Trustees Of Boston University Self-assembling multimeric nucleic acid constructs
US7569341B2 (en) 1994-01-31 2009-08-04 Trustees Of Boston University Nucleic acid directed immobilization arrays and methods of assembly
US6362002B1 (en) 1995-03-17 2002-03-26 President And Fellows Of Harvard College Characterization of individual polymer molecules based on monomer-interface interactions
US5795782A (en) 1995-03-17 1998-08-18 President & Fellows Of Harvard College Characterization of individual polymer molecules based on monomer-interface interactions
US6395887B1 (en) 1995-08-01 2002-05-28 Yale University Analysis of gene expression by display of 3'-end fragments of CDNAS
US5866336A (en) 1996-07-16 1999-02-02 Oncor, Inc. Nucleic acid amplification oligonucleotides with molecular energy transfer labels and methods based thereon
DE19648625A1 (de) 1996-11-13 1998-05-14 Soft Gene Gmbh Mikroprojektil für das Einbringen von Substanzen in Zellen durch ballistischen Transfer
AU8586298A (en) 1997-07-25 1999-02-16 University Of Massachusetts Designed protein pores as components for biosensors
US6087099A (en) 1997-09-08 2000-07-11 Myriad Genetics, Inc. Method for sequencing both strands of a double stranded DNA in a single sequencing reaction
US6127166A (en) 1997-11-03 2000-10-03 Bayley; Hagan Molluscan ligament polypeptides and genes encoding them
JPH11137260A (ja) 1997-11-06 1999-05-25 Soyaku Gijutsu Kenkyusho:Kk 抗インフルエンザウイルス環状ダンベル型rna−dnaキメラ化合物及び抗インフルエンザウイルス剤
US6123819A (en) 1997-11-12 2000-09-26 Protiveris, Inc. Nanoelectrode arrays
DE19826758C1 (de) 1998-06-15 1999-10-21 Soft Gene Gmbh Darstellung von linearen kovalent geschlossenen DNA-Molekülen als Expressionskonstrukte
US6743605B1 (en) 1998-06-24 2004-06-01 Enzo Life Sciences, Inc. Linear amplification of specific nucleic acid sequences
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
US6235502B1 (en) 1998-09-18 2001-05-22 Molecular Staging Inc. Methods for selectively isolating DNA using rolling circle amplification
US6267872B1 (en) 1998-11-06 2001-07-31 The Regents Of The University Of California Miniature support for thin films containing single channels or nanopores and methods for using same
US6426231B1 (en) 1998-11-18 2002-07-30 The Texas A&M University System Analyte sensing mediated by adapter/carrier molecules
US6465193B2 (en) 1998-12-11 2002-10-15 The Regents Of The University Of California Targeted molecular bar codes and methods for using the same
NO986133D0 (no) 1998-12-23 1998-12-23 Preben Lexow FremgangsmÕte for DNA-sekvensering
US7056661B2 (en) 1999-05-19 2006-06-06 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
AU5763000A (en) 1999-06-22 2001-01-09 President And Fellows Of Harvard College Molecular and atomic scale evaluation of biopolymers
AU5668100A (en) 1999-06-29 2001-01-22 University Health Network Peptide conjugates for the stabilization of membrane proteins and interactions with biological membranes
WO2001012855A2 (en) 1999-08-13 2001-02-22 Yale University Binary encoded sequence tags
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US6682649B1 (en) 1999-10-01 2004-01-27 Sophion Bioscience A/S Substrate and a method for determining and/or monitoring electrophysiological properties of ion channels
US6498023B1 (en) 1999-12-02 2002-12-24 Molecular Staging, Inc. Generation of single-strand circular DNA from linear self-annealing segments
US6916665B2 (en) 2000-02-11 2005-07-12 The Texas A&M University System Biosensor compositions and methods of use
CA2403804A1 (en) 2000-03-21 2001-09-27 Curagen Corporation Vegf-modulated genes and methods employing them
JP2003527849A (ja) 2000-03-22 2003-09-24 キュラゲン コーポレイション 新規ペプチド及びこれをコードする核酸
US6596488B2 (en) 2000-03-30 2003-07-22 City Of Hope Tumor suppressor gene
US6387624B1 (en) 2000-04-14 2002-05-14 Incyte Pharmaceuticals, Inc. Construction of uni-directionally cloned cDNA libraries from messenger RNA for improved 3′ end DNA sequencing
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
US20020132350A1 (en) 2000-09-14 2002-09-19 Pioneer Hi-Bred International, Inc. Targeted genetic manipulation using Mu bacteriophage cleaved donor complex
US6709861B2 (en) 2000-11-17 2004-03-23 Lucigen Corp. Cloning vectors and vector components
US6936433B2 (en) 2000-11-27 2005-08-30 The Regents Of The University Of California Methods and devices for characterizing duplex nucleic acid molecules
US20020197618A1 (en) 2001-01-20 2002-12-26 Sampson Jeffrey R. Synthesis and amplification of unstructured nucleic acids for rapid sequencing
US20030087232A1 (en) 2001-01-25 2003-05-08 Fred Christians Methods for screening polypeptides
US7807408B2 (en) 2001-03-19 2010-10-05 President & Fellows Of Harvard College Directed evolution of proteins
US6863833B1 (en) 2001-06-29 2005-03-08 The Board Of Trustees Of The Leland Stanford Junior University Microfabricated apertures for supporting bilayer lipid membranes
CA2452716C (en) 2001-07-03 2012-06-26 The Regents Of The University Of California Mammalian sweet and amino acid heterodimeric taste receptors
US6852492B2 (en) 2001-09-24 2005-02-08 Intel Corporation Nucleic acid sequencing by raman monitoring of uptake of precursors during molecular replication
CN101006177B (zh) 2002-03-15 2011-10-12 纽韦卢森公司 改善的用于合成模制分子的方法
EP1504114B1 (en) 2002-05-10 2017-07-12 The Texas A & M University System Stochastic sensing through covalent interactions
WO2004065582A2 (en) 2003-01-15 2004-08-05 Dana-Farber Cancer Institute, Inc. Amplification of dna in a hairpin structure, and applications
WO2004072294A2 (en) 2003-02-12 2004-08-26 Genizon Svenska Ab Methods and means for nucleic acid sequencing
WO2004092331A2 (en) 2003-04-08 2004-10-28 Li-Cor, Inc. Composition and method for nucleic acid sequencing
US20100035254A1 (en) 2003-04-08 2010-02-11 Pacific Biosciences Of California, Inc. Composition and method for nucleic acid sequencing
US7163658B2 (en) 2003-04-23 2007-01-16 Rouvain Bension Rapid sequencing of polymers
US7344882B2 (en) 2003-05-12 2008-03-18 Bristol-Myers Squibb Company Polynucleotides encoding variants of the TRP channel family member, LTRPC3
WO2005056750A2 (en) 2003-12-11 2005-06-23 Quark Biotech, Inc. Inversion-duplication of nucleic acids and libraries prepared thereby
GB0400584D0 (en) 2004-01-12 2004-02-11 Solexa Ltd Nucleic acid chacterisation
WO2006028508A2 (en) 2004-03-23 2006-03-16 President And Fellows Of Harvard College Methods and apparatus for characterizing polynucleotides
GB2413796B (en) 2004-03-25 2006-03-29 Global Genomics Ab Methods and means for nucleic acid sequencing
US20050227239A1 (en) 2004-04-08 2005-10-13 Joyce Timothy H Microarray based affinity purification and analysis device coupled with solid state nanopore electrodes
WO2005118877A2 (en) 2004-06-02 2005-12-15 Vicus Bioscience, Llc Producing, cataloging and classifying sequence tags
WO2005124888A1 (en) 2004-06-08 2005-12-29 President And Fellows Of Harvard College Suspended carbon nanotube field effect transistor
US7700281B2 (en) 2004-06-30 2010-04-20 Usb Corporation Hot start nucleic acid amplification
CN102925549A (zh) 2004-08-13 2013-02-13 哈佛学院院长等 超高处理量光学-纳米孔dna读出平台
US20060086626A1 (en) 2004-10-22 2006-04-27 Joyce Timothy H Nanostructure resonant tunneling with a gate voltage source
US7867716B2 (en) 2004-12-21 2011-01-11 The Texas A&M University System High temperature ion channels and pores
US7890268B2 (en) 2004-12-28 2011-02-15 Roche Molecular Systems, Inc. De-novo sequencing of nucleic acids
GB0505971D0 (en) 2005-03-23 2005-04-27 Isis Innovation Delivery of molecules to a lipid bilayer
US7507575B2 (en) 2005-04-01 2009-03-24 3M Innovative Properties Company Multiplex fluorescence detection device having removable optical modules
WO2007145612A1 (en) 2005-06-06 2007-12-21 454 Life Sciences Corporation Paired end sequencing
US20070020640A1 (en) 2005-07-21 2007-01-25 Mccloskey Megan L Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis
EP1924704B1 (en) 2005-08-02 2011-05-25 Rubicon Genomics, Inc. Compositions and methods for processing and amplification of dna, including using multiple enzymes in a single reaction
WO2007024997A2 (en) 2005-08-22 2007-03-01 Fermalogic, Inc. Methods of increasing production of secondary metabolites
GB0523282D0 (en) 2005-11-15 2005-12-21 Isis Innovation Methods using pores
CA2633476C (en) 2005-12-22 2015-04-21 Pacific Biosciences Of California, Inc. Active surface coupled polymerases
US7932029B1 (en) 2006-01-04 2011-04-26 Si Lok Methods for nucleic acid mapping and identification of fine-structural-variations in nucleic acids and utilities
EP1994179A2 (en) 2006-02-18 2008-11-26 Michael Strathmann Massively multiplexed sequencing
US8673567B2 (en) 2006-03-08 2014-03-18 Atila Biosystems, Inc. Method and kit for nucleic acid sequence detection
ES2545264T3 (es) 2006-04-04 2015-09-09 Keygene N.V. Detección de alto rendimiento de marcadores moleculares basada en fragmentos de restricción
WO2007146158A1 (en) 2006-06-07 2007-12-21 The Trustees Of Columbia University In The City Of New York Dna sequencing by nanopore using modified nucleotides
JP4876766B2 (ja) 2006-08-10 2012-02-15 トヨタ自動車株式会社 燃料電池
CA2663047A1 (en) 2006-09-06 2008-03-13 Phase Bioscience, Inc. Therapeutic elastin-like polypeptide (elp) fusion proteins
WO2008045575A2 (en) 2006-10-13 2008-04-17 J. Craig Venter Institute, Inc. Sequencing method
WO2008051530A2 (en) 2006-10-23 2008-05-02 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
GB2445016B (en) 2006-12-19 2012-03-07 Microsaic Systems Plc Microengineered ionisation device
US20100196203A1 (en) 2007-02-20 2010-08-05 Gurdial Singh Sanghera Formation of Lipid Bilayers
EP2156179B1 (en) 2007-04-04 2021-08-18 The Regents of The University of California Methods for using a nanopore
EP2195648B1 (en) 2007-09-12 2019-05-08 President and Fellows of Harvard College High-resolution molecular graphene sensor comprising an aperture in the graphene layer
GB2453377A (en) 2007-10-05 2009-04-08 Isis Innovation Transmembrane protein pores and molecular adapters therefore.
KR101414713B1 (ko) 2007-10-11 2014-07-03 삼성전자주식회사 리가제 및 엔도뉴클레아제의 존재하에서 롤링서클 증폭에의하여 표적 핵산을 증폭하는 방법
GB0724736D0 (en) 2007-12-19 2008-01-30 Oxford Nanolabs Ltd Formation of layers of amphiphilic molecules
JP5288143B2 (ja) 2007-12-31 2013-09-11 富士レビオ株式会社 キャビティーモード光学検出の為のマイクロ共鳴体のクラスター
WO2009092035A2 (en) 2008-01-17 2009-07-23 Sequenom, Inc. Methods and compositions for the analysis of biological molecules
US8263367B2 (en) 2008-01-25 2012-09-11 Agency For Science, Technology And Research Nucleic acid interaction analysis
US8231969B2 (en) 2008-03-26 2012-07-31 University Of Utah Research Foundation Asymmetrically functionalized nanoparticles
CA2719747C (en) 2008-03-28 2018-02-20 Pacific Biosciences Of California, Inc. Compositions and methods for nucleic acid sequencing
WO2009120374A2 (en) 2008-03-28 2009-10-01 Pacific Biosciences Of California, Inc. Methods and compositions for nucleic acid sample preparation
US8628940B2 (en) 2008-09-24 2014-01-14 Pacific Biosciences Of California, Inc. Intermittent detection during analytical reactions
US20090269771A1 (en) 2008-04-24 2009-10-29 Life Technologies Corporation Method of sequencing and mapping target nucleic acids
EP2281062B1 (en) 2008-04-24 2017-11-29 The Trustees of Columbia University in the City of New York Geometric patterns and lipid bilayers for dna molecule organization
EP2682460B1 (en) 2008-07-07 2017-04-26 Oxford Nanopore Technologies Limited Enzyme-pore constructs
AU2009269792A1 (en) 2008-07-07 2010-01-14 Oxford Nanopore Technologies Limited Base-detecting pore
US20100092960A1 (en) 2008-07-25 2010-04-15 Pacific Biosciences Of California, Inc. Helicase-assisted sequencing with molecular beacons
CN102203273A (zh) 2008-09-09 2011-09-28 生命技术公司 生成基因特异性的文库的方法
US8481264B2 (en) 2008-09-19 2013-07-09 Pacific Biosciences Of California, Inc. Immobilized nucleic acid complexes for sequence analysis
EP3029467B1 (en) 2008-09-22 2020-01-08 University of Washington Msp nanopores and related methods
WO2010036287A1 (en) 2008-09-24 2010-04-01 Pacific Biosciences Of California, Inc. Intermittent detection during analytical reactions
US8383369B2 (en) 2008-09-24 2013-02-26 Pacific Biosciences Of California, Inc. Intermittent detection during analytical reactions
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
DK2376517T3 (da) 2008-10-24 2013-02-11 Epict Technologies Corp Transposon-ende-sammensætninger og fremgangsmåder til at modificere nukleinsyrer
US8486630B2 (en) 2008-11-07 2013-07-16 Industrial Technology Research Institute Methods for accurate sequence data and modified base position determination
GB0820927D0 (en) 2008-11-14 2008-12-24 Isis Innovation Method
US9175341B2 (en) 2008-12-11 2015-11-03 Pacific Biosciences Of California, Inc. Methods for identifying nucleic acid modifications
JP5843614B2 (ja) 2009-01-30 2016-01-13 オックスフォード ナノポア テクノロジーズ リミテッド 膜貫通配列決定における核酸構築物のためのアダプター
JP2012516145A (ja) 2009-01-30 2012-07-19 オックスフォード ナノポア テクノロジーズ リミテッド ハイブリダイゼーションリンカー
CA2751470C (en) 2009-02-16 2016-07-26 Epicentre Technologies Corporation Template-independent ligation of single-stranded dna
WO2010096838A2 (en) 2009-02-23 2010-08-26 Cytomx Therapeutics, Llc Proproteins and methods of use thereof
GB0905140D0 (en) 2009-03-25 2009-05-06 Isis Innovation Method
FR2943656A1 (fr) 2009-03-25 2010-10-01 Air Liquide Procede et installation de production d'hydrogene mettant en oeuvre un compresseur thermocinetique
WO2010117470A2 (en) 2009-04-10 2010-10-14 Pacific Biosciences Of California, Inc. Nanopore sequencing devices and methods
BRPI1012752B1 (pt) 2009-04-20 2019-06-25 Oxford Nanopore Technologies Limited Método e aparelho para detectar uma interação de uma entidade molecular com uma proteína de membrana em uma camada de moléculas anfifílicas
GB0910302D0 (en) 2009-06-15 2009-07-29 Lumora Ltd Nucleic acid amplification
US20120015821A1 (en) 2009-09-09 2012-01-19 Life Technologies Corporation Methods of Generating Gene Specific Libraries
BR112012013074B1 (pt) 2009-12-01 2018-09-18 Oxford Nanopore Technologies Limited instrumento de análise e módulo para realizar análise bioquímica, e, método para operar um instrumento de análise para realizar análise bioquímica
WO2011090556A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Methods for determining fraction of fetal nucleic acid in maternal samples
FR2955773B1 (fr) 2010-02-01 2017-05-26 Commissariat A L'energie Atomique Complexe moleculaire de ciblage des antigenes vers les cellules presentatrices d'antigene et ses applications pour la vaccination
KR20110100963A (ko) 2010-03-05 2011-09-15 삼성전자주식회사 미세 유동 장치 및 이를 이용한 표적 핵산의 염기 서열 결정 방법
ES2626411T3 (es) 2010-03-10 2017-07-25 Ibis Biosciences, Inc. Producción de ácido nucleico circular monocatenario
US8652779B2 (en) 2010-04-09 2014-02-18 Pacific Biosciences Of California, Inc. Nanopore sequencing using charge blockade labels
US20120244525A1 (en) 2010-07-19 2012-09-27 New England Biolabs, Inc. Oligonucleotide Adapters: Compositions and Methods of Use
EP2614156B1 (en) 2010-09-07 2018-08-01 The Regents of The University of California Control of dna movement in a nanopore at one nucleotide precision by a processive enzyme
EP2635679B1 (en) 2010-11-05 2017-04-19 Illumina, Inc. Linking sequence reads using paired code tags
CN103282518B (zh) 2010-12-17 2016-11-16 纽约哥伦比亚大学理事会 使用经修饰的核苷酸和纳米孔检测的dna边合成边测序
WO2012098561A2 (en) 2011-01-18 2012-07-26 Swamy R K A multipupurpose instrument for triangle solutions, measurements and geometrical applications called triometer
US9402808B2 (en) 2011-01-19 2016-08-02 Panacea Biotec Limited Liquid oral composition of lanthanum salts
US20120196279A1 (en) 2011-02-02 2012-08-02 Pacific Biosciences Of California, Inc. Methods and compositions for nucleic acid sample preparation
BR112013020411B1 (pt) 2011-02-11 2021-09-08 Oxford Nanopore Technologies Limited Monômero de msp mutante, construto, polinucleotídeo, poro, kit e aparelho para caracterizar uma sequência de ácido nucleico alvo, e, método para caracterizar uma sequência de ácido nucleico alvo
US9347929B2 (en) 2011-03-01 2016-05-24 The Regents Of The University Of Michigan Controlling translocation through nanopores with fluid wall
EP2715343B1 (en) 2011-05-27 2019-10-02 Oxford Nanopore Technologies Limited Coupling method
US20130017978A1 (en) 2011-07-11 2013-01-17 Finnzymes Oy Methods and transposon nucleic acids for generating a dna library
US9145623B2 (en) 2011-07-20 2015-09-29 Thermo Fisher Scientific Oy Transposon nucleic acids comprising a calibration sequence for DNA sequencing
JP6298404B2 (ja) 2011-07-25 2018-03-20 オックスフォード ナノポール テクノロジーズ リミテッド 膜貫通ポアを用いる二重鎖ポリヌクレオチド配列決定のためのヘアピンループ方法
US9632102B2 (en) 2011-09-25 2017-04-25 Theranos, Inc. Systems and methods for multi-purpose analysis
JP6457811B2 (ja) 2011-09-23 2019-01-23 オックスフォード ナノポール テクノロジーズ リミテッド ポリマー単位を含むポリマーの解析
US20140308661A1 (en) 2011-09-25 2014-10-16 Theranos, Inc. Systems and methods for multi-analysis
US9810704B2 (en) 2013-02-18 2017-11-07 Theranos, Inc. Systems and methods for multi-analysis
BR112014009579B1 (pt) 2011-10-21 2021-06-22 Oxford Nanopore Technologies Limited Métodos para caracterizar um polinucleotídeo alvo, e para formar um sensor, uso de uma helicase, kit, e, aparelho de análise
US9404147B2 (en) 2011-12-19 2016-08-02 Gen-Probe Incorporated Closed nucleic acid structures
WO2013098562A2 (en) 2011-12-29 2013-07-04 Oxford Nanopore Technologies Limited Enzyme method
US9617591B2 (en) 2011-12-29 2017-04-11 Oxford Nanopore Technologies Ltd. Method for characterising a polynucleotide by using a XPD helicase
NO2694769T3 (zh) 2012-03-06 2018-03-03
BR112014025157B1 (pt) 2012-04-10 2022-02-08 Oxford Nanopore Technologies Limited Monômero de lisenina mutante, construto, poro, método para caracterizar um analito alvo, uso de um poro, e, kit
GB2517875A (en) 2012-06-08 2015-03-04 Pacific Biosciences California Modified base detection with nanopore sequencing
TWI655213B (zh) 2012-07-13 2019-04-01 目立康股份有限公司 自我組織化肽衍生物的製造方法
CA2879355C (en) 2012-07-19 2021-09-21 Oxford Nanopore Technologies Limited Helicase construct and its use in characterising polynucleotides
EP2875128B8 (en) 2012-07-19 2020-06-24 Oxford Nanopore Technologies Limited Modified helicases
US11155860B2 (en) 2012-07-19 2021-10-26 Oxford Nanopore Technologies Ltd. SSB method
WO2014041337A1 (en) 2012-09-14 2014-03-20 Oxford Nanopore Technologies Limited Sample preparation method
GB201313121D0 (en) 2013-07-23 2013-09-04 Oxford Nanopore Tech Ltd Array of volumes of polar medium
CA2889664C (en) 2012-10-26 2020-12-29 Oxford Nanopore Technologies Limited Droplet interfaces
EP2917732B1 (en) 2012-11-09 2016-09-07 Stratos Genomics Inc. Concentrating a target molecule for sensing by a nanopore
US9683230B2 (en) 2013-01-09 2017-06-20 Illumina Cambridge Limited Sample preparation on a solid support
US20140206842A1 (en) 2013-01-22 2014-07-24 Muhammed Majeed Peptides Modified with Triterpenoids and Small Organic Molecules: Synthesis and use in Cosmeceutical
GB201318465D0 (en) 2013-10-18 2013-12-04 Oxford Nanopore Tech Ltd Method
JP6441893B2 (ja) 2013-03-19 2018-12-19 ディレクティド・ジェノミクス・エル・エル・シー 標的配列の濃縮
EP3936222A1 (en) 2013-08-30 2022-01-12 University of Washington through its Center for Commercialization Selective modification of polymer subunits to improve nanopore-based analysis
CN117264925A (zh) 2013-10-18 2023-12-22 牛津纳米孔科技公开有限公司 经修饰的酶
GB201406151D0 (en) 2014-04-04 2014-05-21 Oxford Nanopore Tech Ltd Method
GB201321123D0 (en) 2013-11-29 2014-01-15 Linea Ab Q Amplification of circular molecules
WO2015117232A1 (en) 2014-02-06 2015-08-13 The University Of British Columbia Methods for sequential screening with co-culture based detection of metagenomic elements conferring heterologous metabolite secretion
GB201403096D0 (en) 2014-02-21 2014-04-09 Oxford Nanopore Tech Ltd Sample preparation method
US10131944B2 (en) 2014-03-24 2018-11-20 The Regents Of The University Of California Molecular adapter for capture and manipulation of transfer RNA
GB201417712D0 (en) 2014-10-07 2014-11-19 Oxford Nanopore Tech Ltd Method
SG11201610357UA (en) 2014-06-13 2017-01-27 Illumina Cambridge Ltd Methods and compositions for preparing sequencing libraries
US10017759B2 (en) 2014-06-26 2018-07-10 Illumina, Inc. Library preparation of tagged nucleic acid
EP3161152B1 (en) 2014-06-30 2018-12-26 Illumina, Inc. Methods and compositions using one-sided transposition
WO2016022557A1 (en) 2014-08-05 2016-02-11 Twist Bioscience Corporation Cell free cloning of nucleic acids
EP3633047B1 (en) 2014-08-19 2022-12-28 Pacific Biosciences of California, Inc. Method of sequencing nucleic acids based on an enrichment of nucleic acids
US10435685B2 (en) 2014-08-19 2019-10-08 Pacific Biosciences Of California, Inc. Compositions and methods for enrichment of nucleic acids
CN117164684A (zh) 2014-09-01 2023-12-05 弗拉芒区生物技术研究所 突变csgg孔
US10557134B2 (en) 2015-02-24 2020-02-11 Trustees Of Boston University Protection of barcodes during DNA amplification using molecular hairpins
JP6560336B2 (ja) 2015-02-26 2019-08-14 株式会社日立ハイテクノロジーズ 核酸分子の構築方法
GB201609220D0 (en) 2016-05-25 2016-07-06 Oxford Nanopore Tech Ltd Method
CN107488656B (zh) 2016-06-13 2020-07-17 陆欣华 一种核酸等温自扩增方法
GB201807793D0 (en) 2018-05-14 2018-06-27 Oxford Nanopore Tech Ltd Method

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012103545A1 (en) * 2011-01-28 2012-08-02 Illumina, Inc. Oligonucleotide replacement for di-tagged and directional libraries
CN105209634A (zh) * 2013-03-08 2015-12-30 牛津纳米孔技术公司 酶停滞方法
WO2015022544A1 (en) * 2013-08-16 2015-02-19 Oxford Nanopore Technologies Limited Method
CN105705656A (zh) * 2013-08-16 2016-06-22 牛津纳米孔技术公司 方法
WO2015110813A1 (en) * 2014-01-22 2015-07-30 Oxford Nanopore Technologies Limited Method for attaching one or more polynucleotide binding proteins to a target polynucleotide
WO2016059363A1 (en) * 2014-10-14 2016-04-21 Oxford Nanopore Technologies Limited Method

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
DNA transposon-based gene vehicles – scenes from an evolutionary drive;Alsbjerg Skipper等;《Journal of Biomedical Science》;20131209;第20卷(第92期);第1-23页 *
Handoff from recombinase to replisome: insights from transposition;H. Nakai等;《National Academy of Sciences》;20010717;第98卷(第15期);第8247-8254页 *
Heteroduplex DNA Position Defines the Roles of the Sgs1, Srs2, and Mph1 Helicases in Promoting Distinct Recombination Outcomes;Katrina Mitchel等;《PLOS Genetics》;20130314;第3卷(第9期);第e1003340页 *
Host Factors that promote transpososome disassembly and the PriA-PriC pathway for restart primosome assembly: Orderly transition from transpososome to replisome;Stella H. North等;《Molecular Microbiology》;20050601;第56卷(第6期);第1601-1616页 *
Structure and Mechanism of Helicases and Nucleic Acid Translocases;Martin R. Singleton等;《Annual Review of Biochemistry》;20070707;第76卷;第23-50页 *
玉米Mu转座子及其在反向遗传研究中的应用;崔庆新等;《农业科技通讯》;20101231(第1期);第35-38页 *

Also Published As

Publication number Publication date
EP3464615A1 (en) 2019-04-10
GB201609220D0 (en) 2016-07-06
CN109219665A (zh) 2019-01-15
EP3464615B1 (en) 2020-11-25
US20230374567A1 (en) 2023-11-23
US11649480B2 (en) 2023-05-16
WO2017203267A1 (en) 2017-11-30
US20190194722A1 (en) 2019-06-27

Similar Documents

Publication Publication Date Title
CN109219665B (zh) 修饰模板双链多核苷酸以用于表征的方法
US11965183B2 (en) Modified enzymes
US11725235B2 (en) Method for attaching one or more polynucleotide binding proteins to a target polynucleotide
US11236385B2 (en) Method for characterising a double stranded nucleic acid using a nano-pore and anchor molecules at both ends of said nucleic acid
US20230374583A1 (en) Method of target molecule characterisation using a molecular pore
CN109312401B (zh) 连接的核酸的纳米孔测序方法
US20190345550A1 (en) Method for controlling the movement of a polynucleotide through a transmembrane pore
JP2019213529A (ja) 修飾ヘリカーゼ
JP2016538835A (ja) 修飾酵素
CN117965707A (zh) 经修饰的酶
CN117947149A (zh) 经修饰的酶
CN117947148A (zh) 经修饰的酶

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: oxford

Patentee after: Oxford nanopore Technology Public Co.,Ltd.

Address before: Oxfordshire

Patentee before: OXFORD NANOPORE TECHNOLOGIES LTD.