CN116547380A - 大型及镜像蛋白质的化学合成及其用途 - Google Patents

大型及镜像蛋白质的化学合成及其用途 Download PDF

Info

Publication number
CN116547380A
CN116547380A CN202180068729.0A CN202180068729A CN116547380A CN 116547380 A CN116547380 A CN 116547380A CN 202180068729 A CN202180068729 A CN 202180068729A CN 116547380 A CN116547380 A CN 116547380A
Authority
CN
China
Prior art keywords
amino acid
glu
lys
leu
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180068729.0A
Other languages
English (en)
Inventor
朱听
范楚珧
邓强
许媛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Publication of CN116547380A publication Critical patent/CN116547380A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/02General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length in solution
    • C07K1/026General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length in solution by fragment condensation in solution
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1247DNA-directed RNA polymerase (2.7.7.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07006DNA-directed RNA polymerase (2.7.7.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07007DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本文提供一种用于生产大型(超过400个氨基酸长度)D‑氨基酸蛋白质的通用方法,D‑氨基酸蛋白质亦称为镜像蛋白质(相对于其天然存在的L‑氨基酸对应物),包括RNA/DNA操纵酶,以及其在广泛研究、实际数据存储及医学应用中的用途。

Description

大型及镜像蛋白质的化学合成及其用途
相关申请
本申请请求于2020年8月6日所提交的美国临时专利申请案第63/061,844号的优先权权益,其内容通过引用整体并入本文中。
序列表声明
与提交本申请同时提交的创建于2021年5月6日,包含180,286字节的名为87597_ST25.txt的ASCII文件,通过引用并入本文中。
发明的技术领域及背景技术
本发明,在其一些实施例中,涉及生物化学,且更具体地但不排他地涉及大型蛋白质及其镜像对应物的全化学合成的方法及其用途。
完全由非天然的D-氨基酸及非手性氨基酸甘氨酸所组成的蛋白质是其天然的L-蛋白质对应物的镜像形式。化学性蛋白质合成的最新进展提供对于结构域大小的镜像D-蛋白的独特性及简便的合成途径,使蛋白质研究能够通过“镜子”以先前无法实现的方式进行。D-蛋白可促进难以结晶的天然L-型的结构测定(外消旋X射线晶体学);D蛋白可作为库筛选的诱饵,以最终产生药理学上优越的D肽/D蛋白疗法(镜像噬菌体展示);D蛋白亦可用作一种强大的机制工具,用于探测生物学、药物发现及免疫学中的分子事件。
自从160多年前巴斯德首次艰苦分离酒石酸盐的对映晶体,生物分子的单手性即吸引科学家及外行人。最近,一些理论及实验研究帮助描绘一种模型,说明一对映异构体如何从可能为外消旋生命起源的世界开始支配另一对映异构体。布莱克蒙德,D.G.,[“生物同手性的起源”,Cold Spring Harb Perspect Biol.,2010,2(5),a002147]强调对映体富集的机制,包括化学或物理过程,或两者的结合。由于生物分子的同手性是生命的标志,因此此种努力的科学驱动力中的一者来自于对于了解生命起源的兴趣。其他的动机是来自实际及应用科学的兴趣,例如可提供不受自然影响的分子系统的正交生物学工具,例如,用于安全数据存储。
在核酸方面,氨基磷酸酯化学已使寡核苷酸(oligo)合成可达到约150nt的DNA及约70nt的RNA。在蛋白质方面,介于固相肽合成(solid-phase peptide synthesis,SPPS)与天然化学连接(native chemical ligation,NCL)之间的结合产生一种强大的方法,其可实现各种蛋白质的全化学合成(5,14-20)。具体而言,基于174-aa的非洲猪瘟病毒聚合酶X(ASFV pol X)(5)的镜像版本,实现镜像遗传复制及转录系统,随后是更高效及耐热的352-aa的硫化叶菌(Sulfolobus solfataricus)P2 DNA聚合酶IV(Dpo4)(17-19),从而实现镜像聚合酶链反应(mirror-image polymerase chain reaction,MI-PCR),以及镜像基因转录及逆转录(21)。特别是,对于D-Dpo4的突变版本,全长5S rRNA酶促是转录为120nt,否则此技术将由于长度太长而无法被化学合成(21)。
镜像蛋白是功能强大的工具,在结构生物学、肽/蛋白质药物设计及生物过程的机理研究中具有广泛的应用。随着化学蛋白质合成技术变得更加稳健且可供不同学科的科学家使用,镜像蛋白质在化学、生物学及生物医学研究中的巨大潜力将得到充分释放。此二种使能技术-天然化学连接及镜像噬菌体展示特别具有吸引力,并将对发现用于治疗各种人类疾病的新型药理学优越肽及蛋白质疗法产生深远影响。
“镜像蛋白”的综述[赵,L.及鲁,W.,Current Opinion in Chemical Biology,2014,22,pp.56-61]调察镜像蛋白在结构生物学、药物发现中的应用的最新进展及免疫学。
哈特拉普夫,N.等人[“通过自动化流动化学的蛋白质的合成”,Science,2020,368(6494),pp.980-987]报道与自动化快速流动仪器相匹配的高效化学,可用于在327个连续反应中直接制造长度达164个氨基酸的肽链,如同代表酶、结构单元及调节因子的九种不同的蛋白质链的化学合成所证明,其中肽链的延长是在数小时内完成。研究人员报告经过纯化及折叠之后,合成材料显示与生物性表达蛋白质相当的生物物理学及酶学特性,显示高保真自动化流动化学或自动化快速流动肽合成(utomated fast-flow peptidesynthesis,AFPS)是生产无核糖体的单结构域蛋白质的替代技术。
然而,镜像蛋白质仍然局限于相对较小的蛋白质,而具有超过约400个氨基酸(amiino acid,aa)残基的较大型蛋白质的合成更难实现,其主要是由于肽片段的合成及连接效率是有限的。虽然最近开发的自动化快速流动肽合成(automated fast-flow peptidesynthesis,AFPS)技术能够产生较先前常规的标准SPPS可获得的肽链长度三倍以上的肽链,但明显缺乏合成大型镜像分子的适当方法已经过分限制镜像生物系统的开发及其在信息存储等方面的应用。
发明内容
因此,本发明的一方面涉及在其氨基酸残基的L-及D-手性方面的相对大型的蛋白质(长度超过400个氨基酸)的全化学合成方法,以及根据本文中所公开的方法所制备的D-氨基酸蛋白质的应用。根据本发明的实施例,基于多序列比对及/或结构信息,通过在氨基酸序列中寻找部分,在不涉及或不存在生化大分子的情况下化学合成大型蛋白质,其中氨基酸残基可被替换(突变)而不会对蛋白质的功能产生不利影响。根据目前所公开的发明,在蛋白质序列中引入突变,以在蛋白质序列中插入分裂位点及/或连接位点,以及降低有利连接多肽的疏水性,并通过降低蛋白质中的Ile残基的数量,以降低制备D-氨基酸蛋白质的成本。亦提供D-氨基酸蛋白质的用途,例如,但不限于生物正交分子数据存储、用于适体开发的SELEX及X射线蛋白质晶体学中的晶体生长策略。
因此,根据本发明一些实施例的一方面化学生产蛋白质的方法,其是听过连接所述蛋白质的至少两个有利连接片段来实现,其中各个所述有利连接片段是可化学合成的,且可通过以下的方式获得:
(i)鉴定在所述蛋白质的氨基酸序列中的至少一有利连接序列,在所述有利连接序列处解析所述蛋白质的氨基酸序列,以得到多个有利连接片段;以及
(ii)倘若各个所述有利连接片段是可化学合成的,则化学合成各个所述有利连接片段;
(iii)倘若所述有利连接片段中的任一者非是可化学合成的,则鉴定在所述有利连接片段中的至少一结构缺失区段、利用一有利连接氨基酸残基取代在所述结构缺失区段中的至少一氨基酸,以在所述结构缺失区段中引入一有利连接序列、在所述有利连接序列处解析所述蛋白质的氨基酸序列;以及化学合成各个所述有利连接片段。
在本发明的一些实施例中,在步骤(i)中,所述有利连接序列中的至少一者是位于所述蛋白质中的结构缺失区段中。
在本发明的一些实施例中,本文中所提供的方法包括步骤(iii)。
在本发明的一些实施例中,在步骤(i)之前,本文中所提供的方法包括步骤:
(a)将所述蛋白质的氨基酸序列分裂成至少两个结构域形成片段;
(b)倘若各个所述结构域形成片段是可化学合成的,则化学合成各个所述结构域形成片段;以及
(c)共同折迭所述结构域形成片段,从而获得所述蛋白质。
在本发明的一些实施例中,本文中所提供的方法包括步骤(a),将所述蛋白质的氨基酸序列分裂成至少两个结构域形成片段。
在本发明的一些实施例中,倘若所述结构域形成片段中的一者非为可可化学合成的,则所述方法进一步通过以下而实施:
(d)鉴定在所述结构域形成片段中的至少一有利连接序列,以及在所述有利连接序列处解析所述结构域形成片段的氨基酸序列,从而得到多个可化学合成的有利连接片段;
(e)倘若所述结构域形成片段基本上缺乏一有利连接序列,或所述有利连接片段中的任一者非为可化学合成的,则鉴定在所述结构域形成片段或所述有利连接片段中的至少一结构缺失区段;
(f)利用一有利连接氨基酸残基取代在所述结构缺失区段或所述有利连接片段中的至少一氨基酸,以在所述结构缺失区段或所述有利连接片段中引入一有利连接序列,以及在所述有利连接序列处解析所述结构域形成片段的氨基酸序列,从而得到可化学合成的多个有利连接片段的序列;以及
(g)化学合成各个所述可化学合成的有利连接片段。
在本发明的一些实施例中,本文中所提供的方法包括步骤(f)。
根据本发明的一些实施例,所述合成的蛋白质展现至少1%、5%或至少10%的相应的生物性生产的蛋白质的活性。
根据本发明的一些实施例,所述活性是选自由催化活性、特异性结合活性,以及结构活性所组成的群组。
根据本发明的一些实施例,所述蛋白质包括至少240个氨基酸残基。
根据本发明的一些实施例,所述蛋白质包括约400个氨基酸残基。
根据本发明的一些实施例,本文中所提供的方法进一步包括步骤:在所述有利连接片段中的至少一者中,根据以下的疏水性顺序,利用一疏水性较弱的氨基酸取代至少一疏水性氨基酸残基:Ile>Leu>Phe>Val>Met>Pro>Trp>His(0)>Thr>Glu(0)>Gln>Cys>Tyr>Ala>Ser>Asn>Asp(0)>Arg+>Gly>His+>Glu>Lys+>Asp-。
根据本发明的一些实施例,所述合成的蛋白质是使用至少90%的非Gly D-氨基酸残基所生产。
根据本发明的一些实施例,相较于一相应的生物性生产的蛋白质的3D结构,所述蛋白质基本上具有一镜像的3D结构。
根据本发明的一些实施例,本文中所提供的方法进一步包括步骤:利用D-氨基酸残基取代至少一Ile残基,所述D-氨基酸残基是选自由以下所组成的群组:D-Ala残基、D-Val残基、D-Leu残基、D-Thr残基、D-Phe残基、D-Met残基、Gly残基,以及D-Pro残基。
根据本发明的一些实施例的另一方面,提供一种蛋白质,所述蛋白质是根据本文中公的方法所制备,其中所述蛋白质具有至少约240个氨基酸残基的长度。
根据本发明的一些实施例,本文中所提供的化学合成的蛋白质包括至少两个结构域形成片段,所述结构域形成片段是非共价连接的多肽链,其中所述结构域形成片段是在至少一相应的生物性生产的蛋白质中的共价连接的多肽链。
根据本发明的一些实施例,本文中所提供的蛋白质是选自由以下所组成的群组:酶、转运蛋白、结构/力学蛋白、激素、信号蛋白、抗体、体液平衡蛋白、pH平衡蛋白、细胞通道,以及细胞泵。
根据本发明的一些实施例,所述蛋白质是酶,所述酶能够催化一反应,所述反应是由一相应的生物性生产的酶所催化。
根据本发明的一些实施例,所述化学合成的酶是RNA聚合酶,能够使用一DNA模板从核糖核苷酸合成RNA。
根据本发明的一些实施例,所述化学合成的RNA聚合酶是T7 RNA聚合酶,或PfuDNA聚合酶突变。
根据本发明的一些实施例,所述化学合成的Pfu DNA聚合酶突变具有至少一突变,所述突变是选自由V93Q、E102A、D141A、E143A、Y410G、A486L及E665K所组成的群组。
在本发明的一些实施例中,所述Pfu DNA聚合酶进一步包括至少一突变,所述突变是选自由D215A、A486Y及L490W(SEQ ID No.77)所组成的群组。
在本发明的一些实施例中,所述Pfu DNA聚合酶进一步包括DNA结合结构域,其中所述DNA结合结构域是sso7d结构域(SEQ ID No.78)。
根据本发明的一些实施例,所述化学合成的酶是DNA聚合酶,能够从脱氧核糖核苷酸合成DNA。
根据本发明的一些实施例,所述化学合成的DNA聚合酶是Pfu DNA聚合酶。
根据本发明的实施例的另一方面,提供一种化学生产D-氨基酸蛋白质(一种镜像蛋白质)的方法,所述方法包括步骤:连接所述D-氨基酸蛋白质的至少两个有利连接片段,其中各个所述有利连接片段包括至少90%的非Gly D-氨基酸残基且是可化学合成的,以及可通过以下的步骤获得:
(i)鉴定在一相应的L-氨基酸蛋白质的氨基酸序列中的至少一有利连接序列,在所述有利连接序列处解析所述氨基酸序列,以得到多个有利连接片段;以及
(ii)倘若各个所述有利连接片段是可化学合成的,则利用至少90%的非Gly D-氨基酸残基,以化学合成各个所述有利连接片段;
(iii)倘若所述有利连接片段中的任一者非为可化学合成的,则鉴定在所述有利连接片段中的至少一结构缺失区段、利用一有利连接氨基酸残基来取代在所述结构缺失区段中的至少一氨基酸,以在所述结构缺失区段中引入一有利连接序列、在所述有利连接序列处解析所述有利连接片段的氨基酸序列;以及利用至少90%的非Gly D-氨基酸残基,以化学合成各个所述有利连接片段。
根据本发明的一些实施例,用于生产一镜像蛋白质的方法包括:在步骤(i)中,所述有利连接序列中的至少一者是位于所述相应的L-氨基酸蛋白质中的结构缺失区段中。
根据本发明的一些实施例,用于生产一镜像蛋白质的方法包括步骤(iii)。
根据本发明的一些实施例,用于生产一镜像蛋白质的方法在步骤(i)之前,进一步包括步骤:
(a)将所述L-氨基酸蛋白质的氨基酸序列分裂成至少两个结构域形成片段;
(b)倘若各个所述结构域形成片段是可化学合成的,则利用至少90%的非Gly D-氨基酸残基,以化学合成各个所述结构域形成片段;以及
(c)共同折迭所述结构域形成片段,从而获得所述D-氨基酸蛋白质。
根据本发明的一些实施例,在用于生产一镜像蛋白质的方法中,倘若所述结构域形成片段中的一者非为可可化学合成的,则
(d)鉴定在所述结构域形成片段中的至少一有利连接序列,以及在所述有利连接序列处解析所述结构域形成片段的氨基酸序列,从而得到多个可化学合成的有利连接片段;
(e)倘若所述结构域形成片段基本上缺乏一有利连接序列,或所述有利连接片段中的任一者非为可化学合成的,则鉴定在所述结构域形成片段或所述有利连接片段中的至少一结构缺失区段;
(f)利用一有利连接氨基酸残基取代在所述结构缺失区段或所述有利连接片段中的至少一氨基酸,以在所述结构缺失区段或所述有利连接片段中引入一有利连接序列,以及在所述有利连接序列处解析所述结构域形成片段的氨基酸序列;以及
(g)利用至少90%的非Gly D-氨基酸残基,以化学合成各个所述有利连接片段,从而得到所述结构域形成片段。
根据本发明的一些实施例,用于生产一镜像蛋白质的方法包括步骤(iii)。
根据本发明的一些实施例,在用于生产一镜像蛋白质的方法中,所述D-氨基酸蛋白质展现至少1%、至少5%,至少10%的所述L-氨基酸蛋白质的活性。
根据本发明的一些实施例,所述镜像蛋白质的活性是选自由催化活性、特异性结合活性,以及结构活性所组成的群组。
根据本发明的一些实施例,本文中所提供的D-氨基酸蛋白质包括至少240个、300个、400个,或至少500个氨基酸残基。
根据本发明的一些实施例,用于生产一镜像蛋白质的方法进一步包括步骤:在所述有利连接片段中的至少一者中,根据以下的疏水性顺序,利用一疏水性较弱的氨基酸取代至少一疏水性D-氨基酸残基:D-Ile>D-Leu>D-Phe>D-Val>D-Met>D-Pro>D-Trp>D-His(0)>D-Thr>D-Glu(0)>D-Gln>D-Cys>D-Tyr>D-Ala>D-Ser>D-Asn>D-Asp(0)>D-Arg+>Gly>D-His+>D-Glu>D-Lys+>D-Asp-。
根据本发明的一些实施例,相较于所述相应的L-氨基酸蛋白质的3D结构,所述D-氨基酸蛋白质基本上具有一镜像的3D结构。
根据本发明的一些实施例,用于生产一镜像蛋白质的方法进一步包括步骤:利用D-氨基酸残基取代至少一Ile残基,所述D-氨基酸残基是选自由以下所组成的群组:D-Ala残基、D-Val残基、D-Leu残基、D-Thr残基、Gly残基、D-Phe残基、D-Met残基,以及D-Pro残基。
根据本发明的一些实施例的另一方面,提供一种D-氨基酸蛋白质,所述D-氨基酸蛋白质是根据本文中所提供的方法所制得。
根据本发明的一些实施例,相较于一相应的L-氨基酸蛋白质的3D结构,所述D-氨基酸蛋白质基本上具有一镜像的3D结构(例如,一相应的生物性生产的蛋白质)。
根据本发明的一些实施例,所述D-氨基酸蛋白质包括至少两个结构域形成片段,所述结构域形成片段是非共价连接的多肽链,其中所述结构域形成片段是在至少一相应的L-氨基酸蛋白质中的共价连接的多肽链。
根据本发明的一些实施例,所述D-氨基酸蛋白质是选自由以下所组成的群组:酶、转运蛋白、结构/力学蛋白、激素、信号蛋白、抗体、体液平衡蛋白、pH平衡蛋白、细胞通道,以及细胞泵。
根据本发明的一些实施例,所述D-氨基酸蛋白质是D-氨基酸酶,相较于一相应的L-氨基酸酶,所述D-氨基酸酶能够催化一对映体反应,即使用相应的受质的对映体,催化与相应生物性生产的酶的酶促反应相当的反应,以形成相应产物的对映体。
根据本发明的一些实施例,所述D-氨基酸酶是D-氨基酸的RNA聚合酶,能够使用一L-DNA模板从L-核糖核苷酸合成L-RNA。
根据本发明的一些实施例,所述D-氨基酸的RNA聚合酶是D-氨基酸的T7 RNA聚合酶,或D-氨基酸的Pfu DNA聚合酶突变。
根据本发明的一些实施例,所述D-氨基酸的Pfu DNA聚合酶突变具有至少一突变,所述突变是选自由V93Q、E102A、D141A、E143A、Y410G、A486L及E665K所组成的群组。
根据本发明的一些实施例,所述D-氨基酸蛋白质是T7 RNA聚合酶,所述T7 RNA聚合酶包括至少一分裂位点,第一分裂位点是介于K363与P364之间,以及第二分裂位点是介于N601与T602之间。
根据本发明的一些实施例,所述D-氨基酸酶是D-氨基酸的DNA聚合酶,能够从L-脱氧核糖核苷酸合成L-DNA。
根据本发明的一些实施例,所述D-氨基酸的DNA聚合酶是D-氨基酸的Pfu DNA聚合酶。
根据本发明的一些实施例的另一方面,提供一种T7 RNA聚合酶,所述T7 RNA聚合酶包括至少两条多肽链,所述至少两条多肽链是通过介于K363与P364之间的分裂,及/或介于N601与T602之间的分裂所形成的。
在一些实施例中,本文中所提供的T7 RNA聚合酶进一步包括至少一突变,所述突变是选自由以下所组成的群组:I6V、I14L、I74V、I82V、I109V、I117L、I141V、I210M、I244L、I281V、I320V、I322L、I330V及I367L。
根据本发明的实施例的另一方面,提供一种T7 RNA聚合酶,所述T7RNA聚合酶具有一氨基酸序列,所述氨基酸序列与SEQ ID No.83具有至少80%或至少90%的序列同一性的特征。
根据本发明的一些实施例的另一方面,提供一种Pfu DNA聚合酶,所述Pfu DNA聚合酶包括至少两条多肽链,所述至少两条多肽链是通过介于K467与M468之间的分裂所形成的。所述两条多肽链不经由介于其主链之间的共价键相互连接。
在一些实施例中,所述Pfu DNA聚合酶进一步包括至少一突变,所述突变是选自由E102A、E276A、K317G、V367L及I540A所组成的群组。
在一些实施例中,本文中所提供的Pfu DNA聚合酶进一步包括至少一突变,所述突变是选自由以下所组成的群组:I38F、I62V、I65V、I80V、I127V、I137M、I158L、I171A、I176V、I191V、I197V、I198V、I205V、I206V、I228V、I232L、I244M、I256V、I264A、I268L、I282V、I331A、I401V、I434V、I446F、I478K、I557V、I598V、I605T、I611V、I619A、I631L、I643V、I648T、I656V、I677T、I716Y、I734V、I745V及I772P。
在一些实施例中,所述Pfu DNA聚合酶进一步包括至少一突变,所述突变是选自由V93Q、D141A、E143A、Y410G、A486L及E665K所组成的群组。
在一些实施例中,所述Pfu DNA聚合酶展现RNA聚合活性。
在一些实施例中,所述Pfu DNA聚合酶进一步包括多个突变,所述突变是选自由D215A、A486Y及/或L490W所组成的群组。
在一些实施例中,所述Pfu DNA聚合酶展现缺乏3’至5’核酸外切酶活性及提高的双脱氧核苷三磷酸(dideoxynucleoside triphosphate,ddNTP)选择性。
在一些实施例中,所述Pfu DNA聚合酶进一步包括DNA结合结构域,其中所述DNA结合结构域是sso7d结构域(SEQ ID No.78)。
在一些实施例中,所述经是sso7d结构域修饰的Pfu DNA聚合酶展现改善的PCR扩增活性。
根据本发明的一些实施例的另一方面,提供一种Pfu DNA聚合酶,所述Pfu DNA聚合酶具有一氨基酸序列,所述氨基酸序列与SEQ ID No.51具有至少80%或至少90%的序列同一性的特征,或所述氨基酸序列与SEQ ID No.79具有至少80%或至少90%的序列同一性的特征。
根据本发明的一些实施例的另一方面,提供一种本文中所提供的D-氨基酸蛋白质的用途,所述D-氨基酸蛋白质是酶,以及所述用途是在一产物的合成中进行催化,所述产物是通过一相应的L-氨基酸酶所合成的分子的对映体,或在一受质的反应中进行催化,所述受质是一相应的L-氨基酸酶的相应受质的对映体。
根据本发明的一些实施例的另一方面,提供一种酶促生产L-聚脱氧核糖核酸分子的方法,所述方法通过以下步骤实施:
提供D-氨基酸的DNA聚合酶,其是根据本文中所提供的方法所制得,且能够从L-脱氧核糖核苷酸合成L-DNA;以及将所述D-氨基酸的DNA聚合酶与模板L-DNA分子、L-DNA引物及多个L-脱氧核糖核苷酸进行反应,从而酶促生产所述L-DNA分子。
在所述方法方面的一些实施例中,所述D-氨基酸的DNA聚合酶是Pfu DNA聚合酶。
在所述方法方面的一些实施例中,所述Pfu DNA聚合酶基本上是如本文所提供。
根据本发明的一些实施例的另一方面,提供一种酶促生产L-多核糖核酸(L-polyribonucleic acid,L-RNA)分子的方法,所述方法通过以下步骤实施:
提供D-氨基酸的RNA聚合酶,其是根据本文中所提供的方法所制得,且能够从L-核糖核苷酸合成L-RNA;以及将所述D-氨基酸的RNA聚合酶与模板L-DNA分子、L-DNA/RNA引物及多个L-核糖核苷酸进行反应,从而酶促生产所述L-RNA分子。
在所述方法方面的一些实施例中,所述D-氨基酸的RNA聚合酶是T7RNA聚合酶,或Pfu DNA聚合酶突变,所述Pfu DNA聚合酶突变具有至少一突变,所述突变是选自由V93Q、E102A、D141A、E143A、Y410G、A486L及E665K所组成的群组。
在所述方法方面的一些实施例中,所述T7 RNA聚合酶基本上是如本文所提供。
根据本发明的一些实施例的另一方面,提供一种形成一感兴趣的分子的外消旋晶体的方法,所述方法通过以下步骤实施:将所述感兴趣的分子与所述感兴趣的分子的对映体进行共结晶,从而形成一对映体对的外消旋晶体,其中所述感兴趣的分子的所述对映体是根据本文中所呈现的方法所提供的D-氨基酸蛋白质,或此种D-氨基酸蛋白质的产物。
根据本发明的一些实施例的另一方面,提供一种分子探针,所述分子探针包括如本文中所提供的D-氨基酸蛋白质,其上连接有一标记部分,且对一分析物具有亲和力,所述分析物是一相应的L-氨基酸蛋白质的相应的分析物的对映体。
根据本发明的一些实施例的另一方面,提供一种用于生产L-核酸适体或D-肽结合部分的方法,所述方法通过以下步骤实施:
提供D-氨基酸蛋白质,其是根据本文中所呈现的方法所制得;以及
通过指数富集过程,使所述D-氨基酸蛋白质经历配体的系统进化,
从而获得所述L-核酸适体或D-肽结合部分。
根据本发明的一些实施例的另一方面,提供一种扩增DNA序列或RNA序列的方法,所述方法包括步骤:使DNA或RNA序列的模板与根据本文中所提供的方法所制得的DNA或RNA聚合酶进行反应,其中所述反应基本上是在缺乏天然酶及/或天然DNA/RNA污染的情况下进行。
根据本发明的一些实施例的另一方面,提供一种对L-DNA或L-RNA进行测序的方法,所述方法包括步骤:使用如本文所提供的D-氨基酸的DNA聚合酶或D-氨基酸的RNA聚合酶、硫代磷酸酯L-dNTPs或硫代磷酸酯L-NTPs,以及利用两种不同染剂进行5’标记的两个引物。
在一些实施例中,所述染剂是FAM及Cy5。
根据本发明的一些实施例的另一方面,提供一种数据存储系统,所述数据存储系统包括:
至少一L-核酸(例如,L-DNA、L-RNA及其任何带有D-核酸片段的嵌合体)分子,其具有编码信息数据的序列;
用于合成及/或测序所述L-核酸分子的D-氨基酸的RNA聚合酶及/或D-氨基酸的DNA聚合酶,其中所述D-氨基酸的RNA聚合酶及/或所述D-氨基酸的DNA聚合酶是根据本文中所提供的方法所制得。
在所述系统的一些实施例中,所述L-核酸分子是化学制得,或通过镜像酶催化反应所制得。在L-DNA数据存储系统的一些实施例中,所述存储信息的L-DNA片段是使用D酶通过镜像组装PCR所制得。
在所述系统的一些实施例中,所述L-核酸分子是进行化学测序,或通过使用镜像酶的边合成边测序法进行测序。
在所述系统的一些实施例中,所述D-氨基酸的RNA聚合酶是本文中所提供的T7RNA聚合酶。
在所述系统的一些实施例中,所述D-氨基酸的DNA聚合酶是本文中所提供的PfuDNA聚合酶。
根据本发明的一些实施例的另一方面,提供一种手性隐写术的方法,所述方法通过以下而实施:
至少一D-核酸分子,其具有编码覆盖信息数据的序列;
至少一L-核酸分子及/或D-/L-嵌合核酸分子,其具有编码密钥以解密隐写信息数据的序列,
D-氨基酸的RNA聚合酶及/或D-氨基酸的DNA聚合酶,其用于合成及/或测序所述L-DNA分子,其中所述D-氨基酸的RNA聚合酶及/或所述D-氨基酸的DNA聚合酶是如本文中所提供的方法所制得。
在一些实施例中,所述L-核酸分子是化学制得,或通过镜像酶催化反应所制得。
在一些实施例中,所述L-核酸分子是进行化学测序,或通过使用镜像酶的边合成边测序法进行测序。
在一些实施例中,所述D-/L-嵌合核酸分子是化学制得,或通过天然/镜像酶催化反应所制得。
在一些实施例中,所述D-/L-嵌合核酸分子的L-DNA/RNA部分是进行化学测序,或通过使用镜像酶的边合成边测序法进行测序。
在一些实施例中,所述D-氨基酸的RNA聚合酶是如本文中所提供的T7RNA聚合酶。
在一些实施例中,所述D-氨基酸的DNA聚合酶是如本文中所提供的Pfu DNA聚合酶。
在一些实施例中,所述系统可与DNA密码技术结合,使用加密数据提供额外的安全层。
根据本发明的一些实施例的另一方面,提供一种研究L-RNA水解的方法,所述方法通过以下而实施:
至少一L-RNA分子,其具有高级结构及长的序列;
D-氨基酸的RNA聚合酶及/或D-氨基酸的DNA聚合酶,其用于合成所述L-RNA分子,其中所述D-氨基酸的RNA聚合酶及/或所述D-氨基酸的DNA聚合酶是根据本文中所提供的方法所生产。
根据本发明的一些实施例的另一方面,提供一种研究RNA降解的方法,所述方法通过以下而实施:
至少一L-RNA分子,其具有高级结构及长的序列;
D-氨基酸的RNA聚合酶及/或D-氨基酸的DNA聚合酶,其用于合成所述L-RNA分子,其中所述D-氨基酸的RNA聚合酶及/或所述D-氨基酸的DNA聚合酶是根据本文中所提供的方法所生产。
在一些实施例中,所述方法可用于评估RNase抑制剂的有效性。
根据本发明的一些实施例的另一方面,提供一种转录的AND逻辑(AND-logic),所述转录的AND逻辑通过以下而实施:
D-氨基酸的RNA聚合酶,其中所述D-氨基酸的RNA聚合酶是根据本文中所提供的方法所生产。
在一些实施例中,所述D-氨基酸的RNA聚合酶是本文中所提供的T7RNA聚合酶。
在一些实施例中,所述D-氨基酸的RNA聚合酶包括至少一分裂位点,第一分裂位点是介于K363与P364之间,以及第二分裂位点是介于N601与T602之间。
在一些实施例中,所述D-氨基酸的RNA聚合酶包括至少一分裂位点,上述的位点是位于同一环中,即从位置357至位置366及/或从位置564至位置607。
根据本发明的一些实施例的另一方面,提供一种生产L-RNA标记/阶梯的方法,所述方法包括步骤:
提供D-氨基酸的RNA聚合酶,其是根据本文中所提供的方法所制得,且能够从L-核糖核苷酸合成L-RNA;以及
将所述D-氨基酸的RNA聚合酶与不同长度的各个模板L-DNA分子、L-DNA/RNA引物及多个L-核糖核苷酸进行反应,
从而分别酶促生产不同长度的L-RNA分子,且在纯化后以一特定的浓度混合在一起。
在一些实施例中,所述D-氨基酸的RNA聚合酶基本上是如本文所提供的T7 RNA聚合酶。
除非另有定义,本文中所使用的所有技术及/或科学术语具有与本发明所属领域的普通技术人员普遍理解的相同含义。尽管与本文中所述彼等相似或等同的方法及材料可用于实施或测试本发明的实施例,但示例性方法及/或材料是描述于下文中。在发生冲突的情况下,以专利说明书,包括定义为准。此外,材料、方法及实例仅是说明性的,并非一定是限制性的。
附图说明
本发明的一些实施例在此仅通过实例的方式参考附图进行描述。现在详细地具体参考附图,强调所示的细节是通过实例的方式及出于对本发明的实施例的说明性讨论的目的。在此点上,结合附图的描述使本领域的技术人员明白如何可实施本发明的实施例。
在图中:
图1是说明根据本发明的一些实施例的在本文中所提供的方法的流程图;
图2A至图2B显示突变型Pfu-N片段的合成途径的设计流程(图2A),其中引入额外的NCL位点(E102A、E276A、K317G、V367L),以形成有利连接片段,及25个异亮氨酸残基被取代,以及突变Pfu-C片段的合成途径的设计流程(图2B),其中引入额外的NCL位点(I540A),以及其他15个异亮氨酸残基的突变,而引入此等突变是为了促进在SPPS及连接过程中的蛋白质合成,并降低镜像版本的合成成本;
图3A至图3C显示369-aa(包括添加至N末端的His6标签)突变T7-分裂-N片段(图3A)、238-aa突变T7-分裂-M片段(图3B),以及282-aa突变T7-分裂-C片段(图3C)的合成途径的设计流程,包括异亮氨酸残基的替换、新的NCL及介于K363与P364之间的新分裂位点,其被引入以促进在SPPS及连接过程中的蛋白质合成,以及降低镜像版本的合成成本;
图4是说明根据本发明的一些实施例的分子数据存储的流程图,其使用L-DNA作为典型的XNA;以及
图5显示说明根据本发明的一些实施例的基于DNA的隐写术的流程图,将嵌合的D-DNA/L-DNA密钥嵌入表面是普通的D-DNA存储库中,以传达秘密信息。
具体实施方式
本发明,在其一些实施例中,涉及生物化学,更具体地,但非排他地涉及大型蛋白质及其镜像对应物的全化学合成方法及其用途。
参考附图及随附的描述可更好地理解本发明的原理及操作。
在详细解释本发明的至少一实施例之前,应理解本发明的应用不一定限于以下描述中所阐述的或通过实例举例说明的细节。本发明能够具有其他的实施例或者能够以各种方式实施或执行。
α-氨基酸-蛋白质的基本组成部分-是存在两种形式的手性分子:L-对映体(“L”代表左旋或左旋性的)及D-对映体(“D”代表右旋或右旋性的)。手性(handedness)或手性(chirality)不同的两种不可叠加形式的氨基酸是彼此的镜像,且在其他方面具有相同的物理及化学性质。然而,地球上的生命仅使用L-氨基酸及非手性氨基酸甘氨酸来构建具有多种生物功能的蛋白质。尽管存在于自然界中,特别是在细胞壁的肽聚糖中及在细菌来源的肽抗生素中、在诸如昆虫、蜗牛及两栖动物等低等动物的蛋白质中,及甚至在大脑中作为神经递质,然而人们认为在各种生物体中的D-氨基酸是通过酶催化的后转译反应,从母体L-对映体转化而来。数十年来,地球上的生命为何以及如何偏爱此等左旋分子的此一引人入胜的问题一直是化学家、物理学家、生物学家甚至天文学家激烈争论的话题。虽然α-氨基酸的同手性的起源一直是个谜,然而科学家们已经从研究仅包含手性D-氨基酸的非天然或人工的D-肽及D-蛋白质的物理化学及生物的特性中学到许多。
在将本发明付诸实施的同时,发明人推断为了在实验室中构建镜像生物学系统,核心步骤是建立分子生物学的中心法则的手性反转版本(5-7),采取利用镜像核酸及蛋白质的化学合成作为两个技术支柱(5)。本发明人推断,克服合成长的L-核酸分子的瓶颈的一方法是通过镜像聚合酶进行酶促聚合,其导致本发明的构想,并实现概念验证。尽管如此,早期版本的镜像聚合酶系统被选为全化学合成的模型,作为介于聚合酶活性与大小之间的勉强折衷(5)。诸如ASFV pol X及Dpo4(错误率在10-4至10-2的数量级)等小聚合酶固有的较差的持续合成能力及保真度,使其不适合长的镜像基因的忠实组装、扩增及转录(5、17、18、21)。
因此,本发明人已考虑一种方法,所述方法可使似乎任何蛋白质的全化学合成成为可能,及由此开启获得D-氨基酸蛋白质的途径。
根据本发明的实施例的大型蛋白质的全化学合成的方法系统地解决本领域迄今无法克服的障碍,其是基于在靶标蛋白的氨基酸序列中引入特定的突变,使得在不使蛋白质的比活性无效的情况下,长度问题得到缓解。
分裂蛋白质设计:
本发明人已推断利用分裂蛋白质设计可彻底地简化化学合成大型蛋白质的问题,使其合成两个或更小的蛋白质片段,此等片段可在体外共同折叠成一功能完整的酶。此外,分裂蛋白质策略将允许各个分裂蛋白质片段的合成、纯化、连接及脱硫并行进行,大量降低合成大型蛋白质所需的总时间,以及当某些片段发生故障时,降低用于校正的成本及时间。一些酶具有天然或工程分裂版本,包括Pfu DNA聚合酶;例如,在手指结构域的卷曲螺旋基序中的介于K467与M468之间的已知分裂位点,将聚合酶分成两个片段(一个467-aa Pfu-N片段及一个308-aa Pfu-C片段,而不会显着改变其PCR活性及保真度。上述的分裂位点亦可选择在Pfu DNA聚合酶的手指结构域的卷曲螺旋基序中的上述序列位置的附近,例如,介于位置449与位置498之间。
因此,根据本发明的一些实施例,化学性生产蛋白质的方法包括步骤:将蛋白质的氨基酸序列分裂成至少两个结构域形成片段,当形成结构域的片段在折叠有利的条件下共同归档时,各个片段皆足够短,以通过连接较小的多肽片段进行化学合成,但又足够长,以折叠为功能性蛋白质的功能性结构域。
根据本发明的一些实施例,倘若结构域形成片段是可通过SPPS或AFPS进行化学合成,或者长度为约120、150或200个氨基酸残基或更短,其通常意味着其可被化学合成的,且适合用于与其他的结构域形成片段进行共同折叠,从而获得蛋白质。
如本文中所使用,术语“可化学合成的”主要是指可通过任何非生物合成过程而得到的多肽的长度,所述非生物合成过程例如固相肽合成(solid phase peptidesynthesis,SPPS)或自动快速流肽合成(automated fast-flow peptide synthesis,AFPS)。一般而言,已知长度为约10至120个氨基酸残基的多肽可通过固相肽合成(solidphase peptide synthesis,SPPS)生产,以及长度为约10至180个氨基酸残基的多肽可通过自动快速流肽合成(automated fast-flow peptide synthesis,AFPS)提供。在一些实施例中,术语“可化学合成的”指长度为约120、150或200个氨基酸的多肽链。在一些实施例中,术语“可化学合成的”亦指纯化及任选地分离化学合成的多肽的能力。
倘若结构域域形成片段的长度较适合化学合成的长度为长,则其会被进一步分割成有利连接片段,此等片段被连接形成(相对较长的)结构域形成片段。
在本发明的实施例的内文中,术语“片段”在本文及全文中与术语“域形成片段”互换使用。如本文中所使用,如同此术语在本领域中已知,术语“结构域形成片段”是指折叠成可识别的蛋白质结构域的连续多肽链。根据一些实施例,当多肽在体内或在生物/生理条件下折叠时,结构域形成片段可在体外折叠成一或多个结构域,此等结构域与此等结构域的结构相似或基本相同。
在本发明的实施例的内文中,结构域形成片段可为多结构域蛋白质或包括一单一可识别结构域。结构域的识别或鉴定是在本领域普通技术人员的能力范围内,且通常使用一或多种可公开取得的生物信息学工具来完成,例如多序列比对、SCOP[scop(dot)berkeley(dot)edu/]、CATH[www(dot)cathdb(dot)info]、ExPASy[www(dot)expasy(dot)org]、BLAST[blast(dot)ncbi(dot)nlm(dot)nih(dot)gov]、PFAM[pfam(dot)xfam(dot)org]、PDB[www(dot)rcsb(dot)org]等,所有此等皆在本领域技术人员的能力范围及辨别力内。
如上文所讨论,一些蛋白质是天然地由多于一条多肽链所构成,其等同于本文中所讨论的多结构域或结构域形成片段。可在本文中所提出的方法中以此种天然的或意图的分裂成结构域形成片段。
一些蛋白质可由一条连续的多肽链构建而成,然而,其进化家族成员可包括一些已进化为由多于一条多肽链构建的蛋白质。有关可能分裂的信息可来自家族成员的多序列比对,以及为了化学生产而意图分裂感兴趣的蛋白质的家族成员。关于可选的分裂位点的另一信息的来源可来自感兴趣的蛋白质或蛋白质的家族成员的结构信息,在结构比对的协助下,表明在蛋白质中的某些部分保留较少,因此倘若意图将一分裂位点引入序列中,预计不会破坏蛋白质的活性。
在蛋白质中可作为可能的分裂位点的区段在本文中称为结构缺失区段,无论导致其识别的信息是否来自序列数据及/或结构数据。因此,“结构缺失区段”可通过使用多序列比对及/或从感兴趣的蛋白质的结构信息及/或从蛋白质家族的成员中识别出来。
根据本发明的一些实施例,倘若蛋白质的长度太长而实际上无法直接通过SPPS或通过组合SPPS与连接进行化学生产,则可将一分裂位点引入感兴趣的蛋白质的序列中,期望一旦化学合成,结构域形成片段将共同折叠至蛋白质中。
化学连接:
如同在将本发明付诸实施时所发现,即使蛋白质可通过共同折叠实现,在实施分裂设计方法之后,各个结构域形成片段或结构域形成片段中的一者可能长度太长而无法通过化学合成实现。
天然化学连接(Native chemical ligation,NCL)是化学连接领域的延伸,是构建由两个或多个未被保护的肽片段进行组装所形成的大型多肽的概念。特别是,NCL是一种强大的连接方法,可用于合成天然骨架蛋白或中小型修饰蛋白。在天然化学连接中,未被保护的肽的N末端半胱氨酸残基的硫醇基攻击第二个未被保护的肽的C末端硫酯。此种可逆的转硫酯化步骤具有化学选择性及区域选择性,并导致形成一硫酯中间体。此中间体通过分子内S,N-酰基转移进行重排,导致在连接位点处形成天然酰胺(肽)键。
在本发明的实施例的内文中,术语“有利连接序列”是指在蛋白质序列中的位置,其展现可通过NCL形成的氨基酸序列。例如,N-末端半胱氨酸残基可用于在已知条件下实现化学连接。有利连接序列的鉴定及开发完全在本领域任何普通技术人员的能力范围内,且额外的信息很容易在文献中取得(例如,评论文章“天然化学连接及延长方法:机制、催化作用、范围及限制”,阿古里达斯,V.等人[Chem Rev.2019,119(12),pp.7328-7443])。
因此,根据本发明的一些实施例,可通过首先鉴定在蛋白质的氨基酸序列中的有利连接序列,之后在此等有利连接序列处解析所述序列,从而获得蛋白质的多个有利连接序列的序列,各个序列皆足够短,可有效地进行化学合成及纯化。可被化学合成的各个有利连接片段随后进行连接,以形成蛋白质或结构域形成片段。
一般而言,根据本发明的一些实施例,有利连接序列/片段是可化学合成的,或约10个至120个、约10个至150个或约10个至200个氨基酸的长度。
倘若蛋白质在所需位置处未显示有利连接序列,基于片段的长度,可通过蛋白质的氨基酸序列的突变来引入有利连接序列。因此,根据本发明的一些实施例,倘若多个有利连接片段中的任何一者非为可化学合成的,即长度大于约120、150或200个氨基酸残基,或具有无法有效合成及纯化的其他的长度,则所述方法通过以下步骤来实现:鉴定在有利连接序列中的至少一结构缺失区段、利用有利连接氨基酸残基来取代在所述结构缺失区段中的至少一氨基酸,以在所述结构缺失区段中引入一有利连接序列,随后在突变所提供的有利连接序列处解析蛋白质的氨基酸序列,之后进一步化学合成各个所述有利连接片段。
例如,单独合成具有467个氨基酸(54kDa)的Pfu-N片段,其相较于具有352个氨基酸(40kDa)的Dpo4更大,仍然具有相当大的挑战。挑战之一是通过SPPS所制备的合成肽的NCL需要在连接位点处的N末端半胱氨酸残基,而野生型(wild-type,WT)Pfu DNA聚合酶仅具有四个半胱氨酸残基(在Pfu-N片段(SEQ ID No.57)中的C429及C443);在Pfu-C片段(SEQID No.67)中的C507及C510)。尽管发明人利用先前报道的基于金属自由基的脱硫方法,在NCL之后将未被保护的半胱氨酸转化为丙氨酸残基,从而使具有丙氨酸残基的另外八个连接位点(在Pfu-N片段中的A40、A163、A223及A408;在Pfu-C片段中的A501、A596、A652及A715)亦可被使用,一些肽片段仍然太长,而无法通过SPPS来制备。因此,发明人基于序列比对设计具有五个点突变(在Pfu-N片段中的E102A、E276A、K317G及V367L;在Pfu-C片段中的I540A)的突变版本的Pfu DNA聚合酶,以引入额外的连接位点,或有利连接序列,而不显着改变聚合酶的PCR活性(分裂Pfu-5m;SEQ ID No.48)。
疏水性及体积:
另一挑战是在水性条件下合成及连接疏水性肽片段。目前克服此问题的方法主要集中在对目标肽引入各种突变及/或化学修饰,以降低高度疏水性及/或庞大的氨基酸残基的数量。根据本发明的一些实施例,化学修饰会受到例如Hmb-Nα-保护、可去除增溶标签、假脯氨酸及缩酚酸肽(O-酰基异肽)的影响,尽管其实际使用通常受到费力程序、低产率,以及需要昂贵的氨基酸衍生物的限制。
根据本发明的一些实施例,为了促进化学合成、连接及共同折叠化学生产的蛋白质的各个片段,一些高度疏水性及/或庞大的残基被替换(突变)为疏水性较低及/或体积较小的残基,其中此类替换的标准可依赖于MSA、结构信息及其他的突变数据。
疏水性及体积虽然彼此相关,且在大多数情况下是齐头并进的,但不一定是相同的特性,因为此等特性在不同的环境下可能会有所不同,具体取决于pH值、离子强度、抗衡离子、水活性、温度及其他的因子。在文献中的不同参考文献对在多肽链中的氨基酸残基的疏水性及体积给出略微不同的数值及排序,尽管异亮氨酸是“体积最大及疏水性最强的氨基酸中的一者”的一般概念是正确的。与疏水性及体积相关的信息的示例性来源包括,但不限于,凯特,J.及杜立特,R.F.,“显示蛋白质的亲水特性的简单方法”[J.Mol.Biol.,1982,157(1),pp.105-132]及艾灵顿,A.及俊利,J.M.,“氨基酸的特征”[Curr Protoc Mol Biol,2001,A.1C.1-A.1C.12]。例如,本发明的实施例可基于以下的标准来突变氨基酸:根据以下非限制的示例性顺序来降低体积的标准:I>L>C>T>V>P>S>A>G,以及根据以下非限制的示例性顺序的疏水性的标准:I>V>L>F>C>M>A>G>T。
通常,如本领域已知的,残基置换指南是依照以下的疏水性顺序进行:Ile>Leu>Phe>Val>Met>Pro>Trp>His(0)>Thr>Glu(0)>Gln>Cys>Tyr>Ala>Ser>Asn>Asp(0)>Arg+>Gly>His+>Glu>Lys+>Asp-。
当本文中所提供的方法是用于化学合成D-氨基酸蛋白质时,根据其一些实施例,所述方法进一步包括步骤:依照以下的疏水性顺序:D-Ile>D-Leu>D-Phe>D-Val>D-Met>D-Pro>D-Trp>D-His(0)>D-Thr>D-Glu(0)>D-Gln>D-Cys>D-Tyr>D-Ala>D-Ser>D-Asn>D-Asp(0)>D-Arg+>Gly>D-His+>D-Glu>D-Lys+>D-Asp-,利用疏水性较低的氨基酸来取代在至少一有利连接片段中的至少一疏水性D-氨基酸残基。
例如,Pfu-C-4片段在乙腈水溶液或6M Gn·HCl溶液中溶解性差,因此难以通过标准的Fmoc-SPPS来合成。据估计,异亮氨酸是体积最大、疏水性最强的蛋白质氨基酸中的一者,因此将在疏水性肽中的异亮氨酸突变为替代可能体积较小或疏水性较小的氨基酸(例如,缬氨酸、丙氨酸、亮氨酸、苏氨酸、甘氨酸、苯丙氨酸、甲硫氨酸或脯氨酸等),或将一或多种其他的大体积或疏水性氨基酸(例如,缬氨酸、苏氨酸、苯丙氨酸及亮氨酸等)突变为其他体积较小或疏水性较小的氨基酸,例如极性更大的氨基酸,应该会改变此肽片段的物理化学特性。
根据本发明的一些实施例,基于序列比对及结构信息开发一种系统的异亮氨酸取代的方法,以突变在此片段中的所有七个异亮氨酸残基(I598V、I605T、I611V、I619A、I631L、I643V及I648T)而不会显着改变聚合酶的PCR活性。事实上,存在此七个点突变,此肽片段的合成是容易实现的,其亦可溶于乙腈水溶液及6M Gn·HCl溶液中,以用于下游的纯化及NCL,使得无需对其合成而求助于其他的化学修饰。
降低成本:
除了技术挑战之外,由于整体产量低及试剂成本高,大型镜像(D-氨基酸)蛋白质的合成亦面临经济障碍。虽然所有的蛋白原氨基酸的镜像版本皆可在市场上取得,且大多数价格与其天然对应物的价格相似,然而D-异亮氨酸较L-异亮氨酸及其他的D-氨基酸贵50至300倍,其主要是由于两个手性中心的存在,使其合成及纯化困难且有损耗,在合成镜像蛋白质时,占D-氨基酸成本的80%至90%(取决于在天然蛋白质中的异亮氨酸的丰度,通常约为5%)。因此,根据本发明的一些实施例,基于序列比对及结构信息,将系统性异亮氨酸取代的方法应用于将在Pfu DNA聚合酶中的大量(71个中的41个,或58%)异亮氨酸突变为其他的氨基酸,例如缬氨酸、亮氨酸及丙氨酸等,而不显着改变聚合酶的PCR活性(分裂Pfu-5m-30I;SEQ ID No.51)。
系统性降低Ile的方法导致合成此种聚合酶的D-氨基酸的成本降低约一半,其可能有利于其在未来的大规模合成及应用。
根据一些实施例,化学性生产D-氨基酸蛋白质的方法包括步骤:利用Ala残基、Val残基、Leu残基、Gly残基、Thr残基、Phe残基、Met残基或Pro残基取代至少一Ile残基。因此,所得的D-氨基酸蛋白质,部分或所有的Ile残基位置展现非Ile D-氨基酸残基,所述非IleD-氨基酸残基是选自由D-Ala残基、D-Val残基、D-Leu残基、Gly残基、D-Thr残基、D-Phe残基、D-Met残基及D-Pro残基所组成的群组。
一种大型蛋白质的全化学合成的方法:
如上所述,并在以下的实例部分中证实,90-kDa高保真D-氨基酸的Pfu DNA聚合酶的全化学合成是通过实施本文中所提供的方法来提供,并进行忠实的写入及读取L-DNA序列,以及千个碱基大小的镜像基因的准确组装。天然酶蛋白质的平均大小约为300个至500个氨基酸,对应的编码基因序列约为0.9kb至1.5kb。因此,合成与Pfu DNA聚合酶相同尺寸的酶蛋白的镜像版本,并依次组装长的镜像基因的能力是一关键的使能技术,且亦是构建镜像生命形式的重要垫脚石。从第一代镜像聚合酶ASFV pol X、第二代Dpo4,至目前的第三代Pfu DNA聚合酶,随着技术的进步,大型镜像蛋白质的全化学合成利用大自然提供的最好的酶促工具已成为现实。此等高效的下一代镜像酶为实现更复杂的镜像生物学系统及扩展生物技术及医学的分子工具箱开启新的机会之门。
因此,根据本发明的一些实施例的一方面,提供一种用于相对大型及功能性蛋白质的全化学合成的方法,其通过连接所述蛋白质的至少两个有利连接片段来实现,其中各个有利连接片段是可化学合成的,或者对于SPPS而言通常是长度约10个至120个氨基酸残基;有利连接片段可通过以下方式获得:
(i)鉴定在蛋白质的氨基酸序列中的至少一有利连接序列;在此等有利连接序列处解析(划分)所述蛋白质的氨基酸序列,从而得到多个有利连接片段的序列。根据一些实施例,至少一天然存在的有利连接序列是存在于蛋白质的结构缺失区段中。
(ii)倘若各个有利连接片段的序列可通过SPPS及/或AFPS而被有效合成及有效纯化,则各个有利连接片段可被化学合成且准备用于连接。
(iii)倘若有利连接片段的任何一序列非为可化学合成的,即长度大于约120个、150个或200个氨基酸残基,或无法有效合成及纯化的其他的长度,则分析此等序列以鉴定其中至少有一结构缺失区段,此种分析已描述于上文中且是本领域已知的。为了通过突变来引入一有利连接序列,将在结构缺失区段中的至少一氨基酸替换为一有利连接氨基酸残基(例如,半胱氨酸),以在结构缺失区段中引入一有利连接序列。此后,蛋白质的氨基酸序列在此种新引入的有利连接序列处被分割(解析),且所得到的短于120个氨基酸的有利连接片段是化学合成的。
如上文中所讨论,利用现有的或将分裂位点引入蛋白质的氨基酸序列中,促进蛋白质的全化学合成。因此,根据本发明的一些实施例,所述方法进一步包括步骤:在上文中所述的步骤(i)之前,将蛋白质的氨基酸序列分裂成至少两个结构域形成片段,倘若各个结构域形成片段是可化学合成的(长度约120个、150个或200个氨基酸残基或更少),则化学合成各个结构域形成片段,之后共同折叠此等结构域形成片段,从而获得所述蛋白质。
根据一些实施例,如上文中所讨论,倘若一结构域形成片段是不可化学合成的(例如,长度大于约120个、150个或200个氨基酸残基),或具有无法有效合成及纯化的其他的长度,则将其进一步分割为多个有利连接片段。
优选地,所述结构域形成片段是在其中的结构缺失区段处进行解析,首先鉴定在结构域形成片段内的结构缺失区段,之后鉴定在结构缺失区段中的至少一有利连接序列,以及解析在此等有利连接序列处的结构域形成片段的氨基酸序列。同样,如上文所述,倘若片段或结构缺失区段基本上缺乏有利连接序列,则可通过突变引入有利连接序列。一旦所述结构域形成片段被解析为有利连接片段的可化学合成的(针对SPPS是约10个至120个氨基酸,针对AFPS是约10个至180个氨基酸)序列,后者被化学合成并连接,以形成结构域形成片段。
图1以流程图的形式说明本文中所提供的方法,其中在“方框1”中用户选择一感兴趣的蛋白质,所述感兴趣的蛋白质的一些蛋白质家族及结构信息优选地是可取得,在“方框2”中,所述方法要求使用MSA及结构数据,以鉴定结构缺失区段,以引入有利连接氨基酸、分裂位点及Ile残基替换的突变;倘若感兴趣的蛋白质是短于约400个氨基酸,在“方框3”中,所述方法要求通过寻找以将蛋白质的序列解析为有利连接片段,及/或通过发现或突变为有利连接氨基酸来引入有利连接序列,从而形成多个有利连接片段的序列,各个序列皆是可化学合成的;倘若感兴趣的蛋白质的长度大于约400个氨基酸,则在“方框4”中,所述方法要求寻找或引入至少一分裂位点,以形成各个小于约400个氨基酸的结构域形成片段,以及在“方框5”中,所述方法要求通过寻找及/或引入有利连接序列,将各个结构域形成片段的序列解析为有利连接片段,从而形成多个有利连接片段的序列,各个序列皆是可化学合成的;在“方框6”中,基于根据MSA及/或结构信息的序列保存标准,所述方法要求替换在各个结构域形成片段或产生的有利连接片段中的疏水性氨基酸;倘若感兴趣的蛋白质是D-氨基酸蛋白质,“方框7”要求突变尽可能多的Ile残基,由于MSA及/或结构信息允许在各个结构域形成片段或产生的有利连接片段中具有相似的氨基酸;以及在“方框8”中,所述方法要求使用D-氨基酸合成所有的有利连接片段,并相应地连接此等片段;倘若感兴趣的蛋白质是L-氨基酸蛋白质,“方框9”要求使用L-氨基酸合成所有的有利连接片段,并相应地连接全部;以及最后,在“方框10”中,所述方法要求共同折叠所有结构域形成片段,以提供感兴趣的蛋白质。
在本发明的一些实施例中,所述方法需要突变感兴趣的蛋白质的氨基酸序列的步骤,以使其适合全化学合成。此种要求可能是由于感兴趣的蛋白质的长度过长,在此种情况下,需要突变以引入在相应的生物性表达蛋白质中不存在的分裂位点,或不存在于相应的生物性表达蛋白质的有利连接序列,并且需要其来提供有利连接片段,此等片段被定义为足够短而能通过SPPS(或用于生产多肽的其他的化学方法)实现。此种要求可能是由于有利连接片段的过度疏水性,使得多肽更难在水性条件下合成及连接,而降低其疏水性将使其更适合此项任务。
在本发明的一些实施例中,所述方法需要突变感兴趣的蛋白质的氨基酸序列的步骤,以使其降低总化学合成的成本,特别是当将蛋白质实现为D-氨基酸蛋白质时,即其相应的生物性生产的(或表达的)蛋白质的镜像,即等效的L-氨基酸蛋白质。
在本发明的实施例的内文中,术语“相应的蛋白质”、“相应的生物性生产的蛋白质”、“相应的生物性表达的蛋白质”可互换使用,指的是基本上与本文提供的方法所生产的蛋白质在功能上及结构上有一定程度等同的蛋白质,除了其生产过程及氨基酸序列之外,如上文所讨论,其可能会在运行本文所提供的方法的过程中发生突变。在镜像蛋白质的情况下,术语“相应的L-氨基酸蛋白质”类似于术语“相应的生物性生产的蛋白质”,加上与等效的L-氨基酸蛋白质相比较的结构倒置。因此,通过本文提供的方法所产生的D-氨基酸蛋白质与其等效蛋白质相关:通过具有基本相似的序列,除了:引入分裂位点以提供结构域形成片段的可能的突变,及/或引入有利连接序列的可能的突变,及/或用于降低Ile残基的数量的可能突变,及/或可能的突变以减少Ile残基的数量;通过具有由至少90%的非Gly D-氨基酸残基,而非L-氨基酸残基所组成的组合物;通过具有基本上倒置的(镜像)结构;以及通过具有相似的活性,除了具有镜像配体、受质、产物等。根据本发明的一些实施例,此等序列、组合物、结构及活性在某种程度上亦存在于化学性生产的蛋白质与其相应的生物性生产的蛋白质之间,只是两者是由L-氨基酸残基所组成,因此在结构及活性方面,彼此非为镜像。
化学合成蛋白质的部分方法包括步骤:在连接之后,或多个化学合成链进行连接及共同折叠之后,纯化及分离所得蛋白质。纯化的步骤准则可为用于此种蛋白质纯化工作的任何已知的步骤准则,以及在靶标蛋白质是热稳定的某些情况下,所述步骤准则可利用此种热稳定性包括加热步骤,即所述步骤准则包括合成/连接步骤,随后通过一折叠步骤,之后进一步进行热沉淀步骤,作为最终结果的纯化的一部分。所述热沉淀温度通常设置在介于靶标蛋白的最高稳定温度与大多数杂质(错误折叠的多肽链及错误氨基酸序列的多肽链)的最低沉淀温度之间。例如,在Pfu DNA聚合酶的情况下,最高稳定温度约为95℃,因此热沉淀温度是设置为约85℃。在Dpo4的情况下,最大稳定温度约为86℃,因此热沉淀温度是设置为约78℃。沉淀的(不耐热的)杂质通常通过超速离心及/或过滤而被去除,而正确折叠的耐热蛋白质是存在于上清液中,且可从上清液中被分离出来。本文中提及进行多轮的折叠及热沉淀,以提高正确折叠蛋白质的总产量,其中从先前数轮的折叠及热沉淀中所沉淀的蛋白质不会如同在此种程序中经常进行的程序而被丢弃,而是要经过额外数轮的重新折叠及重新加热沉淀。
除上述之外,本发明的范围包括其中生物性生产的蛋白质及/或蛋白质片段是被用于诱导合成性生产的蛋白质及/或蛋白质片段的正确折叠的情况。因此,根据本发明的一些实施例,亦通过与生物性生产的蛋白质或其片段进行共同折叠,来提供合成的蛋白质及其片段,而最终结果可能是嵌合的多片段/结构域蛋白质,所述嵌合的多片段/结构域蛋白质具有生物性生产的部分及合成性生产的部分。
化学性合成的蛋白质:
根据本发明一些实施例的一方面,提供一种蛋白质,所述蛋白质是通过本文中所公开的方法进行化学合成而得。在一些实施例中,化学性生产的蛋白质的长度为至少约240个氨基酸残基,或长度为至少约250个氨基酸残基,或长度为至少约300个氨基酸残基,或长度为至少约350个氨基酸残基,或长度为至少约400个氨基酸残基,或长度为至少约450个氨基酸残基,或长度为至少约500个氨基酸残基,或长度为至少约550个氨基酸残基,或长度为至少约600个氨基酸残基。
化学性合成的蛋白质可为任何感兴趣的蛋白质,且作为酶、转运蛋白、结构/力学蛋白、激素、信号蛋白、抗体、体液平衡蛋白、pH平衡蛋白、细胞通道,或细胞泵等。
化学性合成的蛋白质与其生物性及/或重组生产的对应物同样具有功能,在本文中亦称为一相应的生物性生产的蛋白质。化学性生产的蛋白质保留所述相应的生物性生产的蛋白质的至少5%的活性。在一些实施例中,化学性生产的蛋白质保留所述相应的生物性生产的蛋白质的至少1%、5%、10%、20%、30%、40%、50%、60%、70%、80%或至少90%的活性。
通过保留相应的生物性生产的蛋白质的至少一定百分比的活性,此意味着倘若生物性生产的蛋白质展现催化活性、特异性结合活性及/或任何结构相关的活性,则本发明的相应的化学性生产的蛋白质展现至少5%的此活性。在D-氨基酸蛋白质的情况下,当相较于其相应的L-氨基酸蛋白质时,无论是化学性及/或生物性提供,使用对应于对映体的蛋白质的适当/对应的对映体受质、对映体反应物、对映体试剂等来定义、评估及检测活性。
根据本发明的一些实施例,相较于D-氨基酸蛋白质的相应的生物性生产的L-氨基酸蛋白质的3D结构,D-氨基酸蛋白质展现基本上镜像的3D结构。当生产D-氨基酸蛋白质时,在本文中亦称为镜像蛋白质(相对于其相应的L-氨基酸蛋白质,或天然存在的蛋白质),其意味着其是是在有利连接片段的化学生产中使用至少75%、80%、90%或至少95%的非GlyD-氨基酸残基所生产的。
当提及包括至少两个结构域形成片段的蛋白质时,其意味着根据本发明的实施例,所得到的化学性生产的蛋白质包括至少两个非共价连接的多肽链(非经由主链原子连接),各个相应于一结构域形成片段。在一些实施例中,相应的结构域形成片段是在生物性生产的蛋白质的至少一相应的家族成员中共价连接多肽链。
在本文中指出一旦将合成的L-/D-蛋白质用于任何反应,即可分离反应混合物,并通过亲和性纯化来回收合成的蛋白质,并在未来的反应中重复使用,或者用于其稀有且昂贵的氨基酸残基。例如,可利用任何已知的亲和性标签,例如,His6标签来生产合成的蛋白质,且在使用之后,反应混合物可与相应的亲和性树脂或珠子一起培养,在此等亲和性树脂或珠子上,合成的L-/D-酶从反应混合物中分离出来。
通过所述方法所制备的示例性蛋白质:
根据本发明一些实施例的另一方面,提供一种蛋白质,所述蛋白质的长度至少为约240、300、350、400、500或更多个氨基酸残基,且是根据本文所提供的方法产生。蛋白质可为L-氨基酸蛋白质或D-氨基酸蛋白质,其取决于在相应的有利连接片段的化学合成中所使用的氨基酸,例如通过SPPS。
以下表1及表2列出可用于本发明的遗传编码氨基酸(表1)及非常规的/经修饰的氨基酸的非限制性实例(表2)。
表1
表2
表2(续)
为了证明蛋白质的全化学合成的方法,本发明人合成活性酶,所述活性酶能够催化由其相应的生物性生产的酶所催化的反应。此等酶中的一者是RNA聚合酶,能够使用DNA模板从核糖核苷酸合成RNA。在以下的实例部分中,示例性RNA聚合酶是T7 RNA聚合酶。在另一实例中,所述酶是DNA聚合酶,其能够从脱氧核糖核苷酸合成DNA。在以下的实例部分中,示例性DNA聚合酶是Pfu DNA聚合酶。
当本文中所提供的方法用于生产D-氨基酸的RNA聚合酶时,此种独特的镜像酶能够使用L-DNA模板,从L-核糖核苷酸合成L-RNA。例如,D-氨基酸的RNA聚合酶是D-氨基酸的T7 RNA聚合酶。
如下文所示,使用WT位置编号方案来制备具有至少一分裂位点的D-氨基酸的T7RNA聚合酶,第一分裂位点是介于K363与P364之间,以及第二分裂位点是介于N601与T602之间。或者,通过本文提供的方法所生产的D-氨基酸的T7 RNA聚合酶以及L-氨基酸的T7 RNA聚合酶包括至少两条多肽链,所述至少两条多肽链是由介于K363与P364之间的分裂及/或介于N601与T602之间的分裂所形成。此外,所述分裂位点可潜在地选择在同一环中的上述位点的附近,即从位置357至位置366及/或从位置564至位置607。
根据本发明的一些实施例,根据本文提供的方法所生产的T7 RNA聚合酶可进一步包括至少一突变,所述突变是选自由以下所组成的群组:I6V、I14L、I74V、I82V、I109V、I117L、I141V、I210M、I244L、I281V、I320V、I322L、I330V及I367L。通过用另一兼容的D-氨基酸残基替换昂贵的D-Ile残基,因此此等突变有利于成本降低策略。
根据本发明的一方面,提供一种D-或L-氨基酸T7 RNA聚合酶,其是通过本文提供的方法生产,具有与SEQ ID No.83相同的氨基酸序列,或具有与SEQ ID No.83具有至少80%至90%的序列同一性。
当本文中所提供的方法是用于产生D-氨基酸的DNA聚合酶时,此独特的镜像酶能够从L-脱氧核糖核苷酸合成L-DNA。例如,D-氨基酸的DNA聚合酶是D-氨基酸的Pfu DNA聚合酶。
因此,根据本发明的另一方面,提供一种Pfu DNA聚合酶,其包括至少两条多肽链,所述至少两条多肽链是由介于K467与M468之间的分裂所形成,而位置编号是基于相应的WT酶的氨基酸位置编号。在本文中应注意,可在此位点的附近选择其他的分裂位点,即,在PfuDNA聚合酶的手指结构域的卷曲螺旋基序中,例如,介于位置449与位置498之间。
根据一些实施例,本文中所提供的合成的Pfu DNA聚合酶进一步包括至少一突变,所述突变是选自由E102A、E276A、K317G、V367L及I540A所组成的群组。根据其他的实施例,本文中所提供的Pfu DNA聚合酶进一步包括至少一突变选,所述突变是选自由V93Q、D141A、E143A、Y410G、A486L及E665K所组成的群组。
根据本发明的一方面,提供一种D-或L-氨基酸的Pfu DNA聚合酶,其具有或不具DNA结合结构域(SEQ ID No.78),其是通过本文提供的方法所生产,具有一氨基酸序列,所述氨基酸序列是选自由以下所组成的群组:SEQ ID No.48、SEQ ID No.49、SEQ ID No.50、SEQ ID No.51、SEQ ID No.74、SEQ ID No.75、SEQ ID No.76、SEQ ID No.77及SEQ IDNo.79,或与SEQ ID No.51具有至少80%至90%的序列同一性。
生物正交数据存储:
全球产生数据的速度越来越快,因此越来越需要可靠的高密度媒体来保存大量的信息。天然DNA经过精心进化以编码、存储及传播信息。
在存储在DNA中,选择在紧密排列的染色体中编码大量基因组指令的自然界的分子,已成为一种有前途的解决方案(1-3)。另一方面,镜像DNA特别适用于生物正交信息存储的任务,为此目的,L-DNA数据存储及检索方法必不可少,但在很大程度上仍未得到探索。
本发明人已考量具有相同信息容量的手性反转(镜像)DNA具有避免生物降解及污染的独特能力,因此可用作高度稳健的生物正交数据存储库。在将本发明付诸实施的同时,根据本发明的一些实施例,化学合成90-kDa的高保真D-氨基酸的Pfu DNA聚合酶,其用于L-DNA序列的忠实写入及读取。
本发明人已证明本发明的一些实施例的一方面,在镜像DNA中存储整段数字文本。从以下的实例部分可看出,在未经纯化的环境水样中携带微量信息的L-DNA条形码在数月乃至更长时间内保持稳定且可放大。此外,根据本发明的一些实施例所生产的高保真D-聚合酶能够准确的组装全长千个碱基大小的镜像基因,其是实现镜像转译及建立镜像-图像中心法则的必要步骤。下一代的镜像酶促工具的成功合成,以及长的镜像基因的组装,改变镜像生物系统的发展及其新兴应用的探索。
简而言之,DNA本质上是一种数据存储分子。其包含细胞(或一整个有机体)维持自身所需的所有的指令。此等指令存在于基因中,所述基因是由特定的核苷酸序列所组成的DNA片段。为了实施,基因中所包含的指令必须被表达或复制成一种形式,细胞可使用此种形式来产生维持生命所需的蛋白质。存储在DNA中的指令是由细胞利用两个步骤进行读取及处理:转录及转译。此等步骤中的各步骤皆是涉及多个分子的独立生化过程。在转录过程中,细胞的DNA的一部分作为产生RNA分子的模板。在某些情况下,新产生的RNA分子本身即为一产物,且其在细胞内扮演重要功能。在其他的情况下,RNA分子将信息从DNA传送至细胞的其他部分以进行处理。大多数情况下,此信息是用于制造蛋白质。将存储在DNA中的信息携带至细胞的其他区域的特定类型的RNA称为信使RNA,或mRNA。
图4是说明根据本发明的一些实施例的分子数据存储的流程图,使用L-DNA作为示例性类型的XNA。
因此,根据本发明的实施例的一方面,提供一种形成双正交数据存储聚合物的方法,其使用D-氨基酸的RNA聚合酶或D-氨基酸的DNA聚合酶,以及L-核糖核酸或L-脱氧核糖核酸,其中所述聚合酶是根据本文提供的方法所生产。
根据本发明的实施例的另一方面,提供一种形成双正交数据存储聚合物的方法,其分别使用本文提供的D-氨基酸的RNA聚合酶或本文提供的D-氨基酸的DNA聚合酶,以及L-核糖核酸或L-脱氧核糖核酸。
根据本发明的实施例的另一方面,提供一种解码双正交数据存储聚合物的方法,其使用通过本文提供的方法所生产的至少一D-氨基酸蛋白质,其中所述双正交数据存储聚合物包括L-核糖核酸或L-脱氧核糖核酸残基。
根据本发明的实施例的又一方面,提供一种双正交数据存储系统,包括至少一L-DNA,基本上如前所述,所述L-DNA使用四个字符A、T、G及C来编码在其序列中的信息数据、用于合成L-DNA(将代码写入DNA序列)及/或用于测序(读取在DNA序列中的代码)L-DNA的D-氨基酸的RNA/DNA聚合酶。
本文中指出,本发明的范围意在包括使用其他类型的非天然存在的或非典型的核苷酸及其聚合物,在本文及本领域中称为“异种核酸(Xeno Nucleic Acid)”或XNA。因此,根据本发明的一些实施例,此处提供的用于生产及使用分子数据存储的系统及方法包括XNA的使用,例如彼等所讨论的:埃列梅耶娃,E及赫德温,P.,在出版物中“非典型的遗传物质”[Current Opinion in Biotechnology,2019,57,pp.25-33],以及查普特,J.C.等人[Chem.Biol.,2012,21;19(11),pp.1360-71]。
L-DNA的忠实组装、扩增及测序可为生物正交信息存储、环境及食品条形码、医疗植入物监控、法医调查以及安全信息传递提供令人兴奋的机会,此等是早期版本的镜像-图像聚合酶系统,例如,ASFV pol X或Dpo4,因为它们对于少量携带信息的L-DNA分子的扩增及测序而言效率太低且容易出错(5,17,18,21)。未来的镜像基因及甚至整个基因组的精确组装亦可使所述系统适用于生产天然生物的镜像基因组备份副本,以用于基因组库及星际运输目的。
镜像核糖体:
建立镜像中心法则的下一步是通过构建一功能性镜像核糖体来实现镜像转译。尽管本发明人最近通过将合成的L-DNA模板转录为120nt的全长5S rRNA,来克服L-RNA化学合成(通常小于约70nt)的局限性,然而,需要能够将镜像基因转录为更长的L-RNA的更有效的酶促系统,以获得用于转译的1.5-kb的16S及2.9-kb的23S rRNA,以及mRNA。如前所述,一种可能性是将DNA聚合酶突变为DNA依赖性RNA聚合酶。事实上,本发明人已成功地将分裂的Pfu DNA聚合酶(具有七个点突变V93Q、E102A、D141A、E143A、Y410G、A486L及E665K)重新改造为高效的DNA依赖性RNA聚合酶。然而,长的单链(single-stranded,ss)L-DNA模板的制备及纯化提出另一挑战,应首先被解决。或者,合成使用双链(double-stranded,ds)L-DNA模板的100-kDa T7 RNA聚合酶的镜像版本应该能够实现镜像转译所需的所有的镜像rRNA及mRNA的酶促转录。在将本发明付诸实施的过程中,根据本发明的一些实施例,如以下的实例部分所示,D-氨基酸的T7 RNA聚合酶是通过全化学合成而实现的。
外消旋晶体学:
如同蛋白质晶体学领域所已知的,在蛋白质结构解析中的第一个且可能是最限速的步骤是获得具有X射线衍射能力的晶体。在小分子结晶实验中观察到,分子的两种对映异构体的外消旋混合物倾向于形成高质量的衍射晶体,其中在单位晶胞中所观察到的至少一对称操作是反转。在结构生物学中的外消旋晶体学的新兴领域由于缺乏镜像蛋白样本而受到影响,尤其是在寻找大型镜像蛋白时。
因此,根据本发明的一些实施例,提供一种用于形成感兴趣的蛋白质晶体的方法,其通过将本文中所提供的所述感兴趣的蛋白质及所述感兴趣的蛋白质的对映体进行共结晶来实现,从而形成一对映体蛋白质对的晶体,其中所述对映体是D-氨基酸(镜像)蛋白质及相应的感兴趣的L-氨基酸蛋白质。
在本发明的另一类型的实施例中,镜像对映体是由本文中所提供的镜像蛋白所生产。例如,如本文所讨论提供的镜像高保真RNA聚合酶可用于转录L-RNA,从而产生其相应的D-RNA的对映体,之后可将其用于与D-RNA的对映体/外消旋进行共结晶,以解析RNA结构。
有关外消旋晶体学的其他信息,例如,可在以下内容中找到:马修斯,B.W.,“外消旋晶体学-简单的晶体及简单的结构:不喜欢何者?”,Protein Science,2009,18(6),pp.1135-1138;叶茨,T.O.及肯特,S.B.H.,“外消旋蛋白质晶体学”,Annual Review ofBiophysics,2012,41(1),pp.41-61;及曼达尔,P.K.等人,“外消旋DNA晶体学”,AngewandteChemie International Edition,2014,53(52),pp.14424-14427,其内容通过引用整体并入本文中,如同在本文中完整的阐述。
测序:
根据本发明的一些实施例,合成的蛋白质可用于测序,以及变性测序PAGE,以分离化学合成的镜像DNA寡核苷酸,通过降低绝大多数-1及-2nt产物来显着改善合成的寡核苷酸的质量。此种使用D-或L-氨基酸合成的蛋白质改善测序过程的保真度,使得大多数的最终组装的基因序列具有正确的序列。
根据本发明的一些实施例,在通过变性测序PAGE进行纯化之前,将未标记的载体D-(或L-)DNA添加至样本中(其具有特定所需量作为其“死体积”),以降低凝胶纯化所需的镜像PCR及PCR扩增的L-DNA产物的规模。根据本发明的一些实施例,合成的镜像高保真聚合酶可与硫代磷酸酯L-dNTP一起使用,用于诸如L-DNA及L-RNA的镜像核酸的边合成边测序。此外,带有两种不同染剂(分别为FAM及Cy5)的经5’标记的两个引物的双向测序策略的用途是用于将在一反应中的读取长度改善至>160至170bp。
指数富集配体的系统进化:
根据本发明的一些实施例,相较于繁琐的L-DNA化学测序方法,本发明的一些实施例开发边合成边测序,例如使用本文中所提供的镜像Pfu DNA聚合酶,是朝着实现更有效的L-DNA测序技术迈出一步。
通过指数富集进行配体的系统进化(Systematic evolution of ligands byexponential enrichment,SELEX),亦称为体外选择或体外进化,是分子生物学中的一种组合化学技术,用于生产特异性结合一靶标配体或多个配体的单链DNA或RNA的寡核苷酸。此过程从合成大型寡核苷酸库开始,所述寡核苷酸库是由随机生成的固定长度的序列所组成,其两侧是用作引物的恒定5’及3’末端。针对长度为n的随机生成区域,在所述库中可能的序列的数量为4n(n个位置,在各个位置具有四种可能性(A、T、C及G))。在所述库中的序列是暴露于目标配体,其可为蛋白质或小的有机化合物,且彼等未结合靶标的序列被去除,通常通过亲和性层析或顺磁珠上的靶标捕获。结合的序列被洗脱并通过PCR进行扩增,以替后续轮次的筛选做准备,其中可增加洗脱条件的严格性,以鉴定最紧密结合的序列。SELEX已被用于开发许多适体,此等适体结合对临床及研究目的感兴趣的靶标。同样为了此等目的,许多具有化学修饰的糖及碱基的核苷酸已被纳入SELEX反应。此等经修饰的核苷酸允许筛选具有新结合特性及潜在改善稳定性的适体。
用于镜像桑格(Sanger)测序甚至自动化、高通量L-DNA测序技术的重新改造高保真的镜像聚合酶(例如,通过合成无3’-5’核酸外切酶活性的突变或截短版本)的未来努力可能会导致新的应用,例如多重L-DNA测序,以及用于直接体外筛选L-适体药物(17,18)的通过指数富集进行配体的系统进化(Systematic evolution of ligands by exponentialenrichment,SELEX)。
预计在本申请的成熟的专利有效期内,将开发许多相关的大型合成的D/L蛋白质,以及术语大型合成的D/L蛋白质的范围旨在包括所有此种先验新技术。
如本文中所使用,术语“约”是指±10%(例如,“约30”是指27至33或30±3)。
术语“包括(comprises)”、“包括(comprising)”、“包括(includes)”、“包括(including)”、“具有”及其变体意指“包括但不限于”。
术语“由…所组成”是指“包括且限于”。
术语“基本上由…所组成”是指所述组合物、方法或结构可包括额外的成分、步骤及/或部分,但前提是额外的成分、步骤及/或部分不会实质性地改变请求保护的组成物、方法或结构的基本及新颖特征。
如本文中所使用,在某种物质的内文中的短语“实质上不含”及/或“基本上不含”是指完全不含此物质或以所述组合物的总重量或体积计,包括小于约5%、1%、0.5%或0.1%的物质。或者,在过程、方法、特性或特征的内文中的短语“实质上不含”及/或“基本上不含”是指完全缺乏特定过程/方法步骤,或某种特性或某种特征,或是指一过程/方法,其中相较于一给定的标准过程/方法,特定过程/方法步骤在小于约5%、1%、0.5%或0.1%的情况下实现,或是指一特性或特征,其相较于一给定的标准,所述特性或特征的百分比小于约5%、1%、0.5%或0.1%。
本文中所使用的术语“示例性”是指“用作一实例、例子或说明”。描述为“示例性”的任何实施例不一定被解释为优于或有利于其他的实施例及/或排除并入来自其他的实施例的特征。
本文中所使用的词语“可选地”或“或者”是指“在一些实施例中提供,且在其他的实施例中未提供”。本发明的任何特定的实施例可包括多个“可选的”特征,除非此等特征相互冲突。
除非内文另有明确规定,如本文中所使用,单数形式“一(a)”、“一(an)”及“所述”包括复数指代。例如,术语“一化合物”或“至少一化合物”可包括多种化合物,包括其混合物。
贯穿本申请,本发明的各种实施例可以范围形式呈现。应当理解,范围形式的描述仅是为了方便及简洁,不应理解为对本发明的范围的不可改变的限制。因此,范围的描述应该被认为已经具体公开所有可能的子范围以及在此范围内的各个数值。例如,诸如从1至6的范围的描述应被视为具有具体公开的子范围,例如,1至3、1至4、1至5、2至4、2至6、3至6等,以及在此范围内的单个数字,例如,1、2、3、4、5及6。无论范围的宽度如何,此皆适用。
每当在本文中指示一数值范围时,其意在包括所指示范围内的任何引用的数字(分数或整数)。短语“介于第一指示数字与第二指示数字之间的范围(ranging)/范围(ranges)”,以及“范围/范围从”第一指示数字“至”第二指示数字在本文中可互换使用,且意在包括第一及第二指示数字,以及其间的所有小数及整数。
如本文中所使用,术语“过程”及“方法”是指用于完成一给定工作的方式、手段、技术及程序,包括,但不限于化学、材料、机械、计算及数字艺术从业者已知的或从已知的方式、手段、技术及程序容易开发的方式、手段、技术及程序。
如本文中所使用,术语“治疗”包括消除、实质上抑制、减缓或逆转病症的进展,实质上改善一病症的临床或美学症状或实质上预防一病症的临床或美学症状的出现。
当参考特定序列表时,应理解此种序列表亦涵盖基本上相应于其互补序列的序列,包括微小的序列变异,此等变异是由例如测序错误、克隆错误或导致碱基取代的其他改变、碱基缺失或碱基添加所引起,条件是此种变异的发生率是在50个核苷酸中少于1个核苷酸,或者,在100个核苷酸中少于1个核苷酸,或者,在200个核苷酸中少于1个核苷酸,或者,在500个核苷酸中少于1个核苷酸,或者,在1000个核苷酸中少于1个核苷酸,或者,在5000个核苷酸中少于1个核苷酸,或者,在10000个核苷酸中少于1个核苷酸。
应当理解,为了清楚起见,在单一实施例的内文中所描述的本发明的各种特征亦可单独提供,或以任何合适的子组合提供,或在本发明的任何其他描述的实施例中合适地提供。在各种实施例的内文中所描述的某些特征不应被认为是彼等实施例的基本特征,除非此实施例在无此等元素的情况下无法作用。
上文所描述的及权利要求书部分所请求保护的本发明的各种实施例及方面在以下的实例中找到实验及/或计算的支持。
实例
现在参考以下的实例,此等实例与以上的描述一起以非限制性方式说明本发明的一些实施例。
实例1
Pfu DNA聚合酶的全化学合成
通过Pfu DNA聚合酶的天然(L-氨基酸蛋白质)及镜像版本的全化学合成,对本发明的一些实施例的概念进行验证。
实施本文提供的方法的第一步是使用与Pfu DNA聚合酶有关的可取得的信息,以识别有利于酶的全化学合成的现有序列特征,并确定在序列中具有足够结构灵活性(松散性)的位置,以允许在其中引入突变而不损害结构稳定性,从而不损害酶的所需活性。为此,使用Pfu-WT(SEQ ID No.47)、Pfu-5m(SEQ ID No.48)、Pfu-5m-55I(SEQ ID No.49)、Pfu-5m-46I(SEQ ID No.50)、Pfu-5m-30I(SEQ ID No.51)、Pfu-5m-0I(SEQ ID No.52)、KOD1(SEQ ID No.53)、Tgo(SEQ ID No.54)、9°N-7(SEQ ID No.55),以及Tok(SEQ ID No.56)聚合酶进行多序列比对(multiple sequence alignment,MSA)。MSA显示高度保守的氨基酸,此等氨基酸保持不变,而MSA上的其他部分显示有利于突变的多样性,以在其中引入额外的NCL位点、分裂位点、疏水性降低突变及Ile减少突变。因此,基于MSA,选择E102A、E276A、K317G、V367L及I540A作为突变,以在序列的不同的氨基酸部分中引入有利连接氨基酸(以及替换位置540的异亮氨酸)。基于MSA分析及蛋白质结构信息,异亮氨酸WT残基I38、I62、I65、I80、I127、I137、I158、I171、I176、I191、I197、I198、I205、I206、I228、I232、I244、I256、I264、I268、I282、I331、I401、I434、I446、I478、I557、I598、I605、I611、I619、I631、I643、I648、I656、I677、I716、I734、I745,以及I772被其他相容的残基取代。此外,引入V93Q、D141A、E143A、Y410G、A486L及E665K突变,以便将Pfu DNA聚合酶转变为L-及D-氨基酸版本二者的高效RNA聚合酶。
根据本发明的一些实施例,Pfu DNA聚合酶的氨基酸序列被分裂成两个结构域形成片段,在本文中称为Pfu-N片段(SEQ ID No.57)及Pfu-C片段(SEQ ID No.67)。如以下的图2A至图2B所示,Pfu-N片段分为长度从40个至62个氨基酸的9个肽片段(SEQ ID Nos.58至66),Pfu-C片段分为长度从33至63个氨基酸的6个肽片段(SEQ ID Nos.68至73)。
图2A至图2B显示突变的Pfu-N片段的合成路径的设计流程(图2A),其中引入了额外的NCL位点(E102A、E276A、K317G、V367L),以形成有利连接片段,及25个异亮氨酸残基被取代,以及突变的Pfu-C片段的合成路径的设计流程(图2B),其中引入一额外的NCL位点(I540A),以及其他15个异亮氨酸残基的突变,而引入此等突变是为了促进在SPPS及连接过程中的蛋白质合成,及降低镜像版本的合成成本。
所述肽片段是通过基于Fmoc的SPPS所制得,通过反相高效液相色谱(reversed-phase high-performance liquid chromatography,RP-HPLC)进行纯化,以及通过基于酰肼的NCL,采用聚合组装策略(convergent assembly strategy)进行组装,之后进行基于金属自由基的脱硫反应。针对L-聚合酶,获得4.3mg的L-Pfu-N片段,所观察的分子量(molecular weight,M.W.)为54830.0Da(经计算的分子量为54829.9Da;通过分析型HPLC及ESI-MS确定,未显示)以及2.2mg的L-Pfu-C片段,所观察的分子量为35563.2Da(经计算的分子量为35563.02Da)。针对D-聚合酶,获得16.5mg的D-Pfu-N片段,所观察的分子量为54829.5Da,以及11.9mg的D-Pfu-C片段,所观察的分子量为35561.9Da。合成的L-聚合酶及D-聚合酶二者皆通过连续透析进行折叠,之后在85℃下进行热沉淀,其进一步改善正确折叠的蛋白质的纯度(ESI-MS,未显示)。接下来,聚合酶的PCR活性在短的100-bp的合成的D-或L-DNA模板(SEQ ID No.12)上进行测试,以及检测介于重组的与合成的L-聚合酶及D-聚合酶之间可比较的扩增效率(通过3%筛分琼脂糖凝胶电泳进行分析,以及通过ExRed进行染色、M,DNA阶梯(DNA ladder)及ImageLab软件(Bio-Rad Laboratories,CA,美国)。M,DNA阶梯)。合成的L-聚合酶的保真度亦在pUC19质粒的1.2-kb D-DNA序列(SEQ ID No.80)上进行量化,PCR产物的桑格(Sanger)测序测得错误率小于3.6×10-6(参见下表3),与先前研究中所报道的WT Pfu DNA聚合酶一致。
表3
材料:
L-DNA寡核苷酸是在H-8寡核苷酸合成仪(K&A Laborgeraete,德国)上利用L-脱氧核苷亚磷酰胺(ChemGenes,MA,美国)进行合成。用于重组蛋白表达的引物是购自金唯智公司(Genewiz)(北京,中国)。通过变性测序PAGE来纯化细菌16S rRNA基因组装的引物。其他的DNA寡核苷酸通过寡核苷酸纯化柱(oligonucleotide purification cartridge,OPC)(睿博兴科生物技术有限公司,北京,中国)进行纯化。PAGE DNA纯化试剂盒是购自天恩泽公司(北京,中国)。三(羟甲基)氨基甲烷-碱(Tris-base)、NP-40、Tween-20、KCl、盐酸胍(guanidine hydrochloride,Gn·HCl)及β-巯基乙醇(β-mercaptoethanol,β-ME)是购自Amresco公司(宾夕法尼亚州,美国)。咪唑及EDTA是购自索莱宝生命科学(Solarbio LifeSciences)(北京,中国)。2-氯三酰氯树脂(载量=0.6毫摩尔/克)是购自天津南开和成科技有限公司(天津,中国)。王氏树脂(Wang Chemmatrix树脂)是购自希施生物科技公司(CSBioLtd)(上海,中国)。Fmoc-D-氨基酸、Fmoc-L-氨基酸,及O-(6-氯苯并三唑-1-基)-N,N,N’,N’-四甲基脲六氟磷酸盐(O-(6-chlorobenzotriazol-1-yl)-N,N,N’,N’-tetramethyluronium hexafluorophosphate,HCTU)是购自吉尔生化公司(GL BiochemCo.)(上海,中国)。N,N-二异丙基乙胺(N,N-Diisopropylethylamine,DIEA)、三氟乙酸(trifluoroacetic acid,TFA)、N,N-二甲基甲酰胺(N,N-dimethylformamide,DMF)、硫代苯甲醚、三异丙基硅烷(triisopropylsilane,TIPS)、1,2-乙二硫醇(1,2-ethanedithiol,EDT)、氯化钯(palladium chloride,PdCl2)、2-巯基乙磺酸钠(sodium 2-mercaptoethanesulfonate,MESNa),以及2,2’-偶氮二[2-(2-咪唑啉-2-基)丙烷]二盐酸盐(2,2’-azobis[2-(2-imidazolin-2-yl)propane]dihydrochloride)(VA-044)是购自百灵威科技有限公司(J&K Scientific)(北京,中国)。4-巯基苯乙酸(4-mercaptophenylaceticacid)(MPAA)是购自阿法埃莎公司(Alfa Aesar Chemicals Co.)(上海,中国)。哌啶、Na2HPO4·12H2O、NaH2PO4·2H2O、亚硝酸钠(NaNO2)及乙酸酐是购自国药集团化学试剂有限公司(Sinopharm Chemical Reagent Co.)(上海,中国)。NaCl、NaOH及盐酸是购自国药集团化学试剂(北京,中国)。二氯甲烷(Dichloromethane,DCM)是购自上海泰坦科技有限公司(Shanghai Titan Scientific Co.)(上海,中国)。三(2-羧乙基)膦盐酸盐(Tris(2-carboxyethyl)phosphine hydrochloride,TCEP·HCl)、9-芴基甲基氨基甲酸酯(9-fluorenylmethyl carbazate,Fmoc-NHNH2)、氰基乙醛酸乙酯-2-肟(ethylcyanoglyoxylate-2-oxime)(Oxyma)、N,N’-二异丙基碳二亚胺(N,N’-diisopropylcarbodiimide,DIC),以及DL-1,4-二硫苏糖醇(DL-1,4-dithiothreitol,DTT)是购自上海阿达玛斯试剂有限公司(Adamas Reagent Co.)(上海,中国)。还原型谷胱甘肽(Glutathione reduced,GSH)是购自Acros Organics(新泽西州,美国)。无水乙醚是购自北京同光精细化工公司(北京,中国)。乙腈(HPLC级)是购自J.T.Baker(新泽西州,美国)。
基于Fmoc的固相肽合成(Fmoc-based solid-phase peptide synthesis,Fmoc-SPPS):
所有的肽皆通过基于Fmoc的SPPS,在Liberty Blue自动的微波肽合成仪(CEM公司,北卡罗来纳州,美国)及Prelude X自动的肽合成仪(蛋白质科技公司,亚利桑那州,美国)上合成。在预载有第一个C末端残基的王氏树脂(Wang Chemmatrix树脂)(希施生物科技公司,上海,中国)上合成具有C末端羧酸盐的肽,例如Pfu-N-9及Pfu-C-6。所有其他的肽皆在Fmoc-肼2-氯三苯甲基氯(Fmoc-hydrazine 2-chlorotrityl chloride)树脂上合成,以制备肽酰肼。针对各种肽酸,第一个残基通过双偶联方法,手动连接至王氏树脂上:在第一个偶联反应中,氨基酸在30℃下使用4当量的氨基酸、3.8当量的HCTU,及8个当量的DIEA进行偶联1小时。树脂利用DMF及DCM进行洗涤;在无脱保护的情况下,第二个偶联反应在25℃下使用4当量的氨基酸、4当量的Oxyma,及4当量的DIC进行过夜。使用前,所有的树脂皆在DMF中溶胀5至10分钟。通过在85℃的DMF中,利用20%哌啶及0.1mol/L Oxyma进行处理,以去除两种树脂及组装的氨基酸的Fmoc基团。除了Fmoc-Cys(Trt)-OH及Fmoc-His(Trt)-OH之外的氨基酸的偶联在85℃下使用4当量的氨基酸、4当量的Oxyma,及8当量的DIC进行。Fmoc-Cys(Trt)-OH及Fmoc-His(Trt)-OH的偶联反应在50℃下进行10分钟,以避免在高温下发生副反应。三氟乙酰基噻唑烷-4-羧酸-OH(Trifluoroacetyl thiazolidine-4-caboxylicacid-OH,Tfa-Thz-OH)在室温下使用Oxyma/DIC活化以进行偶联。肽链组装完成之后,使用H2O/硫代苯甲醚/三异丙基硅烷/1,2-乙二硫醇/三氟乙酸(0.5/0.5/0.5/0.25/8.25)将肽从树脂上分离。裂解反应在27℃下进行搅拌2.5小时。通过N2吹以去除在混合物中的大部分TFA,及加入冷乙醚,以沉淀粗肽。离心之后,去除上清液,且利用乙醚将沉淀物进行洗涤两次。将粗肽溶解在CH3CN/H2O中,通过RP-HPLC及ESI-MS进行分析,及通过半制备型HPLC进行纯化。
天然化学连接(Native chemical ligation,NCL):
将C-末端肽酰肼片段溶解在酸化的连接缓冲液(6M Gn·HCl及0.1M NaH2PO4,pH3.0的水溶液)中。将混合物在冰盐浴(-10℃)中进行冷却,并加入在酸化的连接缓冲液(pH3.0)中的10当量的NaNO2。活化反应系统在冰盐浴中搅拌25分钟,之后加入在连接缓冲液中的40当量的MPAA及1当量的N-末端半胱氨酸肽,并在室温下将溶液的pH调节至6.5。反应过夜之后,加入在连接缓冲液(pH调节至7.0)中的150mM TCEP,以稀释系统两次,及反应系统在室温下搅拌30分钟。最后,连接产物通过HPLC及ESI-MS进行分析,及通过半制备型HPLC进行纯化。值得注意的是,在连接Pfu-C-1及Pfu-C-2片段的期间,发现由于不溶的Pfu-C-2片段,连接的效率非常低,因此将Gn·HCl的初始浓度增加至8M(最终Gn·HCl浓度约为7M),其显着提高两个肽片段的溶解度及连接效率。
脱硫反应:
将含有Cys的肽(3mg/ml)溶解在脱硫缓冲液中(0.1M水性磷酸盐缓冲液,含有6MGn·HCl、200mM TCEP、40mM还原型L-谷胱甘肽及20mM VA-044,pH 6.8)。将混合物在37℃下搅拌过夜,脱硫产物通过HPLC及ESI-MS进行分析,及通过半制备型HPLC进行纯化。
ACM脱保护:
通过Pd辅助的脱保护策略来去除乙酰氨基甲基(Acetamidomethyl,Acm)基团。将经Acm保护的肽溶解在Acm脱保护缓冲液(6M Gn·HCl、0.1M磷酸盐及40mM TCEP的水溶液,pH 7.0)中,至终浓度为1mM,之后加入20当量的PdCl2。将反应混合物在25℃下搅拌培养过夜。将DTT添加至50mM的最终浓度,以淬灭反应。将反应混合物搅拌1小时,并通过半制备型HPLC进行纯化。
分裂的Pfu DNA聚合酶的体外折叠:
将冻干的Pfu DNA聚合酶的N片段及C片段分别溶解在含有10mMβ-ME的4M及5MGn·HCl中。通过将相等浓度的两个片段(0.5μM)混合,以进行体外蛋白质的折叠,之后在4℃下,于含有40mM Tris-HCl(pH 7.5)、1mM EDTA、100mM KCl、10%甘油的缓冲液中进行透析过夜。将经折叠的Pfu DNA聚合酶加热至85℃,15分钟,以沉淀不耐热肽,之后通过在4℃下进行20,000×g离心40分钟,以去除不耐热肽。浓缩上清液,并于存储缓冲液100mM Tris-HCl(pH 8.0)、50%甘油、0.2mM EDTA、0.2% NP-40非离子去污剂、0.2% Tween 20、2mMDTT中进行透析。
RP-HPLC及ESI-MS:
所有的RP-HPLC分析及纯化皆在具有SPD-20A UV-Vis检测器及LC-20AT溶剂输送装置的Shimadzu Prominence HPLC系统(岛津制作所,京都,日本)上进行。Ultimate XB-C4柱(5μm,4.6×250mm)(月旭材料,上海,中国)用于以1ml/min的流速进行分析,以监控连接反应,并分析肽产物的纯度。Ultimate XB-C4及C18柱(5μm,21.2×250mm或5μm,10×250mm)(月旭材料,上海,中国)分别用于分离粗肽及连接产物,流速为4至8ml/min。经纯化的产物在岛津LC/MS-2020系统(岛津制作所,京都,日本)上通过ESI-MS进行表征。
蛋白质表达及纯化:
将Pfu DNA聚合酶基因克隆至pET-28c质粒中,利用pEASY-Uni无缝克隆及组装试剂盒(全式金生物技术公司,北京,中国)来构建突变体。使用大肠杆菌(E.coli)菌株BL21(DE3)在LB培养基中表达与N末端His6标签融合的蛋白质。收集经诱导的细胞,并重悬于裂解缓冲液(40mM Tris-HCl、300mM NaCl、10mM咪唑、10mMβ-ME、10mg/ml溶菌酶,pH8.0)中。将细胞裂解物在85℃下加热15分钟,随后通过在4℃下以20,000×g离心40分钟,以去除不耐热蛋白。在4℃,下将上清液在Ni-NTA Superflow树脂(森辉微球科技,苏州,中国)中培养1小时。利用含有40mM Tris-HCl(pH 8.0)、300mM NaCl、40mM咪唑及10mMβ-ME的缓冲液洗涤树脂,之后利用含有40mM Tris-HCl(pH 8.0)的缓冲液、300mM NaCl、250mM咪唑及10mMβ-ME进行洗脱。经纯化及经浓缩的Pfu DNA聚合酶及突变体在含有100mM Tris-HCl(pH 8.0)、50%甘油、0.2mM EDTA、0.2% NP-40非离子去垢剂、0.2% Tween 20及2mM DTT的存储缓冲液中进行透析。
PCR活性及保真度:
天然及镜像PCR反应在含有1×Pfu缓冲液(索莱宝生命科学,北京,中国)的50μl反应系统中进行,所述反应系统具有200μM(各种)dNTP、0.2μM(各种)引物、模板及聚合酶。为了量化Pfu DNA聚合酶及其突变体的PCR活性,通过12% SDS-PAGE,将聚合酶调整至与野生型(wild-type,WT)Pfu DNA聚合酶相同的浓度。SDS-PAGE分析证实从大肠杆菌中表达及纯化的突变的Pfu DNA聚合酶的重组裂解的片段,与具有相同序列的合成的天然及镜像PfuDNA聚合酶的分子量相似性(结果未显示)。PCR程序设置为94℃,3分钟(初始变性);94℃,30秒、50至65℃(取决于Tm)30秒,以及72℃,1至7分钟(取决于扩增子的长度),10至35个循环;72℃,10分钟(最终延伸)。为了量化合成的Pfu DNA聚合酶的扩增效率,使用100-bp DNA序列作为模板。利用3%筛分琼脂糖凝胶电泳来分析重组的、合成的L-及合成的D-Pfu DNA聚合酶(分裂Pfu-5m-30I)的PCR扩增,并利用ExRed进行染色(结果未显示)。根据产物条带的强度估计,合成的D-Pfu DNA聚合酶的PCR扩增效率测得约为1.5。前9个循环的扩增产物通过ImageJ软件(伯乐生命医学产品公司,加利福尼亚州,美国)进行分析。为了检验合成的Pfu DNA聚合酶的保真度,第45个循环之后的天然的PCR产物(1.2kb D-DNA)通过V-elute凝胶小型纯化试剂盒(V-elute Gel Mini Purification Kit)(北京庄盟国际生物基因科技有限公司,北京,中国)进行纯化,并通过零背景ZT4简单-直白快速克隆试剂盒(ZeroBackground ZT4 Simple-Blunt Fast Clone Kit)(北京庄盟国际生物基因科技有限公司,北京,中国)进行克隆,以用于桑格测序,并根据先前描述的方法进行计算。
实例2
T7 RNA聚合酶的全化学合成及其用途
如上文所讨论的,使用双链(double-stranded,ds)L-DNA模板合成镜像版本的RNA聚合酶,将能够使镜像转译所需的所有的镜像rRNA及mRNA进行酶促转录。因此,作为证明本发明的某些方面的概念的另一步骤,100kDa T7 RNA聚合酶的天然的(L-氨基酸蛋白质)及镜像版本,两个分裂位点的设计,皆为化学合成的。
T7 RNA聚合酶具有已知的分裂形式,例如,西格尔-夏皮罗等人[Mol Syst Biol.,2014,30(10),pp.742]使用基于转座子的方法,在T7 RNA聚合酶中找到数个分裂位点。梯云韩等人[ACS Synth Biol.,2017,6(2),pp.357-366.]设计基于分裂T7 RNA聚合酶的光激活基因开关,以在不同环境下实现光激活基因表达。然而,在此等天然酶中所使用的分裂位点并非总是适用于T7RNA聚合酶的化学合成:T7 RNA聚合酶的一些分裂位点会显着改变其酶活性;有些是位于蛋白质肽链的N或C末端附近,导致一或多个大型蛋白质片段(超过400个至500个氨基酸),此等片段仍然太大而无法化学合成。
为了提供实用的结构域形成片段,根据本发明的一些实施例,使用低序列保守性及结构灵活性的标准,鉴定第二个分裂位点,其是迄今为止尚未被提出的,即介于K363与P364之间的分裂位点。西格尔-夏皮罗等人所报道的介于N601与T602之间的分裂位点,以及将本发明付诸实践时所发现的在T7 RNA聚合酶结构的溶剂暴露环中的分裂位点(介于K363与P364之间),一起被分成三个适合化学合成的长度大致相等的片段(通常小于400个至500个氨基酸):一个369-aa的T7-分裂-N片段(在N末端添加一个His6标签)、一个238-aa T7-分裂-M片段,以及一个282-aa T7-分裂-C片段,而不会显着改变其酶活性及保真度。上述的分裂位点可选择在同一环中的上述位点的附近,即从位置357至位置366及/或从位置564至位置607。同时,分裂T7 RNA聚合酶可被用作转录的AND逻辑(transcriptional AND-logic)。例如,其中T7 RNA聚合酶的活性直接受外部信号调节的基因开关是通过将蛋白质分裂成片段,并使用调节域来调节其重组的工程策略所获得。使用可光激活的VVD域及其变体作为调节域,可获得具有出色的暗/光特性的稳健可切换系统。
亦实施系统的异亮氨酸取代方法,基于使用T7-WT(SEQ ID No.82)、T7-37I(SEQID No.83)、YenP(SEQ ID No.84)、phiEap(SEQ ID No.85)及KpnP(SEQ ID No.86)聚合酶的多序列比对(multiple sequence alignment,MSA),以及将在T7 RNA聚合酶中的许多异亮氨酸(51个中的14个,或27%Ile的残基)突变为其他的氨基酸的结构信息,所述其他的氨基酸例如缬氨酸、亮氨酸及甲硫氨酸(I6V、I14L、I74V、I82V、I109V、I117L、I141V、I210M、I244L、I281V、I320V、I322L、I330V、I367L),而不会显着改变其酶活性及保真度。此种方法降低合成此种D-聚合酶的氨基酸成本,将有助于其在未来的大规模合成及实际应用。
图3A至图3C显示369-aa突变T7-分裂-N片段(SEQ ID No.87)(图3A)、238-aa突变T7-分裂-M片段(SEQ ID No.94)(图3B),以及282-aa突变T7-分裂-C片段(SEQ ID No.101)(图3C)的合成路径的设计流程,包括异亮氨酸残基的替换、新的NCL以及介于K363与P364之间的新的分裂位点,其被引入是为了促进在SPPS及连接过程中的蛋白质合成,以及降低镜像版本的合成成本。
通过引入有利连接残基置换来进一步进行T7 RNA聚合酶的全化学合成。T7-分裂-N片段分为7个肽片段,其长度范围为从32至76个氨基酸(SEQ ID Nos.88至94),及T7-分裂-M片段分为6个肽片段,其长度范围为从23至45个氨基酸(SEQ ID Nos.96至101),以及T7-分裂-C片段被分成5个肽片段,其长度范围为从41至75个氨基酸(SEQ ID Nos.103至107)。肽片段是由基于Fmoc的SPPS所制得,通过反相高效液相色谱(reversed-phase high-performance liquid chromatography,RP-HPLC)进行纯化,以及通过基于酰肼的NCL,采用聚合组装策略进行组装,之后进行基于金属自由基的脱硫反应。合成、连接、纯化及冻干之后,针对L-聚合酶,获得约3mg T7-分裂-N片段,所观察到的分子量(molecular weight,M.W.)为41369.0Da(经计算的分子量为41372.6Da)、约2.5mg T7-分裂-M的分子量为26786.0Da(经计算的分子量为26787.4Da)的片段,以及约4.8mg T7-分裂-C片段的分子量为31459.0Da(经计算的分子量为31459.9Da)。针对D-聚合酶,获得约9mg D-T7,所观察到的分子量(M.W.)为41373.0Da、约8mg T7-分裂-M片段,M.W.为26787.0Da,以及约15mg T7-分裂-C片段,M.W.为31459.0Da。
合成的聚合酶的体外折叠:
通过连续透析来折叠合成的聚合酶,之后通过超滤以沉淀杂质。
将T7 RNA聚合酶的经冻干的合成的N、M及C片段分别溶解在含有6M Gn·HCl及20mM DTT的变性缓冲液中。通过将N、M及C片段等量混合(0.5nmol/ml),以及在复性缓冲液(50mM Tris-HCl、100mM KCl、10%甘油、1mM EDTA、10mM DTT、pH 8.0)中,于4℃下轻轻搅拌24小时,以进行透析。复性之后,酶在含有50%甘油、50mM Tris-HCl(pH 8.0)、100mM NaCl、1mM EDTA、0.1% Triton X-100、10mM DTT的存储缓冲液中,于4℃下轻轻搅拌12小时,以进行透析,之后使用Amicon Utra离心过滤器(0.5ml,100,000MWCO)进行超滤。
合成的T7 RNA聚合酶的转录活性及保真度:
自然转录及镜像转录在含有1×T7反应缓冲液(新英格兰生物实验室,北京,中国)的10μl反应系统中进行,所述反应缓冲液中含有500μM(各种)rNTP、10% DMSO、5mM DTT、模板及聚合酶。为了量化T7 RNA聚合酶及其突变体的转录活性,通过12% SDS-PAGE将聚合酶调整至与野生型(wild-type,WT)T7 RNA聚合酶相同的浓度(结果未显示)。将反应在37℃下培养不同的时间。天然及镜像T7 RNA聚合酶的转录活性显示所述聚合酶可成功转录160-bpDNA模板(SEQ ID No.108)及1.5-kb DNA模板(SEQ ID No.109),表明L-RNA分子的广泛长度范围可通过合成的镜像T7 RNA聚合酶,从1.5-kb L-DNA模板产生(结果未显示)。不同长度的经纯化及浓度确定的单链L-RNA转录本的混合物可用作RNA标记(或RNA阶梯),用于在天然或变性的凝胶上的RNA检测大小及定量,由于其对天然的RNase具有抗性,因此其优于商业的D-RNA标记(D-RNA阶梯)。亦通过利用SuperScript IV高保真逆转录酶来逆转录DNaseⅠ-消化的转录产物,之后利用高保真Pfu DNA聚合酶进行PCR扩增,并通过桑格(Sanger)测序以对扩增子进行测序,来检验合成的T7 RNA聚合酶的保真度,并检测与先前研究中所报导的WT T7 RNA聚合酶的错误率一致的错误率(大约10-6)。
L-tRNASer的带电:
L-tDNASer(SEQ ID No.110)是由镜像Dpo4(D-Dpo4-5m)的突变版本组装而成。L-tRNASer是通过高保真度的镜像T7 RNA聚合酶进行转录,且含有1×T7反应缓冲液A(40mMTris-HCl、25mM MgCl2、1mM亚精胺、2mM DTT,pH 8.0)的反应系统与2mM(各个)L-rNTP、10%DMSO、0.3μM模板及2μM聚合酶于37℃下培养过夜。通过单核苷酸分辨率的变性PAGE来纯化产物,并通过10%变性PAGE来分析经纯化的产物(结果未显示)。L-tRNASer的带电是在25mMHEPES-KOH(pH 7.5)、50mM KCl、2μM L-tRNASer及10μM L-dFx中进行。将反应系统加热至95℃并保持2分钟,之后缓慢冷却至室温以进行粘合。之后向系统中加入100mM MgCl2,并将反应系统在室温下培养10分钟,之后在4℃下培养10分钟。最后,将5mM D-Ser-DBE加入系统中,并将反应系统在4℃下培养6小时。通过加入1/10体积的3M NaOAc及2.5倍体积的乙醇进行乙醇沉淀,并在-20℃下培养过夜。通过8%酸PAGE以分析产物(结果未显示)。
L-16S rRNA纯化:
L-16S rDNA(SEQ ID No.109)是通过高保真的镜像Pfu DNA聚合酶组装而成。L-16S rRNA是通过高保真的镜像T7 RNA聚合酶进行转录,且包含1×T7反应缓冲液(新英格兰生物实验室,北京,中国)的反应系统与500μM(各个)L-rNTPs、10% DMSO、5mM DTT、模板及聚合酶在37℃下培养过夜。通过β-琼脂糖酶(β-Agarase)消化,从2%低熔点琼脂糖凝胶(阿梅莱斯科,美国)来纯化转录产物。含有RNA样本的凝胶切片在室温下利用10倍体积的1×β-琼脂糖酶(β-Agarase)缓冲液平衡60分钟,之后在70℃下熔化15分钟,之后冷却至45℃。将经熔化的琼脂糖溶液与2单位的β-琼脂糖酶(新英格兰生物实验室,北京,中国)在45℃下培养60分钟,之后于-20℃下放置15分钟,并于4℃下离心15分钟。将上清液转移至新的微量离心管中,加入1/10倍体积的3M NaOAc及2.5倍体积的乙醇进行乙醇沉淀,并于-20℃培养过夜。通过3%琼脂糖凝胶来分析经纯化的产物(结果未显示)。
L-鸟嘌呤传感器:
通过追踪由合成的L-及D-T7 RNA聚合酶所转录的D-及L-鸟嘌呤传感器的特异性,来证明鸟嘌呤传感器的分子鉴别。L-鸟嘌呤传感器DNA模板(SEQ ID No.111)是由D-Dpo4-5m组装而成。利用高保真的镜像T7 RNA聚合酶以将L-鸟嘌呤传感器进行转录,且含有1×T7反应缓冲液A(40mM Tris-HCl、25mM MgCl2、1mM亚精胺、2mM DTT,pH 8.0)的反应系统与2mM(各个)L-rNTP、10% DMSO、0.2μM模板以及2μM聚合酶在37℃下培养过夜。在8M尿素中通过聚丙烯酰胺凝胶来纯化产物,并通过10%变性PAGE来分析经纯化的产物(结果未显示)。1μML-鸟嘌呤传感器及10μM DFHBI在含有40mM HEPES(pH 7.4)、125mM KCl及1mM MgCl2的缓冲液中,于37℃进行培养。之后将1mM鸟嘌呤快速添加至溶液中,并在37℃的连续照明下,使用以下的仪器参数,在15分钟内记录荧光发射:激发波长,460nm;发射波长,500nm;狭缝宽度,12nm。0.1μM RNA及10μM DFHBI与100μM鸟嘌呤或竞争分子一起培养,并在500nm处分析荧光发射。鸟嘌呤传感器在100μM鸟嘌呤时饱和,并显示出对相同浓度的GTP及腺嘌呤的高水平的分子鉴别(结果未显示)。
L-38-6RNA聚合反应:
L-38-6核糖酶的DNA模板(SEQ ID No.112)及L-第Ⅰ类连接酶DNA模板(SEQ IDNo.113)是由D-Dpo4-5m组装而成。通过高保真的镜像T7 RNA聚合酶以将RNA进行转录,且含有1×T7反应缓冲液A(40mM Tris-HCl、25mM MgCl2、1mM亚精胺、2mM DTT,pH 8.0)的反应系统,与2mM(各个)L-rNTP、10% DMSO、0.3μM模板及2μM聚合酶在37℃下培养过夜。通过在8M尿素中的聚丙烯酰胺凝胶来纯化产物(结果未显示)。使用100nM L-38-6核糖酶(SEQ IDNo.114)、80nM L-5’-FAM标记的引物(SEQ ID No.115)及100nM L-第Ⅰ类连接酶模板(SEQID No.116)进行RNA聚合反应。首先将RNA加热至80℃,30秒,之后缓慢冷却至17℃,及之后将其添加至含有4mM的各种L-rNTP、200mM MgCl2、25mM Tris·HCl pH 8.3及0.05%Tween-20的反应混合物中,其在17℃下培养不同时间。通过ssDNA/RNA清洁浓缩器试剂盒(ZYMORESEARCH,加利福尼亚州,美国)将产物进行浓缩,之后与变性缓冲液(98%甲酰胺,0.25mMEDTA)混合,之后加热至65℃,10分钟,之后迅速置于冰上。通过在8M尿素中的10%聚丙烯酰胺凝胶以将样本分离,并通过在Cy2模式下运行的台风多功能扫描仪(Typhoon Trio+)系统进行扫描。
在天然及镜像16S rRNA中的RNA降解的动力学:
为了在控制的条件下评估RNA的完整性,通过生物分析仪(Bioanalyzer)方法检测及解析三种制备的转录本,所述转录本包括天然的16S rRNA、具有RNase抑制剂的天然的16S rRNA,及镜像16S rRNA。分别用利天然及镜像T7 RNA聚合酶来转录天然及镜像16SrRNA,以及利用β-琼脂糖酶(β-Agarase)Ⅰ进行消化,并从2%低熔点琼脂糖凝胶中纯化。经纯化的RNA于37℃下放置5分钟、30分钟、1小时、2小时、4小时、8小时、18小时、24小时、48小时、72小时、7天、15天、30天、60天及100天,根据微芯片凝胶电泳的电泳图图像来评估RNA的质量。当于37℃下放置30分钟时,天然的16S rRNA的降解迹象极小,且1小时后降解更加明显,基线大幅升高。在37℃下,6小时之后,由于进一步的降解,峰完全消失。在含有RNase抑制剂的天然的16S rRNA样本中,于37℃下放置4小时时,观察到最小的降解迹象,于8小时时,RNA的降解更为明显,基线大幅升高。在37℃下,48小时之后,由于进一步的降解,峰完全消失。在镜像16S rRNA样本中,即使在37℃下放置15天,亦未检测到降解的迹象。此显示RNA在RNase完全消除的情况下,具有更强的稳定性。利用L-RNA系统来检测RNA在不同条件下的水解动力学,可作为对照,以评价RNase抑制试剂的有效性。
实例3
镜像DNA信息存储
在获得高保真的镜像Pfu DNA聚合酶之后,根据本发明的一些实施例,通过对L-DNA序列的忠实写入及读取,探索其在镜像DNA信息存储中的应用,从而实现镜像DNA信息存储的概念的验证。
以下的段落是来自由路易斯巴斯德的1860年的出版物,其中首次提出镜像分子及镜像生物系统的概念,其被编码成DNA序列(见表4),并存档为长度为220bp的11个L-DNA片段(表5),各个片段是由4个70至90nt的短的、合成的L-DNA寡核苷酸组装而成。
巴斯德:“因此,倘若天然产物的不对称性所引起的神秘的影响改变其的意义或方向,则所有的生物的构成元素皆会呈现相反的不对称性。或许一个新的世界会出现在我们的视野中。倘若原本的纤维素是右旋的,变成左旋;倘若血液的白蛋白,目前是左旋的,变成右旋?谁能预见到生物的组织结构呢?此等皆是为未来提供大量工作的谜团,及从今以后需要科学界最认真的考虑”。
表4
220bp的信息存储双链L-DNA片段,各个片段皆由镜像Pfu DNA聚合酶使用镜像组装PCR,从4个70至90nt的短的、合成的L-DNA寡核苷酸组装而成,及通过2.5%琼脂糖凝胶电泳来分析包含所有的11个片段(L库)的L-DNA存储库,并通过ExRed进行染色。M,DNA标记(结果未显示),列于表5。表5显示用于L-DNA信息存储的序列,其中小写字母为用于扩增的M13-F及M13-R序列,下划线(下划线(underscore);下划线(understrike))字母是用于对各个片段进行测序的独特序列。
表5
L-DNA的读取可通过硫代磷酸酯的方法(使用L-脱氧核苷α-硫代三磷酸(L-deoxynucleosideα-thiotriphosphates,L-dNTPαSs),使用镜像Pfu DNA聚合酶进行边合成边测序来实现,并通过2-碘乙醇进行裂解),或通过利用L-双脱氧核苷三磷酸(L-dideoxynucleoside triphosphates,L-ddNTP)的链终止的方法,使用突变镜像Pfu DNA聚合酶来实现。亦应用双向测序方法,使用带有两种不同染剂(分别为FAM及Cy5)的经5’标记的引物,通过变性的聚丙烯酰胺凝胶电泳(polyacrylamide gel electrophoresis,PAGE;PCR),将单个反应中的最大读取长度提高至约180bp。在存储介质中携带信息的L-DNA203bp序列分别由D-Dpo4-5m从经DNase I处理的L-DNA存储库中,利用片段特异性测序引物来进行扩增,通过2.5%琼脂糖凝胶电泳进行分析,及通过ExRed进行染色。M、DNA标记(结果未显示)及L-DNA存储片段S1(SEQ ID No.1)是使用镜像DNA聚合酶,通过硫代磷酸酯的方法进行测序,以检索经编码的数字数据。具体而言,L-DNA S1片段在4个单独的PCR反应中,通过D-Dpo4-5m,利用经5’-FAM标记的(正向)及经5’-Cy5标记的(反向)测序引物进行特异性扩增,其中多个L-dNTP中的一者被相应的L-dNTPαS取代,各个L-dNTPαS被2-碘乙醇切割,并通过10%变性的PAGE进行分析,以及通过在Cy2及Cy5模式下运行的台风多功能扫描仪(Typhoon Trio+)系统进行扫描。通过D-Dpo4-5m与多个L-dNTPαS及经5’-标记的正向及反向测序引物,对信息存储L-DNA片段S1的测序色谱图是由ImageJ软件处理(结果未显示)。虽然镜像Pfu DNA聚合酶能够对L-DNA存储片段进行扩增及测序,然而由于D-Dpo4合成方便,因此在实际的实验中亦是使用D-Dpo4进行。
手性隐写术:
隐写术被称为隐藏信息的艺术及科学,使得除了收件者之外无其他人可看见彼等或知道彼等的存在。其与密码学形成对比,在密码学中,信息本身的存在并未被隐藏,而仅隐藏其内容。本文中所提供的L-DNA信息存储系统亦可通过设计一手性隐写术实验以应用于安全通信,其中编码路易斯巴斯德的第1860段落的D-DNA存储库作为“封面文本”,以及L-DNA密钥有助于解密“隐写文本”(秘密信息)。为了使秘密信息更加隐蔽,设计一种嵌合的D-DNA/L-DNA密钥(SEQ ID No.46),以读取的手性来传达错误信息“错误”或秘密信息“镜子”。D-DNA存储库通过桑格(Sanger)测序来进行测序,以检索“覆盖文本”。使用天然的PCR仅能扩增及测序嵌入在存储库中的嵌合密钥的D-DNA部分,以揭示错误信息,而使用镜像PCR则可扩增及测序嵌合密钥的L-DNA部分,以揭示秘密信息。隐写术及密码学是两种突出的数据保密技术。隐写术是隐藏秘密信息存在的艺术,而密码学是指将秘密信息转换为不可读的格式的做法。此处所开发的手性隐写术可能与DNA密码学结合,使用加密数据,以提供额外的安全层。
图5显示说明根据本发明的一些实施例的基于DNA的隐写术的流程图,将嵌合的D-DNA/L-DNA密钥嵌入看似普通的D-DNA存储库中,以传达秘密信息。
为证明L-DNA信息存储介质逃避生物降解及自然环境污染的能力,从当地的池塘采集淡水样,并添加微量的100-bp L-DNA条形码(SEQ ID No.12)(50μg/L,或770pM),所述L-DNA条形码将样本采集(“北京的荷花池”)的位置信息(表5)编码至经采集的水样中。值得注意的是,携带信息的L-DNA条形码在长达7个月(任意选择的时间段)甚至可能更长的时间内保持稳定及可扩增。相较之下,相同序列及浓度的D-DNA条形码仅在一天后即无法扩增。具体地,将24小时后通过L-Dpo4-5m扩增的D-DNA条形码及1年后通过D-Dpo4-5m扩增的L-DNA条形码进行琼脂糖凝胶电泳,其中D-DNA条形码的PCR扩增是于24小时后,在40ml池塘水样中通过L-Dpo4-5m进行,以及L-DNA条形码的MI-PCR扩增是于1年后在40ml池塘水样中通过D-Dpo4-5m进行,通过3%琼脂糖凝胶电泳进行分析,及通过ExRed进行染色。M,DNA标记(结果未显示)。
此外,从水样中所提取的微生物DNA的L-DNA条形码亦是生物正交的,因为其可通过D-聚合酶及L-DNA引物的镜像PCR进行特异性扩增,且不影响D-DNA宏基因组微生物测序的结果。
通过L-DNA序列的忠实写入及读取的鼓舞,全长1.5-kb的镜像细菌的16S rRNA基因的组装是由高保真的镜像Pfu DNA聚合酶进行。此尝试首先使用两步骤的组装程序,在D-DNA上使用合成的L-聚合酶来测试基因组装:首先从约90nt的短的合成的寡核苷酸来组装450至600bp的DNA块(表6),之后通过第二步,将DNA块组装成全长16S rRNA基因(SEQ IDNO.81)。
表6
在最初的尝试中,全长D-DNA产物的桑格测序表明仅有约40%的经组装序列是正确的(表3),大部分的错误是核苷酸缺失,可能来自寡核苷酸合成的负1-及2-nt产物。因此,使用具有单核苷酸分辨率的变性的PAGE来修改寡核苷酸纯化的方法,其是通过去除大部分的负1-及2-nt产物,来显着地改善合成的寡核苷酸的质量,之后消除大部分的删除错误,且约90%的最终组装序列是正确的(其余序列仅包含单个随机发生的突变)。因此,使用相同的寡核苷酸纯化的方法及镜像组装PCR,进行全长1.5-kb镜像16S rRNA基因的组装,其将作为一模板,用于进一步的酶促转录为镜像16S rRNA,是构建功能性镜像核糖体的关键。具体地,将通过镜像Pfu DNA聚合酶所组装的镜像16S rRNA基因进行琼脂糖凝胶电泳,其中使用Pfu DNA聚合酶并通过镜像组装PCR,获得全长1.5-kb的镜像细菌的16S rRNA基因,通过1.5%琼脂糖凝胶电泳进行分析,以及并通过ExRed进行染色。M,DNA标记(结果未显示)。
DNA模板的RNA聚合作用:
RNA聚合作用是在1×Thermopol缓冲液(新英格兰生物实验室,麻塞诸塞州,美国)、3mM MgSO4、0.625mM(各个)NTP、0.5μM经5’-FAM标记的DNA引物(21nt),及1μM ssDNA模板(41nt),及聚合酶中进行。在加入聚合酶之前,将反应系统加热至94℃,30秒,之后缓慢冷却至4℃,以进行粘合。引物延伸反应是在65℃下进行10分钟。通过添加含有98%甲酰胺、0.25mM EDTA及0.0125% SDS的上样缓冲液,以终止反应,以及通过在8M尿素中的20%变性的PAGE来分析产物。具体而言,在不同的突变Pfu DNA聚合酶的DNA模板的RNA聚合活性分析之后进行PAGE分析,其中通过不同的Pfu DNA聚合酶突变体进行DNA模板定向引物的延伸是使用41-nt单链的DNA模板、经5’-FAM标记的21-nt DNA引物,以及多个NTP,于65℃下培养10分钟,以及通过在8M尿素中的20% PAGE进行分析(结果未显示)。
写入及读取L-DNA:
路易斯巴斯德1860年所发表的包含550个字符(见上文)的段落被转换为具有1650个核苷酸的DNA序列(表4),及编码为长度为220bp的11个L-DNA片段(表5),各个片段皆是由4个短的、合成的70至90nt的L-DNA寡核苷酸进行组装。经组装的PCR程序设置为94℃,3分钟(初始变性);94℃,30秒、55℃,30秒,以及72℃,1分钟(取决于扩增子的长度),35个循环;72℃,10分钟(最终延伸)。针对硫代磷酸酯的方法,在四个独立的PCR反应,通过D-Dpo4-5m(Dpo4的突变版本以促进其化学合成),利用经5’-FAM标记的(正向)引物及经5’-Cy5标记的(反向)引物来扩增L-DNA片段,其中多个L-dNTP中的一者被相应的L-dNTPαS取代。PCR程序设置为86℃,3分钟(初始变性);86℃,30秒、54℃(取决于Tm)1分钟、65℃,1至2.5分钟(取决于扩增子的长度),45个循环;65℃,5分钟(最终延伸)。PCR产物(与相同长度的未经标记的载体dsDNA以1:20w/w进行混合)通过8% PAGE进行纯化,并溶解在水中至浓度约为200ng/μl。针对各个测序反应,将2.5μl双标记的L-DNA与2.5μl含有2%(v/v)2-碘乙醇的变性缓冲液(98%甲酰胺、0.25mM EDTA)进行混合,之后加热至95℃,3分钟,及之后迅速置于冰上。针对链终止的方法,在四个独立的PCR反应中,通过镜像Pfu DNA聚合酶突变体(D215A、L490W)(SEQ ID No.77),使用经5’-FAM标记的(正向)及/或经5’-Cy5标记的(反向)引物,以将L-DNA片段进行扩增,多个L-dNTP中的一者被相应的L-ddNTP以一定的比例进行替换。PCR程序设置为94℃,3分钟(初始变性);94℃,30秒、54℃(取决于Tm)30秒、72℃,30至60秒(取决于扩增子的长度),20个循环;72℃,5分钟(最终延伸)。双标记的PCR产物分别与等体积的变性缓冲液(98%甲酰胺、0.25mM EDTA)进行混合,之后加热至95℃,3分钟,及之后迅速置于冰上。D-DNA片段S1的测序凝胶通过链终止的方法,使用经表达的Pfu DNA聚合酶突变体(D215A,L490W)与多个ddNTP及经5’-Cy5标记的(反向)测序引物。通过Pfu DNA聚合酶突变体(D215A,L490W),利用多个ddNTP及经5’-Cy5标记的反向测序引物所进行的D-DNA片段S1的扩增产物是通过10%变性的PAGE进行分析,及通过在Cy5模式下运行的台风多功能扫描仪(Typhoon Trio+)系统进行扫描。A,dATP部分被ddATP取代;C,dCTP部分被ddCTP替代;G,dGTP部分被ddGTP取代;T,dTTP部分被ddTTP取代(结果未显示)。将测序样本加载至0.4mm×340mm×300mm的平板上,利用在8M尿素中的10%聚丙烯酰胺凝胶进行分离。凝胶在50W(恒定功率)下预运行2小时,直至加热至30至40℃为止。加载之后,凝胶以50W(恒定功率)运行1.5小时,并暂停进行荧光扫描,之后凝胶继续运行,并每隔一小时扫描一次,直至总运行时间达到5小时为止。聚丙烯酰胺凝胶通过台风多功能扫描仪(Typhoon Trio+)系统,分别以Cy2及Cy5模式进行扫描。凝胶定量及色谱图通过ImageJ软件进行分析。
手性隐写术:
使用上述的方法,利用D-及L-脱氧核苷亚磷酰胺来合成嵌合D-DNA/L-DNA寡核苷酸。将寡核苷酸D-F1、D-R1、D/L-F2及D/L-R2(表7)加热至95℃,3分钟,且之后缓慢冷却至4℃,以进行粘合,以及经粘合的双链DNA通过T3 DNA连接酶(新英格兰生物实验室,麻塞诸塞州,美国),在25℃下进行连接1.5小时。作为“封面文本”的D-DNA存储库是通过TransStartFastPfu Fly聚合酶(全式金生物技术公司,北京,中国)使用与L-DNA存储库类似的方法所制得。将通过琼脂糖凝胶纯化的嵌合的双链D-DNA/L-DNA密钥作为各个D-DNA片段,以1:1的浓度比例添加至D-DNA存储库中。11个信息存储D-DNA片段及嵌合密钥的D-DNA部分分别利用来自存储库的片段特异性引物进行扩增,并通过零背景ZT4简单-直白快速克隆试剂盒(Zero Background ZT4 Simple-Blunt Fast Clone Kit)(北京庄盟国际生物基因科技有限公司,北京,中国)进行克隆,以用于桑格测序(补充表S6)。嵌合密钥的L-DNA部分是通过存储库中的D-Dpo4-5m,利用L-M13F及L-M13R引物扩增,并通过硫代磷酸酯方法进行测序。
表7显示用于手性隐写术的序列,其中小写字母是D-DNA序列,大写字母是L-DNA序列,下划线(下划线(underscore);下划线(understrike))的字母是用于扩增及测序各个片段的独特序列。
表7
L-DNA条形码:
2019年12月8日在清华大学莲花池(北纬40°0'27",东经116°19'34")采集未经纯化的环境水样。将合成的D-及L-DNA寡核苷酸加热至95℃,5分钟,并缓慢冷却至4℃,以进行粘合,并将经粘合的dsDNA添加至水样中至浓度为50μg/L。为了扩增DNA条形码(SEQ IDNo.12),将2ml的水样通过0.22μm过滤器(颇尔公司,威斯康星州,美国)进行过滤,通过Amicon Utra离心过滤装置(0.5ml,10,000MWCO)重悬于经DEPC处理的水中,之后通过D-/L-Pfu DNA聚合酶进行扩增。PCR程序设置为94℃,3分钟(初始变性);94℃,30秒、55℃,30秒、72℃,1分钟,25个循环;72℃,10分钟(最终延伸)。针对宏基因组微生物的DNA提取,利用0.2μm Supor 200PES膜盘过滤器(颇尔公司,纽约州,美国)将水样进行过滤,以及微生物的DNA通过DNeasy PowerSoil试剂盒(凯杰公司,马里兰州,美国)进行提取。
16S rRNA基因组装:
合成的寡核苷酸长度约为90nt,浓度分别为0.005至0.02μM(内部)或0.2μM(外部),分两步骤组装成全长基因。在第一步骤中,组装PCR程序设置为94℃,3分钟(初始变性);94℃,30秒、60℃,30秒、72℃,3分钟,35个循环;72℃,10分钟(最终延伸)。在第二步骤中,先前组装的DNA块长度约为450至550bp,在进行组装PCR之前,利用1.5%琼脂糖凝胶进行纯化。组装PCR程序设置为94℃,3分钟(初始变性);94℃,30秒、60℃,30秒、72℃,7分钟,35个循环;72℃,10分钟(最终延伸)。利用PCR程序设置来进一步扩增组装的产物:94℃,3分钟(初始变性);94℃,30秒、60℃,30秒、72℃,7分钟,35个循环;72℃,10分钟(最终延伸)。通过V-elute凝胶小型纯化试剂盒(V-elute Gel Mini Purification Kit)(北京庄盟国际生物基因科技有限公司,北京,中国)来纯化的天然组装的PCR的最终D-DNA产物(SEQ IDNo.81),以及通过零背景ZT4简单-直白快速克隆试剂盒(Zero Background ZT4 Simple-Blunt Fast Clone Kit)(北京庄盟国际生物基因科技有限公司,北京,中国)进行克隆,以用于桑格测序。
尽管已结合其特定实施例描述本发明,然而显然许多替代、修改及变化对于本领域技术人员而言将是显而易见的。因此,旨在涵盖落入所附权利要求的精神及广泛范围内的所有此类替代、修改及变化。
本说明书中提及的所有出版物、专利及专利申请按皆通过引用以其整体并入说明书中,其程度如同各个单独的出版物、专利或专利申请案被具体且单独地指示通过引用并入本文中。此外,本申请中对任何参考文献的引用或识别不应被解释为承认此类参考文献可作为本发明的现有技术使用。就使用章节标题而言,其不应被解释为必然的限制。此外,本申请的任何优先权文件通过引用整体并入本文中。
参考文献:
1.L.切泽、J.尼瓦拉、K.施特劳斯,使用DNA的分子数字数据存储,Nat Rev Genet20,456-466(2019)。
2.N.戈德曼等人,在合成DNA中实现实用、高容量、低维护的信息存储,Nature494,77-80(2013)。
3.G.M.邱取、Y.高、S.高瑟利,在DNA中的下一代数字信息存储,Science 337,1628(2012)。
4.L.巴斯德,天然有机产品的分子不对称性研究,Soc.Chim.Paris,(1860年)。
5.Z.王、W.徐、L.刘、T.F.朱,一种能够进行镜像遗传复制及转录的合成分子系统,Nature Chemistry 8,698-704(2016)。
6.M.裴洛,与朱婷的对话,ACS Cent Sci 4,783-784(2018)。
7.M.裴洛,镜像酶复制镜子DNA,Nature 533,303-304(2016)。
8.S.L.比吾给驹、M.H.卡拉瑟斯,脱氧核苷亚磷酰胺-一种用于脱氧多核苷酸合成的新型关键中间体,Tetrahedron Lett 22,1859-1862(1981)。
9.Y.刘等人,具有位置选择性标记及镶嵌组分的RNA的合成及应用,Nature 522,368-372(2015)。
10.R.B.梅里菲尔德,固相肽合成.1.四肽的合成,Journal of the AmericanChemical Society 85,2149-&(1963)。
11.L.Z.严、P.E.道森,通过天然化学连接结合脱硫以合成不含半胱氨酸残基的肽及蛋白质,J Am Chem Soc 123,526-533(2001)。
12.P.道森、T.缪尔、I.克拉克-刘易斯、S.肯特,通过天然化学连接合成蛋白质,Science 266,776-779(1994)。
13.G.-M.方等人,通过肽酰肼连接进行蛋白质化学合成,Angewandte ChemieInternational Edition 50,7645-7649(2011)。
14.R.米尔顿、S.米尔顿、S.肯特,D-酶的全化学合成:HIV-1蛋白酶的对映体显示相互手性受质特异性,Science 256,1445-1448(1992)。
15.A.A.维诺格拉多夫、E.D.埃文斯、B.L.潘特柳特,镜像芽孢杆菌酶的全合成及生化表征,Chemical Science 6,2997-3002(2015)。
16.M.T.温斯托克、M.T.雅各布森、M.S.凯,镜像酶的合成及折叠揭示灵巧的伴护蛋白活性,Proceedings of the National Academy of Sciences of the United Statesof America 111,11679-11684(2014)。
17.W.徐等人,能够进行聚合酶链反应的热稳定酶的全化学合成,Cell discovery3,17008(2017)。
18.W.姜等人,镜像聚合酶链反应,Cell discovery 3,17037(2017)。
19.A.佩奇等人,用于镜像PCR的热稳定性d-聚合酶,Nucleic Acids Res 45,3997-4005(2017)。
20.L.E.扎瓦兹克、J.M.伯格,一种外消旋蛋白,Journal of the AmericanChemical Society 114,4002-4003(1992)。
21.M.王等人,镜像基因转录及逆转录,Chem 5,848-857(2019)。
22.B.J.拉马尔什、S.库马尔、M.D.蔡,ASFV DNA聚合酶X在不同的分析条件下及多个DNA序列背景下极易出错,Biochemistry 45,14826-14833(2006)。
23.H.林、F.布索克、R.伍德盖特、W.杨,Y家族DNA聚合酶的晶体结构在起作用:一种容易出错及损伤旁路的复制机制,Cell 107,91-102(2001)。
24.F.布索克、S.岩井、F.花冈、R.伍德盖特,硫化叶硫化叶菌P2 DNA聚合酶IV(Dpo4):一种古细菌DinB样DNA聚合酶具有类似于真核polη的损伤旁路特性,NucleicAcids Research 29,4607-4616(2001)。
25.J.克莱因、J.C.布拉曼、H.H.霍格雷夫,pfu DNA聚合酶及其他耐热DNA聚合酶的PCR保真度,Nucleic Acids Res 24,3546-3551(1996)。
26.C.J.汉森、L.吴、J.D.福克斯、B.阿雷齐、H.H.霍格雷夫,在Pfu DNA聚合酶手指结构域中的工程分裂改善核苷酸γ-磷酸衍生物的掺入,Nucleic Acids Res 39,1801-1810(2011)。
27.Q.万、S.J.丹麦谢夫斯基,基于自由基的半胱氨酸特异性脱硫:多肽及糖多肽合成的有力进展,Angew Chem Int Ed Engl 46,9248-9252(2007)。
28.J.T.海德C、欧文D、奎贝尔M、谢泼德RC.,一些“困难的序列”变得简单,International journal of peptide and Protein Research 43,431-440(1994)。
29.T.约翰逊、M.奎贝尔、R.C.谢泼德,N-(2-羟基-4-甲氧基苄基)-氨基酸的N,O-双Fmoc衍生物:在肽合成中的有用中间体,Journal of Peptide Science 1,11-25(1995)。
30.J.S.郑等人,通过可移除的主链修饰的一般方法稳健地化学合成膜蛋白,J AmChem Soc 138,3553-3561(2016)。
31.M.T.雅各布森等人,帮助克服在化学蛋白质合成中的溶解度挑战,J Am ChemSoc 138,11775-11782(2016)。
32.F.W.托斯滕·沃尔、阿德尔·内夫齐、芭芭拉·罗韦德、佐藤辰典、孙西城、曼弗雷德·穆特,伪脯氨酸作为在肽合成中的溶解、结构破坏保护技术,J Am Chem Soc 118,9218-9227(1996)。
33.M.K.帕斯卡·达米、德克兰E.赖安、芭芭拉·罗韦德、托斯滕·沃尔、曼弗雷德·马特,作为分子铰链的伪脯氨酸:顺式酰胺键可逆诱导进入肽主链,J.Am.Chem.Soc.119,918-925(1997)。
34.Y.索玛等人,“O-酰基异肽法”用于高效合成含有困难的序列的肽:使用“O-酰基异二肽单元”,Tetrahedron Letters 47,3013-3017(2006)。
35.I.寇尹,难的肽的固相合成的缩肽方法,Journal of peptide science:anofficial publication of the European Peptide Society 16,223-230(2010)。
36.G.M.方、J.X.王、L.刘,通过肽酰肼的连接的蛋白质的聚合性化学合成,AngewChem Int Ed Engl 51,10347-10350(2012)。
37.J.S.郑、S.唐、Y.K.齐、Z.P.王、L.刘,使用肽酰肼作为硫酯替代物的蛋白质的化学合成,Nat Protoc 8,2483-2495(2013)。
38.N.K.L.、G.杰拉德、E.弗里茨、V.汉斯-彼得,通过掺入脱氧核苷α-硫代三磷酸,对聚合酶链反应扩增的DNA片段进行直接测序,Nucleic Acids Research,21(1988)。
39.G.吉什、F.埃克斯坦,基于硫代磷酸酯化学的DNA及RNA序列测定,Science240,1520-1522(1988)。
40.C.Y.陈,DNA聚合酶驱动DNA边合成边测序技术:过去及现在,Front Microbiol5,305(2014)。
41.A.S.熊等人,一种简单、快速、高保真及具有成本效益的基于PCR的长基因序列两步DNA合成方法,Nucleic Acids Res 32,e98(2004)。
42.A.蒂森、P.佩雷斯-罗德里格斯、L.J.狄雷伊-阿雷东多,在不同植物、动物、真菌及微生物物种中的蛋白质大小分布的数学建模及比较揭示介于蛋白质大小及蛋白质数量之间的负相关,从而提供对蛋白质组进化的洞察力,BMC Res Notes 5,85(2012)。
43.C.考曾斯、V.B.皮涅罗、A.魏斯曼、R.伍德盖特、P.霍利格,从DNA至RNA聚合酶的短的适应性路径,Proc Natl Acad Sci U S A 109,8067-8072(2012)。
44.X.刘,T.F.朱,化学测序镜像DNA,Cell Chemical Biology 25,1151-1156e1153(2018)。
45.D.韦德等人,含全D氨基酸的通道形成抗生素肽,Proc Natl Acad Sci USA87,4761-4765(1990)。
<110> 清华大学(Tsinghua University)
朱婷(ZHU, Ting)
范楚尧(FAN, Chuyao)
邓匡(DENG, Qiang)
徐元(XU, Yuan)
<120> 大型及镜像蛋白质的化学合成及其用途
<130> 87597
<150> US 63/061,844
<151> 2020-08-06
<160> 116
<170> PatentIn version 3.5
<210> 1
<211> 220
<212> DNA
<213> 人工序列
<220>
<223> L-DNA核酸序列
<400> 1
gtaaaacgac ggccagttcg cgcgtttcgg tgatgacggt gaaaaccatt acaataacgt 60
actgcatcca gagttactag atgaaccata tgtacacttg acgttccatc agcctaatca 120
cttcgatgat cctgcgttag actatgtcaa gcagtcatta gatcagctac ctatgacata 180
tgtaccagat gatcactagt atcgtcatag ctgtttcctg 220
<210> 2
<211> 220
<212> DNA
<213> 人工序列
<220>
<223> L-DNA核酸序列
<400> 2
gtaaaacgac ggccagttct gacacatgca gctcccggag acggtcaatt acccgatcga 60
gccagtcgat cacttcgatg atcacgtagc gtctgctgat gacttcacgt atcagtctaa 120
tctacacgac tcattcaacg tgaatcgact caagttgcca tcagacttag atcagctaga 180
tctgccatat gatctagtcg agtgtcatag ctgtttcctg 220
<210> 3
<211> 220
<212> DNA
<213> 人工序列
<220>
<223> L-DNA核酸序列
<400> 3
gtaaaacgac ggccagtcag cttgtctgta agcggatgcc gggagcaatt agacattgat 60
gcatccagtc gacgtacgat atgatcagca cttagatcta gatgtactag atgatcagtt 120
caatctgcag ctcaatgcag actagcagtt actccatcac ttcgatgatc cagagttact 180
agactagcac tcatactagc gtcgtcatag ctgtttcctg 220
<210> 4
<211> 220
<212> DNA
<213> 人工序列
<220>
<223> L-DNA核酸序列
<400> 4
gtaaaacgac ggccagtgac aagcccgtca gggcgcgtca gcgggtcatt aggatgatca 60
tgtgaatgct gatgtacact tagatcagtc taatcacgtg atgaatctga agcgtcagct 120
acgatatcgt aatgagctac gattagatcc gaagtcattg atgcatcacg tagtagcatc 180
tgatgatcac ttcgatgatc agtgtcatag ctgtttcctg 220
<210> 5
<211> 220
<212> DNA
<213> 人工序列
<220>
<223> L-DNA核酸序列
<400> 5
gtaaaacgac ggccagtttg gcgggtgtcg gggctggctt aactatgatt taagacgaca 60
gttagagcac tatgatcacg tagcgtctgc tgatgacttc acgttctatc atagacatgt 120
catcgacgga ctagatcacg atctacatgc gaatccgaag ttcatgatgc atccgaagtc 180
attgatgcat cgactcaatg taggtcatag ctgtttcctg 220
<210> 6
<211> 220
<212> DNA
<213> 人工序列
<220>
<223> L-DNA核酸序列
<400> 6
gtaaaacgac ggccagtcgg catcagagca gattgtactg agagtgcatt tatatgtaca 60
ctatcagcac ttagatgtga ctaatcacta gtatcagtca ttcaatcgtc agcatgcgat 120
ctatcatacg atcgagtatc cagagtcatt gatgcatcct aagttcaatg tagatgatga 180
tcacttcgat gatcagttca gatgtcatag ctgtttcctg 220
<210> 7
<211> 220
<212> DNA
<213> 人工序列
<220>
<223> L-DNA核酸序列
<400> 7
gtaaaacgac ggccagtacc atatgcggtg tgaaataccg cacagatatt ttaacgtaca 60
gctagacgac tagcagttac atcagtctaa tctgaagcgt cagctacgat atcacttcga 120
gctacgatta gatcagccta atccagatgt gatgacattg aagttagatg tccatctcaa 180
gcgattcgac tatcacgtag atcgtcatag ctgtttcctg 220
<210> 8
<211> 220
<212> DNA
<213> 人工序列
<220>
<223> L-DNA核酸序列
<400> 8
gtaaaacgac ggccagtgcg taaggagaaa ataccgcatc aggcgtgatt ttcagcacta 60
tcagctagtc catcgtaatg cagacgctga tgatctgaat gctaactcac atcagcctaa 120
tcacttcgat gatcacgtga gtacatctga tgtacatcag tctaatcact tcgatgatcg 180
tatgaagtag ttgctccatc tacgtcatag ctgtttcctg 220
<210> 9
<211> 220
<212> DNA
<213> 人工序列
<220>
<223> L-DNA核酸序列
<400> 9
gtaaaacgac ggccagtatt cgccattcag gctgcgcaac tgttgggatt ttgagtcgaa 60
tctgaatgct aacttccatc gtaatgcaga cgctgatgat ctcaagcgat tcgacttgga 120
tcataacttc gatgtagatg atcacgtcaa tgatcctgcg ttagactatg tcaagcatgt 180
agatccgatc gagccagtcg atcgtcatag ctgtttcctg 220
<210> 10
<211> 220
<212> DNA
<213> 人工序列
<220>
<223> L-DNA核酸序列
<400> 10
gtaaaacgac ggccagtaag ggcgatcggt gcgggcctct tcgctataca attctacatt 60
catacagcta gtcgatcctg catcagtcga tccgaagttc agcaatccta agttcaatca 120
cttcgatgat cctacatact cattcaatgt ccatcacgta ctgcatctgc atgctgacgt 180
actgcatctc gatgtaccag atggtcatag ctgtttcctg 220
<210> 11
<211> 220
<212> DNA
<213> 人工序列
<220>
<223> L-DNA核酸序列
<400> 11
gtaaaacgac ggccagttac gccagctggc gaaaggggga tgtgctgaca acactaagtt 60
caacttcgat cacttcgatg atcctgagtt agactatcta gatgtcaagc agtcattaga 120
tccagagtta ctagagctgc atgtcaacga ctagcagtta catcctatca agtctgatct 180
agcagagcat gtaccagatg tctgtcatag ctgtttcctg 220
<210> 12
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> DNA条形码核酸序列
<400> 12
gtaaaacgac ggccagtata tgaagtactc attagatcat agacagttac tgctccatca 60
tagtaatgag caatagctac gatgtcatag ctgtttcctg 100
<210> 13
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 13
tttgttggag agtttgatcc tggctcaggg tgaacgctgg cggcgtgcct aagacatgca 60
agtcgtgcgg gccgcggggt tttactccgt 90
<210> 14
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 14
tttccccggg ttgtccccct cttccgggta ggtcacccac gcgttactca cccgtccgcc 60
gctgaccacg gagtaaaacc ccgcggcccg 90
<210> 15
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 15
ggaagagggg gacaacccgg ggaaactcgg gctaatcccc catgtggacc cgccccttgg 60
ggtgtgtcca aagggctttg cccgcttccg 90
<210> 16
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 16
cggctacccg tcgtcgcctt ggtgggccat taccccacca actagctgat gggacgcggg 60
cccatccgga agcgggcaaa gccctttgga 90
<210> 17
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 17
aaggcgacga cgggtagccg gtctgagagg atggccggcc acaggggcac tgagacacgg 60
gccccactcc tacgggaggc agcagttagg 90
<210> 18
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 18
accccgaagg gcttcttcct ccaagcggcg tcgctccgtc aggcttgcgc ccattgcgga 60
agattcctaa ctgctgcctc ccgtaggagt 90
<210> 19
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 19
cttggaggaa gaagcccttc ggggtgtaaa ctcctgaacc cgggacgaaa cccccgacga 60
ggggactgac ggtaccgggg taatagcgcc 90
<210> 20
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 20
acgcccagtg aatccgggta acgctcgcgc cctccgtatt accgcggctg ctggcacgga 60
gttggccggc gctattaccc cggtaccgtc 90
<210> 21
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 21
gcgttacccg gattcactgg gcgtaaaggg cgtgtaggcg gcctggggcg tcccatgtga 60
aagaccacgg ctcaaccgtg ggggagcgtg 90
<210> 22
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 22
tatctgcgca tttcaccgct actccgggaa ttccaccacc ctctcccacc gtctagcctg 60
agcgtatccc acgctccccc acggttgagc 90
<210> 23
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 23
aattcccgga gtagcggtga aatgcgcaga taccgggagg aacgccgatg gcgaaggcag 60
ccacctggtc cacccgtgac gctgaggcgc 90
<210> 24
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 24
agacctagcg cgcatcgttt agggcgtgga ctacccgggt atctaatccg gtttgctccc 60
cacgctttcg cgcctcagcg tcacgggtgg 90
<210> 25
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 25
ccctaaacga tgcgcgctag gtctctgggt ctcctggggg ccgaagctaa cgcgttaagc 60
gcgccgcctg gggagtacgg ccgcaaggct 90
<210> 26
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 26
ttcgcgttgc ttcgaattaa accacatgct ccaccgcttg tgcgggcccc cgtcaattcc 60
tttgagtttc agccttgcgg ccgtactccc 90
<210> 27
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 27
ggagcatgtg gtttaattcg aagcaacgcg aagaacctta ccaggccttg acatgctagg 60
gaacccgggt gaaagcctgg ggtgccccgc 90
<210> 28
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 28
ggacttaacc caacacctca cggcacgagc tgacgacggc catgcagcac ctgtgctagg 60
gctcccctcg cggggcaccc caggctttca 90
<210> 29
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 29
cgtgccgtga ggtgttgggt taagtcccgc aacgagcgca acccccgccg ttagttgcca 60
gcggttcggc cgggcactct aacgggactg 90
<210> 30
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 30
tgtgtcgccc aggccgtaag ggccatgctg accagacgtc gtcccctcct tcctcccgct 60
ttcgcgggca gtcccgttag agtgcccggc 90
<210> 31
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 31
ggcccttacg gcctgggcga cacacgtgct acaatgccca ctacaaagcg atgccacccg 60
gcaacgggga gctaatcgca aaaaggtggg 90
<210> 32
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 32
gatccgcgat tactagcgat tccggcttca tggggtcggg ttgcagaccc caatccgaac 60
tgggcccacc tttttgcgat tagctccccg 90
<210> 33
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 33
gccggaatcg ctagtaatcg cggatcagcc atgccgcggt gaatacgttc ccgggccttg 60
tacacaccgc ccgtcacgcc atgggagcgg 90
<210> 34
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 34
cgacttcgcc ccagtcacgg gccctaccct cggcgcctgc ccgtaggctc ccggcgactt 60
cgggtagagc ccgctcccat ggcgtgacgg 90
<210> 35
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 35
ccgcaccttc cggtacagct accttgttac gacttcgccc cagtcacggg ccct 54
<210> 36
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 单链DNA寡核苷酸
<400> 36
gtaaaacgac ggccagt 17
<210> 37
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 单链DNA寡核苷酸
<400> 37
caggaaacag ctatgac 17
<210> 38
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 38
gtgctgcaag gcgattaatt aggtatacaa ccagaaccag attaagattg tata 54
<210> 39
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的寡核苷酸的核酸序列
<400> 39
ctatgactgt taacctatac aatcttaatc tggttctggt tgtataccta attaatcgcc 60
ttgcagcac 69
<210> 40
<211> 113
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的D-/L-嵌合寡核苷酸的核酸序列
<400> 40
ggttaacagt catagctgtt tcctggtaaa acgacggcca gtattacctt aacaacctat 60
accacatata ccaggttcag attctatagg ttcacagtca tagctgtttc ctg 113
<210> 41
<211> 98
<212> DNA
<213> 人工序列
<220>
<223> 短的合成的D-/L-嵌合寡核苷酸的核酸序列
<400> 41
caggaaacag ctatgactgt gaacctatag aatctgaacc tggtatatgt ggtataggtt 60
gttaaggtaa tactggccgt cgttttacca ggaaacag 98
<210> 42
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 单链DNA寡核苷酸
<400> 42
gtgctgcaag gcgatta 17
<210> 43
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 单链DNA寡核苷酸
<400> 43
caggaaacag ctatgac 17
<210> 44
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 单链L-DNA寡核苷酸
<400> 44
gtaaaacgac ggccagt 17
<210> 45
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 单链L-DNA寡核苷酸
<400> 45
caggaaacag ctatgac 17
<210> 46
<211> 167
<212> DNA
<213> 人工序列
<220>
<223> D-/L-嵌合DNA核酸序列
<400> 46
gtgctgcaag gcgattaatt aggtatacaa ccagaaccag attaagattg tataggttaa 60
cagtcatagc tgtttcctgg taaaacgacg gccagtatta ccttaacaac ctataccaca 120
tataccaggt tcagattcta taggttcaca gtcatagctg tttcctg 167
<210> 47
<211> 775
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶
<400> 47
Met Ile Leu Asp Val Asp Tyr Ile Thr Glu Glu Gly Lys Pro Val Ile
1 5 10 15
Arg Leu Phe Lys Lys Glu Asn Gly Lys Phe Lys Ile Glu His Asp Arg
20 25 30
Thr Phe Arg Pro Tyr Ile Tyr Ala Leu Leu Arg Asp Asp Ser Lys Ile
35 40 45
Glu Glu Val Lys Lys Ile Thr Gly Glu Arg His Gly Lys Ile Val Arg
50 55 60
Ile Val Asp Val Glu Lys Val Glu Lys Lys Phe Leu Gly Lys Pro Ile
65 70 75 80
Thr Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Val Pro Thr Ile
85 90 95
Arg Glu Lys Val Arg Glu His Pro Ala Val Val Asp Ile Phe Glu Tyr
100 105 110
Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro
115 120 125
Met Glu Gly Glu Glu Glu Leu Lys Ile Leu Ala Phe Asp Ile Glu Thr
130 135 140
Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Ile Met Ile
145 150 155 160
Ser Tyr Ala Asp Glu Asn Glu Ala Lys Val Ile Thr Trp Lys Asn Ile
165 170 175
Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Ile Lys
180 185 190
Arg Phe Leu Arg Ile Ile Arg Glu Lys Asp Pro Asp Ile Ile Val Thr
195 200 205
Tyr Asn Gly Asp Ser Phe Asp Phe Pro Tyr Leu Ala Lys Arg Ala Glu
210 215 220
Lys Leu Gly Ile Lys Leu Thr Ile Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240
Met Gln Arg Ile Gly Asp Met Thr Ala Val Glu Val Lys Gly Arg Ile
245 250 255
His Phe Asp Leu Tyr His Val Ile Thr Arg Thr Ile Asn Leu Pro Thr
260 265 270
Tyr Thr Leu Glu Ala Val Tyr Glu Ala Ile Phe Gly Lys Pro Lys Glu
275 280 285
Lys Val Tyr Ala Asp Glu Ile Ala Lys Ala Trp Glu Ser Gly Glu Asn
290 295 300
Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Lys Ala Thr Tyr
305 310 315 320
Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ile Gln Leu Ser Arg Leu
325 330 335
Val Gly Gln Pro Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350
Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Val Ala
355 360 365
Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln Arg Arg Leu Arg Glu Ser
370 375 380
Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn
385 390 395 400
Ile Val Tyr Leu Asp Phe Arg Ala Leu Tyr Pro Ser Ile Ile Ile Thr
405 410 415
His Asn Val Ser Pro Asp Thr Leu Asn Leu Glu Gly Cys Lys Asn Tyr
420 425 430
Asp Ile Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp Ile Pro Gly
435 440 445
Phe Ile Pro Ser Leu Leu Gly His Leu Leu Glu Glu Arg Gln Lys Ile
450 455 460
Lys Thr Lys Met Lys Glu Thr Gln Asp Pro Ile Glu Lys Ile Leu Leu
465 470 475 480
Asp Tyr Arg Gln Lys Ala Ile Lys Leu Leu Ala Asn Ser Phe Tyr Gly
485 490 495
Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu
500 505 510
Ser Val Thr Ala Trp Gly Arg Lys Tyr Ile Glu Leu Val Trp Lys Glu
515 520 525
Leu Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ile Asp Thr Asp Gly
530 535 540
Leu Tyr Ala Thr Ile Pro Gly Gly Glu Ser Glu Glu Ile Lys Lys Lys
545 550 555 560
Ala Leu Glu Phe Val Lys Tyr Ile Asn Ser Lys Leu Pro Gly Leu Leu
565 570 575
Glu Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys
580 585 590
Lys Arg Tyr Ala Val Ile Asp Glu Glu Gly Lys Val Ile Thr Arg Gly
595 600 605
Leu Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln
610 615 620
Ala Arg Val Leu Glu Thr Ile Leu Lys His Gly Asp Val Glu Glu Ala
625 630 635 640
Val Arg Ile Val Lys Glu Val Ile Gln Lys Leu Ala Asn Tyr Glu Ile
645 650 655
Pro Pro Glu Lys Leu Ala Ile Tyr Glu Gln Ile Thr Arg Pro Leu His
660 665 670
Glu Tyr Lys Ala Ile Gly Pro His Val Ala Val Ala Lys Lys Leu Ala
675 680 685
Ala Lys Gly Val Lys Ile Lys Pro Gly Met Val Ile Gly Tyr Ile Val
690 695 700
Leu Arg Gly Asp Gly Pro Ile Ser Asn Arg Ala Ile Leu Ala Glu Glu
705 710 715 720
Tyr Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn
725 730 735
Gln Val Leu Pro Ala Val Leu Arg Ile Leu Glu Gly Phe Gly Tyr Arg
740 745 750
Lys Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Thr Ser
755 760 765
Trp Leu Asn Ile Lys Lys Ser
770 775
<210> 48
<211> 775
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的突变版本
<400> 48
Met Ile Leu Asp Val Asp Tyr Ile Thr Glu Glu Gly Lys Pro Val Ile
1 5 10 15
Arg Leu Phe Lys Lys Glu Asn Gly Lys Phe Lys Ile Glu His Asp Arg
20 25 30
Thr Phe Arg Pro Tyr Ile Tyr Ala Leu Leu Arg Asp Asp Ser Lys Ile
35 40 45
Glu Glu Val Lys Lys Ile Thr Gly Glu Arg His Gly Lys Ile Val Arg
50 55 60
Ile Val Asp Val Glu Lys Val Glu Lys Lys Phe Leu Gly Lys Pro Ile
65 70 75 80
Thr Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Val Pro Thr Ile
85 90 95
Arg Glu Lys Val Arg Ala His Pro Ala Val Val Asp Ile Phe Glu Tyr
100 105 110
Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro
115 120 125
Met Glu Gly Glu Glu Glu Leu Lys Ile Leu Ala Phe Asp Ile Glu Thr
130 135 140
Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Ile Met Ile
145 150 155 160
Ser Tyr Ala Asp Glu Asn Glu Ala Lys Val Ile Thr Trp Lys Asn Ile
165 170 175
Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Ile Lys
180 185 190
Arg Phe Leu Arg Ile Ile Arg Glu Lys Asp Pro Asp Ile Ile Val Thr
195 200 205
Tyr Asn Gly Asp Ser Phe Asp Phe Pro Tyr Leu Ala Lys Arg Ala Glu
210 215 220
Lys Leu Gly Ile Lys Leu Thr Ile Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240
Met Gln Arg Ile Gly Asp Met Thr Ala Val Glu Val Lys Gly Arg Ile
245 250 255
His Phe Asp Leu Tyr His Val Ile Thr Arg Thr Ile Asn Leu Pro Thr
260 265 270
Tyr Thr Leu Ala Ala Val Tyr Glu Ala Ile Phe Gly Lys Pro Lys Glu
275 280 285
Lys Val Tyr Ala Asp Glu Ile Ala Lys Ala Trp Glu Ser Gly Glu Asn
290 295 300
Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Gly Ala Thr Tyr
305 310 315 320
Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ile Gln Leu Ser Arg Leu
325 330 335
Val Gly Gln Pro Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350
Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala
355 360 365
Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln Arg Arg Leu Arg Glu Ser
370 375 380
Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn
385 390 395 400
Ile Val Tyr Leu Asp Phe Arg Ala Leu Tyr Pro Ser Ile Ile Ile Thr
405 410 415
His Asn Val Ser Pro Asp Thr Leu Asn Leu Glu Gly Cys Lys Asn Tyr
420 425 430
Asp Ile Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp Ile Pro Gly
435 440 445
Phe Ile Pro Ser Leu Leu Gly His Leu Leu Glu Glu Arg Gln Lys Ile
450 455 460
Lys Thr Lys Met Lys Glu Thr Gln Asp Pro Ile Glu Lys Ile Leu Leu
465 470 475 480
Asp Tyr Arg Gln Lys Ala Ile Lys Leu Leu Ala Asn Ser Phe Tyr Gly
485 490 495
Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu
500 505 510
Ser Val Thr Ala Trp Gly Arg Lys Tyr Ile Glu Leu Val Trp Lys Glu
515 520 525
Leu Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly
530 535 540
Leu Tyr Ala Thr Ile Pro Gly Gly Glu Ser Glu Glu Ile Lys Lys Lys
545 550 555 560
Ala Leu Glu Phe Val Lys Tyr Ile Asn Ser Lys Leu Pro Gly Leu Leu
565 570 575
Glu Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys
580 585 590
Lys Arg Tyr Ala Val Ile Asp Glu Glu Gly Lys Val Ile Thr Arg Gly
595 600 605
Leu Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln
610 615 620
Ala Arg Val Leu Glu Thr Ile Leu Lys His Gly Asp Val Glu Glu Ala
625 630 635 640
Val Arg Ile Val Lys Glu Val Ile Gln Lys Leu Ala Asn Tyr Glu Ile
645 650 655
Pro Pro Glu Lys Leu Ala Ile Tyr Glu Gln Ile Thr Arg Pro Leu His
660 665 670
Glu Tyr Lys Ala Ile Gly Pro His Val Ala Val Ala Lys Lys Leu Ala
675 680 685
Ala Lys Gly Val Lys Ile Lys Pro Gly Met Val Ile Gly Tyr Ile Val
690 695 700
Leu Arg Gly Asp Gly Pro Ile Ser Asn Arg Ala Ile Leu Ala Glu Glu
705 710 715 720
Tyr Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn
725 730 735
Gln Val Leu Pro Ala Val Leu Arg Ile Leu Glu Gly Phe Gly Tyr Arg
740 745 750
Lys Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Thr Ser
755 760 765
Trp Leu Asn Ile Lys Lys Ser
770 775
<210> 49
<211> 775
<212> PRT
<213> 人工序列
<220>
<223> Pfu-5m-55I氨基酸序列
<400> 49
Met Ile Leu Asp Val Asp Tyr Ile Thr Glu Glu Gly Lys Pro Val Ile
1 5 10 15
Arg Leu Phe Lys Lys Glu Asn Gly Lys Phe Lys Ile Glu His Asp Arg
20 25 30
Thr Phe Arg Pro Tyr Ile Tyr Ala Leu Leu Arg Asp Asp Ser Lys Ile
35 40 45
Glu Glu Val Lys Lys Ile Thr Gly Glu Arg His Gly Lys Ile Val Arg
50 55 60
Ile Val Asp Val Glu Lys Val Glu Lys Lys Phe Leu Gly Lys Pro Ile
65 70 75 80
Thr Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Val Pro Thr Ile
85 90 95
Arg Glu Lys Val Arg Ala His Pro Ala Val Val Asp Ile Phe Glu Tyr
100 105 110
Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro
115 120 125
Met Glu Gly Glu Glu Glu Leu Lys Ile Leu Ala Phe Asp Ile Glu Thr
130 135 140
Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Ile Met Ile
145 150 155 160
Ser Tyr Ala Asp Glu Asn Glu Ala Lys Val Ile Thr Trp Lys Asn Ile
165 170 175
Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Ile Lys
180 185 190
Arg Phe Leu Arg Ile Ile Arg Glu Lys Asp Pro Asp Ile Ile Val Thr
195 200 205
Tyr Asn Gly Asp Ser Phe Asp Phe Pro Tyr Leu Ala Lys Arg Ala Glu
210 215 220
Lys Leu Gly Ile Lys Leu Thr Ile Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240
Met Gln Arg Ile Gly Asp Met Thr Ala Val Glu Val Lys Gly Arg Ile
245 250 255
His Phe Asp Leu Tyr His Val Ile Thr Arg Thr Ile Asn Leu Pro Thr
260 265 270
Tyr Thr Leu Ala Ala Val Tyr Glu Ala Ile Phe Gly Lys Pro Lys Glu
275 280 285
Lys Val Tyr Ala Asp Glu Ile Ala Lys Ala Trp Glu Ser Gly Glu Asn
290 295 300
Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Gly Ala Thr Tyr
305 310 315 320
Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ile Gln Leu Ser Arg Leu
325 330 335
Val Gly Gln Pro Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350
Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala
355 360 365
Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln Arg Arg Leu Arg Glu Ser
370 375 380
Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn
385 390 395 400
Ile Val Tyr Leu Asp Phe Arg Ala Leu Tyr Pro Ser Ile Ile Ile Thr
405 410 415
His Asn Val Ser Pro Asp Thr Leu Asn Leu Glu Gly Cys Lys Asn Tyr
420 425 430
Asp Ile Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp Ile Pro Gly
435 440 445
Phe Ile Pro Ser Leu Leu Gly His Leu Leu Glu Glu Arg Gln Lys Ile
450 455 460
Lys Thr Lys Met Lys Glu Thr Gln Asp Pro Ile Glu Lys Lys Leu Leu
465 470 475 480
Asp Tyr Arg Gln Lys Ala Ile Lys Leu Leu Ala Asn Ser Phe Tyr Gly
485 490 495
Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu
500 505 510
Ser Val Thr Ala Trp Gly Arg Lys Tyr Ile Glu Leu Val Trp Lys Glu
515 520 525
Leu Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly
530 535 540
Leu Tyr Ala Thr Ile Pro Gly Gly Glu Ser Glu Glu Val Lys Lys Lys
545 550 555 560
Ala Leu Glu Phe Val Lys Tyr Ile Asn Ser Lys Leu Pro Gly Leu Leu
565 570 575
Glu Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys
580 585 590
Lys Arg Tyr Ala Val Val Asp Glu Glu Gly Lys Val Thr Thr Arg Gly
595 600 605
Leu Glu Val Val Arg Arg Asp Trp Ser Glu Ala Ala Lys Glu Thr Gln
610 615 620
Ala Arg Val Leu Glu Thr Leu Leu Lys His Gly Asp Val Glu Glu Ala
625 630 635 640
Val Arg Val Val Lys Glu Val Thr Gln Lys Leu Ala Asn Tyr Glu Val
645 650 655
Pro Pro Glu Lys Leu Ala Ile Tyr Glu Gln Ile Thr Arg Pro Leu His
660 665 670
Glu Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Lys Leu Ala
675 680 685
Ala Lys Gly Val Lys Ile Lys Pro Gly Met Val Ile Gly Tyr Ile Val
690 695 700
Leu Arg Gly Asp Gly Pro Ile Ser Asn Arg Ala Tyr Leu Ala Glu Glu
705 710 715 720
Tyr Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Val Glu Asn
725 730 735
Gln Val Leu Pro Ala Val Leu Arg Val Leu Glu Gly Phe Gly Tyr Arg
740 745 750
Lys Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Thr Ser
755 760 765
Trp Leu Asn Pro Lys Lys Ser
770 775
<210> 50
<211> 775
<212> PRT
<213> 人工序列
<220>
<223> Pfu-5m-46I氨基酸序列
<400> 50
Met Ile Leu Asp Val Asp Tyr Ile Thr Glu Glu Gly Lys Pro Val Ile
1 5 10 15
Arg Leu Phe Lys Lys Glu Asn Gly Lys Phe Lys Ile Glu His Asp Arg
20 25 30
Thr Phe Arg Pro Tyr Phe Tyr Ala Leu Leu Arg Asp Asp Ser Lys Ile
35 40 45
Glu Glu Val Lys Lys Ile Thr Gly Glu Arg His Gly Lys Val Val Arg
50 55 60
Val Val Asp Val Glu Lys Val Glu Lys Lys Phe Leu Gly Lys Pro Val
65 70 75 80
Thr Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Val Pro Thr Ile
85 90 95
Arg Glu Lys Val Arg Ala His Pro Ala Val Val Asp Ile Phe Glu Tyr
100 105 110
Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro
115 120 125
Met Glu Gly Glu Glu Glu Leu Lys Met Leu Ala Phe Asp Ile Glu Thr
130 135 140
Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Leu Met Ile
145 150 155 160
Ser Tyr Ala Asp Glu Asn Glu Ala Lys Val Ala Thr Trp Lys Asn Val
165 170 175
Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Val Lys
180 185 190
Arg Phe Leu Arg Val Val Arg Glu Lys Asp Pro Asp Val Leu Val Thr
195 200 205
Tyr Asn Gly Asp Ser Phe Asp Phe Pro Tyr Leu Ala Lys Arg Ala Glu
210 215 220
Lys Leu Gly Val Lys Leu Thr Leu Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240
Met Gln Arg Met Gly Asp Met Thr Ala Val Glu Val Lys Gly Arg Val
245 250 255
His Phe Asp Leu Tyr His Val Ala Thr Arg Thr Leu Asn Leu Pro Thr
260 265 270
Tyr Thr Leu Ala Ala Val Tyr Glu Ala Val Phe Gly Lys Pro Lys Glu
275 280 285
Lys Val Tyr Ala Asp Glu Ile Ala Lys Ala Trp Glu Ser Gly Glu Asn
290 295 300
Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Gly Ala Thr Tyr
305 310 315 320
Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ala Gln Leu Ser Arg Leu
325 330 335
Val Gly Gln Pro Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350
Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala
355 360 365
Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln Arg Arg Leu Arg Glu Ser
370 375 380
Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn
385 390 395 400
Val Val Tyr Leu Asp Phe Arg Ala Leu Tyr Pro Ser Ile Ile Ile Thr
405 410 415
His Asn Val Ser Pro Asp Thr Leu Asn Leu Glu Gly Cys Lys Asn Tyr
420 425 430
Asp Val Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp Phe Pro Gly
435 440 445
Phe Ile Pro Ser Leu Leu Gly His Leu Leu Glu Glu Arg Gln Lys Ile
450 455 460
Lys Thr Lys Met Lys Glu Thr Gln Asp Pro Ile Glu Lys Ile Leu Leu
465 470 475 480
Asp Tyr Arg Gln Lys Ala Ile Lys Leu Leu Ala Asn Ser Phe Tyr Gly
485 490 495
Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu
500 505 510
Ser Val Thr Ala Trp Gly Arg Lys Tyr Ile Glu Leu Val Trp Lys Glu
515 520 525
Leu Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly
530 535 540
Leu Tyr Ala Thr Ile Pro Gly Gly Glu Ser Glu Glu Ile Lys Lys Lys
545 550 555 560
Ala Leu Glu Phe Val Lys Tyr Ile Asn Ser Lys Leu Pro Gly Leu Leu
565 570 575
Glu Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys
580 585 590
Lys Arg Tyr Ala Val Ile Asp Glu Glu Gly Lys Val Ile Thr Arg Gly
595 600 605
Leu Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln
610 615 620
Ala Arg Val Leu Glu Thr Ile Leu Lys His Gly Asp Val Glu Glu Ala
625 630 635 640
Val Arg Ile Val Lys Glu Val Ile Gln Lys Leu Ala Asn Tyr Glu Ile
645 650 655
Pro Pro Glu Lys Leu Ala Ile Tyr Glu Gln Ile Thr Arg Pro Leu His
660 665 670
Glu Tyr Lys Ala Ile Gly Pro His Val Ala Val Ala Lys Lys Leu Ala
675 680 685
Ala Lys Gly Val Lys Ile Lys Pro Gly Met Val Ile Gly Tyr Ile Val
690 695 700
Leu Arg Gly Asp Gly Pro Ile Ser Asn Arg Ala Ile Leu Ala Glu Glu
705 710 715 720
Tyr Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn
725 730 735
Gln Val Leu Pro Ala Val Leu Arg Ile Leu Glu Gly Phe Gly Tyr Arg
740 745 750
Lys Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Thr Ser
755 760 765
Trp Leu Asn Ile Lys Lys Ser
770 775
<210> 51
<211> 775
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的突变版本
<400> 51
Met Ile Leu Asp Val Asp Tyr Ile Thr Glu Glu Gly Lys Pro Val Ile
1 5 10 15
Arg Leu Phe Lys Lys Glu Asn Gly Lys Phe Lys Ile Glu His Asp Arg
20 25 30
Thr Phe Arg Pro Tyr Phe Tyr Ala Leu Leu Arg Asp Asp Ser Lys Ile
35 40 45
Glu Glu Val Lys Lys Ile Thr Gly Glu Arg His Gly Lys Val Val Arg
50 55 60
Val Val Asp Val Glu Lys Val Glu Lys Lys Phe Leu Gly Lys Pro Val
65 70 75 80
Thr Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Val Pro Thr Ile
85 90 95
Arg Glu Lys Val Arg Ala His Pro Ala Val Val Asp Ile Phe Glu Tyr
100 105 110
Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro
115 120 125
Met Glu Gly Glu Glu Glu Leu Lys Met Leu Ala Phe Asp Ile Glu Thr
130 135 140
Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Leu Met Ile
145 150 155 160
Ser Tyr Ala Asp Glu Asn Glu Ala Lys Val Ala Thr Trp Lys Asn Val
165 170 175
Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Val Lys
180 185 190
Arg Phe Leu Arg Val Val Arg Glu Lys Asp Pro Asp Val Leu Val Thr
195 200 205
Tyr Asn Gly Asp Ser Phe Asp Phe Pro Tyr Leu Ala Lys Arg Ala Glu
210 215 220
Lys Leu Gly Val Lys Leu Thr Leu Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240
Met Gln Arg Met Gly Asp Met Thr Ala Val Glu Val Lys Gly Arg Val
245 250 255
His Phe Asp Leu Tyr His Val Ala Thr Arg Thr Leu Asn Leu Pro Thr
260 265 270
Tyr Thr Leu Ala Ala Val Tyr Glu Ala Val Phe Gly Lys Pro Lys Glu
275 280 285
Lys Val Tyr Ala Asp Glu Ile Ala Lys Ala Trp Glu Ser Gly Glu Asn
290 295 300
Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Gly Ala Thr Tyr
305 310 315 320
Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ala Gln Leu Ser Arg Leu
325 330 335
Val Gly Gln Pro Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350
Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala
355 360 365
Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln Arg Arg Leu Arg Glu Ser
370 375 380
Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn
385 390 395 400
Val Val Tyr Leu Asp Phe Arg Ala Leu Tyr Pro Ser Ile Ile Ile Thr
405 410 415
His Asn Val Ser Pro Asp Thr Leu Asn Leu Glu Gly Cys Lys Asn Tyr
420 425 430
Asp Val Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp Phe Pro Gly
435 440 445
Phe Ile Pro Ser Leu Leu Gly His Leu Leu Glu Glu Arg Gln Lys Ile
450 455 460
Lys Thr Lys Met Lys Glu Thr Gln Asp Pro Ile Glu Lys Lys Leu Leu
465 470 475 480
Asp Tyr Arg Gln Lys Ala Ile Lys Leu Leu Ala Asn Ser Phe Tyr Gly
485 490 495
Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu
500 505 510
Ser Val Thr Ala Trp Gly Arg Lys Tyr Ile Glu Leu Val Trp Lys Glu
515 520 525
Leu Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly
530 535 540
Leu Tyr Ala Thr Ile Pro Gly Gly Glu Ser Glu Glu Val Lys Lys Lys
545 550 555 560
Ala Leu Glu Phe Val Lys Tyr Ile Asn Ser Lys Leu Pro Gly Leu Leu
565 570 575
Glu Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys
580 585 590
Lys Arg Tyr Ala Val Val Asp Glu Glu Gly Lys Val Thr Thr Arg Gly
595 600 605
Leu Glu Val Val Arg Arg Asp Trp Ser Glu Ala Ala Lys Glu Thr Gln
610 615 620
Ala Arg Val Leu Glu Thr Leu Leu Lys His Gly Asp Val Glu Glu Ala
625 630 635 640
Val Arg Val Val Lys Glu Val Thr Gln Lys Leu Ala Asn Tyr Glu Val
645 650 655
Pro Pro Glu Lys Leu Ala Ile Tyr Glu Gln Ile Thr Arg Pro Leu His
660 665 670
Glu Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Lys Leu Ala
675 680 685
Ala Lys Gly Val Lys Ile Lys Pro Gly Met Val Ile Gly Tyr Ile Val
690 695 700
Leu Arg Gly Asp Gly Pro Ile Ser Asn Arg Ala Tyr Leu Ala Glu Glu
705 710 715 720
Tyr Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Val Glu Asn
725 730 735
Gln Val Leu Pro Ala Val Leu Arg Val Leu Glu Gly Phe Gly Tyr Arg
740 745 750
Lys Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Thr Ser
755 760 765
Trp Leu Asn Pro Lys Lys Ser
770 775
<210> 52
<211> 775
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的突变版本
<400> 52
Met Val Leu Asp Val Asp Tyr Leu Thr Glu Glu Gly Lys Pro Val Val
1 5 10 15
Arg Leu Phe Lys Lys Glu Asn Gly Lys Phe Lys Val Glu His Asp Arg
20 25 30
Thr Phe Arg Pro Tyr Phe Tyr Ala Leu Leu Arg Asp Asp Ser Lys Leu
35 40 45
Glu Glu Val Lys Lys Val Thr Gly Glu Arg His Gly Lys Val Val Arg
50 55 60
Val Val Asp Val Glu Lys Val Glu Lys Lys Phe Leu Gly Lys Pro Val
65 70 75 80
Thr Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Val Pro Thr Leu
85 90 95
Arg Glu Lys Val Arg Ala His Pro Ala Val Val Asp Val Phe Glu Tyr
100 105 110
Asp Val Pro Phe Ala Lys Arg Tyr Leu Val Asp Lys Gly Leu Val Pro
115 120 125
Met Glu Gly Glu Glu Glu Leu Lys Met Leu Ala Phe Asp Val Glu Thr
130 135 140
Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Val Leu Met Val
145 150 155 160
Ser Tyr Ala Asp Glu Asn Glu Ala Lys Val Ala Thr Trp Lys Asn Val
165 170 175
Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Val Lys
180 185 190
Arg Phe Leu Arg Val Val Arg Glu Lys Asp Pro Asp Val Leu Val Thr
195 200 205
Tyr Asn Gly Asp Ser Phe Asp Phe Pro Tyr Leu Ala Lys Arg Ala Glu
210 215 220
Lys Leu Gly Val Lys Leu Thr Leu Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240
Met Gln Arg Met Gly Asp Met Thr Ala Val Glu Val Lys Gly Arg Val
245 250 255
His Phe Asp Leu Tyr His Val Ala Thr Arg Thr Leu Asn Leu Pro Thr
260 265 270
Tyr Thr Leu Ala Ala Val Tyr Glu Ala Val Phe Gly Lys Pro Lys Glu
275 280 285
Lys Val Tyr Ala Asp Glu Val Ala Lys Ala Trp Glu Ser Gly Glu Asn
290 295 300
Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Gly Ala Thr Tyr
305 310 315 320
Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ala Gln Leu Ser Arg Leu
325 330 335
Val Gly Gln Pro Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350
Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala
355 360 365
Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln Arg Arg Leu Arg Glu Ser
370 375 380
Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn
385 390 395 400
Val Val Tyr Leu Asp Phe Arg Ala Leu Tyr Pro Ser Val Val Val Thr
405 410 415
His Asn Val Ser Pro Asp Thr Leu Asn Leu Glu Gly Cys Lys Asn Tyr
420 425 430
Asp Val Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp Phe Pro Gly
435 440 445
Phe Val Pro Ser Leu Leu Gly His Leu Leu Glu Glu Arg Gln Lys Val
450 455 460
Lys Thr Lys Met Lys Glu Thr Gln Asp Pro Val Glu Lys Lys Leu Leu
465 470 475 480
Asp Tyr Arg Gln Lys Ala Val Lys Leu Leu Ala Asn Ser Phe Tyr Gly
485 490 495
Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu
500 505 510
Ser Val Thr Ala Trp Gly Arg Lys Tyr Val Glu Leu Val Trp Lys Glu
515 520 525
Leu Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly
530 535 540
Leu Tyr Ala Thr Val Pro Gly Gly Glu Ser Glu Glu Val Lys Lys Lys
545 550 555 560
Ala Leu Glu Phe Val Lys Tyr Val Asn Ser Lys Leu Pro Gly Leu Leu
565 570 575
Glu Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys
580 585 590
Lys Arg Tyr Ala Val Val Asp Glu Glu Gly Lys Val Thr Thr Arg Gly
595 600 605
Leu Glu Val Val Arg Arg Asp Trp Ser Glu Ala Ala Lys Glu Thr Gln
610 615 620
Ala Arg Val Leu Glu Thr Leu Leu Lys His Gly Asp Val Glu Glu Ala
625 630 635 640
Val Arg Val Val Lys Glu Val Thr Gln Lys Leu Ala Asn Tyr Glu Val
645 650 655
Pro Pro Glu Lys Leu Ala Val Tyr Glu Gln Val Thr Arg Pro Leu His
660 665 670
Glu Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Lys Leu Ala
675 680 685
Ala Lys Gly Val Lys Val Lys Pro Gly Met Val Val Gly Tyr Val Val
690 695 700
Leu Arg Gly Asp Gly Pro Val Ser Asn Arg Ala Tyr Leu Ala Glu Glu
705 710 715 720
Tyr Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Val Glu Asn
725 730 735
Gln Val Leu Pro Ala Val Leu Arg Val Leu Glu Gly Phe Gly Tyr Arg
740 745 750
Lys Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Thr Ser
755 760 765
Trp Leu Asn Pro Lys Lys Ser
770 775
<210> 53
<211> 774
<212> PRT
<213> 人工序列
<220>
<223> KOD1聚合酶
<400> 53
Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile
1 5 10 15
Arg Ile Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg
20 25 30
Thr Phe Glu Pro Tyr Phe Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile
35 40 45
Glu Glu Val Lys Lys Ile Thr Ala Glu Arg His Gly Thr Val Val Thr
50 55 60
Val Lys Arg Val Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Val
65 70 75 80
Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile
85 90 95
Arg Asp Lys Ile Arg Glu His Pro Ala Val Ile Asp Ile Tyr Glu Tyr
100 105 110
Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro
115 120 125
Met Glu Gly Asp Glu Glu Leu Lys Met Leu Ala Phe Asp Ile Glu Thr
130 135 140
Leu Tyr Glu Glu Gly Glu Glu Phe Ala Glu Gly Pro Ile Leu Met Ile
145 150 155 160
Ser Tyr Ala Asp Glu Glu Gly Ala Arg Val Ile Thr Trp Lys Asn Val
165 170 175
Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Arg Glu Met Ile Lys
180 185 190
Arg Phe Leu Arg Val Val Lys Glu Lys Asp Pro Asp Val Leu Ile Thr
195 200 205
Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu
210 215 220
Lys Leu Gly Ile Asn Phe Ala Leu Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240
Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile
245 250 255
His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr
260 265 270
Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Gln Pro Lys Glu
275 280 285
Lys Val Tyr Ala Glu Glu Ile Thr Thr Ala Trp Glu Thr Gly Glu Asn
290 295 300
Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr
305 310 315 320
Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ala Gln Leu Ser Arg Leu
325 330 335
Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350
Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala
355 360 365
Pro Asn Lys Pro Asp Glu Lys Glu Leu Ala Arg Arg Arg Gln Ser Tyr
370 375 380
Glu Gly Gly Tyr Val Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile
385 390 395 400
Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His
405 410 415
Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp
420 425 430
Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe
435 440 445
Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys
450 455 460
Lys Lys Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu Leu Asp
465 470 475 480
Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Tyr Tyr Gly Tyr
485 490 495
Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser
500 505 510
Val Thr Ala Trp Gly Arg Glu Tyr Ile Thr Met Thr Ile Lys Glu Ile
515 520 525
Glu Glu Lys Tyr Gly Phe Lys Val Ile Tyr Ser Asp Thr Asp Gly Phe
530 535 540
Phe Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Lys Lys Ala
545 550 555 560
Met Glu Phe Leu Lys Tyr Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu
565 570 575
Leu Glu Tyr Glu Gly Phe Tyr Glu Arg Gly Phe Phe Val Thr Lys Lys
580 585 590
Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu
595 600 605
Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala
610 615 620
Arg Val Leu Glu Ala Leu Leu Lys Asp Gly Asp Val Glu Lys Ala Val
625 630 635 640
Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro
645 650 655
Pro Glu Lys Leu Val Ile His Glu Gln Ile Thr Arg Asp Leu Lys Asp
660 665 670
Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala
675 680 685
Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu
690 695 700
Lys Gly Ser Gly Arg Ile Gly Asp Arg Ala Ile Pro Phe Asp Glu Phe
705 710 715 720
Asp Pro Thr Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln
725 730 735
Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys
740 745 750
Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Ser Ala Trp
755 760 765
Leu Lys Pro Lys Gly Thr
770
<210> 54
<211> 773
<212> PRT
<213> 人工序列
<220>
<223> Tgo聚合酶
<400> 54
Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile
1 5 10 15
Arg Ile Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Asp Tyr Asp Arg
20 25 30
Asn Phe Glu Pro Tyr Ile Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile
35 40 45
Glu Asp Val Lys Lys Ile Thr Ala Glu Arg His Gly Thr Thr Val Arg
50 55 60
Val Val Arg Ala Glu Lys Val Lys Lys Lys Phe Leu Gly Arg Pro Ile
65 70 75 80
Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile
85 90 95
Arg Asp Lys Ile Lys Glu His Pro Ala Val Val Asp Ile Tyr Glu Tyr
100 105 110
Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro
115 120 125
Met Glu Gly Asp Glu Glu Leu Lys Met Leu Ala Phe Asp Ile Glu Thr
130 135 140
Leu Tyr His Glu Gly Glu Glu Phe Ala Glu Gly Pro Ile Leu Met Ile
145 150 155 160
Ser Tyr Ala Asp Glu Glu Gly Ala Arg Val Ile Thr Trp Lys Asn Ile
165 170 175
Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Lys Glu Met Ile Lys
180 185 190
Arg Phe Leu Lys Val Val Lys Glu Lys Asp Pro Asp Val Leu Ile Thr
195 200 205
Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Ser Glu
210 215 220
Lys Leu Gly Val Lys Phe Ile Leu Gly Arg Glu Gly Ser Glu Pro Lys
225 230 235 240
Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile
245 250 255
His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr
260 265 270
Tyr Thr Leu Glu Ala Val Tyr Glu Ala Ile Phe Gly Gln Pro Lys Glu
275 280 285
Lys Val Tyr Ala Glu Glu Ile Ala Gln Ala Trp Glu Thr Gly Glu Gly
290 295 300
Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr
305 310 315 320
Glu Leu Gly Lys Glu Phe Phe Pro Met Glu Ala Gln Leu Ser Arg Leu
325 330 335
Val Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350
Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala
355 360 365
Pro Asn Lys Pro Asp Glu Arg Glu Leu Ala Arg Arg Arg Glu Ser Tyr
370 375 380
Ala Gly Gly Tyr Val Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile
385 390 395 400
Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His
405 410 415
Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Glu Glu Tyr Asp
420 425 430
Val Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp Phe Pro Gly Phe
435 440 445
Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Val Lys
450 455 460
Lys Lys Met Lys Ala Thr Ile Asp Pro Ile Glu Lys Lys Leu Leu Asp
465 470 475 480
Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Phe Tyr Gly Tyr
485 490 495
Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser
500 505 510
Val Thr Ala Trp Gly Arg Gln Tyr Ile Glu Thr Thr Ile Arg Glu Ile
515 520 525
Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly Phe
530 535 540
Phe Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Lys Lys Ala
545 550 555 560
Lys Glu Phe Leu Asp Tyr Ile Asn Ala Lys Leu Pro Gly Leu Leu Glu
565 570 575
Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys Lys
580 585 590
Lys Tyr Ala Val Ile Asp Glu Glu Asp Lys Ile Thr Thr Arg Gly Leu
595 600 605
Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala
610 615 620
Arg Val Leu Glu Ala Ile Leu Lys His Gly Asp Val Glu Glu Ala Val
625 630 635 640
Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro
645 650 655
Pro Glu Lys Leu Val Ile Tyr Glu Gln Ile Thr Arg Asp Leu Lys Asp
660 665 670
Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala
675 680 685
Arg Gly Ile Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu
690 695 700
Lys Gly Ser Gly Arg Ile Gly Asp Arg Ala Ile Pro Phe Asp Glu Phe
705 710 715 720
Asp Pro Ala Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln
725 730 735
Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys
740 745 750
Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Gly Ala Trp
755 760 765
Leu Lys Pro Lys Thr
770
<210> 55
<211> 775
<212> PRT
<213> 人工序列
<220>
<223> 9度N-7聚合酶的氨基酸序列
<400> 55
Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asn Gly Lys Pro Val Ile
1 5 10 15
Arg Val Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg
20 25 30
Thr Phe Glu Pro Tyr Phe Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile
35 40 45
Glu Asp Val Lys Lys Val Thr Ala Lys Arg His Gly Thr Val Val Lys
50 55 60
Val Lys Arg Ala Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Ile
65 70 75 80
Glu Val Trp Lys Leu Tyr Phe Asn His Pro Gln Asp Val Pro Ala Ile
85 90 95
Arg Asp Arg Ile Arg Ala His Pro Ala Val Val Asp Ile Tyr Glu Tyr
100 105 110
Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro
115 120 125
Met Glu Gly Asp Glu Glu Leu Thr Met Leu Ala Phe Asp Ile Glu Thr
130 135 140
Leu Tyr His Glu Gly Glu Glu Phe Gly Thr Gly Pro Ile Leu Met Ile
145 150 155 160
Ser Tyr Ala Asp Gly Ser Glu Ala Arg Val Ile Thr Trp Lys Lys Ile
165 170 175
Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Lys Glu Met Ile Lys
180 185 190
Arg Phe Leu Arg Val Val Arg Glu Lys Asp Pro Asp Val Leu Ile Thr
195 200 205
Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu
210 215 220
Glu Leu Gly Ile Lys Phe Thr Leu Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240
Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile
245 250 255
His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr
260 265 270
Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Lys Pro Lys Glu
275 280 285
Lys Val Tyr Ala Glu Glu Ile Ala Gln Ala Trp Glu Ser Gly Glu Gly
290 295 300
Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr
305 310 315 320
Glu Leu Gly Arg Glu Phe Phe Pro Met Glu Ala Gln Leu Ser Arg Leu
325 330 335
Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350
Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Lys Arg Asn Glu Leu Ala
355 360 365
Pro Asn Lys Pro Asp Glu Arg Glu Leu Ala Arg Arg Arg Gly Gly Tyr
370 375 380
Ala Gly Gly Tyr Val Lys Glu Pro Glu Arg Gly Leu Trp Asp Asn Ile
385 390 395 400
Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His
405 410 415
Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp
420 425 430
Val Ala Pro Glu Val Gly His Lys Phe Cys Lys Asp Phe Pro Gly Phe
435 440 445
Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys
450 455 460
Arg Lys Met Lys Ala Thr Val Asp Pro Leu Glu Lys Lys Leu Leu Asp
465 470 475 480
Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Phe Tyr Gly Tyr
485 490 495
Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser
500 505 510
Val Thr Ala Trp Gly Arg Glu Tyr Ile Glu Met Val Ile Arg Glu Leu
515 520 525
Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly Leu
530 535 540
His Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Lys Lys Ala
545 550 555 560
Lys Glu Phe Leu Lys Tyr Ile Asn Pro Lys Leu Pro Gly Leu Leu Glu
565 570 575
Leu Glu Tyr Glu Gly Phe Tyr Val Arg Gly Phe Phe Val Thr Lys Lys
580 585 590
Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu
595 600 605
Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala
610 615 620
Arg Val Leu Glu Ala Ile Leu Lys His Gly Asp Val Glu Glu Ala Val
625 630 635 640
Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro
645 650 655
Pro Glu Lys Leu Val Ile His Glu Gln Ile Thr Arg Asp Leu Arg Asp
660 665 670
Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala
675 680 685
Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu
690 695 700
Lys Gly Ser Gly Arg Ile Gly Asp Arg Ala Ile Pro Ala Asp Glu Phe
705 710 715 720
Asp Pro Thr Lys His Arg Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln
725 730 735
Val Leu Pro Ala Val Glu Arg Ile Leu Lys Ala Phe Gly Tyr Arg Lys
740 745 750
Glu Asp Leu Arg Tyr Gln Lys Thr Lys Gln Val Gly Leu Gly Ala Trp
755 760 765
Leu Lys Val Lys Gly Lys Lys
770 775
<210> 56
<211> 773
<212> PRT
<213> 人工序列
<220>
<223> Tok聚合酶
<400> 56
Met Ile Leu Asp Ala Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile
1 5 10 15
Arg Val Phe Lys Lys Glu Lys Gly Glu Phe Lys Ile Asp Tyr Asp Arg
20 25 30
Asp Phe Glu Pro Tyr Ile Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile
35 40 45
Glu Asp Ile Lys Lys Ile Thr Ala Glu Arg His Gly Thr Thr Val Arg
50 55 60
Val Thr Arg Ala Glu Arg Val Lys Lys Lys Phe Leu Gly Arg Pro Val
65 70 75 80
Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile
85 90 95
Arg Asp Lys Ile Arg Glu His Pro Ala Val Val Asp Ile Tyr Glu Tyr
100 105 110
Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Arg Gly Leu Ile Pro
115 120 125
Met Glu Gly Asp Glu Glu Leu Arg Met Leu Ala Phe Asp Ile Glu Thr
130 135 140
Leu Tyr His Glu Gly Glu Glu Phe Gly Glu Gly Pro Ile Leu Met Ile
145 150 155 160
Ser Tyr Ala Asp Glu Glu Gly Ala Arg Val Ile Thr Trp Lys Asn Ile
165 170 175
Asp Leu Pro Tyr Val Glu Ser Val Ser Thr Glu Lys Glu Met Ile Lys
180 185 190
Arg Phe Leu Lys Val Ile Gln Glu Lys Asp Pro Asp Val Leu Ile Thr
195 200 205
Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Ser Glu
210 215 220
Met Leu Gly Val Lys Phe Ile Leu Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240
Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile
245 250 255
His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr
260 265 270
Tyr Thr Leu Glu Thr Val Tyr Glu Pro Val Phe Gly Gln Pro Lys Glu
275 280 285
Lys Val Tyr Ala Glu Glu Ile Ala Arg Ala Trp Glu Ser Gly Glu Gly
290 295 300
Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Ala Thr Tyr
305 310 315 320
Glu Leu Gly Lys Glu Phe Phe Pro Met Glu Ala Gln Leu Ser Arg Leu
325 330 335
Val Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350
Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Asp Val Ala
355 360 365
Pro Asn Lys Pro Asp Glu Arg Glu Leu Ala Arg Arg Thr Glu Ser Tyr
370 375 380
Ala Gly Gly Tyr Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn Ile
385 390 395 400
Val Tyr Leu Asp Tyr Lys Ser Leu Tyr Pro Ser Ile Ile Ile Thr His
405 410 415
Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Arg Glu Tyr Asp
420 425 430
Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe
435 440 445
Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Val Lys
450 455 460
Lys Lys Met Lys Ala Thr Val Asp Pro Ile Glu Arg Lys Leu Leu Asp
465 470 475 480
Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Tyr Tyr Gly Tyr
485 490 495
Tyr Ala Tyr Ala Asn Ala Arg Trp Tyr Cys Arg Glu Cys Ala Glu Ser
500 505 510
Val Thr Ala Trp Gly Arg Gln Tyr Ile Glu Thr Thr Met Arg Glu Ile
515 520 525
Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly Phe
530 535 540
Phe Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Asn Lys Ala
545 550 555 560
Lys Glu Phe Leu Asn Tyr Ile Asn Pro Arg Leu Pro Gly Leu Leu Glu
565 570 575
Leu Glu Tyr Glu Gly Phe Tyr Arg Arg Gly Phe Phe Val Thr Lys Lys
580 585 590
Lys Tyr Ala Val Ile Asp Glu Glu Asp Lys Ile Thr Thr Arg Gly Leu
595 600 605
Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala
610 615 620
Arg Val Leu Glu Ala Ile Leu Lys His Gly Asp Val Glu Glu Ala Val
625 630 635 640
Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Arg His Glu Val Pro
645 650 655
Pro Glu Lys Leu Val Ile Tyr Glu Gln Ile Thr Arg Asp Leu Arg Ser
660 665 670
Tyr Arg Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala
675 680 685
Arg Gly Ile Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu
690 695 700
Lys Gly Pro Gly Arg Val Gly Asp Arg Ala Ile Pro Phe Asp Glu Phe
705 710 715 720
Asp Pro Ala Lys His Arg Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln
725 730 735
Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys
740 745 750
Glu Asp Leu Arg Tyr Gln Lys Thr Lys Gln Ala Gly Leu Gly Ala Trp
755 760 765
Leu Lys Pro Lys Thr
770
<210> 57
<211> 473
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的N片段
<400> 57
His His His His His His Met Ile Leu Asp Val Asp Tyr Ile Thr Glu
1 5 10 15
Glu Gly Lys Pro Val Ile Arg Leu Phe Lys Lys Glu Asn Gly Lys Phe
20 25 30
Lys Ile Glu His Asp Arg Thr Phe Arg Pro Tyr Phe Tyr Ala Leu Leu
35 40 45
Arg Asp Asp Ser Lys Ile Glu Glu Val Lys Lys Ile Thr Gly Glu Arg
50 55 60
His Gly Lys Val Val Arg Val Val Asp Val Glu Lys Val Glu Lys Lys
65 70 75 80
Phe Leu Gly Lys Pro Val Thr Val Trp Lys Leu Tyr Leu Glu His Pro
85 90 95
Gln Asp Val Pro Thr Ile Arg Glu Lys Val Arg Ala His Pro Ala Val
100 105 110
Val Asp Ile Phe Glu Tyr Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile
115 120 125
Asp Lys Gly Leu Val Pro Met Glu Gly Glu Glu Glu Leu Lys Met Leu
130 135 140
Ala Phe Asp Ile Glu Thr Leu Tyr His Glu Gly Glu Glu Phe Gly Lys
145 150 155 160
Gly Pro Ile Leu Met Ile Ser Tyr Ala Asp Glu Asn Glu Ala Lys Val
165 170 175
Ala Thr Trp Lys Asn Val Asp Leu Pro Tyr Val Glu Val Val Ser Ser
180 185 190
Glu Arg Glu Met Val Lys Arg Phe Leu Arg Val Val Arg Glu Lys Asp
195 200 205
Pro Asp Val Leu Val Thr Tyr Asn Gly Asp Ser Phe Asp Phe Pro Tyr
210 215 220
Leu Ala Lys Arg Ala Glu Lys Leu Gly Val Lys Leu Thr Leu Gly Arg
225 230 235 240
Asp Gly Ser Glu Pro Lys Met Gln Arg Met Gly Asp Met Thr Ala Val
245 250 255
Glu Val Lys Gly Arg Val His Phe Asp Leu Tyr His Val Ala Thr Arg
260 265 270
Thr Leu Asn Leu Pro Thr Tyr Thr Leu Ala Ala Val Tyr Glu Ala Val
275 280 285
Phe Gly Lys Pro Lys Glu Lys Val Tyr Ala Asp Glu Ile Ala Lys Ala
290 295 300
Trp Glu Ser Gly Glu Asn Leu Glu Arg Val Ala Lys Tyr Ser Met Glu
305 310 315 320
Asp Ala Gly Ala Thr Tyr Glu Leu Gly Lys Glu Phe Leu Pro Met Glu
325 330 335
Ala Gln Leu Ser Arg Leu Val Gly Gln Pro Leu Trp Asp Val Ser Arg
340 345 350
Ser Ser Thr Gly Asn Leu Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr
355 360 365
Glu Arg Asn Glu Leu Ala Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln
370 375 380
Arg Arg Leu Arg Glu Ser Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu
385 390 395 400
Lys Gly Leu Trp Glu Asn Val Val Tyr Leu Asp Phe Arg Ala Leu Tyr
405 410 415
Pro Ser Ile Ile Ile Thr His Asn Val Ser Pro Asp Thr Leu Asn Leu
420 425 430
Glu Gly Cys Lys Asn Tyr Asp Val Ala Pro Gln Val Gly His Lys Phe
435 440 445
Cys Lys Asp Phe Pro Gly Phe Ile Pro Ser Leu Leu Gly His Leu Leu
450 455 460
Glu Glu Arg Gln Lys Ile Lys Thr Lys
465 470
<210> 58
<211> 45
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的N片段
<400> 58
His His His His His His Met Ile Leu Asp Val Asp Tyr Ile Thr Glu
1 5 10 15
Glu Gly Lys Pro Val Ile Arg Leu Phe Lys Lys Glu Asn Gly Lys Phe
20 25 30
Lys Ile Glu His Asp Arg Thr Phe Arg Pro Tyr Phe Tyr
35 40 45
<210> 59
<211> 62
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的N片段
<400> 59
Cys Leu Leu Arg Asp Asp Ser Lys Ile Glu Glu Val Lys Lys Ile Thr
1 5 10 15
Gly Glu Arg His Gly Lys Val Val Arg Val Val Asp Val Glu Lys Val
20 25 30
Glu Lys Lys Phe Leu Gly Lys Pro Val Thr Val Trp Lys Leu Tyr Leu
35 40 45
Glu His Pro Gln Asp Val Pro Thr Ile Arg Glu Lys Val Arg
50 55 60
<210> 60
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的N片段
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> 经N-末端三氟乙酰基噻唑烷-4-羧酸
(Tfa-Thz)结合的
<400> 60
His Pro Ala Val Val Asp Ile Phe Glu Tyr Asp Ile Pro Phe Ala Lys
1 5 10 15
Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro Met Glu Gly Glu Glu Glu
20 25 30
Leu Lys Met Leu Ala Phe Asp Ile Glu Thr Leu Tyr His Glu Gly Glu
35 40 45
Glu Phe Gly Lys Gly Pro Ile Leu Met Ile Ser Tyr
50 55 60
<210> 61
<211> 59
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的N片段
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> 经N-末端三氟乙酰基噻唑烷-4-羧酸
(Tfa-Thz)结合的
<400> 61
Asp Glu Asn Glu Ala Lys Val Ala Thr Trp Lys Asn Val Asp Leu Pro
1 5 10 15
Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Val Lys Arg Phe Leu
20 25 30
Arg Val Val Arg Glu Lys Asp Pro Asp Val Leu Val Thr Tyr Asn Gly
35 40 45
Asp Ser Phe Asp Phe Pro Tyr Leu Ala Lys Arg
50 55
<210> 62
<211> 53
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的N片段
<400> 62
Cys Glu Lys Leu Gly Val Lys Leu Thr Leu Gly Arg Asp Gly Ser Glu
1 5 10 15
Pro Lys Met Gln Arg Met Gly Asp Met Thr Ala Val Glu Val Lys Gly
20 25 30
Arg Val His Phe Asp Leu Tyr His Val Ala Thr Arg Thr Leu Asn Leu
35 40 45
Pro Thr Tyr Thr Leu
50
<210> 63
<211> 41
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的N片段
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> 经N-末端三氟乙酰基噻唑烷-4-羧酸
(Tfa-Thz)结合的
<400> 63
Ala Val Tyr Glu Ala Val Phe Gly Lys Pro Lys Glu Lys Val Tyr Ala
1 5 10 15
Asp Glu Ile Ala Lys Ala Trp Glu Ser Gly Glu Asn Leu Glu Arg Val
20 25 30
Ala Lys Tyr Ser Met Glu Asp Ala Gly
35 40
<210> 64
<211> 49
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的N片段
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> 经N-末端三氟乙酰基噻唑烷-4-羧酸
(Tfa-Thz)结合的
<400> 64
Thr Tyr Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ala Gln Leu Ser
1 5 10 15
Arg Leu Val Gly Gln Pro Leu Trp Asp Val Ser Arg Ser Ser Thr Gly
20 25 30
Asn Leu Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu
35 40 45
Leu
<210> 65
<211> 39
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的N片段
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> 经N-末端三氟乙酰基噻唑烷-4-羧酸
(Tfa-Tz)结合的
<400> 65
Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln Arg Arg Leu Arg Glu Ser
1 5 10 15
Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn
20 25 30
Val Val Tyr Leu Asp Phe Arg
35
<210> 66
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的N片段
<400> 66
Cys Leu Tyr Pro Ser Ile Ile Ile Thr His Asn Val Ser Pro Asp Thr
1 5 10 15
Leu Asn Leu Glu Gly Cys Lys Asn Tyr Asp Val Ala Pro Gln Val Gly
20 25 30
His Lys Phe Cys Lys Asp Phe Pro Gly Phe Ile Pro Ser Leu Leu Gly
35 40 45
His Leu Leu Glu Glu Arg Gln Lys Ile Lys Thr Lys
50 55 60
<210> 67
<211> 308
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的C片段
<400> 67
Met Lys Glu Thr Gln Asp Pro Ile Glu Lys Lys Leu Leu Asp Tyr Arg
1 5 10 15
Gln Lys Ala Ile Lys Leu Leu Ala Asn Ser Phe Tyr Gly Tyr Tyr Gly
20 25 30
Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser Val Thr
35 40 45
Ala Trp Gly Arg Lys Tyr Ile Glu Leu Val Trp Lys Glu Leu Glu Glu
50 55 60
Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly Leu Tyr Ala
65 70 75 80
Thr Ile Pro Gly Gly Glu Ser Glu Glu Val Lys Lys Lys Ala Leu Glu
85 90 95
Phe Val Lys Tyr Ile Asn Ser Lys Leu Pro Gly Leu Leu Glu Leu Glu
100 105 110
Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys Lys Arg Tyr
115 120 125
Ala Val Val Asp Glu Glu Gly Lys Val Thr Thr Arg Gly Leu Glu Val
130 135 140
Val Arg Arg Asp Trp Ser Glu Ala Ala Lys Glu Thr Gln Ala Arg Val
145 150 155 160
Leu Glu Thr Leu Leu Lys His Gly Asp Val Glu Glu Ala Val Arg Val
165 170 175
Val Lys Glu Val Thr Gln Lys Leu Ala Asn Tyr Glu Val Pro Pro Glu
180 185 190
Lys Leu Ala Ile Tyr Glu Gln Ile Thr Arg Pro Leu His Glu Tyr Lys
195 200 205
Ala Thr Gly Pro His Val Ala Val Ala Lys Lys Leu Ala Ala Lys Gly
210 215 220
Val Lys Ile Lys Pro Gly Met Val Ile Gly Tyr Ile Val Leu Arg Gly
225 230 235 240
Asp Gly Pro Ile Ser Asn Arg Ala Tyr Leu Ala Glu Glu Tyr Asp Pro
245 250 255
Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Val Glu Asn Gln Val Leu
260 265 270
Pro Ala Val Leu Arg Val Leu Glu Gly Phe Gly Tyr Arg Lys Glu Asp
275 280 285
Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Thr Ser Trp Leu Asn
290 295 300
Pro Lys Lys Ser
305
<210> 68
<211> 33
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的C片段
<400> 68
Met Lys Glu Thr Gln Asp Pro Ile Glu Lys Lys Leu Leu Asp Tyr Arg
1 5 10 15
Gln Lys Ala Ile Lys Leu Leu Ala Asn Ser Phe Tyr Gly Tyr Tyr Gly
20 25 30
Tyr
<210> 69
<211> 39
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的C片段
<400> 69
Cys Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser Val Thr Ala
1 5 10 15
Trp Gly Arg Lys Tyr Ile Glu Leu Val Trp Lys Glu Leu Glu Glu Lys
20 25 30
Phe Gly Phe Lys Val Leu Tyr
35
<210> 70
<211> 56
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的C片段
<400> 70
Cys Asp Thr Asp Gly Leu Tyr Ala Thr Ile Pro Gly Gly Glu Ser Glu
1 5 10 15
Glu Val Lys Lys Lys Ala Leu Glu Phe Val Lys Tyr Ile Asn Ser Lys
20 25 30
Leu Pro Gly Leu Leu Glu Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly
35 40 45
Phe Phe Val Thr Lys Lys Arg Tyr
50 55
<210> 71
<211> 55
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的C片段
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> 经N-末端三氟乙酰基噻唑烷-4-羧酸
(Tfa-Thz)结合的
<400> 71
Val Val Asp Glu Glu Gly Lys Val Thr Thr Arg Gly Leu Glu Val Val
1 5 10 15
Arg Arg Asp Trp Ser Glu Ala Ala Lys Glu Thr Gln Ala Arg Val Leu
20 25 30
Glu Thr Leu Leu Lys His Gly Asp Val Glu Glu Ala Val Arg Val Val
35 40 45
Lys Glu Val Thr Gln Lys Leu
50 55
<210> 72
<211> 62
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的C片段
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> 经N-末端三氟乙酰基噻唑烷-4-羧酸
(Tfa-Tz)结合的
<400> 72
Asn Tyr Glu Val Pro Pro Glu Lys Leu Ala Ile Tyr Glu Gln Ile Thr
1 5 10 15
Arg Pro Leu His Glu Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala
20 25 30
Lys Lys Leu Ala Ala Lys Gly Val Lys Ile Lys Pro Gly Met Val Ile
35 40 45
Gly Tyr Ile Val Leu Arg Gly Asp Gly Pro Ile Ser Asn Arg
50 55 60
<210> 73
<211> 61
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的C片段
<400> 73
Cys Tyr Leu Ala Glu Glu Tyr Asp Pro Lys Lys His Lys Tyr Asp Ala
1 5 10 15
Glu Tyr Tyr Val Glu Asn Gln Val Leu Pro Ala Val Leu Arg Val Leu
20 25 30
Glu Gly Phe Gly Tyr Arg Lys Glu Asp Leu Arg Tyr Gln Lys Thr Arg
35 40 45
Gln Val Gly Leu Thr Ser Trp Leu Asn Pro Lys Lys Ser
50 55 60
<210> 74
<211> 775
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的突变版本
<400> 74
Met Ile Leu Asp Val Asp Tyr Ile Thr Glu Glu Gly Lys Pro Val Ile
1 5 10 15
Arg Leu Phe Lys Lys Glu Asn Gly Lys Phe Lys Ile Glu His Asp Arg
20 25 30
Thr Phe Arg Pro Tyr Ile Tyr Ala Leu Leu Arg Asp Asp Ser Lys Ile
35 40 45
Glu Glu Val Lys Lys Ile Thr Gly Glu Arg His Gly Lys Ile Val Arg
50 55 60
Ile Val Asp Val Glu Lys Val Glu Lys Lys Phe Leu Gly Lys Pro Ile
65 70 75 80
Thr Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Val Pro Thr Ile
85 90 95
Arg Glu Lys Val Arg Ala His Pro Ala Val Val Asp Ile Phe Glu Tyr
100 105 110
Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro
115 120 125
Met Glu Gly Glu Glu Glu Leu Lys Ile Leu Ala Phe Asp Ile Glu Thr
130 135 140
Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Ile Met Ile
145 150 155 160
Ser Tyr Ala Asp Glu Asn Glu Ala Lys Val Ile Thr Trp Lys Asn Ile
165 170 175
Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Ile Lys
180 185 190
Arg Phe Leu Arg Ile Ile Arg Glu Lys Asp Pro Asp Ile Ile Val Thr
195 200 205
Tyr Asn Gly Asp Ser Phe Asp Phe Pro Tyr Leu Ala Lys Arg Ala Glu
210 215 220
Lys Leu Gly Ile Lys Leu Thr Ile Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240
Met Gln Arg Ile Gly Asp Met Thr Ala Val Glu Val Lys Gly Arg Ile
245 250 255
His Phe Asp Leu Tyr His Val Ile Thr Arg Thr Ile Asn Leu Pro Thr
260 265 270
Tyr Thr Leu Glu Ala Val Tyr Glu Ala Ile Phe Gly Lys Pro Lys Glu
275 280 285
Lys Val Tyr Ala Asp Glu Ile Ala Lys Ala Trp Glu Ser Gly Glu Asn
290 295 300
Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Lys Ala Thr Tyr
305 310 315 320
Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ile Gln Leu Ser Arg Leu
325 330 335
Val Gly Gln Pro Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350
Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Val Ala
355 360 365
Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln Arg Arg Leu Arg Glu Ser
370 375 380
Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn
385 390 395 400
Ile Val Tyr Leu Asp Phe Arg Ala Leu Gly Pro Ser Ile Ile Ile Thr
405 410 415
His Asn Val Ser Pro Asp Thr Leu Asn Leu Glu Gly Cys Lys Asn Tyr
420 425 430
Asp Ile Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp Ile Pro Gly
435 440 445
Phe Ile Pro Ser Leu Leu Gly His Leu Leu Glu Glu Arg Gln Lys Ile
450 455 460
Lys Thr Lys Met Lys Glu Thr Gln Asp Pro Ile Glu Lys Ile Leu Leu
465 470 475 480
Asp Tyr Arg Gln Lys Ala Ile Lys Leu Leu Ala Asn Ser Phe Tyr Gly
485 490 495
Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu
500 505 510
Ser Val Thr Ala Trp Gly Arg Lys Tyr Ile Glu Leu Val Trp Lys Glu
515 520 525
Leu Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ile Asp Thr Asp Gly
530 535 540
Leu Tyr Ala Thr Ile Pro Gly Gly Glu Ser Glu Glu Ile Lys Lys Lys
545 550 555 560
Ala Leu Glu Phe Val Lys Tyr Ile Asn Ser Lys Leu Pro Gly Leu Leu
565 570 575
Glu Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys
580 585 590
Lys Arg Tyr Ala Val Ile Asp Glu Glu Gly Lys Val Ile Thr Arg Gly
595 600 605
Leu Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln
610 615 620
Ala Arg Val Leu Glu Thr Ile Leu Lys His Gly Asp Val Glu Glu Ala
625 630 635 640
Val Arg Ile Val Lys Glu Val Ile Gln Lys Leu Ala Asn Tyr Glu Ile
645 650 655
Pro Pro Glu Lys Leu Ala Ile Tyr Lys Gln Ile Thr Arg Pro Leu His
660 665 670
Glu Tyr Lys Ala Ile Gly Pro His Val Ala Val Ala Lys Lys Leu Ala
675 680 685
Ala Lys Gly Val Lys Ile Lys Pro Gly Met Val Ile Gly Tyr Ile Val
690 695 700
Leu Arg Gly Asp Gly Pro Ile Ser Asn Arg Ala Ile Leu Ala Glu Glu
705 710 715 720
Tyr Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn
725 730 735
Gln Val Leu Pro Ala Val Leu Arg Ile Leu Glu Gly Phe Gly Tyr Arg
740 745 750
Lys Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Thr Ser
755 760 765
Trp Leu Asn Ile Lys Lys Ser
770 775
<210> 75
<211> 775
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的突变版本
<400> 75
Met Ile Leu Asp Val Asp Tyr Ile Thr Glu Glu Gly Lys Pro Val Ile
1 5 10 15
Arg Leu Phe Lys Lys Glu Asn Gly Lys Phe Lys Ile Glu His Asp Arg
20 25 30
Thr Phe Arg Pro Tyr Ile Tyr Ala Leu Leu Arg Asp Asp Ser Lys Ile
35 40 45
Glu Glu Val Lys Lys Ile Thr Gly Glu Arg His Gly Lys Ile Val Arg
50 55 60
Ile Val Asp Val Glu Lys Val Glu Lys Lys Phe Leu Gly Lys Pro Ile
65 70 75 80
Thr Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Gln Pro Thr Ile
85 90 95
Arg Glu Lys Val Arg Ala His Pro Ala Val Val Asp Ile Phe Glu Tyr
100 105 110
Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro
115 120 125
Met Glu Gly Glu Glu Glu Leu Lys Ile Leu Ala Phe Asp Ile Glu Thr
130 135 140
Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Ile Met Ile
145 150 155 160
Ser Tyr Ala Asp Glu Asn Glu Ala Lys Val Ile Thr Trp Lys Asn Ile
165 170 175
Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Ile Lys
180 185 190
Arg Phe Leu Arg Ile Ile Arg Glu Lys Asp Pro Asp Ile Ile Val Thr
195 200 205
Tyr Asn Gly Asp Ser Phe Asp Phe Pro Tyr Leu Ala Lys Arg Ala Glu
210 215 220
Lys Leu Gly Ile Lys Leu Thr Ile Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240
Met Gln Arg Ile Gly Asp Met Thr Ala Val Glu Val Lys Gly Arg Ile
245 250 255
His Phe Asp Leu Tyr His Val Ile Thr Arg Thr Ile Asn Leu Pro Thr
260 265 270
Tyr Thr Leu Glu Ala Val Tyr Glu Ala Ile Phe Gly Lys Pro Lys Glu
275 280 285
Lys Val Tyr Ala Asp Glu Ile Ala Lys Ala Trp Glu Ser Gly Glu Asn
290 295 300
Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Lys Ala Thr Tyr
305 310 315 320
Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ile Gln Leu Ser Arg Leu
325 330 335
Val Gly Gln Pro Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350
Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Val Ala
355 360 365
Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln Arg Arg Leu Arg Glu Ser
370 375 380
Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn
385 390 395 400
Ile Val Tyr Leu Asp Phe Arg Ala Leu Gly Pro Ser Ile Ile Ile Thr
405 410 415
His Asn Val Ser Pro Asp Thr Leu Asn Leu Glu Gly Cys Lys Asn Tyr
420 425 430
Asp Ile Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp Ile Pro Gly
435 440 445
Phe Ile Pro Ser Leu Leu Gly His Leu Leu Glu Glu Arg Gln Lys Ile
450 455 460
Lys Thr Lys Met Lys Glu Thr Gln Asp Pro Ile Glu Lys Ile Leu Leu
465 470 475 480
Asp Tyr Arg Gln Lys Leu Ile Lys Leu Leu Ala Asn Ser Phe Tyr Gly
485 490 495
Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu
500 505 510
Ser Val Thr Ala Trp Gly Arg Lys Tyr Ile Glu Leu Val Trp Lys Glu
515 520 525
Leu Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ile Asp Thr Asp Gly
530 535 540
Leu Tyr Ala Thr Ile Pro Gly Gly Glu Ser Glu Glu Ile Lys Lys Lys
545 550 555 560
Ala Leu Glu Phe Val Lys Tyr Ile Asn Ser Lys Leu Pro Gly Leu Leu
565 570 575
Glu Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys
580 585 590
Lys Arg Tyr Ala Val Ile Asp Glu Glu Gly Lys Val Ile Thr Arg Gly
595 600 605
Leu Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln
610 615 620
Ala Arg Val Leu Glu Thr Ile Leu Lys His Gly Asp Val Glu Glu Ala
625 630 635 640
Val Arg Ile Val Lys Glu Val Ile Gln Lys Leu Ala Asn Tyr Glu Ile
645 650 655
Pro Pro Glu Lys Leu Ala Ile Tyr Lys Gln Ile Thr Arg Pro Leu His
660 665 670
Glu Tyr Lys Ala Ile Gly Pro His Val Ala Val Ala Lys Lys Leu Ala
675 680 685
Ala Lys Gly Val Lys Ile Lys Pro Gly Met Val Ile Gly Tyr Ile Val
690 695 700
Leu Arg Gly Asp Gly Pro Ile Ser Asn Arg Ala Ile Leu Ala Glu Glu
705 710 715 720
Tyr Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn
725 730 735
Gln Val Leu Pro Ala Val Leu Arg Ile Leu Glu Gly Phe Gly Tyr Arg
740 745 750
Lys Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Thr Ser
755 760 765
Trp Leu Asn Ile Lys Lys Ser
770 775
<210> 76
<211> 775
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的突变版本
<400> 76
Met Ile Leu Asp Val Asp Tyr Ile Thr Glu Glu Gly Lys Pro Val Ile
1 5 10 15
Arg Leu Phe Lys Lys Glu Asn Gly Lys Phe Lys Ile Glu His Asp Arg
20 25 30
Thr Phe Arg Pro Tyr Ile Tyr Ala Leu Leu Arg Asp Asp Ser Lys Ile
35 40 45
Glu Glu Val Lys Lys Ile Thr Gly Glu Arg His Gly Lys Ile Val Arg
50 55 60
Ile Val Asp Val Glu Lys Val Glu Lys Lys Phe Leu Gly Lys Pro Ile
65 70 75 80
Thr Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Gln Pro Thr Ile
85 90 95
Arg Glu Lys Val Arg Ala His Pro Ala Val Val Asp Ile Phe Glu Tyr
100 105 110
Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro
115 120 125
Met Glu Gly Glu Glu Glu Leu Lys Ile Leu Ala Phe Ala Ile Ala Thr
130 135 140
Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Ile Met Ile
145 150 155 160
Ser Tyr Ala Asp Glu Asn Glu Ala Lys Val Ile Thr Trp Lys Asn Ile
165 170 175
Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Ile Lys
180 185 190
Arg Phe Leu Arg Ile Ile Arg Glu Lys Asp Pro Asp Ile Ile Val Thr
195 200 205
Tyr Asn Gly Asp Ser Phe Asp Phe Pro Tyr Leu Ala Lys Arg Ala Glu
210 215 220
Lys Leu Gly Ile Lys Leu Thr Ile Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240
Met Gln Arg Ile Gly Asp Met Thr Ala Val Glu Val Lys Gly Arg Ile
245 250 255
His Phe Asp Leu Tyr His Val Ile Thr Arg Thr Ile Asn Leu Pro Thr
260 265 270
Tyr Thr Leu Glu Ala Val Tyr Glu Ala Ile Phe Gly Lys Pro Lys Glu
275 280 285
Lys Val Tyr Ala Asp Glu Ile Ala Lys Ala Trp Glu Ser Gly Glu Asn
290 295 300
Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Lys Ala Thr Tyr
305 310 315 320
Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ile Gln Leu Ser Arg Leu
325 330 335
Val Gly Gln Pro Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350
Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Val Ala
355 360 365
Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln Arg Arg Leu Arg Glu Ser
370 375 380
Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn
385 390 395 400
Ile Val Tyr Leu Asp Phe Arg Ala Leu Gly Pro Ser Ile Ile Ile Thr
405 410 415
His Asn Val Ser Pro Asp Thr Leu Asn Leu Glu Gly Cys Lys Asn Tyr
420 425 430
Asp Ile Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp Ile Pro Gly
435 440 445
Phe Ile Pro Ser Leu Leu Gly His Leu Leu Glu Glu Arg Gln Lys Ile
450 455 460
Lys Thr Lys Met Lys Glu Thr Gln Asp Pro Ile Glu Lys Ile Leu Leu
465 470 475 480
Asp Tyr Arg Gln Lys Leu Ile Lys Leu Leu Ala Asn Ser Phe Tyr Gly
485 490 495
Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu
500 505 510
Ser Val Thr Ala Trp Gly Arg Lys Tyr Ile Glu Leu Val Trp Lys Glu
515 520 525
Leu Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ile Asp Thr Asp Gly
530 535 540
Leu Tyr Ala Thr Ile Pro Gly Gly Glu Ser Glu Glu Ile Lys Lys Lys
545 550 555 560
Ala Leu Glu Phe Val Lys Tyr Ile Asn Ser Lys Leu Pro Gly Leu Leu
565 570 575
Glu Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys
580 585 590
Lys Arg Tyr Ala Val Ile Asp Glu Glu Gly Lys Val Ile Thr Arg Gly
595 600 605
Leu Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln
610 615 620
Ala Arg Val Leu Glu Thr Ile Leu Lys His Gly Asp Val Glu Glu Ala
625 630 635 640
Val Arg Ile Val Lys Glu Val Ile Gln Lys Leu Ala Asn Tyr Glu Ile
645 650 655
Pro Pro Glu Lys Leu Ala Ile Tyr Lys Gln Ile Thr Arg Pro Leu His
660 665 670
Glu Tyr Lys Ala Ile Gly Pro His Val Ala Val Ala Lys Lys Leu Ala
675 680 685
Ala Lys Gly Val Lys Ile Lys Pro Gly Met Val Ile Gly Tyr Ile Val
690 695 700
Leu Arg Gly Asp Gly Pro Ile Ser Asn Arg Ala Ile Leu Ala Glu Glu
705 710 715 720
Tyr Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn
725 730 735
Gln Val Leu Pro Ala Val Leu Arg Ile Leu Glu Gly Phe Gly Tyr Arg
740 745 750
Lys Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Thr Ser
755 760 765
Trp Leu Asn Ile Lys Lys Ser
770 775
<210> 77
<211> 682
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的突变版本
<400> 77
Pro Thr Ile Arg Glu Lys Val Arg Ala His Pro Ala Val Val Asp Ile
1 5 10 15
Phe Glu Tyr Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly
20 25 30
Leu Ile Pro Met Glu Gly Glu Glu Glu Leu Lys Ile Leu Ala Phe Asp
35 40 45
Ile Glu Thr Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile
50 55 60
Ile Met Ile Ser Tyr Ala Asp Glu Asn Glu Ala Lys Val Ile Thr Trp
65 70 75 80
Lys Asn Ile Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu
85 90 95
Met Ile Lys Arg Phe Leu Arg Ile Ile Arg Glu Lys Asp Pro Asp Ile
100 105 110
Ile Val Thr Tyr Asn Gly Asp Ser Phe Ala Phe Pro Tyr Leu Ala Lys
115 120 125
Arg Ala Glu Lys Leu Gly Ile Lys Leu Thr Ile Gly Arg Asp Gly Ser
130 135 140
Glu Pro Lys Met Gln Arg Ile Gly Asp Met Thr Ala Val Glu Val Lys
145 150 155 160
Gly Arg Ile His Phe Asp Leu Tyr His Val Ile Thr Arg Thr Ile Asn
165 170 175
Leu Pro Thr Tyr Thr Leu Ala Ala Val Tyr Glu Ala Ile Phe Gly Lys
180 185 190
Pro Lys Glu Lys Val Tyr Ala Asp Glu Ile Ala Lys Ala Trp Glu Ser
195 200 205
Gly Glu Asn Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Gly
210 215 220
Ala Thr Tyr Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ile Gln Leu
225 230 235 240
Ser Arg Leu Val Gly Gln Pro Leu Trp Asp Val Ser Arg Ser Ser Thr
245 250 255
Gly Asn Leu Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn
260 265 270
Glu Leu Ala Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln Arg Arg Leu
275 280 285
Arg Glu Ser Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu Lys Gly Leu
290 295 300
Trp Glu Asn Ile Val Tyr Leu Asp Phe Arg Ala Leu Tyr Pro Ser Ile
305 310 315 320
Ile Ile Thr His Asn Val Ser Pro Asp Thr Leu Asn Leu Glu Gly Cys
325 330 335
Lys Asn Tyr Asp Ile Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp
340 345 350
Ile Pro Gly Phe Ile Pro Ser Leu Leu Gly His Leu Leu Glu Glu Arg
355 360 365
Gln Lys Ile Lys Thr Lys Met Lys Glu Thr Gln Asp Pro Ile Glu Lys
370 375 380
Ile Leu Leu Asp Tyr Arg Gln Lys Ala Ile Lys Leu Trp Ala Asn Ser
385 390 395 400
Phe Tyr Gly Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu
405 410 415
Cys Ala Glu Ser Val Thr Ala Trp Gly Arg Lys Tyr Ile Glu Leu Val
420 425 430
Trp Lys Glu Leu Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp
435 440 445
Thr Asp Gly Leu Tyr Ala Thr Ile Pro Gly Gly Glu Ser Glu Glu Ile
450 455 460
Lys Lys Lys Ala Leu Glu Phe Val Lys Tyr Ile Asn Ser Lys Leu Pro
465 470 475 480
Gly Leu Leu Glu Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe
485 490 495
Val Thr Lys Lys Arg Tyr Ala Val Ile Asp Glu Glu Gly Lys Val Ile
500 505 510
Thr Arg Gly Leu Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys
515 520 525
Glu Thr Gln Ala Arg Val Leu Glu Thr Ile Leu Lys His Gly Asp Val
530 535 540
Glu Glu Ala Val Arg Ile Val Lys Glu Val Ile Gln Lys Leu Ala Asn
545 550 555 560
Tyr Glu Ile Pro Pro Glu Lys Leu Ala Ile Tyr Glu Gln Ile Thr Arg
565 570 575
Pro Leu His Glu Tyr Lys Ala Ile Gly Pro His Val Ala Val Ala Lys
580 585 590
Lys Leu Ala Ala Lys Gly Val Lys Ile Lys Pro Gly Met Val Ile Gly
595 600 605
Tyr Ile Val Leu Arg Gly Asp Gly Pro Ile Ser Asn Arg Ala Ile Leu
610 615 620
Ala Glu Glu Tyr Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr
625 630 635 640
Ile Glu Asn Gln Val Leu Pro Ala Val Leu Arg Ile Leu Glu Gly Phe
645 650 655
Gly Tyr Arg Lys Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly
660 665 670
Leu Thr Ser Trp Leu Asn Ile Lys Lys Ser
675 680
<210> 78
<211> 63
<212> PRT
<213> 人工序列
<220>
<223> sso7d结构域的氨基酸序列
<400> 78
Ala Thr Val Lys Phe Lys Tyr Lys Gly Glu Glu Lys Glu Val Asp Ile
1 5 10 15
Ser Lys Ile Lys Lys Val Trp Arg Val Gly Lys Met Ile Ser Phe Thr
20 25 30
Tyr Asp Glu Gly Gly Gly Lys Thr Gly Arg Gly Ala Val Ser Glu Lys
35 40 45
Asp Ala Pro Lys Glu Leu Leu Gln Met Leu Glu Lys Gln Lys Lys
50 55 60
<210> 79
<211> 844
<212> PRT
<213> 人工序列
<220>
<223> Pfu DNA聚合酶的氨基酸序列
<400> 79
Met Ile Leu Asp Val Asp Tyr Ile Thr Glu Glu Gly Lys Pro Val Ile
1 5 10 15
Arg Leu Phe Lys Lys Glu Asn Gly Lys Phe Lys Ile Glu His Asp Arg
20 25 30
Thr Phe Arg Pro Tyr Ile Tyr Ala Leu Leu Arg Asp Asp Ser Lys Ile
35 40 45
Glu Glu Val Lys Lys Ile Thr Gly Glu Arg His Gly Lys Ile Val Arg
50 55 60
Ile Val Asp Val Glu Lys Val Glu Lys Lys Phe Leu Gly Lys Pro Ile
65 70 75 80
Thr Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Val Pro Thr Ile
85 90 95
Arg Glu Lys Val Arg Ala His Pro Ala Val Val Asp Ile Phe Glu Tyr
100 105 110
Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro
115 120 125
Met Glu Gly Glu Glu Glu Leu Lys Ile Leu Ala Phe Asp Ile Glu Thr
130 135 140
Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Ile Met Ile
145 150 155 160
Ser Tyr Ala Asp Glu Asn Glu Ala Lys Val Ile Thr Trp Lys Asn Ile
165 170 175
Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Ile Lys
180 185 190
Arg Phe Leu Arg Ile Ile Arg Glu Lys Asp Pro Asp Ile Ile Val Thr
195 200 205
Tyr Asn Gly Asp Ser Phe Asp Phe Pro Tyr Leu Ala Lys Arg Ala Glu
210 215 220
Lys Leu Gly Ile Lys Leu Thr Ile Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240
Met Gln Arg Ile Gly Asp Met Thr Ala Val Glu Val Lys Gly Arg Ile
245 250 255
His Phe Asp Leu Tyr His Val Ile Thr Arg Thr Ile Asn Leu Pro Thr
260 265 270
Tyr Thr Leu Ala Ala Val Tyr Glu Ala Ile Phe Gly Lys Pro Lys Glu
275 280 285
Lys Val Tyr Ala Asp Glu Ile Ala Lys Ala Trp Glu Ser Gly Glu Asn
290 295 300
Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Gly Ala Thr Tyr
305 310 315 320
Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ile Gln Leu Ser Arg Leu
325 330 335
Val Gly Gln Pro Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350
Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala
355 360 365
Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln Arg Arg Leu Arg Glu Ser
370 375 380
Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn
385 390 395 400
Ile Val Tyr Leu Asp Phe Arg Ala Leu Tyr Pro Ser Ile Ile Ile Thr
405 410 415
His Asn Val Ser Pro Asp Thr Leu Asn Leu Glu Gly Cys Lys Asn Tyr
420 425 430
Asp Ile Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp Ile Pro Gly
435 440 445
Phe Ile Pro Ser Leu Leu Gly His Leu Leu Glu Glu Arg Gln Lys Ile
450 455 460
Lys Thr Lys Met Lys Glu Thr Gln Asp Pro Ile Glu Lys Ile Leu Leu
465 470 475 480
Asp Tyr Arg Gln Lys Ala Ile Lys Leu Leu Ala Asn Ser Phe Tyr Gly
485 490 495
Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu
500 505 510
Ser Val Thr Ala Trp Gly Arg Lys Tyr Ile Glu Leu Val Trp Lys Glu
515 520 525
Leu Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly
530 535 540
Leu Tyr Ala Thr Ile Pro Gly Gly Glu Ser Glu Glu Ile Lys Lys Lys
545 550 555 560
Ala Leu Glu Phe Val Lys Tyr Ile Asn Ser Lys Leu Pro Gly Leu Leu
565 570 575
Glu Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys
580 585 590
Lys Arg Tyr Ala Val Ile Asp Glu Glu Gly Lys Val Ile Thr Arg Gly
595 600 605
Leu Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln
610 615 620
Ala Arg Val Leu Glu Thr Ile Leu Lys His Gly Asp Val Glu Glu Ala
625 630 635 640
Val Arg Ile Val Lys Glu Val Ile Gln Lys Leu Ala Asn Tyr Glu Ile
645 650 655
Pro Pro Glu Lys Leu Ala Ile Tyr Glu Gln Ile Thr Arg Pro Leu His
660 665 670
Glu Tyr Lys Ala Ile Gly Pro His Val Ala Val Ala Lys Lys Leu Ala
675 680 685
Ala Lys Gly Val Lys Ile Lys Pro Gly Met Val Ile Gly Tyr Ile Val
690 695 700
Leu Arg Gly Asp Gly Pro Ile Ser Asn Arg Ala Ile Leu Ala Glu Glu
705 710 715 720
Tyr Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn
725 730 735
Gln Val Leu Pro Ala Val Leu Arg Ile Leu Glu Gly Phe Gly Tyr Arg
740 745 750
Lys Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Thr Ser
755 760 765
Trp Leu Asn Ile Lys Lys Ser Gly Thr Gly Gly Gly Gly Ala Thr Val
770 775 780
Lys Phe Lys Tyr Lys Gly Glu Glu Lys Glu Val Asp Ile Ser Lys Ile
785 790 795 800
Lys Lys Val Trp Arg Val Gly Lys Met Ile Ser Phe Thr Tyr Asp Glu
805 810 815
Gly Gly Gly Lys Thr Gly Arg Gly Ala Val Ser Glu Lys Asp Ala Pro
820 825 830
Lys Glu Leu Leu Gln Met Leu Glu Lys Gln Lys Lys
835 840
<210> 80
<211> 1228
<212> DNA
<213> 人工序列
<220>
<223> pUC19质粒的核酸序列
<400> 80
gcgtttcggt gatgacggtg aaaacctctg acacatgcag ctcccggaga cggtcacagc 60
ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg 120
cgggtgtcgg ggctggctta actatgcggc atcagagcag attgtactga gagtgcacca 180
tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgccattc 240
gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg 300
ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc 360
ccagtcacga cgttgtaaaa cgacggccag tgaattcgag ctcggtaccc ggggatcctc 420
tagagtcgac ctgcaggcat gcaagcttgg cgtaatcatg gtcatagctg tttcctgtgt 480
gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag 540
cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt 600
tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 660
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 720
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 780
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 840
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 900
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 960
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 1020
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 1080
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 1140
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 1200
cgccactggc agcagccact ggtaacag 1228
<210> 81
<211> 1523
<212> DNA
<213> 人工序列
<220>
<223> 编码细菌的16S rRNA基因的DNA模板
<400> 81
taatacgact cactataggt ttgttggaga gtttgatcct ggctcagggt gaacgctggc 60
ggcgtgccta agacatgcaa gtcgtgcggg ccgcggggtt ttactccgtg gtcagcggcg 120
gacgggtgag taacgcgtgg gtgacctacc cggaagaggg ggacaacccg gggaaactcg 180
ggctaatccc ccatgtggac ccgccccttg gggtgtgtcc aaagggcttt gcccgcttcc 240
ggatgggccc gcgtcccatc agctagttgg tggggtaatg gcccaccaag gcgacgacgg 300
gtagccggtc tgagaggatg gccggccaca ggggcactga gacacgggcc ccactcctac 360
gggaggcagc agttaggaat cttccgcaat gggcgcaagc ctgacggagc gacgccgctt 420
ggaggaagaa gcccttcggg gtgtaaactc ctgaacccgg gacgaaaccc ccgacgaggg 480
gactgacggt accggggtaa tagcgccggc caactccgtg ccagcagccg cggtaatacg 540
gagggcgcga gcgttacccg gattcactgg gcgtaaaggg cgtgtaggcg gcctggggcg 600
tcccatgtga aagaccacgg ctcaaccgtg ggggagcgtg ggatacgctc aggctagacg 660
gtgggagagg gtggtggaat tcccggagta gcggtgaaat gcgcagatac cgggaggaac 720
gccgatggcg aaggcagcca cctggtccac ccgtgacgct gaggcgcgaa agcgtgggga 780
gcaaaccgga ttagataccc gggtagtcca cgccctaaac gatgcgcgct aggtctctgg 840
gtctcctggg ggccgaagct aacgcgttaa gcgcgccgcc tggggagtac ggccgcaagg 900
ctgaaactca aaggaattga cgggggcccg cacaagcggt ggagcatgtg gtttaattcg 960
aagcaacgcg aagaacctta ccaggccttg acatgctagg gaacccgggt gaaagcctgg 1020
ggtgccccgc gaggggagcc ctagcacagg tgctgcatgg ccgtcgtcag ctcgtgccgt 1080
gaggtgttgg gttaagtccc gcaacgagcg caacccccgc cgttagttgc cagcggttcg 1140
gccgggcact ctaacgggac tgcccgcgaa agcgggagga aggaggggac gacgtctggt 1200
cagcatggcc cttacggcct gggcgacaca cgtgctacaa tgcccactac aaagcgatgc 1260
cacccggcaa cggggagcta atcgcaaaaa ggtgggccca gttcggattg gggtctgcaa 1320
cccgacccca tgaagccgga atcgctagta atcgcggatc agccatgccg cggtgaatac 1380
gttcccgggc cttgtacaca ccgcccgtca cgccatggga gcgggctcta cccgaagtcg 1440
ccgggagcct acgggcaggc gccgagggta gggcccgtga ctggggcgaa gtcgtaacaa 1500
ggtagctgta ccggaaggtg cgg 1523
<210> 82
<211> 883
<212> PRT
<213> 人工序列
<220>
<223> T7-WT氨基酸序列
<400> 82
Met Asn Thr Ile Asn Ile Ala Lys Asn Asp Phe Ser Asp Ile Glu Leu
1 5 10 15
Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp His Tyr Gly Glu Arg Leu
20 25 30
Ala Arg Glu Gln Leu Ala Leu Glu His Glu Ser Tyr Glu Met Gly Glu
35 40 45
Ala Arg Phe Arg Lys Met Phe Glu Arg Gln Leu Lys Ala Gly Glu Val
50 55 60
Ala Asp Asn Ala Ala Ala Lys Pro Leu Ile Thr Thr Leu Leu Pro Lys
65 70 75 80
Met Ile Ala Arg Ile Asn Asp Trp Phe Glu Glu Val Lys Ala Lys Arg
85 90 95
Gly Lys Arg Pro Thr Ala Phe Gln Phe Leu Gln Glu Ile Lys Pro Glu
100 105 110
Ala Val Ala Tyr Ile Thr Ile Lys Thr Thr Leu Ala Cys Leu Thr Ser
115 120 125
Ala Asp Asn Thr Thr Val Gln Ala Val Ala Ser Ala Ile Gly Arg Ala
130 135 140
Ile Glu Asp Glu Ala Arg Phe Gly Arg Ile Arg Asp Leu Glu Ala Lys
145 150 155 160
His Phe Lys Lys Asn Val Glu Glu Gln Leu Asn Lys Arg Val Gly His
165 170 175
Val Tyr Lys Lys Ala Phe Met Gln Val Val Glu Ala Asp Met Leu Ser
180 185 190
Lys Gly Leu Leu Gly Gly Glu Ala Trp Ser Ser Trp His Lys Glu Asp
195 200 205
Ser Ile His Val Gly Val Arg Cys Ile Glu Met Leu Ile Glu Ser Thr
210 215 220
Gly Met Val Ser Leu His Arg Gln Asn Ala Gly Val Val Gly Gln Asp
225 230 235 240
Ser Glu Thr Ile Glu Leu Ala Pro Glu Tyr Ala Glu Ala Ile Ala Thr
245 250 255
Arg Ala Gly Ala Leu Ala Gly Ile Ser Pro Met Phe Gln Pro Cys Val
260 265 270
Val Pro Pro Lys Pro Trp Thr Gly Ile Thr Gly Gly Gly Tyr Trp Ala
275 280 285
Asn Gly Arg Arg Pro Leu Ala Leu Val Arg Thr His Ser Lys Lys Ala
290 295 300
Leu Met Arg Tyr Glu Asp Val Tyr Met Pro Glu Val Tyr Lys Ala Ile
305 310 315 320
Asn Ile Ala Gln Asn Thr Ala Trp Lys Ile Asn Lys Lys Val Leu Ala
325 330 335
Val Ala Asn Val Ile Thr Lys Trp Lys His Cys Pro Val Glu Asp Ile
340 345 350
Pro Ala Ile Glu Arg Glu Glu Leu Pro Met Lys Pro Glu Asp Ile Asp
355 360 365
Met Asn Pro Glu Ala Leu Thr Ala Trp Lys Arg Ala Ala Ala Ala Val
370 375 380
Tyr Arg Lys Asp Lys Ala Arg Lys Ser Arg Arg Ile Ser Leu Glu Phe
385 390 395 400
Met Leu Glu Gln Ala Asn Lys Phe Ala Asn His Lys Ala Ile Trp Phe
405 410 415
Pro Tyr Asn Met Asp Trp Arg Gly Arg Val Tyr Ala Val Ser Met Phe
420 425 430
Asn Pro Gln Gly Asn Asp Met Thr Lys Gly Leu Leu Thr Leu Ala Lys
435 440 445
Gly Lys Pro Ile Gly Lys Glu Gly Tyr Tyr Trp Leu Lys Ile His Gly
450 455 460
Ala Asn Cys Ala Gly Val Asp Lys Val Pro Phe Pro Glu Arg Ile Lys
465 470 475 480
Phe Ile Glu Glu Asn His Glu Asn Ile Met Ala Cys Ala Lys Ser Pro
485 490 495
Leu Glu Asn Thr Trp Trp Ala Glu Gln Asp Ser Pro Phe Cys Phe Leu
500 505 510
Ala Phe Cys Phe Glu Tyr Ala Gly Val Gln His His Gly Leu Ser Tyr
515 520 525
Asn Cys Ser Leu Pro Leu Ala Phe Asp Gly Ser Cys Ser Gly Ile Gln
530 535 540
His Phe Ser Ala Met Leu Arg Asp Glu Val Gly Gly Arg Ala Val Asn
545 550 555 560
Leu Leu Pro Ser Glu Thr Val Gln Asp Ile Tyr Gly Ile Val Ala Lys
565 570 575
Lys Val Asn Glu Ile Leu Gln Ala Asp Ala Ile Asn Gly Thr Asp Asn
580 585 590
Glu Val Val Thr Val Thr Asp Glu Asn Thr Gly Glu Ile Ser Glu Lys
595 600 605
Val Lys Leu Gly Thr Lys Ala Leu Ala Gly Gln Trp Leu Ala Tyr Gly
610 615 620
Val Thr Arg Ser Val Thr Lys Arg Ser Val Met Thr Leu Ala Tyr Gly
625 630 635 640
Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Leu Glu Asp Thr Ile Gln
645 650 655
Pro Ala Ile Asp Ser Gly Lys Gly Leu Met Phe Thr Gln Pro Asn Gln
660 665 670
Ala Ala Gly Tyr Met Ala Lys Leu Ile Trp Glu Ser Val Ser Val Thr
675 680 685
Val Val Ala Ala Val Glu Ala Met Asn Trp Leu Lys Ser Ala Ala Lys
690 695 700
Leu Leu Ala Ala Glu Val Lys Asp Lys Lys Thr Gly Glu Ile Leu Arg
705 710 715 720
Lys Arg Cys Ala Val His Trp Val Thr Pro Asp Gly Phe Pro Val Trp
725 730 735
Gln Glu Tyr Lys Lys Pro Ile Gln Thr Arg Leu Asn Leu Met Phe Leu
740 745 750
Gly Gln Phe Arg Leu Gln Pro Thr Ile Asn Thr Asn Lys Asp Ser Glu
755 760 765
Ile Asp Ala His Lys Gln Glu Ser Gly Ile Ala Pro Asn Phe Val His
770 775 780
Ser Gln Asp Gly Ser His Leu Arg Lys Thr Val Val Trp Ala His Glu
785 790 795 800
Lys Tyr Gly Ile Glu Ser Phe Ala Leu Ile His Asp Ser Phe Gly Thr
805 810 815
Ile Pro Ala Asp Ala Ala Asn Leu Phe Lys Ala Val Arg Glu Thr Met
820 825 830
Val Asp Thr Tyr Glu Ser Cys Asp Val Leu Ala Asp Phe Tyr Asp Gln
835 840 845
Phe Ala Asp Gln Leu His Glu Ser Gln Leu Asp Lys Met Pro Ala Leu
850 855 860
Pro Ala Lys Gly Asn Leu Asn Leu Arg Asp Ile Leu Glu Ser Asp Phe
865 870 875 880
Ala Phe Ala
<210> 83
<211> 883
<212> PRT
<213> 人工序列
<220>
<223> T7-37I (I6V, I14L, I74L, I82V, I109V, I117L, I141V, I219M, I244L,
I281V, I320V, I322L, I330V, I367L)氨基酸序列
<400> 83
Met Asn Thr Ile Asn Val Ala Lys Asn Asp Phe Ser Asp Leu Glu Leu
1 5 10 15
Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp His Tyr Gly Glu Arg Leu
20 25 30
Ala Arg Glu Gln Leu Ala Leu Glu His Glu Ser Tyr Glu Met Gly Glu
35 40 45
Ala Arg Phe Arg Lys Met Phe Glu Arg Gln Leu Lys Ala Gly Glu Val
50 55 60
Ala Asp Asn Ala Ala Ala Lys Pro Leu Val Thr Thr Leu Leu Pro Lys
65 70 75 80
Met Val Ala Arg Ile Asn Asp Trp Phe Glu Glu Val Lys Ala Lys Arg
85 90 95
Gly Lys Arg Pro Thr Ala Phe Gln Phe Leu Gln Glu Val Lys Pro Glu
100 105 110
Ala Val Ala Tyr Leu Thr Ile Lys Thr Thr Leu Ala Cys Leu Thr Ser
115 120 125
Ala Asp Asn Thr Thr Val Gln Ala Val Ala Ser Ala Val Gly Arg Ala
130 135 140
Ile Glu Asp Glu Ala Arg Phe Gly Arg Ile Arg Asp Leu Glu Ala Lys
145 150 155 160
His Phe Lys Lys Asn Val Glu Glu Gln Leu Asn Lys Arg Val Gly His
165 170 175
Val Tyr Lys Lys Ala Phe Met Gln Val Val Glu Ala Asp Met Leu Ser
180 185 190
Lys Gly Leu Leu Gly Gly Glu Ala Trp Ser Ser Trp His Lys Glu Asp
195 200 205
Ser Met His Val Gly Val Arg Cys Ile Glu Met Leu Ile Glu Ser Thr
210 215 220
Gly Met Val Ser Leu His Arg Gln Asn Ala Gly Val Val Gly Gln Asp
225 230 235 240
Ser Glu Thr Leu Glu Leu Ala Pro Glu Tyr Ala Glu Ala Ile Ala Thr
245 250 255
Arg Ala Gly Ala Leu Ala Gly Ile Ser Pro Met Phe Gln Pro Cys Val
260 265 270
Val Pro Pro Lys Pro Trp Thr Gly Val Thr Gly Gly Gly Tyr Trp Ala
275 280 285
Asn Gly Arg Arg Pro Leu Ala Leu Val Arg Thr His Ser Lys Lys Ala
290 295 300
Leu Met Arg Tyr Glu Asp Val Tyr Met Pro Glu Val Tyr Lys Ala Val
305 310 315 320
Asn Leu Ala Gln Asn Thr Ala Trp Lys Val Asn Lys Lys Val Leu Ala
325 330 335
Val Ala Asn Val Ile Thr Lys Trp Lys His Cys Pro Val Glu Asp Ile
340 345 350
Pro Ala Ile Glu Arg Glu Glu Leu Pro Met Lys Pro Glu Asp Leu Asp
355 360 365
Met Asn Pro Glu Ala Leu Thr Ala Trp Lys Arg Ala Ala Ala Ala Val
370 375 380
Tyr Arg Lys Asp Lys Ala Arg Lys Ser Arg Arg Ile Ser Leu Glu Phe
385 390 395 400
Met Leu Glu Gln Ala Asn Lys Phe Ala Asn His Lys Ala Ile Trp Phe
405 410 415
Pro Tyr Asn Met Asp Trp Arg Gly Arg Val Tyr Ala Val Ser Met Phe
420 425 430
Asn Pro Gln Gly Asn Asp Met Thr Lys Gly Leu Leu Thr Leu Ala Lys
435 440 445
Gly Lys Pro Ile Gly Lys Glu Gly Tyr Tyr Trp Leu Lys Ile His Gly
450 455 460
Ala Asn Cys Ala Gly Val Asp Lys Val Pro Phe Pro Glu Arg Ile Lys
465 470 475 480
Phe Ile Glu Glu Asn His Glu Asn Ile Met Ala Cys Ala Lys Ser Pro
485 490 495
Leu Glu Asn Thr Trp Trp Ala Glu Gln Asp Ser Pro Phe Cys Phe Leu
500 505 510
Ala Phe Cys Phe Glu Tyr Ala Gly Val Gln His His Gly Leu Ser Tyr
515 520 525
Asn Cys Ser Leu Pro Leu Ala Phe Asp Gly Ser Cys Ser Gly Ile Gln
530 535 540
His Phe Ser Ala Met Leu Arg Asp Glu Val Gly Gly Arg Ala Val Asn
545 550 555 560
Leu Leu Pro Ser Glu Thr Val Gln Asp Ile Tyr Gly Ile Val Ala Lys
565 570 575
Lys Val Asn Glu Ile Leu Gln Ala Asp Ala Ile Asn Gly Thr Asp Asn
580 585 590
Glu Val Val Thr Val Thr Asp Glu Asn Thr Gly Glu Ile Ser Glu Lys
595 600 605
Val Lys Leu Gly Thr Lys Ala Leu Ala Gly Gln Trp Leu Ala Tyr Gly
610 615 620
Val Thr Arg Ser Val Thr Lys Arg Ser Val Met Thr Leu Ala Tyr Gly
625 630 635 640
Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Leu Glu Asp Thr Ile Gln
645 650 655
Pro Ala Ile Asp Ser Gly Lys Gly Leu Met Phe Thr Gln Pro Asn Gln
660 665 670
Ala Ala Gly Tyr Met Ala Lys Leu Ile Trp Glu Ser Val Ser Val Thr
675 680 685
Val Val Ala Ala Val Glu Ala Met Asn Trp Leu Lys Ser Ala Ala Lys
690 695 700
Leu Leu Ala Ala Glu Val Lys Asp Lys Lys Thr Gly Glu Ile Leu Arg
705 710 715 720
Lys Arg Cys Ala Val His Trp Val Thr Pro Asp Gly Phe Pro Val Trp
725 730 735
Gln Glu Tyr Lys Lys Pro Ile Gln Thr Arg Leu Asn Leu Met Phe Leu
740 745 750
Gly Gln Phe Arg Leu Gln Pro Thr Ile Asn Thr Asn Lys Asp Ser Glu
755 760 765
Ile Asp Ala His Lys Gln Glu Ser Gly Ile Ala Pro Asn Phe Val His
770 775 780
Ser Gln Asp Gly Ser His Leu Arg Lys Thr Val Val Trp Ala His Glu
785 790 795 800
Lys Tyr Gly Ile Glu Ser Phe Ala Leu Ile His Asp Ser Phe Gly Thr
805 810 815
Ile Pro Ala Asp Ala Ala Asn Leu Phe Lys Ala Val Arg Glu Thr Met
820 825 830
Val Asp Thr Tyr Glu Ser Cys Asp Val Leu Ala Asp Phe Tyr Asp Gln
835 840 845
Phe Ala Asp Gln Leu His Glu Ser Gln Leu Asp Lys Met Pro Ala Leu
850 855 860
Pro Ala Lys Gly Asn Leu Asn Leu Arg Asp Ile Leu Glu Ser Asp Phe
865 870 875 880
Ala Phe Ala
<210> 84
<211> 895
<212> PRT
<213> 人工序列
<220>
<223> YenP氨基酸序列
<400> 84
Met Asn Ile Leu Asn His Val Ala Arg Asn Asp Phe Ser Glu Met Glu
1 5 10 15
Leu Ala Ala Ile Pro Tyr Asn Thr Leu Ser Glu His Tyr Gly Asp Arg
20 25 30
Leu Ala Arg Glu Gln Leu Ala Leu Glu His Glu Ala Tyr Glu Leu Gly
35 40 45
Glu Lys Arg Phe Leu Lys Met Leu Asp Arg Gln Ala Gln Ala Gly Glu
50 55 60
Leu Ala Asp Asn Ala Ala Ala Lys Pro Leu Val Ala Thr Leu Val Pro
65 70 75 80
Arg Met Ala Ser Arg Val Thr Glu Trp Val Asp Glu Ser Phe Phe Val
85 90 95
Thr Asp Pro Glu Thr Gly Glu Lys Lys Gly Lys Lys Gly Lys Arg Ser
100 105 110
Val Ser Gln Arg Ile Leu Arg Glu Val Lys Pro Glu Val Val Ala Phe
115 120 125
Val Thr Ile Lys Cys Val Leu Gly Gly Leu Thr Ser Thr Gly Ser Thr
130 135 140
Val Val Gln Arg Leu Ala Ser Ser Val Gly Lys Ala Leu Glu Glu Glu
145 150 155 160
Met Arg Phe Gly Arg Ile Arg Asp Leu Glu Gln Lys His Phe Lys Lys
165 170 175
Asn Val Gln Glu Gln Leu Glu Lys Arg Val Gly His Val Tyr Lys Lys
180 185 190
Ala Phe Leu Gln Val Val Glu Ala Asp Met Leu Ser Lys Gly Leu Met
195 200 205
Gly Gly Glu Ala Trp Ser Ser Trp Thr Ala Glu Asp Thr Ile Gln Val
210 215 220
Gly Val Lys Cys Ile Glu Leu Leu Ile Glu Ser Thr Gly Leu Val Glu
225 230 235 240
Leu Glu Arg Glu Gly His Gly Ile Ala Gly Ala Asp Ser Glu Asn Val
245 250 255
Lys Leu Ala Asp Glu Tyr Met Asp Ile Ile Thr Lys Arg Ala Gly Ala
260 265 270
Leu Ala Gly Ile Ala Pro Met His Gln Pro Cys Val Val Pro Pro Lys
275 280 285
Pro Trp Thr Gly Val Ile Gly Gly Gly Tyr Trp Ala Asn Gly Arg Lys
290 295 300
Pro Leu Ala Leu Val Arg Thr His Ser Lys Lys Ala Leu Leu Arg Tyr
305 310 315 320
Glu Asp Val Tyr Met Pro Glu Val Tyr Lys Ala Val Asn Ile Ala Gln
325 330 335
Asn Thr Pro Trp Lys Ile Asn Lys Lys Val Leu Ala Val Val Asn Gln
340 345 350
Val Thr Lys Trp Gln His Cys Pro Val Ala Asp Val Pro Ala Gln Glu
355 360 365
Arg Glu Glu Leu Pro Gln Arg Pro Asp Asp Met Asp Thr Asn Pro Glu
370 375 380
Ala Leu Lys Ala Trp Lys Lys Ala Ala Ser Ala Val Tyr Arg Lys Asp
385 390 395 400
Lys Ala Arg Val Ser Arg Arg Leu Ser Leu Glu Phe Met Leu Ala Gln
405 410 415
Ala Asn Lys Phe Ala Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met
420 425 430
Asp Trp Arg Gly Arg Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly
435 440 445
Asn Asp Met Thr Lys Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile
450 455 460
Gly Ala Glu Gly Phe Tyr Trp Leu Lys Ile His Gly Ala Asn Thr Ala
465 470 475 480
Gly Val Asp Lys Val Thr Phe Pro Glu Arg Ile Lys Phe Ile Glu Asp
485 490 495
Asn His Ala Asn Ile Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr
500 505 510
Trp Trp Ala Glu Gln Asp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe
515 520 525
Glu Tyr Ala Gly Val Gln Ser His Gly Leu Gly Tyr Val Cys Ser Leu
530 535 540
Pro Leu Ala Phe Asp Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala
545 550 555 560
Met Leu Arg Asp Glu Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser
565 570 575
Glu Glu Val Gln Asp Ile Tyr Gly Ile Val Ala Gln Arg Val Asn Glu
580 585 590
Met Leu Leu Glu Ala Thr Val Ser Gly Thr Ala Asp Glu Thr Glu Thr
595 600 605
Leu Val Asn Lys Asp Thr Gly Glu Ile Thr Glu Arg Leu Lys Leu Gly
610 615 620
Thr Ala Lys Leu Ala Ala Gln Trp Leu Ala Phe Gly Val Thr Arg Lys
625 630 635 640
Val Thr Lys Arg Ser Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe
645 650 655
Gly Phe Arg Gln Gln Val Leu Glu Asp Thr Val Gln Pro Ala Leu Asp
660 665 670
Asn Gly Gln Gly Leu Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr
675 680 685
Met Ala Lys Leu Ile Trp Glu Ala Val Ser Val Thr Val Val Ala Ala
690 695 700
Val Glu Ala Met Asn Trp Leu Lys Ala Ser Ala Lys Leu Leu Ala Ala
705 710 715 720
Glu Val Lys Asp Lys Lys Thr Asp Glu Val Leu Arg Ala Arg Cys Ala
725 730 735
Val His Trp Val Thr Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Arg
740 745 750
Lys Pro Val Gln Ser Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg
755 760 765
Leu Gln Pro Thr Ile Asn Thr Asn Lys Asp Ser Gly Ile Asp Ala His
770 775 780
Lys Gln Glu Ser Gly Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly
785 790 795 800
Asn His Leu Arg Met Thr Val Val His Ala His Glu Ala Tyr Gly Ile
805 810 815
Glu Ser Phe Ala Leu Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp
820 825 830
Ala Ala Asn Leu Phe Lys Ala Val Arg Glu Thr Met Val Ser Thr Tyr
835 840 845
Glu Glu Asn Asp Val Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln
850 855 860
Leu His Glu Ser Gln Leu Glu Lys Met Pro Ala Leu Pro Ala Lys Gly
865 870 875 880
Ser Leu Asn Leu Gln Asp Ile Leu Lys Ser Asp Phe Ala Phe Ala
885 890 895
<210> 85
<211> 893
<212> PRT
<213> 人工序列
<220>
<223> phiEap氨基酸序列
<400> 85
Met Ser Leu Met Asn Ser Ile Glu Arg Asn Asp Phe Ser Asp Ile Glu
1 5 10 15
Leu Ala Ala Ile Pro Tyr Asn Ile Leu Ser Glu His Tyr Gly Ala Ser
20 25 30
Leu Ala Lys Glu Gln Leu Ala Leu Glu His Glu Ala Tyr Glu Leu Gly
35 40 45
Glu Gln Arg Phe Leu Lys Thr Phe Glu Arg Gln Met Asn Asn Gly Glu
50 55 60
Leu Ala Asp Asn Ala Ala Ala Lys Pro Leu Val Leu Thr Leu Leu Pro
65 70 75 80
Arg Leu Val Ser Arg Ile Asn Gln Trp Arg His Glu Gln Val Tyr Lys
85 90 95
Leu Asn Asp Lys Gly Glu Glu Val Leu Arg Gly Gly Lys Lys Thr Ile
100 105 110
Met Phe Asn Leu Thr Ala Thr Leu Thr Ala Glu Ala Val Ala Leu Ala
115 120 125
Thr Ile Lys Thr Val Leu Ala Ser Leu Thr Ser Thr Asn Ala Val Thr
130 135 140
Ile Gln Glu Ala Gly Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala
145 150 155 160
Arg Phe Gly Arg Ile Arg Asp Leu Glu Glu Lys His Phe Lys Lys Asn
165 170 175
Val Lys Glu Gln Leu Glu Lys Arg Val Gly Thr Val Tyr Lys Lys Ala
180 185 190
Phe Met Gln Val Ile Glu Ala Asp Met Leu Ser Lys Gly Leu Met Gly
195 200 205
Gly Gln Ala Trp Ala Ser Trp Ser Lys Glu Asp Ser Ile His Val Gly
210 215 220
Ile Arg Cys Ile Glu Leu Leu Ile Glu Ala Thr Gly Met Val Glu Val
225 230 235 240
Val Arg His Gly Ala Gly Ile Ala Lys Leu Asp Ser Glu Asn Leu Gln
245 250 255
Leu Thr Lys Glu Tyr Ala Asp Leu Ile Thr Lys Arg Ala Gly Ala Leu
260 265 270
Ala Gly Ile Ser Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro
275 280 285
Trp Thr Glu Ile Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro
290 295 300
Leu Ala Leu Val Arg Thr His Gly Lys Lys Ala Leu Met Arg Tyr Gln
305 310 315 320
Asp Val Tyr Met Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Ser
325 330 335
Thr Pro Trp Lys Ile Asn Gln Lys Val Leu Lys Val Ala Asn Glu Ile
340 345 350
Val Asn Trp Lys Asn Cys Pro Val Glu Asp Val Pro Ala Thr Glu Arg
355 360 365
Lys Glu Leu Pro Val Lys Pro Asp Asp Ile Asp Thr Asn Pro Glu Ala
370 375 380
Leu Lys Ala Trp Lys Lys Ala Ala Ser Thr Ile Tyr Arg Asn Asp Lys
385 390 395 400
Ala Arg Val Ser Arg Arg Ile Ser Met Glu Phe Met Leu Ala Gln Ala
405 410 415
Asn Lys Phe Ala Asn Lys Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp
420 425 430
Trp Arg Gly Arg Val Tyr Ala Val Pro Met Phe Asn Pro Gln Gly Asn
435 440 445
Asp Leu Thr Lys Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly
450 455 460
Leu Asp Gly Leu Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly
465 470 475 480
Val Asp Lys Val Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn
485 490 495
His Asp Asn Ile Met Gln Ser Ala Ala Asn Pro Ile Glu Phe Asp Trp
500 505 510
Trp Ala Lys Gln Asp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu
515 520 525
Tyr Ala Gly Val Glu His His Gly Leu Asn Tyr Asn Cys Ser Leu Pro
530 535 540
Leu Ala Phe Asp Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met
545 550 555 560
Leu Arg Asp Glu Ile Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Thr
565 570 575
Glu Val Gln Asp Ile Tyr Arg Ile Val Ala Asp Lys Val Asn Glu Ile
580 585 590
Leu Lys Val Asp Ala Val Asn Gly Thr Ala Asn Glu Val Glu Leu Ile
595 600 605
Thr Asp Lys Thr Thr Gly Glu Ile Lys Glu Arg Leu Lys Val Gly Thr
610 615 620
Ser Val Met Ala Gln Glu Trp Leu Ala Phe Gly Val Thr Arg Lys Val
625 630 635 640
Thr Lys Arg Ser Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly
645 650 655
Phe Arg Gln Gln Ile Leu Asp Asp Thr Val Gln Pro Ala Ile Asp Asn
660 665 670
Gly Tyr Thr Gly Phe Thr Asn Gly Asn Gln Ser Ala Gly Tyr Met Ala
675 680 685
Lys Leu Ile Trp Asn Ala Val Ser Val Thr Val Val Ala Ala Val Glu
690 695 700
Ala Met Asn Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val
705 710 715 720
Lys Asp Lys Lys Thr Lys Glu Val Leu Arg Ala Arg Cys Ala Val His
725 730 735
Trp Val Thr Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Arg Lys Ser
740 745 750
Lys Gln Val Arg Leu Asp Leu Ile Phe Leu Gly Ser Ile Arg Leu Gln
755 760 765
Pro Thr Val Asn Thr Asn Lys Asp Thr Gly Ile Asp Ala His Lys Gln
770 775 780
Glu Ser Gly Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Asn His
785 790 795 800
Leu Arg Ala Thr Val Val His Ala His Glu Lys Tyr Gly Ile Glu Ser
805 810 815
Phe Ala Leu Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala
820 825 830
Asn Leu Phe Lys Ala Val Arg Glu Thr Met Val Glu Thr Tyr Glu Ser
835 840 845
Asn Asp Val Leu Ala Asp Phe Tyr Glu Gln Phe Ala Asp Gln Leu His
850 855 860
Glu Ser Gln Leu Glu Asp Met Pro Ala Leu Pro Lys Ala Gly Asn Leu
865 870 875 880
Asn Leu Gln Asp Ile Leu Lys Ser Asp Phe Ala Phe Ala
885 890
<210> 86
<211> 906
<212> PRT
<213> 人工序列
<220>
<223> KpnP氨基酸序列
<400> 86
Met Asn Ala Leu Asn Ile Ala Arg Asn Asp Phe Ser Glu Ile Glu Leu
1 5 10 15
Ala Ala Ile Pro Tyr Asn Ile Leu Ser Glu His Tyr Gly Asp Lys Leu
20 25 30
Ala Arg Glu Gln Leu Ala Leu Glu His Glu Ala Tyr Glu Leu Gly Glu
35 40 45
Gln Arg Phe Leu Lys Met Leu Glu Arg Gln Val Lys Ala Gly Glu Phe
50 55 60
Ala Asp Asn Val Ala Ala Lys Pro Leu Val Leu Thr Leu His Pro Gln
65 70 75 80
Leu Thr Lys Arg Ile Asp Asp Trp Lys Glu Glu Gln Ala Asn Ala Arg
85 90 95
Gly Lys Lys Pro Arg Ala Tyr Tyr Pro Ile Lys His Gly Val Ala Ser
100 105 110
Glu Leu Ala Val Asn Met Gly Ala Glu Val Leu Lys Glu Lys Arg Gly
115 120 125
Val Ser Ser Glu Ala Ile Ala Leu Leu Thr Ile Lys Val Val Leu Gly
130 135 140
Thr Leu Thr Asp Ala Ser Lys Ala Thr Ile Gln Gln Val Ser Ser Gln
145 150 155 160
Leu Gly Lys Ala Leu Glu Asp Glu Ala Arg Phe Gly Arg Ile Arg Glu
165 170 175
Gln Glu Ala Ala Tyr Phe Lys Lys Asn Val Ala Asp Gln Leu Asp Lys
180 185 190
Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val Val Glu Ala
195 200 205
Asp Met Ile Ser Lys Gly Met Leu Gly Gly Asp Asn Trp Ser Ser Trp
210 215 220
Lys Thr Asp Glu Gln Met His Val Gly Thr Lys Leu Leu Glu Leu Leu
225 230 235 240
Ile Glu Gly Thr Gly Leu Val Glu Met Thr Lys Asn Lys Met Ala Asp
245 250 255
Gly Ser Asp Asp Val Thr Ser Met Gln Met Val Gln Leu Ala Pro Ala
260 265 270
Phe Val Glu Leu Leu Ser Lys Arg Ala Gly Ala Leu Ala Gly Ile Ser
275 280 285
Pro Met Tyr Gln Pro Cys Val Val Pro Pro Lys Pro Trp Val Glu Thr
290 295 300
Val Gly Gly Gly Tyr Trp Ser Val Gly Arg Arg Pro Leu Ala Leu Val
305 310 315 320
Arg Thr His Ser Lys Lys Ala Leu Arg Arg Tyr Glu Asp Val His Met
325 330 335
Pro Glu Val Tyr Lys Ala Val Asn Leu Ala Gln Asn Thr Pro Trp Lys
340 345 350
Val Asn Lys Lys Val Leu Ala Val Val Asn Glu Ile Ile Asn Trp Lys
355 360 365
His Cys Pro Val Gly Asp Val Pro Ala Ile Glu Arg Glu Glu Leu Pro
370 375 380
Pro Arg Pro Asp Asp Ile Asp Thr Asn Glu Val Ala Arg Lys Ala Trp
385 390 395 400
Arg Lys Glu Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Gln Ser
405 410 415
Arg Arg Leu Ser Met Glu Phe Met Val Ala Gln Ala Asn Lys Phe Ala
420 425 430
Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg
435 440 445
Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys
450 455 460
Gly Met Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Leu Asp Gly Phe
465 470 475 480
Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val
485 490 495
Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn Asp Ala Asn Ile
500 505 510
Leu Ala Ser Ala Ala Asp Pro Leu Asn Asn Thr Trp Trp Thr Gln Gln
515 520 525
Asp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val
530 535 540
Lys His His Gly Leu Asn Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp
545 550 555 560
Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Ser
565 570 575
Ile Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Asp Thr Val Gln Asp
580 585 590
Ile Tyr Lys Ile Val Ala Asp Lys Val Asn Glu Val Leu His Gln His
595 600 605
Val Ile Asn Gly Ser Gln Thr Val Val Glu Gln Ile Ala Asp Lys Glu
610 615 620
Thr Gly Glu Phe Arg Glu Lys Val Thr Leu Gly Glu Ser Val Leu Ala
625 630 635 640
Ala Gln Trp Leu Gln Tyr Gly Val Thr Arg Lys Val Thr Lys Arg Ser
645 650 655
Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln
660 665 670
Val Leu Glu Asp Thr Ile Gln Pro Ala Ile Asp Asn Gly Glu Gly Leu
675 680 685
Met Phe Thr His Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile
690 695 700
Trp Asp Ala Val Thr Val Thr Val Val Ala Ala Val Glu Ala Met Asn
705 710 715 720
Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys
725 730 735
Lys Thr Lys Glu Val Leu Arg Lys Arg Cys Ala Ile His Trp Val Thr
740 745 750
Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Arg Lys Gln Asn Gln Ala
755 760 765
Arg Leu Lys Leu Val Phe Leu Gly Gln Ala Asn Val Lys Met Thr Tyr
770 775 780
Asn Thr Gly Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly
785 790 795 800
Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Met
805 810 815
Thr Val Val His Ala Asn Glu Val Tyr Gly Ile Asp Ser Phe Ala Leu
820 825 830
Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Gly Asn Leu Phe
835 840 845
Lys Ala Val Arg Glu Thr Met Val Lys Thr Tyr Glu Asp Asn Asp Val
850 855 860
Ile Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln
865 870 875 880
Leu Asp Lys Met Pro Ala Val Pro Ala Lys Gly Asp Leu Asn Leu Arg
885 890 895
Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala
900 905
<210> 87
<211> 369
<212> PRT
<213> 人工序列
<220>
<223> T7-分裂-N片段的氨基酸序列
<400> 87
His His His His His His Met Asn Thr Ile Asn Val Ala Lys Asn Asp
1 5 10 15
Phe Ser Asp Leu Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp
20 25 30
His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His Glu
35 40 45
Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg Gln
50 55 60
Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu Val
65 70 75 80
Thr Thr Leu Leu Pro Lys Met Val Ala Arg Ile Asn Asp Trp Phe Glu
85 90 95
Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe Leu
100 105 110
Gln Glu Val Lys Pro Glu Ala Val Ala Tyr Leu Thr Ile Lys Thr Thr
115 120 125
Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val Ala
130 135 140
Ser Ala Val Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg Ile
145 150 155 160
Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln Leu
165 170 175
Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val Val
180 185 190
Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp Ser
195 200 205
Ser Trp His Lys Glu Asp Ser Met His Val Gly Val Arg Cys Ile Glu
210 215 220
Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn Ala
225 230 235 240
Gly Val Val Gly Gln Asp Ser Glu Thr Leu Glu Leu Ala Pro Glu Tyr
245 250 255
Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser Pro
260 265 270
Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Val Thr
275 280 285
Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val Arg
290 295 300
Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met Pro
305 310 315 320
Glu Val Tyr Lys Ala Val Asn Leu Ala Gln Asn Thr Ala Trp Lys Val
325 330 335
Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys His
340 345 350
Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro Met
355 360 365
Lys
<210> 88
<211> 43
<212> PRT
<213> 人工序列
<220>
<223> T7-N-1氨基酸序列
<400> 88
His His His His His His Met Asn Thr Ile Asn Val Ala Lys Asn Asp
1 5 10 15
Phe Ser Asp Leu Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp
20 25 30
His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu
35 40
<210> 89
<211> 32
<212> PRT
<213> 人工序列
<220>
<223> T7-N-2氨基酸序列
<400> 89
Cys Leu Glu His Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys
1 5 10 15
Met Phe Glu Arg Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala
20 25 30
<210> 90
<211> 70
<212> PRT
<213> 人工序列
<220>
<223> T7-N-3氨基酸序列
<400> 90
Cys Lys Pro Leu Val Thr Thr Leu Leu Pro Lys Met Val Ala Arg Ile
1 5 10 15
Asn Asp Trp Phe Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr
20 25 30
Ala Phe Gln Phe Leu Gln Glu Val Lys Pro Glu Ala Val Ala Tyr Leu
35 40 45
Thr Ile Lys Thr Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr
50 55 60
Val Gln Ala Val Ala Ser
65 70
<210> 91
<211> 76
<212> PRT
<213> 人工序列
<220>
<223> T7-N-4氨基酸序列
<400> 91
Cys Val Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg Ile Arg
1 5 10 15
Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln Leu Asn
20 25 30
Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val Val Glu
35 40 45
Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp Ser Ser
50 55 60
Trp His Lys Glu Asp Ser Met His Val Gly Val Arg
65 70 75
<210> 92
<211> 44
<212> PRT
<213> 人工序列
<220>
<223> T7-N-5氨基酸序列
<400> 92
Cys Ile Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg
1 5 10 15
Gln Asn Ala Gly Val Val Gly Gln Asp Ser Glu Thr Leu Glu Leu Ala
20 25 30
Pro Glu Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly
35 40
<210> 93
<211> 34
<212> PRT
<213> 人工序列
<220>
<223> T7-N-6氨基酸序列
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> 经N-末端三氟乙酰基噻唑烷-4-羧酸
(Tfa-Thz)结合的
<400> 93
Leu Ala Gly Ile Ser Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys
1 5 10 15
Pro Trp Thr Gly Val Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg
20 25 30
Pro Leu
<210> 94
<211> 69
<212> PRT
<213> 人工序列
<220>
<223> T7-N-7氨基酸序列
<400> 94
Cys Leu Val Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp
1 5 10 15
Val Tyr Met Pro Glu Val Tyr Lys Ala Val Asn Leu Ala Gln Asn Thr
20 25 30
Ala Trp Lys Val Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr
35 40 45
Lys Trp Lys His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu
50 55 60
Glu Leu Pro Met Lys
65
<210> 95
<211> 238
<212> PRT
<213> 人工序列
<220>
<223> T7-分裂-M片段的氨基酸序列
<400> 95
Pro Glu Asp Leu Asp Met Asn Pro Glu Ala Leu Thr Ala Trp Lys Arg
1 5 10 15
Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser Arg Arg
20 25 30
Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Asn His
35 40 45
Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg Val Tyr
50 55 60
Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys Gly Leu
65 70 75 80
Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr Tyr Trp
85 90 95
Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val Pro Phe
100 105 110
Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile Met Ala
115 120 125
Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln Asp Ser
130 135 140
Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Gln His
145 150 155 160
His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp Gly Ser
165 170 175
Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu Val Gly
180 185 190
Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp Ile Tyr
195 200 205
Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp Ala Ile
210 215 220
Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn
225 230 235
<210> 96
<211> 45
<212> PRT
<213> 人工序列
<220>
<223> T7-M-1氨基酸序列
<400> 96
Pro Glu Asp Leu Asp Met Asn Pro Glu Ala Leu Thr Ala Trp Lys Arg
1 5 10 15
Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser Arg Arg
20 25 30
Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe
35 40 45
<210> 97
<211> 38
<212> PRT
<213> 人工序列
<220>
<223> T7-M-2氨基酸序列
<400> 97
Cys Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly
1 5 10 15
Arg Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr
20 25 30
Lys Gly Leu Leu Thr Leu
35
<210> 98
<211> 44
<212> PRT
<213> 人工序列
<220>
<223> T7-M-3氨基酸序列
<400> 98
Cys Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr Tyr Trp Leu Lys Ile
1 5 10 15
His Gly Ala Asn Cys Ala Gly Val Asp Lys Val Pro Phe Pro Glu Arg
20 25 30
Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile Met
35 40
<210> 99
<211> 43
<212> PRT
<213> 人工序列
<220>
<223> T7-M-4氨基酸序列
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> 经N-末端三氟乙酰基噻唑烷-4-羧酸
(Tfa-Thz)结合的
<400> 99
Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln Asp Ser
1 5 10 15
Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Gln His
20 25 30
His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu
35 40
<210> 100
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> T7-M-5氨基酸序列
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> 经N-末端三氟乙酰基噻唑烷-4-羧酸
(Tfa-Thz)结合的
<400> 100
Phe Asp Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg
1 5 10 15
Asp Glu Val Gly Gly Arg
20
<210> 101
<211> 44
<212> PRT
<213> 人工序列
<220>
<223> T7-M-6氨基酸序列
<400> 101
Cys Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp Ile Tyr Gly Ile
1 5 10 15
Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp Ala Ile Asn Gly
20 25 30
Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn
35 40
<210> 102
<211> 282
<212> PRT
<213> 人工序列
<220>
<223> T7-分裂-C片段的氨基酸序列
<400> 102
Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala
1 5 10 15
Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser
20 25 30
Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln
35 40 45
Val Leu Glu Asp Thr Ile Gln Pro Ala Ile Asp Ser Gly Lys Gly Leu
50 55 60
Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile
65 70 75 80
Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn
85 90 95
Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys
100 105 110
Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr
115 120 125
Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr
130 135 140
Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile
145 150 155 160
Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly
165 170 175
Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys
180 185 190
Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu
195 200 205
Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe
210 215 220
Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val
225 230 235 240
Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln
245 250 255
Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg
260 265 270
Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala
275 280
<210> 103
<211> 72
<212> PRT
<213> 人工序列
<220>
<223> T7-C-1氨基酸序列
<400> 103
Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala
1 5 10 15
Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser
20 25 30
Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln
35 40 45
Val Leu Glu Asp Thr Ile Gln Pro Ala Ile Asp Ser Gly Lys Gly Leu
50 55 60
Met Phe Thr Gln Pro Asn Gln Ala
65 70
<210> 104
<211> 49
<212> PRT
<213> 人工序列
<220>
<223> T7-C-2氨基酸序列
<400> 104
Cys Gly Tyr Met Ala Lys Leu Ile Trp Glu Ser Val Ser Val Thr Val
1 5 10 15
Val Ala Ala Val Glu Ala Met Asn Trp Leu Lys Ser Ala Ala Lys Leu
20 25 30
Leu Ala Ala Glu Val Lys Asp Lys Lys Thr Gly Glu Ile Leu Arg Lys
35 40 45
Arg
<210> 105
<211> 75
<212> PRT
<213> 人工序列
<220>
<223> T7-C-3氨基酸序列
<400> 105
Cys Ala Val His Trp Val Thr Pro Asp Gly Phe Pro Val Trp Gln Glu
1 5 10 15
Tyr Lys Lys Pro Ile Gln Thr Arg Leu Asn Leu Met Phe Leu Gly Gln
20 25 30
Phe Arg Leu Gln Pro Thr Ile Asn Thr Asn Lys Asp Ser Glu Ile Asp
35 40 45
Ala His Lys Gln Glu Ser Gly Ile Ala Pro Asn Phe Val His Ser Gln
50 55 60
Asp Gly Ser His Leu Arg Lys Thr Val Val Trp
65 70 75
<210> 106
<211> 44
<212> PRT
<213> 人工序列
<220>
<223> T7-C-4氨基酸序列
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> 经N-末端三氟乙酰基噻唑烷-4-羧酸
(Tfa-Thz)结合的
<400> 106
His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu Ile His Asp Ser Phe
1 5 10 15
Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe Lys Ala Val Arg Glu
20 25 30
Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val Leu
35 40
<210> 107
<211> 41
<212> PRT
<213> 人工序列
<220>
<223> T7-C-5氨基酸序列
<400> 107
Cys Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln Leu
1 5 10 15
Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg Asp
20 25 30
Ile Leu Glu Ser Asp Phe Ala Phe Ala
35 40
<210> 108
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> DNA模板的核酸序列
<400> 108
gatctcgatc ccgcgaaatt aatacgactc actataggtc ccccgtgccc atagcggcgt 60
ggaaccaccc gttcccattc cgaacacgga agtgaaacgc gccagcgccg atggtactgg 120
gcgggcgacc gcctgggaga gtaggtcggt gcgggggatt 160
<210> 109
<211> 1539
<212> DNA
<213> 人工序列
<220>
<223> Tt 16S DNA模板的核酸序列
<400> 109
ctcgatcccg cgaaattaat acgactcact ataggtttgt tggagagttt gatcctggct 60
cagggtgaac gctggcggcg tgcctaagac atgcaagtcg tgcgggccgc ggggttttac 120
tccgtggtca gcggcggacg ggtgagtaac gcgtgggtga cctacccgga agagggggac 180
aacccgggga aactcgggct aatcccccat gtggacccgc cccttggggt gtgtccaaag 240
ggctttgccc gcttccggat gggcccgcgt cccatcagct agttggtggg gtaatggccc 300
accaaggcga cgacgggtag ccggtctgag aggatggccg gccacagggg cactgagaca 360
cgggccccac tcctacggga ggcagcagtt aggaatcttc cgcaatgggc gcaagcctga 420
cggagcgacg ccgcttggag gaagaagccc ttcggggtgt aaactcctga acccgggacg 480
aaacccccga cgaggggact gacggtaccg gggtaatagc gccggccaac tccgtgccag 540
cagccgcggt aatacggagg gcgcgagcgt tacccggatt cactgggcgt aaagggcgtg 600
taggcggcct ggggcgtccc atgtgaaaga ccacggctca accgtggggg agcgtgggat 660
acgctcaggc tagacggtgg gagagggtgg tggaattccc ggagtagcgg tgaaatgcgc 720
agataccggg aggaacgccg atggcgaagg cagccacctg gtccacccgt gacgctgagg 780
cgcgaaagcg tggggagcaa accggattag atacccgggt agtccacgcc ctaaacgatg 840
cgcgctaggt ctctgggtct cctgggggcc gaagctaacg cgttaagcgc gccgcctggg 900
gagtacggcc gcaaggctga aactcaaagg aattgacggg ggcccgcaca agcggtggag 960
catgtggttt aattcgaagc aacgcgaaga accttaccag gccttgacat gctagggaac 1020
ccgggtgaaa gcctggggtg ccccgcgagg ggagccctag cacaggtgct gcatggccgt 1080
cgtcagctcg tgccgtgagg tgttgggtta agtcccgcaa cgagcgcaac ccccgccgtt 1140
agttgccagc ggttcggccg ggcactctaa cgggactgcc cgcgaaagcg ggaggaagga 1200
ggggacgacg tctggtcagc atggccctta cggcctgggc gacacacgtg ctacaatgcc 1260
cactacaaag cgatgccacc cggcaacggg gagctaatcg caaaaaggtg ggcccagttc 1320
ggattggggt ctgcaacccg accccatgaa gccggaatcg ctagtaatcg cggatcagcc 1380
atgccgcggt gaatacgttc ccgggccttg tacacaccgc ccgtcacgcc atgggagcgg 1440
gctctacccg aagtcgccgg gagcctacgg gcaggcgccg agggtagggc ccgtgactgg 1500
ggcgaagtcg taacaaggta gctgtaccgg aaggtgcgg 1539
<210> 110
<211> 113
<212> DNA
<213> 人工序列
<220>
<223> tRNA(Ser)DNA模板
<400> 110
tggcggagag agggggattt gaacccccgg tagagttgcc cctactccgg ttttcgagac 60
cggtccgttc agccgctccg gcatctctcc tatagtgagt cgtattagaa ccg 113
<210> 111
<211> 163
<212> DNA
<213> 人工序列
<220>
<223> L-鸟嘌呤传感器的DNA模板
<400> 111
ctcgatcccg cgaaattaat acgactcact atagacgcga ctgaatgaaa tggtgaagga 60
cgggtccaga taatcgcgtg gatatggcac gcaagtttct accgggcacc gtaaatgtcc 120
gactcttgtt gagtagagtg tgagctccgt aactagtcgc gtc 163
<210> 112
<211> 203
<212> DNA
<213> 人工序列
<220>
<223> L- 38-6核糖酶的DNA模板
<400> 112
ggactaatac gactcactat tagtcattgc cgcacaaaga caaatctccc ctcagagctt 60
gagaacatct acggatgcag aggagggggc cttcggtgga tcaattgtgc accaccgttc 120
tcaacacgta cccgaacata aaaagacctg acaaaaaggc gatgttagac acgcacaggt 180
gccataccca acacatggct gac 203
<210> 113
<211> 133
<212> DNA
<213> 人工序列
<220>
<223> L-第I类连接酶的DNA模板
<400> 113
ggactaatac gactcactat tgacaatgac aaaaaatcac tattgttgag aacgttggcg 60
ttaaagccac cgggggctgc ctcccctgca tccgaagatg ttctcaagct ctgagggcag 120
atttgtcttt tcc 133
<210> 114
<211> 182
<212> DNA
<213> 人工序列
<220>
<223> L- 38-6核糖酶
<400> 114
agucauugcc gcacaaagac aaaucucccc ucagagcuug agaacaucua cggaugcaga 60
ggagggggcc uucgguggau caauugugca ccaccguucu caacacguac ccgaacauaa 120
aaagaccuga caaaaaggcg auguuagaca cgcacaggug ccauacccaa cacauggcug 180
ac 182
<210> 115
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> L- 5'-经FAM标记的引物
<220>
<221> misc_feature
<222> (1)..(1)
<223> 经FAM标记的
<220>
<221> misc_feature
<222> (1)..(1)
<223> 经FAM结合的
<400> 115
ggaaaagaca aaucugcccu 20
<210> 116
<211> 112
<212> DNA
<213> 人工序列
<220>
<223> L-第I类连接酶的模板
<400> 116
gacaaugaca aaaaaucacu auuguugaga acguuggcgu uaaagccacc gggggcugcc 60
uccccugcau ccgaagaugu ucucaagcuc ugagggcaga uuugucuuuu cc 112

Claims (97)

1.一种化学生产蛋白质的方法,其特征在于:所述方法包括步骤:连接所述蛋白质的至少两个有利连接片段,其中各个所述有利连接片段是可化学合成的,且可通过以下的方式获得:
(i)鉴定在所述蛋白质的氨基酸序列中的至少一有利连接序列,在所述有利连接序列处解析所述蛋白质的氨基酸序列,以得到多个有利连接片段;以及
(ii)倘若各个所述有利连接片段是可化学合成的,则化学合成各个所述有利连接片段;
(iii)倘若所述有利连接片段中的任一者非是可化学合成的,则鉴定在所述有利连接片段中的至少一结构缺失区段、利用一有利连接氨基酸残基取代在所述结构缺失区段中的至少一氨基酸,以在所述结构缺失区段中引入一有利连接序列、在所述有利连接序列处解析所述蛋白质的氨基酸序列;
以及化学合成各个所述有利连接片段。
2.根据权利要求1所述的方法,其特征在于:在步骤(i)中,所述有利连接序列中的至少一者是位于所述蛋白质中的结构缺失区段。
3.根据权利要求1至2中任一项所述的方法,其特征在于:所述方法包括步骤(iii)。
4.根据权利要求1至3中任一项所述的方法,其特征在于:在步骤(i)之前,所述方法包括步骤:
(a)将所述蛋白质的氨基酸序列分裂成至少两个结构域形成片段;
(b)倘若各个所述结构域形成片段是可化学合成的,则化学合成各个所述结构域形成片段;以及
(c)共同折迭所述结构域形成片段,从而获得所述蛋白质。
5.根据权利要求4所述的方法,其特征在于:所述方法包括步骤(a)。
6.根据权利要求4所述的方法,其特征在于:倘若所述结构域形成片段中的一者非为可可化学合成的,则
(d)鉴定在所述结构域形成片段中的至少一有利连接序列,以及在所述有利连接序列处解析所述结构域形成片段的氨基酸序列,从而得到多个可化学合成的有利连接片段;
(e)倘若所述结构域形成片段基本上缺乏一有利连接序列,或所述有利连接片段中的任一者非为可化学合成的,则鉴定在所述结构域形成片段或所述有利连接片段中的至少一结构缺失区段;
(f)利用一有利连接氨基酸残基取代在所述结构缺失区段或所述有利连接片段中的至少一氨基酸,以在所述结构缺失区段或所述有利连接片段中引入一有利连接序列,以及在所述有利连接序列处解析所述结构域形成片段的氨基酸序列,从而得到可化学合成的多个有利连接片段的序列;以及
(g)化学合成各个所述可化学合成的有利连接片段。
7.根据权利要求1所述的方法,其特征在于:所述方法包括步骤(f)。
8.根据权利要求1至7中任一项所述的方法,其特征在于:所述蛋白质展现至少5%的相应的生物性生产的蛋白质的活性。
9.根据权利要求8所述的方法,其特征在于:所述活性是选自由催化活性、特异性结合活性,以及结构活性所组成的群组。
10.根据权利要求1至9中任一项所述的方法,其特征在于:所述蛋白质包括至少240个氨基酸残基。
11.根据权利要求1至10中任一项所述的方法,其特征在于:所述蛋白质包括约400个氨基酸残基。
12.根据权利要求1至11中任一项所述的方法,其特征在于:所述方法进一步包括步骤:在所述有利连接片段中的至少一者中,根据以下的疏水性顺序,利用一疏水性较弱的氨基酸取代至少一疏水性氨基酸残基:Ile>Leu>Phe>Val>Met>Pro>Trp>His(0)>Thr>Glu(0)>Gln>Cys>Tyr>Ala>Ser>Asn>Asp(0)>Arg+>Gly>His+>Glu>Lys+>Asp-。
13.根据权利要求1至12中任一项所述的方法,其特征在于:所述蛋白质是使用至少90%的非Gly D-氨基酸残基所生产。
14.根据权利要求13所述的方法,其特征在于:相较于一相应的生物性生产的蛋白质的3D结构,所述蛋白质基本上具有一镜像的3D结构。
15.根据权利要求13至14中任一项所述的方法,其特征在于:所述方法进一步包括步骤:利用D-氨基酸残基取代至少一Ile残基,所述D-氨基酸残基是选自由以下所组成的群组:D-Ala残基、D-Val残基、D-Leu残基、D-Thr残基、D-Phe残基、D-Met残基、Gly残基,以及D-Pro残基。
16.一种根据权利要求1至15中任一项所述的方法所制备的蛋白质,其特征在于:所述蛋白质具有至少约240个氨基酸残基的长度。
17.根据权利要求16所述的蛋白质,其特征在于:所述蛋白质包括至少两个结构域形成片段,所述结构域形成片段是非共价连接的多肽链,其中所述结构域形成片段是在至少一相应的生物性生产的蛋白质中的共价连接的多肽链。
18.根据权利要求16至17中任一项所述的蛋白质,其特征在于:所述蛋白质是选自由以下所组成的群组:酶、转运蛋白、结构/力学蛋白、激素、信号蛋白、抗体、体液平衡蛋白、pH平衡蛋白、细胞通道,以及细胞泵。
19.根据权利要求18所述的蛋白质,其特征在于:所述蛋白质是酶,所述酶能够催化一反应,所述反应是由一相应的生物性生产的酶所催化。
20.根据权利要求19所述的蛋白质,其特征在于:所述酶是RNA聚合酶,能够使用一DNA模板从核糖核苷酸合成RNA。
21.根据权利要求20所述的蛋白质,其特征在于:所述RNA聚合酶是T7 RNA聚合酶,或Pfu DNA聚合酶突变。
22.根据权利要求21所述的蛋白质,其特征在于:所述Pfu DNA聚合酶突变具有至少一突变,所述突变是选自由V93Q、E102A、D141A、E143A、Y410G、A486L及E665K所组成的群组。
23.根据权利要求19所述的蛋白质,其特征在于:所述酶是DNA聚合酶,能够从脱氧核糖核苷酸合成DNA。
24.根据权利要求23所述的蛋白质,其特征在于:所述DNA聚合酶是PfuDNA聚合酶。
25.一种化学生产D-氨基酸蛋白质的方法,其特征在于:所述方法包括步骤:连接所述D-氨基酸蛋白质的至少两个有利连接片段,其中各个所述有利连接片段包括至少90%的非Gly D-氨基酸残基且是可化学合成的,以及可通过以下的步骤获得:
(i)鉴定在一相应的L-氨基酸蛋白质的氨基酸序列中的至少一有利连接序列,在所述有利连接序列处解析所述氨基酸序列,以得到多个有利连接片段;以及
(ii)倘若各个所述有利连接片段是可化学合成的,则利用至少90%的非Gly D-氨基酸残基,以化学合成各个所述有利连接片段;
(iii)倘若所述有利连接片段中的任一者非为可化学合成的,则鉴定在所述有利连接片段中的至少一结构缺失区段、利用一有利连接氨基酸残基来取代在所述结构缺失区段中的至少一氨基酸,以在所述结构缺失区段中引入一有利连接序列、在所述有利连接序列处解析所述有利连接片段的氨基酸序列;以及利用至少90%的非Gly D-氨基酸残基,以化学合成各个所述有利连接片段。
26.根据权利要求25所述的方法,其特征在于:在步骤(i)中,所述有利连接序列中的至少一者是位于所述相应的L-氨基酸蛋白质中的结构缺失区段中。
27.根据权利要求25至26中任一项所述的方法,其特征在于:所述方法包括步骤(iii)。
28.根据权利要求25所述的方法,其特征在于:在步骤(i)之前,所述方法包括步骤:
(a)将所述L-氨基酸蛋白质的氨基酸序列分裂成至少两个结构域形成片段;
(b)倘若各个所述结构域形成片段是可化学合成的,则利用至少90%的非Gly D-氨基酸残基,以化学合成各个所述结构域形成片段;以及
(c)共同折迭所述结构域形成片段,从而获得所述D-氨基酸蛋白质。
29.根据权利要求28所述的方法,其特征在于:倘若所述结构域形成片段中的一者非为可可化学合成的,则
(d)鉴定在所述结构域形成片段中的至少一有利连接序列,以及在所述有利连接序列处解析所述结构域形成片段的氨基酸序列,从而得到多个可化学合成的有利连接片段;
(e)倘若所述结构域形成片段基本上缺乏一有利连接序列,或所述有利连接片段中的任一者非为可化学合成的,则鉴定在所述结构域形成片段或所述有利连接片段中的至少一结构缺失区段;
(f)利用一有利连接氨基酸残基取代在所述结构缺失区段或所述有利连接片段中的至少一氨基酸,以在所述结构缺失区段或所述有利连接片段中引入一有利连接序列,以及在所述有利连接序列处解析所述结构域形成片段的氨基酸序列;以及
(g)利用至少90%的非Gly D-氨基酸残基,以化学合成各个所述有利连接片段,从而得到所述结构域形成片段。
30.根据权利要求25所述的方法,其特征在于:所述方法包括步骤(iii)。
31.根据权利要求25至30中任一项所述的方法,其特征在于:所述D-氨基酸蛋白质展现至少10%的所述L-氨基酸蛋白质的活性。
32.根据权利要求31所述的方法,其特征在于:所述活性是选自由催化活性、特异性结合活性,以及结构活性所组成的群组。
33.根据权利要求25至32中任一项所述的方法,其特征在于:所述D-氨基酸蛋白质包括至少240个氨基酸残基。
34.根据权利要求25至33中任一项所述的方法,其特征在于:所述D-氨基酸蛋白质包括约400个氨基酸残基。
35.根据权利要求25至34中任一项所述的方法,其特征在于:所述方法进一步包括步骤:在所述有利连接片段中的至少一者中,根据以下的疏水性顺序,利用一疏水性较弱的氨基酸取代至少一疏水性D-氨基酸残基:D-Ile>D-Leu>D-Phe>D-Val>D-Met>D-Pro>D-Trp>D-His(0)>D-Thr>D-Glu(0)>D-Gln>D-Cys>D-Tyr>D-Ala>D-Ser>D-Asn>D-Asp(0)>D-Arg+>Gly>D-His+>D-Glu>D-Lys+>D-Asp-。
36.根据权利要求25至35中任一项所述的方法,其特征在于:相较于所述L-氨基酸蛋白质的3D结构,所述D-氨基酸蛋白质基本上具有一镜像的3D结构。
37.根据权利要求25至36中任一项所述的方法,其特征在于:所述方法进一步包括步骤:利用D-氨基酸残基取代至少一Ile残基,所述D-氨基酸残基是选自由以下所组成的群组:D-Ala残基、D-Val残基、D-Leu残基、D-Thr残基、Gly残基、D-Phe残基、D-Met残基,以及D-Pro残基。
38.一种D-氨基酸蛋白质,其特征在于:所述D-氨基酸蛋白质是根据权利要求13至15或25至37中任一项所述的方法所制得。
39.根据权利要求38所述的D-氨基酸蛋白质,其特征在于:相较于一相应的L-氨基酸蛋白质的3D结构,所述D-氨基酸蛋白质基本上具有一镜像的3D结构。
40.根据权利要求38至39中任一项所述的D-氨基酸蛋白质,其特征在于:所述D-氨基酸蛋白质包括至少两个结构域形成片段,所述结构域形成片段是非共价连接的多肽链,其中所述结构域形成片段是在至少一相应的L-氨基酸蛋白质中的共价连接的多肽链。
41.根据权利要求38至39中任一项所述的D-氨基酸蛋白质,其特征在于:所述D-氨基酸蛋白质是选自由以下所组成的群组:酶、转运蛋白、结构/力学蛋白、激素、信号蛋白、抗体、体液平衡蛋白、pH平衡蛋白、细胞通道,以及细胞泵。
42.根据权利要求41所述的D-氨基酸蛋白质,其特征在于:所述D-氨基酸蛋白质是D-氨基酸酶,相较于一相应的L-氨基酸酶,所述D-氨基酸酶能够催化一对映体反应。
43.根据权利要求42所述的D-氨基酸蛋白质,其特征在于:所述D-氨基酸酶是D-氨基酸的RNA聚合酶,能够使用一L-DNA模板从L-核糖核苷酸合成L-RNA。
44.根据权利要求43所述的D-氨基酸蛋白质,其特征在于:所述D-氨基酸的RNA聚合酶是D-氨基酸的T7 RNA聚合酶,或D-氨基酸的Pfu DNA聚合酶突变。
45.根据权利要求44所述的D-氨基酸蛋白质,其特征在于:所述D-氨基酸的Pfu DNA聚合酶突变具有至少一突变,所述突变是选自由V93Q、E102A、D141A、E143A、Y410G、A486L及E665K所组成的群组。
46.根据权利要求44所述的D-氨基酸蛋白质,其特征在于:所述D-氨基酸蛋白质是T7RNA聚合酶,所述T7 RNA聚合酶包括至少一分裂位点,第一分裂位点是介于K363与P364之间,以及第二分裂位点是介于N601与T602之间。
47.根据权利要求46所述的D-氨基酸蛋白质,其特征在于:所述分裂位点被选择为从位置357至位置366,及/或从位置564至位置607。
48.根据权利要求42所述的D-氨基酸蛋白质,其特征在于:所述D-氨基酸酶是D-氨基酸的DNA聚合酶,能够从L-脱氧核糖核苷酸合成L-DNA。
49.根据权利要求48所述的D-氨基酸蛋白质,其特征在于:所述D-氨基酸的DNA聚合酶是D-氨基酸的Pfu DNA聚合酶。
50.一种T7 RNA聚合酶,其特征在于:所述T7 RNA聚合酶包括至少两条多肽链,所述至少两条多肽链是通过介于K363与P364之间的分裂,及/或介于N601与T602之间的分裂所形成的。
51.根据权利要求50所述的T7 RNA聚合酶,其特征在于:所述T7 RNA聚合酶进一步包括至少一突变,所述突变是选自由以下所组成的群组:I6V、I14L、I74V、I82V、I109V、I117L、I141V、I210M、I244L、I281V、I320V、I322L、I330V及I367L。
52.一种T7 RNA聚合酶,其特征在于:所述T7 RNA聚合酶具有一氨基酸序列,所述氨基酸序列与SEQ ID No.83具有至少80%至90%的序列同一性的特征。
53.一种Pfu DNA聚合酶,其特征在于:所述Pfu DNA聚合酶包括至少两条多肽链,所述至少两条多肽链是通过介于K467与M468之间的分裂所形成的。
54.根据权利要求53所述的Pfu DNA聚合酶,其特征在于:所述Pfu DNA聚合酶进一步包括至少一突变,所述突变是选自由E102A、E276A、K317G、V367L及I540A所组成的群组。
55.根据权利要求44及53至54所述的Pfu DNA聚合酶,其特征在于:所述Pfu DNA聚合酶进一步包括至少一突变,所述突变是选自由V93Q、D141A、E143A、Y410G、A486L及E665K所组成的群组。
56.根据权利要求44及53至54所述的Pfu DNA聚合酶,其特征在于:所述Pfu DNA聚合酶进一步包括至少一突变,所述突变是选自由D215A、A486Y及L490W(SEQ ID No.77)所组成的群组。
57.根据权利要求44及53至54所述的Pfu DNA聚合酶,其特征在于:所述Pfu DNA聚合酶进一步包括DNA结合结构域,其中所述DNA结合结构域是sso7d结构域(SEQ ID No.78)。
58.根据权利要求55所述的Pfu DNA聚合酶,其特征在于:所述Pfu DNA聚合酶展现RNA聚合活性。
59.根据权利要求56所述的Pfu DNA聚合酶,其特征在于:所述Pfu DNA聚合酶展现缺乏3’至5’核酸外切酶活性及提高的双脱氧核苷三磷酸(ddNTP)选择性。
60.根据权利要求57所述的Pfu DNA聚合酶,其特征在于:所述Pfu DNA聚合酶展现改善的扩增速度及延伸能力。
61.一种Pfu DNA聚合酶,其特征在于:所述Pfu DNA聚合酶具有一氨基酸序列,所述氨基酸序列与SEQ ID No.51具有至少80%至90%的序列同一性的特征,或所述氨基酸序列与SEQ ID No.79具有至少80%或至少90%的序列同一性的特征。
62.一种根据权利要求38所述的D-氨基酸蛋白质的用途,其特征在于:所述D-氨基酸蛋白质是酶,在一产物的合成中进行催化,所述产物是通过一相应的L-氨基酸酶所合成的分子的对映体,或在一受质的反应中进行催化,所述受质是一相应的L-氨基酸酶的相应受质的对映体。
63.一种酶促生产L-聚脱氧核糖核酸分子的方法,其特征在于:所述方法包括步骤:
提供D-氨基酸的DNA聚合酶,其是根据权利要求13至15或25至37中任一项所述的方法所制得,能够从L-脱氧核糖核苷酸合成L-DNA;以及
将所述D-氨基酸的DNA聚合酶与模板L-DNA分子、L-DNA引物及多个L-脱氧核糖核苷酸进行反应,
从而酶促生产所述L-DNA分子。
64.根据权利要求63所述的方法,其特征在于:所述D-氨基酸的DNA聚合酶是Pfu DNA聚合酶。
65.根据权利要求64所述的方法,其特征在于:所述Pfu DNA聚合酶基本上是如本文所提供。
66.一种酶促生产L-多核糖核酸(L-RNA)分子的方法,其特征在于:所述方法包括步骤:
提供D-氨基酸的RNA聚合酶,其是根据权利要求13至15或25至37中任一项所述的方法所制得,能够从L-核糖核苷酸合成L-RNA;以及
将所述D-氨基酸的RNA聚合酶与模板L-DNA分子、L-DNA/RNA引物及多个L-核糖核苷酸进行反应,
从而酶促生产所述L-RNA分子。
67.根据权利要求66所述的方法,其特征在于:所述D-氨基酸的RNA聚合酶是T7 RNA聚合酶,或Pfu DNA聚合酶突变,所述Pfu DNA聚合酶突变具有至少一突变,所述突变是选自由V93Q、E102A、D141A、E143A、Y410G、A486L及E665K所组成的群组。
68.根据权利要求67所述的方法,其特征在于:所述T7 RNA聚合酶基本上是如本文所提供。
69.一种形成一外消旋晶体的方法,其特征在于:所述方法包括步骤:
将一感兴趣的分子与所述感兴趣的分子的对映体进行共结晶,从而形成一对映体对的外消旋晶体,其中所述感兴趣的分子的所述对映体是如权利要求38所述的D-氨基酸蛋白质或其产物。
70.一种分子探针,其特征在于:所述分子探针包括如权利要求38所述的D-氨基酸蛋白质,其上连接有一标记部分,且对一分析物具有亲和力,所述分析物是一相应的L-氨基酸蛋白质的相应的分析物的对映体。
71.一种用于生产L-核酸适体或D-肽结合部分的方法,其特征在于:所述方法包括步骤:
提供D-氨基酸蛋白质,其是根据权利要求13至15或25至37中任一项所述的方法所制得;以及
通过指数富集过程,使所述D-氨基酸蛋白质经历配体的系统进化,从而获得所述L-核酸适体或D-肽结合部分。
72.一种扩增DNA序列或RNA序列的方法,其特征在于:所述方法包括步骤:使DNA或RNA序列的模板与根据权利要求1至12中任一项所制得的DNA或RNA聚合酶进行反应,其中所述反应基本上是在缺乏天然酶及/或天然DNA/RNA污染的情况下进行。
73.一种对L-DNA或L-RNA进行测序的方法,其特征在于:所述方法包括步骤:使用如本文所提供的D-氨基酸的DNA聚合酶或D-氨基酸的RNA聚合酶、硫代磷酸酯L-dNTPs或硫代磷酸酯L-NTPs,以及利用两种不同染剂进行5’标记的两个引物。
74.一种对L-DNA进行测序的方法,其特征在于:所述方法包括步骤:使用如本文所提供的D-氨基酸的DNA聚合酶、L-双脱氧核苷三磷酸,以及利用两种不同染剂进行5’标记的两个引物。
75.根据权利要求73及74中任一项所述的方法,其特征在于:所述染剂是FAM及Cy5。
76.一种数据存储系统,其特征在于:所述数据存储系统包括:
至少一L-核酸分子,其具有编码信息数据的序列;
用于合成及/或测序所述L-DNA分子的D-氨基酸的RNA聚合酶及/或D-氨基酸的DNA聚合酶,其中所述D-氨基酸的RNA聚合酶及/或所述D-氨基酸的DNA聚合酶是根据权利要求13至15或25至37中任一项所述的方法所制得。
77.根据权利要求76所述的系统,其特征在于:所述L-核酸分子是化学制得,或通过镜像酶催化反应所制得。
78.根据权利要求76所述的系统,其特征在于:所述L-核酸分子是进行化学测序,或通过使用镜像酶的边合成边测序法进行测序。
79.根据权利要求76所述的系统,其特征在于:所述D-氨基酸的RNA聚合酶是权利要求50至52中任一项所述的T7 RNA聚合酶。
80.根据权利要求76所述的系统,其特征在于:所述D-氨基酸的DNA聚合酶是权利要求53至61中任一项所述的Pfu DNA聚合酶。
81.一种手性隐写术的方法,其特征在于:所述方法包括:
至少一D-核酸分子,其具有编码覆盖信息数据的序列;
至少一L-核酸分子及/或D-/L-嵌合核酸分子,其具有编码密钥以解密隐写信息数据的序列,
D-氨基酸的RNA聚合酶及/或D-氨基酸的DNA聚合酶,其用于合成及/或测序所述L-DNA分子,其中所述D-氨基酸的RNA聚合酶及/或所述D-氨基酸的DNA聚合酶是根据权利要求13至15或25至37中任一项所述的方法所制得。
82.根据权利要求81所述的系统,其特征在于:所述L-核酸分子是化学制得,或通过镜像酶催化反应所制得。
83.根据权利要求81所述的系统,其特征在于:所述L-核酸分子是进行化学测序,或通过使用镜像酶的边合成边测序法进行测序。
84.根据权利要求81所述的系统,其特征在于:所述D-/L-嵌合核酸分子是化学制得,或通过天然/镜像酶催化反应所制得。
85.根据权利要求81所述的系统,其特征在于:所述D-/L-嵌合核酸分子的L-DNA/RNA部分是进行化学测序,或通过使用镜像酶的边合成边测序法进行测序。
86.根据权利要求81所述的系统,其特征在于:所述D-氨基酸的RNA聚合酶是权利要求50至52中任一项所述的T7 RNA聚合酶。
87.根据权利要求81所述的系统,其特征在于:所述D-氨基酸的DNA聚合酶是权利要求53至61中任一项所述的Pfu DNA聚合酶。
88.根据权利要求81所述的系统,其特征在于:所述系统可与DNA密码技术结合,使用加密数据提供额外的安全层。
89.一种研究L-RNA水解的方法,其特征在于:所述方法包括:
至少一L-RNA分子,其具有高级结构及长的序列;
D-氨基酸的RNA聚合酶及/或D-氨基酸的DNA聚合酶,其用于合成所述L-RNA分子,其中所述D-氨基酸的RNA聚合酶及/或所述D-氨基酸的DNA聚合酶是根据权利要求13至15或25至37中任一项所述的方法所生产。
90.一种研究RNA降解的方法,其特征在于:所述方法包括:
至少一L-RNA分子,其具有高级结构及长的序列;
D-氨基酸的RNA聚合酶及/或D-氨基酸的DNA聚合酶,其用于合成所述L-RNA分子,其中所述D-氨基酸的RNA聚合酶及/或所述D-氨基酸的DNA聚合酶是根据权利要求13至15或25至37中任一项所述的方法所生产。
91.根据权利要求90所述的方法,其特征在于:所述方法可用于评估RNase抑制剂的有效性。
92.一种转录的AND逻辑,其特征在于:所述转录的AND逻辑包括D-氨基酸的RNA聚合酶,其中所述D-氨基酸的RNA聚合酶是根据权利要求13至15或25至37中任一项所述的方法所生产。
93.根据权利要求92所述的系统,其特征在于:所述D-氨基酸的RNA聚合酶是权利要求50至52中任一项所述的T7 RNA聚合酶。
94.根据权利要求92所述的系统,其特征在于:所述D-氨基酸的RNA聚合酶包括至少一分裂位点,第一分裂位点是介于K363与P364之间,以及第二分裂位点是介于N601与T602之间。
95.根据权利要求92所述的系统,其特征在于:所述D-氨基酸的RNA聚合酶包括至少一分裂位点,上述的位点是位于同一环中,即从位置357至位置366及/或从位置564至位置607。
96.一种生产L-RNA标记/阶梯的方法,其特征在于:所述方法包括步骤:
提供D-氨基酸的RNA聚合酶,其是根据权利要求13至15或25至37中任一项所述的方法所制得,且能够从L-核糖核苷酸合成L-RNA;以及
将所述D-氨基酸的RNA聚合酶与不同长度的各个模板L-DNA分子、L-DNA/RNA引物及多个L-核糖核苷酸进行反应,
从而分别酶促生产不同长度的L-RNA分子,且在纯化后以一特定的浓度混合在一起。
97.根据权利要求96所述的方法,其特征在于:所述D-氨基酸的RNA聚合酶基本上是如本文所提供的T7 RNA聚合酶。
CN202180068729.0A 2020-08-06 2021-05-13 大型及镜像蛋白质的化学合成及其用途 Pending CN116547380A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063061844P 2020-08-06 2020-08-06
US63/061844 2020-08-06
PCT/IB2021/054106 WO2022029512A1 (en) 2020-08-06 2021-05-13 Chemical synthesis of large and mirror-image proteins and uses thereof

Publications (1)

Publication Number Publication Date
CN116547380A true CN116547380A (zh) 2023-08-04

Family

ID=76502751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180068729.0A Pending CN116547380A (zh) 2020-08-06 2021-05-13 大型及镜像蛋白质的化学合成及其用途

Country Status (10)

Country Link
US (1) US20230313156A1 (zh)
EP (1) EP4192841A1 (zh)
JP (1) JP2023537902A (zh)
KR (1) KR20230118799A (zh)
CN (1) CN116547380A (zh)
AU (1) AU2021321395A1 (zh)
CA (1) CA3188462A1 (zh)
IL (1) IL300418B1 (zh)
MX (1) MX2023001604A (zh)
WO (1) WO2022029512A1 (zh)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6184344B1 (en) * 1995-05-04 2001-02-06 The Scripps Research Institute Synthesis of proteins by native chemical ligation
CA2395874C (en) * 1999-05-06 2011-09-20 Frank Carter Bancroft Dna-based steganography
WO2008029085A2 (en) * 2006-09-06 2008-03-13 Medical Research Council Polymerase
KR20110044753A (ko) * 2008-08-08 2011-04-29 토소가부시키가이샤 기능 개선된 rna 중합효소 변이체
US9193959B2 (en) * 2010-04-16 2015-11-24 Roche Diagnostics Operations, Inc. T7 RNA polymerase variants with enhanced thermostability
CA2817579A1 (en) * 2010-11-12 2012-04-14 Reflexion Pharmaceuticals, Inc. Gb1 peptidic libraries and compounds, and methods of screening the same

Also Published As

Publication number Publication date
CA3188462A1 (en) 2022-02-10
IL300418B1 (en) 2024-07-01
IL300418A (en) 2023-04-01
WO2022029512A8 (en) 2023-05-11
US20230313156A1 (en) 2023-10-05
JP2023537902A (ja) 2023-09-06
KR20230118799A (ko) 2023-08-14
AU2021321395A1 (en) 2023-04-13
WO2022029512A1 (en) 2022-02-10
EP4192841A1 (en) 2023-06-14
MX2023001604A (es) 2023-09-05

Similar Documents

Publication Publication Date Title
Fan et al. Bioorthogonal information storage in l-DNA with a high-fidelity mirror-image Pfu DNA polymerase
Pech et al. A thermostable d-polymerase for mirror-image PCR
Rocco et al. Construction and use of new cloning vectors for the rapid isolation of recombinant proteins from Escherichia coli
Jiang et al. Mirror-image polymerase chain reaction
CN109072203B (zh) 镜像核酸复制体系
EP2850192B1 (en) Enzymatic synthesis of l-nucleic acids
CN107614689A (zh) 用于将非天然氨基酸并入蛋白质中的平台
JP6670237B2 (ja) 酵素によるl−核酸の合成
CN106754811A (zh) 一种突变型Tn5转座酶及其制备方法和应用
CN108795893B (zh) 一种氨基酸脱氢酶突变体及其制备方法和应用
US20130189757A1 (en) Affinity purification of rna under native conditions based on the lambda boxb/n peptide interaction
CN113249362A (zh) 经改造的胞嘧啶碱基编辑器及其应用
CN116547380A (zh) 大型及镜像蛋白质的化学合成及其用途
KR101646728B1 (ko) 디제너러시 리프로그래밍을 통한 비천연 단백질 합성 방법
Class et al. Patent application title: Enzymatic Synthesis of L-Nucleic Acids Inventors: Andreas Pech (Halle, DE) Ralf David (Leipzig, DE) Florian Jarosch (Berlin, DE) Florian Jarosch (Berlin, DE) Michael Jahnz (Berlin, DE) Sven Klussmann (Berlin, DE) Assignees: NOXXON PHARMA AG
北田栄 Characterization of Mitochondrial Processing Peptidase β subunit as the Catalytic Function Primary Structure, Expression and Site-directed Mutagenesis of Rat Mitochondrial Processing Peptidase

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40098654

Country of ref document: HK