CN115605216A - 用于体内递送dna有效载荷的细菌递送媒介物 - Google Patents

用于体内递送dna有效载荷的细菌递送媒介物 Download PDF

Info

Publication number
CN115605216A
CN115605216A CN202080097730.1A CN202080097730A CN115605216A CN 115605216 A CN115605216 A CN 115605216A CN 202080097730 A CN202080097730 A CN 202080097730A CN 115605216 A CN115605216 A CN 115605216A
Authority
CN
China
Prior art keywords
virus
protein
bacterial
delivery vehicle
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080097730.1A
Other languages
English (en)
Inventor
J·费尔南德斯罗德里格斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Erig Biotechnology Co ltd
Original Assignee
Erig Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Erig Biotechnology Co ltd filed Critical Erig Biotechnology Co ltd
Priority claimed from PCT/EP2020/088043 external-priority patent/WO2021136812A1/en
Publication of CN115605216A publication Critical patent/CN115605216A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/06Organic compounds, e.g. natural or synthetic hydrocarbons, polyolefins, mineral oil, petrolatum or ozokerite
    • A61K47/26Carbohydrates, e.g. sugar alcohols, amino sugars, nucleic acids, mono-, di- or oligo-saccharides; Derivatives thereof, e.g. polysorbates, sorbitan fatty acid esters or glycyrrhizin
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/711Natural deoxyribonucleic acids, i.e. containing only 2'-deoxyriboses attached to adenine, guanine, cytosine or thymine and having 3'-5' phosphodiester links
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/66Microorganisms or materials therefrom
    • A61K35/74Bacteria
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/162Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/46Ingredients of undetermined constitution or reaction products thereof, e.g. skin, bone, milk, cotton fibre, eggshell, oxgall or plant extracts
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • C12N15/73Expression systems using phage (lambda) regulatory sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/10011Details dsDNA Bacteriophages
    • C12N2795/10311Siphoviridae
    • C12N2795/10322New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/10011Details dsDNA Bacteriophages
    • C12N2795/10311Siphoviridae
    • C12N2795/10341Use of virus, viral particle or viral elements as a vector
    • C12N2795/10342Use of virus, viral particle or viral elements as a vector virus or viral particle as vehicle, e.g. encapsulating small organic molecule
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Veterinary Medicine (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biochemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Biophysics (AREA)
  • Virology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Botany (AREA)
  • Immunology (AREA)
  • Mycology (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本公开总体上涉及细菌递送媒介物及其在将期望的有效载荷有效转移到受试者微生物群的目标细菌细胞中的用途。更具体地讲,本公开涉及可用于在体内将期望的有效载荷有效地转移至受试者微生物群的一种或多种目标细菌细胞的具有期望的宿主范围的细菌递送媒介物。

Description

用于体内递送DNA有效载荷的细菌递送媒介物
技术领域
本公开总体上涉及细菌递送媒介物及其在将期望的有效载荷有效转移至目标细菌细胞群中的用途。更具体地讲,本公开涉及可用于在体内将期望的有效载荷有效地转移至微生物组的一个或多个目标细菌细胞群的具有期望的宿主范围的细菌递送媒介物。
背景
细菌递送颗粒中的衣壳化DNA可用作将遗传物质递送至目标细菌群体中的方法。存在几种允许在实验室环境中将外源性DNA包装成噬菌体颗粒例如λ细菌噬菌体的系统。例如,这种系统包括在细菌细胞中直接产生包装颗粒的系统和体外无细胞系统[1]-[3]。这些系统利用了这样一个事实,即将同源包装位点添加至外源性DNA载体(称为噬菌粒,并且更具体地讲在存在cos包装位点的情况下称为粘粒)中允许将该有效载荷有效地包装到成熟病毒颗粒中。这种方法已在许多不同的应用中使用,例如用于产生粘粒文库或将特定基因转导到细菌中[2],[4]。大多数这些转导测定在实验室条件下进行:细胞在受控生长培养基(比如LB)中培养,并且转导方案在具有已知溶质浓度的缓冲液中进行。
对于体内应用,比如口服递送衣壳化成颗粒的DNA,需要能以足够高的浓度给予以到达所有目标细胞的细菌递送媒介物;因此,给予足够高滴度的有效载荷对于优化体内活性以及制备过程至关重要。包装成颗粒的DNA还需要能够足够牢固且长地结合其目标细胞以进行注入过程。
概述
尽管先前已表明侧尾丝的存在在K-12实验室菌株中对于λ介导的体外转导实验不是必需的[5],但本文证明侧尾丝实际上为优化治疗的受试者中的体内活性所必需的。本公开提供用于体内递送至感兴趣的目标宿主细菌的递送媒介物,比如治疗的受试者肠道中的那些。
本公开涉及λ形细菌递送媒介物及其在将期望的有效载荷有效体内转移到目标细菌细胞中的用途。期望的有效载荷包括编码感兴趣的基因的核酸分子。
提供用于将感兴趣的DNA有效载荷体内递送到目标细菌细胞群中的λ形细菌递送媒介物。在一个实施方案中,细菌递送媒介物包含一种或多种受体结合蛋白(RBP)。如本文使用的,受体结合蛋白或RBP为识别和任选地结合和/或修饰或降解位于细菌外包膜上的底物的多肽,所述底物非限制性地比如细菌外膜、LPS、荚膜、蛋白受体、通道、结构比如鞭毛、菌毛、分泌系统。底物非限制性地可为任何碳水化合物或修饰的碳水化合物、任何脂质或修饰的脂质、任何蛋白或修饰的蛋白、任何氨基酸序列及其任何组合。
在一个实施方案中,细菌递送媒介物包含一种或多种选自功能性λ形侧尾丝蛋白(本文的“STF蛋白”)、功能性λ形gpJ蛋白和功能性λ形gpH蛋白的RBP。在另一个实施方案中,细菌递送媒介物可包含两种或更多种选自功能性λ形侧尾丝蛋白(本文的“STF蛋白”)、功能性λ形gpJ蛋白和功能性λ形gpH蛋白的蛋白。在一个特定实施方案中,细菌递送媒介物包含功能性λ形侧尾丝蛋白(本文的“STF蛋白”)和功能性λ形gpJ蛋白。在仍然另一个实施方案中,细菌递送媒介物包含功能性λ形侧尾丝蛋白(本文的“STF蛋白”)、功能性λ形gpJ蛋白和功能性λ形gpH蛋白。在另一方面,细菌递送媒介物包含功能性λ形gpJ蛋白和功能性λ形gpH蛋白。在另一方面,细菌递送媒介物包含(i)功能性λ形侧尾丝蛋白。除功能性STF蛋白之外,细菌递送媒介物可进一步包含(ii)功能性λ形gpJ蛋白;和任选地(iii)功能性λ形gpH蛋白。
在一个实施方案中,STF蛋白、gpJ蛋白和/或gpH蛋白为野生型λSTF、gpJ和/或gpH蛋白。或者,STF蛋白、gpJ蛋白和/或gpH蛋白为重组蛋白,优选地为非天然存在的重组蛋白。特别是,重组STF蛋白、gpJ蛋白和或gpH蛋白可经工程改造以靶向将感兴趣的DNA有效载荷转移到目标细菌细胞中。在一个非限制性实例中,重组STF蛋白可经工程改造以有利地具有酶促活性,比如解聚酶活性,并且目标细菌细胞可为封装的细菌细胞。发现这种解聚酶活性可提高递送效率,并且包括与内切唾液酸酶(endosialidase)比如K1F内切唾液酸酶相关的活性或与裂解酶比如K5裂解酶相关的活性。
重组STF蛋白包括例如工程改造的嵌合STF蛋白,并且在一些情况下,本公开提供其相关的伴侣(也称为辅助)蛋白。这种伴侣蛋白助于嵌合STF蛋白的折叠。重组工程化嵌合STF蛋白可包含源于λ形细菌噬菌体(优选地λ或λ样细菌噬菌体)的STF蛋白的一部分与源于源自不同细菌噬菌体的相应STF蛋白的STF蛋白的一部分之间的融合体。这种嵌合STF蛋白可包含来自λ形细菌噬菌体(优选地λ或λ样细菌噬菌体)的STF的N-末端结构域与不同STF的C-末端结构域之间的融合体。在一个实施方案中,嵌合STF蛋白包含SEQ ID NO:14的氨基酸序列、SEQ ID NO:16的氨基酸序列、SEQ ID NO:17的氨基酸序列、SEQ ID NO:19的氨基酸序列、SEQ ID NO:21的氨基酸序列、SEQ ID NO:44的氨基酸序列或SEQ ID NO:50的氨基酸序列或者由其组成。在一个特定实施方案中,嵌合STF蛋白为STF-V10(SEQ ID NO:44)。嵌合STF蛋白的其他实例包括STF-V10f(SEQ ID NO:45)、STF-V10a(SEQ ID NO:46)和STF-V10h(SEQ ID NO:47)。本公开还提供合成细菌递送媒介物,其特征为存在工程改造的分支受体结合多亚基蛋白复合物(“分支RBP”)。工程改造的分支RBP包含源于细菌噬菌体的两个或更多个相关受体结合蛋白,其基于相互作用结构域(ID)的存在而彼此缔合(ID)。在一个特定实施方案中,所述工程改造的分支RBP包含源于细菌噬菌体的两种或更多种相关STF,其基于ID的存在而彼此缔合。一个亚基与另一个的缔合可为非共价或共价的。每个多肽亚基均含有充当“锚”用于将一个亚基RBP与另一个缔合的ID。在具体实施方案中,分支RBP可包含多个RBP亚基,包括例如2、3、4个等亚基。单个RBP亚基可为整体工程改造的分支RBP带来不同的生物学功能。这种功能包括(但不限于)宿主识别和酶促活性。这种酶促活性包括解聚酶活性。
因此,提供了使得可将编码感兴趣的蛋白或核酸的核酸有效载荷转移到期望的目标细菌宿主细胞中的细菌递送媒介物,其中所述细菌递送媒介物的特征为具有如本文公开的嵌合STF和/或分支RBP。
还提供了包含重组gpJ蛋白的细菌递送媒介物。这种gpJ蛋白包括包含嵌合蛋白的重组gpJ蛋白,其允许识别除作为细菌细胞表面上的天然λ噬菌体受体的LamB OMP受体之外的细菌细胞受体(14)。重组工程化嵌合gpJ蛋白可包含源于λ形细菌噬菌体(优选地λ或λ样细菌噬菌体)的gpJ蛋白的一部分与源于源自不同细菌噬菌体的相应gpJ蛋白的gpJ蛋白的一部分之间的融合体。这种嵌合gpJ蛋白可包含来自λ形细菌噬菌体(优选地λ或λ样细菌噬菌体)的gpJ蛋白的N-末端结构域与不同gpJ蛋白的C-末端结构域之间的融合体。在一个实施方案中,gpJ蛋白包含SEQ ID NO:10、11、12、13或49的氨基酸序列或者由其组成。
还提供了包含重组gpH蛋白的细菌递送媒介物。这种gpH蛋白包括重组gpH蛋白,其允许或容许细菌载体改进地进入通透酶复合物中具有缺陷或改变的细胞中。重组工程化嵌合gpH蛋白可包含源于λ形细菌噬菌体(优选地λ或λ样细菌噬菌体)的gpH蛋白的一部分与源于源自不同细菌噬菌体的相应gpH蛋白的gpH蛋白的一部分之间的融合体。这种嵌合gpH蛋白可包含来自λ形细菌噬菌体(优选地λ或λ样细菌噬菌体)的gpH蛋白的N-末端结构域与不同gpH蛋白的C-末端结构域之间的融合体。在一个实施方案中,gpH蛋白包含SEQ ID NO:23或24的氨基酸序列或者由其组成。
在某些方面,本文提供的细菌递送媒介物为其中重组STF蛋白、gpJ蛋白和/或gpH蛋白经工程改造以提高将DNA有效载荷转移到目标细菌细胞中的效率的媒介物。这种细菌细胞可选自耶尔森氏菌属物种(Yersinia spp.)、埃希氏菌属物种(Escherichia spp.)、克雷伯氏菌属物种(Klebsiella spp.)、不动杆菌属物种(Acinetobacter spp.)、假单胞菌属物种(Pseudomonas spp.)、螺杆菌属物种(Helicobacter spp.)、弧菌属物种(Vibriospp.)、沙门氏菌属物种(Salmonella spp.)、链球菌属物种(Streptococcus spp.)、葡萄球菌属物种(Staphylococcus spp.)、拟杆菌属物种(Bacteroides spp.)、梭菌属物种(Clostridium spp.)、志贺氏菌属物种(Shigella spp.)、肠球菌属物种(Enterococcusspp.)、肠杆菌属物种(Enterobacter spp.)、李斯特菌属物种(Listeria spp.)及其混合物,优选地选自大肠杆菌和其他感兴趣的细菌物种,比如克雷伯氏菌属、柠檬酸杆菌属(Citrobacter)、农杆菌属(Agrobacterium)、肠杆菌属或假单胞菌属,更优选地为大肠杆菌。
本文公开的细菌递送媒介物提供一种将感兴趣的DNA有效载荷转移(包括体内转移)到目标宿主细菌中的手段。在非限制性方面,DNA有效载荷包含选自以下的感兴趣的核酸:Cas核酸酶基因,Cas9核酸酶基因,引导RNA,CRISPR基因座,毒素基因,编码酶比如核酸酶或激酶、TALEN、ZFN、大范围核酸酶、重组酶、细菌受体、膜蛋白、结构蛋白、分泌蛋白的基因,编码对抗生素或一般药物的抗性的基因,编码毒性蛋白或毒性因子的基因和编码毒力蛋白或毒力因子的基因,或任何它们的组合。在具体实施方案中,感兴趣的核酸编码治疗性蛋白。仍然进一步地,感兴趣的核酸可编码反义核酸分子。
在一方面,细菌递送媒介物使得可转移编码靶向切割宿主细菌细胞基因组或宿主细菌细胞质粒的核酸酶的核酸有效载荷。在一些方面,切割发生在抗生素抗性基因中。在另一个实施方案中,核酸酶介导的宿主细菌细胞基因组的切割旨在刺激同源重组事件,以将感兴趣的核酸插入到细菌细胞的基因组中。
本公开还提供药用或兽用组合物,其包含一种或多种本文公开的细菌递送媒介物和药学上可接受的载体。还提供了一种用于治疗由细菌引起的疾病或障碍(优选地为细菌感染)的方法,其包括给予需要治疗的患有由细菌引起的疾病或障碍(优选地为细菌感染)的受试者所提供的药用或兽用组合物。本公开还涉及用于治疗由细菌引起的疾病或障碍(优选地为细菌感染)的如本文公开的药用或兽用组合物或细菌递送媒介物。其进一步涉及如本文公开的药用或兽用组合物或细菌递送媒介物在制造用于治疗由细菌引起的疾病或障碍(优选地为细菌感染)的药物中的用途。由细菌引起的疾病或障碍优选地选自细菌感染、代谢障碍和涉及人类微生物组细菌的病理学。更优选地,由细菌引起的疾病或障碍为细菌感染。提供了一种用于减少细菌群体中毒力和/或抗生素抗性细菌的量的方法,其包括使细菌群体与本文公开的细菌递送媒介物接触。该方法可为体内或体外方法。本公开还涉及用于减少细菌群体中,特别是患有细菌感染的受试者中毒力和/或抗生素抗性细菌的量的如本文公开的药用或兽用组合物或细菌递送载体。其进一步涉及如本文公开的药用或兽用组合物或细菌递送媒介物在制造用于减少细菌群体中,特别是患有细菌感染的受试者中毒力和/或抗生素抗性细菌的量的药物中的用途。
在另一方面,本文所述的方法和组合物提供感兴趣的基因在宿主微生物组中的长期稳定表达。在这种情况下,递送媒介物包含编码感兴趣的基因的核酸分子,其中该核酸经工程改造以整合到细菌染色体中,或者在宿主的目标微生物组内稳定复制。一旦递送到感兴趣的细菌(即微生物组)中,感兴趣的基因一般地会被表达。本文所述的方法和组合物包括任何感兴趣的化合物(包括治疗性化合物,比如用于哺乳动物的预防性和治疗性疫苗)的原位细菌产生。感兴趣的化合物可在目标细菌内产生、从目标细菌分泌或在目标细菌表面表达。在一个更特定实施方案中,抗原在用于预防性和/或治疗性疫苗接种的目标细菌表面表达。
附图简述
为更好地理解本文公开的主题并举例说明其可如何在实践中实施,现将参考附图通过非限制性实例来描述实施方案。具体参考附图,强调所示细节作为示例的方式并且用于对本公开实施方案的说明性讨论的目的。
图1.口服管饲λ-PaPa包装的psgRNAcos粘粒(SEQ ID NO:1的DNA有效载荷)之后转导子的存在。黑点,MG-GFP细胞的总数。白点,具有获得性卡那霉素抗性的MG-GFP细胞。
图2.λPaPa噬菌体在小鼠肠道中对MG-GFP的体内适应性(n=3)。每条线对应于在一只小鼠中进行的实验。X轴,天数。
图3.口服管饲Ur-λ包装的pJ23104-GFP粘粒(3kbp)(SEQ ID NO:2的DNA有效载荷)之后转导子的存在。黑点,MG1655-Str细胞的总数。白点,具有获得性氯霉素抗性的MG-GFP细胞。
图4.口服管饲Ur-λ包装的pJF1粘粒(7kb)(SEQ ID NO:3的DNA有效载荷)之后转导子的存在。黑点,MG-GFP细胞的总数。白点,具有获得性氯霉素抗性的MG-GFP细胞。
图5.具有不同有效载荷大小的包装的λ噬菌粒的滴定。
图6A-B.口服管饲具有或没有stf的Ur-λ包装的GG6K和GG8K粘粒(分别为SEQ IDNO:6和SEQ ID NO:7)之后的递送效率。图6A.具有STF的包装的噬菌粒。图6B.没有STF的包装的噬菌粒。
图7.gpJ变体与λgpJ的比对。选择两个基于蛋白同一性用框1和2标记的插入点,以产生具有λgpJ的嵌合体。
图8A-D.不同gpJ嵌合体的表观滴度。图8A.591个嵌合体,使用第二个插入点(图7中的框#2)插入到λgpJ中。λWT是指识别LamB的初始gpJ变体。每个泳道代表产生的包装噬菌粒的10倍稀释,从右侧最浓缩至左侧最稀释。图8B.gpJ变体λWT、Z2145和1A2(分别为SEQ IDNO:10、SEQ ID NO:12和SEQ ID NO:13)在3种菌株中的表观滴度:MG-GFP(黑条)、MG-Δ-LamB(白条)和H10-waaJ(缺乏O157抗原的O157菌株,灰条)。图8C.使用具有gpJ Z2145变体(SEQ ID NO:12)或Z2145(SEQ ID NO:12)与WW11.2 stf变体(SEQ ID NO:16)的λ包装噬菌粒进行的H10 wt菌株(含有第4组荚膜)的以流式细胞仪测量的递送效率(%GFP+细胞)。图8D.使用用包含gpJ变体A8(SEQ ID NO:49)或1A2(SEQ ID NO:13)和嵌合λ-P2 STF(SEQ IDNO:50)的λ包装噬菌粒转导的MG1655或MG1656-OmpCO157进行的以流式细胞仪测量的递送效率(%GFP+细胞)。
图9A-B.λgpH的分析和工程改造的变体的产生。图9A.λgpH与来自大肠杆菌中发现的另一种λ形原噬菌体的gpH蛋白之间的蛋白比对。图9B.MG1655、manZ和manY突变体中λWTgpH变体(左图-SEQ ID NO:23)和工程改造的gpH-IAI(右图-SEQ ID NO:24)的滴定。每个泳道代表产生的包装噬菌粒的10倍稀释,从右侧最浓缩至左侧最稀释。
图10.工程改造的λ包装噬菌粒在其他变形菌门(Proteobacteria)中的递送效率。阴沟肠杆菌(Enterobacter cloacae)菌株上不同gpJ和STF组合的点滴定。将10μL包装的噬菌粒与90μL OD600~0.7的细菌混合,在37℃下温育30分钟并将10μL反应物铺板在LB琼脂加25μg/mL氯霉素上。
图11.1A2-STF118或1A2-STF29包装的噬菌粒在PBS中的稳定性。灰条,仅有PBS;白条,PBS加胰酶,pH 6.8。左侧组条形,MG1656-OmpCO157中的活性;右侧组条形,LMR_503菌株。Y轴显示每μL的颗粒滴度。
图12.实施例3中通过svAUC分析的3个
Figure BDA0003820857320000071
(EB)批次的沉降系数分布数据的叠加。由3或4个拷贝的有效载荷包装的EB的积分范围用虚线表示。
图13.包含3或4个拷贝的其有效载荷的
Figure BDA0003820857320000072
的相对丰度。对svAUC中定义的每个群体在260和280nm处的吸光度信号进行积分,并用于计算其在每批
Figure BDA0003820857320000073
中的相对丰度。
详述
本公开涉及具有期望的宿主范围的细菌递送媒介物,其可用于在体内将期望的有效载荷有效地转移至受试者微生物群的一个或多个目标细菌细胞。
本文公开了用于将期望的有效载荷体内递送到受试者的微生物组中的方法和组合物。这种递送媒介物经工程改造以含有编码可用于治疗受试者的障碍和疾病的RNA分子或蛋白的核酸作为其有效载荷的一部分。这种核酸通常可编码作为非限制性实例的任何分子、化合物和蛋白。
本文提供的细菌递送媒介物使得可将编码感兴趣的蛋白或核酸的核酸有效载荷转移到期望的目标细菌宿主细胞中。如本文使用的术语“递送媒介物”是指允许将有效载荷转移到细菌中的任何手段。存在由本公开包括的几种类型的递送媒介物,其非限制性地包括:细菌噬菌体支架、病毒支架、基于化学的递送媒介物(例如环糊精、磷酸钙、阳离子聚合物、阳离子脂质体)、基于蛋白或基于肽的递送媒介物、基于脂质的递送媒介物、基于纳米颗粒的递送媒介物、基于非化学的递送媒介物(例如转化、电穿孔、声致穿孔、光学转染)、基于颗粒的递送媒介物(例如基因枪、磁转染、穿刺感染(impalefection)、粒子轰击、细胞穿透肽)或供体细菌(接合)。本公开还包括递送媒介物的任何组合。递送媒介物可指细菌噬菌体衍生的支架并且可从天然的、进化或工程改造的衣壳中获得。
在一方面,提供具有期望的目标宿主范围的细菌递送媒介物,用于将有效载荷体内转移至受试者的微生物组。细菌递送媒介物可包含一种或多种选自功能性λ形侧尾丝蛋白(本文的“STF蛋白”)、功能性λ形gpJ蛋白和功能性λ形gpH蛋白的蛋白。在另一个实施方案中,细菌递送媒介物可包含两种或更多种选自功能性λ形侧尾丝蛋白、功能性λ形gpJ蛋白和功能性λ形gpH蛋白的蛋白。在一个特定实施方案中,细菌递送媒介物包含功能性λ形STF蛋白和功能性λ形gpJ蛋白。在仍然另一个实施方案中,细菌递送媒介物可包含功能性λ形STF蛋白、功能性λ形gpJ蛋白和功能性λ形gpH蛋白。在另一方面,细菌递送媒介物可包含功能性λ形gpJ蛋白和功能性λ形gpH蛋白。在另一方面,细菌递送媒介物可包含(i)功能性λ形STF蛋白。除功能性STF蛋白之外,细菌递送媒介物可进一步包含(ii)功能性λ形gpJ蛋白;和任选地(iii)功能性λ形gpH蛋白。
在一个实施方案中,功能性STF蛋白、功能性gpJ蛋白和/或功能性gpH蛋白分别为野生型λSTF、gpJ和/或gpH蛋白。或者,功能性STF蛋白、功能性gpJ蛋白和/或功能性gpH蛋白为重组蛋白。
如本文使用的术语“重组蛋白”是指非天然存在的蛋白,特别是通过重组技术获得的工程改造的蛋白。这种重组蛋白包括例如工程改造的嵌合蛋白。
如本文使用的,功能性蛋白通常意指具有生物活性的蛋白;更具体地讲,本文中的功能性野生型、重组蛋白、变体、融合体或片段涉及有助于将DNA有效载荷有效递送到目标菌株中的野生型、重组蛋白、变体、融合体或片段。效率阈值取决于许多因素,比如蛋白的类型、目标菌株的类型和环境的类型。例如,STF和gpJ蛋白允许识别、结合(并且在一些情况下还降解)细胞外表位,比如LPS、荚膜和外膜蛋白;gpH蛋白允许有效注入DNA有效载荷并因此使DNA有效载荷成功通过周质。
在本发明的上下文中,可通过对已知展示由蛋白(比如STF、gpJ和gpH蛋白)识别的受体的细菌细胞滴定含有所述蛋白的包装噬菌粒,并将其与用相同包装噬菌粒对已知展示不被所述蛋白识别的受体的细菌细胞获得的滴度进行比较来确定所述蛋白为功能性的。
这种重组嵌合STF蛋白可包含源于λ形细菌噬菌体(优选地λ或λ样细菌噬菌体)的STF蛋白的一部分与源于源自不同细菌噬菌体(特别是源自不同λ形细菌噬菌体或源自非λ形细菌噬菌体)的STF蛋白的STF蛋白的一部分之间的融合体(本文中也称为“嵌合受体结合蛋白”或“嵌合RBP”)。这种嵌合STF蛋白可包含来自λ形细菌噬菌体(优选地λ或λ样细菌噬菌体)的STF蛋白的N-末端结构域与不同STF的C-末端结构域之间的融合体。如本文使用的,受体结合蛋白或RBP可为识别和任选地结合和/或修饰或降解位于细菌外包膜上的底物的STF衍生的多肽,所述底物非限制性地比如细菌外膜、LPS、荚膜、蛋白受体、通道、结构比如鞭毛、菌毛、分泌系统。底物非限制性地可为任何碳水化合物或修饰的碳水化合物、任何脂质或修饰的脂质、任何蛋白或修饰的蛋白、任何氨基酸序列及其任何组合。
如本文使用的,λ形细菌噬菌体包含一组感染细菌的相关病毒。这些病毒称为λ形,因为要描述的第一批成员之一为lambda(λ)。λ形细菌噬菌体为尾病毒目(Caudovirusorder)(也称为有尾细菌噬菌体(tailed bacteriophage))的成员,并且包括具有相似生活方式的那些细菌噬菌体,包括例如当杂交时重组的能力、具有相同的粘性末端对以及可通过紫外线照射诱导的原噬菌体。尽管该目成员可能具有在核苷酸水平上有所不同的基因组,但它们携带具有足够核苷酸序列同一性的区域以引导它们之间的重组,一般地产生具有所有必要基因的全功能性噬菌体(参见例如Casjens和Hendrix(2015)Virology 479-480:310-330)。出于本公开的目的,本领域的技术人员通常会理解用作递送媒介物的λ形细菌噬菌体以及供使用的λ形STF、gpH和gpJ蛋白。
λ形噬菌体可基于基因组分析定义为属于λ超级簇[6]。在该超级簇中,可区分几个簇,每个簇具有原型噬菌体。噬菌体样簇及其成员(括号之间)为:λ样(lambda(λ)、HK630、HK629)、phi80样(phi80、HK225、mEp237)、N15样(N15、PY54、phiKO2)、HK97样(HK97、HK022、HK75、HK106、HK140、HK446、HK542、HK544、HK633、mEpX1、mEpX2、mEp234、mEp235、mEp390、ENT39118)、ES18样(ES18、Oslo、SPN3UB)、Gifsy-2样(gifsy-2、gifsy-1、Fels-1、mEp043、mEp213、CP-1639、
Figure BDA0003820857320000101
mEp640,FSL_SP-016)、BP-4795样(BP-4795、2851、stx2-1717、YYZ-2008)、SfV样(SfV、SfII,SfIV、SfI、
Figure BDA0003820857320000102
ST64B)、P22样(P22、L、SPN9CC、ST64T、ST104、ST160、ε34、g341、SE1、Emek、
Figure BDA0003820857320000103
IME10、Sf6,HK620、CUS-3、SPC-P1)、APSE-1样(APSE-1、APSE-2)、933W样(933W、
Figure BDA0003820857320000104
stx2-86、min27、
Figure BDA0003820857320000105
P13374、TL-2011c、VT2-sakai、
Figure BDA0003820857320000106
)、HK639样(HK639)、
Figure BDA0003820857320000107
Figure BDA0003820857320000108
HS2样(HS2)、ENT47970样(ENT47670)、ZF40样(ZF40)、
Figure BDA0003820857320000109
Figure BDA00038208573200001010
在本公开中,λ形STF蛋白包括例如包含以下或由其组成的蛋白:与直至对应于λSTF(Uniprot P03764 SEQ ID NO:14)的氨基酸130的氨基酸,特别是直至所述λSTF的氨基酸130具有至少75%同一性的氨基酸序列;λ形gpJ蛋白包括例如包含以下或由其组成的蛋白:与直至对应于λgpJ(Uniprot P03749 SEQ ID NO:10)的氨基酸606的氨基酸,特别是直至所述λgpJ的氨基酸606具有至少35%同一性的氨基酸序列;和λ形gpH蛋白包括例如包含以下或由其组成的蛋白:在λgpH(Uniprot P03736 SEQ ID NO:23)的全长上具有至少40%同一性并且考虑到189-391位之间的氨基酸段可能具有很少或根本没有同一性的氨基酸序列。λ形细菌递送媒介物包括包含功能性λ形stf蛋白和/或功能性λ形gpJ蛋白和/或功能性λ形gpH蛋白的细菌递送媒介物,所述蛋白与野生型λ噬菌体相比较各自可具有改变的宿主范围。
在一方面,STF蛋白包括包含与SEQ ID NO:14的野生型λstf蛋白氨基酸序列或与本文公开的任何重组STF蛋白、融合体、变体或片段具有至少80、85、90、95、96、97、98或99%序列同一性的氨基酸序列或由其组成。在一方面,gpJ蛋白包括包含与SEQ ID NO:10的野生型gpJ蛋白氨基酸序列或与本文公开的任何重组gpJ蛋白、融合体、变体或片段具有至少80、85、90、95、96、97、98或99%序列同一性的氨基酸序列或由其组成。在一方面,gpH蛋白包括包含与SEQ ID NO:23的野生型gpH蛋白氨基酸序列或与本文公开的任何重组gpH蛋白、融合体、变体或片段具有至少80、85、90、95、96、97、98或99%序列同一性的氨基酸序列或由其组成。在另一方面,本文提供编码这种野生型或重组STF、gpH和gpJ蛋白的核酸。
如本文使用的,两个序列之间的同源性百分比等于两个序列之间的同一性百分比。同一性百分比为相对于其序列已被比对的聚合物(例如多核苷酸或多肽)来计算。两个序列之间的同一性百分比为考虑需要引入以实现两个序列最佳比对的空位数和每个空位的长度的情况下,序列共具的相同位置数的函数(即%同源性=相同位置#/位置总#x100)。两个序列之间的序列比较和同一性百分比的确定可使用数学算法来完成,如以下非限制性实例中所述。
可使用E.Meyers和W.Miller(Comput.Appl.Biosci.,4:11-17(1988))的算法确定两个氨基酸序列之间的同一性百分比,该算法已纳入到ALIGN程序(版本2.0)中,其中使用PAM120权重残基表、空位长度罚分12和空位罚分4。另外,可使用Needleman和Wunsch(J.Mol.Biol.48:444-453(1970))算法确定两个氨基酸序列之间的同一性百分比,该算法已纳入到GCG软件包(可在www.gcg.com上获得)的GAP程序中,其中使用BLOSUM62矩阵、BLOSUM30矩阵或PAM250矩阵,以及16、14、12、10、8、6或4的空位权重和1、2、3、4、5或6的长度权重。在一个具体实施方案中,使用BLOSUM30矩阵、空位开放罚分12和空位扩展罚分4。
提供多种不同的λ形细菌递送媒介物,作为将有效载荷转移到目标细菌细胞群中的一种手段。这种细菌递送媒介物包括包含一种或多种野生型λ形STF、gpH和gpJ蛋白的那些媒介物。或者,递送媒介物可包含与一种或多种重组STF、gpH或gpJ蛋白(包括如本文公开的嵌合蛋白、融合体、变体或片段)组合的一种或多种野生型STF、gpH或gpJ蛋白。包括其中3种STF、gpH和gpJ蛋白为野生型的递送媒介物和其中3种STF、gpH和gpJ蛋白为重组体、融合体、变体或片段的那些递送媒介物。
本公开提供例如包含嵌合受体结合蛋白(RBP)的递送媒介物,其中嵌合RBP包含来自λ形细菌噬菌体(优选地λ或λ样细菌噬菌体)的RBP的N-末端结构域与不同细菌噬菌体RBP的C-末端结构域之间的融合体。由此衍生嵌合RBP的这种细菌噬菌体RBP包括例如“L形丝”、“侧尾丝(STF)”、“长尾丝”或“尾刺”。由此衍生嵌合RBP的这种细菌噬菌体RBP可为野生型RBP或RBP变体,优选地为野生型RBP。这种嵌合RBP包括具有改变的宿主范围和/或生物活性比如解聚酶活性的那些。在一个实施方案中,嵌合RBP具有针对宿主或受试者微生物组的特定细菌细胞的宿主范围。在一个具体方面,嵌合受体结合蛋白(RBP)的不同RBP源于任何细菌噬菌体或任何细菌素。
这种嵌合RBP可包含来自λ形细菌噬菌体(优选地λ或λ样细菌噬菌体)的RBP的N-末端结构域与不同的RBP的C-末端结构域之间的融合体。N-末端结构域一般地与C-末端结构域的N-末端融合。
来自细菌噬菌体的RBP(特别是STF蛋白的)的“N-末端结构域”在本文中意指始于所述RBP的N-末端并止于所述RBP的80-150、320-460或495-560位的所述RBP的氨基酸区域,所述位置参照λ细菌噬菌体STF序列(SEQ ID NO:14)。来自细菌噬菌体的RBP(特别是STF蛋白的)的“C-末端结构域”在本文中意指始于所述RBP的25-150、320-460或495-560位并止于所述RBP的C-末端的所述RBP的氨基酸区域,所述位置参照λ细菌噬菌体STF序列(SEQ IDNO:14)。
在一个实施方案中,细菌递送媒介物含有包含源于λ形细菌噬菌体(优选地λ或λ样细菌噬菌体)的RBP的N-末端结构域与不同RBP的C-末端结构域之间的融合体的嵌合RBP,其中嵌合RBP的所述N-末端结构域在选自以下的氨基酸区域之一内与不同RBP的所述C-末端结构域融合:参照λ细菌噬菌体STF序列(SEQ ID NO:14)的N-末端结构域的80-150、320-460或495-560位。在一方面,来自λ形细菌噬菌体(优选地λ或λ样细菌噬菌体)的RBP和不同的RBP在参照λ细菌噬菌体STF序列(SEQ ID NO:14)的RBP的80-150、320-460和495-560位范围内的3个氨基酸区域中的一个或多个中含有同源性。在某些方面,在参照λ细菌噬菌体STF序列的RBP的80-150、320-460和495-560位范围内的3个氨基酸区域中一个或多个内,同源性对于45个或更多氨基酸具有约35%同一性、对于30个或更多氨基酸具有约50%同一性或对于18个或更多氨基酸具有约90%同一性。在一个具体方面,嵌合RBP的不同RBP结构域源于细菌噬菌体或细菌素。在一方面,嵌合RBP包含在选自参照λ细菌噬菌体STF序列(SEQ IDNO:14)的N-末端RBP结构域的80-150、320-460和495-560位的氨基酸区域之一内与不同RBP的C-末端结构域融合的RBP的N-末端结构域。在另一个非限制性实施方案中,嵌合RBP包含RBP的N-末端结构域和在与选自氨基酸SAGDAS(SEQ ID NO:37)、ADAKKS(SEQ ID NO:38)、MDETNR(SEQ ID NO:39)、SASAAA(SEQ ID NO:40)和GAGENS(SEQ ID NO:41)的位点具有80%、85%、90%、95%、99%或100%同一性的N-末端RBP结构域的位点内融合的不同RBP的C-末端结构域。
在一个具体实施方案中,嵌合STF蛋白包含λ细菌噬菌体STF蛋白的N-末端结构域与来自另一种细菌噬菌体的STF蛋白的C-末端结构域之间的融合体,所述N-末端结构域特别是在参照λ细菌噬菌体STF蛋白序列(SEQ ID NO:14)的N-末端结构域的氨基酸区域495-560内与所述C-末端结构域融合。在所述实施方案中,嵌合STF变体可为包含氨基酸序列SEQID NO:44或者由其组成并且一般地由核苷酸序列SEQ ID NO:51编码的STF-V10。或者,在所述实施方案中,嵌合STF变体可为包含氨基酸序列SEQ ID NO:16或者由其组成并且一般地由核苷酸序列SEQ ID NO:30编码的WW11.2。仍然或者,在所述实施方案中,嵌合STF变体可为包含氨基酸序列SEQ ID NO:17或者由其组成并且一般地由核苷酸序列SEQ ID NO:31编码的STF75。在所述实施方案中,所述STF75可以与其相关的伴侣蛋白一起,特别是与之一起产生,所述伴侣蛋白一般地包含氨基酸序列SEQ ID NO:18或者由其组成并且一般地由核酸序列SEQ ID NO:34编码。仍然或者,在所述实施方案中,嵌合STF变体可为包含氨基酸序列SEQ ID NO:21或者由其组成并且一般地由核苷酸序列SEQ ID NO:35编码的STF23。在所述实施方案中,所述STF23可以与其相关的伴侣蛋白一起,特别是与之一起产生,所述伴侣蛋白一般地包含氨基酸序列SEQ ID NO:22或者由其组成并且一般地由核酸序列SEQ ID NO:36编码。在另一个实施方案中,嵌合STF蛋白包含λ细菌噬菌体STF蛋白的N-末端结构域与来自另一种细菌噬菌体的STF蛋白的C-末端结构域之间的融合体,所述N-末端结构域特别是在参照λ细菌噬菌体STF蛋白序列(SEQ ID NO:14)的N-末端结构域的氨基酸区域320-460内与所述C-末端结构域融合。在所述实施方案中,嵌合STF变体可为包含氨基酸序列SEQ IDNO:19或者由其组成并且一般地由核苷酸序列SEQ ID NO:33编码的STF-EB6。在所述实施方案中,所述STF-EB6可以与其相关的伴侣蛋白一起,特别是与之一起产生,所述伴侣蛋白一般地包含氨基酸序列SEQ ID NO:20或者由其组成并且一般地由核酸序列SEQ ID NO:32编码。或者,在所述实施方案中,嵌合STF变体可为包含氨基酸序列SEQ ID NO:50或者由其组成并且一般地由核苷酸序列SEQ ID NO:56编码的STFλ-P2。在所述实施方案中,所述STFλ-P2可以与其相关的伴侣蛋白一起,特别是与之一起产生,所述伴侣蛋白一般地包含氨基酸序列SEQ ID NO:57或者由其组成并且一般地由核酸序列SEQ ID NO:58编码。或者,嵌合STF变体可为包含氨基酸序列SEQ ID NO:45或者由其组成并且一般地由核酸序列SEQ ID NO:52编码的STF-V10f。或者,嵌合STF变体可为包含氨基酸序列SEQ ID NO:46或者由其组成并且一般地由核酸序列SEQ ID NO:53编码的STF-V10a。或者,嵌合STF变体可为包含氨基酸序列SEQ ID NO:48或者由其组成并且一般地由核酸序列SEQ ID NO:54编码的STF-V10h。
如本文公开的重组RBP蛋白可能需要其相关伴侣(也称为辅助)蛋白用于正确折叠。这种伴侣蛋白助于嵌合RBP蛋白的折叠。例如,包含氨基酸序列SEQ ID NO:14或者由其组成的λSTF蛋白需要一般地包含氨基酸序列SEQ ID NO:15或者由其组成的其相关蛋白用于正确折叠。对用于正确折叠所述嵌合RBP蛋白的相关伴侣蛋白的需要一般地取决于嵌合RBP的C-末端区域来源的RBP。例如,包含氨基酸序列SEQ ID NO:17或者由其组成的嵌合STF蛋白STF75需要一般地包含氨基酸序列SEQ ID NO:18或者由其组成并且一般地由核酸序列SEQ ID NO:34编码的其相关伴侣蛋白用于正确折叠。例如,包含氨基酸序列SEQ ID NO:19或者由其组成的嵌合STF蛋白STF-EB6需要一般地包含氨基酸序列SEQ ID NO:20或者由其组成并且一般地由核酸序列SEQ ID NO:32编码的其相关伴侣蛋白用于正确折叠。例如,包含氨基酸序列SEQ ID NO:21或者由其组成的嵌合STF蛋白STF23需要一般地包含氨基酸序列SEQ ID NO:22或者由其组成并且一般地由核酸序列SEQ ID NO:36编码的其相关伴侣蛋白用于正确折叠。例如,包含氨基酸序列SEQ ID NO:50或者由其组成的嵌合STF蛋白STFλ-P2需要一般地包含氨基酸序列SEQ ID NO:57或者由其组成并且一般地由核酸序列SEQ IDNO:58编码的其相关伴侣蛋白用于正确折叠。所述伴侣蛋白可在折叠之后保持附着于所述嵌合STF蛋白。因此,在一些实施方案中,本文公开的细菌递送媒介物可进一步包含与所述媒介物包含的嵌合STF蛋白相关的伴侣蛋白。或者,所述伴侣蛋白可在折叠之后不保持附着于所述嵌合STF蛋白,并且可例如被蛋白水解,特别是自体蛋白水解。因此,在一些实施方案中,本文公开的细菌递送媒介物不包含与所述媒介物包含的嵌合STF蛋白相关的伴侣蛋白。
本公开还提供合成细菌递送媒介物,其特征为存在工程改造的分支受体结合多亚基蛋白复合物(“分支RBP”)。这种递送媒介物可用于将感兴趣的有效载荷转移到微生物组的细菌细胞中。工程改造的分支RBP包含源于细菌噬菌体的两个或更多个相关受体结合蛋白,其基于相互作用结构域(ID)的存在而彼此缔合(ID)。一个亚基与另一个的缔合可为非共价或共价的。每个多肽亚基均含有充当“锚”用于将一个亚基RBP与另一个缔合的ID。在具体实施方案中,分支RBP可包含多个RBP亚基,包括例如2、3、4个等亚基。
单个RBP亚基可为整体工程改造的分支RBP带来不同的生物学功能。这种功能包括(但不限于)宿主识别和酶促活性。这种酶促活性包括解聚酶活性。分支RBP的两个或更多个相关受体结合蛋白包括(但不限于)本文所述的嵌合受体结合蛋白(RBP),其包含源于λ形细菌噬菌体(优选地λ或λ样细菌噬菌体)的RBP的N-末端结构域与不同RBP的C-末端结构域之间的融合体,其中所述嵌合RBP进一步包含ID结构域。
因此,提供了使得可将编码感兴趣的蛋白或核酸的核酸有效载荷转移到期望的目标细菌宿主细胞中的细菌递送媒介物,其中所述细菌递送媒介物的特征为具有如本文公开的嵌合RBP和/或分支RBP。(对于嵌合RBP和分支RBP参见美国临时申请US 62/802,777、US申请16/696,769和US申请16/726,033,其每一个通过参考以其全部结合。
还提供了包含重组gpJ蛋白的细菌递送媒介物。这种gpJ蛋白包括包含嵌合蛋白的重组gpJ蛋白,其允许识别除LamB OMP受体之外的细菌细胞受体。已知gpJ的受体识别活性位于蛋白的C-末端部分,小至249aa的片段赋予与LamB受体结合的能力[5]。在一个特定实施方案中,这种嵌合gpJ蛋白可包含来自λ形细菌噬菌体(优选地λ或λ样细菌噬菌体)的gpJ蛋白的N-末端结构域与不同gpJ蛋白的C-末端结构域之间的融合体。N-末端结构域一般地与C-末端结构域的N-末端融合。
来自细菌噬菌体的gpJ蛋白的“N-末端结构域”在本文中意指始于所述gpJ蛋白的N-末端并止于所述gpJ蛋白的810-825或950-970位的所述gpJ蛋白的氨基酸区域,所述位置参照λ细菌噬菌体gpJ蛋白序列(SEQ ID NO:10)。来自细菌噬菌体的gpJ蛋白的“C-末端结构域”在本文中意指始于所述gpJ蛋白的810-825或950-970位并止于所述gpJ蛋白的C-末端的所述gpJ蛋白的氨基酸区域,所述位置参照λ细菌噬菌体gpJ蛋白序列(SEQ ID NO:10)。
对于嵌合gpJ蛋白的产生,发明人已经鉴定了两个插入点(图7)。在非限制性方面,这种插入位点可用于产生嵌合蛋白。两者插入点均产生具有改变的受体结合的功能性gpJ嵌合体。在本发明的一个实施方案中,细菌递送媒介物含有包含源于λ形细菌噬菌体(优选地λ或λ样细菌噬菌体)的gpJ蛋白的N-末端结构域与不同gpJ蛋白的C-末端结构域之间的融合体的嵌合gpJ蛋白,其中嵌合gpJ蛋白的所述N-末端结构域在选自参照λ细菌噬菌体gpJ蛋白序列(SEQ ID NO:10)的N-末端结构域的810-825或950-970位的氨基酸区域之一内与不同gpJ蛋白的所述C-末端结构域融合。
在一个具体实施方案中,嵌合gpJ蛋白包含λ细菌噬菌体gpJ蛋白的N-末端结构域与来自不同细菌噬菌体的gpJ蛋白的C-末端结构域之间的融合体,其一般地识别并结合OmpC,所述N-末端结构域特别是在参考λ细菌噬菌体gpJ蛋白序列(SEQ ID NO:10)的N-末端结构域的氨基酸区域950-970内与所述C-末端结构域融合。在所述实施方案中,嵌合gpJ变体可为包含氨基酸序列SEQ ID NO:11或者由其组成并且一般地由核苷酸序列SEQ ID NO:25编码的H591,所述H591嵌合gpJ变体一般地识别并结合OmpC。在另一个实施方案中,嵌合gpJ蛋白包含λ细菌噬菌体gpJ蛋白的N-末端结构域与来自不同细菌噬菌体的gpJ蛋白的C-末端结构域之间的融合体,其一般地识别存在于大肠杆菌O157菌株中的受体,所述N-末端结构域特别是在参照λ细菌噬菌体gpJ蛋白序列(SEQ ID NO:10)的N-末端结构域的氨基酸区域810-825内与所述C-末端结构域融合。在所述实施方案中,嵌合gpJ变体可为包含氨基酸序列SEQ ID NO:12或者由其组成并且一般地由核苷酸序列SEQ ID NO:26编码的Z2145,所述Z2145嵌合gpJ变体一般地识别存在于O157菌株中的受体。在仍然另一个实施方案中,嵌合gpJ蛋白包含λ细菌噬菌体gpJ蛋白的N-末端结构域与来自不同细菌噬菌体的gpJ蛋白的C-末端结构域之间的融合体,其一般地识别存在于O157菌株中的OmpC受体,所述N-末端结构域特别是在参考λ细菌噬菌体gpJ蛋白序列(SEQ ID NO:10)的N-末端结构域的氨基酸区域950-970内与所述C-末端结构域融合。在所述实施方案中,嵌合gpJ变体可为包含氨基酸序列SEQ ID NO:13或者由其组成并且一般地由核苷酸序列SEQ ID NO:27编码的1A2,所述1A2嵌合gpJ变体一般地识别存在于大肠杆菌O157菌株中的OmpC受体。在仍然另一个实施方案中,嵌合gpJ蛋白包含λ细菌噬菌体gpJ蛋白的N-末端结构域与来自不同细菌噬菌体的gpJ蛋白的C-末端结构域之间的融合体,其一般地识别存在于O157和MG1655菌株两者中的OmpC受体,所述N-末端结构域特别是在参考λ细菌噬菌体gpJ蛋白序列(SEQ ID NO:10)的N-末端结构域的氨基酸区域950-970内与所述C-末端结构域融合。在所述实施方案中,嵌合gpJ变体可为包含氨基酸序列SEQ ID NO:49或者由其组成并且一般地由核苷酸序列SEQ IDNO:55编码的A8,所述A8嵌合gpJ变体一般地识别大肠杆菌O157和MG1655菌株两者中的OmpC受体。
还提供包含重组gpH蛋白的细菌递送媒介物。这种gpH蛋白包括重组gpH蛋白,其允许或容许细菌载体改进地进入通透酶复合物中具有缺陷或改变的细胞中。重组工程改造的嵌合gpH蛋白可包含源于λ形细菌噬菌体(优选地λ或λ样细菌噬菌体)的gpH蛋白的一部分与源于源自不同细菌噬菌体的相应gpH蛋白的gpH蛋白的一部分之间的融合体。这种嵌合gpH蛋白可包含来自λ形细菌噬菌体(优选地λ或λ样细菌噬菌体)的gpH蛋白的N-末端结构域与不同gpH蛋白的C-末端结构域之间的融合体。一种这样的变体为氨基酸序列SEQ ID NO:24和核苷酸序列SEQ ID NO:28的gpH-IAI。
在一个特定实施方案中,所述细菌递送媒介物包含如以上公开的嵌合STF-V10h变体和如以上公开的嵌合1A2变体。
在一些方面,本文提供的细菌递送媒介物为包含一种或多种重组STF蛋白(包括(但不限于)嵌合和分支RBP)、一种或多种gpJ蛋白和/或一种或多种gpH蛋白的媒介物,其经工程改造以提高将DNA有效载荷转移到目标细菌细胞群中的效率。这种细菌细胞群包括例如大肠杆菌和其他感兴趣的细菌种类。
本文还证明了包装基因组的大小可对包装效率存在影响。
提供了编码本文公开的野生型以及重组STF、gpJ和gpH蛋白的核酸分子。这种核酸可包含在载体比如细菌噬菌体、质粒、噬菌粒、病毒和其他使得可转移和表达重组STF、gpJ和gpH编码核酸的媒介物中。
在一个特定实施方案中,核酸包含在单个载体中。在一个更特定实施方案中,所述载体包含核酸序列SEQ ID NO:47或者由其组成。
本文提供的细菌递送媒介物使得可将编码感兴趣的蛋白或核酸的核酸有效载荷转移到期望的目标细菌宿主细胞中。如本文使用的术语“递送媒介物”是指允许将有效载荷转移到细菌中的任何手段。存在由本公开包括的几种类型的递送媒介物,其非限制性地包括:细菌噬菌体支架、病毒支架、基于化学的递送媒介物(例如环糊精、磷酸钙、阳离子聚合物、阳离子脂质体)、基于蛋白或基于肽的递送媒介物、基于脂质的递送媒介物、基于纳米颗粒的递送媒介物、基于非化学的递送媒介物(例如转化、电穿孔、声致穿孔、光学转染)、基于颗粒的递送媒介物(例如基因枪、磁转染、穿刺感染、粒子轰击、细胞穿透肽)或供体细菌(接合)。本公开还包括递送媒介物的任何组合。递送媒介物可指细菌噬菌体衍生的支架并且可从天然的、进化或工程改造的衣壳中获得。
递送媒介物包括如本文公开的包装的噬菌粒以及细菌噬菌体。
Figure BDA0003820857320000181
为包装的噬菌粒,即衣壳化于噬菌体衍生衣壳中的有效载荷。这种递送媒介物的工程改造为本领域技术人员众所周知的。这种工程改造技术可采用经工程改造以表达本文公开的STF、gpJ和gpH蛋白的生产细胞系。在一方面,提供了具有期望的目标宿主范围的细菌递送媒介物用于将有效载荷转移至宿主的微生物组。细菌递送媒介物的特征可为野生型和重组STF、gpJ和gpH蛋白的组合。
本公开还提供产生本文公开的细菌递送媒介物的生产细胞系。
包装的噬菌粒和细菌噬菌体颗粒的产生为本领域技术人员众所周知的常规技术。在一个实施方案中,卫星噬菌体和/或辅助噬菌体可用于促进有效载荷在本文公开的递送媒介物中的包装。辅助噬菌体提供反式功能并且为本领域技术人员众所周知的。辅助噬菌体包含编码对于包装有效载荷必不可少的结构和功能蛋白的所有基因(即辅助噬菌体为组装递送媒介物提供所有必要的基因产物)。辅助噬菌体可含有缺陷型复制起点或包装信号,或完全缺乏后者,并因此无法自我包装,因此仅会产生携带有效载荷或质粒的细菌递送颗粒。可选择辅助噬菌体,使得其不能诱导用于递送颗粒产生的宿主裂解。本领域的技术人员将会理解,一些细菌噬菌体为缺陷型的并且需要辅助噬菌体来进行有效载荷包装。因此,取决于选择用于制备细菌递送颗粒的细菌噬菌体,本领域的技术人员知道是否需要辅助噬菌体。编码组装或产生包装的有效载荷所必需的一种或多种蛋白或者调节过程的序列可反式提供。例如,本公开的STF、gpJ和gpH蛋白可在诱导型启动子控制下在质粒中提供或组成型表达。在这种情况下,噬菌体野生型序列可能含有或不含反式提供的基因或序列的缺失。另外,编码新功能如重组STF、gpJ或gpH蛋白的嵌合或修饰的噬菌体序列,可直接插入到辅助噬菌体基因组中期望的位置,因此绕过反式提供修饰序列的必要性。用于以质粒形式反式提供序列或蛋白的方法,以及产生直接基因组插入、修饰和突变的方法均为本领域技术人员众所周知的。在一个特定实施方案中,所述生产细胞系产生:
-包含SEQ ID NO:14的氨基酸序列或者由其组成的STF蛋白及其包含SEQ ID NO:15的氨基酸序列或者由其组成的相关伴侣蛋白,
-包含SEQ ID NO:16的氨基酸序列或者由其组成的STF蛋白,
-包含SEQ ID NO:17的氨基酸序列或者由其组成的STF蛋白及其包含SEQ ID NO:18的氨基酸序列或者由其组成的相关伴侣蛋白,
-包含SEQ ID NO:19的氨基酸序列或者由其组成的STF蛋白及其包含SEQ ID NO:20的氨基酸序列或者由其组成的相关伴侣蛋白,
-包含SEQ ID NO:21的氨基酸序列或者由其组成的STF蛋白及其包含SEQ ID NO:22的氨基酸序列或者由其组成的相关伴侣蛋白,
-包含SEQ ID NO:44的氨基酸序列或者由其组成的STF蛋白,或者
-包含SEQ ID NO:50的氨基酸序列或者由其组成的STF蛋白及任选地其包含SEQID NO:57的氨基酸序列或者由其组成的相关伴侣蛋白。
在一个特定实施方案中,所述辅助噬菌体包含编码含有序列SEQ ID NO:48或者由其组成的嵌合RBP的核酸序列,所述核酸序列一般地包含序列SEQ ID NO:54或者由其组成,并且所述辅助噬菌体任选地进一步包含编码含有序列SEQ ID NO:13或者由其组成的嵌合gpJ变体的核酸序列,所述核酸序列一般地包含序列SEQ ID NO:27或者由其组成。在一个特定实施方案中,所述辅助噬菌体为λ噬菌体,其中(i)编码野生型STF蛋白的核酸已被编码包含序列SEQ ID NO:48或者由其组成的嵌合RBP的核酸序列替代,所述核酸序列一般地包含序列SEQ ID NO:54或者由其组成,(ii)编码野生型gpJ蛋白的核酸已被编码包含序列SEQID NO:13或者由其组成的嵌合gpJ变体的核酸序列替代,所述核酸序列一般地包含序列SEQID NO:27或者由其组成,和(iii)Cos位点已被去除,和其中任选地(iv)辅助原噬菌体含有防止自发细胞裂解的突变,比如Sam7突变和(v)辅助原噬菌体含有主cI阻遏物的热敏形式,比如cI857形式。
在一个实施方案中,本文公开的细菌递送媒介物包含感兴趣的DNA有效载荷。如本文使用的术语“有效载荷”是指用递送媒介物转移到细菌中的任何核酸序列或氨基酸序列或两者的组合(非限制性地比如肽核酸或肽-寡核苷酸缀合物)。术语“有效载荷”还可指质粒、载体或货物。有效载荷可为从天然的、进化或工程改造的细菌噬菌体基因组中获得的噬菌粒或质粒。有效载荷也可仅部分地由从天然的、进化或工程改造的细菌噬菌体基因组获得的噬菌粒或质粒组成。
如以下实施例1所示,本文公开的细菌递送媒介物装载有效载荷的效率可取决于有效载荷的大小等。因此,在一个特定实施方案中,有效载荷具有大于或等于4kb且优选地小于或等于51kb的大小。
在所述实施方案中,有效载荷可具有一定大小,其整数倍在36kb-51kb之间。换言之,在该实施方案中,至少有一个整数n,比如36kb≤n×有效载荷的大小≤51kb。
发明人更特别地证明了,当所述有效载荷具有特定范围的大小时,有可能产生包含几乎唯一数量的有效载荷拷贝的更均匀的细菌递送媒介物群。
在一个特定实施方案中,有效载荷具有严格大于10.000kb且严格小于12.000kb的大小。在一个备选实施方案中,有效载荷具有严格大于12.500kb且严格小于16.667kb的大小,特别是严格大于12.500kb且小于13.000kb的大小。
在另一个特定实施方案中,有效载荷具有大于或等于18.000kb且小于或等于25.000kb,特别是小于或等于24.000kb的大小。
有效载荷可为能够在转移到目标细胞中后环化并然后在染色体内复制或整合的核酸质粒。载体DNA的复制取决于细菌复制起点的存在。一旦复制,质粒遗传到每个子细胞中可通过主动分配机制和质粒成瘾系统比如毒素/抗毒素系统的存在来介导。
如本文使用的术语“核酸”是指共价连接在一起的至少两个核苷酸的序列,其可为单链或双链的或者含有单链和双链序列两者的一部分。核酸可为天然存在的、重组的或合成的。核酸可以环状序列或线性序列的形式或两者形式的组合存在。核酸可为DNA、基因组或cDNA、或RNA或两者的组合。核酸可含有脱氧核糖核苷酸和核糖核苷酸的任何组合,以及包括以下在内的碱基的任何组合:尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤、次黄嘌呤、异胞嘧啶、5-羟甲基胞嘧啶和异鸟嘌呤。可使用的修饰碱基的其他实例详述于Chemical Reviews 2016,116(20)12655-12687中。术语“核酸”还包括可含有非限制性地包括以下的其他骨架的任何核酸类似物:磷酰胺、硫代磷酸酯、二硫代磷酸酯、O-甲基亚磷酰胺连接体和/或脱氧核糖核苷酸和核糖核苷酸核酸。本公开还包括以上核酸特征的任何组合。
本领域已知的复制起点已从物种特异性质粒DNA(例如CoIE1、Rl、pT181、pSC101、pMB1、R6K、RK2、p15a等)、从细菌病毒(例如
Figure BDA0003820857320000211
M13、F1和P4)和从细菌染色体复制起点(例如oriC)鉴定。在一个实施方案中,本公开的噬菌粒包含在目标细菌中功能性的细菌复制起点。
或者,本公开的质粒不包含任何功能性细菌复制起点或含有在目标细菌中无活性的复制起点。因此,本公开的质粒一旦被细菌病毒颗粒引入到细菌中就不能自行复制。
在一个实施方案中,待包装质粒上的复制起点在目标细菌中为无活性的,意指该复制起点在细菌病毒颗粒靶向的细菌中不是功能性的,从而防止不需要的质粒复制。
在一个实施方案中,质粒包含在用于产生细菌病毒颗粒的细菌中为功能性的细菌复制起点。
质粒复制取决于宿主酶和质粒控制的顺式和反式决定簇。例如,一些质粒具有在几乎所有革兰氏阴性细菌中均被识别并且在复制起始和调控期间于每种宿主中均正确地起作用的决定簇。其他质粒仅在一些细菌中具有这种能力(Kues,U和Stahl,U1989Microbiol Rev 53:491-5166)。
质粒通过从复制起点处起始的3种一般机制即θ型、链置换和滚环(由Del Solar等人1998Microhio and Molec Biol.Rev 62:434-464综述)进行复制。这些复制起点含有质粒和/或宿主编码的蛋白相互作用所需的位点。
在本公开的质粒上使用的复制起点可具有中等拷贝数,比如来自pBR322的ColE1ori(每个细胞15-20个拷贝)或R6K质粒(每个细胞15-20个拷贝),或者可为高拷贝数,例如pUC oris(每个细胞500-700个拷贝)、pGEM oris(每个细胞300-400个拷贝)、pTZ oris(每个细胞>1000个拷贝)或pBluescript oris(每个细胞300-500个拷贝)。
在一个实施方案中,细菌复制起点选自ColE1、pMB1和变体(pBR322、pET、pUC等)、p15a、ColA、ColE2、pOSAK、pSC101、R6K、IncW(pSa等)、IncFII、pT181、P1、F IncP、IncC、IncJ、IncN、IncP1、IncP4、IncQ、IncH11、RSF1010、CloDF13、NTP16、R1、f5、pPS10、pC194、pE194、BBR1、pBC1、pEP2、pWVO1、pLF1311、pAP1、pWKS1、pLS1、pLS11、pUB6060、pJD4、pIJ101、pSN22、pAMβ1、pIP501、pIP407、ZM6100(Sa)、pCU1、RA3、pMOL98、RK2/RP4/RP1/R68、pB10、R300B、pRO1614、pRO1600、pECB2、pCM1、pFA3、RepFIA、RepFIB、RepFIC、pYVE439-80、R387、phasyl、RA1、TF-FC2、pMV158和pUB113。
在一个实施方案中,细菌复制起点为选自以下的大肠杆菌复制起点:ColE1、pMB1和变体(pBR322、pET、pUC等)、p15a、ColA、ColE2、pOSAK、pSC101、R6K、IncW(pSa等)、IncFII、pT181、P1、F IncP、IncC、IncJ、IncN、IncP1、IncP4、IncQ、IncH11、RSF1010、CloDF13、NTP16、R1、f5和pPS10。
在一个实施方案中,细菌复制起点选自pC194、pE194、BBR1、pBC1、pEP2、pWVO1、pLF1311、pAP1、pWKS1、pLS1、pLS11、pUB6060、pJD4、pIJ101、pSN22、pAMβ1、pIP501、pIP407、ZM6100(Sa)、pCU1、RA3、pMOL98、RK2/RP4/RP1/R68、pB10、R300B、pRO1614、pRO1600、pECB2、pCM1、pFA3、RepFIA、RepFIB、RepFIC、pYVE439-80、R387、phasyl、RA1、TF-FC2、pMV158和pUB113。
在一个实施方案中,细菌复制起点为ColE1。
本公开递送的核酸序列可包含噬菌体复制起点,其可在完整的噬菌体基因组互补的情况下启动递送核酸序列的复制,用于随后封装到不同的衣壳中。
包含在本公开递送的核酸序列中的噬菌体复制起点可为噬菌体中发现的任何复制起点。
在一个实施方案中,噬菌体复制起点可为M13、f1、
Figure BDA0003820857320000221
P4、λ、P2、λ样、HK022、mEP237、HK97、HK629、HK630、mEP043、mEP213、mEP234、mEP390、mEP460、mEPx1、mEPx2、phi80、mEP234、T2、T4、T5、T7、RB49、phiX174,R17、PRD1 Pl样、P2样、P22、P22样、N15和N15样细菌噬菌体的野生型或非野生型序列。
在一个实施方案中,噬菌体复制起点选自M13、f1、
Figure BDA0003820857320000231
P4和λ的噬菌体复制起点。
在一个特定实施方案中,噬菌体复制起点为λ或P4复制起点。
递送的感兴趣的核酸包含在启动子控制下的核酸序列。在某些实施方案中,感兴趣的核酸选自Cas核酸酶基因,Cas9核酸酶基因,引导RNA,CRISPR基因座,毒素基因,编码酶比如核酸酶或激酶、TALEN、ZFN、大范围核酸酶、重组酶、细菌受体、膜蛋白、结构蛋白、分泌蛋白的基因,编码对抗生素或一般药物的抗性的基因,编码毒性蛋白或毒性因子的基因和编码毒力蛋白或毒力因子的基因,或其任何组合。在一个实施方案中,核酸有效载荷编码治疗性蛋白。在另一个实施方案中,核酸有效载荷编码反义核酸分子。
在一个实施方案中,感兴趣的序列为待递送至目标细菌的可编程核酸酶回路。这种可编程核酸酶回路能够介导体内序列特异性消除含有感兴趣的目标基因(例如对人类有害的基因)的细菌。本公开的一些实施方案涉及化脓性链球菌的II型CRISPR-Cas(成簇的规律间隔的短回文重复序列(Clustered Regularly Interspaced Short PalindromicRepeats)-CRISPR-相关)系统的工程改造的变体。可使用的其他可编程核酸酶包括其他CRISPR-Cas系统、工程改造的TALEN(转录激活因子样效应物核酸酶(TranscriptionActivator-Like Effector Nuclease))变体、工程改造的锌指核酸酶(ZFN)变体、天然的、进化或工程改造的大范围核酸酶或重组酶变体以及可编程核酸酶的任何组合或杂合体。因此,本文提供的工程改造的自主分布核酸酶回路可用于选择性地切割编码感兴趣基因比如毒素基因、毒力因子基因、抗生素抗性基因、重塑基因或调节基因的DNA(参见WO2014124226)。
其他感兴趣的序列,比如可编程序列,可添加至递送的核酸序列中,以便递送至目标细菌。在一个实施方案中,添加至递送的核酸序列的感兴趣的序列导致目标细菌的细胞死亡。例如,添加至质粒的感兴趣的核酸序列可编码穿孔素或毒素。
或者,添加至递送的核酸序列的感兴趣的回路序列不会导致细菌死亡。例如,感兴趣的序列可编码导致发光或荧光信号的报告基因。或者,感兴趣的序列可包含实现有用功能(例如改变细菌的新陈代谢或其环境的组成)的蛋白和酶。
在一个特定实施方案中,感兴趣的核酸序列选自Cas9,单引导RNA(sgRNA),CRISPR基因座,编码酶比如核酸酶或激酶、TALEN、ZFN、大范围核酸酶、重组酶、细菌受体、膜蛋白、结构蛋白、分泌蛋白的基因,编码对抗生素或一般药物的抗性的基因,编码毒性蛋白或毒性因子的基因和编码毒力蛋白或毒力因子的基因。
在一个特定实施方案中,本公开递送的核酸序列包含编码细菌素的感兴趣的核酸序列,该细菌素可为由细菌产生以杀死或抑制其他细菌生长的蛋白毒素。细菌素按几种方式进行分类,包括生产菌株、常见的抗性机制和杀死机制。来自革兰氏阴性细菌(例如小菌素、大肠杆菌素样细菌素和尾链素(tailocin))以及来自革兰氏阳性菌(例如I类、II类、III类或IV类细菌素)的这种细菌素已得到描述。
在一个实施方案中,本公开递送的核酸序列进一步包含编码选自以下的毒素的感兴趣的序列:小菌素、大肠杆菌素样细菌素、尾链素、I类、II类、III类和IV类细菌素。
在一个特定实施方案中,相应的免疫多肽(即抗毒素)可用于保护用于递送的核酸序列生产和衣壳化目的的细菌细胞(参加Cotter等人,Nature Reviews Microbiology 11:95,2013的综述,其特此通过参考以其全部结合),但在药用组合物以及其中递送本公开递送的核酸序列的目标细菌中不存在。
在本公开的一个方面,CRISPR系统包括在递送的核酸序列中。CRISPR系统含有两种不同的元件,即i)核酸内切酶,在这种情况下为CRISPR相关核酸酶(Cas或“CRISPR相关蛋白”),以及ii)引导RNA。引导RNA为嵌合RNA的形式,其由CRISPR(RNAcr)细菌RNA和RNAtracr(反式激活RNA CRISPR)的组合组成(Jinek等人,Science 2012)。引导RNA在单个转录物中组合对应于充当Cas蛋白引导的“间隔序列”的RNAcr的靶向特异性以及RNAtracr的构象性质。当引导RNA和Cas蛋白在细胞中同时表达时,目标基因组序列可永久修饰或中断。修饰有利地由修复矩阵引导。通常,CRISPR系统根据核酸酶的作用机制包括两个主要类别。1类由多亚基效应物复合物构成,并且包括I、III和IV型。2类由单一单元效应物模块如Cas9核酸酶构成,并且包括II型(II-A、II-B、II-C、II-C变体)、V型(V-A、V-B、V-C、V-D、V-E、V-U1、V-U2、V-U3、V-U4、V-U5)和VI型(VI-A、VI-B1、VI-B2、VI-C、VI-D)。
本公开感兴趣的序列包含编码Cas蛋白的核酸序列。多种CRISPR酶可用作质粒上感兴趣的序列。在一些实施方案中,CRISPR酶为II型CRISPR酶。在一些实施方案中,CRISPR酶催化DNA切割。在一些其他实施方案中,CRISPR酶催化RNA切割。在一个实施方案中,CRISPR酶可与sgRNA偶联。在某些实施方案中,sgRNA靶向选自以下的基因:抗生素抗性基因、毒力蛋白或因子基因、毒素蛋白或因子基因、细菌受体基因、膜蛋白基因、结构蛋白基因、分泌蛋白基因和编码对一般药物的抗性的基因。
作为多亚基效应物的一部分或作为单一单元效应物的Cas蛋白的非限制性实例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Cas11(SS)、Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、C2c4、C2c8、C2c5、C2c10、C2c9、Cas13a(C2c2)、Cas13b(C2c6)、Cas13c(C2c7)、Cas13d、Csa5、Csc1、Csc2、Cse1、Cse2、Csy1、Csy2、Csy3、Csf1、Csf2、Csf3、Csf4、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csn2、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx13、Csx1、Csx15、SdCpf1、CmtCpf1、TsCpf1、CmaCpf1、PcCpf1、ErCpf1、FbCpf1、UbcCpf1、AsCpf1、LbCpf1、其同源物、其直向同源物、其变体或其修饰形式。在一些实施方案中,CRISPR酶在前间隔序列邻近基序(PAM)位点处切割目标核酸的两条链。
在一个特定实施方案中,CRISPR酶为任何Cas9蛋白,例如任何天然存在的细菌Cas9及其任何变体、同源物或直向同源物。
“Cas9”意指蛋白Cas9(也称为Csn1或Csx12)或其功能性蛋白、肽或多肽片段,即能够与一种或多种引导RNA相互作用并发挥酶促活性(核酸酶),这允许其对目标基因组的DNA进行双链切割。“Cas9”因此可表示修饰的蛋白,例如截短以去除对于蛋白的预定功能并非必需的蛋白结构域,特别是对于与一种或多种gRNA的相互作用并非必要的结构域。
如本公开的上下文中使用的编码Cas9(整个蛋白或其片段)的序列可从任何已知的Cas9蛋白获得(Fonfara等人,Nucleic Acids Res 42(4),2014;Koonin等人,Nat RevMicrobiol 15(3),2017)。可用于本公开的Cas9蛋白的实例包括(但不限于)以下的Cas9蛋白:化脓性链球菌(Streptococcus pyogenes)(SpCas9)、嗜热链球菌(Streptococcusthermophiles)(St1Cas9、St3Cas9)、变异链球菌(Streptococcus mutans)、金黄色葡萄球菌(Staphylococcus aureus)(SaCas9)、空肠弯曲杆菌(Campylobacter jejuni)(CjCas9)、新凶手弗朗西斯菌(Francisella novicida)(FnCas9)和脑膜炎奈瑟菌(Neisseriameningitides)(NmCas9)。
如本公开的上下文中使用的编码Cpfl(Cas12a)(整个蛋白或其片段)的序列可从任何已知的Cpfl(Cas12a)蛋白获得(Koonin等人,2017)。可用于本公开的Cpf1(Cas12a)蛋白的实例包括(但不限于)以下的Cpf1(Cas12a)蛋白:氨基酸球菌属物种(Acidaminococcussp)、毛螺菌科细菌(Lachnospiraceae bacteriu)和新凶手弗朗西斯菌(Francisellanovicida)。
编码Cas13a(整个蛋白或其片段)的序列可从任何已知的Cas13a(C2c2)蛋白获得(Abudayyeh等人,2017)。可用于本公开的Cas13a(C2c2)蛋白的实例包括(但不限于)以下的Cas13a(C2c2)蛋白:韦德纤毛菌(Leptotrichia wadei)(LwaCas13a)。
编码Cas13d(整个蛋白或其片段)的序列可从任何已知的Cas13d蛋白获得(Yan等人,2018)。可用于本公开的Cas13d蛋白的实例包括(但不限于)以下的Cas13d蛋白:惰性真杆菌(Eubacterium siraeum)和瘤胃球菌属物种(Ruminococcus sp)。
在一个特定实施方案中,感兴趣的核酸序列为CRISPR/Cas9系统,用于选自以下的基因的基因表达降低或失活:抗生素抗性基因,毒力因子或蛋白基因,毒素因子或蛋白基因,编码细菌受体、膜蛋白、结构蛋白、分泌蛋白的基因和编码对一般药物的抗性的基因。
在一个实施方案中,CRISPR系统用于靶向毒力因子和使毒力因子失活。毒力因子可为由病原体产生的任何物质,其通过增加对宿主造成的损害程度来改变宿主-病原体相互作用。毒力因子被病原体以多种方式使用,所述方式包括例如宿主中的细胞粘附或生态位定殖中,以逃避宿主的免疫反应,促进进入和离开宿主细胞,从宿主获取营养,或抑制宿主的其他生理过程。毒力因子可包括酶、内毒素、粘附因子、运动因子、参与补体逃逸的因子和促进生物膜形成的因子。例如,这种目标毒力因子基因可为大肠杆菌毒力因子基因,例如但不限于:EHEC-HlyA、Stx1(VT1)、Stx2(VT2)、Stx2a(VT2a)、Stx2b(VT2b)、Stx2c(VT2c)、Stx2d(VT2d)、Stx2e(VT2e)和Stx2f(VT2f)、Stx2h(VT2h)、fimA、fimF、fimH、neuC、kpsE、sfa、foc、iroN、aer、iha、papC、papGI、papGII、papGIII、hlyC、cnf1、hra、sat、ireA、uspompT、ibeA、malX、fyuA、irp2、traT、afaD、ipaH、eltB、estA、bfpA、eaeA、espA、aaiC、aatA、TEM、CTX、SHV、csgA、csgB、csgC、csgD、csgE、csgF、csgG、csgH、T1SS、T2SS、T3SS、T4SS、T5SS、T6SS(分泌系统)。例如,这种目标毒力因子基因可为痢疾志贺氏菌(Shigelladysenteriae)毒力因子基因,例如但不限于:stx1和stx2。例如,这种目标毒力因子基因可为鼠疫耶尔森氏菌(Yersinia pestis)毒力因子基因,例如但不限于:yscF(质粒携带(pCD1)T3SS外针亚基。例如,这种目标毒力因子基因可为土拉弗朗西斯菌(Francisellatularensis)毒力因子基因,例如但不限于:fslA。例如,这种目标毒力因子基因可为炭疽芽孢杆菌(Bacillus anthracis)毒力因子基因,例如但不限于:pag(炭疽毒素,细胞结合保护性抗原)。例如,这种目标毒力因子基因可为霍乱弧菌(Vibrio cholera)毒力因子基因,例如但不限于:ctxA和ctxB(霍乱毒素)、tcpA(毒素共调菌毛)和toxT(主毒力调控因子)。例如,这种目标毒力因子基因可为铜绿假单胞菌毒力因子基因,例如但不限于:脓菌素(例如σ因子pvdS、生物合成基因pvdL、pvdl、pvdJ、pvdH、pvdA、pvdF、pvdQ、pvdN、pvdM、pvdO、pvdP、转运基因pvdE、pvdR、pvdT、opmQ)、铁载体绿脓杆菌螯铁蛋白(pyochelin)(例如pchD、pchC、pchB、pchA、pchE、pchF和pchG及毒素类(例如exoU、exoS和exoT)。例如,这种目标毒力因子基因可为肺炎克雷伯氏菌(Klebsiella pneumoniae)毒力因子基因,例如但不限于:fimA(粘附性,I型菌毛主要亚基)和cps(荚膜多糖)。例如,这种目标毒力因子基因可为鲍曼不动杆菌(Acinetobacter baumannii)毒力因子基因,例如但不限于:ptk(荚膜聚合)和epsA(组装)。例如,这种目标毒力因子基因可为伤寒肠道沙门氏菌(Salmonella enterica Typhi)毒力因子基因,例如但不限于:MIA(入侵,SPI-1调控因子)、ssrB(SPI-2调控因子),以及与胆汁耐受性相关的那些,包括外排泵基因acrA、acrB和tolC。例如,这种目标毒力因子基因可为具核梭杆菌(Fusobacterium nucleatum)毒力因子基因,例如但不限于:FadA和TIGIT。例如,这种目标毒力因子基因可为脆弱拟杆菌(Bacteroides fragilis)毒力因子基因,例如但不限于:bft。
在另一个实施方案中,CRISPR/Cas9系统用于靶向抗生素抗性基因且使其失活,所述抗生素抗性基因例如但不限于:GyrB、ParE、ParY、AAC(1)、AAC(2’)、AAC(3)、AAC(6’)、ANT(2”)、ANT(3”)、ANT(4’)、ANT(6)、ANT(9)、APH(2”)、APH(3”)、APH(3’)、APH(4)、APH(6)、APH(7”)、APH(9)、ArmA、RmtA、RmtB、RmtC、Sgm、AER、BLA1、CTX-M、KPC、SHV、TEM、BlaB、CcrA、IMP、NDM、VIM、ACT、AmpC、CMY、LAT、PDC、OXAβ-内酰胺酶、mecA、Omp36、OmpF、PIB、bla(blaI、blaR1)和mec(mecI、mecR1)操纵子、氯霉素乙酰转移酶(CAT)、氯霉素磷酸转移酶、乙胺丁醇抗性阿拉伯糖基转移酶(EmbB)、MupA、MupB、整合膜蛋白MprF、Cfr 23S rRNA甲基转移酶、利福平ADP-核糖基转移酶(Arr)、利福平糖基转移酶、利福平单加氧酶、利福平磷酸转移酶、DnaA、RbpA、利福平抗性RNA聚合酶β亚基(RpoB)、Erm 23S rRNA甲基转移酶、Lsa、MsrA、Vga、VgaB、链阳菌素Vgb裂解酶、Vat乙酰转移酶、氟喹诺酮乙酰转移酶、氟喹诺酮抗性DNA拓扑异构酶、氟喹诺酮抗性GyrA、GyrB、ParC、喹诺酮抗性蛋白(Qnr)、FomA、FomB、FosC、FosA、FosB、FosX、VanA、VanB、VanD、VanR、VanS、林可酰胺核苷酸基转移酶(Lin)、EreA、EreB、GimA、Mgt、Ole、大环内酯磷酸转移酶(MPH)、MefA、MefE、Mel、链丝菌素乙酰转移酶(sat)、Sul1、Sul2、Sul3、磺胺抗性FolP、四环素失活酶TetX、TetA、TetB、TetC、Tet30、Tet31、TetM、TetO、TetQ、Tet32、Tet36、MacAB-TolC、MsbA、MsrA,VgaB、EmrD、EmrAB-TolC、NorB、GepA、MepA、AdeABC、AcrD、MexAB-OprM、mtrCDE、EmrE、adeR、acrR、baeSR、mexR、phoPQ、mtrR或综合抗生素抗性数据库(CARD https://card.mcmaster.ca/)中描述的任何抗生素抗性基因。
在另一个实施方案中,CRISPR/Cas9系统用于靶向细菌毒素基因并使其失活。细菌毒素可分类为外毒素或内毒素。外毒素为产生并主动分泌的;内毒素保持为细菌的一部分。对细菌毒素的反应可涉及重度炎症,并且可导致败血症。这种毒素可为例如肉毒杆菌神经毒素、破伤风毒素、葡萄球菌毒素、白喉毒素、炭疽毒素、α毒素、百日咳毒素、志贺毒素、热稳定肠毒素(大肠杆菌ST)、大肠杆菌素、BFT(脆弱拟杆菌毒素)或Henkel等人,(Toxins fromBacteria in EXS.2010;100:1-29)中描述的任何毒素。
在一个特定实施方案中,所述有效载荷包含核酸序列SEQ ID NO:47或者由其组成。
由本文公开的细菌递送媒介物靶向的细菌可为哺乳动物有机体中存在的任何细菌。在某个方面,通过由递送媒介物表达的嵌合RBP和/或分支RBP与细菌细胞的相互作用来靶向细菌。其可为微生物群或微生物组的任何共栖、共生或致病细菌。
微生物组可包含多种内源性细菌种类,其任何一种均可根据本公开靶向。在一些实施方案中,目标内源性细菌细胞的属和/或种可取决于用于制备细菌递送媒介物的细菌噬菌体的类型。例如,一些细菌噬菌体显示出对于特异性宿主细菌种的向性或优先靶向其。其他细菌噬菌体不表现出这种向性,并且可用于靶向许多不同属和/或种的内源性细菌细胞。
细菌细胞的实例非限制性地包括来自以下属的细菌的细胞:耶尔森氏菌属物种(Yersinia spp.)、埃希氏菌属物种(Escherichia spp.)、克雷伯氏菌属物种(Klebsiellaspp.)、不动杆菌属物种(Acinetobacter spp.)、博德特氏菌属物种(Bordetella spp.)、奈瑟菌属物种(Neisseria spp.)、气单胞菌属物种(Aeromonas spp.)、弗朗西斯菌属物种(Franciesella spp.)、棒状杆菌属物种(Corynebacterium spp.)、柠檬酸杆菌属物种(Citrobacter spp.)、衣原体属物种(Chlamydia spp.)、嗜血杆菌属物种(Hemophilusspp.)、布鲁氏菌属物种(Brucella spp.)、分枝杆菌属物种(Mycobacterium spp.)、军团菌属物种(Legionella spp.)、红球菌属物种(Rhodococcus spp.)、假单胞菌属物种(Pseudomonas spp.)、螺杆菌属物种(Helicobacter spp.)、弧菌属物种(Vibrio spp.)、芽孢杆菌属物种(Bacillus spp.)、丹毒丝菌属物种(Erysipelothrix spp.)、沙门氏菌属物种(Salmonella spp.)、链霉菌属物种(Streptomyces spp.)、链球菌属物种(Streptococcus spp.)、葡萄球菌属物种(Staphylococcus spp.)、拟杆菌属物种(Bacteroides spp.)、普雷沃氏菌属物种(Prevotella spp.)、梭菌属物种(Clostridiumspp.)、双歧杆菌属物种(Bifidobacterium spp.)、梭菌属物种、短杆菌属物种(Brevibacterium spp.)、乳球菌属物种(Lactococcus spp.)、明串珠菌属物种(Leuconostoc spp.)、放线杆菌属物种(Actinobacillus spp.)、硒单胞菌属物种(Selnomonas spp.)、志贺氏菌属物种(Shigella spp.)、发酵单胞菌属物种(Zymonasspp.)、支原体属物种(Mycoplasma spp.)、密螺旋体属物种(Treponema spp.)、明串珠菌属物种、棒状杆菌属物种、肠球菌属物种(Enterococcus spp.)、肠杆菌属物种(Enterobacterspp.)、热球菌属物种(Pyrococcus spp.)、沙雷氏菌属物种(Serratia spp.)、摩根氏菌属物种(Morganella spp.)、微单胞菌属物种(Parvimonas spp.)、梭杆菌属物种(Fusobacterium spp.)、放线菌属物种(Actinomyces spp.)、卟啉单胞菌属物种(Porphyromonas spp.)、微球菌属物种(Micrococcus spp.)、巴尔通体属物种(Bartonellaspp.)、疏螺旋体属物种(Borrelia spp.)、布鲁氏菌属物种(Brucelia spp.)、弯曲杆菌属物种(Campylobacter spp.)、嗜衣原体属物种(Chlamydophilia spp.)、皮肤杆菌属(Cutibacterium)(以前的丙酸杆菌属(Propionibacterium))物种、埃立克体属物种(Ehrlichia spp.)、嗜血杆菌属物种(Haemophilus spp.)、钩端螺旋体属物种(Leptospiraspp.)、李斯特菌属物种(Listeria spp.)、支原体属物种、诺卡氏菌属物种(Nocardiaspp.)、立克次体属物种(Rickettsia spp.)、脲原体属物种(Ureaplasma spp.)和乳杆菌属物种(Lactobacillus spp)及其混合物。
因此,细菌递送媒介物可靶向(例如特异性地靶向)来自任何一个或多个前述属的细菌细胞,以特异性地递送本公开感兴趣的有效载荷。
在一个实施方案中,目标细菌可选自耶尔森氏菌属物种、埃希氏菌属物种、克雷伯氏菌属物种、不动杆菌属物种、假单胞菌属物种、螺杆菌属物种、弧菌属物种、沙门氏菌属物种、链球菌属物种、葡萄球菌属物种、拟杆菌属物种、梭菌属物种、志贺氏菌属物种、肠球菌属物种、肠杆菌属物种和李斯特菌属物种。
在一些实施方案中,本公开的目标细菌细胞为厌氧菌细胞(例如不需要氧用于生长的细胞)。厌氧菌细胞包括兼性厌氧细胞,比如(但不限于)大肠杆菌(Escherichiacoli)、奥奈达希瓦氏菌(Shewanella oneidensis)和李斯特菌属(Listeria)。厌氧菌细胞还包括专性厌氧细胞,比如拟杆菌属(Bacteroides)和梭菌属(Clostridium)物种。在人类中,厌氧菌最常见于胃肠道。在一些特定实施方案中,目标细菌因此为胃肠道中最常见的细菌。用于制备细菌病毒颗粒的细菌噬菌体,并且然后是细菌病毒颗粒,可根据其本领域技术人员已知的特异性谱靶向(例如特异性地靶向)厌氧菌细胞,以特异性地递送质粒。
在一些实施方案中,目标细菌细胞非限制性地为多形拟杆菌(Bacteroidesthetaiotaomicron)、脆弱拟杆菌(Bacteroides fragilis)、狄氏拟杆菌(Bacteroidesdistasonis)、普通拟杆菌(Bacteroides vulgatus)、柔嫩梭菌(Clostridium leptum)、球形梭菌(Clostridium coccoides)、金黄色葡萄球菌(Staphylococcus aureus)、枯草芽孢杆菌(Bacillus subtilis)、丁酸梭菌(Clostridium butyricum)、乳酸发酵短杆菌(Brevibacterium lactofermentum)、无乳链球菌(Streptococcus agalactiae)、乳酸乳球菌(Lactococcus lactis)、乳酸明串珠菌(Leuconostoc lactis)、伴放线放线杆菌(Actinobacillus actinobycetemcomitans)、蓝细菌(cyanobacteria)、大肠杆菌、幽门螺杆菌(Helicobacter pylori)、反刍动物硒单胞菌(Selnomonas ruminatium)、宋内志贺氏菌(Shigella sonnei)、运动发酵单胞菌(Zymomonas mobilis)、蕈状支原体(Mycoplasmamycoides)、栖牙密螺旋体(Treponema denticola)、苏云金芽孢杆菌(Bacillusthuringiensis)、路邓葡萄球菌(Staphilococcus lugdunensis)、酒明串珠菌(Leuconostoc oenos)、干燥棒状杆菌(Corynebacterium xerosis)、植物乳杆菌(Lactobacillus plantarum)、鼠李糖乳杆菌(Lactobacillus rhamnosus)、干酪乳杆菌(Lactobacillus casei)、嗜酸乳杆菌(Lactobacillus acidophilus)、粪肠球菌(Enterococcus faecalis)、凝结芽孢杆菌(Bacillus coagulans)、蜡状芽孢杆菌(Bacillus cereus)、日本金龟子芽孢杆菌(Bacillus popillae)、集胞藻属(Synechocystis)菌株PCC6803、液化芽孢杆菌(Bacillus liquefaciens)、海底热球菌(Pyrococcus abyssi)、Selenomonas nominantium、希氏乳杆菌(Lactobacillushilgardii)、野生链球菌(Streptococcus ferus)、戊糖乳杆菌(Lactobacilluspentosus)、脆弱拟杆菌、表皮葡萄球菌(Staphylococcus epidermidis)、产色链霉菌(Streptomyces phaechromogenes)、加纳链霉菌(Streptomyces ghanaenis)、肺炎克雷伯氏菌(Klebsiella pneumoniae)、阴沟肠杆菌(Enterobacter cloacae)、产气肠杆菌(Enterobacter aerogenes)、粘质沙雷氏菌(Serratia marcescens)、摩氏摩根氏菌(Morganella morganii)、弗氏柠檬酸杆菌(Citrobacter freundii)、费氏丙酸杆菌(Propionibacterium freudenreichii)、铜绿假单胞菌(Pseudomonas aeruginosa)、微小微单胞菌(Parvimonas micra)、中间普雷沃氏菌(Prevotella intermedia)、具核梭杆菌(Fusobacterium nucleatum)、变黑普雷沃氏菌(Prevotella nigrescens)、以色列放线菌(Actinomyces israelii)、牙髓卟啉单胞菌(Porphyromonas endodontalis)、牙龈卟啉单胞菌(Porphyromonas gingivalis)、藤黄微球菌(Micrococcus luteus)、巨大芽孢杆菌(Bacillus megaterium)、嗜水气单胞菌(Aeromonas hydrophila)、豚鼠气单胞菌(Aeromonas caviae)、炭疽芽孢杆菌(Bacillus anthracis)、汉氏巴尔通体(Bartonellahenselae)、五日热巴尔通体(Bartonella Quintana)、百日咳博德特氏菌(Bordetellapertussis)、伯氏疏螺旋体(Borrelia burgdorferi)、伽氏疏螺旋体(Borrelia garinii)、阿氏疏螺旋体(Borrelia afzelii)、回归热疏螺旋体(Borrelia recurrentis)、流产布鲁氏菌(Brucella abortus)、犬布鲁氏菌(Brucella canis)、羊布鲁氏菌(Brucellamelitensis)、猪布鲁氏菌(Brucella suis)、空肠弯曲杆菌(Campylobacter jejuni)、结肠弯曲杆菌(Campylobacter coli)、胎儿弯曲杆菌(Campylobacter fetus)、肺炎衣原体(Chlamydia pneumoniae)、沙眼衣原体(Chlamydia trachomatis)、鹦鹉热嗜衣原体(Chlamydophila psittaci)、肉毒梭菌(Clostridium botulinum)、艰难梭菌(Clostridiumdifficile)、产气荚膜梭菌(Clostridium perfringens)、破伤风梭菌(Clostridiumtetani)、白喉棒状杆菌(Corynebacterium diphtheria)、痤疮皮肤杆菌(Cutibacteriumacnes)(以前的痤疮丙酸杆菌(Propionibacterium acnes))、犬埃立克体(Ehrlichiacanis)、查菲埃立克体(Ehrlichia chaffeensis)、屎肠球菌(Enterococcus faecium)、土拉弗朗西斯菌(Francisella tularensis)、流感嗜血杆菌(Haemophilus influenza)、嗜肺军团菌(Legionella pneumophila)、问号钩端螺旋体(Leptospira interrogans)、圣他罗西亚钩端螺旋体(Leptospira santarosai)、韦氏钩端螺旋体(Leptospira weilii)、野口钩端螺旋体(Leptospira noguchii)、单核细胞增多性李斯特菌(Listeriamonocytogenes)、麻风分枝杆菌(Mycobacterium leprae)、结核分枝杆菌(Mycobacteriumtuberculosis)、溃疡分枝杆菌(Mycobacterium ulcerans)、肺炎支原体(Mycoplasmapneumonia)、淋病奈瑟菌(Neisseria gonorrhoeae)、脑膜炎奈瑟菌(Neisseriameningitides)、星形诺卡氏菌(Nocardia asteroids)、立氏立克次体(Rickettsiarickettsia)、肠炎沙门氏菌(Salmonella enteritidis)、伤寒沙门氏菌(Salmonellatyphi)、副伤寒沙门氏菌(Salmonella paratyphi)、鼠伤寒沙门氏菌(Salmonellatyphimurium)、福氏志贺氏菌(Shigella flexnerii)、痢疾志贺氏菌(Shigelladysenteriae)、腐生葡萄球菌(Staphylococcus saprophyticus)、肺炎链球菌(Streptococcus pneumoniae)、化脓性链球菌(Streptococcus pyogenes)、阴道加德纳菌(Gardnerella vaginalis)、草绿色链球菌(Streptococcus viridans)、苍白密螺旋体(Treponema pallidum)、解脲脲原体(Ureaplasma urealyticum)、霍乱弧菌(Vibriocholera)、副溶血弧菌(Vibrio parahaemolyticus)、鼠疫耶尔森氏菌(Yersinia pestis)、小肠结肠炎耶尔森氏菌(Yersinia enterocolitica)、假结核病耶尔森氏菌(Yersiniapseudotuberculosis)、鲍曼不动杆菌(Actinobacter baumanii)、铜绿假单胞菌及其混合物。在一个实施方案中,感兴趣的目标细菌选自大肠杆菌、屎肠球菌、金黄色葡萄球菌、肺炎克雷伯氏菌、鲍曼不动杆菌(Acinetobacter baumanii)、铜绿假单胞菌、阴沟肠杆菌和产气肠杆菌及其混合物。
在一些实施方案中,目标细菌细胞非限制性地为厌氧棍状菌属(Anaerotruncus)、厌氧醋菌属(Acetanaerobacterium)、聚乙酸菌属(Acetitomaculum)、醋弧菌属(Acetivibrio)、厌氧球菌属(Anaerococcus)、厌氧细杆菌属(Anaerofilum)、Anaerosinus、厌氧棒杆菌属(Anaerostipes)、厌氧贪食菌属(Anaerovorax)、丁酸弧菌属(Butyrivibrio)、梭菌属、山羊球菌属(Capracoccus)、脱卤素杆菌属(Dehalobacter)、戴阿李斯特菌属(Dialister)、多尔氏菌属(Dorea)、肠球菌属(Enterococcus)、产乙醇杆菌属(Ethanoligenens)、栖粪杆菌属(Faecalibacterium)、梭杆菌属、纤细杆菌属(Gracilibacter)、Guggenheimella、黑斯伯利亚菌属(Hespellia)、毛形杆菌属(Lachnobacterium)、毛螺菌属(Lachnospira)、乳杆菌属、明串球菌属、巨单胞菌属(Megamonas)、莫亚拉菌属(Moryella)、光冈菌属(Mitsuokella)、原细菌属(Oribacterium)、产醋杆菌属(Oxobacter)、乳头杆属(Papillibacter)、丙酸螺菌属(Proprionispira)、假丁酸弧菌属(Pseudobutyrivibrio)、假支杆菌属(Pseudoramibacter)、罗氏菌属(Roseburia)、瘤胃球菌属、八叠球菌属(Sarcina)、清野氏菌属(Seinonella)、肖特沃思氏菌属(Shuttleworthia)、孢子杆菌属(Sporobacter)、孢子菌属(Sporobacterium)、链球菌属、罕见小球菌属(Subdoligranulum)、互营球菌属(Syntrophococcus)、耐热芽孢杆菌属(Thermobacillus)、苏黎世杆菌属(Turibacter)、魏斯氏菌属(Weisella)、梭菌属、拟杆菌属、瘤胃球菌属(Ruminococcus)、栖粪杆菌属、密螺旋体属、考拉杆菌属(Phascolarctobacterium)、巨球形菌属(Megasphaera)、栖粪杆菌属、双歧杆菌属、乳杆菌属、萨特氏菌属(Sutterella)和/或普雷沃氏菌属。
在其他实施方案中,目标细菌细胞非限制性地为木糖氧化无色杆菌(Achromobacter xylosoxidans)、发酵氨基酸球菌(Acidaminococcus fermentans)、肠氨基酸球菌(Acidaminococcus intestini)、氨基酸球菌属物种(Acidaminococcus sp.)、鲍曼不动杆菌(Acinetobacter baumannii)、琼氏不动杆菌(Acinetobacter junii)、洛菲不动杆菌(Acinetobacter lwoffii)、荚膜放线杆菌(Actinobacillus capsulatus)、内氏放线菌(Actinomyces naeslundii)、纽氏放线菌(Actinomyces neuii)、溶齿放线菌(Actinomyces odontolyticus)、放线菌罗亚种(Actinomyces radingae)、产液阿德勒克罗伊茨菌(Adlercreutzia equolifaciens)、马赛气微菌(Aeromicrobium massiliense)、伴放线凝聚杆菌(Aggregatibacter actinomycetemcomitans)、嗜黏蛋白阿克曼菌(Akkermansia muciniphila)、海洋别样食藻菌(Aliagarivorans marinus)、芬氏别样杆菌(Alistipes finegoldii)、苍莽别样杆菌(Alistipes indistinctus)、狭边别样杆菌(Alistipes inops)、昂氏别样杆菌(Alistipes onderdonkii)、腐烂别样杆菌(Alistipesputredinis)、塞内加尔别样杆菌(Alistipes senegalensis)、沙氏别样杆菌(Alistipesshahii)、蒂莫内别样杆菌(Alistipes timonensis)、欧米克斯异斯卡多维亚菌(Alloscardovia omnicolens)、多内孢厌氧杆菌(Anaerobacter polyendosporus)、产氢厌氧棒菌(Anaerobaculum hydrogeniformans)、产氢厌氧球菌(Anaerococcushydrogenalis)、普氏厌氧球菌(Anaerococcus prevotii)、塞内加尔厌氧球菌(Anaerococcus senegalensis)、粪厌氧棒形菌(Anaerofustis stercorihominis)、粪厌氧棒杆菌(Anaerostipes caccae)、庞大厌氧棒杆菌(Anaerostipes hadrus)、结肠厌氧棍状菌(Anaerotruncus colihominis)、解硫胺素硫胺素芽孢杆菌(Aneurinibacillusaneurinilyticus)、地衣芽孢杆菌(Bacillus licheniformis)、Bacillusmassilioanorexius、马赛塞内加尔芽孢杆菌(Bacillus massiliosenegalensis)、简单芽孢杆菌(Bacillus simplex)、史氏芽孢杆菌(Bacillus smithii)、枯草芽孢杆菌、苏云金芽孢杆菌(Bacillus thuringiensis)、蒂莫内芽孢杆菌(Bacillus timonensis)、溶木聚糖拟杆菌(Bacteriodes xylanisolvens)、产酸拟杆菌(Bacteroides acidifaciens)、粪拟杆菌(Bacteroides caccae)、多毛拟杆菌(Bacteroides capillosus)、解纤维素拟杆菌(Bacteroides cellulosilyticus)、克拉鲁斯拟杆菌(Bacteroides clarus)、栖粪拟杆菌(Bacteroides coprocola)、嗜粪拟杆菌(Bacteroides coprophilus)、多氏拟杆菌(Bacteroides dorei)、埃氏拟杆菌(Bacteroides eggerthii)、粪拟杆菌(Bacteroidesfaecis)、细金拟杆菌(Bacteroides finegoldii)、氟拟杆菌(Bacteroides fluxus)、脆弱拟杆菌、鹑鸡拟杆菌(Bacteroides gallinarum)、肠道拟杆菌(Bacteroidesintestinalis)、诺氏拟杆菌(Bacteroides nordii)、油性拟杆菌(Bacteroidesoleiciplenus)、卵形拟杆菌(Bacteroides ovatus)、嗜果胶拟杆菌(Bacteroidespectinophilus)、平常拟杆菌(Bacteroides plebeius)、萨氏拟杆菌(Bacteroidessalanitronis)、萨利尔斯氏拟杆菌(Bacteroides salyersiae)、拟杆菌属物种(Bacteroides sp.)、粪便拟杆菌(Bacteroides stercoris)、多形拟杆菌、单形拟杆菌(Bacteroides uniformis)、普通拟杆菌、溶木聚糖拟杆菌、嗜果胶拟杆菌ATCC、肠道巴恩斯氏菌(Barnesiella intestinihominis)、赛勒氏巴伐利亚球菌(Bavariicoccus seileri)、青春双歧杆菌(Bifidobacterium adolescentis)、角双歧杆菌(Bifidobacteriumangulatum)、动物双歧杆菌(Bifidobacterium animalis)、两歧双歧杆菌(Bifidobacterium bifidum)、短双歧杆菌(Bifidobacterium breve)、小链双歧杆菌(Bifidobacterium catenulatum)、齿双歧杆菌(Bifidobacterium dentium)、高卢双歧杆菌(Bifidobacterium gallicum)、长双歧杆菌(Bifidobacterium longum)、假小链双歧杆菌(Bifidobacterium pseudocatenulatum)、粪双歧杆菌(Bifidobacterium stercoris)、沃氏嗜胆菌(Bilophila wadsworthia)、粪布劳特氏菌(Blautia faecis)、汉氏布劳特氏菌(Blautia hansenii)、氢营养布劳特氏菌(Blautia hydrogenotrophica)、卢氏布劳特氏菌(Blautia luti)、卵形布劳特氏菌(Blautia obeum)、生产布劳特氏菌(Blautiaproducta)、韦氏布劳特氏菌(Blautia wexlerae)、摇蚜短枝单胞菌(Brachymonaschironomi)、塞内加尔短杆菌(Brevibacterium senegalense)、需甲酸盐布瑞特氏菌(Bryantella formatexigens)、丁酸盐产生菌(butyrate-producing bacterium)、白痢丁酸球菌(Butyricicoccus pullicaecorum)、病毒性蓖麻杆菌(Butyricimonas virosa)、穗狀丁酸弧菌(Butyrivibrio crossotus)、溶纤维丁酸弧菌(Butyrivibrio fibrisolvens)、粪钙杆菌(Caldicoprobacter faecalis)、简明弯曲杆菌(Campylobacter concisus)、空肠弯曲杆菌、乌普萨拉弯曲杆菌(Campylobacter upsaliensis)、光冈链型杆菌(Catenibacterium mitsuokai)、戴氏西地西菌(Cedecea davisae)、马赛纤维单胞菌(Cellulomonas massiliensis)、索氏鲸杆菌(Cetobacterium somerae)、布氏柠檬酸杆菌(Citrobacter braakii)、弗氏柠檬酸杆菌、巴氏柠檬酸杆菌(Citrobacter pasteurii)、柠檬酸杆菌属物种(Citrobacter sp.)、杨氏柠檬酸杆菌(Citrobacter youngae)、艾维克洛杆菌(Cloacibacillus evryensis)、梭菌目细菌(Clostridiales bacterium)、艰难梭菌(Clostridioides difficile)、天冬酰胺梭菌(Clostridium asparagiforme)、巴勒特梭菌(Clostridium bartlettii)、玻利维亚梭菌(Clostridium boliviensis)、鲍氏梭菌(Clostridium bolteae)、哈氏梭菌(Clostridium hathewayi)、希拉诺梭菌(Clostridiumhiranonis)、海氏梭菌(Clostridium hylemonae)、柔嫩梭菌(Clostridium leptum)、甲基戊糖梭菌(Clostridium methylpentosum)、系结梭菌(Clostridium nexile)、园环梭菌(Clostridium orbiscindens)、多枝梭菌(Clostridium ramosum)、闪烁梭菌(Clostridiumscindens)、梭菌属物种、梭菌属物种、螺状梭菌(Clostridium spiroforme)、生孢梭菌(Clostridium sporogenes)、共生梭菌(Clostridium symbiosum)、产气柯林斯菌(Collinsella aerofaciens)、肠道柯林斯菌(Collinsella intestinalis)、粪便柯林斯菌(Collinsella stercoris)、田中柯林斯菌(Collinsella tanakaei)、串珠芽孢杆菌(Coprobacillus cateniformis)、苛求粪杆菌(Coprobacter fastidiosus)、灵巧粪球菌(Coprococcus catus)、陪伴粪球菌(Coprococcus comes)、规则粪球菌(Coprococcuseutactus)、产氨棒状杆菌(Corynebacterium ammoniagenes)、无枝菌酸棒状杆菌(Corynebacterium amycolatum)、假白喉棒状杆菌(Corynebacteriumpseudodiphtheriticum)、痤疮皮肤杆菌(Cutibacterium acnes)、人皮肤杆菌(Dermabacter hominis)、哥本哈根脱亚硫酸菌属(Desulfitobacterium hafniense)、费尔菲尔德脱硫弧菌(Desulfovibrio fairfieldensis)、懒惰脱硫弧菌(Desulfovibriopiger)、喜琥珀酸戴阿李斯特菌(Dialister succinatiphilus)、苛求迪尔莫菌(Dielmafastidiosa)、产甲酸多尔氏菌(Dorea formicigenerans)、长链多尔氏菌(Dorealongicatena)、Dysgonomonas capnocytophagoides、嘉德营发酵单胞菌(Dysgonomonasgadei)、莫斯氏营发酵单胞菌(Dysgonomonas mossii)、迟钝爱德华菌(Edwardsiellatarda)、迟缓埃格特菌(Eggerthella lenta)、塔一艾森伯格氏菌(Eisenbergiella tayi)、马赛Enorma菌(Enorma massiliensis)、产气肠杆菌(Enterobacter aerogenes)、阿氏肠杆菌(Enterobacter asburiae)、生癌肠杆菌(Enterobacter cancerogenus)、阴沟肠杆菌、马赛肠杆菌(Enterobacter massiliensis)、铅黄肠球菌(Enterococcus casseliflavus)、耐久肠球菌(Enterococcus durans)、粪肠球菌、屎肠球菌、黄色肠球菌(Enterococcusflavescens)、鹑鸡肠球菌(Enterococcus gallinarum)、肠球菌属物种(Enterococcussp.)、黑色肠弧菌(Enterovibrio nigricans)、多枝丹毒荚膜菌(Erysipelatoclostridiumramosum)、大肠杆菌、埃希氏菌属物种(Escherichia sp.)、两形真杆菌(Eubacteriumbiforme)、细长真杆菌(Eubacterium dolichum)、霍氏真杆菌(Eubacterium hallii)、粘液真杆菌(Eubacterium limosum)、细枝真杆菌(Eubacterium ramulus)、直肠真杆菌(Eubacterium rectale)、惰性真杆菌(Eubacterium siraeum)、凸腹真杆菌(Eubacteriumventriosum)、海微小杆菌(Exiguobacterium marinum)、水域微小杆菌(Exiguobacteriumundae)、cf栖粪杆菌(Faecalibacterium cf)、普氏栖粪杆菌(Faecalibacteriumprausnitzii)、圆柱状屎豆菌(Faecalitalea cylindroides)、巴氏铁单胞菌(Ferrimonasbalearica)、大芬戈尔德菌(Finegoldia magna)、大田黄杆菌(Flavobacteriumdaejeonense)、普氏黄杆菌(Flavonifractor plautii)、解糖纺锤链杆菌(Fusicatenibacter saccharivorans)、刚氏梭杆菌(Fusobacterium gonidiaformans)、死亡梭杆菌(Fusobacterium mortiferum)、坏死梭杆菌(Fusobacterium necrophorum)、具核梭杆菌、牙周梭杆菌(Fusobacterium periodonticum)、梭杆菌属物种(Fusobacteriumsp.)、溃疡梭杆菌(Fusobacterium ulcerans)、变异梭杆菌(Fusobacterium varium)、鸭源鸡杆菌(Gallibacterium anatis)、甲酸芽殖菌(Gemmiger formicilis)、帕梅莱亚戈登氏杆菌(Gordonibacter pamelaeae)、蜂房哈夫尼菌(Hafnia alvei)、胆汁螺杆菌(Helicobacter bilis)、胆汁螺杆菌(Helicobacter bills)、加拿大螺杆菌(Helicobactercanadensis)、犬螺杆菌(Helicobacter canis)、同性恋螺杆菌(Helicobacter cinaedi)、猕猴螺杆菌(Helicobacter macacae)、帕美特螺杆菌(Helicobacter pametensis)、幼禽螺杆菌(Helicobacter pullorum)、幽门螺杆菌、啮齿类螺杆菌(Helicobacter rodentium)、温哈门螺杆菌(Helicobacter winghamensis)、马赛草螺菌(Herbaspirillummassiliense)、双形霍尔德曼氏菌(Holdemanella biformis)、丝状霍尔德曼氏菌(Holdemania fdiformis)、细条霍尔德曼氏菌(Holdemania filiformis)、马赛霍尔德曼氏菌(Holdemania massiliensis)、细条霍尔德曼氏菌(Holdemania filiformis)、哈瑟瓦伊菌(hungatella hathewayi)、巴特勒肠杆菌(Intestinibacter bartlettii)、产丁酸肠杆菌(Intestinimonas butyriciproducens)、产酸克雷伯氏菌(Klebsiella oxytoca)、肺炎克雷伯氏菌、马赛库特氏菌(Kurthia massiliensis)、裂果胶毛螺菌(Lachnospirapectinoschiza)、嗜酸乳杆菌、解淀粉乳杆菌(Lactobacillus amylolyticus)、动物乳杆菌(Lactobacillus animalis)、胃窦乳杆菌(Lactobacillus antri)、短乳杆菌(Lactobacillus brevis)、布氏乳杆菌(Lactobacillus buchneri)、干酪乳杆菌、弯曲乳杆菌(Lactobacillus curvatus)、德氏乳杆菌(Lactobacillus delbrueckii)、发酵乳杆菌(Lactobacillus fermentum)、格氏乳杆菌(Lactobacillus gasseri)、瑞士乳杆菌(Lactobacillus helveticus)、希氏乳杆菌、惰性乳杆菌(Lactobacillus iners)、肠道乳杆菌(Lactobacillus intestinalis)、约氏乳杆菌(Lactobacillus johnsonii)、鼠乳杆菌(Lactobacillus murinus)、副干酪乳杆菌(Lactobacillus paracasei)、植物乳杆菌、罗伊氏乳杆菌(Lactobacillus reuteri)、鼠李糖乳杆菌、瘤胃乳杆菌(Lactobacillusruminis)、清酒乳杆菌(Lactobacillus sakei)、唾液乳杆菌(Lactobacillussalivarius)、厄尔纳拉乳杆菌(Lactobacillus ultunensis)、阴道乳杆菌(Lactobacillusvaginalis)、植物乳杆菌亚种(Lactobacillus plantarum subsp.)、肠膜明串珠菌(Leuconostoc mesenteroides)、假肠膜明串珠菌(Leuconostoc pseudomesenteroides)、灰色李斯特菌(Listeria grayi)、英诺克李斯特菌(Listeria innocua)、肉芽肿性曼氏杆菌(Mannheimia granulomatis)、需甲酸盐马文布莱恩特氏菌(Marvinbryantiaformatexigens)、单形巨单胞菌(Megamonas funiformis)、极巨巨单胞菌(Megamonashypermegale)、史氏甲烷短杆菌(Methanobrevibacter smithii)、史氏甲烷短杆菌菌Fl(Methanobrevibacter smithii Fl)、藤黄微球菌、好氧反硝化微枝杆菌(Microvirgulaaerodenitrificans)、贾氏光冈菌(Mitsuokella jalaludinii)、多酸光冈菌(Mitsuokellamultacida)、柔膜细菌目细菌(Mollicutes bacterium)、肠Murimonas菌(Murimonasintestini)、猕猴奈瑟菌(Neisseria macacae)、嗜碱腈基降解菌(Nitriliruptoralkaliphilus)、马赛海洋芽孢杆菌(Oceanobacillus massiliensis)、黑臭杆菌(Odoribacter laneus)、内脏臭杆菌(Odoribacter splanchnicus)、鼻气管炎鸟杆菌(Ornithobacterium rhinotracheale)、产甲酸草酸杆菌(Oxalobacter formigenes)、巴伦氏类芽孢杆菌(Paenibacillus barengoltzii)、解几丁质类芽孢杆菌(Paenibacilluschitinolyticus)、灿烂类芽孢杆菌(Paenibacillus lautus)、本部类芽孢杆菌(Paenibacillus motobuensis)、塞内加尔类芽孢杆菌(Paenibacillus senegalensis)、泥类芽孢八叠球菌(Paenisporosarcina quisquiliarum)、狄氏副拟杆菌(Parabacteroidesdistasonis)、戈氏副拟杆菌(Parabacteroides goldsteinii)、戈登副拟杆菌(Parabacteroides gordonii)、约氏副拟杆菌(Parabacteroides johnsonii)、粪副拟杆菌(Parabacteroides merdae)、嗜木聚糖帕拉普氏菌(Paraprevotella xylaniphila)、毛螺旋杆菌(Parasutterella excrementihominis)、微小微单胞菌、乳酸片球菌(Pediococcusacidilactici)、艰难艰难梭菌(Peptoclostridium difficile)、哈雷嗜胨菌(Peptoniphilus harei)、肥胖嗜胨菌(Peptoniphilus obesi)、塞内加尔嗜胨菌(Peptoniphilus senegalensis)、蒂莫内嗜胨菌(Peptoniphilus timonensis)、琥珀酸考拉杆菌(Phascolarctobacterium succinatutens)、不解糖卟啉单胞菌(Porphyromonasasaccharolytica)、上野卟啉单胞菌(Porphyromonas uenonis)、巴氏普雷沃氏菌(Prevotella baroniae)、二路普雷沃氏菌(Prevotella bivia)、粪便普雷沃氏菌(Prevotella copri)、牙普雷沃氏菌(Prevotella dentalis)、彩虹普雷沃氏菌(Prevotella micans)、食多糖普雷沃氏菌(Prevotella multisaccharivorax)、口腔普雷沃氏菌(Prevotella oralis)、唾液普雷沃氏菌(Prevotella salivae)、粪普雷沃氏菌(Prevotella stercorea)、真口腔普雷沃氏菌(Prevotella veroralis)、痤疮丙酸杆菌、贪婪丙酸杆菌(Propionibacterium avidum)、费氏丙酸杆菌、嗜淋巴丙酸微菌(Propionimicrobium lymphophilum)、奇异变形杆菌(Proteus mirabilis)、彭氏变形杆菌(Proteus penneri)ATCC、产碱普罗威登斯菌(Providencia alcalifaciens)、雷氏普罗威登斯菌(Providencia rettgeri)、拉氏普罗威登斯菌(Providencia rustigianii)、斯氏普罗威登斯菌(Providencia stuartii)、多毛假黄杆菌(Pseudoflavonifractorcapillosus)、铜绿假单胞菌(Pseudomonas aeruginosa)、浅黄色假单胞菌(Pseudomonasluteola)、皮氏罗尔斯通氏菌(Ralstonia pickettii)、透明莱茵海默氏菌(Rheinheimeraperlucida)、德克萨斯莱茵海默氏菌(Rheinheimera texasensis)、鸽里默菌(Riemerellacolumbina)、象牙海岸罗姆布茨菌(Romboutsia lituseburensis)、粪便罗氏菌(Roseburiafaecis)、肠道罗氏菌(Roseburia intestinalis)、食葡糖罗氏菌(Roseburiainulinivorans)、双环瘤胃球菌(Ruminococcus bicirculans)、布氏瘤胃球菌(Ruminococcus bromii)、伶俐瘤胃球菌(Ruminococcus callidus)、查帕西斯瘤胃球菌(Ruminococcus champanellensis)、粪便瘤胃球菌(Ruminococcus faecis)、活泼瘤胃球菌(Ruminococcus gnavus)、酸奶瘤胃球菌(Ruminococcus lactaris)、卵形瘤胃球菌(Ruminococcus obeum)、瘤胃球菌属物种(Ruminococcus sp)、瘤胃球菌属物种、扭链瘤胃球菌(Ruminococcus torques)、心室八叠球菌(Sarcina ventriculi)、肠道塞利单胞菌(Sellimonas intestinalis)、塞内加尔厌氧菌(Senegalimassilia anaerobia)、宋内志贺氏菌、梨形斯奈克氏菌(Slackia piriformis)、表皮葡萄球菌、缓慢葡萄球菌(Staphylococcus lentus)、尼泊尔葡萄球菌(Staphylococcus nepalensis)、假中间葡萄球菌(Staphylococcus pseudintermedius)、木糖葡萄球菌(Staphylococcus xylosus)、嗜麦芽窄食单胞菌(Stenotrophomonas maltophilia)、无乳链球菌、咽峡炎链球菌(Streptococcus anginosus)、澳大利亚链球菌(Streptococcus australis)、家马链球菌(Streptococcus caballi)、河狸链球菌(Streptococcus castoreus)、负鼠链球菌(Streptococcus didelphis)、马肠链球菌(Streptococcus equinus)、戈登链球菌(Streptococcus gordonii)、亨利链球菌(Streptococcus henryi)、猪阴道链球菌(Streptococcus hyovaginalis)、婴幼儿链球菌(Streptococcus infantarius)、婴儿链球菌(Streptococcus infantis)、黄体链球菌(Streptococcus lutetiensis)、沙鼠链球菌(Streptococcus merionis)、缓症链球菌(Streptococcus mitis)、变异链球菌、口腔链球菌(Streptococcus oralis)、绵羊链球菌(Streptococcus ovis)、副血链球菌(Streptococcus parasanguinis)、多内脏链球菌(Streptococcus plurextorum)、猪源链球菌(Streptococcus porci)、化脓性链球菌、唾液链球菌(Streptococcus salivarius)、表兄链球菌(Streptococcus sobrinus)、嗜热链球菌(Streptococcus thermophilus)、托尔豪特链球菌(Streptococcus thoraltensis)、白色链霉菌(Streptomyces albus)、变形罕见小球菌(Subdoligranulum variabile)、希贝琥珀酸单胞菌(Succinatimonashippei)、Sutterella parvirubra、华德萨特氏菌(Sutterella wadsworthensis)、甘油利用泰瑞抱子菌(Terrisporobacter glycolicus)、马犹姆贝泰瑞抱子菌(Terrisporobactermayombei)、食有机物深海芽孢杆菌(Thalassobacillus devorans)、塞内加尔蒂莫内菌(Timonella senegalensis)、血尿杆菌(Turicibacter sanguinis)、未知属物种(unknownsp)、未知属物种、寒武弯曲短杆菌(Varibaculum cambriense)、非典型韦荣菌(Veillonella atypica)、殊异韦荣菌(Veillonella dispar)、小韦荣菌(Veillonellaparvula)、辛辛那提弧菌(Vibrio cincinnatiensis)、需盐枝芽孢杆菌(Virgibacillussalexigens)和类肠膜魏斯氏菌(Weissella paramesenteroides)。
在其他实施方案中,目标细菌细胞为皮肤微生物群中常见的那些,并且非限制性地为法氏醋酸杆菌(Acetobacter farinalis)、苹果醋酸杆菌(Acetobacter malorum)、奥尔良醋酸杆菌(Acetobacter orleanensis)、Acetobacter sicerae、Achromobacteranxifer、反硝化无色杆菌(Achromobacter denitrificans)、马氏无色杆菌(Achromobacter marplatensis)、少见无色杆菌(Achromobacter spanius)、木糖氧化无色杆菌木糖氧化亚种(Achromobacter xylosoxidans subsp.xylosoxidans)、魔芋噬酸菌(Acidovorax konjaci)、根噬酸菌(Acidovorax radicis)、约氏不动杆菌(Acinetobacterjohnsonii)、柠檬马杜拉放线菌(Actinomadura citrea)、青蓝马杜拉放线菌(Actinomadura coerulea)、纤维状马杜拉放线菌(Actinomadura fibrosa)、微暗黄马杜拉放线菌(Actinomadura fulvescens)、Actinomadura jiaoheensis、藤黄荧光马杜拉放线菌(Actinomadura luteofluorescens)、墨西哥马杜拉放线菌(Actinomadura mexicana)、产亚硝酸马杜拉放线菌(Actinomadura nitritigenes)、疣孢马杜拉放线菌(Actinomaduraverrucosospora)、尤马马杜拉放线菌(Actinomadura yumaensis)、溶齿放线菌、非典型放线链孢菌(Actinomycetospora atypica)、Actinomycetospora corticicola、嗜根放线链孢菌(Actinomycetospora rhizophila)、利尻放线链孢菌(Actinomycetosporarishiriensis)、澳洲气单胞菌(Aeromonas australiensis)、兽气单胞菌(Aeromonasbestiarum)、双壳气单胞菌(Aeromonas bivalvium)、鳗鱼气单胞菌(Aeromonasencheleia)、嗜矿泉气单胞菌(Aeromonas eucrenophila)、嗜水气单胞菌嗜水亚种(Aeromonas hydrophila subsp.hydrophila)、居鱼气单胞菌(Aeromonas piscicola)、波氏气单胞菌(Aeromonas popoffii)、瑞沃利气单胞菌(Aeromonas rivuli)、杀鲑气单胞菌溶果胶亚种(Aeromonas salmonicida subsp.pectinolytica)、杀鲑气单胞菌史氏亚种(Aeromonas salmonicida subsp.smithia)、Amaricoccus kaplicensis、维罗纳下水道球菌(Amaricoccus veronensis)、阿加诺氨基杆菌(Aminobacter aganoensis)、环孢素氨基杆菌(Aminobacter ciceronei)、Aminobacter lissarensis、新泻氨基杆菌(Aminobacterniigataensis)、多形弯杆菌(Ancylobacter polymorphus)、黄热无氧芽抱杆菌云南亚种(Anoxybacillus flavithermus subsp.yunnanensis)、气生水微菌(Aquamicrobiumaerolatum)、过渡原囊菌(Archangium gephyra)、过渡原囊菌(Archangium gephyra)、小原囊菌(Archangium minus)、紫原囊菌(Archangium violaceum)、粘节杆菌(Arthrobacterviscosus)、炭疽芽孢杆菌、澳洲芽孢杆菌(Bacillus australimaris)、钻特省芽孢杆菌(Bacillus drentensis)、蕈状芽孢杆菌(Bacillus mycoides)、假蕈状芽孢杆菌(Bacilluspseudomycoides)、短小芽孢杆菌(Bacillus pumilus)、沙福芽孢杆菌(Bacillussafensis)、死谷芽孢杆菌(Bacillus vallismortis)、硫氧化博斯氏菌(Boseathiooxidans)、黄淮海慢生根瘤菌(Bradyrhizobium huanghuaihaiense)、大豆慢生根瘤菌(Bradyrhizobium japonicum)、橙色短波单胞菌(Brevundimonas aurantiaca)、中间短波单胞菌(Brevundimonas intermedia)、Burkholderia aspalathi、Burkholderia choica、Burkholderia cordobensis、广布伯克霍尔德氏菌(Burkholderia diffusa)、Burkholderia insulsa、鹿藿伯克霍尔德氏菌(Burkholderia rhynchosiae)、土伯克霍尔德氏菌(Burkholderia terrestris)、Burkholderia udeis、加文布蒂亚克斯菌(Buttiauxella gaviniae)、土地污泥单胞菌(Caenimonas terrae)、牙龈二氧化碳嗜纤维菌(Capnocytophaga gingivalis)、鼎湖山噬几丁质菌(Chitinophaga dinghuensis)、粘金黄杆菌(Chryseobacterium gleum)、绿地金黄杆菌(Chryseobacterium greenlandense)、济州岛金黄杆菌(Chryseobacterium jejuense)、鱼金黄杆菌(Chryseobacteriumpiscium)、沉积物金黄杆菌(Chryseobacterium sediminis)、Chryseobacterium tructae、解脲金黄杆菌(Chryseobacterium ureilyticum)、越南金黄杆菌(Chryseobacteriumvietnamense)、拥挤棒状杆菌(Corynebacterium accolens)、非发酵棒状杆菌嗜脂亚种(Corynebacterium afermentans subsp.lipophilum)、微小棒状杆菌(Corynebacteriumminutissimum)、松兹瓦尔棒状杆菌(Corynebacterium sundsvallense)、耐金属贪铜菌(Cupriavidus metallidurans)、南通嗜铜菌(Cupriavidus nantongensis)、杀虫贪铜菌(Cupriavidus necator)、Cupriavidus pampae、涟川贪铜菌(Cupriavidusyeoncheonensis)、萎蔫短小杆菌(Curtobacterium flaccumfaciens)、epidermidihirudinis德沃斯氏菌(Devosia epidermidihirudinis)、核黄素德沃斯氏菌(Devosia riboflavina)、核黄素德沃斯氏菌(Devosia riboflavina)、米黄色杆菌(Diaphorobacter oryzae)、嗜碱迪茨氏菌(Dietzia psychralcaliphila)、粘着剑菌(Ensifer adhaerens)、美洲剑菌(Ensifer americanus)、病臭肠球菌(Enterococcusmalodoratus)、假鸟肠球菌(Enterococcus pseudoavium)、维埃基肠球菌(Enterococcusviikkiensis)、香坊肠球菌(Enterococcus xiangfangensis)、大黄欧文氏菌(Erwiniarhapontici)、耐盐错玫杆菌(Falsirhodobacter halotolerans)、Flavobacteriumaraucananum、冷海水黄杆菌(Flavobacterium frigidimaris)、弗氏葡糖杆菌(Gluconobacter frateurii)、泰国葡糖杆菌(Gluconobacter thailandicus)、食烷烃戈登氏菌(Gordonia alkanivorans)、海水盐单胞菌(Halomonas aquamarina)、轴向海山盐单胞菌(Halomonas axialensis)、南方盐单胞菌(Halomonas meridiana)、橄榄油盐单胞菌(Halomonas olivaria)、松嫩盐单胞菌(Halomonas songnenensis)、变异盐单胞菌(Halomonas variabilis)、氯酚草螺菌(Herbaspirillum chlorophenolicum)、弗赖森草螺菌(Herbaspirillum frisingense)、Herbaspirillum hiltneri、Herbaspirillumhuttiense subsp.putei、葡萄牙草螺菌(Herbaspirillum lusitanum)、丰蒂卡赫敏单胞菌(Herminiimonas fonticola)、中间氢噬胞菌(Hydrogenophaga intermedia)、类黄色氢噬胞菌(Hydrogenophaga pseudoflava)、产酸克雷伯氏菌、蔗糖小迫氏菌(Kosakoniasacchari)、德氏乳杆菌保加利亚亚种(Lactobacillus delbrueckii subsp.bulgaricus)、谦逊乳杆菌(Lactobacillus modestisalitolerans)、植物乳杆菌阿根图拉特亚种(Lactobacillus plantarum subsp.argentoratensis)、香坊乳杆菌(Lactobacillusxiangfangensis)、罗塞莉氏列契瓦尼尔氏菌(Lechevalieria roselyniae)、微白伦茨氏菌(Lentzea albida)、加利福尼亚伦茨氏菌(Lentzea californiensis)、肉质明串珠菌(Leuconostoc carnosum)、柠檬色明串珠菌(Leuconostoc citreum)、Leuconostocgelidum subsp.gasicomitatum、肠膜明串珠菌suionicum亚种(Leuconostocmesenteroides subsp.suionicum)、潮汐藤黄色单胞菌(Luteimonas aestuarii)、抗生物溶杆菌(Lysobacter antibioticus)、韩国溶杆菌(Lysobacter koreensis)、水稻溶杆菌(Lysobacter oryzae)、莫斯科磁螺菌(Magnetospirillum moscoviense)、Marinomonasalcarazii、普利莫耶卤地海单胞菌(Marinomonas primoryensis)、金色马赛菌(Massiliaaurea)、济州岛马赛菌(Massilia jejuensis)、京氏马赛菌(Massilia kyonggiensis)、蒂莫内马赛菌(Massilia timonae)、金合欢中慢生根瘤菌(Mesorhizobium acaciae)、庆笙中慢生根瘤菌(Mesorhizobium qingshengii)、少年中慢生根瘤菌(Mesorhizobiumshonense)、单色甲基杆菌(Methylobacterium haplocladii)、悬铃木甲基杆菌(Methylobacterium platani)、Methylobacterium pseudosasicola、Methylobacteriumzatmanii、氧化微杆菌(Microbacterium oxydan)、猜也蓬府小单胞菌(Micromonosporachaiyaphumensis)、青铜小单孢菌(Micromonospora chalcea)、柠檬小单孢菌(Micromonospora citrea)、髋小单孢菌(Micromonospora coxensis)、棘孢小单孢菌(Micromonospora echinofusca)、嗜盐小单孢菌(Micromonospora halophytica)、Micromonospora kangleipakensis、海栖小单胞(Micromonospora maritima)、黑色小单孢菌(Micromonospora nigra)、绛红产色小单孢菌(Micromonospora purpureochromogene)、根际小单孢菌(Micromonospora rhizosphaerae)、圣莱西小单孢菌(Micromonosporasaelicesensis)、地下微枝形杆菌(Microvirga subterranea)、赞比亚微枝形杆菌(Microvirga zambiensis)、蜂房分枝杆菌(Mycobacterium alvei)、鸟分枝杆菌森林土壤亚种(Mycobacterium avium subsp.silvaticum)、哥伦比亚分枝杆菌(Mycobacteriumcolombiense)、概念分枝杆菌(Mycobacterium conceptionense)、概念分枝杆菌(Mycobacterium conceptionense)、鼻疽分枝杆菌(Mycobacterium farcinogenes)、偶发分枝杆菌偶发亚种(Mycobacterium fortuitum subsp.fortuitum)、古地分枝杆菌(Mycobacterium goodii)、Mycobacterium insubricum、Mycobacterium llatzerense、新金色分枝杆菌(Mycobacterium neoaurum)、新奥尔良分枝杆菌(Mycobacteriumneworleansense)、奧布分枝杆菌(Mycobacterium obuense)、外来分枝杆菌(Mycobacterium peregrinum)、Mycobacterium saopaulense、败血症分枝杆菌(Mycobacterium septicum)、赛特分枝杆菌(Mycobacterium setense)、耻垢分枝杆菌(Mycobacterium smegmatis)、微黄奈瑟菌(Neisseria subflava)、丽江诺卡氏菌(Nocardia lijiangensis)、泰国诺卡氏菌(Nocardia thailandica)、吧哈伊姆新鞘氨醇菌(Novosphingobium barchaimii)、棉花新鞘氨醇菌(Novosphingobiumlindaniclasticum)、棉花新鞘氨醇菌(Novosphingobium lindaniclasticum)、马图拉新鞘氨醇菌(Novosphingobium mathurense)、假格里尼翁苍白杆菌(Ochrobactrumpseudogrignonense)、Oxalicibacterium solurbis、格氏副伯克霍尔德氏菌(Paraburkholderia glathei)、土地副伯克霍尔德氏菌(Paraburkholderia humi)、苯那嗪副伯克霍尔德氏菌(Paraburkholderia phenazinium)、固植副伯克霍尔德氏菌(Paraburkholderia phytofirmans)、Paraburkholderia sordidicola、栖土副伯克霍尔德氏菌(Paraburkholderia terricola)、Paraburkholderia xenovorans、Paracoccuslaeviglucosivorans、人参沼杆菌(Patulibacter ginsengiterrae)、红色多形孢菌(Polymorphospora rubra)、泳池产卟啉杆菌(Porphyrobacter colymbi)、空肠普雷沃氏菌(Prevotella jejuni)、产黑素普雷沃氏菌(Prevotella melaninogenica)、痤疮丙酸杆菌长亚种(Propionibacterium acnes subsp.elongatum)、普通变形杆菌(Proteusvulgaris)、拉氏普罗威登斯菌、食琼脂假交替单胞菌(Pseudoalteromonas agarivorans)、大西洋假交替单胞菌(Pseudoalteromonas atlantica)、巴拉圭假交替单胞菌(Pseudoalteromonas paragorgicola)、无脾假单胞菌(Pseudomonas asplenii)、亚洲假单胞菌(Pseudomonas asuensis)、食苯假单胞菌(Pseudomonas benzenivorans)、大麻假单胞菌(Pseudomonas cannabina)、青紫菖假单胞菌(Pseudomonas cissicola)、结冰假单胞菌(Pseudomonas congelans)、康氏假单胞菌(Pseudomonas costantinii)、天仙果假单胞菌(Pseudomonas ficuserectae)、弗雷德里克斯堡假单胞菌(Pseudomonasfrederiksbergensis)、革兰氏假单胞菌(Pseudomonas graminis)、杰氏假单胞菌(Pseudomonas jessenii)、韩国假单胞菌(Pseudomonas koreensis)、韩国假单胞菌(Pseudomonas koreensis)、昆明假单胞菌(Pseudomonas kunmingensis)、边缘假单胞菌(Pseudomonas marginalis)、霉味假单胞菌(Pseudomonas mucidolens)、人参假单胞菌(Pseudomonas panacis)、杀香鱼假单胞菌(Pseudomonas plecoglossicida)、草假单胞菌(Pseudomonas poae)、假产碱假单胞菌(Pseudomonas pseudoalcaligenes)、恶臭假单胞菌(Pseudomonas putida)、瑞士假单胞菌(Pseudomonas reinekei)、根际假单胞菌(Pseudomonas rhizosphaerae)、Pseudomonas seleniipraecipitans、阴城假单胞菌(Pseudomonas umsongensis)、肇东假单胞菌(Pseudomonas zhaodongensis)、嗜丙氨酸假诺卡氏菌(Pseudonocardia alaniniphila)、氧化氨假诺卡氏菌(Pseudonocardiaammonioxydans)、自养假诺卡氏菌(Pseudonocardia autotrophica)、公州假诺卡氏菌(Pseudonocardia kongjuensis)、云南假诺卡氏菌(Pseudonocardia yunnanensis)、土壤假红育菌(Pseudorhodoferax soli)、大田假黄单胞菌(Pseudoxanthomonasdaejeonensis)、印度假黄单胞菌(Pseudoxanthomonas indica)、高雄假黄单胞菌(Pseudoxanthomonas kaohsiungensis)、水嗜冷杆菌(Psychrobacter aquaticus)、北极嗜冷杆菌(Psychrobacter arcticus)、速生嗜冷杆菌(Psychrobacter celer)、居海嗜冷杆菌(Psychrobacter marincola)、海雪嗜冷杆菌(Psychrobacter nivimaris)、鄂霍次克海嗜冷杆菌(Psychrobacter okhotskensis)、鄂霍次克海嗜冷杆菌(Psychrobacterokhotskensis)、Psychrobacter piscatorii、肺嗜冷杆菌(Psychrobacter pulmonis)、人参皂甙变形杆菌(Ramlibacter ginsenosidimutans)、日本莱茵海默氏菌(Rheinheimerajaponica)、muenzenbergensis莱茵海默氏菌(Rheinheimera muenzenbergensis)、土壤莱茵海默氏菌(Rheinheimera soli)、唐山莱茵海默氏菌(Rheinheimera tangshanensis)、德克萨斯莱茵海默氏菌(Rheinheimera texasensis)、罗非鱼莱茵海默氏菌(Rheinheimeratilapiae)、阿拉米根瘤菌(Rhizobium alamii)、Rhizobium azibense、Rhizobium binae、大田根瘤菌(Rhizobium daejeonense)、内生根瘤菌(Rhizobium endophyticum)、埃特里根瘤菌(Rhizobium etli)、蚕豆根瘤菌(Rhizobium fabae)、Rhizobium freirei、高卢根瘤菌(Rhizobium gallicum)、黄土根瘤菌(Rhizobium loessense)、Rhizobiumsophoriradicis、泰白山根瘤菌(Rhizobium taibaishanense)、河谷根瘤菌(Rhizobiumvallis)、豇豆根瘤菌(Rhizobium vignae)、豇豆根瘤菌(Rhizobium vignae)、杨凌根瘤菌(Rhizobium yanglingense)、拜科罗尔红球菌(Rhodococcus baikonurensis)、Rhodococcus enclensis、Rhodoferax saidenbachensis、加拿大立克次体(Rickettsiacanadensis)、黑龙江立克次体(Rickettsia heilongjiangensis)、弗诺立克次体(Rickettsia honei)、拉欧蒂立克次体(Rickettsia raoultii)、水生玫瑰色半光合菌(Roseateles aquatilis)、水生玫瑰色半光合菌(Roseateles aquatilis)、肠道沙门氏菌萨拉姆亚种(Salmonella enterica subsp.salamae)、无花果沙雷氏菌(Serratiaficaria)、鼠耳蝠沙雷氏菌(Serratia myotis)、血管性沙雷氏菌(Serratiavespertilionis)、潮汐希瓦氏菌(Shewanella aestuarii)、脱色希瓦氏菌(Shewanelladecolorationis)、阿见鞘氨醇菌(Sphingobium amiense)、Sphingobium baderi、Sphingobium barthaii、氯芬鞘氨醇菌(Sphingobium chlorophenolicum)、铜抗性鞘氨醇菌(Sphingobium cupriresistens)、捷克鞘氨醇菌(Sphingobium czechense)、飞鱼鞘氨醇菌(Sphingobium fuliginis)、印度洋鞘氨醇菌(Sphingobium indicum)、印度洋鞘氨醇菌(Sphingobium indicum)、大豆鞘氨醇菌(Sphingobium japonicum)、乳糖同化鞘氨醇菌(Sphingobium lactosutens)、独岛鞘氨醇单胞菌(Sphingomonas dokdonensis)、伪血鞘氨醇单胞菌(Sphingomonas pseudosanguinis)、智利鞘氨醇盒菌(Sphingopyxischilensis)、弗莱堡鞘氨醇盒菌(Sphingopyxis fribergensis)、细粒鞘氨醇盒菌(Sphingopyxis granuli)、印度鞘氨醇盒菌(Sphingopyxis indica)、威特弗拉里亚鞘氨醇盒菌(Sphingopyxis witflariensis)、Staphylococcus agnetis、金黄色葡萄球菌金黄色亚种(Staphylococcus aureus subsp.aureus)、表皮葡萄球菌、人葡萄球菌新霉素败血症亚种(Staphylococcus hominis subsp.novobiosepticus)、尼泊尔葡萄球菌、腐生葡萄球菌牛亚种(Staphylococcus saprophyticus subsp.bovis)、松鼠葡萄球菌肉亚种(Staphylococcus sciuri subsp.carnaticus)、黑蓝链霉菌(Streptomycescaeruleatus)、加那利链霉菌(Streptomyces canarius)、卡波姆链霉菌(Streptomycescapoamus)、高加索链霉菌(Streptomyces ciscaucasicus)、灰锈赤链霉菌(Streptomycesgriseorubiginosus)、橄榄绿链霉菌(Streptomyces olivaceoviridis)、Streptomycespanaciradicis、暗绛红链霉菌(Streptomyces phaeopurpureus)、假委内瑞拉链霉菌(Streptomyces pseudovenezuelae)、抗霉素链霉菌(Streptomyces resistomycificus)、沉积物谭天伟氏菌(Tianweitania sediminis)、微变冢村氏菌(Tsukamurellapaurometabola)、广西贪食菌(Variovorax guangxiensis)、嗜碱福格斯氏菌(Vogesellaalkaliphila)、树木黄单胞菌(Xanthomonas arboricola)、地毯草黄单胞菌(Xanthomonasaxonopodis)、木薯黄单胞菌(Xanthomonas cassavae)、黄瓜黄单胞菌(Xanthomonascucurbitae)、蓟黄单胞菌(Xanthomonas cynarae)、真泡黄单胞菌(Xanthomonaseuvesicatoria)、草莓黄单胞菌(Xanthomonas fragariae)、加氏黄单胞菌(Xanthomonasgardneri)、产黄单胞菌(Xanthomonas perforans)、豌豆黄单胞菌(Xanthomonas pisi)、白杨黄单胞菌(Xanthomonas populi)、Xanthomonas vasicola、气生嗜异生质菌(Xenophilusaerolatus)、Yersinia nurmii、软弱贫养菌(Abiotrophia defectiva)、解氨酸球菌(Acidocella aminolytica)、广东不动杆菌(Acinetobacter guangdongensis)、微小不动杆菌(Acinetobacter parvus)、抗辐射不动杆菌(Acinetobacter radioresistens)、土壤不动杆菌(Acinetobacter soli)、变异不动杆菌(Acinetobacter variabilis)、加地夫放线菌(Actinomyces cardiffensis)、牙放线菌(Actinomyces dentalis)、欧洲放线菌(Actinomyces europaeus)、戈氏放线菌(Actinomyces gerencseriae)、革氏放线菌(Actinomyces graevenitzii)、鲍放线菌(Actinomyces haliotis)、约氏放线菌(Actinomyces johnsonii)、马赛放线菌(Actinomyces massiliensis)、麦氏放线菌(Actinomyces meyeri)、麦氏放线菌(Actinomyces meyeri)、内氏放线菌、纽氏放线菌无硝亚种(Actinomyces neuii subsp.anitratus)、溶齿放线菌、口腔放线菌(Actinomycesoris)、苏黎世放线菌(Actinomyces turicensis)、Actinomycetospora corticicola、斯氏放线杆菌(Actinotignum schaalii)、柯氏气球菌(Aerococcus christensenii)、脲气球菌(Aerococcus urinae)、黄色气微菌(Aeromicrobium flavum)、马赛气微菌(Aeromicrobiummassiliense)、耽罗国气微菌(Aeromicrobium tamlense)、沙玛娜气单胞菌(Aeromonassharmana)、嗜沫凝聚杆菌(Aggregatibacter aphrophilus)、惰性凝聚杆菌(Aggregatibacter segnis)、光神农球菌(Agrococcus baldri)、食甲醛白杆菌(Albibacter methylovorans)、粪产碱菌粪亚种(Alcaligenes faecalissubsp.faecalis)、拉氏噬冷菌(Algoriphagus ratkowskyi)、橄榄渣碱小杆菌(Alkalibacterium olivapovliticus)、海面群落碱小杆菌(Alkalibacterium pelagium)、海面群落碱小杆菌(Alkalibacterium pelagium)、拉瓦异普雷沃氏菌(Alloprevotellarava)、耐金属林杆菌(Alsobacter metallidurans)、Amaricoccus kaplicensis、维罗纳下水道球菌(Amaricoccus veronensis)、产氢厌氧球菌、溶乳厌氧球菌(Anaerococcuslactolyticus)、莫道克厌氧球菌(Anaerococcus murdochii)、八度厌氧球菌(Anaerococcus octavius)、普氏厌氧球菌、阴道厌氧球菌(Anaerococcus vaginalis)、柠檬水杆菌(Aquabacterium citratiphilum)、油水杆菌(Aquabacterium olei)、油水杆菌(Aquabacterium olei)、微小水杆菌(Aquabacterium parvum)、解叔丁醇水居菌(Aquincola tertiaricarbonis)、蛤仔弓形杆菌(Arcobacter venerupis)、博利氏砷球菌(Arsenicicoccus bolidensis)、Arthrobacter russicus、离中不粘柄菌(Asticcacaulisexcentricus)、Atopobium deltae、极小奇异菌(Atopobium parvulum)、龈裂奇异菌(Atopobium rimae)、阴道奇异菌(Atopobium vaginae)、阿尔塔米拉金色单胞菌(Aureimonas altamirensis)、红素金色单胞菌(Aureimonas rubiginis)、稻曲菌(Azospira oryzae)、稻固氮螺菌(Azospirillum oryzae)、环状芽胞杆菌(Bacilluscirculans)、钻特省芽孢杆菌(Bacillus drentensis)、苛求芽孢杆菌(Bacillusfastidiosus)、列城芽孢杆菌(Bacillus lehensis)、海洋沉积物芽孢杆菌(Bacillusoceanisediminis)、根际芽孢杆菌(Bacillus rhizosphaerae)、斯托普噬菌弧菌(Bacteriovorax stolpii)、凝结拟杆菌(Bacteroides coagulans)、多氏拟杆菌、脆弱拟杆菌、卵形拟杆菌、粪便拟杆菌、单形拟杆菌、普通拟杆菌、噬菌蛭弧菌(Bdellovibriobacteriovorus)、外来蛭弧菌(Bdellovibrio exovorus)、摩押别尔纳普氏菌(Belnapiamoabensis)、土壤别尔纳普氏菌(Belnapia soli)、汉氏布劳特氏菌、卵形布劳特氏菌、韦氏布劳特氏菌、山黧豆博斯氏菌(Bosea lathyri)、柠檬色小短杆菌(Brachybacteriumfresconis)、小鼠小短杆菌(Brachybacterium muris)、解氨短杆菌(Brevibacteriumammoniilyticum)、干酪短杆菌(Brevibacterium casei)、表皮短杆菌(Brevibacteriumepidermidis)、碘短杆菌(Brevibacterium iodinum)、黄腐短杆菌(Brevibacteriumluteolum)、少食短杆菌(Brevibacterium paucivorans)、松蛾短杆菌(Brevibacteriumpityocampae)、血红短杆菌(Brevibacterium sanguinis)、Brevundimonas albigilva、缺陷短波单胞菌(Brevundimonas diminuta)、Brevundimonas vancanneytii、土地污泥单胞菌(Caenimonas terrae)、印度卡利迪丰提杆菌(Calidifontibacter indicus)、简明弯曲杆菌、纤细弯曲杆菌(Campylobacter gracilis)、人弯曲杆菌(Campylobacter hominis)、直肠弯曲杆菌(Campylobacter rectus)、昭和弯曲杆菌(Campylobacter showae)、溶脲弯曲杆菌(Campylobacter ureolyticus)、牙龈二氧化碳嗜纤维菌、Capnocytophagaleadbetteri、黄褐二氧化碳嗜纤维菌(Capnocytophaga ochracea)、生痰二氧化碳嗜纤维菌(Capnocytophaga sputigena)、人心杆菌(Cardiobacterium hominis)、瓣膜心杆菌(Cardiobacterium valvarum)、广布肉杆菌(Carnobacterium divergens)、疾病卡托氏菌(Catonella morbi)、亨氏柄杆菌(Caulobacter henricii)、地下空洞菌(Cavicellasubterranea)、解木聚糖纤维单胞菌(Cellulomonas xylanilytica)、普通纤维弧菌(Cellvibrio vulgaris)、台湾几丁质单胞菌(Chitinimonas taiwanensis)、花生金黄杆菌(Chryseobacterium arachidis)、大靑湖金黄杆菌(Chryseobacterium daecheongense)、福尔摩森金黄杆菌(Chryseobacterium formosense)、福尔摩森金黄杆菌(Chryseobacterium formosense)、绿地金黄杆菌(Chryseobacterium greenlandense)、产吲哚金黄杆菌(Chryseobacterium indologenes)、鱼金黄杆菌(Chryseobacteriumpiscium)、湿地金黄杆菌(Chryseobacterium rigui)、茄病金黄杆菌(Chryseobacteriumsolani)、塔克拉玛干金黄杆菌(Chryseobacterium taklimakanense)、解脲金黄杆菌(Chryseobacterium ureilyticum)、解脲金黄杆菌(Chryseobacterium ureilyticum)、玉米金黄杆菌(Chryseobacterium zeae)、金黄色金黄杆菌(Chryseomicrobium aureum)、鲍管道杆菌(Cloacibacterium haliotis)、Cloacibacterium normanense、Cloacibacteriumnormanense、产气柯林斯菌、反硝化丛毛单胞菌(Comamonas denitrificans)、土生丛毛单胞菌(Comamonas terrigena)、拥挤棒状杆菌、非发酵棒状杆菌嗜脂亚种(Corynebacteriumafermentans subsp.lipophilum)、产氨棒状杆菌、无枝菌酸棒状杆菌、金黄色棒状杆菌(Corynebacterium aurimucosum)、金黄色棒状杆菌(Corynebacterium aurimucosum)、科伊尔棒状杆菌(Corynebacterium coyleae)、硬质小麦棒状杆菌(Corynebacteriumdurum)、弗莱堡棒状杆菌(Corynebacterium freiburgense)、灰绿棒状杆菌(Corynebacterium glaucum)、嗜甘草棒状杆菌(Corynebacterium glyciniphilum)、亚胺棒状杆菌(Corynebacterium imitans)、杰氏棒状杆菌(Corynebacterium jeikeium)、杰氏棒状杆菌(Corynebacterium jeikeium)、柯氏棒状杆菌(Corynebacteriumkroppenstedtii)、亲脂黄色棒状杆菌(Corynebacterium lipophiloflavum)、马赛棒状杆菌(Corynebacterium massiliense)、乳腺炎棒状杆菌(Corynebacterium mastitidis)、马氏棒状杆菌(Corynebacterium matruchotii)、微小棒状杆菌、粘液棒状杆菌(Corynebacterium mucifaciens)、雪貂棒状杆菌(Corynebacterium mustelae)、菌丝体棒状杆菌(Corynebacterium mycetoides)、产丙酮酸棒状杆菌(Corynebacteriumpyruviciproducens)、模拟棒状杆菌(Corynebacterium simulans)、奇棒状杆菌(Corynebacterium singulare)、痰液棒状杆菌(Corynebacterium sputi)、Corynebacterium suicordis、结核硬脂酸棒状杆菌(Corynebacteriumtuberculostearicum)、结核硬脂酸棒状杆菌(Corynebacterium tuberculostearicum)、Corynebacterium ureicelerivorans、变异棒状杆菌(Corynebacterium variabile)、青蓝科奇氏游动菌青蓝亚种(Couchioplanes caeruleus subsp.caeruleus)、耐金属贪铜菌、草短小杆菌(Curtobacterium herbarum)、兴奋性脱氯单胞菌(Dechloromonas agitata)、Deinococcus actinosclerus、南极异常球菌(Deinococcus antarcticus)、游泥异常球菌(Deinococcus caeni)、无花果异常球菌(Deinococcus ficus)、嗜热异常球菌(Deinococcus geothermalis)、耐辐射异常球菌(Deinococcus radiodurans)、乌鲁木齐异常球菌(Deinococcus wulumuqiensis)、新疆异常球菌(Deinococcus xinjiangensis)、人皮肤杆菌(Dermabacter hominis)、阴道皮肤杆菌(Dermabacter vaginalis)、西宫皮生球菌(Dermacoccus nishinomiyaensis)、未定德库菌(Desemzia incerta)、玫瑰沙漠杆菌(Desertibacter roseus)、浑浊戴阿李斯特菌(Dialister invisus)、微好气戴阿李斯特菌(Dialister micraerophilus)、产丙酸戴阿李斯特菌(Dialister propionicifaciens)、橙色迪茨氏菌(Dietzia aurantiaca)、连香树迪茨氏菌(Dietzia cercidiphylli)、帝纹迪茨氏菌(Dietzia timorensis)、帝纹迪茨氏菌(Dietzia timorensis)、韩国独岛杆菌(Dokdonella koreensis)、韩国独岛杆菌(Dokdonella koreensis)、懒惰狡诈球菌(Dolosigranulum pigrum)、啮蚀艾肯菌(Eikenella corrodens)、米尔伊丽莎白菌(Elizabethkingia miricola)、海滨埃尔斯特菌(Elstera litoralis)、短稳杆菌(Empedobacter brevis)、气囊水栖菌(Enhydrobacter aerosaccus)、香坊肠杆菌(Enterobacter xiangfangensis)、阿奎马林肠球菌(Enterococcus aquimarinus)、粪肠球菌、橄榄肠球菌(Enterococcus olivae)、大黄欧文氏菌、挑剔真杆菌(Eubacteriumeligens)、骄弱真杆菌(Eubacterium infirmum)、直肠真杆菌、隐藏真杆菌(Eubacteriumsaphenum)、沟迹真杆菌(Eubacterium sulci)、墨西哥微小杆菌(Exiguobacteriummexicanum)、Facklamia tabacinasalis、嗜盐错玫杆菌、大芬戈尔德菌、表皮水蛭素黄杆菌(Flavobacterium cutihirudinis)、耐林丹黄杆菌(Flavobacterium lindanitolerans)、抗性黄杆菌(Flavobacterium resistens)、荚膜弗莱德门氏菌(Friedmanniellacapsulata)、具核梭杆菌多形亚种(Fusobacterium nucleatum subsp.polymorphum)、溶血孪生球菌(Gemella haemolysans)、麻疹孪生球菌(Gemella morbillorum)、犬腭孪生球菌(Gemella palaticanis)、血孪生球菌(Gemella sanguinis)、水芽殖杆菌(Gemmobacteraquaticus)、游泥芽殖杆菌(Gemmobacter caeni)、金华戈登氏菌(Gordoniajinhuaensis)、柯氏戈登氏菌(Gordonia kroppenstedtii)、食聚异戊二烯戈登氏菌(Gordonia polyisoprenivorans)、食聚异戊二烯戈登氏菌(Gordoniapolyisoprenivorans)、毗邻颗粒链球菌(Granulicatella adiacens)、细长颗粒链球菌(Granulicatella elegans)、副流感嗜血杆菌(Haemophilus parainfluenzae)、生痰嗜血杆菌(Haemophilus sputorum)、硫化物矿盐单胞菌(Halomonas sulfidaeris)、橙色滑柱菌(Herpetosiphon aurantiacus)、扩展食烃菌(Hydrocarboniphaga effusa)、海海源菌(Idiomarina maris)、按蚊两面神菌(Janibacter anophelis)、霍伊两面神菌(Janibacterhoylei)、印度两面神菌(Janibacter indicus)、泥两面神菌(Janibacter limosus)、瓜两面神菌(Janibacter melonis)、嗜盐咸海鲜球菌(Jeotgalicoccus halophilus)、Jonquetella anthropi、Kaistia geumhonensis、反硝化金氏菌(Kingelladenitrificans)、口腔金氏菌(Kingella oralis)、产酸克雷伯氏菌、气生诺尔氏菌(Knoellia aerolata)、locipacati诺尔氏菌(Knoellia locipacati)、心房库克菌(Kocuria atrinae)、嗜肉库克菌(Kocuria carniphila)、克氏库克菌(Kocuriakristinae)、沼泽库克菌(Kocuria palustris)、吐鲁番库克菌(Kocuria turfanensis)、砂毛绒厌氧杆菌(Lachnoanaerobaculum saburreum)、砂毛绒厌氧杆菌(Lachnoanaerobaculum saburreum)、卷曲乳杆菌(Lactobacillus crispatus)、惰性乳杆菌、乳酸乳球菌乳酸亚种(Lactococcus lactis subsp.lactis)、乳酸乳球菌乳酸亚种(Lactococcus lactis subsp.lactis)、鱼乳球菌(Lactococcus piscium)、济州岛小石球菌(Lapillicoccus jejuensis)、奇异劳特普罗菌(Lautropia mirabilis)、贝利亚登斯军团菌(Legionella beliardensis)、颊纤毛菌(Leptotrichia buccalis)、古德菲勒纤毛菌(Leptotrichia goodfellowii)、赫氏纤毛菌(Leptotrichia hofstadii)、香港纤毛菌(Leptotrichia hongkongensis)、沙氏纤毛菌(Leptotrichia shahii)、特氏纤毛菌(Leptotrichia trevisanii)、韦德纤毛菌(Leptotrichia wadei)、栖土藤黄色单胞菌(Luteimonas terricola)、纺缍形赖氨酸芽孢杆菌(Lysinibacillus fusiformis)、居海绵溶杆菌(Lysobacter spongiicola)、新疆溶杆菌(Lysobacter xinjiangensis)、溶酪大球菌(Macrococcus caseolyticus)、抱川大理石雕菌(Marmoricola pocheonensis)、石渣大理石雕菌(Marmoricola scoriae)、耐碱马赛菌(Massilia alkalitolerans)、耐碱马赛菌(Massilia alkalitolerans)、金色马赛菌(Massilia aurea)、折叠马赛菌(Massiliaplicata)、蒂莫内马赛菌、拉罗谢尔巨单胞菌(Megamonas rupellensis)、西尔瓦诺斯亚栖热菌(Meiothermus silvanus)、丹氏甲基杆菌(Methylobacterium dankookense)、天蓝甲基杆菌(Methylobacterium goesingense)、天蓝甲基杆菌(Methylobacteriumgoesingense)、Methylobacterium isbiliense、咸海鲜甲基杆菌(Methylobacteriumjeotgali)、草酸甲基杆菌(Methylobacterium oxalidis)、悬铃木甲基杆菌、Methylobacterium pseudosasicola、尤尼沃斯嗜甲基菌(Methyloversatilisuniversalis)、叶片微杆菌(Microbacterium foliorum)、水热微杆菌(Microbacteriumhydrothermale)、水热微杆菌(Microbacterium hydrothermale)、乳微杆菌(Microbacterium lacticum)、乳微杆菌(Microbacterium lacticum)、产左聚糖微杆菌(Microbacterium laevaniformans)、沼泽微杆菌(Microbacterium paludicola)、石油微杆菌(Microbacterium petrolearium)、叶球形微杆菌(Microbacteriumphyllosphaerae)、抗性微杆菌(Microbacterium resistens)、南极微球菌(Micrococcusantarcticus)、科氏微球菌(Micrococcus cohnii)、黄色微球菌(Micrococcus flavus)、里拉微球菌(Micrococcus lylae)、土微球菌(Micrococcus terreus)、橙色小月菌(Microlunatus aurantiacus)、糖原性微白霜菌(Micropruina glycogenica)、气生微枝形杆菌(Microvirga aerilata)、气生微枝形杆菌(Microvirga aerilata)、地下微枝形杆菌、豇豆微枝形杆菌(Microvirga vignae)、赞比亚微枝形杆菌(Microvirga zambiensis)、好氧反硝化微枝杆菌(Microvirgula aerodenitrificans)、胆怯艰难杆菌(Mogibacteriumtimidum)、大西洋莫拉菌(Moraxella atlantae)、卡他莫拉菌(Moraxella catarrhalis)、摩氏摩根氏菌摩根亚种(Morganella morganii subsp.morganii)、耐冷摩根氏菌(Morganella psychrotolerans)、不解糖默多克菌(Murdochiella asaccharolytica)、亚洲分枝杆菌(Mycobacterium asiaticum)、楚布分枝杆菌(Mycobacterium chubuense)、藏红花分枝杆菌(Mycobacterium crocinum)、加地斯分枝杆菌(Mycobacterium gadium)、荷斯坦分枝杆菌(Mycobacterium holsaticum)、伊朗分枝杆菌(Mycobacterium iranicum)、Mycobacterium longobardum、新金色分枝杆菌、新金色分枝杆菌、奧布分枝杆菌、食琥珀酸阴性球菌(Negativicoccus succinicivorans)、杆状奈瑟菌(Neisseria bacilliformis)、口腔奈瑟菌(Neisseria oralis)、干燥奈瑟菌(Neisseria sicca)、微黄奈瑟菌、艾霍湖涅斯捷连科氏菌(Nesterenkonia lacusekhoensis)、根际涅斯捷连科氏菌(Nesterenkoniarhizosphaerae)、Nevskia persephonica、分支涅瓦河菌(Nevskia ramosa)、砚山尼阿巴菌(Niabella yanshanensis)、Niveibacterium umoris、尼瓦诺卡氏菌(Nocardia niwae)、泰国诺卡氏菌、嗜琼脂类诺卡氏菌(Nocardioides agariphilus)、稀释类诺卡氏菌(Nocardioides dilutus)、江华岛类诺卡氏菌(Nocardioides ganghwensis)、和顺类诺卡氏菌(Nocardioides hwasunensis)、南海类诺卡氏菌(Nocardioides nanhaiensis)、沉积物类诺卡氏菌(Nocardioides sediminis)、Nosocomiicoccus ampullae、软沥青新草螺菌(Noviherbaspirillum malthae)、棉花新鞘氨醇菌、玫瑰色新鞘氨醇菌(Novosphingobiumrosa)、根际苍白杆菌(Ochrobactrum rhizosphaerae)、齿龈欧氏菌(Olsenella uli)、壁鸟氨酸微菌(Ornithinimicrobium murale)、天津鸟氨酸微菌(Ornithinimicrobiumtianjinense)、陆地稻曲菌(Oryzobacter terrae)、北京奥托氏菌(Ottowiabeijingensis)、水原类产碱杆菌(Paenalcaligenes suwonensis)、食琼脂类芽孢杆菌(Paenibacillus agaridevorans)、紫红类芽孢杆菌(Paenibacillus phoenicis)、解木聚糖类芽孢杆菌(Paenibacillus xylanexedens)、永氏帕氏杆菌(Paludibacteriumyongneupense)、杓兰泛菌(Pantoea cypripedii)、狄氏副拟杆菌、须芒草副伯克霍尔德氏菌(Paraburkholderia andropogonis)、嗜碱副球菌(Paracoccus alcaliphilus)、安格斯副球菌(Paracoccus angustae)、柯居里副球菌(Paracoccus kocurii)、Paracoccuslaeviglucosivorans、沉积物副球菌(Paracoccus sediminis)、苦马豆副球菌(Paracoccussphaerophysae)、耶氏副球菌(Paracoccus yeei)、微小微单胞菌、Parviterribactermultiflagellatus、人参沼杆菌(Patulibacter ginsengiterrae)、水生土地杆菌(Pedobacter aquatilis)、人参土土地杆菌(Pedobacter ginsengisoli)、西溪土土地杆菌(Pedobacter xixiisoli)、黑色消化球菌(Peptococcus niger)、Peptoniphilus coxii、戈巴赫嗜胨菌(Peptoniphilus gorbachii)、哈雷嗜胨菌、克氏嗜胨菌(Peptoniphiluskoenoeneniae)、泪腺嗜胨菌(Peptoniphilus lacrimalis)、厌氧消化链球菌(Peptostreptococcus anaerobius)、胃消化链球菌(Peptostreptococcus stomatis)、粪考拉杆菌(Phascolarctobacterium faecium)、嗜血苯基杆菌(Phenylobacteriumhaematophilum)、昆山苯基杆菌(Phenylobacterium kunshanense)、日勾维多源菌(Pluralibacter gergoviae)、Polymorphobacter multimanifer、本氏卟啉单胞菌(Porphyromonas bennonis)、牙髓卟啉单胞菌、牙龈卟啉单胞菌、狗齿龈卟啉单胞菌(Porphyromonas gingivicanis)、巴斯德卟啉单胞菌(Porphyromonas pasteri)、波戈纳卟啉单胞菌(Porphyromonas pogonae)、索氏卟啉单胞菌(Porphyromonas somerae)、Povalibacter uvarum、橙色普雷沃氏菌(Prevotella aurantiaca)、巴氏普雷沃氏菌、二路普雷沃氏菌、颊普雷沃氏菌(Prevotella buccae)、颊普雷沃氏菌(Prevotella buccalis)、粪便普雷沃氏菌、人体普雷沃氏菌(Prevotella corporis)、栖牙普雷沃氏菌(Prevotelladenticola)、栖居普雷沃氏菌(Prevotella enoeca)、栖组织普雷沃氏菌(Prevotellahisticola)、中间普雷沃氏菌、空肠普雷沃氏菌、空肠普雷沃氏菌、小斑点普雷沃氏菌(Prevotella maculosa)、产黑素普雷沃氏菌、产黑素普雷沃氏菌、彩虹普雷沃氏菌、多形普雷沃氏菌(Prevotella multiformis)、南充普雷沃氏菌(Prevotella nanceiensis)、变黑普雷沃氏菌、口腔普雷沃氏菌(Prevotella oris)、龈炎普雷沃氏菌(Prevotellaoulorum)、苍白普雷沃氏菌(Prevotella pallens)、胸膜炎普雷沃氏菌(Prevotellapleuritidis)、解糖普雷沃氏菌(Prevotella saccharolytica)、唾液普雷沃氏菌、沙氏普雷沃氏菌(Prevotella shahii)、蒂莫内普雷沃氏菌(Prevotella timonensis)、真口腔普雷沃氏菌、产酸丙酸杆菌(Propionibacterium acidifaciens)、痤疮丙酸杆菌痤疮亚种(Propionibacterium acnes subsp.acnes)、痤疮丙酸杆菌痤疮亚种(Propionibacteriumacnes subsp.acnes)、痤疮丙酸杆菌长亚种(Propionibacterium acnessubsp.elongatum)、颗粒丙酸杆菌(Propionibacterium granulosum)、嗜淋巴丙酸微菌、弓形丙酸螺菌(Propionispira arcuata)、葡萄牙假动球菌(Pseudokineococcuslusitanus)、铜绿假单胞菌、成都假单胞菌(Pseudomonas chengduensis)、食苯假诺卡氏菌(Pseudonocardia benzenivorans)、Pseudorhodoplanes sinuspersici、血嗜冷杆菌(Psychrobacter sanguinis)、人参皂甙变形杆菌、水莱茵海默氏菌(Rheinheimeraaquimaris)、蜂房根瘤菌(Rhizobium alvei)、大田根瘤菌、拉氏根瘤菌(Rhizobiumlarrymoorei)、Rhizobium rhizoryzae、土壤根瘤菌(Rhizobium soli)、泰白山根瘤菌、豇豆根瘤菌、甘草罗丹杆菌(Rhodanobacter glycinis)、维氏红细菌(Rhodobacterveldkampii)、Rhodococcus enclensis、带化红球菌(Rhodococcus fascians)、带化红球菌(Rhodococcus fascians)、Rhodovarius lipocyclicus、屏东溪边菌(Rivicolapingtungensis)、食葡糖罗氏菌、Rosenbergiella nectarea、气生玫瑰单胞菌(Roseomonasaerilata)、水生玫瑰单胞菌(Roseomonas aquatica)、粘液玫瑰单胞菌(Roseomonasmucosa)、玫瑰色玫瑰单胞菌(Roseomonas rosea)、葡萄酒色玫瑰单胞菌(Roseomonasvinacea)、空气罗氏菌(Rothia aeria)、污水沟罗氏菌(Rothia amarae)、龋齿罗氏菌(Rothia dentocariosa)、内生罗氏菌(Rothia endophytica)、粘液罗氏菌(Rothiamucilaginosa)、鼠鼻罗氏菌(Rothia nasimurium)、嗜中温微红微菌(Rubellimicrobiummesophilum)、粉红色微红微菌(Rubellimicrobium roseum)、Rubrobacter bracarensis、Rudaea cellulosilytica、活泼瘤胃球菌、玉米古字状菌(Runella zeae)、直杆糖多孢菌(Saccharopolyspora rectivirgula)、青岛盐水球菌(Salinicoccus qingdaonensis)、韦格斯卡多维亚菌(Scardovia wiggsiae)、人参土沉积物杆状菌(Sediminibacteriumginsengisoli)、蛛形新月形单胞菌(Selenomonas artemidis)、损伤新月形单胞菌(Selenomonas infelix)、有害新月形单胞菌(Selenomonas noxia)、生痰新月形单胞菌(Selenomonas sputigena)、潮汐希瓦氏菌、卫星肖特沃思氏菌(Shuttleworthiasatelles)、米氏西蒙斯氏菌(Simonsiella muelleri)、气生斯克尔曼氏菌(Skermanellaaerolata)、抗锑斯克尔曼氏菌(Skermanella stibiiresistens)、弱生斯奈克氏菌(Slackia exigua)、新泻小球菌(Smaragdicoccus niigatensis)、血红色纤毛菌(Sneathiasanguinegens)、土壤土壤红杆菌(Solirubrobacter soli)、游泥鞘氨醇杆菌(Sphingobacterium caeni)、大田鞘氨醇杆菌(Sphingobacterium daejeonense)、霍塔宁鞘氨醇杆菌(Sphingobacterium hotanense)、京氏鞘氨醇杆菌(Sphingobacteriumkyonggiense)、多食鞘氨醇杆菌(Sphingobacterium multivorum)、杀线虫鞘氨醇杆菌(Sphingobacterium nematocida)、食神鞘氨醇杆菌(Sphingobacterium spiritivorum)、阿见鞘氨醇菌、印度洋鞘氨醇菌(Sphingobium indicum)、乳糖同化鞘氨醇菌、地下鞘氨醇菌(Sphingobium subterraneum)、桌鞘氨醇单胞菌(Sphingomonas abaci)、潮汐鞘氨醇单胞菌(Sphingomonas aestuarii)、加拿大鞘氨醇单胞菌(Sphingomonas canadensis)、大涌鞘氨醇单胞菌(Sphingomonas daechungensis)、独岛鞘氨醇单胞菌、刺状鞘氨醇单胞菌(Sphingomonas echinoides)、丰蒂卡鞘氨醇单胞菌(Sphingomonas fonticola)、丰蒂卡鞘氨醇单胞菌(Sphingomonas fonticola)、福尔摩森鞘氨醇单胞菌(Sphingomonasformosensis)、Sphingomonas gei、韩泰鞘氨醇单胞菌(Sphingomonas hankookensis)、韩泰鞘氨醇单胞菌(Sphingomonas hankookensis)、韩国鞘氨醇单胞菌(Sphingomonaskoreensis)、Sphingomonas kyeonggiensis、Sphingomonas laterariae、粘膜鞘氨醇单胞菌(Sphingomonas mucosissima)、寡酚鞘氨醇单胞菌(Sphingomonas oligophenolica)、伪血鞘氨醇单胞菌、栖沉积物鞘氨醇单胞菌(Sphingomonas sediminicola)、盐亭鞘氨醇单胞菌(Sphingomonas yantingensis)、云南鞘氨醇单胞菌(Sphingomonas yunnanensis)、印度鞘氨醇盒菌、湿地螺菌(Spirosoma rigui)、嗜中温生孢产醋杆状菌(Sporacetigeniummesophilum)、粘球生孢噬纤维菌(Sporocytophaga myxococcoides)、耳葡萄球菌(Staphylococcus auricularis)、表皮葡萄球菌、表皮葡萄球菌、人葡萄球菌新霉素败血症亚种(Staphylococcus hominis subsp.novobiosepticus)、路邓葡萄球菌(Staphylococcus lugdunensis)、佩藤科费尔葡萄球菌(Staphylococcus pettenkoferi)、韩国窄食单胞菌(Stenotrophomonas koreensis)、嗜根窄食单胞菌(Stenotrophomonasrhizophila)、嗜根窄食单胞菌(Stenotrophomonas rhizophila)、无乳链球菌、犬链球菌(Streptococcus canis)、嵴链球菌(Streptococcus cristatus)、戈登氏链球菌、婴儿链球菌、中间链球菌(Streptococcus intermedius)、变异链球菌、寡发酵链球菌(Streptococcus oligofermentans)、口腔链球菌、血链球菌(Streptococcus sanguinis)、Streptomyces iconiensis、阳陵链霉菌(Streptomyces yanglinensis)、水生大不里士杆菌(Tabrizicola aquatica)、Tahibacter caeni、福赛坦氏菌(Tannerella forsythia)、Tepidicella xavieri、Tepidimonas fonticaldi、藤黄土壤球菌(Terracoccus luteus)、变黄四合球菌(Tessaracoccus flavescens)、嗜热栖热菌(Thermus thermophilus)、沉积物谭天伟氏菌(Tianweitania sediminis)、沉积物谭天伟氏菌(Tianweitaniasediminis)、食淀粉密螺旋体(Treponema amylovorum)、栖牙密螺旋体、解卵磷脂密螺旋体(Treponema lecithinolyticum)、中间密螺旋体(Treponema medium)、耳炎苏黎士菌(Turicella otitidis)、血尿杆菌、嗜寡碳水杆形菌(Undibacteriumoligocarboniphilum)、虾水杆形菌(Undibacterium squillarum)、鲑鱼漫游球菌(Vagococcus salmoninarum)、寒武弯曲短杆菌、梅氏弧菌(Vibrio metschnikovii)、万寿菊黄色杆菌(Xanthobacter tagetidis)、气生嗜异生质菌、抗砷嗜异生质菌(Xenophilusarseniciresistens)、橙色云微所菌(Yimella lutea)、白齐默曼氏菌(Zimmermannellaalba)、双裂齐默曼氏菌(Zimmermannella bifida)和游泥动胶菌(Zoogloea caeni)。
在其他实施方案中,目标细菌细胞为阴道微生物群中常见的那些,并且非限制性地为抗病毒不动杆菌(Acinetobacter antiviralis)、鲍曼不动杆菌、醋酸钙不动杆菌(Acinetobacter calcoaceticus)、约氏不动杆菌(Acinetobacter johnsonii)、马赛放线杆菌(Actinobaculum massiliense)、斯氏放线杆菌(Actinobaculum schaalii)、欧洲放线菌(Actinomyces europaeus)、革氏放线菌(Actinomyces graevenitzii)、以色列放线菌(Actinomyces israelii)、麦氏放线菌、内氏放线菌、纽氏放线菌、溶齿放线菌、苏黎世放线菌、泌尿生殖器放线菌(Actinomyces urogenitalis)、粘性放线菌(Actinomycesviscosus)、柯氏气球菌、脲气球菌、草绿色气球菌、鳗鱼气单胞菌、杀鲑气单胞菌、马赛阿菲波菌(Afipia massiliensis)、根癌农杆菌(Agrobacterium tumefaciens)、水生噬冷菌(Algoriphagus aquatilis)、沃当另类弧菌(Aliivibrio wodanis)、芬氏别样杆菌、耳炎差异球菌(Alloiococcus otitis)、坦纳拟普雷沃氏菌(Alloprevotella tannerae)、欧米克斯异斯卡多维亚菌、食环氧化物交替红色杆菌(Altererythrobacter epoxidivorans)、草酸盐嗜氨菌(Ammoniphilus oxalaticus)、京氏羊膜杆菌(Amnibacterium kyonggiense)、产氢厌氧球菌、溶乳厌氧球菌、莫道克厌氧球菌、肥胖症相关厌氧球菌(Anaerococcusobesiensis)、普氏厌氧球菌、四联厌氧球菌(Anaerococcus tetradius)、阴道厌氧球菌、成双厌氧球状菌(Anaeroglobus geminatus)、普西诺无氧芽孢杆菌(Anoxybacilluspushchinoensis)、微小水杆菌、海豹隐秘杆菌(Arcanobacterium phocae)、金黄节杆菌(Arthrobacter aurescens)、离中不黏柄菌、微小奇异菌(Atopobium minutum)、极小奇异菌、龈裂奇异菌、阴道奇异菌、鹑鸡禽杆菌(Avibacterium gallinarum)、酸居芽孢杆菌(Bacillus acidicola)、萎缩芽孢杆菌(Bacillus atrophaeus)、蜡状芽孢杆菌、食物芽孢杆菌(Bacillus cibi)、科阿韦拉芽孢杆菌(Bacillus coahuilensis)、大山芽孢杆菌(Bacillus gaemokensis)、甲醇芽孢杆菌(Bacillus methanolicus)、蔬菜芽孢杆菌(Bacillus oleronius)、短小芽孢杆菌、沙氏芽孢杆菌(Bacillus shackletonii)、耐热芽孢杆菌(Bacillus sporothermodurans)、枯草芽孢杆菌、和光芽孢杆菌(Bacilluswakoensis)、韦氏芽孢杆菌(Bacillus weihenstephanensis)、巴氏拟杆菌(Bacteroidesbarnesiae)、凝结拟杆菌、多氏拟杆菌、粪拟杆菌、福氏拟杆菌(Bacteroides forsythus)、脆弱拟杆菌、诺氏拟杆菌、卵形拟杆菌、萨利尔斯氏拟杆菌、粪便拟杆菌、单形拟杆菌、普通拟杆菌、溶木聚糖拟杆菌、动胶拟杆菌(Bacteroides zoogleoformans)、肠居巴恩斯氏菌(Barnesiella viscericola)、科研中心哈格瓦氏菌(Bhargavaea cecembensis)、青春双歧杆菌、两歧双歧杆菌、短双歧杆菌、齿双歧杆菌、长双歧杆菌婴儿亚种(Bifidobacteriumlogum subsp.infantis)、长双歧杆菌、假小链双歧杆菌、史卡杜维双歧杆菌(Bifidobacterium scardovii)、沃氏嗜胆菌、氢营养布劳特氏菌、卵形布劳特氏菌、生产布劳特氏菌、粪小短杆菌(Brachybacterium faecium)、大豆慢生根瘤菌、迈克布瑞德短杆菌(Brevibacterium mcbrellneri)、耳炎短杆菌(Brevibacterium otitidis)、少食短杆菌、缓慢布雷德菌(Bulleidia extructa)、真菌伯克霍尔德氏菌(Burkholderia fungorum)、Burkholderia phenoliruptix、解糖热解纤维素菌(Caldicellulosiruptorsaccharolyticus)、台湾热单胞菌(Caldimonas taiwanensis)、纤细弯曲杆菌、人弯曲杆菌、生痰弯曲杆菌(Campylobacter sputorum)、溶脲弯曲杆菌、黄褐二氧化碳嗜纤维菌、人心杆菌、疾病卡托氏菌、沙眼衣原体、流产嗜衣原体(Chlamydophila abortus)、粗柄软骨霉状菌(Chondromyces robustus)、水金黄杆菌(Chryseobacterium aquaticum)、杨氏柠檬酸杆菌、Cloacibacterium normanense、卡文迪什梭菌(Clostridium cavendishii)、狗肠梭菌(Clostridium colicanis)、济州岛梭菌(Clostridium jejuense)、产气荚膜梭菌、多枝梭菌、索氏梭菌(Clostridium sordellii)、维利梭菌(Clostridium viride)、土生丛毛单胞菌、拥挤棒状杆菌、阑尾炎棒状杆菌(Corynebacterium appendicis)、科伊尔棒状杆菌、解葡萄糖苷棒状杆菌(Corynebacterium glucuronolyticum)、谷氨酸棒状杆菌(Corynebacterium glutamicum)、杰氏棒状杆菌、柯氏棒状杆菌、亲脂黄色棒状杆菌、微小棒状杆菌、粘液棒状杆菌、Corynebacterium nuruki、假生殖道棒状杆菌(Corynebacteriumpseudogenitalium)、产丙酮酸棒状杆菌、奇棒状杆菌、纹带棒状杆菌(Corynebacteriumstriatum)、结核硬脂酸棒状杆菌、干燥棒状杆菌、嗜冷冷杆菌(Cryobacteriumpsychrophilum)、萎蔫短小杆菌、痤疮皮肤杆菌(Cutibacterium acnes)、贪婪皮肤杆菌(Cutibacterium avidum)、解木聚糖噬纤维菌(Cytophaga xylanolytica)、嗜放射异常球菌(Deinococcus radiophilus)、鹤羽田戴尔福特菌(Delftia tsuruhatensis)、脱硫脱硫弧菌(Desulfovibrio desulfuricans)、浑浊戴阿李斯特菌、微好气戴阿李斯特菌、侵肺戴阿李斯特菌(Dialister pneumosintes)、产丙酸戴阿李斯特菌、菊花迪克氏菌(Dickeyachrysanthemi)、长链多尔氏菌、迟缓埃格特菌、链状埃格特氏菌(Eggerthiacatenaformis)、啮蚀艾肯菌、气囊水栖菌、阿氏肠杆菌、阴沟肠杆菌、鸟肠球菌、耐久肠球菌、粪肠球菌、屎肠球菌、海氏肠球菌(Enterococcus hirae)、桃色欧文氏菌(Erwiniapersicina)、大黄欧文氏菌、托莱塔纳欧文氏菌(Erwinia toletana)、大肠杆菌、费格森埃希氏菌(Escherichia fergusonii)、短真杆菌(Eubacterium brachy)、挑剔真杆菌、纠缠真杆菌(Eubacterium nodatum)、直肠真杆菌、隐藏真杆菌、惰性真杆菌、沟迹真杆菌、尤氏真杆菌(Eubacterium yurii)、乙酰微小杆菌(Exiguobacterium acetylicum)、迟缓费克蓝姆菌(Facklamia ignava)、普氏栖粪杆菌、龈沟产线菌(Filifactor alocis)、大芬戈尔德菌、刚氏梭杆菌、具核梭杆菌、牙周梭杆菌、阴道加德纳菌、不解糖卟啉孪生球菌(Gemellaasaccharolytica)、伯氏孪生球菌(Gemella bergeri)、溶血孪生球菌、血孪生球菌、嗜热脂肪土芽孢杆菌(Geobacillus stearothermophilus)、热小链土芽孢杆菌(Geobacillusthermocatenulatus)、热葡糖苷酶土芽孢杆菌(Geobacillus thermoglucosidasius)、Geobacter grbiciae、细长颗粒链球菌、杜克雷嗜血杆菌(Haemophilus ducreyi)、溶血嗜血杆菌(Haemophilus haemolyticus)、副溶血嗜血杆菌(Haemophilusparahaemolyticus)、副流感嗜血杆菌、蜂房哈夫尼菌、南方盐单胞菌、Halomonas phoceae、美丽盐单胞菌(Halomonas venusta)、织片草螺菌(Herbaspirillum seropedicae)、深蓝紫色杆菌(Janthinobacterium lividum)、Jonquetella anthropi、肉芽肿克雷伯氏菌(Klebsiella granulomatis)、产酸克雷伯氏菌、肺炎克雷伯氏菌、嗜酸乳杆菌、食淀粉乳杆菌(Lactobacillus amylovorus)、短乳杆菌、人阴道乳杆菌(Lactobacilluscoleohominis)、卷曲乳杆菌、弯曲乳杆菌、德氏乳杆菌、发酵乳杆菌、格氏乳杆菌、瑞士乳杆菌、惰性乳杆菌、詹氏乳杆菌(Lactobacillus jensenii)、约氏乳杆菌、卡利克斯镇乳杆菌(Lactobacillus kalixensis)、马乳酒样乳杆菌(Lactobacillus kefiranofaciens)、金霉素乳杆菌(Lactobacillus kimchicus)、北山乳杆菌(Lactobacillus kitasatonis)、粘膜乳杆菌(Lactobacillus mucosae)、面包乳杆菌(Lactobacillus panis)、副干酪乳杆菌、植物乳杆菌、桥乳杆菌(Lactobacillus pontis)、罗伊氏乳杆菌、鼠李糖乳杆菌、唾液乳杆菌、厄尔纳拉乳杆菌、阴道乳杆菌、乳酸乳球菌、颊纤毛菌、肉质明串珠菌、柠檬色明串珠菌、Leuconostoc garlicum、乳酸明串珠菌、肠膜明串珠菌、克里布赖氨酸单胞菌(Lysinimonaskribbensis)、Mageeibacillus indolicus、东方海洋杆菌(Maribacter orientalis)、变形海单胞菌(Marinomonas protea)、海岛海螺菌(Marinospirillum insulare)、蒂莫内马赛菌、埃氏巨球形菌(Megasphaera elsdenii)、微核巨球形菌(Megasphaeramicronuciformis)、紫穗槐中慢生根瘤菌(Mesorhizobium amorphae)、耐福射甲基杆菌(Methylobacterium radiotolerans)、转圈甲基娇养杆菌(Methylotenera versatilis)、嗜盐微杆菌(Microbacterium halophilum)、藤黄微球菌、Microterricola viridarii、克氏动弯杆菌(Mobiluncus curtisii)、羞怯动弯杆菌(Mobiluncus mulieris)、胆怯艰难杆菌、甘油穆尔氏菌(Moorella glycerini)、奥斯陆莫拉菌(Moraxella osloensis)、摩氏摩根氏菌、产吲哚莫亚拉菌(Moryella indoligenes)、不解糖默多克菌、蜂房支原体(Mycoplasma alvi)、生殖道支原体(Mycoplasma genitalium)、人支原体(Mycoplasmahominis)、小鼠支原体(Mycoplasma muris)、唾液支原体(Mycoplasma salivarium)、食琥珀酸阴性球菌、黄色奈瑟菌(Neisseria flava)、淋病奈瑟球菌、粘液奈瑟菌(Neisseriamucosa)、微黄奈瑟菌、分支涅瓦河菌、土壤涅瓦菌(Nevskia soli)、嗜碱腈基降解菌、内脏臭杆菌、尿道寡养杆菌(Oligella urethralis)、齿龈欧氏菌、解淀粉类芽孢杆菌(Paenibacillus amylolyticus)、腐殖质类芽孢杆菌(Paenibacillus humicus)、饲料类芽孢杆菌(Paenibacillus pabuli)、帕萨登斯类芽孢杆菌(Paenibacillus pasadenensis)、松木类芽孢杆菌(Paenibacillus pini)、强壮类芽孢杆菌(Paenibacillus validus)、成团泛菌(Pantoea agglomerans)、粪副拟杆菌、石竹副伯克霍尔德氏菌(Paraburkholderiacaryophylli)、耶氏副球菌、脓肿副链霉菌(Parastreptomyces abscessus)、微小微单胞菌、巴西果胶杆菌(Pectobacterium betavasculorum)、胡萝卜软腐果胶杆菌(Pectobacterium carotovorum)、乳酸片球菌、耐乙醇片球菌(Pediococcusethanolidurans)、冲击地土地杆菌(Pedobacter alluvionis)、完州郡土地杆菌(Pedobacter wanjuense)、水生嗜糖假单胞菌(Pelomonas aquatica)、黑色消化球菌、不解糖嗜胨菌(Peptoniphilus asaccharolyticus)、戈巴赫嗜胨菌、哈雷嗜胨菌、吲哚嗜胨菌(Peptoniphilus indolicus)、泪腺嗜胨菌、马赛嗜胨菌(Peptoniphilus massiliensis)、厌氧消化链球菌、马赛消化链球菌(Peptostreptococcus massiliae)、胃消化链球菌、狭小发光杆菌(Photobacterium angustum)、嗜冷发光杆菌(Photobacterium frigidiphilum)、明亮发光杆菌(Photobacterium phosphoreum)、不解糖卟啉单胞菌、本氏卟啉单胞菌、卡氏卟啉单胞菌(Porphyromonas catoniae)、牙髓卟啉单胞菌、牙龈卟啉单胞菌、索氏卟啉单胞菌、Porphyromonas uenonis、阿姆尼普雷沃氏菌(Prevotella amnii)、巴氏普雷沃氏菌、卑尔根普雷沃氏菌(Prevotella bergensis)、二路普雷沃氏菌、颊普雷沃氏菌(Prevotellabuccae)、颊普雷沃氏菌(Prevotella buccalis)、彩色普雷沃氏菌(Prevotellacolorans)、粪便普雷沃氏菌、人体普雷沃氏菌、牙普雷沃氏菌、栖牙普雷沃氏菌、解糖胨普雷沃氏菌(Prevotella disiens)、中间普雷沃氏菌、洛氏普雷沃氏菌(Prevotellaloescheii)、马氏普雷沃氏菌(Prevotella marshii)、产黑素普雷沃氏菌、彩虹普雷沃氏菌、变黑普雷沃氏菌、口腔普雷沃氏菌、胸膜炎普雷沃氏菌、栖瘤胃普雷沃氏菌(Prevotellaruminicola)、沙氏普雷沃氏菌、粪普雷沃氏菌、蒂莫内普雷沃氏菌、真口腔普雷沃氏菌、嗜淋巴丙酸微菌、奇异变形杆菌、冷杉假单胞菌(Pseudomonas abietaniphila)、铜绿假单胞菌、扁桃假单胞菌(Pseudomonas amygdali)、产氮假单胞菌(Pseudomonas azotoformans)、绿叶假单胞菌(Pseudomonas chlororaphis)、夸特罗谢内加斯假单胞菌(Pseudomonascuatrocienegasensis)、荧光假单胞菌(Pseudomonas fluorescens)、黄褐假单胞菌(Pseudomonas fulva)、浅黄假单胞菌(Pseudomonas lutea)、霉味假单胞菌、食油假单胞菌(Pseudomonas oleovorans)、东方假单胞菌(Pseudomonas orientalis)、假产碱假单胞菌、嗜冷假单胞菌(Pseudomonas psychrophila)、恶臭假单胞菌、类黄假单胞菌(Pseudomonassynxantha)、丁香假单胞菌(Pseudomonas syringae)、托拉氏假单胞菌(Pseudomonastolaasii)、丙酸假丙酸杆菌(Pseudopropionibacterium propionicum)、水生拉恩氏菌(Rahnella aquatilis)、皮氏罗尔斯通氏菌、茄科罗尔斯通氏菌(Ralstoniasolanacearum)、植生拉乌尔菌(Raoultella planticola)、达乌奇根杆菌(Rhizobacterdauci)、埃特里根瘤菌、带化红球菌、沼泽红假单胞菌(Rhodopseudomonas palustris)、肠道罗氏菌、食葡糖罗氏菌、粘液罗氏菌、布氏瘤胃球菌、活泼瘤胃球菌、扭链瘤胃球菌、凯迪血杆菌(Sanguibacter keddieii)、鲑色沉积物杆状菌(Sediminibacterium salmoneum)、牛新月形单胞菌(Selenomonas bovis)、丰蒂卡沙雷氏菌(Serratia fonticola)、液化沙雷氏菌(Serratia liquefaciens)、粘质沙雷氏菌、海藻希瓦氏菌(Shewanella algae)、亚马逊希瓦氏菌(Shewanella amazonensis)、波伊德氏志贺氏菌(Shigella boydii)、宋内志贺氏菌、弱生斯奈克氏菌、阿姆尼纤毛菌(Sneathia amnii)、血红色纤毛菌、莫雷溶杆菌(Solobacterium moorei)、纤维堆囊菌(Sorangium cellulosum)、阿见鞘氨醇菌、大豆鞘氨醇菌、矢野鞘氨醇菌(Sphingobium yanoikuyae)、维氏鞘氨醇单胞菌(Sphingomonaswittichii)、海水芽孢八叠球菌(Sporosarcina aquimarina)、金黄色葡萄球菌、耳葡萄球菌、头状葡萄球菌(Staphylococcus capitis)、表皮葡萄球菌、溶血葡萄球菌(Staphylococcus haemolyticus)、人葡萄球菌(Staphylococcus hominis)、路邓葡萄球菌、腐生葡萄球菌、施氏葡萄球菌(Staphylococcus schleiferi)、猿猴葡萄球菌(Staphylococcus simiae)、模拟葡萄球菌(Staphylococcus simulans)、沃氏葡萄球菌(Staphylococcus warneri)、嗜麦芽窄食单胞菌、Stenoxybacter acetivorans、无乳链球菌、咽峡炎链球菌、澳大利亚链球菌、马肠链球菌、解没食子酸链球菌(Streptococcusgallolyticus)、婴儿链球菌、中间链球菌、黄体链球菌、Streptococcus marimammalium、缓症链球菌、变异链球菌、口腔链球菌、副血链球菌、海豹链球菌(Streptococcus phocae)、假肺炎链球菌(Streptococcus pseudopneumoniae)、唾液链球菌、血链球菌、嗜热链球菌、华德萨特氏菌、福赛坦氏菌、食芳烃土地嗜血杆菌(Terrahaemophilus aromaticivorans)、栖牙密螺旋体、嗜麦芽糖密螺旋体(Treponema maltophilum)、微小密螺旋体(Treponemaparvum)、文氏密螺旋体(Treponema vincentii)、伯尔德储珀菌(Trueperellabernardiae)、耳炎苏黎士菌、微小脲原体(Ureaplasma parvum)、解脲脲原体、寒武弯曲短杆菌、争论贪食菌(Variovorax paradoxus)、非典型韦荣菌、殊异韦荣菌、蒙皮立韦荣菌(Veillonella montpellierensis)、小韦荣菌、普氏枝芽孢杆菌(Virgibacillusproomii)、沙地绿芽孢杆菌(Viridibacillus arenosi)、阿维绿芽孢杆菌(Viridibacillusarvi)、食窦魏斯氏菌(Weissella cibaria)、土壤魏斯氏菌(Weissella soli)、野油菜黄单胞菌(Xanthomonas campestris)、囊泡黄单胞菌(Xanthomonas vesicatoria)、Zobellialaminariae和生枝动胶菌(Zoogloea ramigera)。
在一个实施方案中,目标细菌为大肠杆菌。在一个特定实施方案中,所述目标细菌为产生志贺毒素的大肠杆菌(STEC)。
目标细菌细胞群可包含一种或几种如上定义的感兴趣的细菌。特别是,目标细菌细胞群可包含大肠杆菌和一种或几种如上定义的感兴趣的其他细菌。
因此,用于制备细菌递送媒介物的细菌噬菌体,并且然后是细菌递送媒介物,可靶向(例如特异性地靶向)来自任何一个或多个前述细菌属和/或种的细菌细胞,以特异性地递送感兴趣的有效载荷。
在一个实施方案中,目标细菌为致病性细菌。目标细菌可为毒力细菌。
目标细菌可为抗菌抗性细菌,包括选自产超广谱β-内酰胺酶(ESBL)的大肠杆菌、ESBL肺炎克雷伯氏菌、万古霉素抗性肠球菌属(VRE)、甲氧西林抗性金黄色葡萄球菌(MRSA)、多药抗性(MDR)鲍曼不动杆菌、MDR肠杆菌属物种及其组合的那些细菌。目标细菌可选自产超广谱β-内酰胺酶(ESBL)的大肠杆菌菌株。
或者,目标细菌可为给定物种的微生物组的细菌,包括人类微生物群的细菌。
本公开涉及含有如本文所述的有效载荷的细菌递送媒介物。细菌递送媒介物由细菌病毒制备。选择细菌递送媒介物以便能够将有效载荷引入到目标细菌中。
可由此衍生本文公开的细菌递送媒介物的细菌病毒包括细菌噬菌体。任选地,基于Krupovic等人,Arch Virol,2015的分类法,细菌噬菌体选自由肌尾噬菌体科(Myoviridae)、短尾噬菌体科(Podoviridae)、长尾噬菌体科(Siphoviridae)和埃凯曼病毒科(Ackermannviridae)组成的有尾噬菌体目(Caudovirales)。
细菌噬菌体可选自肌尾噬菌体科(Myoviridae)(例如但不限于:Cp220病毒、Cp8病毒、Ea214病毒、Felixo1病毒、Moogle病毒、Susp病毒、Hp1病毒、P2病毒、Kay病毒、P100病毒、Silvia病毒、Spo1病毒、Tsarbomba病毒、Twort病毒、Cc31病毒、Jd18病毒、Js98病毒、Kp15病毒、Moon病毒、Rb49病毒、Rb69病毒、S16病毒、Schizot4病毒、Sp18病毒、T4病毒、Cr3病毒、Se1病毒、V5病毒、Abouo病毒、Agate病毒、Agrican357病毒、Ap22病毒、Arv1病毒、B4病毒、Bastille病毒、Bc431病毒、Bcep78病毒、Bcepmu病毒、Biquarta病毒、Bxz1病毒、Cd119病毒、Cp51病毒、Cvm10病毒、Eah2病毒、El病毒、Hapuna病毒、Jimmer病毒、Kpp10病毒、M12病毒、Machina病毒、Martha病毒、Msw3病毒、Mu病毒、Myohalo病毒、Nit1病毒、P1病毒、Pakpuna病毒、Pbuna病毒、Phikz病毒、Rheph4病毒、Rsl2病毒、Rsluna病毒、Secunda5病毒、Sep1病毒、Spn3病毒、Svuna病毒、Tg1病毒、Vhml病毒和Wph病毒)。
细菌噬菌体可选自短尾噬菌体科(Podoviridae)(例如但不限于:Fri1病毒、Kp32病毒、Kp34病毒、Phikmv病毒、Prado病毒、Sp6病毒、T7病毒、Cp1病毒、P68病毒、Phi29病毒、Nona33病毒、Pocj病毒、Tl2011病毒、Bcep22病毒、Bpp1病毒、Cba41病毒、Dfl12病毒、Ea92病毒、ε15病毒、F116病毒、G7c病毒、Jwalpha病毒、Kf1病毒、Kpp25病毒、Lit1病毒、Luz24病毒、Luz7病毒、N4病毒、Nonana病毒、P22病毒、Page病毒、Phieco32病毒、Prtb病毒、Sp58病毒、Una961病毒和Vp5病毒)。
细菌噬菌体可选自长尾噬菌体科(Siphoviridae)(例如但不限于:Cam病毒、Lika病毒、R4病毒、Acadian病毒、Cooper病毒、Pg1病毒、Pipefish病毒、Rosebush病毒、Brujita病毒、Che9c病毒、Hawkeye病毒、Plot病毒、Jersey病毒、K1g病毒、Sp31病毒、Lmd1病毒、Una4病毒、Bongo病毒、Rey病毒、Butters病毒、Charlie病毒、Redi病毒、Baxter病毒、Nymphadora病毒、Bignuz病毒、Fishburne病毒、Phayonce病毒、Kp36病毒、Rogue1病毒、Rtp病毒、T1病毒、Tls病毒、Ab18病毒、Amigo病毒、Anatole病毒、Andromeda病毒、Attis病毒、Barnyard病毒、Bernal13病毒、Biseptima病毒、Bron病毒、C2病毒、C5病毒、Cba181病毒、Cbast病毒、Ceci病毒、Che8病毒、Chi病毒、Cjw1病毒、Corndog病毒、Cronus病毒、D3112病毒、D3病毒、Decurro病毒、Demosthenes病毒、Doucette病毒、E125病毒、Eiau病毒、Ff47病毒、Gaia病毒、Giles病毒、Gordon病毒、Gordtnk病毒、Harrison病毒、Hk578病毒、Hk97病毒、Jenst病毒、Jwx病毒、Kellezio病毒、Korra病毒、L5病毒、lambda病毒、Laroye病毒、Liefie病毒、Marvin病毒、Mudcat病毒、N15病毒、Nonag病毒、Np1病毒、ω病毒、P12002病毒、P12024病毒、P23病毒、P70病毒、Pa6病毒、Pamx74病毒、Patience病毒、Pbi1病毒、Pepy6病毒、Pfr1病毒、Phic31病毒、Phicbk病毒、Phieta病毒、Phifel病毒、Phijl1病毒、Pis4a病毒、Psa病毒、Psimuna病毒、Rdjl病毒、Rer2病毒、Sap6病毒、Send513病毒、Septima3病毒、Seurat病毒、Sextaec病毒、Sfi11病毒、Sfi21dt1病毒、Sitara病毒、Sk1病毒、Slash病毒、Smoothie病毒、Soups病毒、Spbeta病毒、Ssp2病毒、T5病毒、Tank病毒、Tin2病毒、Titan病毒、Tm4病毒、Tp21病毒、Tp84病毒、Tria病毒、Trigintaduo病毒、Vegas病毒、Vendetta病毒、Wbeta病毒、Wildcat病毒、Wizard病毒、Woes病毒、Xp10病毒、Ydn12病毒和Yua病毒)。
细菌噬菌体可选自埃凯曼病毒科(例如但不限于:Ag3病毒、Limestone病毒、Cba120病毒和Vi1病毒)。
任选地,细菌噬菌体不为有尾噬菌体目(Caudovirales)的一部分,而是来自具有未指定目的科,例如但不限于:复层噬菌体科(Tectiviridae)(比如以下属:Alphatectivirus、Betatectivirus)、覆盖噬菌体科(Corticoviridae)(比如以下属:覆盖噬菌体属(Corticovirus))、丝状噬菌体科(Inoviridae)(比如以下属:Fibrovirus、Habenivirus、丝状噬菌体属(Inovirus)、Lineavirus、短杆状噬菌体属(Plectrovirus)、Saetivirus、Vespertiliovirus)、囊状噬菌体科(Cystoviridae)(比如以下属:囊状噬菌体属(Cystovirus))、光滑噬菌体科(Leviviridae)(比如以下属:异轻小噬菌体属(Allolevivirus)、光滑噬菌体属(Levivirus))、微小噬菌体科(Microviridae)(比如以下属:α3微小噬菌体属、G4微小噬菌体属、Phix174微小噬菌体属、蛭弧菌微小噬菌体属(Bdellomicrovirus)、衣原体微小噬菌体属(Chlamydiamicrovirus)、螺旋体微小噬菌体属(Spiromicrovirus))和芽生噬菌体科(Plasmaviridae)(比如以下属:芽生噬菌体属(Plasmavirus))。
任选地,细菌噬菌体靶向古细菌并不是有尾噬菌体目的一部分,而是来自具有未指定目的科,例如但不限于:瓶状噬菌体科(Ampullaviridae)、微小纺锤形噬菌体科(FuselloViridae)、球状病毒科(Globuloviridae)、微滴形噬菌体科(Guttaviridae)、脂毛噬菌体科(Lipothrixviridae)、嗜盐菌多形病毒科(Pleolipoviridae)、古噬菌体科(Rudiviridae)、盐末端蛋白噬菌体属(Salterprovirus)和双尾病毒科(Bicaudaviridae)。
以下段落中呈现细菌属及其已知宿主特异性细菌病毒的非详尽列表。作为非限制性实例,本文公开的嵌合RBP和/或分支RBP和/或重组gpJ蛋白和/或重组gpH蛋白以及细菌递送媒介物可从以下噬菌体工程改造。括号中表示同义词和拼写变体。同音异义词尽可能经常出现(例如D、D、d)。未命名的噬菌体通过在其属旁边的“NN”指示,并且其编号在括号中给出。
放线菌属(Actinomyces)的细菌可被以下噬菌体感染:Av-I、Av-2、Av-3、BF307、CTl、CT2、CT3、CT4、CT6、CT7、CT8和1281。
气单胞菌属(Aeromonas)的细菌可被以下噬菌体感染:AA-I、Aeh2、N、PMl、TP446、3、4、11、13、29、31、32、37、43、43-10T、51、54、55R.1、56、56RR2、57、58、59.1、60、63、Aehl、F、PM2、1、25、31、40RR2.8t、(同义词=44R)、(同义词=44RR2.8t)、65、PM3、PM4、PM5和PM6。
芽孢杆菌属(Bacillus)的细菌可被以下噬菌体感染:A、aizl、Al-K-I、B、BCJAl、BCl、BC2、BLLl、BLl、BP142、BSLl、BSL2、BSl、BS3、BS8、BS15、BS18、BS22、BS26、BS28、BS31、BS104、BS105、BS106、BTB、B1715V1、C、CK-I、Coll、Corl、CP-53、CS-I、CSi、D、D、D、D5、entl、FP8、FP9、FSi、FS2、FS3、FS5、FS8、FS9、G、GH8、GT8、GV-I、GV-2、GT-4、g3、gl2、gl3、gl4、gl6、gl7、g21、g23、g24、g29、H2、kenl、KK-88、Kuml、Kyul、J7W-1、LP52、(同义词=LP-52)、L7、Mexl、MJ-I、mor2、MP-7、MPlO、MP12、MP14、MP15、Neol、N°2、N5、N6P、PBCl、PBLA、PBPl、P2、S-a、SF2、SF6、Shal、Sill、SP02、(同义词=ΦSPP1)、SPβ、STI、STi、SU-Il、t、TbI、Tb2、Tb5、TbIO、Tb26、Tb51、Tb53、Tb55、Tb77、Tb97、Tb99、Tb560、Tb595、Td8、Td6、Tdl5、TgI、Tg4、Tg6、Tg7、Tg9、TgIO、TgIl、Tgl3、Tgl5、Tg21、Tinl、Tin7、Tin8、Tinl3、Tm3、Tocl、Togl、toll、TP-I、TP-10vir、TP-15c、TP-16c、TP-17c、TP-19、TP35、TP51、TP-84、Tt4、Tt6、A型、B型、C型、D型、E型、
Figure BDA0003820857320000661
VA-9、W、wx23、wx26、Yunl、α、γ、pl l、
Figure BDA0003820857320000662
Figure BDA0003820857320000663
(同义词=
Figure BDA0003820857320000664
)、IA、IB、1-97A、1-97B、2、2、3、3、3、5、12、14、20、30、35、36、37、38、41C、51、63、64、138D、I、II、IV、NN-芽孢杆菌属(13)、alel、ARl、AR2、AR3、AR7、AR9、Bace-11、(同义词=11)、Bastille、BLl、BL2、BL3、BL4、BL5、BL6、BL8、BL9、BP124、BS28、BS80、Ch、CP-51、CP-54、D-5、darl、denl、DP-7、entl、FoSi、FoS2、FS4、FS6、FS7、G、gall、γ、GEl、GF-2、GSi、GT-I、GT-2、GT-3、GT-4、GT-5、GT-6、GT-7、GV-6、gl5、19、110、ISi、K、MP9、MP13、MP21、MP23、MP24、MP28、MP29、MP30、MP32、MP34、MP36、MP37、MP39、MP40、MP41、MP43、MP44、MP45、MP47、MP50、NLP-I、No.l、N17、N19、PBSl、PKl、PMBl、PMB12、PMJl、S、SPOl、SP3、SP5、SP6、SP7、SP8、SP9、SPlO、SP-15、SP50、(同义词=SP-50)、SP82、SST、subl、SW、Tg8、Tgl2、Tgl3、Tgl4、thul、thuΛ、thuS、Tin4、Tin23、TP-13、TP33、TP50、TSP-I、V型、VI型、V、Vx、β22、
Figure BDA0003820857320000665
1、1、2、2C、3NT、4、5、6、7、8、9、10、12、12、17、18、19、21、138、III、4(巨大芽孢杆菌(B.megateriwn))、4(球形芽孢杆菌(B.sphaericus))、AR13、BPP-IO、BS32、BS107、Bl、B2、GA-I、GP-IO、GV-3、GV-5、g8、MP20、MP27、MP49、Nf、PP5、PP6、SF5、Tgl8、TP-I、Versailles、
Figure BDA0003820857320000666
1-97、837/IV、
Figure BDA0003820857320000667
-芽孢杆菌属(
Figure BDA0003820857320000668
-Bacillus)(1)、BatlO、BSLlO、BSLI l、BS6、BSI l、BS16、BS23、BSlOl、BS102、gl8、morl、PBLl、SN45、thu2、thu3、TmI、Tm2、TP-20、TP21、TP52、F型、G型、IV型、ΗN-BacMus(3)、BLE、(同义词=θc)、BS2、BS4、BS5、BS7、BlO、B12、BS20、BS21、F、MJ-4、PBA12、AP50、AP50-04、AP50-11、AP50-23、AP50-26、AP50-27和Bam35。以下芽孢杆菌属特异性噬菌体为缺陷型的:DLP10716、DLP-11946、DPB5、DPB12、DPB21、DPB22、DPB23、GA-2、M、No.IM、PBLB、PBSH、PBSV、PBSW、PBSX、PBSY、PBSZ、phi、SPa、1型和μ。
拟杆菌属(Bacteriodes)的细菌可被以下噬菌体感染:ad I2、Baf-44、Baf-48B、Baf-64、Bf-I、Bf-52、B40-8、Fl、βl、
Figure BDA0003820857320000671
11、67.1、67.3、68.1、mt-拟杆菌属(3)、Bf42、Bf71、ΗN-蛭弧菌属(1)和BF-41。
博德特氏菌属(Bordetella)的细菌可被以下噬菌体感染:134和NN-博德特氏菌属(3)。
疏螺旋体属(Borrelia)的细菌可被以下噬菌体感染:NN-疏螺旋体属(1)和NN-疏螺旋体属(2)。
布鲁氏菌属(Brucella)的细菌可被以下噬菌体感染:A422、Bk、(同义词=Berkeley)、BM29、FOi、(同义词=FOl)、(同义词=FQl)、D、FP2、(同义词=FP2)、(同义词=FD2)、Fz、(同义词=Fz75/13)、(同义词=Firenze 75/13)、(同义词=Fi)、Fi、(同义词=Fl)、Fim、(同义词=FIm)、(同义词=Fim)、FiU、(同义词=FlU)、(同义词=FiU)、F2、(同义词=F2)、F3、(同义词=F3)、F4、(同义词=F4)、F5、(同义词=F5)、F6、F7、(同义词=F7)、F25、(同义词=F25)、(同义词=£25)、F25U、(同义词=F25u)、(同义词=F25U)、(同义词=F25V)、F44、(同义词-F44)、F45、(同义词=F45)、F48、(同义词=F48)、I、Im、M、MC/75、M51、(同义词=M85)、P、(同义词=D)、S708、R、Tb、(同义词=TB)、(同义词=Tbilisi)、W、(同义词=Wb)、(同义词=Weybridge)、X、3、6、7、10/1、(同义词=10)、(同义词=F8)、(同义词=F8)、12m、24/11、(同义词=24)、(同义词=F9)、(同义词=F9)、45/111、(同义词=45)、75、84、212/XV、(同义词=212)、(同义词=Fi0)、(同义词=FlO)、371/XXIX、(同义词=371)、(同义词=Fn)、(同义词=Fl l)和513。
伯克霍尔德氏菌属(Burkholderia)的细菌可被以下噬菌体感染:CP75、NN-伯克霍尔德氏菌属(1)和42。
弯曲杆菌属(Campylobacter)的细菌可被以下噬菌体感染:C型、NTCC12669、NTCC12670、NTCC12671、NTCC12672、NTCC12673、NTCC12674、NTCC12675、NTCC12676、NTCC12677、NTCC12678、NTCC12679、NTCC12680、NTCC12681、NTCC12682、NTCC12683、NTCC12684、32f、111c、191、NN-弯曲杆菌属(2)、Vfi-6、(同义词=V19)、VfV-3、V2、V3、V8、V16、(同义词=Vfi-1)、V19、V20(V45)、V45、(同义词=V-45)和NN-弯曲杆菌属(1)。
衣原体属(Chlamydia)的细菌可被以下噬菌体感染:Chpl。
梭菌属(Clostridium)的细菌可被以下噬菌体感染:CAKl、CA5、Ca7、CEβ、(同义词=1C)、CEγ、Cldl、c-n71、c-203Tox-、DEβ、(同义词=ID)、(同义词=lDt0X+)、HM3、KMl、KT、Ms、NAl、(同义词=Naltox+)、PA135Oe、Pf
Figure BDA0003820857320000682
PL73、PL78、PL81、Pl、P50、P5771、P19402、lCt0X+、2Ct0X\2D3(同义词=2Dt0X+)、3C、(同义词=3Ctox+)、4C、(同义词=4Ct0X+)、56、III-l、NN-梭菌属(61)、NBlt0X+、αl、CAl、HMT、HM2、PFl5 P-23、P-46、Q-05、Q-oe、Q-16、Q-21、Q-26、Q-40、Q-46、S111、SA02、WA01、WA03、Wm、W523、80、C、CA2、CA3、CPTl、CPT4、cl、c4、c5、HM7、H11/A1、H18/Ax、FWS23、Hi58ZA1、K2ZA1、K21ZS23、ML、NA2t0X;Pf2、Pf3、Pf4、S9ZS3、S41ZA1、S44ZS23、α2、41、112ZS23、214/S23、233/Ai、234/S23、235/S23、II-l、II-2、II-3、NN-梭菌属(12)、CAl、Fl、K、S2、1、5和NN-梭菌属(8)。
棒状杆菌属(Corynebacterium)的细菌可被以下噬菌体感染:CGKl(缺陷型)、A、A2、A3、AlOl、A128、A133、A137、A139、A155、A182、B、BF、B17、B18、B51、B271、B275、B276、B277、B279、B282、C、capi、CCl、CGl、CG2、CG33、CL31、Cog、(同义词=CG5)、D、E、F、H、H-I、hqi、hq2、11ZH33、Ii/31、J、K、K、(同义词=Ktox”)、L、L、(同义词=Ltox+)、M、MC-I、MC-2、MC-3、MC-4、MLMa、N、O、ovi、ov2、ov3、P、P、R、RP6、RS29、S、T、U、UB1、ub2、UH1、UH3、uh3、uh5、uh6、β、(同义词=βtox+)、βhv64、βvir、γ、(同义词=γtoχ-)、γl9、δ、(同义词=δ’ox+)、p、(同义词=ptoχ-)、Φ9、
Figure BDA0003820857320000681
ω、IA、1/1180、2、2/1180、5/1180、5ad/9717、7/4465、8/4465、8ad/10269、10/9253、13Z9253、15/3148、21/9253、28、29、55、2747、2893、4498和5848。
肠球菌属(Enterococcus)的细菌可被以下噬菌体感染:DF78、Fl、F2、1、2、4、14、41、867、Dl、SB24、2BV、182、225、C2、C2F、E3、E62、DS96、H24、M35、P3、P9、SBlOl、S2、2BII、5、182a、705、873、881、940、1051、1057、21096C、NN-肠球菌属(1)、PEl、Fl、F3、F4、VD13、1、200、235和341。
丹毒丝菌属(Erysipelothrix)的细菌可被以下噬菌体感染:NN-丹毒丝菌属(1)。
埃希氏菌属(Escherichia)的细菌可被以下噬菌体感染:BW73、B278、D6、D108、E、El、E24、E41、FI-2、FI-4、FI-5、HI8A、Ffl8B、i、MM、Mu、(同义词=mu)、(同义词=MuI)、(同义词=Mu-I)、(同义词=MU-I)、(同义词=MuI)、(同义词=μ)、025、PhI-5、Pk、PSP3、Pl、PlD、P2、P4(缺陷型)、Sl、
Figure BDA0003820857320000691
Figure BDA0003820857320000692
(缺陷型)、
Figure BDA0003820857320000693
ψ(缺陷型)、7A、
Figure BDA0003820857320000694
15(缺陷型)、18、28-1、186、299、ΗH-埃希氏菌属(2)、AB48、CM、C4、C16、DD-VI、(同义词=Dd-Vi)、(同义词=DDVI)、(同义词=DDVi)、E4、E7、E28、FIl、FI3、H、Hl、H3、H8、K3、M、N、ND-2、ND-3、ND4、ND-5、ND6、ND-7、Ox-I(同义词=OXl)、(同义词=HF)、Ox-2(同义词=0x2)、(同义词=0X2)、Ox-3、Ox-4、Ox-5、(同义词=0X5)、Ox-6、(同义词=66F)、(同义词=
Figure BDA0003820857320000695
)、(同义词=
Figure BDA0003820857320000696
)50111、PhI-I、RB42、RB43、RB49、RB69、S、SaI-I、Sal-2、Sal-3、Sal-4、Sal-5、Sal-6、TC23、TC45、TuII*-6、(同义词=TuII*)、TuIP-24、TuII*46、TuIP-60、T2、(同义词=ganuTia)、(同义词=γ)、(同义词=PC)、(同义词=P.C.)、(同义词=T-2)、(同义词=T2)、(同义词=P4)、T4、(同义词=T-4)、(同义词=T4)、T6、T35、αl、1、IA、3、(同义词=Ac3)、3A、3T+、(同义词=3)、(同义词=Ml)、
Figure BDA0003820857320000697
(同义词=
Figure BDA0003820857320000698
)、9266Q、CFO103、HK620、J、K、KlF、m59、no.A、no.E、no.3、no.9、N4、sd、(同义词=Sd)、(同义词=SD)、(同义词=Sa)3(同义词=sd)、(同义词=SD)、(同义词=CD)、T3、(同义词=T-3)、(同义词=T3)、T7、(同义词=T-7)、(同义词=T7)、WPK、W31、ΔH、
Figure BDA0003820857320000699
Φ04-CF、Φ05、Φ06、Φ07、
Figure BDA00038208573200006910
(同义词=
Figure BDA00038208573200006911
)、Ω8、1、3、7、8、26、27、28-2、29、30、31、32、38、39、42、933W、NN-埃希氏菌属(1)、Esc-7-11、AC30、CVX-5、Cl、DDUP、ECl、EC2、E21、E29、Fl、F26S、F27S、Hi、HK022、HK97、(同义词=ΦHK97)、HK139、HK253、HK256、K7、ND-I、no.D、PA-2、q、S2、Tl、(同义词=α)、(同义词=P28)、(同义词=T-I)、(同义词=Tx)、T3C、T5、(同义词=T-5)、(同义词=T5)、UC-I、w、β4、γ2、λ(同义词=λ)、(同义词=Φλ)、ΦD326、
Figure BDA00038208573200006912
Φ06、Φ7、Φ10、
Figure BDA00038208573200006913
χ、(同义词=χi)、(同义词=
Figure BDA00038208573200006914
)、(同义词=
Figure BDA00038208573200006915
)、2、4、4A、6、8A、102、150、168、174、3000、AC6、AC7、AC28、AC43、AC50、AC57、AC81、AC95、HK243、KlO、ZG/3A、5、5A、21EL、H19-J和933H。
梭杆菌属(Fusobacterium)的细菌可被以下噬菌体感染:NN-梭杆菌属(2)、fv83-554/3、fv88-531/2、227、fv2377、fv2527和fv8501。
嗜血杆菌属(Haemophilus)的细菌可被以下噬菌体感染:HPl、S2和N3。
螺杆菌属(Helicobacter)的细菌可被以下噬菌体感染:HPl和^^-螺杆菌属(1)。
克雷伯氏菌属(Klebsiella)的细菌可被以下噬菌体感染:AIO-2、KI4B、Kl6B、Kl9、(同义词=K19)、Kl14、Kl15、Kl21、Kl28、Kl29、KI32、Kl33、Kl35、Kl106B、Kl171B、Kl181B、Kl832B、AIO-I、AO-I、AO-2、AO-3、FC3-10、K、Kl1、(同义词=KIl)、Kl2、(同义词=K12)、Kl3、(同义词=K13)、(同义词=Kl 70/11)、Kl4、(同义词=K14)、Kl5、(同义词=K15)、Kl6、(同义词=K16)、Kl7、(同义词=K17)、Kl8、(同义词=K18)、Kl19、(同义词=K19)、Kl27、(同义词=K127)、Kl31、(同义词=K131)、Kl35、Kl171B、II、VI、IX、CI-I、Kl4B、Kl8、Kl11、Kl12、Kl13、Kl16、Kl17、Kl18、Kl20、Kl22、Kl23、Kl24、Kl26、Kl30、Kl34、Kl106B、KIi65B、Kl328B、KLXI、K328、P5046、11、380、III、IV、VII、VIII、FC3-11、Kl2B、(同义词=K12B)、Kl25、(同义词=K125)、Kl42B、(同义词=K142)、(同义词=K142B)、Kl181B、(同义词=KIl 81)、(同义词=K1181B)、Kl765/!、(同义词=K1765/1)、Kl842B、(同义词=K1832B)、Kl937B、(同义词=K1937B)、Ll、
Figure BDA0003820857320000701
7、231、483、490、632和864/100。
钩端螺旋体属(Lepitospira)的细菌可被以下噬菌体感染:LEl、LE3、LE4和~NN-钩端螺旋体属(1)。
李斯特菌属(Listeria)的细菌可被以下噬菌体感染:A511、01761、4211、4286、(同义词=BO54)、A005、A006、A020、A500、A502、A511、Al 18、A620、A640、B012、B021、B024、B025、B035、B051、B053、B054、B055、B056、BlOl、BI lO、B545、B604、B653、C707、D441、HSO47、HlOG、H8/73、H19、H21、H43、H46、H107、H108、HI lO、H163/84、H312、H340、H387、H391/73、H684/74、H924A、PSA、U153、
Figure BDA0003820857320000702
(同义词=P35)、00241、00611、02971A、02971C、5/476、5/911、5/939、5/11302、5/11605、5/11704、184、575、633、699/694、744、900、1090、1317、1444、1652、1806、1807、1921/959、1921/11367、1921/11500、1921/11566、1921/12460、1921/12582、1967、2389、2425、2671、2685、3274、3550、3551、3552、4276、4277、4292、4477、5337、5348/11363、5348/11646、5348/12430、5348/12434、10072、11355C、11711A、12029、12981、13441、90666、90816、93253、907515、910716和NN-李斯特菌属(15)。
摩根氏菌属(Morganella)的细菌可被以下噬菌体感染:47。
分枝杆菌属(Mycobacterium)的细菌可被以下噬菌体感染:13、AGl、ALi、ATCC11759、A2、B.C3、BG2、BKl、BK5、butyricum、B-I、B5、B7、B30、B35、Clark、Cl、C2、DNAIII、DSP1、D4、D29、GS4E、(同义词=GS4E)、GS7、(同义词=GS-7)、(同义词=GS7)、IPa、lacticola、Legendre、Leo、L5、(同义词=ΦL-5)、MC-I、MC-3、MC-4、minetti、MTPHI l、Mx4、MyF3P/59a、phlei、(同义词=phlei 1)、phlei 4、Polonus II、rabinovitschi、smegmatis、TM4、TM9、TMlO、TM20、Y7、YlO、
Figure BDA0003820857320000711
IB、IF、IH、1/1、67、106、1430、Bl、(同义词=Bol)、B24、D、D29、F-K、F-S、HP、Polonus I、Roy、Rl、(同义词=Rl-Myb)、(同义词=Ri)、11、31、40、50、103a、103b、128、3111-D、3215-D和NN-分枝杆菌属(1)。
奈瑟菌属(Neisseria)的细菌可被以下噬菌体感染:I组、II组和NPl。
诺卡氏菌属(Nocardia)的细菌可被以下噬菌体感染:MNP8、NJ-L、NS-8、N5和TtiN-诺卡氏菌属。
变形杆菌属(Proteus)的细菌可被以下噬菌体感染:Pm5、13vir、2/44、4/545、6/1004、13/807、20/826、57、67b、78、107/69、121、9/0、22/608、30/680、PmI、Pm3、Pm4、Pm6、Pm7、Pm9、PmIO、PmI l、Pv2、πl、
Figure BDA0003820857320000712
7/549、9B/2、10A/31、12/55、14、15、16/789、17/971、19A/653、23/532、25/909、26/219、27/953、32A/909、33/971、34/13、65、5006M、7480b、VI、13/3a、Clichy 12、π2600、
Figure BDA0003820857320000713
1/1004、5/742、9、12、14、22、24/860、2600/D52、Pm8和24/2514。
普罗威登斯菌属(Providencia)的细菌可被以下噬菌体感染:PL25、PL26、PL37、9211/9295、9213/921Ib、9248、7/R49、7476/322、7478/325、7479、7480、9000/9402和9213/921Ia。
假单胞菌属(Pseudomonas)的细菌可被以下噬菌体感染:PfI、(同义词=Pf-I)、Pf2、Pf3、PP7、PRRl、7s、im-假单胞菌属(1)、AI-I、AI-2、B 17、B89、CB3、Col 2、Col 11、Col18、Col 21、C154、C163、C167、C2121、E79、F8、ga、gb、H22、K1、M4、N2、Nu、PB-I、(同义词=PBl)、pfl6、PMN17、PPl、PP8、Psal、PsPl、PsP2、PsP3、PsP4、PsP5、PS3、PS17、PTB80、PX4、PX7、PYOl、PYO2、PYO5、PYO6、PYO9、PYOlO、PYO13、PYO14、PYO16、PYO18、PYO19、PYO20、PYO29、PYO32、PYO33、PYO35、PYO36、PYO37、PYO38、PYO39、PYO41、PYO42、PYO45、PYO47、PYO48、PYO64、PYO69、PYO103、PlK、SLPl、SL2、S2、UNL-I、wy、Yai、Ya4、Yan、
Figure BDA0003820857320000721
(同义词=ΦKZ)、
Figure BDA0003820857320000722
Φmu78、
Figure BDA0003820857320000723
1/72、2/79、3、3/DO、4/237、5/406、6C、6/6660、7、7v、7/184、8/280、9/95、10/502、11/DE、12/100、12S、16、21、24、25F、27、31、44、68、71、95、109、188、337、352、1214、ΗN-假单胞菌属(23)、A856、B26、CI-I、CI-2、C5、D、gh-1、Fl 16、HF、H90、K5、K6、Kl 04、K109、K166、K267、N4、N5、O6N-25P、PE69、Pf、PPN25、PPN35、PPN89、PPN91、PP2、PP3、PP4、PP6、PP7、PP8、PP56、PP87、PPl 14、PP206、PP207、PP306、PP651、Psp231a、Pssy401、Pssy9220、psi、PTB2、PTB20、PTB42、PXl、PX3、PXlO、PX12、PX14、PYO70、PYO71、R、SH6、SH133、tf、Ya5、Ya7、
Figure BDA0003820857320000724
ΦKf77、
Figure BDA0003820857320000725
ΦmnF82、
Figure BDA0003820857320000726
Figure BDA0003820857320000727
1、2、2、3、4、5、6、7、7、8、9、10、11、12、12B、13、14、15、14、15、16、17、18、19、20、20、21、21、22、23、23、24、25、31、53、73、119x、145、147、170、267、284、308、525、NN-假单胞菌属(5)、af、A7、B3、B33、B39、BI-I、C22、D3、D37、D40、D62、D3112、F7、FlO、g、gd、ge、gξHwl2、Jb 19、KFl、L°、OXN-32P、O6N-52P、PCH-I、PC13-1、PC35-1、PH2、PH51、PH93、PH132、PMW、PM13、PM57、PM61、PM62、PM63、PM69、PM105、PMl 13、PM681、PM682、PO4、PPl、PP4、PP5、PP64、PP65、PP66、PP71、PP86、PP88、PP92、PP401、PP711、PP891、Pssy41、Pssy42、Pssy403、Pssy404、Pssy420、Pssy923、PS4、PS-IO、Pz、SDl、SLl、SL3、SL5、SM、
Figure BDA0003820857320000728
Figure BDA0003820857320000729
2、2F、5、7m、11、13、13/441、14、20、24、40、45、49、61、73、148、160、198、218、222、236、242、246、249、258、269、295、297、309、318、342、350、351、357-1、400-1、ΗN-假单胞菌属(6)、GlOl、M6、M6a、Ll、PB2、Pssyl5、Pssy4210、Pssy4220、PYO12、PYO34、PYO49、PYO50、PYO51、PYO52、PYO53、PYO57、PYO59、PYO200、PX2、PX5、SL4、
Figure BDA0003820857320000731
和1214。
立克次体属(Rickettsia)的细菌可被以下噬菌体感染:NN-立克次体属。
沙门氏菌属(Salmonella)的细菌可被以下噬菌体感染:b、Beccles、CT、d、Dundee、f、FeIs 2、GI、GUI、GVI、GVIII、k、K、i、j、L、01、(同义词=0-1)、(同义词=O1)、(同义词=O-I)、(同义词=7)、02、03、P3、P9a、PlO、Sab3、Sab5、SanlS、Sanl7、SI、Taunton、ViI、(同义词=ViI)、9、imSalmonella(1)、N-I、N-5、N-IO、N-17、N-22、11、12、16-19、20.2、36、449C/C178、966A/C259、a、B.A.O.R.、e、G4、GUI、L、LP7、M、MG40、N-18、PSA68、P4、P9c、P22、(同义词=P22)、(同义词=PLT22)、(同义词=PLT22)、P22al、P22-4、P22-7、P22-11、SNT-I、SNT-2、SP6、Villi、ViIV、ViV、ViVI、ViVII、Worksop、Sj5、ε34、1,37、1(40)、(同义词=
Figure BDA0003820857320000732
)、1,422、2、2.5、3b、4、5、6,14(18)、8、14(6,7)、10、27、28B、30、31、32、33、34、36、37、39、1412、SNT-3、7-11、40.3、c、C236、C557、C625、C966N、g、GV、G5、Gl 73、h、IRA、Jersey、MB78、P22-1、P22-3、P22-12、Sabl、Sab2、Sab2、Sab4、Sanl、San2、San3、San4、San6、San7、San8、San9、Sanl3、Sanl4、Sanl6、Sanl8、Sanl9、San20、San21、San22、San23、San24、San25、San26、SasLl、SasL2、SasL3、SasL4、SasL5、SlBL、SII、ViII、
Figure BDA0003820857320000733
1、2、3a、3al、1010、Ym-沙门氏菌属(1)、N-4、SasL6和27。
沙雷氏菌属(Serratia)的细菌可被以下噬菌体感染:A2P、PS20、SMB3、SMP、SMP5、SM2、V40、V56、ic、ΦCP-3、ΦCP-6、3M、10/la、20A、34CC、34H、38T、345G、345P、501B、SMB2、SMP2、BC、BT、CW2、CW3、CW4、CW5、Lt232、L2232、L34、L.228、SLP、SMPA、V.43、σ、
Figure BDA0003820857320000734
ΦCP6-1、ΦCP6-2、ΦCP6-5、3T、5、8、9F、10/1、2OE、32/6、34B、34CT、34P、37、41、56、56D、56P、6OP、61/6、74/6、76/4、101/8900、226、227、228、229F、286、289、290F、512、764a、2847/10、2847/1Oa、L.359和SMBl。
志贺氏菌属(Shigella)的细菌可被以下噬菌体感染:Fsa、(同义词=a)、FSD2d、(同义词=D2d)、(同义词=W2d)、FSD2E、(同义词=W2e)、fv、F6、f7.8、H-Sh、PE5、P90、SfII、Sh、SHm、SHrv、(同义词=HIV)、SHvi、(同义词=HVI)、SHVvm、(同义词=HVIII)、SKγ66、(同义词=γ66)、(同义词=yββ)、(同义词=γ66b)、SKm、(同义词=SIIIb)5(同义词=UI)、SKw、(同义词=Siva)、(同义词=IV)、SICTM、(同义词=SIVA.)、(同义词=IVA)、SKvi、(同义词=KVI)、(同义词=Svi)、(同义词=VI)、SKvm、(同义词=Svm)、(同义词=VIII)、SKVΠIA、(同义词=SvmA)、(同义词=VIIIA)、STvi、STK、STx1、STxn、S66、W2、(同义词=D2c)、(同义词=D20)、
Figure BDA0003820857320000741
8368-SO-R、F7、(同义词=FS7)、(同义词=K29)、FlO、(同义词=FSlO)、(同义词=K31)、I1、(同义词=α)、(同义词=FSa)、(同义词=Kl 8)、(同义词=α)、I2、(同义词=a)、(同义词=K19)、SG33、(同义词=G35)、(同义词=SO-35/G)、SG35、(同义词=SO-55/G)、SG3201、(同义词=SO-3201/G)、SHn、(同义词=HII)、SHv、(同义词=SHV)、SHx、SHX、SKn、(同义词=K2)、(同义词=KII)、(同义词=Sn)、(同义词=SsII)、(同义词=II)、SKrv、(同义词=Sm)、(同义词=SsIV)、(同义词=IV)、SK1Va、(同义词=Swab)、(同义词=SsIVa)、(同义词=IVa)、SKV、(同义词=K4)、(同义词=KV)、(同义词=SV)、(同义词=SsV)、(同义词=V)、SKx、(同义词=K9)、(同义词=KX)、(同义词=SX)、(同义词=SsX)、(同义词=X)、STV、(同义词=T35)、(同义词=35-50-R)、STvm、(同义词=T8345)、(同义词=8345-SO-S-R)、W1、(同义词=D8)、(同义词=FSD8)、W2a、(同义词=D2A)、(同义词=FS2a)、DD-2、Sf6、FSi、(同义词=Fl)、SF6、(同义词=F6)、SG42、(同义词=SO-42/G)、SG3203、(同义词=SO-3203/G)、SKF12、(同义词=SsF12)、(同义词=F12)、(同义词=F12)、STn、(同义词=1881-SO-R)、γ66、(同义词=γ66a)、(同义词=Ssγ66)、
Figure BDA0003820857320000742
BIl、DDVII、(同义词=DD7)、FSD2b、(同义词=W2B)、FS2、(同义词=F2)、(同义词=F2)、FS4、(同义词=F4)、(同义词=F4)、FS5、(同义词=F5)、(同义词=F5)、FS9、(同义词=F9)、(同义词=F9)、FI l、P2-S0-S、SG36、(同义词=SO-36/G)、(同义词=G36)、SG3204、(同义词=SO-3204/G)、SG3244、(同义词=SO-3244/G)、SHi、(同义词=HI)、SHvπ、(同义词=HVII)、SHK、(同义词=HIX)、SHx1、SHxπ、(同义词=HXn)、SKI、KI、(同义词=S1)、(同义词=SsI)、SKVII、(同义词=KVII)、(同义词=Svπ)、(同义词=SsVII)、SKIX、(同义词=KIX)、(同义词=S1x)、(同义词=SsIX)、SKXII、(同义词=KXII)、(同义词=Sxn)、(同义词=SsXII)、STi、STffl、STrv、STVi、STvπ、S70、S206、U2-S0-S、3210-SO-S、3859-SO-S、4020-SO-S、
Figure BDA0003820857320000743
Figure BDA0003820857320000744
SHm、(同义词=Hπi)、SHχi、(同义词=HXt)和SKxI、(同义词=KXI)、(同义词=Sχi)、(同义词=SsXI)、(同义词=XI)。
葡萄球菌属(Staphylococcus)的细菌可被以下噬菌体感染:A、EW、K、Ph5、Ph9、PhIO、Phl3、Pl、P2、P3、P4、P8、P9、PlO、RG、SB-i、(同义词=Sb-I)、S3K、Twort、ΦSK311、
Figure BDA0003820857320000751
06、40、58、119、130、131、200、1623、STCl、(同义词=stcl)、STC2、(同义词=stc2)、44AHJD、68、ACl、AC2、A6“C”、A9“C”、b581、CA-I、CA-2、CA-3、CA-4、CA-5、DI l、L39x35、L54a、M42、Nl、N2、N3、N4、N5、N7、N8、NlO、Ni l、N12、N13、N14、N16、Ph6、Phl2、Phl4、UC-18、U4、U15、Sl、S2、S3、S4、S5、X2、Z1、
Figure BDA0003820857320000752
ω、11、(同义词=
Figure BDA0003820857320000753
)、(同义词=P11-M15)、15、28、28A、29、31、31B、37、42D、(同义词=P42D)、44A、48、51、52、52A、(同义词=P52A)、52B、53、55、69、71、(同义词=P71)、71A、72、75、76、77、79、80、80α、82、82A、83A、84、85、86、88、88A、89、90、92、95、96、102、107、108、111、129-26、130、130A、155、157、157A、165、187、275、275A、275B、356、456、459、471、471A、489、581、676、898、1139、1154A、1259、1314、1380、1405、1563、2148、2638A、2638B、2638C、2731、2792A、2792B、2818、2835、2848A、3619、5841、12100、AC3、A8、AlO、A13、b594n、D、HK2、N9、N15、P52、P87、Sl、S6、Z4、
Figure BDA0003820857320000754
3A、3B、3C、6、7、16、21、42B、42C、42E、44、47、47A5 47C、51、54、54x1、70、73、75、78、81、82、88、93、94、101、105、110、115、129/16、174、594n、1363/14、2460和mS-葡萄球菌属(1)。
链球菌属(Streptococcus)的细菌可被以下噬菌体感染:EJ-I、NN-链球菌属(1)、a、Cl、FL0Ths、H39、Cp-I、Cρ-5、Cp-7、Cp-9、Cp-IO、AT298、A5、alO/Jl、alO/J2、alO/J5、alO/J9、A25、BTI l、b6、CAl、c20-l、c20-2、DP-I、Dp-4、DTl、ET42、elO、FA101、FEThs、Fκ、FKKIOI、FKLIO、FKP74、FKH、FLOThs、FyIOl、fl、F10、F20140/76、g、GT-234、HB3、(同义词=HB-3)、HB-623、HB-746、M102、O1205、
Figure BDA0003820857320000755
PST、PO、Pl、P2、P3、P5、P6、P8、P9、P9、P12、P13、P14、P49、P50、P51、P52、P53、P54、P55、P56、P57、P58、P59、P64、P67、P69、P71、P73、P75、P76、P77、P82、P83、P88、sc、sch、sf、SfIl 1、(同义词=SFiI l)、(同义词=
Figure BDA0003820857320000756
)、(同义词=ΦSfill)、(同义词=
Figure BDA0003820857320000757
)、sfil9、(同义词=SFil9)、(同义词=
Figure BDA0003820857320000758
)、(同义词=
Figure BDA0003820857320000759
)、Sfi21、(同义词=SFi21)、(同义词=
Figure BDA00038208573200007510
)、(同义词=
Figure BDA00038208573200007511
)、ST0、STX、st2、ST2、ST4、S3、(同义词=
Figure BDA0003820857320000761
s265、Φ17、
Figure BDA0003820857320000762
Φ57、
Figure BDA0003820857320000763
Figure BDA0003820857320000764
Figure BDA0003820857320000765
Φ7201、ωl、ω2、ω3、ω4、ω5、ω6、ω8、ωlO、1、6、9、1OF、12/12、14、17SR、19S、24、50/33、50/34、55/14、55/15、70/35、70/36、71/ST15、71/45、71/46、74F、79/37、79/38、80/J4、80/J9、80/ST16、80/15、80/47、80/48、101、103/39、103/40、121/41、121/42、123/43、123/44、124/44、337/ST17和mStreptococcus(34)。
密螺旋体属(Treponema)的细菌可被以下噬菌体感染:NN-密螺旋体属(1)。
弧菌属(Vibrio)的细菌可被以下噬菌体感染:CTXΦ、fs、(同义词=si)、fs2、Ivpf5、Vfl2、Vf33、VPIΦ、VSK、v6、493、CP-Tl、ET25、κ、K139、Labol、)XN-69P、OXN-86、O6N-21P、PB-I、P147、rp-1、SE3、VA-I、(同义词=VcA-I)、VcA-2、VPl、VP2、VP4、VP7、VP8、VP9、VPlO、VP17、VP18、VP19、X29、(同义词=29d’Herelle)、t、ΦHAWI-1、ΦHAWI-2、ΦHAWI-3、ΦHAWI-4、ΦHAWI-5、ΦHAWI-6、ΦHAWI-7、XHAWI-8、ΦHAWI-9、ΦHAWI-10、ΦHCl-1、ΦHC1-2、ΦHC1-3、ΦHC1-4、ΦHC2-1、>HC2-2、ΦHC2-3、ΦHC2-4、ΦHC3-1、ΦHC3-2、ΦHC3-3、ΦHD1S-1、ΦHD1S-2、ΦHD2S-1、ΦHD2S-2、ΦHD2S-3、ΦHD2S-4、ΦHD2S-5、ΦHDO-1、ΦHDO-2、ΦHDO-3、ΦHDO-4、ΦHDO-5、ΦHDO-6、ΦKL-33、ΦKL-34、ΦKL-35、ΦKL-36、ΦKWH-2、ΦKWH-3、ΦKWH-4、ΦMARQ-1、ΦMARQ-2、ΦMARQ-3、ΦMOAT-1、ΦO139、ΦPEL1A-1、ΦPEL1A-2、ΦPEL8A-1、ΦPEL8A-2、ΦPEL8A-3、ΦPEL8C-1、ΦPEL8C-2、ΦPEL13A-1、ΦPEL13B-1、ΦPEL13B-2、ΦPEL13B-3、ΦPEL13B-4、ΦPEL13B-5、ΦPEL13B-6、ΦPEL13B-7、ΦPEL13B-8、ΦPEL13B-9、ΦPEL13B-10、
Figure BDA0003820857320000766
Φ16、
Figure BDA0003820857320000767
1-II、5、13、14、16、24、32、493、6214、7050、7227、II、(同义词=II组)、(同义词=
Figure BDA0003820857320000768
)、V、VIII、~m-弧菌属(13)、KVP20、KVP40、nt-1、O6N-22P、P68、el、e2、e3、e4、e5、FK、G、I、K、nt-6、Nl、N2、N3、N4、N5、O6N-34P、OXN-72P、OXN-85P、OXN-100P、P、Ph-I、PL163/10、Q、S、T、
Figure BDA0003820857320000769
1-9、37、51、57、70A-8、72A-4、72A-10、110A-4、333、4996、I(同义词=I组)、III(同义词=III组)、VI、(同义词=A-Saratov)、VII、IX、X、ΗN-弧菌属(6)、pAl、7、7-8、70A-2、71A-6、72A-5、72A-8、108A-10、109A-6、109A-8、l lOA-1、110A-5、110A-7、hv-1、OXN-52P、P13、P38、P53、P65、P108、Pill、TPl3 VP3、VP6、VP12、VP13、70A-3、70A-4、70A-10、72A-1、108A-3、109-B1、110A-2、149、(同义词=
Figure BDA0003820857320000771
)、IV、(同义词=IV组)、NN-弧菌属(22)、VP5、VPIl、VP15、VP16、αl、α2、α3a、α3b、353B和ΗN-弧菌属(7)。
耶尔森氏菌属(Yersinia)的细菌可被以下噬菌体感染:H、H-I、H-2、H-3、H-4、Lucas 110、Lucas 303、Lucas 404、YerA3、YerA7、YerA20、YerA41、3/M64-76、5/G394-76、6/C753-76、8/C239-76、9/F18167、1701、1710、PST、1/F2852-76、D'Herelle、EV、H、Kotljarova、PTB、R、Y、YerA41、
Figure BDA0003820857320000772
3、4/C1324-76、7/F783-76、903、1/M6176和Yer2AT。
在一个实施方案中,细菌噬菌体选自沙门氏菌属病毒SKML39、志贺氏菌属病毒AG3、迪克氏菌属(Dickeya)病毒Limestone、迪克氏菌属病毒RC2014、埃希氏菌属病毒CBA120、埃希氏菌属病毒PhaxI、沙门氏菌属病毒38、沙门氏菌属病毒Det7、沙门氏菌属病毒GG32、沙门氏菌属病毒PM10、沙门氏菌属病毒SFP10、沙门氏菌属病毒SH19、沙门氏菌属病毒SJ3、埃希氏菌属病毒ECML4、沙门氏菌属病毒Marshall、沙门氏菌属病毒Maynard、沙门氏菌属病毒SJ2、沙门氏菌属病毒STML131、沙门氏菌属病毒ViI、欧文氏菌属病毒Ea2809、克雷伯氏菌属病毒0507KN21、沙雷氏菌属病毒IME250、沙雷氏菌属病毒MAM1、弯曲杆菌属病毒CP21、弯曲杆菌属病毒CP220、弯曲杆菌属病毒CPt10、弯曲杆菌属病毒IBB35、弯曲杆菌属病毒CP81、弯曲杆菌属病毒CP30A、弯曲杆菌属病毒CPX、弯曲杆菌属病毒NCTC12673、欧文氏菌属病毒Ea214、欧文氏菌属病毒M7、埃希氏菌属病毒AYO145A、埃希氏菌属病毒EC6、埃希氏菌属病毒HY02、埃希氏菌属病毒JH2、埃希氏菌属病毒TP1、埃希氏菌属病毒VpaE1、埃希氏菌属病毒wV8、沙门氏菌属病毒FelixO1、沙门氏菌属病毒HB2014、沙门氏菌属病毒Mushroom、沙门氏菌属病毒UAB87、柠檬酸杆菌属病毒Moogle、柠檬酸杆菌属病毒Mordin、埃希氏菌属病毒SUSP1、埃希氏菌属病毒SUSP2、气单胞菌属病毒phiO18P、嗜血杆菌属病毒HP1、嗜血杆菌属病毒HP2、巴斯德氏菌属(Pasteurella)病毒F108、弧菌属病毒K139、弧菌属病毒κ、伯克霍尔德氏菌属病毒phi52237、伯克霍尔德氏菌属病毒phiE122、伯克霍尔德氏菌属病毒phiE202、埃希氏菌属病毒186、埃希氏菌属病毒P4、埃希氏菌属病毒P2、埃希氏菌属病毒Wphi、曼氏杆菌属(Mannheimia)病毒PHL101、假单胞菌属病毒phiCTX、罗尔斯通氏菌属(Ralstonia)病毒RSA1、沙门氏菌属病毒Fels2、沙门氏菌属病毒PsP3、沙门氏菌属病毒SopEphi、耶尔森氏菌属病毒L413C、葡萄球菌属病毒G1、葡萄球菌属病毒G15、葡萄球菌属病毒JD7、葡萄球菌属病毒K、葡萄球菌属病毒MCE2014、葡萄球菌属病毒P108、葡萄球菌属病毒Rodi、葡萄球菌属病毒S253、葡萄球菌属病毒S25-4、葡萄球菌属病毒SA12、李斯特菌属病毒A511、李斯特菌属病毒P100、葡萄球菌属病毒Remus、葡萄球菌属病毒SA11、葡萄球菌属病毒Stau2、芽孢杆菌属病毒Camphawk、芽孢杆菌属病毒SPO1、芽孢杆菌属病毒BCP78、芽孢杆菌属病毒TsarBomba、葡萄球菌属病毒Twort、肠球菌属病毒phiEC24C、乳杆菌属病毒Lb338-1、乳杆菌属病毒LP65、肠杆菌属病毒PG7、埃希氏菌属病毒CC31、克雷伯氏菌属病毒JD18、克雷伯氏菌属病毒PKO111、埃希氏菌属病毒Bp7、埃希氏菌属病毒IME08、埃希氏菌属病毒JS10、埃希氏菌属病毒JS98、埃希氏菌属病毒QL01、埃希氏菌属病毒VR5、肠杆菌属病毒Eap3、克雷伯氏菌属病毒KP15、克雷伯氏菌属病毒KP27、克雷伯氏菌属病毒Matisse、克雷伯氏菌属病毒Miro、柠檬酸杆菌属病毒Merlin、柠檬酸杆菌属病毒Moon、埃希氏菌属病毒JSE、埃希氏菌属病毒phi1、埃希氏菌属病毒RB49、埃希氏菌属病毒HX01、埃希氏菌属病毒JS09、埃希氏菌属病毒RB69、志贺氏菌属病毒UTAM、沙门氏菌属病毒S16、沙门氏菌属病毒STML198、弧菌属病毒KVP40、弧菌属病毒nt1、弧菌属病毒ValKK3、埃希氏菌属病毒VR7、埃希氏菌属病毒VR20、埃希氏菌属病毒VR25、埃希氏菌属病毒VR26、志贺氏菌属病毒SP18、埃希氏菌属病毒AR1、埃希氏菌属病毒C40、埃希氏菌属病毒E112、埃希氏菌属病毒ECML134、埃希氏菌属病毒HY01、埃希氏菌属病毒Ime09、埃希氏菌属病毒RB3、埃希氏菌属病毒RB14、埃希氏菌属病毒T4、志贺氏菌属病毒Pss1、志贺氏菌属病毒Shfl2、耶尔森氏菌属病毒D1、耶尔森氏菌属病毒PST、不动杆菌属病毒133、气单胞菌属病毒65、气单胞菌属病毒Aeh1、埃希氏菌属病毒RB16、埃希氏菌属病毒RB32、埃希氏菌属病毒RB43、假单胞菌属病毒42、克罗诺杆菌属(Cronobacter)病毒CR3、克罗诺杆菌属病毒CR8、克罗诺杆菌属病毒CR9、克罗诺杆菌属病毒PBES02、果胶杆菌属(Pectobacterium)病毒phiTE、克罗诺杆菌属病毒GAP31、埃希氏菌属病毒4MG、沙门氏菌属病毒SE1、沙门氏菌属病毒SSE121、埃希氏菌属病毒FFH2、埃希氏菌属病毒FV3、埃希氏菌属病毒JES2013、埃希氏菌属病毒V5、短芽孢杆菌属病毒Abouo、短芽孢杆菌属病毒Davies、芽孢杆菌属病毒Agate、芽孢杆菌属病毒Bobb、芽孢杆菌属病毒Bp8pC、欧文氏菌属病毒Deimos、欧文氏菌属病毒Ea35-70、欧文氏菌属病毒RAY、欧文氏菌属病毒Simmy50、欧文氏菌属病毒SpecialG、不动杆菌属病毒AB1、不动杆菌属病毒AB2、不动杆菌属病毒AbC62、不动杆菌属病毒AP22、节杆菌属病毒ArV1、节杆菌属病毒Trina、芽孢杆菌属病毒AvesoBmore、芽孢杆菌属病毒B4、芽孢杆菌属病毒Bigbertha、芽孢杆菌属病毒Riley、芽孢杆菌属病毒Spock、芽孢杆菌属病毒Troll、芽孢杆菌属病毒Bastille、芽孢杆菌属病毒CAM003、芽孢杆菌属病毒Bc431、芽孢杆菌属病毒Bcp1、芽孢杆菌属病毒BCP82、芽孢杆菌属病毒BM15、芽孢杆菌属病毒Deepblue、芽孢杆菌属病毒JBP901、伯克霍尔德氏菌属病毒Bcep1、伯克霍尔德氏菌属病毒Bcep43、伯克霍尔德氏菌属病毒Bcep781、伯克霍尔德氏菌属病毒BcepNY3、黄单胞菌属病毒OP2、伯克霍尔德氏菌属病毒BcepMu、伯克霍尔德氏菌属病毒phiE255、气单胞菌属病毒44RR2、分枝杆菌属病毒Alice、分枝杆菌属病毒Bxz1、分枝杆菌属病毒Dandelion、分枝杆菌属病毒HyRo、分枝杆菌属病毒I3、分枝杆菌属病毒Nappy、分枝杆菌属病毒Sebata、梭菌属病毒phiC2、梭菌属病毒phiCD27、梭菌属病毒phiCD119、芽孢杆菌属病毒CP51、芽孢杆菌属病毒JL、芽孢杆菌属病毒Shanette、埃希氏菌属病毒CVM10、埃希氏菌属病毒ep3、欧文氏菌属病毒Asesino、欧文氏菌属病毒EaH2、假单胞菌属病毒EL、盐单胞菌属(Halomonas)病毒HAP1、弧菌属病毒VP882、短芽孢杆菌属病毒Jimmer、短芽孢杆菌属病毒Osiris、假单胞菌属病毒Ab03、假单胞菌属病毒KPP10、假单胞菌属病毒PAKP3、中华根瘤菌属(Sinorhizobium)病毒M7、中华根瘤菌属病毒M12、中华根瘤菌属病毒N3、欧文氏菌属病毒Machina、节杆菌属病毒Brent、节杆菌属病毒Jawnski、节杆菌属病毒Martha、节杆菌属病毒Sonny、爱德华菌属(Edwardsiella)病毒MSW3、爱德华菌属病毒PEi21、埃希氏菌属病毒Mu、志贺氏菌属病毒SfMu、盐杆菌属(Halobacterium)病毒phiH、芽孢杆菌属病毒Grass、芽孢杆菌属病毒NIT1、芽孢杆菌属病毒SPG24、气单胞菌属病毒43、埃希氏菌属病毒P1、假单胞菌属病毒CAb1、假单胞菌属病毒CAb02、假单胞菌属病毒JG004、假单胞菌属病毒PAKP1、假单胞菌属病毒PAKP4、假单胞菌属病毒PaP1、伯克霍尔德氏菌属病毒BcepF1、假单胞菌属病毒141、假单胞菌属病毒Ab28、假单胞菌属病毒DL60、假单胞菌属病毒DL68、假单胞菌属病毒F8、假单胞菌属病毒JG024、假单胞菌属病毒KPP12、假单胞菌属病毒LBL3、假单胞菌属病毒LMA2、假单胞菌属病毒PB1、假单胞菌属病毒SN、假单胞菌属病毒PA7、假单胞菌属病毒phiKZ、根瘤菌属病毒RHEph4、罗尔斯通氏菌属病毒RSF1、罗尔斯通氏菌属病毒RSL2、罗尔斯通氏菌属病毒RSL1、气单胞菌属病毒25、气单胞菌属病毒31、气单胞菌属病毒Aes12、气单胞菌属病毒Aes508、气单胞菌属病毒AS4、窄食单胞菌属(Stenotrophomonas)病毒IME13、葡萄球菌属病毒IPLAC1C、葡萄球菌属病毒SEP1、沙门氏菌属病毒SPN3US、芽孢杆菌属病毒1、土芽孢杆菌属(Geobacillus)病毒GBSV1、耶尔森氏菌属病毒R1RT、耶尔森氏菌属病毒TG1、芽孢杆菌属病毒G、芽孢杆菌属病毒PBS1、微囊藻属(Microcystis)病毒Ma-LMM01、弧菌属病毒MAR、弧菌属病毒VHML、弧菌属病毒VP585、芽孢杆菌属病毒BPS13、芽孢杆菌属病毒Hakuna、芽孢杆菌属病毒Megatron、芽孢杆菌属病毒WPh、不动杆菌属病毒AB3、不动杆菌属病毒Abp1、不动杆菌属病毒Fri1、不动杆菌属病毒IME200、不动杆菌属病毒PD6A3、不动杆菌属病毒PDAB9、不动杆菌属病毒phiAB1、埃希氏菌属病毒K30、克雷伯氏菌属病毒K5、克雷伯氏菌属病毒K11、克雷伯氏菌属病毒Kp1、克雷伯氏菌属病毒KP32、克雷伯氏菌属病毒KpV289、克雷伯氏菌属病毒F19、克雷伯氏菌属病毒K244、克雷伯氏菌属病毒Kp2、克雷伯氏菌属病毒KP34、克雷伯氏菌属病毒KpV41、克雷伯氏菌属病毒KpV71、克雷伯氏菌属病毒KpV475、克雷伯氏菌属病毒SU503、克雷伯氏菌属病毒SU552A、泛菌属(Pantoea)病毒Limelight、泛菌属病毒Limezero、假单胞菌属病毒LKA1、假单胞菌属病毒phiKMV、黄单胞菌属病毒f20、黄单胞菌属病毒f30、木杆菌属(Xylella)病毒Prado、欧文氏菌属病毒Era103、埃希氏菌属病毒K5、埃希氏菌属病毒K1-5、埃希氏菌属病毒K1E、沙门氏菌属病毒SP6、埃希氏菌属病毒T7、克吕沃尔氏菌属(Kluyvera)病毒Kvp1、假单胞菌属病毒gh1、原绿球藻属(Prochlorococcus)病毒PSSP7、聚球藻属(Synechococcus)病毒P60、聚球藻属病毒Syn5、链球菌属病毒Cp1、链球菌属病毒Cp7、葡萄球菌属病毒44AHJD、链球菌属病毒C1、芽孢杆菌属病毒B103、芽孢杆菌属病毒GA1、芽孢杆菌属病毒phi29、库特氏菌属(Kurthia)病毒6、放线菌属病毒Av1、支原体属病毒P1、埃希氏菌属病毒24B、埃希氏菌属病毒933W、埃希氏菌属病毒Min27、埃希氏菌属病毒PA28、埃希氏菌属病毒Stx2 II、志贺氏菌属病毒7502Stx、志贺氏菌属病毒POCJ13、埃希氏菌属病毒191、埃希氏菌属病毒PA2、埃希氏菌属病毒TL2011、志贺氏菌属病毒VASD、伯克霍尔德氏菌属病毒Bcep22、伯克霍尔德氏菌属病毒Bcepil02、伯克霍尔德氏菌属病毒Bcepmigl、伯克霍尔德氏菌属病毒DC1、博德特氏菌属病毒BPP1、伯克霍尔德氏菌属病毒BcepC6B、噬纤维素菌属(Cellulophaga)病毒Cba41、噬纤维素菌属病毒Cba172、沟鞭藻玫瑰杆菌属(Dinoroseobacter)病毒DFL12、欧文氏菌属病毒Ea9-2、欧文氏菌属病毒Frozen、埃希氏菌属病毒phiV10、沙门氏菌属病毒ε15、沙门氏菌属病毒SPN1S、假单胞菌属病毒F116、假单胞菌属病毒H66、埃希氏菌属病毒APEC5、埃希氏菌属病毒APEC7、埃希氏菌属病毒Bp4、埃希氏菌属病毒EC1UPM、埃希氏菌属病毒ECBP1、埃希氏菌属病毒G7C、埃希氏菌属病毒IME11、志贺氏菌属病毒Sb1、无色杆菌属(Achromobacter)病毒Axp3、无色杆菌属病毒JWAlpha、爱德华菌属病毒KF1、假单胞菌属病毒KPP25、假单胞菌属病毒R18、假单胞菌属病毒Ab09、假单胞菌属病毒LIT1、假单胞菌属病毒PA26、假单胞菌属病毒Ab22、假单胞菌属病毒CHU、假单胞菌属病毒LUZ24、假单胞菌属病毒PAA2、假单胞菌属病毒PaP3、假单胞菌属病毒PaP4、假单胞菌属病毒TL、假单胞菌属病毒KPP21、假单胞菌属病毒LUZ7、埃希氏菌属病毒N4、沙门氏菌属病毒9NA、沙门氏菌属病毒SP069、沙门氏菌属病毒BTP1、沙门氏菌属病毒HK620、沙门氏菌属病毒P22、沙门氏菌属病毒ST64T、志贺氏菌属病毒Sf6、芽孢杆菌属病毒Page、芽孢杆菌属病毒Palmer、芽孢杆菌属病毒Pascal、芽孢杆菌属病毒Pony、芽孢杆菌属病毒Pookie、埃希氏菌属病毒172-1、埃希氏菌属病毒ECB2、埃希氏菌属病毒NJ01、埃希氏菌属病毒phiEco32、埃希氏菌属病毒Septima11、埃希氏菌属病毒SU10、布鲁氏菌属病毒Pr、布鲁氏菌属病毒Tb、埃希氏菌属病毒Pollock、沙门氏菌属病毒FSL SP-058、沙门氏菌属病毒FSL SP-076、螺杆菌属(Helicobacter)病毒1961P、螺杆菌属病毒KHP30、螺杆菌属病毒KHP40、Hamiltonella病毒APSE1、乳球菌属(Lactococcus)病毒KSY1、席藻属(Phormidium)病毒WMP3、席藻属病毒WMP4、假单胞菌属病毒119X、玫瑰杆菌属(Roseobacter)病毒SIO1、弧菌属病毒VpV262、弧菌属病毒VC8、弧菌属病毒VP2、弧菌属病毒VP5、链霉菌属病毒Amela、链霉菌属病毒phiCAM、链霉菌属病毒Aaronocolus、链霉菌属病毒Caliburn、链霉菌属病毒Danzina、链霉菌属病毒Hydra、链霉菌属病毒Izzy、链霉菌属病毒Lannister、链霉菌属病毒Lika、链霉菌属病毒Sujidade、链霉菌属病毒Zemlya、链霉菌属病毒ELB20、链霉菌属病毒R4、链霉菌属病毒phiHau3、分枝杆菌属病毒Acadian、分枝杆菌属病毒Baee、分枝杆菌属病毒Reprobate、分枝杆菌属病毒Adawi、分枝杆菌属病毒Bane1、分枝杆菌属病毒BrownCNA、分枝杆菌属病毒Chrisnmich、分枝杆菌属病毒Cooper、分枝杆菌属病毒JAMaL、分枝杆菌属病毒Nigel、分枝杆菌属病毒Stinger、分枝杆菌属病毒Vincenzo、分枝杆菌属病毒Zemanar、分枝杆菌属病毒Apizium、分枝杆菌属病毒Manad、分枝杆菌属病毒Oline、分枝杆菌属病毒Osmaximus、分枝杆菌属病毒Pg1、分枝杆菌属病毒Soto、分枝杆菌属病毒Suffolk、分枝杆菌属病毒Athena、分枝杆菌属病毒Bernardo、分枝杆菌属病毒Gadjet、分枝杆菌属病毒Pipefish、分枝杆菌属病毒Godines、分枝杆菌属病毒Rosebush、分枝杆菌属病毒Babsiella、分枝杆菌属病毒Brujita、分枝杆菌属病毒Che9c、分枝杆菌属病毒Sbash、分枝杆菌属病毒Hawkeye、分枝杆菌属病毒Plot、沙门氏菌属病毒AG11、沙门氏菌属病毒Ent1、沙门氏菌属病毒f18SE、沙门氏菌属病毒Jersey、沙门氏菌属病毒L13、沙门氏菌属病毒LSPA1、沙门氏菌属病毒SE2、沙门氏菌属病毒SETP3、沙门氏菌属病毒SETP7、沙门氏菌属病毒SETP13、沙门氏菌属病毒SP101、沙门氏菌属病毒SS3e、沙门氏菌属病毒wksl3、埃希氏菌属病毒K1G、埃希氏菌属病毒K1H、埃希氏菌属病毒K1ind1、埃希氏菌属病毒K1ind2、沙门氏菌属病毒SP31、明串球菌属病毒Lmd1、明串球菌属病毒LN03、明串球菌属病毒LN04、明串球菌属病毒LN12、明串球菌属病毒LN6B、明串球菌属病毒P793、明串球菌属病毒1A4、明串球菌属病毒Ln8、明串球菌属病毒Ln9、明串球菌属病毒LN25、明串球菌属病毒LN34、明串球菌属病毒LNTR3、分枝杆菌属病毒Bongo、分枝杆菌属病毒Rey、分枝杆菌属病毒Butters、分枝杆菌属病毒Michelle、分枝杆菌属病毒Charlie、分枝杆菌属病毒Pipsqueaks、分枝杆菌属病毒Xeno、分枝杆菌属病毒Panchino、分枝杆菌属病毒Phrann、分枝杆菌属病毒Redi、分枝杆菌属病毒Skinnyp、戈登氏菌属病毒BaxterFox、戈登氏菌属病毒Yeezy、戈登氏菌属病毒Kita、戈登氏菌属病毒Zirinka、戈登氏菌属病毒Nymphadora、分枝杆菌属病毒Bignuz、分枝杆菌属病毒Brusacoram、分枝杆菌属病毒Donovan、分枝杆菌属病毒Fishburne、分枝杆菌属病毒Jebeks、分枝杆菌属病毒Malithi、分枝杆菌属病毒Phayonce、肠杆菌属病毒F20、克雷伯氏菌属病毒1513、克雷伯氏菌属病毒KLPN1、克雷伯氏菌属病毒KP36、克雷伯氏菌属病毒PKP126、克雷伯氏菌属病毒Sushi、埃希氏菌属病毒AHP42、埃希氏菌属病毒AHS24、埃希氏菌属病毒AKS96、埃希氏菌属病毒C119、埃希氏菌属病毒E41c、埃希氏菌属病毒Eb49、埃希氏菌属病毒Jk06、埃希氏菌属病毒KP26、埃希氏菌属病毒Rogue1、埃希氏菌属病毒ACGM12、埃希氏菌属病毒Rtp、埃希氏菌属病毒ADB2、埃希氏菌属病毒JMPW1、埃希氏菌属病毒JMPW2、埃希氏菌属病毒T1、志贺氏菌属病毒PSf2、志贺氏菌属病毒Shfl1、柠檬酸杆菌属病毒Stevie、埃希氏菌属病毒TLS、沙门氏菌属病毒SP126、克罗诺杆菌属病毒Esp2949-1、假单胞菌属病毒Ab18、假单胞菌属病毒Ab19、假单胞菌属病毒PaMx11、节杆菌属病毒Amigo、丙酸杆菌属病毒Anatole、丙酸杆菌属病毒B3、芽孢杆菌属病毒Andromeda、芽孢杆菌属病毒Blastoid、芽孢杆菌属病毒Curly、芽孢杆菌属病毒Eoghan、芽孢杆菌属病毒Finn、芽孢杆菌属病毒Glittering、芽孢杆菌属病毒Riggi、芽孢杆菌属病毒Taylor、戈登氏菌属病毒Attis、分枝杆菌属病毒Barnyard、分枝杆菌属病毒Konstantine、分枝杆菌属病毒Predator、分枝杆菌属病毒Bernal13、葡萄球菌属病毒13、葡萄球菌属病毒77、葡萄球菌属病毒108PVL、分枝杆菌属病毒Bron、分枝杆菌属病毒Faith1、分枝杆菌属病毒Joedirt、分枝杆菌属病毒Rumpelstiltskin、乳球菌属病毒bIL67、乳球菌属病毒c2、乳杆菌属病毒c5、乳杆菌属病毒Ld3、乳杆菌属病毒Ld17、乳杆菌属病毒Ld25A、乳杆菌属病毒LLKu、乳杆菌属病毒phiLdb、噬纤维素菌属病毒Cba121、噬纤维素菌属病毒Cba171、噬纤维素菌属病毒Cba181、噬纤维素菌属病毒ST、芽孢杆菌属病毒250、芽孢杆菌属病毒IEBH、分枝杆菌属病毒Ardmore、分枝杆菌属病毒Avani、分枝杆菌属病毒Boomer、分枝杆菌属病毒Che8、分枝杆菌属病毒Che9d、分枝杆菌属病毒Deadp、分枝杆菌属病毒Dlane、分枝杆菌属病毒Dorothy、分枝杆菌属病毒Dotproduct、分枝杆菌属病毒Drago、分枝杆菌属病毒Fruitloop、分枝杆菌属病毒Gumbie、分枝杆菌属病毒Ibhubesi、分枝杆菌属病毒Llij、分枝杆菌属病毒Mozy、分枝杆菌属病毒Mutaforma13、分枝杆菌属病毒Pacc40、分枝杆菌属病毒PMC、分枝杆菌属病毒Ramsey、分枝杆菌属病毒Rockyhorror、分枝杆菌属病毒SG4、分枝杆菌属病毒Shauna1、分枝杆菌属病毒Shilan、分枝杆菌属病毒Spartacus、分枝杆菌属病毒Taj、分枝杆菌属病毒Tweety、分枝杆菌属病毒Wee、分枝杆菌属病毒Yoshi、沙门氏菌属病毒Chi、沙门氏菌属病毒FSLSP030、沙门氏菌属病毒FSLSP088、沙门氏菌属病毒iEPS5、沙门氏菌属病毒SPN19、分枝杆菌属病毒244、分枝杆菌属病毒Bask21、分枝杆菌属病毒CJW1、分枝杆菌属病毒Eureka、分枝杆菌属病毒Kostya、分枝杆菌属病毒Porky、分枝杆菌属病毒Pumpkin、分枝杆菌属病毒Sirduracell、分枝杆菌属病毒Toto、分枝杆菌属病毒Corndog、分枝杆菌属病毒Firecracker、红细菌属病毒RcCronus、假单胞菌属病毒D3112、假单胞菌属病毒DMS3、假单胞菌属病毒FHA0480、假单胞菌属病毒LPB1、假单胞菌属病毒MP22、假单胞菌属病毒MP29、假单胞菌属病毒MP38、假单胞菌属病毒PA1KOR、假单胞菌属病毒D3、假单胞菌属病毒PMG1、节杆菌属病毒Decurro、戈登氏菌属病毒Demosthenes、戈登氏菌属病毒Katyusha、戈登氏菌属病毒Kvothe、丙酸杆菌属病毒B22、丙酸杆菌属病毒Doucette、丙酸杆菌属病毒E6、丙酸杆菌属病毒G4、伯克霍尔德氏菌属病毒phi6442、伯克霍尔德氏菌属病毒phi1026b、伯克霍尔德氏菌属病毒phiE125、爱德华氏菌属病毒eiAU、分枝杆菌属病毒Ff47、分枝杆菌属病毒Muddy、分枝杆菌属病毒Gaia、分枝杆菌属病毒Giles、节杆菌属病毒Captnmurica、节杆菌属病毒Gordon、戈登氏菌属病毒GordTnk2、类芽孢杆菌属(Paenibacillus)病毒Harrison、埃希氏菌属病毒EK99P1、埃希氏菌属病毒HK578、埃希氏菌属病毒JL1、埃希氏菌属病毒SSL2009a、埃希氏菌属病毒YD2008s、志贺氏菌属病毒EP23、伴突属(Sodalis)病毒SO1、埃希氏菌属病毒HK022、埃希氏菌属病毒HK75、埃希氏菌属病毒HK97、埃希氏菌属病毒HK106、埃希氏菌属病毒HK446、埃希氏菌属病毒HK542、埃希氏菌属病毒HK544、埃希氏菌属病毒HK633、埃希氏菌属病毒mEp234、埃希氏菌属病毒mEp235、埃希氏菌属病毒mEpX1、埃希氏菌属病毒mEpX2、埃希氏菌属病毒mEp043、埃希氏菌属病毒mEp213、埃希氏菌属病毒mEp237、埃希氏菌属病毒mEp390、埃希氏菌属病毒mEp460、埃希氏菌属病毒mEp505、埃希氏菌属病毒mEp506、短芽孢杆菌属病毒Jenst、无色杆菌属病毒83-24、无色杆菌属病毒JWX、节杆菌属病毒Kellezzio、节杆菌属病毒Kitkat、节杆菌属病毒Bennie、节杆菌属病毒DrRobert、节杆菌属病毒Glenn、节杆菌属病毒HunterDalle、节杆菌属病毒Joann、节杆菌属病毒Korra、节杆菌属病毒Preamble、节杆菌属病毒Pumancara、节杆菌属病毒Wayne、分枝杆菌属病毒Alma、分枝杆菌属病毒Arturo、分枝杆菌属病毒Astro、分枝杆菌属病毒Backyardigan、分枝杆菌属病毒BBPiebs31、分枝杆菌属病毒Benedict、分枝杆菌属病毒Bethlehem、分枝杆菌属病毒Billknuckles、分枝杆菌属病毒Bruns、分枝杆菌属病毒Bxb1、分枝杆菌属病毒Bxz2、分枝杆菌属病毒Che12、分枝杆菌属病毒Cuco、分枝杆菌属病毒D29、分枝杆菌属病毒Doom、分枝杆菌属病毒Ericb、分枝杆菌属病毒Euphoria、分枝杆菌属病毒George、分枝杆菌属病毒Gladiator、分枝杆菌属病毒Goose、分枝杆菌属病毒Hammer、分枝杆菌属病毒Heldan、分枝杆菌属病毒Jasper、分枝杆菌属病毒JC27、分枝杆菌属病毒Jeffabunny、分枝杆菌属病毒JHC117、分枝杆菌属病毒KBG、分枝杆菌属病毒Kssjeb、分枝杆菌属病毒Kugel、分枝杆菌属病毒L5、分枝杆菌属病毒Lesedi、分枝杆菌属病毒LHTSCC、分枝杆菌属病毒lockley、分枝杆菌属病毒Marcell、分枝杆菌属病毒Microwolf、分枝杆菌属病毒Mrgordo、分枝杆菌属病毒Museum、分枝杆菌属病毒Nepal、分枝杆菌属病毒Packman、分枝杆菌属病毒Peaches、分枝杆菌属病毒Perseus、分枝杆菌属病毒Pukovnik、分枝杆菌属病毒Rebeuca、分枝杆菌属病毒Redrock、分枝杆菌属病毒Ridgecb、分枝杆菌属病毒Rockstar、分枝杆菌属病毒Saintus、分枝杆菌属病毒Skipole、分枝杆菌属病毒Solon、分枝杆菌属病毒Switzer、分枝杆菌属病毒SWU1、分枝杆菌属病毒Ta17a、分枝杆菌属病毒Tiger、分枝杆菌属病毒Timshel、分枝杆菌属病毒Trixie、分枝杆菌属病毒Turbido、分枝杆菌属病毒Twister、分枝杆菌属病毒U2、分枝杆菌属病毒Violet、分枝杆菌属病毒Wonder、埃希氏菌属病毒DE3、埃希氏菌属病毒HK629、埃希氏菌属病毒HK630、埃希氏菌属病毒λ、节杆菌属病毒Laroye、分枝杆菌属病毒Halo、分枝杆菌属病毒Liefie、分枝杆菌属病毒Marvin、分枝杆菌属病毒Mosmoris、节杆菌属病毒Circum、节杆菌属病毒Mudcat、埃希氏菌属病毒N15、埃希氏菌属病毒9g、埃希氏菌属病毒JenK1、埃希氏菌属病毒JenP1、埃希氏菌属病毒JenP2、假单胞菌属病毒NP1、假单胞菌属病毒PaMx25、分枝杆菌属病毒Baka、分枝杆菌属病毒Courthouse、分枝杆菌属病毒Littlee、分枝杆菌属病毒ω、分枝杆菌属病毒Optimus、分枝杆菌属病毒Thibault、极地杆菌属(Polaribacter)病毒P12002L、极地杆菌属病毒P12002S、不滑动菌属(Nonlabens)病毒P12024L、不滑动菌属病毒P12024S、栖热菌属(Thermus)病毒P23-45、栖热菌属病毒P74-26、李斯特菌属病毒LP26、李斯特菌属病毒LP37、李斯特菌属病毒LP110、李斯特菌属病毒LP114、李斯特菌属病毒P70、丙酸杆菌属病毒ATCC29399BC、丙酸杆菌属病毒ATCC29399BT、丙酸杆菌属病毒Attacne、丙酸杆菌属病毒Keiki、丙酸杆菌属病毒Kubed、丙酸杆菌属病毒Lauchelly、丙酸杆菌属病毒MrAK、丙酸杆菌属病毒Ouroboros、丙酸杆菌属病毒P91、丙酸杆菌属病毒P105、丙酸杆菌属病毒P144、丙酸杆菌属病毒P1001、丙酸杆菌属病毒P1.1、丙酸杆菌属病毒P100A、丙酸杆菌属病毒P100D、丙酸杆菌属病毒P101A、丙酸杆菌属病毒P104A、丙酸杆菌属病毒PA6、丙酸杆菌属病毒Pacnes201215、丙酸杆菌属病毒PAD20、丙酸杆菌属病毒PAS50、丙酸杆菌属病毒PHL009M11、丙酸杆菌属病毒PHL025M00、丙酸杆菌属病毒PHL037M02、丙酸杆菌属病毒PHL041M10、丙酸杆菌属病毒PHL060L00、丙酸杆菌属病毒PHL067M01、丙酸杆菌属病毒PHL070N00、丙酸杆菌属病毒PHL071N05、丙酸杆菌属病毒PHL082M03、丙酸杆菌属病毒PHL092M00、丙酸杆菌属病毒PHL095N00、丙酸杆菌属病毒PHL111M01、丙酸杆菌属病毒PHL112N00、丙酸杆菌属病毒PHL113M01、丙酸杆菌属病毒PHL114L00、丙酸杆菌属病毒PHL116M00、丙酸杆菌属病毒PHL117M00、丙酸杆菌属病毒PHL117M01、丙酸杆菌属病毒PHL132N00、丙酸杆菌属病毒PHL141N00、丙酸杆菌属病毒PHL151M00、丙酸杆菌属病毒PHL151N00、丙酸杆菌属病毒PHL152M00、丙酸杆菌属病毒PHL163M00、丙酸杆菌属病毒PHL171M01、丙酸杆菌属病毒PHL179M00、丙酸杆菌属病毒PHL194M00、丙酸杆菌属病毒PHL199M00、丙酸杆菌属病毒PHL301M00、丙酸杆菌属病毒PHL308M00、丙酸杆菌属病毒Pirate、丙酸杆菌属病毒Procrass1、丙酸杆菌属病毒SKKY、丙酸杆菌属病毒Solid、丙酸杆菌属病毒Stormborn、丙酸杆菌属病毒Wizzo、假单胞菌属病毒PaMx28、假单胞菌属病毒PaMx74、分枝杆菌属病毒Patience、分枝杆菌属病毒PBI1、红球菌属(Rhodococcus)病毒Pepy6、红球菌属病毒Poco6、丙酸杆菌属病毒PFR1、链霉菌属病毒phiBT1、链霉菌属病毒phiC31、链霉菌属病毒TG1、柄杆菌属(Caulobacter)病毒Karma、柄杆菌属病毒Magneto、柄杆菌属病毒phiCbK、柄杆菌属病毒Rogue、柄杆菌属病毒Swift、葡萄球菌属病毒11、葡萄球菌属病毒29、葡萄球菌属病毒37、葡萄球菌属病毒53、葡萄球菌属病毒55、葡萄球菌属病毒69、葡萄球菌属病毒71、葡萄球菌属病毒80、葡萄球菌属病毒85、葡萄球菌属病毒88、葡萄球菌属病毒92、葡萄球菌属病毒96、葡萄球菌属病毒187、葡萄球菌属病毒52a、葡萄球菌属病毒80α、葡萄球菌属病毒CNPH82、葡萄球菌属病毒EW、葡萄球菌属病毒IPLA5、葡萄球菌属病毒IPLA7、葡萄球菌属病毒IPLA88、葡萄球菌属病毒PH15、葡萄球菌属病毒phiETA、葡萄球菌属病毒phiETA2、葡萄球菌属病毒phiETA3、葡萄球菌属病毒phiMR11、葡萄球菌属病毒phiMR25、葡萄球菌属病毒phiNM1、葡萄球菌属病毒phiNM2、葡萄球菌属病毒phiNM4、葡萄球菌属病毒SAP26、葡萄球菌属病毒X2、肠球菌属病毒FL1、肠球菌属病毒FL2、肠球菌属病毒FL3、乳杆菌属病毒ATCC8014、乳杆菌属病毒phiJL1、片球菌属(Pediococcus)病毒cIP1、气单胞菌属病毒pIS4A、李斯特菌属病毒LP302、李斯特菌属病毒PSA、甲烷杆菌属(Methanobacterium)病毒psiM1、玫瑰杆菌属病毒RDJL1、玫瑰杆菌属病毒RDJL2、红球菌属病毒RER2、肠球菌属病毒BC611、肠球菌属病毒IMEEF1、肠球菌属病毒SAP6、肠球菌属病毒VD13、链球菌属病毒SPQS1、分枝杆菌属病毒Papyrus、分枝杆菌属病毒Send513、伯克霍尔德氏菌属病毒KL1、假单胞菌属病毒73、假单胞菌属病毒Ab26、假单胞菌属病毒Kakheti25、埃希氏菌属病毒Cajan、埃希氏菌属病毒Seurat、葡萄球菌属病毒SEP9、葡萄球菌属病毒Sextaec、链球菌属病毒858、链球菌属病毒2972、链球菌属病毒ALQ132、链球菌属病毒O1205、链球菌属病毒Sfi11、链球菌属病毒7201、链球菌属病毒DT1、链球菌属病毒phiAbc2、链球菌属病毒Sfi19、链球菌属病毒Sfi21、类芽孢杆菌属病毒Diva、类芽孢杆菌属病毒Hb10c2、类芽孢杆菌属病毒Rani、类芽孢杆菌属病毒Shelly、类芽孢杆菌属病毒Sitara、类芽孢杆菌属病毒Willow、乳球菌属病毒712、乳球菌属病毒ASCC191、乳球菌属病毒ASCC273、乳球菌属病毒ASCC281、乳球菌属病毒ASCC465、乳球菌属病毒ASCC532、乳球菌属病毒Bibb29、乳球菌属病毒bIL170、乳球菌属病毒CB13、乳球菌属病毒CB14、乳球菌属病毒CB19、乳球菌属病毒CB20、乳球菌属病毒jj50、乳球菌属病毒P2、乳球菌属病毒P008、乳球菌属病毒sk1、乳球菌属病毒Sl4、芽孢杆菌属病毒Slash、芽孢杆菌属病毒Stahl、芽孢杆菌属病毒Staley、芽孢杆菌属病毒Stills、戈登氏菌属病毒Bachita、戈登氏菌属病毒ClubL、戈登氏菌属病毒OneUp、戈登氏菌属病毒Smoothie、戈登氏菌属病毒Soups、芽孢杆菌属病毒SPbeta、弧菌属病毒MAR10、弧菌属病毒SSP002、埃希氏菌属病毒AKFV33、埃希氏菌属病毒BF23、埃希氏菌属病毒DT57C、埃希氏菌属病毒EPS7、埃希氏菌属病毒FFH1、埃希氏菌属病毒H8、埃希氏菌属病毒slur09、埃希氏菌属病毒T5、沙门氏菌属病毒118970sal2、沙门氏菌属病毒Shivani、沙门氏菌属病毒SPC35、沙门氏菌属病毒Stitch、节杆菌属病毒Tank、冢村氏菌属(Tsukamurella)病毒TIN2、束村氏菌属病毒TIN3、束村氏菌属病毒TIN4、红细菌属病毒RcSpartan、红细菌属病毒RcTitan、分枝杆菌属病毒Anaya、分枝杆菌属病毒Angelica、分枝杆菌属病毒Crimd、分枝杆菌属病毒Fionnbarth、分枝杆菌属病毒Jaws、分枝杆菌属病毒Larva、分枝杆菌属病毒Macncheese、分枝杆菌属病毒Pixie、分枝杆菌属病毒TM4、芽孢杆菌属病毒BMBtp2、芽孢杆菌属病毒TP21、土芽孢杆菌属病毒Tp84、葡萄球菌属病毒47、葡萄球菌属病毒3a、葡萄球菌属病毒42e、葡萄球菌属病毒IPLA35、葡萄球菌属病毒phi12、葡萄球菌属病毒phiSLT、分枝杆菌属病毒32HC、红球菌属病毒RGL3、类芽孢杆菌属病毒Vegas、戈登氏菌属病毒Vendetta、芽孢杆菌属病毒Wbeta、分枝杆菌属病毒Wildcat、戈登氏菌属病毒Twister6、戈登氏菌属病毒Wizard、戈登氏菌属病毒Hotorobo、戈登氏菌属病毒Monty、戈登氏菌属病毒Woes、黄单胞菌属病毒CP1、黄单胞菌属病毒OP1、黄单胞菌属病毒phil7、黄单胞菌属病毒Xop411、黄单胞菌属病毒Xp10、链霉菌属病毒TP1604、链霉菌属病毒YDN12、α-变形菌门(Alphaproteobacteria)病毒phiJl001、假单胞菌属病毒LKO4、假单胞菌属病毒M6、假单胞菌属病毒MP1412、假单胞菌属病毒PAE1、假单胞菌属病毒Yua、假交替单胞菌属(Pseudoalteromonas)病毒PM2、假单胞菌属病毒phi6、假单胞菌属病毒phi8、假单胞菌属病毒phi12、假单胞菌属病毒phi13、假单胞菌属病毒phi2954、假单胞菌属病毒phiNN、假单胞菌属病毒phiYY、弧菌属病毒fs1、弧菌属病毒VGJ、罗尔斯通氏菌属病毒RS603、罗尔斯通氏菌属病毒RSM1、罗尔斯通氏菌属病毒RSM3、埃希氏菌属病毒M13、埃希氏菌属病毒I22、沙门氏菌属病毒IKe、无胆甾原体属(Acholeplasma)病毒L51、弧菌属病毒fs2、弧菌属病毒VFJ、埃希氏菌属病毒If1、丙酸杆菌属病毒B5、假单胞菌属病毒Pf1、假单胞菌属病毒Pf3、罗尔斯通氏菌属病毒PE226、罗尔斯通氏菌属病毒RSS1、螺原体属(Spiroplasma)病毒SVTS2、窄食单胞菌属病毒PSH1、窄食单胞菌属病毒SMA6、窄食单胞菌属病毒SMA7、窄食单胞菌属病毒SMA9、弧菌属病毒CTXphi、弧菌属病毒KSF1、弧菌属病毒VCY、弧菌属病毒Vf33、弧菌属病毒VfO3K6、黄单胞菌属病毒Cf1c、螺原体属病毒C74、螺原体属病毒R8A2B、螺原体属病毒SkV1CR23x、埃希氏菌属病毒FI、埃希氏菌属病毒Qβ、埃希氏菌属病毒BZ13、埃希氏菌属病毒MS2、埃希氏菌属病毒α3、埃希氏菌属病毒ID21、埃希氏菌属病毒ID32、埃希氏菌属病毒ID62、埃希氏菌属病毒NC28、埃希氏菌属病毒NC29、埃希氏菌属病毒NC35、埃希氏菌属病毒phiK、埃希氏菌属病毒St1、埃希氏菌属病毒WA45、埃希氏菌属病毒G4、埃希氏菌属病毒ID52、埃希氏菌属病毒Talmos、埃希氏菌属病毒phiX174、蛭弧菌属病毒MAC1、蛭弧菌属(Bdellovibrio)病毒MH2K、衣原体属(Chlamydia)病毒Chp1、衣原体属病毒Chp2、衣原体属病毒CPAR39、衣原体属病毒CPG1、螺原体属病毒SpV4、无胆甾原体属病毒L2、假单胞菌属病毒PR4、假单胞菌属病毒PRD1、芽孢杆菌属病毒AP50、芽孢杆菌属病毒Bam35、芽孢杆菌属病毒GIL16、芽孢杆菌属病毒Wip1、埃希氏菌属病毒phi80、埃希氏菌属病毒RB42、埃希氏菌属病毒T2、埃希氏菌属病毒T3、埃希氏菌属病毒T6、埃希氏菌属病毒VT2-Sa、埃希氏菌属病毒VT1-Sakai、埃希氏菌属病毒VT2-Sakai、埃希氏菌属病毒CP-933V、埃希氏菌属病毒P27、埃希氏菌属病毒Stx2phi-I、埃希氏菌属病毒Stx1phi、埃希氏菌属病毒Stx2phi-II、埃希氏菌属病毒CP-1639、基于埃希氏菌属病毒BP-4795、埃希氏菌属病毒86、埃希氏菌属病毒Min27、埃希氏菌属病毒2851、埃希氏菌属病毒1717、埃希氏菌属病毒YYZ-2008、埃希氏菌属病毒EC026_P06、埃希氏菌属病毒ECO103_P15、埃希氏菌属病毒ECO103_P12、埃希氏菌属病毒ECO111_P16、埃希氏菌属病毒ECO111_P11、埃希氏菌属病毒VT2phi_272、埃希氏菌属病毒TL-2011c、埃希氏菌属病毒P13374、埃希氏菌属病毒Sp5。
在一个实施方案中,细菌病毒颗粒通常靶向大肠杆菌,并且包括选自以下的细菌噬菌体的衣壳:BW73、B278、D6、D108、E、El、E24、E41、FI-2、FI-4、FI-5、HI8A、Ffl8B、i、MM、Mu、025、PhI-5、Pk、PSP3、Pl、PlD、P2、P4、Sl、
Figure BDA0003820857320000891
7A、
Figure BDA0003820857320000892
18、28-1、186、299、ΗH-埃希氏菌属(2)、AB48、CM、C4、C16、DD-VI、E4、E7、E28、FIl、FI3、H、Hl、H3、H8、K3、M、N、ND-2、ND-3、ND4、ND-5、ND6、ND-7、Ox-I、Ox-2、Ox-3、Ox-4、Ox-5、Ox-6、PhI-I、RB42、RB43、RB49、RB69、S、SaI-I、Sal-2、Sal-3、Sal-4、Sal-5、Sal-6、TC23、TC45、TuII*-6、TuIP-24、TuII*46、TuIP-60、T2、T4、T6、T35、αl、1、IA、3、3A、3T+、
Figure BDA0003820857320000901
9266Q、CFO103、HK620、J、K、KlF、m59、no.A、no.E、no.3、no.9、N4、sd、T3、T7、WPK、W31、ΔH、
Figure BDA0003820857320000902
Φ04-CF、Φ05、Φ06、Φ07、
Figure BDA0003820857320000903
Figure BDA0003820857320000904
Ω8、1、3、7、8、26、27、28-2、29、30、31、32、38、39、42、933W、NN-埃希氏菌属(1)、Esc-7-11、AC30、CVX-5、Cl、DDUP、ECl、EC2、E21、E29、Fl、F26S、F27S、Hi、HK022、HK97、HK139、HK253、HK256、K7、ND-I、PA-2、q、S2、Tl、)、T3C、T5、UC-I、w、β4、γ2、λ、ΦD326、
Figure BDA0003820857320000905
Φ06、Φ7、Φ10、
Figure BDA0003820857320000906
χ、2、4、4A、6、8A、102、150、168、174、3000、AC6、AC7、AC28、AC43、AC50、AC57、AC81、AC95、HK243、KlO、ZG/3A、5、5A、21EL、H19-J和933H。
本公开提供药用或兽用组合物,其包含一种或多种本文公开的细菌递送媒介物和药学上可接受的载体。通常,对于药用用途,细菌递送媒介物可配制成药用制剂或组合物,其包含至少一种细菌递送媒介物和至少一种药学上可接受的载体、稀释剂或赋形剂以及任选地一种或多种其他药用活性化合物。这种制剂可呈适合于口服给予,胃肠外给予(比如通过静脉内、肌内或皮下注射或静脉内输注),局部给予,通过吸入、皮肤贴片、植入物、栓剂等给予的形式。这种给予形式取决于给予的方式和途径可为固体、半固体或液体。例如,用于口服给予的制剂可提供有肠溶衣,所述肠溶衣允许制剂中的合成细菌递送媒介物抵抗胃环境并进入肠道。更一般地,用于口服给予的合成细菌递送媒介物制剂可适当地配制以递送到胃肠道任何期望的部分。另外,合适的栓剂可用于递送到胃肠道中。可用于细菌递送媒介物组合物的各种药学上可接受的载体、稀释剂和赋形剂为技术人员已知的。
还提供了用于使用本文公开的细菌递送媒介物或组合物治疗由细菌引起的疾病或障碍比如细菌感染的方法。该方法包括给予患有需要治疗的细菌感染的受试者本文公开的细菌递送媒介物或组合物。在一些实施方案中,受试者为哺乳动物。在一些实施方案中,受试者为人类。
本公开的药用或兽用组合物可进一步包含药学上可接受的媒介物。固体药学上可接受的媒介物可包括一种或多种物质,其也可用作矫味剂、润滑剂、增溶剂、助悬剂、染料、填充剂、助流剂、压缩助剂、惰性粘合剂、甜味剂、防腐剂、染料、包衣剂或片剂崩解剂。合适的固体媒介物包括例如磷酸钙、硬脂酸镁、滑石粉、糖、乳糖、糊精、淀粉、明胶、纤维素、聚乙烯吡咯烷酮、低熔点蜡和离子交换树脂。
药用或兽用组合物可制备为无菌固体组合物,其可在给予时使用无菌水、盐水或其他适当的无菌可注射介质悬浮。本公开的药用或兽用组合物可以含有以下物质的无菌溶液剂或混悬剂的形式口服给予:其他溶质或助悬剂(例如足够的盐水或葡萄糖以使溶液等渗)、胆汁盐、阿拉伯胶、明胶、失水山梨醇单油酸酯、聚山梨酯80(与环氧乙烷共聚合的山梨醇及其酸酐的油酸酯)等。本公开的颗粒也可以液体或固体组合物的形式口服给予。适合于口服给予的组合物包括固体形式(比如丸剂、胶囊剂、颗粒剂、片剂和粉剂)以及液体形式(比如溶液剂、糖浆剂、酏剂和混悬剂)。可用于肠内给予的形式包括无菌溶液剂、乳剂和混悬剂。
本公开的细菌递送媒介物可溶解或悬浮于药学上可接受的液体媒介物比如水、有机溶剂、两者的混合物或者药学上可接受的油或脂肪中。液体媒介物可含有其他合适的药用添加剂,比如增溶剂、乳化剂、缓冲剂、防腐剂、甜味剂、矫味剂、助悬剂、增稠剂、着色剂、粘度调节剂、稳定剂或渗透压调节剂。用于口服和肠内给予的液体媒介物的合适实例包括水(部分地含有如上的添加剂,例如纤维素衍生物,优选地为羧甲基纤维素钠溶液)、醇(包括一元醇和多元醇,例如二醇)及其衍生物和油(例如分馏的椰子油和花生油)。对于胃肠外给予,媒介物也可为油性酯,比如油酸乙酯和肉豆蔻酸异丙酯。无菌液体媒介物可用于肠内给予的无菌液体形式组合物。用于加压组合物的液体媒介物可为卤代烃或其他药学上可接受的抛射剂。
对于经皮给予,药用或兽用组合物可配制成软膏剂、乳膏剂或凝胶剂形式,并且可使用适当的渗透剂或去污剂来促进渗透,比如二甲基亚砜、二甲基乙酰胺和二甲基甲酰胺。
对于经粘膜给予,可使用鼻喷雾剂、直肠或阴道栓剂。活性化合物可通过本领域已知的方法掺入到任何已知的栓剂基质中。这种基质的实例包括可可脂、聚乙二醇(碳蜡)、聚乙烯失水山梨醇单硬脂酸酯以及这些与其他相容性材料的混合物,以改变熔点或溶出速率。
由细菌引起的疾病或障碍可选自腹部绞痛、寻常痤疮、急性会厌炎、关节炎、菌血症、血性腹泻、肉毒杆菌中毒、布鲁氏菌病、脑脓肿、软下疳、性病、衣原体、克罗恩氏病、结膜炎、胆囊炎、结肠直肠癌、息肉病、生态失调、莱姆病、腹泻、白喉、十二指肠溃疡、心内膜炎、丹毒丝菌病(erysipelothricosis)、肠热症、发热、肾小球肾炎、胃肠炎、胃溃疡、格巴二氏综合征、破伤风、淋病、牙龈炎、炎性肠病、肠易激综合征、钩端螺旋体病、麻风病、李斯特菌病、肺结核、温夫人综合征、军团菌病、脑膜炎、粘液脓性结膜炎、多药抗性细菌感染、多药抗性细菌携带、肌坏死-气性坏疽、鸟分枝杆菌复合群、新生儿坏死性小肠结肠炎、诺卡氏菌病、医院感染、耳炎、牙周炎、咽炎、肺炎、腹膜炎、紫癜热、落基山斑疹热、志贺氏菌病、梅毒、鼻窦炎、乙状结肠炎、败血症、皮下脓肿、兔热病、气管支气管炎、扁桃体炎、伤寒、溃疡性结肠炎、尿路感染、百日咳。
由细菌引起的疾病或障碍可为选自以下的细菌感染:皮肤感染如痤疮,肠道感染如食道炎、胃炎、肠炎、结肠炎、乙状结肠炎、直肠炎和腹膜炎,尿路感染,阴道感染,女性上生殖道感染如输卵管炎、子宫内膜炎、卵巢炎、子宫肌炎、子宫旁组织炎和盆腔腹膜感染,呼吸道感染如肺炎,羊膜内感染,牙源性感染,牙髓感染,纤维化,脑膜炎,血流感染,医院感染如导管相关感染、医院获得性肺炎、产后感染、医院获得性胃肠炎、医院获得性尿路感染及其组合。在一个实施方案中,本公开的感染由呈现抗生素抗性的细菌引起。在一个特定实施方案中,感染由如上文在目标细菌中列出的细菌引起。在另一个实施方案中,本公开的感染由表达毒素(比如志贺毒素)的细菌引起。在一个特定实施方案中,感染由产生志贺毒素的大肠杆菌(STEC)引起。
由细菌引起的疾病或障碍也可为代谢障碍,例如肥胖症和/或糖尿病。因此,本公开还涉及用于治疗包括例如肥胖症和/或糖尿病在内的代谢障碍的如本文公开的药用或兽用组合物。其进一步涉及用于治疗代谢障碍的方法(其包括给予治疗有效量的如本文公开的药用或兽用组合物),以及如本文公开的药用或兽用组合物用于制造用于治疗代谢障碍的药物的用途。
由细菌引起的疾病或障碍也可能是涉及人类微生物组细菌的病理学。因此,在一个特定实施方案中,本公开涉及用于治疗涉及人类微生物组的细菌的病理学比如炎症性和自身免疫性疾病、癌症、感染或脑部障碍的如本文公开的药用或兽用组合物。其进一步涉及用于治疗涉及人类微生物组细菌的病理学的方法(其包括给予治疗有效量的如本文公开的药用或兽用组合物),以及如本文公开的药用或兽用组合物用于制造用于治疗涉及人类微生物组细菌的病理学的药物的用途。事实上,微生物组的一些细菌在不触发任何感染的情况下,可以分泌诱导和/或增强炎症或自身免疫性疾病或癌症发展的分子。更具体而言,本公开内容还涉及调节微生物组的组成以改善免疫疗法的功效,所述免疫疗法基于例如CAR-T(嵌合抗原受体T)细胞、TIL(肿瘤浸润性淋巴细胞)、以及也称为抑制性T细胞的Treg(调节性T细胞)。调节微生物组的组成以改善免疫疗法的功效,还可以包括本领域众所周知的免疫检查点抑制剂的使用,所述抑制剂例如但不限于PD-1(程序性细胞死亡蛋白1)抑制剂、PD-L1(程序性死亡配体1)抑制剂和CTLA-4(细胞毒性T淋巴细胞相关蛋白4)。
微生物组的一些细菌也可分泌影响脑部的分子,比如用于治疗抑郁症、痴呆症或睡眠障碍的血清素和褪黑激素。
因此,本公开的另一个目的为一种用于控制受试者的微生物组的方法,其包括在所述受试者中给予有效量的如本文公开的药用或兽用组合物。
在一个特定实施方案中,本公开还涉及一种用于对需要治疗疾病或障碍比如细菌感染的个体进行个性化治疗的方法,其包括:i)从个体获得生物样品并测定来自样品的一组细菌DNA序列;ii)基于序列的测定,鉴定样品中的一种或多种致病性细菌菌株或物种;和iii)给予个体本公开的药用或兽用组合物,所述药用或兽用组合物能够识别样品中鉴定的每种致病性细菌菌株或物种并递送包装的质粒。本公开还涉及用于治疗疾病或障碍比如细菌感染的本公开药用或兽用组合物,其中药用或兽用组合物通过包括以下步骤的方法获得:i)从待治疗的个体获得生物样品并测定来自样品的一组细菌DNA序列;ii)基于序列的测定,鉴定样品中的一种或多种致病性细菌菌株或物种,和iii)制备能够识别样品中鉴定的每种致病性细菌菌株或物种并递送包装的质粒的药用或兽用组合物。
在一个实施方案中,生物样品包含病理性和非病理性细菌物种,并且在给予个体本公开的药用或兽用组合物之后,个体上或体内致病性细菌的量减少,但非致病性细菌的量并未减少。
在另一个特定实施方案中,本公开涉及用于提高药物有效性的本公开药用或兽用组合物。事实上,已知微生物组的一些细菌虽然本身并不具有致病性,但能够代谢药物并将其修饰为无效或有害的分子。
在另一个特定实施方案中,本公开涉及一种组合物,其可进一步包含至少一种另外的活性成分,例如益生元和/或益生菌和/或抗生素,和/或另一种抗菌或抗生物膜剂和/或增强细菌递送媒介物对细菌的靶向和/或有效载荷向细菌的传递的任何试剂。
如本文使用的“益生元”是指允许胃肠道微生物群的组成和/或活性两者发生可赋予宿主益处的特定变化的成分。益生元可为可食用的食物或饮料或其成分。益生元可为选择性发酵的成分。益生元可包括复合碳水化合物、氨基酸、肽、矿物质或用于细菌组合物存活的其他必需营养组分。益生元包括(但不限于)氨基酸、生物素、果寡糖、半乳寡糖、半纤维素(例如阿拉伯木聚糖、木聚糖、木葡聚糖和葡甘露聚糖)、菊粉、几丁质、乳果糖、甘露寡糖、富含低聚果糖的菊粉、树胶(例如瓜尔胶、阿拉伯树胶和角叉菜胶)、低聚果糖、低聚右旋糖、塔格糖、抗性麦芽糖糊精(例如抗性淀粉)、反式半乳寡糖、果胶(例如木糖聚半乳糖醛酸(xylogalactouronan)、柑橘果胶、苹果果胶和鼠李聚糖半乳糖醛酸-I)、膳食纤维(例如大豆纤维、甜菜纤维、豌豆纤维、玉米麸和燕麦纤维)和木寡糖。
如本文使用的“益生菌”是指基于活微生物的膳食补充剂,其当摄入足够量时,通过增强肠道生态系统对宿主生物体产生有益影响。益生菌可包含具有或不具有一种或多种益生元的非致病性细菌或真菌群体,例如免疫调节细菌群体,比如抗炎细菌群体。它们含有足够高数量的活的和活跃的益生菌微生物,其可通过直接定殖对肠道菌群发挥平衡作用。必须注意的是,出于本说明书的目的,术语“益生菌”意指益生菌的任何生物活性形式,优选地包括(但不限于)乳酸杆菌(lactobacilli)、双歧杆菌(bifidobacteria)、链球菌(streptococci)、肠球菌(enterococci)、丙酸杆菌(propionibacteria)或酵母菌(saccharomycetes),而且甚至包括组成正常肠道菌群的其他微生物,或者还包括这些微生物的细菌壁或DNA的片段。这些组合物有利于适合于安全给予人类和其他哺乳动物受试者,并且对于治疗、预防由细菌引起的疾病或障碍比如细菌感染为有效的。益生菌包括(但不限于)乳酸杆菌、双歧杆菌、链球菌、肠球菌、丙酸杆菌、酵母菌、乳酸杆菌、双歧杆菌或变形菌门。
抗生素可以选自青霉素类,例如青霉素G、青霉素K、青霉素N、青霉素O、青霉素V、甲氧西林、苄青霉素、萘夫西林、苯唑西林、氯唑西林、双氯西林、氨苄西林、阿莫西林、匹氨西林、海他西林、巴氨西林、美坦西林、酞氨西林、依匹西林、羧苄西林、替卡西林、替莫西林、美洛西林和哌拉西林;头孢菌素类,例如头孢乙腈、头孢羟氨苄、头孢氨苄、头孢来星、头孢洛宁、头孢噻啶、头孢噻吩、头孢匹林、头孢曲嗪、头孢氮氟、头孢西酮、头孢唑啉、头孢拉定、头孢沙定、头孢替唑、头孢克洛、头孢尼西、头孢丙烯、头孢呋辛、头孢唑南、头孢美唑、头孢替坦、头孢西丁、氯碳头孢、头孢拉宗、头孢米诺、头孢替坦、头孢西丁、头孢替安、头孢卡品、头孢达肟、头孢地尼、头孢托仑、头孢他美、头孢克肟、头孢甲肟、头孢地嗪、头孢噻肟、头孢维星、头孢咪唑、头孢泊肟、头孢特仑、ceftamere、头孢布烯、头孢噻呋、头孢噻林、头孢唑肟、头孢曲松、头孢哌酮、头孢他啶、拉氧头孢、头孢克定、头孢吡肟、头孢瑞南、头孢噻利、头孢唑兰、头孢匹罗、头孢喹肟、氟氧头孢、头孢比普、头孢洛林、头孢洛扎、头孢洛仑、头孢帕罗、头孢卡奈、头孢屈洛、头孢吡酮、头孢三唑、头孢维曲、头孢马替林、cefmepidium、头孢噁唑、头孢罗替、头孢舒米、头孢噻氧、头孢呋汀和头孢硝噻吩;多粘菌素类,例如多链丝霉素(polysporin)、新孢霉素、多粘菌素B和多粘菌素E,利福平类,例如利福平、利福喷丁和利福昔明;非达霉素;喹诺酮类,例如西诺沙星、萘啶酸、噁喹酸、吡咯米酸、吡哌酸、罗索沙星、环丙沙星、依诺沙星、氟罗沙星、洛美沙星、那氟沙星、诺氟沙星、氧氟沙星、培氟沙星、芦氟沙星、巴洛沙星、格帕沙星、左氧氟沙星、帕珠沙星、替马沙星、托氟沙星、克林沙星、加替沙星、吉米沙星、莫西沙星、西他沙星、曲伐沙星、普卢利沙星、德拉沙星、奈诺沙星和扎波沙星;磺胺类,例如磺胺异噁唑、磺胺乙酰胺、磺胺嘧啶、磺胺二甲嘧啶、磺胺异噁唑、磺胺索嘧啶、磺胺多辛、磺胺甲噁唑、磺胺噁唑、磺胺硝苯、磺胺二甲氧嘧啶、磺胺甲氧哒嗪、磺胺对甲氧嘧啶、磺胺多辛、磺胺甲氧嗪和对苯二酚(terephtyl);大环内酯类,例如阿奇霉素、克拉霉素、红霉素、非达霉素、泰利霉素、碳霉素(carbomycin)A、交沙霉素、吉他霉素、麦迪霉素、夹竹桃霉素、索利霉素、螺旋霉素、醋竹桃霉素、泰乐菌素和罗红霉素;酮内酯类,例如泰利霉素和赛红霉素;氟酮内酯类,例如索利霉素;林可酰胺类,例如林可霉素、克林霉素和吡利霉素;四环素类,例如地美环素、多西环素、米诺环素、土霉素和四环素;氨基糖苷类,例如阿米卡星、地贝卡星、庆大霉素、卡那霉素、新霉素、奈替米星、西索米星、妥布霉素、巴龙霉素和链霉素;安莎霉素类,例如格尔德霉素、除莠霉素和利福昔明;碳头孢烯类,例如氯碳头孢;碳青霉烯类,例如厄他培南、多利培南、亚胺培南(或西司他丁)和美罗培南;糖肽类,例如替考拉宁、万古霉素、特拉万星、达巴万星和奥利万星;林可酰胺类,例如克林霉素和林可霉素;脂肽类,例如达托霉素;单内酰胺类,例如氨曲南;硝基呋喃类,例如呋喃唑酮和呋喃妥因;噁唑烷酮类,例如利奈唑胺、posizolid、雷德唑胺和特地唑胺;泰斯巴汀、氯法齐明、氨苯砜、卷曲霉素、环丝氨酸、乙胺丁醇、乙硫异烟胺、异烟肼、吡嗪酰胺、利福布汀、胂凡钠明、氯霉素、磷霉素、夫西地酸、甲硝唑、莫匹罗星、平板霉素、喹奴普丁(或达福普汀)、甲砜霉素、替加环素、替硝唑、甲氧苄啶、阿拉曲沙星、非达霉素、萘啶酸、利福平、其衍生物和组合。
在另一个特定实施方案中,本公开涉及任何感兴趣的化合物(包括治疗性化合物,比如用于哺乳动物的预防性和治疗性疫苗)的原位细菌产生。感兴趣的化合物可在目标细菌内产生、从目标细菌分泌或在目标细菌表面表达。在一个更特定实施方案中,抗原在用于预防性和/或治疗性疫苗接种的目标细菌表面表达。
本公开还涉及细菌递送颗粒的非治疗性用途。例如,非治疗性用途可为美容用途或用于改善受试者,特别是并未患有疾病的受试者的健康的用途。因此,本公开还涉及一种包含本公开的细菌递送颗粒的美容组合物或非治疗性组合物。
本发明将通过以下实施例进一步说明。
实施例
实施例1
λ包装的粘粒源于λPaPa,后者为野生型Ur-λ噬菌体的变体,在stf基因中具有移码突变[7],导致截短的蛋白,其为无活性的STF蛋白,即没有生物活性的蛋白。在大多数实验室研究中,λPaPa已用作事实上的野生型λ噬菌体,因为与野生型Ur-λ相对照,其会产生更易于处理的更大斑块。stf基因编码侧尾丝蛋白,在λ噬菌体的情况下,该蛋白识别细胞表面的次要受体OmpC。
这种次要受体允许噬菌体颗粒在细胞表面瞬时结合,以扫描表面并将注入机构定位于与主要受体接触(在λ的情况下为LamB,由λ蛋白gpJ介导的相互作用)。由于STF结合为可逆的,其允许噬菌体在细胞表面“行走”,直至发现主要受体并开始感染过程。这些蛋白复合物有时称为“L形丝”(比如T5中)、“侧尾丝”(比如λ中)、“长尾丝”(比如T4中)或尾刺(比如噬菌体P22中)[7]-[10]。对于一些噬菌体,这种第二组蛋白的存在为发生感染过程所必需的,比如T4[8]。在一些其他噬菌体中,如λ,这种第二组蛋白对于发生感染过程不是必需的,但其可允许更有效地附着于目标细胞[7]。
λ噬菌体基因组的野生型长度为48.5kbp。众所周知,λ仅能包装37.7kbp-51kbp[11],或为野生型长度的约78%-105%的DNA。较小的DNA有效载荷不会在衣壳内建立足够的压力以发生包装终止,而较大的DNA有效载荷会使衣壳太不稳定。另外,在存在较高的外部渗透压的情况下,较小的基因组显示出以低得多的效率喷出[12]:随着衣壳化DNA的长度减小,喷射力在两个极端大小之间(37.7-51kbp)以指数方式下降。也已知有效载荷越小,包装颗粒形成的效率就越低[11]。结合这两个观察结果,可以得出结论,如果需要足够高的滴度进行体内实验,则较小的DNA有效载荷将为有害的。
大多数使用λ系统(以及许多其他系统)包装的噬菌粒比野生型噬菌体的长度小得多。包装是可能的,因为粘粒经σ复制途径形成多连体:当多连体落在野生型λ基因组长度的74%-105%之间时,包装终止并形成成熟的包装粘粒[11]。这意味着与野生型λ基因组相比较,这些颗粒不会具有均一长度的包装DNA:将存在74%-105%基因组长度的整个范围。例如,在[11]中显示12.8kb的粘粒被包装成三聚体和四聚体,这对应于38.4kb和51.2kb(在允许的包装大小范围内);在约15%的颗粒中发现了38.4kb的变体,而在约40%的颗粒中发现了51.2kb。类似地,显示4.6kb的质粒被包装成9-聚体、10-聚体和11-聚体(41.4kb、46kb和50.6kb)。在这种情况下,41kb的变体为最常见的,约20%的颗粒具有这种大小,然后为50.6kb变体,约占12%;46kb变体仅存在于约5%的颗粒中。
对于体内应用,比如口服递送衣壳化的DNA颗粒,需要以足够高的浓度给予包装噬菌粒以到达所有目标细胞;因此,给予足够高滴度的有效载荷对于优化体内活性以及制造过程至关重要。
最后,除具有适当大小的有效载荷之外,包装颗粒还需要能够足够牢固且长地结合其目标细胞以进行注入过程。先前表明,在K-12实验室菌株中,λ介导的体外转导实验不需要STF的存在[7]。
在此,发明人出乎意料地表明,当进行基于λ的包装噬菌粒的体内递送测定时,被包装为正确长度的多连体的合适的有效载荷以及功能性侧尾丝均大大地提高效率。发明人在本文中还出乎意料地证明,对于除模型K12菌株以外的菌株,来自可特异性地识别目标细菌表面抗原/受体的其他噬菌体的STF和/或gpJ可用于产生在体外和体内介导有效递送的工程改造的λ病毒颗粒。
使用建立的定殖方案[13]开发了一种使用具有工程改造的链霉素抗性的大肠杆菌菌株MG1655或衍生物的小鼠模型。小鼠(Balb/c ByJ,7周)用已知减少肠道中的天然大肠菌群的短疗程链霉素治疗[14]。这种治疗允许给予外源性大肠杆菌并定殖空生态位,同时保持天然微生物群中存在的其他物种。具体而言,动物用饮用水中的5g/L链霉素治疗5天疗程。在管饲包装的噬菌粒之前5天停止治疗,以避免由于抗生素进化压力所致的任何偏差和抗性选择。
为测试包装噬菌粒psgRNAcos的体内递送效率,将携带卡那霉素抗性基因的SEQID NO:1的2.5kb粘粒包装成编码非功能性stf基因的λPaPa颗粒。为实现这一点,将粘粒转化到大肠杆菌菌株中,该菌株携带缺乏cos位点的λ原噬菌体,但在其他方面具有用于诱导λ噬菌体裂解循环的所有机构以及DNA包装系统。λ原噬菌体的cI阻遏物携带使其热敏并使得可通过温度变化诱导裂解循环的突变。含有λ粘粒的细胞在30℃下于液体LB培养基中生长。在OD600为0.6时,将培养转变为42℃持续25分钟以诱导进入到裂解循环。之后,将细胞变回至37℃持续3小时,以允许含有λ粘粒的病毒颗粒组装。然后将细胞离心并以λ缓冲液(10mMTris pH 7.5,100mM NaCl,10mM MgSO4)洗涤。加入氯仿并将样品以17,000g离心5分钟。最后,收集水相并通过0.2μm孔径过滤器过滤。通过使用菌株MG-GFP作为受体进行体外转导测定来测量包装噬菌粒的滴度。MG-GFP为在染色体中插入了gfp荧光报告基因和氨苄青霉素抗性基因的菌株MG1655的衍生物。滴度确定为约106个颗粒/μl(未显示)。这种包装噬菌粒的原液用于在MG-GFP定殖的小鼠肠道中转导MG-GFP菌株持续5天。在不同时间点收集粪便,均质化并铺板在含有卡那霉素的LB琼脂板上以监测转导的MG-GFP细胞的数量。对小鼠肠道不同部位的卡那霉素抗性菌落进行计数(psgRNAcos编码卡那霉素标志物)。如图1所示,几乎没有在任何地方观察到可检测到的转导子。
观察到的低递送效率与以下事实一致:λPaPa噬菌体在MG-GFP定殖的小鼠肠道中复制非常差,如通过计数MG-GFP定殖并感染λPaPa的小鼠粪便中随着时间推移的空斑形成单位测量的。为鉴定λPaPa在小鼠肠道中这种效率低下的原因,进行了体内进化测定以选择这种噬菌体的改进变体。MG-GFP定殖小鼠的管饲初始总剂量为107λPaPa。每天收集粪便并测试其在MG1655菌苔上形成斑块的能力。它们还在1X PBS中以40mg/mL均质化,通过0.22μm孔膜过滤并再喂饲给小鼠。如图2可见的,最初几乎没有检测到PFU,因为λPapa不能在小鼠肠道中结合其宿主。在PFU形成颗粒的量上观察到一些峰值,其量从高水平到无法检测到的水平振荡直到第17天,其中检测到PFU数量的稳定增加。
引人注目的是,当对第35天获得的噬菌体颗粒的基因组进行测序时,观察到stf基因的ORF已经恢复:λPaPa颗粒已恢复突变以产生全长stf基因(尽管相对于SEQ ID NO:14的规范STF序列在K338E、T391M和A395S具有突变)。另外,观察到负责与LamB受体结合的gpJ基因也在3个位置发生了突变。测试这些突变以确定其是否改变了该噬菌体在野生型MG165和MG1655-Δ-LamB上使用的受体。发明人未发现差异,这证实了新的Ur-λ颗粒仍然使用LamB作为其主要受体。
在stf基因的ORF在初始λ包装噬菌粒生产菌株中恢复但保持SEQ ID NO:14的初始STF序列而不是以上实验中获得的突变形式的情况下,用含有大小为3kb的DNA有效载荷(SEQ ID NO:2的pJ23104-GFP)但这次编码氯霉素标志物的包装噬菌粒进行了相同实验。gpJ基因的序列在该阶段没有变化。将包装的噬菌粒管饲给定殖有MG1655-Strp(具有链霉素抗性)的小鼠。粪便在1X PBS中以40mg/mL均质化,并连续稀释且铺板在补充或不补充25μg/mL氯霉素的Drigalski板中。因此,在转导之后长达48小时,计数粪便中氯霉素抗性细胞的量。如图3可见的,与λPaPa包装噬菌粒相比较,转导细胞的量增加,但递送效率非常低(每1000个细胞中约有1个)。当用具有修饰的gpJ基因的包装Ur-λ颗粒尝试相同实验以模拟在体内进化测定中获得的颗粒时,观察到相同结果。得出的结论是,必然存在阻止包装噬菌粒在体内最佳地发挥作用的另一种因素,因为在体外转导测定中没有发现显著差异。
然后进行了一项实验,其中产生了在Ur-λ衣壳中具有更大DNA有效载荷(SEQ IDNO:3的pJF1,约7kb)的包装噬菌粒,并将其给予小鼠。重要的是要注意gpJ基因没有变化,因此这些颗粒编码SEQ ID NO:10的野生型gpJλ并且仍然使用LamB作为其主要受体。对于体内递送,遵循与SEQ ID NO:2的较小DNA有效载荷相同的方案。令人惊讶的是,如图4可见的,添加功能性stf基因和由于其长度而以更高滴度包装的DNA有效载荷两者显著地提高体内递送效率。
由于根据使用的DNA有效载荷的大小观察到强烈的差异,因此进行了一组实验,其中将SEQ ID NO:4-8的不同大小的DNA有效载荷包装到λ衣壳递送媒介物中,并在体内测定之前评价其滴度。所有有效载荷的生产均在相同条件下进行。按照上述方案进行生产和裂解之后,对澄清的裂解液进行100kDa孔径的TFF过滤步骤,并将缓冲液更换为1X PBS。与澄清的裂解液相比较,TFF步骤允许颗粒浓缩约1log。如图5可见的,较小的DNA有效载荷(2.2kb)在我们生产系统中以比其较大的对应物至少低1个log的滴度生产。
最后,为验证DNA有效载荷的大小、滴度和STF存在的作用,将图5所示的6kb和8kb变体(分别为SEQ ID NO:6的GG6K和SEQ ID NO:7的GG8K)以两种λ噬菌粒形式包装:含有完整的全STF及其伴侣蛋白的λ颗粒和在其中stf和tfa伴侣基因从原噬菌体基因组中无缝缺失的菌株中产生的λ颗粒。两种形式均编码SEQ ID NO:10的野生型λgpJ基因。澄清之后,使裂解液如对图5中的噬菌粒所述通过具有100kDa过滤器的TFF装置并测量其滴度(约108/μL)。将每个DNA有效载荷的1010个总包装噬菌粒管饲给小鼠,并如上所述计算递送效率。引人注目的是,如图6A可见的,添加功能性STF大大地提高体内递送效率,其在一些情况下为100%。
值得注目的是,这些结果突出了功能性STF在体内条件下的重要性,其并不反映体外获得的结果,其中使用λPapa或Ur-λ包装噬菌粒通过铺板未观察到明显差异。
这组实验带来3个对开发成功的体内使用包装噬菌粒(尤其是用于去定殖化目的)的方法具有重大影响的结论。首先,需要具有适当大小的DNA有效载荷以获得足够高的滴度。如果DNA有效载荷太小,则必须进行关注于将颗粒浓缩至合适滴度的密集下游加工,这可能会减慢生产过程并增加其成本。其次,功能性STF的存在对于获得体内实验所需的高递送效率为至关重要的,并且先前已经表明STF可针对每种目标菌株进行工程改造(参见例如美国临时申请US62/802777、美国申请16/696,769和美国申请16/726,033,其每一个通过参考以其全部结合)。第三,在这种情况下,主要受体LamB可能不是所追求应用的最佳选择。如下所述,表明可工程改造噬菌粒颗粒以包括结合除LamB以外的其他受体的gpJ变体(在λ的情况下)。
工程改造λgpJ蛋白
λ噬菌体使用细菌LamB OMP作为其主要进入受体[15],该受体被位于噬菌体颗粒尖端的gpJ蛋白识别。该事件触发DNA喷射到细菌细胞质中,并且通常视为“不可逆”的结合过程[15]。然而,如果LamB受体发生突变、掩蔽或下调,细菌菌株就会对λ噬菌体的进入变为抗性;特别是,在一些小鼠模型中对MG1655菌株观察到LamB基因下调,并且这种下调由基因型变化引起:调节LamB表达水平的malT基因突变,导致膜中这些受体的数量急剧减少[16],[17]。反过来,细菌噬菌体已进化出不同策略来绕过这些防御机制。例如,突变gpJ蛋白允许其使用不同受体[18],[19]。还已知gpJ的受体识别活性在于其C-末端部分,其中小至249aa的片段赋予与LamB受体结合的能力[5]。
因此,具有允许进入特定条件或不同细菌菌株中的STF和gpJ的不同组合对于成功利用λ衍生的包装噬菌粒作为治疗剂(尤其是对于体内应用)至关重要。出于这个原因,已经工程改造了识别除LamB以外的受体的几种gpJ嵌合体,以及已鉴定允许进入一些大肠杆菌菌株但不能进入其他菌株的变体。
为实现这一点,搜索了来自不同大肠杆菌原噬菌体基因组的gpJ同源物,并进行蛋白比对以发现可能参与识别细菌OMP受体的C-末端部分中的区域(图7)。
如图7所示,除其C-末端之外,所有gpJ变体在其大部分长度(直至约氨基酸820)上共享高度序列同一性。为验证受体特异性包含在gpJ蛋白的该区域内,使用两个插入点(SEQID NO:42和SEQ ID NO:43)测试了不同融合体,如图7所示。这些嵌合体共具λgpJ的N-末端,并在其C-末端上不同,后者来自其他大肠杆菌原噬菌体。将gpJ变体无缝插入到λ生产菌株中并包装含有如上所述产生的SEQ ID NO:9的DNA有效载荷p7.3kb(编码GFP和氯霉素抗性基因)的噬菌粒。使用4种菌株来滴定这些包装的噬菌粒:MG-GFP(MG1655的变体,其在基因组中编码GFP)、MG-Δ-LamB(缺乏LamB受体的KEIO变体)、H10-waaJ(缺乏waaJ基因的O157菌株,其阻止O157荚膜抗原的表达[20])和MG1656-OmpCO157(改良的MG1655,其中初始OmpC已被替换为O157菌株中发现的OmpC变体)。由于所有菌株的OD600保持恒定(0.8),因此图8所示的表观滴度用作包装噬菌粒效率的量度。如图8可见的,两个插入点均产生功能性gpJ嵌合体,但令人惊讶的是,识别的受体从最初由λgpJ识别的受体发生变化;例如,如图8A所示,SEQ ID NO:11的变体H591现使用OmpC。有趣的是,两种gpJ变体(氨基酸序列SEQ ID NO:12的Z2145和氨基酸SEQ ID NO:13的1A2)分别显示减少或几乎没有进入MG1655,而它们能够识别O157菌株中存在的受体(图8)。由于MG-GFP和MG-Δ-LamB菌株中的滴度相同,两种变体均不使用LamB受体(图8B)。最后,构建了另一种gpJ变体并命名为A8(SEQ ID NO:49),且在MG1655(含有其内源性OmpC变体)和MG1656-OmpCO157两者上测试其递送效率。为此,将含有A8或1A2 gpJ变体和P2-stf嵌合体(序列SEQ ID NO:50的蛋白,一般地由核酸序列SEQ IDNO:56编码)的噬菌粒的连续1:3稀释液与固定量的MG1655或MG1656-OmpCO157细胞一起在OD600=0.025下温育;通过这样操作,获得不同的MOI。在37℃下温育45分钟之后,使用流式细胞仪测量每个MOI的GFP水平,并针对MOI绘图。如之前所观察到的,1A2 gpJ变体仅能识别MG1656-OmpCO157中的受体;但令人惊讶的是,A8变体能够识别MG1655和MG1656-OmpCO157两者中的OmpC受体。
鉴于这些结果,似乎产生gpJ嵌合体的方法不仅可产生识别相同菌株中不同OMP的变体,而且还产生显示不同菌株特异性的变体。
然而,如果菌株被封装,则变化主要受体是徒劳的:因为由于细胞表面的物理掩蔽,包装的噬菌粒将无法接近受体,因此递送效率将显著地降低。正是出于这个原因,对于以上显示的gpJ融合体的活性测试,使用了裸H10-waaJ O157菌株,因为已知O157菌株产生掩蔽细胞表面的IV组荚膜抗原[21]。在这种情况下,功能性STF和gpJ的组合对于获得高递送效率是必要的。
为此,将生产菌株中来自λ原噬菌体的stf和tfa(伴侣)基因无缝缺失。嵌合stf然后与携带这些嵌合stf的DAPG诱导型形式的质粒反式互补。事实上,当使用称为WW11.2并由SEQ ID NO:16表示的显示对O157抗原具有特异性的STF变体,与以上显示的氨基酸序列SEQID NO:12的gpJ变体Z2145组合时,获得了非常有效的向封装的O157菌株中的进入,如图8C可见的。
工程改造λ卷尺蛋白gpH
另外,已经表明,细菌保护免受噬菌体注入的另一种可能机制为周质蛋白的突变,据信周质蛋白助于在注入DNA时形成穿过周质的通道[22]-[24]。λ噬菌体可通过修饰gpH基因(卷尺蛋白)而在这些突变体中恢复其活性,尽管这些突变的确切位置尚不清楚。在λ噬菌体中,参与与甘露糖通透酶复合物相互作用的蛋白为gpH。最近,已经描述了一些大肠杆菌菌株通过葡萄糖转运蛋白PtsG的突变而对λ形噬菌体HK97的感染变为抗性;HK97的gpH蛋白被抑制,并且不能发生注入到这些突变体中。作者描述了通过变化HK97噬菌体中gpH蛋白的区域,其可绕过PtsG突变,并且工程改造的HK97再次变为感染性。
为检验该假设是否可类推至λ噬菌体,将λgpH蛋白与大肠杆菌中存在的其他λ形原噬菌体进行比对。如图9A所示,可发现gpH的其他变体,其中除两个区域(标记为远端和近端)在其序列中显示出异质性之外,在gpH的长度上存在极高百分比的同一性。
如同对gpJ变体所做的那样,在λ包装噬菌粒生产菌株中修饰gpH基因以包括可变区,并如上所述产生包装的噬菌粒。SEQ ID NO:24的这种gpH变体称为gpH-IAI。在这种情况下,使用3种菌株进行滴定:MG1655、KEIO manY和KEIO manZ,其含有甘露糖通透酶复合物两种组分的缺失。如图9B可见的,与MG1655相比较,manZ和manY的缺失导致表观滴度降低2-log;然而,使用SEQ ID NO:24的修饰的gpHλ噬菌体变体完全恢复其活性,甚至在manZ和manY菌株中也是如此。这些结果表明,修饰λ噬菌体中的gpH基因可用于允许或改善进入显示通透酶复合物中的缺陷或变化的菌株。
通过这一系列实验,表明能够工程改造参与λ形噬菌体识别和注入到其宿主中的3种主要机制:荚膜/次要受体(通过STF);主要受体识别(通过gpJ);和通透酶/周质通道形成(通过gpH)。这些修饰可用于工程改造在大量大肠杆菌菌株中具有改良的向性和注入效率的λ形噬菌体和包装的噬菌粒。
使用λ噬菌粒有效地递送给不同的未经修饰的变形菌门最后,已经表明λ形衍生的包装噬菌粒可用于在不同于大肠杆菌的其他变形菌门(比如克雷伯氏菌属、农杆菌属或假单胞菌属)中递送[25]-[27]。然而,这种方法需要用编码大肠杆菌LamB受体的质粒转化受体菌株,因为其他物种不具备它。尽管这对于在实验室条件下生长的细胞为有效方法,但如果自然条件下存在的细菌待用λ衍生的包装噬菌粒靶向(例如肠道),则其变为不可行,因为编码受体的质粒不易于转移。
检验了λ衍生的包装噬菌粒是否可用于将SEQ ID NO:9的p7.3 kb有效载荷递送至其他变形菌门,比如肠杆菌属。为实现这一点,工程改造了不同的λ包装噬菌粒,以含有gpJ、SEQ ID NO:12的Z2145和SEQ ID NO:13的1A2与SEQ ID NO:19的STF变体STF-EB6(及其SEQID NO:20的伴侣(或辅助)蛋白、SEQ ID NO:17的STF75(及其SEQ ID NO:18的辅助蛋白)和SEQ ID NO:21的STF23(及其SEQ ID NO:22的辅助蛋白)的几种组合。图10显示保持如对大肠杆菌菌株观察到的相同原理:递送效率在很大程度上取决于所使用的gpJ和STF的选择;对于一些组合,进入这些细菌是低效的(尽管可易于看到转导子),但变化STF和gpJ允许得到高得多的递送效率。
这些结果表明,λ衣壳的注入元件(gpJ、stf、gpH)可工程改造以在除大肠杆菌以外的其他类型细菌中实现高递送效率。因此,本发明人表明使用这些方法中的一种或多种(DNA有效载荷大小优化和选择适当的gpJ/STF/gpH组合)来产生优化的基于λ形的递送媒介物以用于涉及DNA转移的体内实验为有利的。
实施例2
使用λ噬菌粒在体内细菌中有效传递
发明人已经检验了是否可将具有基于同源点的λSTF融合体的包装噬菌粒内的有效载荷递送至宿主胃肠道中的细菌而不会使这种STF受到胃肠道中存在的蛋白水解活性,特别是胰酶的影响(即有效载荷低至无递送给细菌)。
原则上,基于同源性的STF嵌合体的结构应当联想到初始蛋白,因为融合点的氨基酸序列没有重大修饰。这意味着如果初始STF已进化为对胰酶具有抗性,则嵌合体很可能也具有抗性。为证明这一点,发明人工程改造了当靶向LMR_503菌株时具有λSTF功能的两种不同STF嵌合体(λ-STF29,SEQ ID NO:63及其序列SEQ ID NO:65的辅助蛋白;以及λ-STF118,SEQ ID NO:64及其序列SEQ ID NO:66的辅助蛋白)。STF29的插入点为ADAKKS(SEQ ID NO:38)和STF118的插入点为MDETNR(SEQ ID NO:39)。含有1A2 gpJ和每种STF嵌合体的
Figure BDA0003820857320001051
在用或不用胰酶于pH 6.8下处理之后基于MG1656-OmpCO157或LMR_503产生和滴定。简而言之,嵌合STF活性的读取菌株为LMR_503,和gpJ活性的读取菌株为MG1656-OmpCO157。如图11可见的,这些基于同源点的STF嵌合体在存在胰酶的情况下显示几乎没有降解,如发明人基于STF嵌合体同源性设计的融合点预测的那样。
实施例3
DNA有效载荷大小对
Figure BDA0003820857320001056
包装的影响
为评估DNA有效载荷大小对
Figure BDA0003820857320001057
(EB)中包装的有效载荷数量的影响,使用3种不同有效载荷来产生
Figure BDA0003820857320001058
如表1所概述的。
表1:产生的
Figure BDA0003820857320001059
批次
Figure BDA0003820857320001052
在发酵、裂解(在37℃下用0.1%Triton X-100、2000U/L Benzonase温育3h)和在Zeta Plus Capsule(3M)上澄清之后,通过Sartobind Q capsule(Sartorius)上的阴离子交换色谱纯化
Figure BDA0003820857320001053
该初始纯化后接缓冲液交换和通过在Pellicon2minicassette Biomax 300kDa(Millipore)上的切向流过滤进行的浓缩步骤。基于Sepharose 6FF树脂(GE Healthcare)进行尺寸排阻色谱的最后精制步骤以产生纯化的Eligobiotics。
Figure BDA0003820857320001054
DNA含量的分析通过在Beckman Coulter Optima AUC中使用AN50Ti转子以6krpm的分析型超速离心进行。从沉降速度数据(在260和280nm处获得)提取每个EB批次的溶液中存在的不同EB的沉降系数。
基于根据其沉降系数及其260/280nm比率计算的分子量,可将检测到的不同EB群体分离为含有3个拷贝(以290S为中心)或4个拷贝(以330-340S为中心)的有效载荷的
Figure BDA0003820857320001055
(图12)。
根据包装的有效载荷的大小,在
Figure BDA0003820857320001061
之间观察到重要差异。尽管包装较小的p1392(11.615kb)的
Figure BDA0003820857320001062
几乎只产生了含有4个拷贝的有效载荷的颗粒,但有效载荷大小的小幅增加(高达800bp)与向包装3个拷贝的转变有关。因此,用p779(12.428kb)产生的
Figure BDA0003820857320001063
优先地包装了3个拷贝的有效载荷,而大约三分之一的EB含有4个拷贝的有效载荷(图13)。
因此,似乎p1392接近理想的大小,可在噬菌体衍生的衣壳中只包装4个拷贝的有效负载,从而产生同质群体。与p1392相比较,增加有效载荷的大小会产生更多的异质
Figure BDA0003820857320001064
群体,其中含有3个拷贝的有效载荷的EB比例增加。如文献[28]中所述,从该数据集中可以看出,似乎存在接近36kb的多连体包装的下限。大小为12.125kb的p1085可包装每头3个拷贝(36.375kb)或每头4个拷贝(48.5kb),尽管如图13所示4个拷贝物类为优选的。将大小增加至12.428kb将允许包装每头3个拷贝(37.284kb)和每头4个拷贝(49.712kb);在这种情况下,4个拷贝为优选的。从这两个数据点,发明人推断包装的下限事实上为约36kb,但效率较低。将大小仅增加909bp会将包装的物类完全变为4个拷贝:可能是由衣壳中的压力信号驱动的对包装的最佳效率的限制位于这两个大小之内。最后,11.615kb的有效载荷几乎每头仅包装4个拷贝(46.46kb),因为3个拷贝物类略低于包装限制,甚至在低效率下(34.845kb)。
从这些数据中,发明人还可预测哪些大小将产生单一和多聚体物类的包装,如以下表2和3所示。出于几个原因,产生单一包装物类的较小大小通常为优选的,所述原因包括易于操纵和引入不需要的限制性位点的可能性较低。最后,在一些情况下,允许非常有效的包装物类的不会太小(26-39kb)或太大(50-51kb)的大小也为优选的,因为已经表明衣壳中存在的DNA的量可能会由于衣壳内压力所致改变颗粒的包装和稳定性[29]-[30]。最后,足够大以允许以高滴度产生包装的噬菌粒的大小也为更特别优选的。
表2:根据单体大小预测包装在衣壳中的多连体数量.
Figure BDA0003820857320001071
有阴影的单元格代表更好的物类,白色单元格代表太小或太大无法进行最佳包装的物类。有效包装的下限和上限已分别设置为36kb和51kb。
表3:根据9-13kb之间的单体大小预测包装在衣壳中的多连体数量.
Figure BDA0003820857320001072
有阴影的单元格代表更好的物类,白色单元格代表太小或太大无法进行最佳包装的物类。有效包装的下限和上限已分别设置为36kb和51kb。
序列
Figure BDA0003820857320001073
Figure BDA0003820857320001081
Figure BDA0003820857320001091
参考文献
[1]J.Collins和B.Hohn,“Cosmids:a type of plasmid gene-cloning vectorthat is packageable in vitro in bacteriophage lambda heads.,”Proc.Natl.Acad.Sci.U.S.A.,第75卷,第9期,第4242-4246页,1978年9月.
[2]J.E.Cronan,“Cosmid-Based System for Transient Expression andAbsolute Off-to-On Transcriptional Control of Escherichia coli Genes,”J.Bacteriol.,第185卷,第22期,第6522-6529页,2003年11月,doi:10.1128/JB.185.22.6522-6529.2003.
[3]J.E.Cronan,“Improved Plasmid-Based System for Fully Regulated Off-To-On Gene Expression in Escherichia coli:Application to Production of ToxicProteins,”Plasmid,第69卷,第1期,第81-89页,2013年1月,doi:10.1016/j.plasmid.2012.09.003.
[4]J.D.Haley,“Cosmid library construction,”Methods Mol.Biol.CliftonNJ,第4卷,第257–283页,1988,doi:10.1385/0-89603-127-6:257.
[5]J.Wang,M.Hofnung,和A.Charbit,“The C-terminal portion of the tailfiber protein of bacteriophage lambda is responsible for binding to LamB,itsreceptor at the surface of Escherichia coli K-12,”J.Bacteriol.,第182卷,第2期,第508-512页,2000年1月,doi:10.1128/jb.182.2.508-512.2000.
[6]J.H.Grose和S.R.Casjens,“Understanding the enormous diversity ofbacteriophages:the tailed phages that infect the bacterial familyEnterobacteriaceae,”Virology,第0卷,第421-443页,2014年11月,doi:10.1016/j.virol.2014.08.024.
[7]R.W.Hendrix和R.L.Duda,“Bacteriophage lambda PaPa:not the mother ofall lambda phages,”Science,第258卷,第5085期,第1145-1148页,1992年11月.
[8]M.G.Rossmann,V.V.Mesyanzhinov,F.Arisaka,和P.G.Leiman,“Thebacteriophage T4 DNA injection machine,”Curr.Opin.Struct.Biol.,第14卷,第2期,第171-180页,2004年4月,doi:10.1016/j.sbi.2004.02.001.
[9]Y.Zivanovic等人,“Insights into Bacteriophage T5 Structure fromAnalysis of Its Morphogenesis Genes and Protein Components,”J.Virol.,第88卷,第2期,第1162-1174页,2014年1月,doi:10.1128/JVI.02262-13.
[10]M.A.Speed,T.Morshead,D.I.Wang,和J.King,“Conformation ofP22tailspike folding and aggregation intermediates probed by monoclonalantibodies,”Protein Sci.Publ.Protein Soc.,第6卷,第1期,第99-108页,1997年1月,doi:10.1002/pro.5560060111.
[11]T.Miwa和K.Matsubara,“Formation of oligomeric structures fromplasmid DNA carrying cos lambda that is packaged into bacteriophage lambdaheads.,”J.Bacteriol.,第153卷,第1期,第100-108页,1983年1月.
[12]P.Grayson等人,“The effect of genome length on ejection forces inbacteriophage lambda,”Virology,第348卷,第2期,第430-436页,2006年5月,doi:10.1016/j.virol.2006.01.003.
[13]S.Vimont等人,“The CTX-M-15-producing Escherichia coli clone O25b:H4-ST131 has high intestine colonization and urinary tract infectionabilities,”PloS One,第7卷,第9期,第e46547页,2012,doi:10.1371/journal.pone.0046547.
[14]M.L.Myhal,D.C.Laux,和P.S.Cohen,“Relative colonizing abilities ofhuman fecal and K 12strains of Escherichia coli in the large intestines ofstreptomycin-treated mice,”Eur.J.Clin.Microbiol.,第1卷,第3期,第186-192页,1982年6月.
[15]S.Chatterjee和E.Rothenberg,“Interaction of Bacteriophageλwith ItsE.coli Receptor,LamB,”Viruses,第4卷,第11期,第3162-3178页,2012年11月,doi:10.3390/v4113162.
[16]A.Charbit,K.Gehring,H.Nikaido,T.Ferenci,和M.Hofnung,“Maltosetransport and starch binding in phage-resistant point mutants ofmaltoporin.Functional and topological implications,”J.Mol.Biol.,第201卷,第3期,第487-496页,1988年6月.
[17]M.D.Paepe,V.Gaboriau-Routhiau,D.Rainteau,S.Rakotobe,F.Taddei,和N.Cerf-Bensussan,“Trade-Off between Bile Resistance and NutritionalCompetence Drives Escherichia coli Diversification in the Mouse Gut,”PLOSGenet.,第7卷,第6期,第e1002107页,2011年6月,doi:10.1371/journal.pgen.1002107.
[18]J.R.Meyer,D.T.Dobias,J.S.Weitz,J.E.Barrick,R.T.Quick,和R.E.Lenski,“Repeatability and contingency in the evolution of a keyinnovation in phage lambda,”Science,第335卷,第6067期,第428–432页,2012年1月,doi:10.1126/science.1214449.
[19]C.Werts,V.Michel,M.Hofnung,和A.Charbit,“Adsorption ofbacteriophage lambda on the LamB protein of Escherichia coli K-12:pointmutations in gene J of lambda responsible for extended host range,”J.Bacteriol.,第176卷,第4期,第941-947页,1994年2月,doi:10.1128/jb.176.4.941-947.1994.
[20]K.S.Choi等人,“Protection from Hemolytic Uremic Syndrome byEyedrop Vaccination with Modified Enterohemorrhagic E.coli Outer MembraneVesicles,”PLoS ONE,第9卷,第7期,2014年7月,doi:10.1371/journal.pone.0100229.
[21]Y.Shifrin等人,“Transient Shielding of Intimin and the Type IIISecretion System of Enterohemorrhagic and Enteropathogenic Escherichia coliby a Group 4Capsule,”J.Bacteriol.,第190卷,第14期,第5063–5074页,2008年7月,doi:10.1128/JB.00440-08.
[22]C.A.Roessner和G.M.Ihler,“Proteinase sensitivity of bacteriophagelambda tail proteins gpJ and pH in complexes with the lambda receptor.,”J.Bacteriol.,第157卷,第1期,第165-170页,1984年1月.
[23]D.Scandella和W.Arber,“Phage lambda DNA injection into Escherichiacoli pel-mutants is restored by mutations in phage genes V or H,”Virology,第69卷,第1期,第206-215页,1976年1月.
[24]I.Martin-Verstraete,V.Michel,和A.Charbit,“The levanase operon ofBacillus subtilis expressed in Escherichia coli can substitute for themannose permease in mannose uptake and bacteriophage lambda infection,”J.Bacteriol.,第178卷,第24期,第7112-7119页,1996年12月,doi:10.1128/jb.178.24.7112-7119.1996.
[25]G.E.de Vries,C.K.Raymond,和R.A.Ludwig,“Extension of bacteriophagelambda host range:selection,cloning,and characterization of a constitutivelambda receptor gene,”Proc.Natl.Acad.Sci.U.S.A.,第81卷,第19期,第6080-6084页,1984年10月.
[26]M.S.Francis,A.F.Parker,R.Morona,和C.J.Thomas,“BacteriophageLambda as a Delivery Vector for Tn10-Derived Transposons inXenorhabdusbovienii,”Appl.Environ.Microbiol.,第59卷,第9期,第3050-3055页,1993年9月.
[27]R.A.Ludwig,“Gene tandem-mediated selection of coliphageλ-receptive Agrobacterium,Pseudomonas,and Rhizobium strains,”Proc.Natl.Acad.Sci.U.S.A.,第84卷,第10期,第3334-3338页,1987年5月.
[28]T.Miwa和K.Matsubara,“Formation of oligomeric structures fromplasmid DNA carrying cos lambda that is packaged into bacteriophage lambdaheads.”J Bacteriol.第153卷,第1期,第100-108页,1983年1月.
[29]I.Ivanovska,G.Wuite,B.
Figure BDA0003820857320001131
和A.Evilevitch,“Internal DNApressure modifies stability of WT phage”Proc.Natl.Acad.Sci.U.S.A.,第104卷,第23期,第9603-9608页,2007年6月.
[30]E.Nurmemmedov,M.Castelnovo,E.Medina,C.Enrique Catalano和A.Evilevitch,“Challenging packaging limits and infectivity of phageλ”J.Mol.Biol.第415卷,第2期,第263-73页,2012年1月。
<110> 艾力格生物科技有限公司
<120> 用于体内递送DNA有效载荷的细菌递送媒介物
<130> B3419PC
<160> 66
<170> PatentIn版本3.5
<210> 1
<211> 2528
<212> DNA
<213> 人工序列
<220>
<223> psgRNAcos (p184)
<400> 1
tgcagcgcga tcgtaatcag gatcccatgg tacgcgtgct agaggcatca aataaaacga 60
aaggctcagt cgaaagactg ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc 120
ctgagtagga caaatccgcc gccctagacc ctccacgcac gttgtgatat gtagatgata 180
atcattatca ctttacgggt cctttccggt gatccgacag gttacggggc ggcgacctcg 240
cgggttttcg ctatttatga aaattttccg gtttaaggcg tttccgttct tcttcgtcat 300
aacttaatgt ttttatttaa aataccctct gaaaagaaag gaaacgacag gtgctgaaag 360
cgaggctttt tggggcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 420
acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 480
aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 540
tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 600
aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 660
gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 720
acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 780
accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 840
ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 900
gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 960
gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 1020
ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 1080
gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 1140
cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgactagtg cttggattct 1200
caccaataaa aaacgcccgg cggcaaccga gcgttctgaa caaatccaga tggagttctg 1260
aggtcattac tggatctatc aacaggagtc caagcgagct ctcgaacccc agagtcccgc 1320
tcagaagaac tcgtcaagaa ggcgatagaa ggcgatgcgc tgcgaatcgg gagcggcgat 1380
accgtaaagc acgaggaagc ggtcagccca ttcgccgcca agctcttcag caatatcacg 1440
ggtagccaac gctatgtcct gatagcggtc cgccacaccc agccggccac agtcgatgaa 1500
tccagaaaag cggccatttt ccaccatgat attcggcaag caggcatcgc catgggtcac 1560
gacgagatcc tcgccgtcgg gcatgcgcgc cttgagcctg gcgaacagtt cggctggcgc 1620
gagcccctga tgctcttcgt ccagatcatc ctgatcgaca agaccggctt ccatccgagt 1680
acgtgctcgc tcgatgcgat gtttcgcttg gtggtcgaat gggcaggtag ccggatcaag 1740
cgtatgcagc cgccgcattg catcagccat gatggatact ttctcggcag gagcaaggtg 1800
agatgacagg agatcctgcc ccggcacttc gcccaatagc agccagtccc ttcccgcttc 1860
agtgacaacg tcgagcacag ctgcgcaagg aacgcccgtc gtggccagcc acgatagccg 1920
cgctgcctcg tcctgcagtt cattcagggc accggacagg tcggtcttga caaaaagaac 1980
cgggcgcccc tgcgctgaca gccggaacac ggcggcatca gagcagccga ttgtctgttg 2040
tgcccagtca tagccgaata gcctctccac ccaagcggcc ggagaacctg cgtgcaatcc 2100
atcttgttca atcatgcgaa acgatcctca tcctgtctct tgatcagatc ttgatcccct 2160
gcgccatcag atccttggcg gcaagaaagc catccagttt actttgcagg gcttcccaac 2220
cttaccagag ggcgccccag ctggcaattc cgacgtctaa gaaaccatta ttatcatgac 2280
attaacctat aaaaataggc gtatcacgag gccctttcgt cttcgggccc attaagttct 2340
gtgctaggag gtgactgaag tatattttag gaattctaaa gatctttgac agctagctca 2400
gtcctaggta taatactagt tgagaccagt ctaggtctcg gttttagagc tagaaatagc 2460
aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 2520
tttggtag 2528
<210> 2
<211> 3274
<212> DNA
<213> 人工序列
<220>
<223> pJ23104-GFP (p211)
<400> 2
aaaatctcga taactcaaaa aatacgcccg gtagtgatct tatttcatta tggtgaaagt 60
tggaacctct tacgtgccga tcaacgtctc attttcgcca aaagttggcc cagggcttcc 120
cggtatcaac agggacacca ggatttattt attctgcgaa gtgatcttcc gtcacaggta 180
tttattcggc gcaaagtgcg tcgggtgatg ctgccaactt actgatttag tgtatgatgg 240
tgtttttgag gtgctccagt ggcttctgtt tctatcagct gtccctcctg ttcagctact 300
gacggggtgg tgcgtaacgg caaaagcacc gccggacatc agcgctagcg gagtgtatac 360
tggcttacta tgttggcact gatgagggtg tcagtgaagt gcttcatgtg gcaggagaaa 420
aaaggctgca ccggtgcgtc agcagaatat gtgatacagg atatattccg cttcctcgct 480
cactgactcg ctacgctcgg tcgttcgact gcggcgagcg gaaatggctt acgaacgggg 540
cggagatttc ctggaagatg ccaggaagat acttaacagg gaagtgagag ggccgcggca 600
aagccgtttt tccataggct ccgcccccct gacaagcatc acgaaatctg acgctcaaat 660
cagtggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggcggctcc 720
ctcgtgcgct ctcctgttcc tgcctttcgg tttaccggtg tcattccgct gttatggccg 780
cgtttgtctc attccacgcc tgacactcag ttccgggtag gcagttcgct ccaagctgga 840
ctgtatgcac gaaccccccg ttcagtccga ccgctgcgcc ttatccggta actatcgtct 900
tgagtccaac ccggaaagac atgcaaaagc accactggca gcagccactg gtaattgatt 960
tagaggagtt agtcttgaag tcatgcgccg gttaaggcta aactgaaagg acaagttttg 1020
gtgactgcgc tcctccaagc cagttacctc ggttcaaaga gttggtagct cagagaacct 1080
tcgaaaaacc gccctgcaag gcggtttttt cgttttcaga gcaagagatt acgcgcagac 1140
caaaacgatc tcaagaagat catcttatta atcagataaa atatttctag atttcagtgc 1200
aatttatctc ttcaaatgta gcacctgaag tcagccccat acgatataag ttgtactagt 1260
ggatttgaca gctagctcag tcctaggtat tgtgctagcg aattcattaa agaggagaaa 1320
ggtacccatg agtaaaggtg aagaactgtt caccggtgtt gttccgatcc tggttgaact 1380
ggatggtgat gttaacggcc acaaattctc tgttcgtggt gaaggtgaag gtgatgcaac 1440
caacggtaaa ctgaccctga aattcatctg cactaccggt aaactgccgg ttccatggcc 1500
gactctggtg actaccctga cctatggtgt tcagtgtttt tctcgttacc cggatcacat 1560
gaagcagcat gatttcttca aatctgcaat gccggaaggt tatgtacagg agcgcaccat 1620
ttctttcaaa gacgatggca cctacaaaac ccgtgcagag gttaaatttg aaggtgatac 1680
tctggtgaac cgtattgaac tgaaaggcat tgatttcaaa gaggacggca acatcctggg 1740
ccacaaactg gaatataact tcaactccca taacgtttac atcaccgcag acaaacagaa 1800
gaacggtatc aaagctaact tcaaaattcg ccataacgtt gaagacggta gcgtacagct 1860
ggcggaccac taccagcaga acactccgat cggtgatggt ccggttctgc tgccggataa 1920
ccactacctg tccacccagt ctaaactgtc caaagacccg aacgaaaagc gcgaccacat 1980
ggtgctgctg gagttcgtta ctgcagcagg tatcacgcac ggcatggatg aactctacaa 2040
ataaaacgca tgagaaagcc cccggaagat caccttccgg gggctttttt attgcgctcg 2100
ggtagcacca gagctcgccg cagccgaacg ccccaaaaag cctcgctttc agcacctgtc 2160
gtttcctttc ttttcagagg gtattttaaa taaaaacatt aagttatgac gaagaagaac 2220
ggaaacgcct taaaccggaa aattttcata aatagcgaaa acccgcgagg tcgccgcccc 2280
gtaacctgtc ggatcaccgg aaaggacccg taaagtgata atgattatca tctacatatc 2340
acaacgtgcg tggagggact agtggattcg ggtagcacca gaagtctata gcacgtgagc 2400
acacggtcac actgcttccg gtagtcaata aaccggtaaa ccagcaatag acataagcgg 2460
ctatttaacg accctgccct gaaccgacga ccgggtcgaa tttgctttcg aatttctgcc 2520
attcatccgc ttattatcac ttattcaggc gtagcaccag gcgtttaagg gcaccaataa 2580
ctgccttaaa aaaattacgc cccgccctgc cactcatcgc agtactgttg taattcatta 2640
agcattctgc cgacatggaa gccatcacag acggcatgat gaacctgaat cgccagcggc 2700
atcagcacct tgtcgccttg cgtataatat ttgcccatgg tgaaaacggg ggcgaagaag 2760
ttgtccatat tggccacgtt taaatcaaaa ctggtgaaac tcacccaggg attggctgag 2820
acgaaaaaca tattctcaat aaacccttta gggaaatagg ccaggttttc accgtaacac 2880
gccacatctt gcgaatatat gtgtagaaac tgccggaaat cgtcgtggta ttcactccag 2940
agcgatgaaa acgtttcagt ttgctcatgg aaaacggtgt aacaagggtg aacactatcc 3000
catatcacca gctcaccgtc tttcattgcc atacggaatt ccggatgagc attcatcagg 3060
cgggcaagaa tgtgaataaa ggccggataa aacttgtgct tatttttctt tacggtcttt 3120
aaaaaggccg taatatccag ctgaacggtc tggttatagg tacattgagc aactgactga 3180
aatgcctcaa aatgttcttt acgatgccat tgggatatat caacggtggt atatccagtg 3240
atttttttct ccattttagc ttccttagct cctg 3274
<210> 3
<211> 7240
<212> DNA
<213> 人工序列
<220>
<223> pJF1 (p344)
<400> 3
gattttacgg ctagctcagt cctaggtaca atgctagcga atcattaaag aggagaaagg 60
tactatggca cgtaccccgt cacgtagtag cattggtagc ctgcgtagtc cgcataccca 120
taaagcaatt ctgaccagta ccatcgagat cctgaaagaa tgtggttata gcggactgag 180
cattgaaagc gttgcacgtc gtgccggagc aagcaaaccg accatttatc gttggtggac 240
gaataaagca gcactgattg ccgaagtgta tgaaaatgaa agcgaacagg tgcgtaaatt 300
tccggatctg ggtagcttta aagcagatct ggatttttta ctgcgtaatt tatggaaagt 360
ttggcgtgaa actatttgcg gtgaagcatt tcgttgtgtt attgcagaag ctcagctgga 420
tcctgcaacc ctgacccagt taaaggatca atttatggaa cgtcgtcgtg agatgccgaa 480
aaaactggtt gaaaatgcca ttagcaatgg tgaactgccg aaagatacca atcgtgaact 540
tcttctggat atgatttttg gtttttgttg gtatcgcctg ttaaccgaac agctgaccgt 600
tgaacaggat attgaagaat ttaccttcct tctgattaat ggtgtttgtc cgggtactca 660
gcgttaacta ggccataatc gctaccaaat tccagaaaac agacgctttc gagcgtcttt 720
tttcgttttg gtcacgacgt actgaatctg attcgttacc aattgacatg atacgaaacg 780
taccgtatcg ttaaggttac tggagcttaa aaaggagaaa gtttctatgg ataagaaata 840
cagcataggc ttagacatcg gcacaaatag cgtcggatgg gcggtgatca ctgatgaata 900
taaagttccg tctaaaaagt tcaaggtact gggtaataca gatcgccata gtatcaaaaa 960
gaacttaatc ggtgcgcttc tgttcgattc cggcgaaacc gcagaagcaa cacgtctgaa 1020
acgcaccgct cgtcgccgtt acacccgtcg taaaaaccgc atctgctacc tgcaagaaat 1080
cttctctaac gaaatggcta aagtagatga cagctttttt caccgtctgg aagaatcatt 1140
tctggtggaa gaagataaaa agcacgaacg tcatccaatc ttcggcaaca ttgtggacga 1200
agtagcgtat cacgaaaaat acccgactat ctatcacctg cgcaaaaagc tggtcgattc 1260
gacggataag gccgatctgc gtctgatcta tctggcctta gcgcatatga ttaagttccg 1320
tggtcatttc ctgatcgaag gcgacctgaa tccagacaac agcgatgtag acaaactgtt 1380
catccagctg gtgcaaacct ataaccagct gtttgaagaa aacccaatta atgctagcgg 1440
tgttgacgcg aaagcgatct tgtccgcacg cctgtccaaa tcccgtcgtc tggaaaactt 1500
aattgcgcaa ctgccgggtg agaagaaaaa cggactgttc ggcaatctga tcgctcttag 1560
cttgggactg accccgaact tcaaaagcaa cttcgatctg gcagaggacg caaaacttca 1620
acttagcaaa gatacgtatg acgatgactt ggataactta ctggcccaga tcggagatca 1680
gtacgctgat ctgtttctgg cggcaaagaa cttatcagac gctattctcc tgtctgatat 1740
tcttcgtgtg aataccgaaa tcaccaaagc accgctttct gcatccatga ttaaacgcta 1800
tgacgaacat caccaagatc tgactcttct gaaagcgctg gtacggcaac aactgccgga 1860
gaagtacaag gagatcttct ttgaccaatc caaaaacggc tacgcgggtt atattgacgg 1920
gggtgcaagc caagaggagt tctacaaatt catcaagcca atcttagaaa aaatggatgg 1980
cacggaagaa ttacttgtta aactgaatcg tgaggatctg cttcgtaaac agcgtacctt 2040
cgacaacggt agcattccgc accagatcca cttaggtgaa ctgcacgcta tcctgcgtcg 2100
ccaagaggat ttttacccgt tcctgaaaga taatcgtgaa aaaatcgaaa aaatcctgac 2160
ctttcgtatc ccgtattatg tcggcccgct ggcgcgtggc aactcccgtt tcgcgtggat 2220
gactcgcaaa tccgaagaaa ctattacccc gtggaacttc gaggaagtgg ttgacaaagg 2280
cgcaagcgcc caatccttca tcgagcgcat gactaacttt gataaaaacc tgccgaacga 2340
aaaggtactg ccgaaacact cccttctgta cgaatacttc accgtgtaca acgagctgac 2400
taaagtaaag tatgtgactg agggcatgcg taaacctgca ttcctgagcg gtgaacagaa 2460
aaaagcaatt gttgatttac tgtttaaaac caaccgtaaa gtaaccgtta aacagctgaa 2520
agaggactac ttcaagaaaa tcgaatgctt cgactccgtc gagattagtg gagttgaaga 2580
tcgttttaat gcaagtttag gcacgtatca cgatttatta aagatcatta aagacaaaga 2640
tttcttggac aacgaagaaa atgaggacat cttagaggac atcgtcctga ccctgactct 2700
gttcgaagat cgtgaaatga ttgaagaacg cttgaagacg tatgctcacc tgtttgacga 2760
taaagtaatg aaacaactga aacgtcgccg ttatactggc tggggccgtc tgagccgtaa 2820
actgattaac ggtatccgtg acaaacagtc cggtaaaact attctggact tcctgaaatc 2880
tgacggcttc gcaaaccgta acttcatgca actgattcac gacgattccc tgaccttcaa 2940
agaggacatc cagaaagctc aggtttctgg tcaaggtgat tctctgcacg agcatatcgc 3000
caatttagca ggtagtccgg cgatcaaaaa aggtatcctg caaaccgtga aagtggtgga 3060
tgagcttgtg aaagttatgg gtcgtcacaa accggaaaac attgttatcg agatggctcg 3120
tgaaaaccaa acgacccaga agggacagaa aaactcccgc gaacgcatga aacgtatcga 3180
ggagggtatt aaagaacttg gctctcagat tctgaaagaa caccctgttg aaaataccca 3240
actgcaaaat gaaaaactgt acctgtacta cctgcaaaat ggtcgtgaca tgtatgtaga 3300
tcaggagctg gacatcaacc gcctctccga ttacgacgtt gaccacattg ttccgcagtc 3360
ttttctgaaa gatgattcca ttgataacaa agtactcacc cgtagcgata aaaaccgtgg 3420
gaagagtgac aacgttccat cggaagaagt agttaagaaa atgaagaact attggcgtca 3480
actgcttaac gcgaaactga ttactcaacg taaatttgat aacctgacca aagctgaacg 3540
tggcggtttg tctgagctgg ataaggcggg ttttattaaa cgtcaactgg tagaaactcg 3600
ccagattaca aaacatgttg ctcagattct ggactctcgt atgaacacta aatacgatga 3660
aaatgacaaa ctgatccgcg aagttaaggt tattaccctg aaatctaagc tggtttccga 3720
cttccgtaaa gatttccaat tctataaagt gcgcgagatt aacaactatc accacgcgca 3780
cgacgcatat ctgaatgcag ttgttggcac ggcactgatc aaaaaatatc cgaaactgga 3840
aagcgaattt gtgtacggcg attataaagt ttacgacgtg cgcaaaatga tcgccaaatc 3900
tgaacaggaa attggcaaag caaccgctaa atactttttc tactcaaaca ttatgaattt 3960
cttcaaaacc gaaatcacct tagcgaatgg cgaaattcgt aaacgccctc tgatcgaaac 4020
caacggcgaa acgggtgaga tcgtgtggga caaaggtcgt gatttcgcta ctgtccgcaa 4080
agttctgtcc atgcctcaag taaacatcgt taaaaagact gaggtacaga ctggcggttt 4140
cagcaaggaa tccattctgc cgaaacgcaa ctccgacaaa ctgatcgcgc gtaagaaaga 4200
ctgggatccg aagaaatacg gtggcttcga ttctccaacc gtggcataca gcgttctggt 4260
agtcgccaaa gtcgaaaagg gtaaatcaaa aaaactgaaa tcagtgaaag aacttttagg 4320
catcaccatt atggaacgta gctctttcga aaaaaacccg attgacttcc tcgaagcgaa 4380
ggggtacaag gaagtaaaga aagatctgat tatcaaactg ccgaagtatt ccctgttcga 4440
actggaaaat ggtcgtaaac gtatgttagc gtctgcgggt gaactgcaaa aagggaacga 4500
attggccctt ccgtccaagt acgtgaactt cctgtatctg gcctcgcact acgagaaact 4560
gaaaggtagt ccggaagata atgagcagaa acagctgttc gtggaacagc acaaacacta 4620
tctggacgag attattgaac agatttctga gtttagcaaa cgcgtaattc tggcggacgc 4680
gaatctggat aaagtcctga gcgcctacaa taaacaccgt gataaaccga tccgtgaaca 4740
ggcagaaaac atcattcacc tgttcacgct gactaatctt ggtgctccgg cagccttcaa 4800
atacttcgac accacgatcg atcgtaaacg ttacacctcc actaaagaag tcttagatgc 4860
aactcttatt caccagagca tcactggcct gtatgaaact cgtattgatc tgagtcagtt 4920
gggcggtgac taataacgtt aaagtcagtt tcacctgttt tacgttaaaa cccgcttcgg 4980
cgggttttta cttttgggtt tagccgaacg ccccaaaaag cctcgctttc agcacctgtc 5040
gtttcctttc ttttcagagg gtattttaaa taaaaacatt aagttatgac gaagaagaac 5100
ggaaacgcct taaaccggaa aattttcata aatagcgaaa acccgcgagg tcgccgcccc 5160
gtaacctgtc ggatcaccgg aaaggacccg taaagtgata atgattatca tctacatatc 5220
acaacgtgcg taaagggact agtggatgtt tgatctcaaa aaaagcaccg actcggtgcc 5280
actttttcaa gttgataacg gactagcctt attttaactt gctatttcta gctctaaaac 5340
ctgagaagac atctcctgcg cgtgctagca ttatacctag gactgagcta gctgtcagtc 5400
gggtagcacc agaagtctat agcatgtgca tacctttggt cgaaaaaaaa agcccgcact 5460
gtcaggtgcg ggcttttttc agtgtttcct tgccggatta cgccccgccc tgccactcat 5520
cgcagtattg ttgtaattca ttaagcattc tgccgacatg gaagccatca caaacggcat 5580
gatgaacttg gatcgccagt ggcattaaca ccttgtcgcc ttgcgtataa tattttccca 5640
tagtgaaaac gggggcgaag aagttgtcca tatttgctac gtttaaatca aaactggtga 5700
aactcaccca cggattggca ctgacgaaaa acatattttc gataaaccct ttagggaaat 5760
atgctaagtt ttcaccgtaa cacgccacat cttgactata tatgtgtaga aactgccgga 5820
aatcgtcgtg gtattctgac cagagcgatg aaaacgtttc agtttgctca tggaaaacgg 5880
tgtaacaagg gtgaacacta tcccatatca ccagctcacc gtctttcatt gccatacgaa 5940
actccggatg tgcattcatc aggcgggcaa gaatgtgaat aaaggccgga taaaacttgt 6000
gcttattttt ctttacggtt tttaaaaagg ccgtaatatc cagctgaacg gtttggttat 6060
aggtgcactg agcaactgac tggaatgcct caaaatgttc tttacgatgc cattgactta 6120
tatcaactgt agtatatcca gtgatttttt tctccatttt agcttcctta gcttgcgaaa 6180
tctcgataac tcaaaaaata gtagtgatct tatttcatta tggtgaaagt tgtcttacgt 6240
gcaacatttt cgcaaaaagt tggcgcttta tcaacactgt ccctcctgtt cagctactga 6300
cggtactgcg gaactgacta aagtagtgcg taacggcaaa agcaccgccg gacatcagcg 6360
ctagcggagt gtatactggc ttactatgtt ggcactgatg agggtgtaag tgaagtgctt 6420
catgtggcag gagaaaaaag gctgcaccgg tgcgtcagca gaatatgtga tacaggatat 6480
attccgcttc ctcgctcact gactcgctac gctcggtcgt tcgactgcgg cgagcggaaa 6540
tggcttacga acggggcgga gatttcctgg aagatgccag gaagatactt aacagggaag 6600
tgagagggcc gcggcaaagc cgtttttcca taggctccgc ccccctgaca agcatcacga 6660
aatctgacgc tcaaatcagt ggtggcgaaa cctgacagga ctataaagat accaggcgtt 6720
tccccctggc ggctccctcg tgcgctctcc tgttcctgcc tttcggttta ccggtgtcat 6780
tccgctgtta tggccgcgtt tgtctcattc cacgcctgac actcagttcc gggtaggcag 6840
ttcgctccaa gctggactgt atgcacgaac cccccgttca gtccgaccgc tgcgccttat 6900
ccggtaacta tcgtcttgag tccaacccgg aaagacatgc aaaagcacca ctggcagcag 6960
ccactggtaa ttgatttaga ggagttagtc ttgaagtcat gcgccggata aggctaaact 7020
gaaaggacaa gttttggcga ctgcgctcct ccaagccagt tacctcggtt caaagagttg 7080
gtagctcaga gaaccttcga aaaaccgccc tgcaaggcgg ttttttcgtt ttcagagcaa 7140
gagattacgc gcagaccaaa acgatctcaa gaagatcatc ttattaatca gataaaatat 7200
ttctagattt cagtgcaatt tatctcttca aatgtagcac 7240
<210> 4
<211> 2165
<212> DNA
<213> 人工序列
<220>
<223> GG2K (p502)
<400> 4
ctgatgaggg tgtaagtgaa gtgcttcatg tggcaggaga aaaaaggctg catcggtgcg 60
tcagcagaat atgtgataca ggatatattc cgcttcctcg ctcactgact cgctacgctc 120
ggtcgttcga ctgtggcgag cggaaatggc ttacgaacgg ggcggagatt tcctggaaga 180
tgccaggaag atacttaaca gggaagtgag agggtcgcgg caaagccgtt tttccatagg 240
ctccgccccc ctgacaagca tcacgaaatc tgacgctcaa atcagtggtg gcgaaacctg 300
acaggactat aaagatacca ggcgtttccc cctggcggct ccctcgtgcg ctctcctgtt 360
cctgcctttc ggtttgccgg tgtcattcct ctgttacggc cgagtttgtc tcattccacg 420
cctgacactc agttccgggt aggcagttcg ctccaagctg gactgtatgc acgaaccccc 480
cgttcagtcc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggaaag 540
acatgcaaaa gcaccactgg cagcagccac tggtaattga tttagaggag ttagtcttga 600
agtcatgcgc cggataaggc taaactgaaa ggacaagttt tggcgactgc gctcctccaa 660
gccagttacc tcggttcaaa gagttggtag ctcagagaac cttcgaaaaa ccgccctgca 720
aggcggtttt ttcgttttca gagcaagaga ttacgcgcag accaaaacga tctcaagaag 780
atcatcttat taatcagata aaatatttct agatttcagt gcaatttatc tcttcaaatg 840
tagcaccggc gcgccgtgac caattattga aggccgctaa cgcggccttt ttttgtttct 900
ggtatcccga atggagcgac ttctccccaa aaagcctcgc tttcagcacc tgtcgtttcc 960
tttcttttca gagggtattt taaataaaaa cattaagtta tgacgaagaa gaacggaaac 1020
gccttaaacc ggaaaatttt cataaatagc gaaaacccgc gaggtcgccg ccccgtaacc 1080
tgtcggatca ccggaaagga cccgtaaagt gataatgatt atcatctaca tatcacaacg 1140
tgcgtaaagg gtaagtatga aggtcgtgta ctccgtaact tcgacccaca ttccttaaag 1200
agtgcatgtg catattttgt tatcaataaa aaaggccgcg atttgcggcc ttattgttcg 1260
tcttgccgga ttacgccccg ccctgccact catcgcagta ttgttgtaat tcattaagca 1320
ttctgccgac atggaagcca tcacaaacgg catgatgaac ttggatcgcc agtggcatta 1380
acaccttgtc gccttgcgta taatattttc ccatagtgaa aacgggggcg aagaagttgt 1440
ccatatttgc tacgtttaaa tcaaaactgg tgaaactcac ccacggattg gcactgacga 1500
aaaacatatt ttcgataaac cctttaggga aatatgctaa gttttcaccg taacacgcca 1560
catcttgact atatatgtgt agaaactgcc ggaaatcgtc gtggtattct gaccagagcg 1620
atgaaaacgt ttcagtttgc tcatggaaaa cggtgtaaca agggtgaaca ctatcccata 1680
tcaccagctc accgtctttc attgccatac gaaactccgg atgtgcattc atcaggcggg 1740
caagaatgtg aataaaggcc ggataaaact tgtgcttatt tttctttacg gtttttaaaa 1800
aggccgtaat atccagctga acggtttggt tataggtgca ctgagcaact gactggaatg 1860
cctcaaaatg ttctttacga tgccattgac ttatatcaac tgtagtatat ccagtgattt 1920
ttttctccat tttagcttcc ttagcttgcg aaatctcgat aactcaaaaa atagtagtga 1980
tcttatttca ttatggtgaa agttgtctta cgtgcaacat tttcgcaaaa agttggcgct 2040
ttatcaacac tgtcggaatg acaaatggtt ccaattattg aacacccttc ggggtgtttt 2100
tttgtttctg gtttcccgag gccggcctgc gctagcggag tgtatactgg cttactatgt 2160
tggca 2165
<210> 5
<211> 4073
<212> DNA
<213> 人工序列
<220>
<223> GG4K (p710)
<400> 5
ttcgcaaaaa gttggcgctt tatcaacact gtcggaatga caaatggttc caattattga 60
acacccttcg gggtgttttt ttgtttctgg tttcccgagg ccggcctgcg ctagcggagt 120
gtatactggc ttactatgtt ggcactgatg agggtgtaag tgaagtgctt catgtggcag 180
gagaaaaaag gctgcatcgg tgcgtcagca gaatatgtga tacaggatat attccgcttc 240
ctcgctcact gactcgctac gctcggtcgt tcgactgtgg cgagcggaaa tggcttacga 300
acggggcgga gatttcctgg aagatgccag gaagatactt aacagggaag tgagagggtc 360
gcggcaaagc cgtttttcca taggctccgc ccccctgaca agcatcacga aatctgacgc 420
tcaaatcagt ggtggcgaaa cctgacagga ctataaagat accaggcgtt tccccctggc 480
ggctccctcg tgcgctctcc tgttcctgcc tttcggtttg ccggtgtcat tcctctgtta 540
cggccgagtt tgtctcattc cacgcctgac actcagttcc gggtaggcag ttcgctccaa 600
gctggactgt atgcacgaac cccccgttca gtccgaccgc tgcgccttat ccggtaacta 660
tcgtcttgag tccaacccgg aaagacatgc aaaagcacca ctggcagcag ccactggtaa 720
ttgatttaga ggagttagtc ttgaagtcat gcgccggata aggctaaact gaaaggacaa 780
gttttggcga ctgcgctcct ccaagccagt tacctcggtt caaagagttg gtagctcaga 840
gaaccttcga aaaaccgccc tgcaaggcgg ttttttcgtt ttcagagcaa gagattacgc 900
gcagaccaaa acgatctcaa gaagatcatc ttattaatca gataaaatat ttctagattt 960
cagtgcaatt tatctcttca aatgtagcac cggcgcgccg tgaccaatta ttgaaggccg 1020
ctaacgcggc ctttttttgt ttctggtatc ccgaatggag cgacttctcc ccaaaaagcc 1080
tcgctttcag cacctgtcgt ttcctttctt ttcagagggt attttaaata aaaacattaa 1140
gttatgacga agaagaacgg aaacgcctta aaccggaaaa ttttcataaa tagcgaaaac 1200
ccgcgaggtc gccgccccgt aacctgtcgg atcaccggaa aggacccgta aagtgataat 1260
gattatcatc tacatatcac aacgtgcgta aagggtaagt atgaaggtcg tgtactccat 1320
cgctaccaaa ttccagaaaa cagacgcttt cgagcgtctt ttttcgtttt ggtcacgacg 1380
tactgaaatc catgtcttct cagtcagatc tataataaag actttagcgc gtacagcaaa 1440
ggccgtccga atctgcacac cctttactgg aaagcattat ttgacgaacg taacctgcaa 1500
gatgtggtgt ataaactgaa cggtgaggcg gaacttttct accgtaaaca gagtatcccg 1560
aagaaaatca cgcatccggc aaaagaagct attgccaaca aaaacaaaga caacccgaag 1620
aaagaatcag tattcgaata tgacctgatc aaagataaac gtttcaccga agataagttc 1680
tttttccact gtccgattac catcaacttc aaatctagcg gtgcgaacaa gttcaacgat 1740
gaaattaact tattactgaa agagaaagct aatgacgtac acatcttatc tattgatcgc 1800
ggtgaacgtc atttagcata ctatacactg gtagatggta aaggtaatat tattaaacag 1860
gatactttca atattatcgg taatgaccgt atgaaaacca actatcacga taagctggcg 1920
gcgatcgaaa aagatcgtga ttctgcgcgt aaagattgga agaaaattaa caatatcaaa 1980
gaaatgaaag aaggctatct gagccaagtg gtgcacgaga tcgcaaaact ggtgattgaa 2040
tataacgcta tcgtggtttt cgaagatctg aactttggtt ttaaacgtgg tcgcttcaaa 2100
gtagaaaaac aggtgtacca aaaactggaa aaaatgctga ttgaaaaact gaactatctg 2160
gtttttaaag acaacgaatt tgacaaaacg ggtggcgtac tccgtgccta tcagctgacc 2220
gctccgttcg aaacgttcaa gaaaatgggt aaacaaacgg ggattatcta ttatgtgcca 2280
gctggtttca cctccaagat ttgtccagtt acgggcttcg ttaaccagct gtacccgaaa 2340
tacgagagcg ttagcaaatc tcaagaattt ttcagcaaat tcgacaagat ctgctataat 2400
ctggataaag gctatttcga gttcagcttc gattacaaaa acttcggcga taaagcggct 2460
aaaggtaagt ggactattgc tagctttggt agccgtctga ttaactttcg caactccgac 2520
aaaaaccata attgggacac gcgtgaagtg tatccgacca aagaactgga aaaattactg 2580
aaagactatt ccatcgaata tggtcatggg gagtgcatta aagcggcgat ttgcggtgaa 2640
tccgataaga aatttttcgc caaactgacc agcgtgctta acaccattct gcaaatgcgt 2700
aattctaaaa cgggtacgga gctggactac ctgatttctc cggtagccga cgttaacggc 2760
aacttcttcg attctcgtca agcaccgaaa aatatgccac aagacgcgga tgccaacggt 2820
gcataccata tcggcttaaa aggcttaatg ttattaggcc gtatcaagaa taatcaggag 2880
ggcaagaaat taaatctggt tatcaaaaac gaagaatact tcgagttcgt tcagaatcgt 2940
aacaattaat gtatgcttaa gcagctcggt accaaagacg aacaataaga cgctgaaaag 3000
cgtctttttt cgttttggtc ctgttgcggc gcgatagtgt gaacatgcta tagacttctg 3060
gtgctacccg actgacagct agctcagtcc taggtataat gctagcaatt tctactgttg 3120
tagatagaag agcttcatcg ctcttcatcg agacgaacaa taaggcctcc ctaacggggg 3180
gcctttttta ttgataacaa aagtaacttc gagcttgtct acctccgtaa attgcaccca 3240
cattccttaa agagtgcatg tgcatatttt gttatcaata aaaaaggccg cgatttgcgg 3300
ccttattgtt cgtcttgccg gattacgccc cgccctgcca ctcatcgcag tattgttgta 3360
attcattaag cattctgccg acatggaagc catcacaaac ggcatgatga acttggatcg 3420
ccagtggcat taacaccttg tcgccttgcg tataatattt tcccatagtg aaaacggggg 3480
cgaagaagtt gtccatattt gctacgttta aatcaaaact ggtgaaactc acccacggat 3540
tggcactgac gaaaaacata ttttcgataa accctttagg gaaatatgct aagttttcac 3600
cgtaacacgc cacatcttga ctatatatgt gtagaaactg ccggaaatcg tcgtggtatt 3660
ctgaccagag cgatgaaaac gtttcagttt gctcatggaa aacggtgtaa caagggtgaa 3720
cactatccca tatcaccagc tcaccgtctt tcattgccat acgaaactcc ggatgtgcat 3780
tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa cttgtgctta tttttcttta 3840
cggtttttaa aaaggccgta atatccagct gaacggtttg gttataggtg cactgagcaa 3900
ctgactggaa tgcctcaaaa tgttctttac gatgccattg acttatatca actgtagtat 3960
atccagtgat ttttttctcc attttagctt ccttagcttg cgaaatctcg ataactcaaa 4020
aaatagtagt gatcttattt cattatggtg aaagttgtct tacgtgcaac att 4073
<210> 6
<211> 6491
<212> DNA
<213> 人工序列
<220>
<223> GG6K (p504)
<400> 6
gcccgcagaa agggtatgaa aaattcgaat ttaatataga ggactgccgt aagttcatcg 60
acttctataa acagagcatt tccaaacatc cggaatggaa agacttcggc ttccgtttct 120
ctgacactca gcgctataat agcatcgacg agttctaccg cgaagtggag aatcagggct 180
ataaactgac cttcgagaac attagtgagt cgtacatcga ctccgttgtg aatcagggta 240
aactgtacct gtttcagatc tataataaag actttagcgc gtacagcaaa ggccgtccga 300
atctgcacac cctttactgg aaagcattat ttgacgaacg taacctgcaa gatgtggtgt 360
ataaactgaa cggtgaggcg gaacttttct accgtaaaca gagtatcccg aagaaaatca 420
cgcatccggc aaaagaagct attgccaaca aaaacaaaga caacccgaag aaagaatcag 480
tattcgaata tgacctgatc aaagataaac gtttcaccga agataagttc tttttccact 540
gtccgattac catcaacttc aaatctagcg gtgcgaacaa gttcaacgat gaaattaact 600
tattactgaa agagaaagct aatgacgtac acatcttatc tattgatcgc ggtgaacgtc 660
atttagcata ctatacactg gtagatggta aaggtaatat tattaaacag gatactttca 720
atattatcgg taatgaccgt atgaaaacca actatcacga taagctggcg gcgatcgaaa 780
aagatcgtga ttctgcgcgt aaagattgga agaaaattaa caatatcaaa gaaatgaaag 840
aaggctatct gagccaagtg gtgcacgaga tcgcaaaact ggtgattgaa tataacgcta 900
tcgtggtttt cgaagatctg aactttggtt ttaaacgtgg tcgcttcaaa gtagaaaaac 960
aggtgtacca aaaactggaa aaaatgctga ttgaaaaact gaactatctg gtttttaaag 1020
acaacgaatt tgacaaaacg ggtggcgtac tccgtgccta tcagctgacc gctccgttcg 1080
aaacgttcaa gaaaatgggt aaacaaacgg ggattatcta ttatgtgcca gctggtttca 1140
cctccaagat ttgtccagtt acgggcttcg ttaaccagct gtacccgaaa tacgagagcg 1200
ttagcaaatc tcaagaattt ttcagcaaat tcgacaagat ctgctataat ctggataaag 1260
gctatttcga gttcagcttc gattacaaaa acttcggcga taaagcggct aaaggtaagt 1320
ggactattgc tagctttggt agccgtctga ttaactttcg caactccgac aaaaaccata 1380
attgggacac gcgtgaagtg tatccgacca aagaactgga aaaattactg aaagactatt 1440
ccatcgaata tggtcatggg gagtgcatta aagcggcgat ttgcggtgaa tccgataaga 1500
aatttttcgc caaactgacc agcgtgctta acaccattct gcaaatgcgt aattctaaaa 1560
cgggtacgga gctggactac ctgatttctc cggtagccga cgttaacggc aacttcttcg 1620
attctcgtca agcaccgaaa aatatgccac aagacgcgga tgccaacggt gcataccata 1680
tcggcttaaa aggcttaatg ttattaggcc gtatcaagaa taatcaggag ggcaagaaat 1740
taaatctggt tatcaaaaac gaagaatact tcgagttcgt tcagaatcgt aacaattaat 1800
gtatgcttaa gcagctcggt accaaagacg aacaataaga cgctgaaaag cgtctttttt 1860
cgttttggtc ctgttgcggc gcgatagtgt gaacatgcta tagacttctg gtgctacccg 1920
actgacagct agctcagtcc taggtataat gctagcaatt tctactgttg tagatagaag 1980
agcttcatcg ctcttcatcg agacgaacaa taaggcctcc ctaacggggg gcctttttta 2040
ttgataacaa aagtaacttc gagcttgtct acctccgtaa attgcaccca cattccttaa 2100
agagtgcatg tgcatatttt gttatcaata aaaaaggccg cgatttgcgg ccttattgtt 2160
cgtcttgccg gattacgccc cgccctgcca ctcatcgcag tattgttgta attcattaag 2220
cattctgccg acatggaagc catcacaaac ggcatgatga acttggatcg ccagtggcat 2280
taacaccttg tcgccttgcg tataatattt tcccatagtg aaaacggggg cgaagaagtt 2340
gtccatattt gctacgttta aatcaaaact ggtgaaactc acccacggat tggcactgac 2400
gaaaaacata ttttcgataa accctttagg gaaatatgct aagttttcac cgtaacacgc 2460
cacatcttga ctatatatgt gtagaaactg ccggaaatcg tcgtggtatt ctgaccagag 2520
cgatgaaaac gtttcagttt gctcatggaa aacggtgtaa caagggtgaa cactatccca 2580
tatcaccagc tcaccgtctt tcattgccat acgaaactcc ggatgtgcat tcatcaggcg 2640
ggcaagaatg tgaataaagg ccggataaaa cttgtgctta tttttcttta cggtttttaa 2700
aaaggccgta atatccagct gaacggtttg gttataggtg cactgagcaa ctgactggaa 2760
tgcctcaaaa tgttctttac gatgccattg acttatatca actgtagtat atccagtgat 2820
ttttttctcc attttagctt ccttagcttg cgaaatctcg ataactcaaa aaatagtagt 2880
gatcttattt cattatggtg aaagttgtct tacgtgcaac attttcgcaa aaagttggcg 2940
ctttatcaac actgtcggaa tgacaaatgg ttccaattat tgaacaccct tcggggtgtt 3000
tttttgtttc tggtttcccg aggccggcct gcgctagcgg agtgtatact ggcttactat 3060
gttggcactg atgagggtgt aagtgaagtg cttcatgtgg caggagaaaa aaggctgcat 3120
cggtgcgtca gcagaatatg tgatacagga tatattccgc ttcctcgctc actgactcgc 3180
tacgctcggt cgttcgactg tggcgagcgg aaatggctta cgaacggggc ggagatttcc 3240
tggaagatgc caggaagata cttaacaggg aagtgagagg gtcgcggcaa agccgttttt 3300
ccataggctc cgcccccctg acaagcatca cgaaatctga cgctcaaatc agtggtggcg 3360
aaacctgaca ggactataaa gataccaggc gtttccccct ggcggctccc tcgtgcgctc 3420
tcctgttcct gcctttcggt ttgccggtgt cattcctctg ttacggccga gtttgtctca 3480
ttccacgcct gacactcagt tccgggtagg cagttcgctc caagctggac tgtatgcacg 3540
aaccccccgt tcagtccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 3600
cggaaagaca tgcaaaagca ccactggcag cagccactgg taattgattt agaggagtta 3660
gtcttgaagt catgcgccgg ataaggctaa actgaaagga caagttttgg cgactgcgct 3720
cctccaagcc agttacctcg gttcaaagag ttggtagctc agagaacctt cgaaaaaccg 3780
ccctgcaagg cggttttttc gttttcagag caagagatta cgcgcagacc aaaacgatct 3840
caagaagatc atcttattaa tcagataaaa tatttctaga tttcagtgca atttatctct 3900
tcaaatgtag caccggcgcg ccgtgaccaa ttattgaagg ccgctaacgc ggcctttttt 3960
tgtttctggt atcccgaatg gagcgacttc tccccaaaaa gcctcgcttt cagcacctgt 4020
cgtttccttt cttttcagag ggtattttaa ataaaaacat taagttatga cgaagaagaa 4080
cggaaacgcc ttaaaccgga aaattttcat aaatagcgaa aacccgcgag gtcgccgccc 4140
cgtaacctgt cggatcaccg gaaaggaccc gtaaagtgat aatgattatc atctacatat 4200
cacaacgtgc gtaaagggta agtatgaagg tcgtgtactc catcgctacc aaattccaga 4260
aaacagacgc tttcgagcgt cttttttcgt tttggtcacg acgtactgaa tctgattcgt 4320
taccaattga catgatacga aacgtaccgt atcgttaagg ttactagaag agcgattggg 4380
ctcttcaatg tccatctatc aggagtttgt taacaagtat tccctgtcta aaaccctgcg 4440
ttttgaactg atcccgcagg gcaaaacttt ggaaaacatt aaagcgcgtg gcctgattct 4500
ggatgacgaa aaacgtgcaa aggattacaa gaaagctaaa cagatcatcg acaaatatca 4560
ccagttcttt atcgaagaaa ttctgtcgtc ggtgtgcatc agtgaggatc tgttacagaa 4620
ttattctgat gtatacttta aacttaaaaa gtccgatgac gataatctgc aaaaagattt 4680
caagtcagcc aaagatacca tcaagaaaca gatctcagaa tatattaaag atagcgaaaa 4740
gttcaaaaac ctgtttaacc aaaacctcat tgatgctaag aaaggccaag aatctgacct 4800
gatcttatgg ctgaaacaga gcaaagataa cggcattgaa ctgttcaaag ctaatagcga 4860
catcaccgat attgatgaag cgctcgaaat catcaagtct ttcaaaggct ggacgacgta 4920
tttcaaaggt tttcatgaaa accgtaagaa tgtatattcg agcaacgata ttccgacctc 4980
tattatttat cgtatcgtgg acgacaacct gccgaagttt ctggaaaaca aagcgaaata 5040
tgaatctctg aaagacaaag caccggaagc tattaactat gaacagatca agaaagatct 5100
ggcggaagaa ctgaccttcg acatcgacta taaaacctcc gaagttaacc agcgtgtttt 5160
ctcactggac gaggttttcg aaatcgctaa tttcaacaat tacctgaatc aatctggcat 5220
caccaaattc aacaccatta ttggtggcaa atttgttaac ggcgaaaaca ccaagcgtaa 5280
gggcatcaac gaatacatta acctgtatag ccaacaaatc aacgacaaaa ccctgaaaaa 5340
gtataaaatg tccgttctgt ttaaacagat tttatcggac accgaatcta aatccttcgt 5400
aattgataaa ctggaagatg atagcgacgt tgtcaccacg atgcagagct tttatgagca 5460
gattgcggcg ttcaaaaccg tggaagagaa atctattaaa gaaactctgt ccctgctctt 5520
tgacgacctc aaagcgcaga aactagatct gtctaagatt tactttaaaa acgacaaatc 5580
tctgaccgat ctcagtcaac aagttttcga tgactatagc gtgatcggca cggcagtttt 5640
ggaatacatc acccaacaaa tcgcgccgaa aaatctggac aacccgtcca agaaggaaca 5700
ggaactgatt gcaaagaaaa cagaaaaagc taaatacctg agcttagaaa ctatcaaact 5760
ggcacttgag gaatttaata aacatcgtga tattgataaa cagtgtcgtt ttgaggaaat 5820
tctggcgaac tttgcggcaa tcccgatgat cttcgacgaa attgctcaaa acaaagacaa 5880
tctggcgcag atctctatca agtaccagaa tcagggtaag aaagatctgc ttcaagcatc 5940
tgcggaggac gatgtgaaag caattaaaga cttattagat cagacgaata acttattaca 6000
caagctcaaa atcttccaca tcagccagag cgaggacaag gcgaacattc tggataaaga 6060
tgaacacttc tatctggtgt tcgaagaatg ttacttcgaa ctggcaaaca tcgtccctct 6120
ctacaataaa atccgcaact acatcacgca gaagccttac tctgacgaga aattcaaact 6180
gaacttcgaa aacagcacgc tggcgaacgg ctgggataag aacaaagagc cggacaacac 6240
cgcaatcctg ttcatcaaag acgacaaata ctatctgggc gtaatgaaca agaagaacaa 6300
caagatcttc gacgataaag cgatcaaaga aaacaagggt gaaggctata agaaaatcgt 6360
gtacaagctc ctgccgggtg cgaataaaat gttaccgaaa gtgttctttt ccgcgaaaag 6420
catcaaattc tacaacccgt ctgaggatat tctgcgcatc cgcaatcata gcacgcacac 6480
taaaaacggt a 6491
<210> 7
<211> 7980
<212> DNA
<213> 人工序列
<220>
<223> GG8K (p711)
<400> 7
actgtcggaa tgacaaatgg ttccaattat tgaacaccct tcggggtgtt tttttgtttc 60
tggtttcccg aggccggcct gcgctagcgg agtgtatact ggcttactat gttggcactg 120
atgagggtgt aagtgaagtg cttcatgtgg caggagaaaa aaggctgcat cggtgcgtca 180
gcagaatatg tgatacagga tatattccgc ttcctcgctc actgactcgc tacgctcggt 240
cgttcgactg tggcgagcgg aaatggctta cgaacggggc ggagatttcc tggaagatgc 300
caggaagata cttaacaggg aagtgagagg gtcgcggcaa agccgttttt ccataggctc 360
cgcccccctg acaagcatca cgaaatctga cgctcaaatc agtggtggcg aaacctgaca 420
ggactataaa gataccaggc gtttccccct ggcggctccc tcgtgcgctc tcctgttcct 480
gcctttcggt ttgccggtgt cattcctctg ttacggccga gtttgtctca ttccacgcct 540
gacactcagt tccgggtagg cagttcgctc caagctggac tgtatgcacg aaccccccgt 600
tcagtccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggaaagaca 660
tgcaaaagca ccactggcag cagccactgg taattgattt agaggagtta gtcttgaagt 720
catgcgccgg ataaggctaa actgaaagga caagttttgg cgactgcgct cctccaagcc 780
agttacctcg gttcaaagag ttggtagctc agagaacctt cgaaaaaccg ccctgcaagg 840
cggttttttc gttttcagag caagagatta cgcgcagacc aaaacgatct caagaagatc 900
atcttattaa tcagataaaa tatttctaga tttcagtgca atttatctct tcaaatgtag 960
caccggcgcg ccgtgaccaa ttattgaagg ccgctaacgc ggcctttttt tgtttctggt 1020
atcccgaatg gagcgacttc tccccaaaaa gcctcgcttt cagcacctgt cgtttccttt 1080
cttttcagag ggtattttaa ataaaaacat taagttatga cgaagaagaa cggaaacgcc 1140
ttaaaccgga aaattttcat aaatagcgaa aacccgcgag gtcgccgccc cgtaacctgt 1200
cggatcaccg gaaaggaccc gtaaagtgat aatgattatc atctacatat cacaacgtgc 1260
gtaaagggta agtatgaagg tcgtgtactc catcgctacc aaattccaga aaacagacgc 1320
tttcgagcgt cttttttcgt tttggtcacg acgtactgaa tctgattcgt taccaattga 1380
catgatacga aacgtaccgt atcgttaagg ttactagaag agcgattggg ctcttcaatg 1440
tccatctatc aggagtttgt taacaagtat tccctgtcta aaaccctgcg ttttgaactg 1500
atcccgcagg gcaaaacttt ggaaaacatt aaagcgcgtg gcctgattct ggatgacgaa 1560
aaacgtgcaa aggattacaa gaaagctaaa cagatcatcg acaaatatca ccagttcttt 1620
atcgaagaaa ttctgtcgtc ggtgtgcatc agtgaggatc tgttacagaa ttattctgat 1680
gtatacttta aacttaaaaa gtccgatgac gataatctgc aaaaagattt caagtcagcc 1740
aaagatacca tcaagaaaca gatctcagaa tatattaaag atagcgaaaa gttcaaaaac 1800
ctgtttaacc aaaacctcat tgatgctaag aaaggccaag aatctgacct gatcttatgg 1860
ctgaaacaga gcaaagataa cggcattgaa ctgttcaaag ctaatagcga catcaccgat 1920
attgatgaag cgctcgaaat catcaagtct ttcaaaggct ggacgacgta tttcaaaggt 1980
tttcatgaaa accgtaagaa tgtatattcg agcaacgata ttccgacctc tattatttat 2040
cgtatcgtgg acgacaacct gccgaagttt ctggaaaaca aagcgaaata tgaatctctg 2100
aaagacaaag caccggaagc tattaactat gaacagatca agaaagatct ggcggaagaa 2160
ctgaccttcg acatcgacta taaaacctcc gaagttaacc agcgtgtttt ctcactggac 2220
gaggttttcg aaatcgctaa tttcaacaat tacctgaatc aatctggcat caccaaattc 2280
aacaccatta ttggtggcaa atttgttaac ggcgaaaaca ccaagcgtaa gggcatcaac 2340
gaatacatta acctgtatag ccaacaaatc aacgacaaaa ccctgaaaaa gtataaaatg 2400
tccgttctgt ttaaacagat tttatcggac accgaatcta aatccttcgt aattgataaa 2460
ctggaagatg atagcgacgt tgtcaccacg atgcagagct tttatgagca gattgcggcg 2520
ttcaaaaccg tggaagagaa atctattaaa gaaactctgt ccctgctctt tgacgacctc 2580
aaagcgcaga aactagatct gtctaagatt tactttaaaa acgacaaatc tctgaccgat 2640
ctcagtcaac aagttttcga tgactatagc gtgatcggca cggcagtttt ggaatacatc 2700
acccaacaaa tcgcgccgaa aaatctggac aacccgtcca agaaggaaca ggaactgatt 2760
gcaaagaaaa cagaaaaagc taaatacctg agcttagaaa ctatcaaact ggcacttgag 2820
gaatttaata aacatcgtga tattgataaa cagtgtcgtt ttgaggaaat tctggcgaac 2880
tttgcggcaa tcccgatgat cttcgacgaa attgctcaaa acaaagacaa tctggcgcag 2940
atctctatca agtaccagaa tcagggtaag aaagatctgc ttcaagcatc tgcggaggac 3000
gatgtgaaag caattaaaga cttattagat cagacgaata acttattaca caagctcaaa 3060
atcttccaca tcagccagag cgaggacaag gcgaacattc tggataaaga tgaacacttc 3120
tatctggtgt tcgaagaatg ttacttcgaa ctggcaaaca tcgtccctct ctacaataaa 3180
atccgcaact acatcacgca gaagccttac tctgacgaga aattcaaact gaacttcgaa 3240
aacagcacgc tggcgaacgg ctgggataag aacaaagagc cggacaacac cgcaatcctg 3300
ttcatcaaag acgacaaata ctatctgggc gtaatgaaca agaagaacaa caagatcttc 3360
gacgataaag cgatcaaaga aaacaagggt gaaggctata agaaaatcgt gtacaagctc 3420
ctgccgggtg cgaataaaat gttaccgaaa gtgttctttt ccgcgaaaag catcaaattc 3480
tacaacccgt ctgaggatat tctgcgcatc cgcaatcata gcacgcacac taaaaacggt 3540
agcccgcaga aagggtatga aaaattcgaa tttaatatag aggactgccg taagttcatc 3600
gacttctata aacagagcat ttccaaacat ccggaatgga aagacttcgg cttccgtttc 3660
tctgacactc agcgctataa tagcatcgac gagttctacc gcgaagtgga gaatcagggc 3720
tataaactga ccttcgagaa cattagtgag tcgtacatcg actccgttgt gaatcagggt 3780
aaactgtacc tgtttcagat ctataataaa gactttagcg cgtacagcaa aggccgtccg 3840
aatctgcaca ccctttactg gaaagcatta tttgacgaac gtaacctgca agatgtggtg 3900
tataaactga acggtgaggc ggaacttttc taccgtaaac agagtatccc gaagaaaatc 3960
acgcatccgg caaaagaagc tattgccaac aaaaacaaag acaacccgaa gaaagaatca 4020
gtattcgaat atgacctgat caaagataaa cgtttcaccg aagataagtt ctttttccac 4080
tgtccgatta ccatcaactt caaatctagc ggtgcgaaca agttcaacga tgaaattaac 4140
ttattactga aagagaaagc taatgacgta cacatcttat ctattgatcg cggtgaacgt 4200
catttagcat actatacact ggtagatggt aaaggtaata ttattaaaca ggatactttc 4260
aatattatcg gtaatgaccg tatgaaaacc aactatcacg ataagctggc ggcgatcgaa 4320
aaagatcgtg attctgcgcg taaagattgg aagaaaatta acaatatcaa agaaatgaaa 4380
gaaggctatc tgagccaagt ggtgcacgag atcgcaaaac tggtgattga atataacgct 4440
atcgtggttt tcgaagatct gaactttggt tttaaacgtg gtcgcttcaa agtagaaaaa 4500
caggtgtacc aaaaactgga aaaaatgctg attgaaaaac tgaactatct ggtttttaaa 4560
gacaacgaat ttgacaaaac gggtggcgta ctccgtgcct atcagctgac cgctccgttc 4620
gaaacgttca agaaaatggg taaacaaacg gggattatct attatgtgcc agctggtttc 4680
acctccaaga tttgtccagt tacgggcttc gttaaccagc tgtacccgaa atacgagagc 4740
gttagcaaat ctcaagaatt tttcagcaaa ttcgacaaga tctgctataa tctggataaa 4800
ggctatttcg agttcagctt cgattacaaa aacttcggcg ataaagcggc taaaggtaag 4860
tggactattg ctagctttgg tagccgtctg attaactttc gcaactccga caaaaaccat 4920
aattgggaca cgcgtgaagt gtatccgacc aaagaactgg aaaaattact gaaagactat 4980
tccatcgaat atggtcatgg ggagtgcatt aaagcggcga tttgcggtga atccgataag 5040
aaatttttcg ccaaactgac cagcgtgctt aacaccattc tgcaaatgcg taattctaaa 5100
acgggtacgg agctggacta cctgatttct ccggtagccg acgttaacgg caacttcttc 5160
gattctcgtc aagcaccgaa aaatatgcca caagacgcgg atgccaacgg tgcataccat 5220
atcggcttaa aaggcttaat gttattaggc cgtatcaaga ataatcagga gggcaagaaa 5280
ttaaatctgg ttatcaaaaa cgaagaatac ttcgagttcg ttcagaatcg taacaattaa 5340
tgtatgctta agcagctcgg taccaaagac gaacaataag acgctgaaaa gcgtcttttt 5400
tcgttttggt cctgttgcgg cgcgatagtg tgaacatgct atagacttct ggtgctaccc 5460
gactgacagc tagctcagtc ctaggtataa tgctagcaat ttctactgtt gtagatagaa 5520
gagcttcatc gctcttcatc gagacgaaca ataaggcctc cctaacgggg ggcctttttt 5580
attgataaca aaagtaactt cgagcttgtc tacctcctag cactttatag ctagctcagc 5640
ccttggtaca atgctagcgt tttcattaaa gaggagaaag gaagccatga gtaaaggtga 5700
ggaattattt actggtgttg ttccgatctt agttgaactg gacggcgatg ttaacggtca 5760
taaattcagt gttcgtggtg aaggtgaagg tgatgcaacc aacggtaagc tgaccctgaa 5820
attcatctgc actactggaa aattaccagt accgtggcct actctggtga ctaccctgac 5880
ctatggtgtt cagtgttttt ctcgttaccc tgaccacatg aagcaacatg atttcttcaa 5940
atctgcaatg ccggaaggtt atgtacagga gcgcaccatt tctttcaaag acgatggcac 6000
gtataaaacc cgtgcagagg ttaaatttga aggtgacact ctggtgaatc gtattgaact 6060
gaaaggcatt gatttcaaag aggacggcaa tattttaggc cacaaactgg aatataactt 6120
caactcccat aacgtttaca tcaccgcaga caaacagaag aacggtatca aagctaactt 6180
caaaattcgc cataacgttg aagatggtag cgtacagctg gcggatcatt accaacagaa 6240
cactccgatt ggagatgctc ctgttttact gccggataac cactacctgt ccacccagtc 6300
taaactgtcg aaggatccga acgaaaagcg cgaccacatg gtgttattag agttcgttac 6360
cgctagtggt atcacgcacg gtatggatga actctacaaa taagacgaac aataagggga 6420
gcgggaaacc gctccccttt tttattgata acaaaagtaa attgcacgct gatagtctcc 6480
caattgcgaa ggaccaaaac gaaaaaacac cctttcgggt gtcttttctg gaatttggta 6540
ccgagtacta ggtatcgtgt aagtagcgaa ggcccgtacg cgagataaac tgctaggcaa 6600
ccgcgactct acgactggtg ctcgatttaa tttcgctgac gtaaagaaat tatcggcagt 6660
gcgtcaactg ccgtatcttt atcttaatta ggtagttgga caagcccttg aaagaaatag 6720
caagagcctg cctctctatt gaagtcacgg cgaaagtcgg gtagaaatca aagaaagcag 6780
aaattaaatc ggagtaacac taaggtggga taactccgta actgactacg cctttctcta 6840
gactttactt gaccagatac actgtctttg acacgttgaa ggattagagc aatcaaatcc 6900
aagactggct aagcacgaag caactcttga gtgttaaaaa gttatctcct gtattcggga 6960
agcgggtact agaagattgc agggactccg acgttaagta aattacaaag taataagtat 7020
cgttcaggat cacgttaccg caataagaag cgagaataat ataatttccg aagtgcttac 7080
cccagtagtg actattccta taacccttct gagtgtccgg cattccttaa agagtgcatg 7140
tgcatatttt gttatcaata aaaaaggccg cgatttgcgg ccttattgtt cgtcttgccg 7200
gattacgccc cgccctgcca ctcatcgcag tattgttgta attcattaag cattctgccg 7260
acatggaagc catcacaaac ggcatgatga acttggatcg ccagtggcat taacaccttg 7320
tcgccttgcg tataatattt tcccatagtg aaaacggggg cgaagaagtt gtccatattt 7380
gctacgttta aatcaaaact ggtgaaactc acccacggat tggcactgac gaaaaacata 7440
ttttcgataa accctttagg gaaatatgct aagttttcac cgtaacacgc cacatcttga 7500
ctatatatgt gtagaaactg ccggaaatcg tcgtggtatt ctgaccagag cgatgaaaac 7560
gtttcagttt gctcatggaa aacggtgtaa caagggtgaa cactatccca tatcaccagc 7620
tcaccgtctt tcattgccat acgaaactcc ggatgtgcat tcatcaggcg ggcaagaatg 7680
tgaataaagg ccggataaaa cttgtgctta tttttcttta cggtttttaa aaaggccgta 7740
atatccagct gaacggtttg gttataggtg cactgagcaa ctgactggaa tgcctcaaaa 7800
tgttctttac gatgccattg acttatatca actgtagtat atccagtgat ttttttctcc 7860
attttagctt ccttagcttg cgaaatctcg ataactcaaa aaatagtagt gatcttattt 7920
cattatggtg aaagttgtct tacgtgcaac attttcgcaa aaagttggcg ctttatcaac 7980
<210> 8
<211> 12262
<212> DNA
<213> 人工序列
<220>
<223> GG12K (p499)
<400> 8
actgtcggaa tgacaaatgg ttccaattat tgaacaccct tcggggtgtt tttttgtttc 60
tggtttcccg aggccggcct gcgctagcgg agtgtatact ggcttactat gttggcactg 120
atgagggtgt aagtgaagtg cttcatgtgg caggagaaaa aaggctgcat cggtgcgtca 180
gcagaatatg tgatacagga tatattccgc ttcctcgctc actgactcgc tacgctcggt 240
cgttcgactg tggcgagcgg aaatggctta cgaacggggc ggagatttcc tggaagatgc 300
caggaagata cttaacaggg aagtgagagg gtcgcggcaa agccgttttt ccataggctc 360
cgcccccctg acaagcatca cgaaatctga cgctcaaatc agtggtggcg aaacctgaca 420
ggactataaa gataccaggc gtttccccct ggcggctccc tcgtgcgctc tcctgttcct 480
gcctttcggt ttgccggtgt cattcctctg ttacggccga gtttgtctca ttccacgcct 540
gacactcagt tccgggtagg cagttcgctc caagctggac tgtatgcacg aaccccccgt 600
tcagtccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggaaagaca 660
tgcaaaagca ccactggcag cagccactgg taattgattt agaggagtta gtcttgaagt 720
catgcgccgg ataaggctaa actgaaagga caagttttgg cgactgcgct cctccaagcc 780
agttacctcg gttcaaagag ttggtagctc agagaacctt cgaaaaaccg ccctgcaagg 840
cggttttttc gttttcagag caagagatta cgcgcagacc aaaacgatct caagaagatc 900
atcttattaa tcagataaaa tatttctaga tttcagtgca atttatctct tcaaatgtag 960
caccggcgcg ccgtgaccaa ttattgaagg ccgctaacgc ggcctttttt tgtttctggt 1020
atcccgaatg gagcgacttc tccccaaaaa gcctcgcttt cagcacctgt cgtttccttt 1080
cttttcagag ggtattttaa ataaaaacat taagttatga cgaagaagaa cggaaacgcc 1140
ttaaaccgga aaattttcat aaatagcgaa aacccgcgag gtcgccgccc cgtaacctgt 1200
cggatcaccg gaaaggaccc gtaaagtgat aatgattatc atctacatat cacaacgtgc 1260
gtaaagggta agtatgaagg tcgtgtactc catcgctacc aaattccaga aaacagacgc 1320
tttcgagcgt cttttttcgt tttggtcacg acgtactgaa tctgattcgt taccaattga 1380
catgatacga aacgtaccgt atcgttaagg ttactagaag agcgattggg ctcttcaatg 1440
tccatctatc aggagtttgt taacaagtat tccctgtcta aaaccctgcg ttttgaactg 1500
atcccgcagg gcaaaacttt ggaaaacatt aaagcgcgtg gcctgattct ggatgacgaa 1560
aaacgtgcaa aggattacaa gaaagctaaa cagatcatcg acaaatatca ccagttcttt 1620
atcgaagaaa ttctgtcgtc ggtgtgcatc agtgaggatc tgttacagaa ttattctgat 1680
gtatacttta aacttaaaaa gtccgatgac gataatctgc aaaaagattt caagtcagcc 1740
aaagatacca tcaagaaaca gatctcagaa tatattaaag atagcgaaaa gttcaaaaac 1800
ctgtttaacc aaaacctcat tgatgctaag aaaggccaag aatctgacct gatcttatgg 1860
ctgaaacaga gcaaagataa cggcattgaa ctgttcaaag ctaatagcga catcaccgat 1920
attgatgaag cgctcgaaat catcaagtct ttcaaaggct ggacgacgta tttcaaaggt 1980
tttcatgaaa accgtaagaa tgtatattcg agcaacgata ttccgacctc tattatttat 2040
cgtatcgtgg acgacaacct gccgaagttt ctggaaaaca aagcgaaata tgaatctctg 2100
aaagacaaag caccggaagc tattaactat gaacagatca agaaagatct ggcggaagaa 2160
ctgaccttcg acatcgacta taaaacctcc gaagttaacc agcgtgtttt ctcactggac 2220
gaggttttcg aaatcgctaa tttcaacaat tacctgaatc aatctggcat caccaaattc 2280
aacaccatta ttggtggcaa atttgttaac ggcgaaaaca ccaagcgtaa gggcatcaac 2340
gaatacatta acctgtatag ccaacaaatc aacgacaaaa ccctgaaaaa gtataaaatg 2400
tccgttctgt ttaaacagat tttatcggac accgaatcta aatccttcgt aattgataaa 2460
ctggaagatg atagcgacgt tgtcaccacg atgcagagct tttatgagca gattgcggcg 2520
ttcaaaaccg tggaagagaa atctattaaa gaaactctgt ccctgctctt tgacgacctc 2580
aaagcgcaga aactagatct gtctaagatt tactttaaaa acgacaaatc tctgaccgat 2640
ctcagtcaac aagttttcga tgactatagc gtgatcggca cggcagtttt ggaatacatc 2700
acccaacaaa tcgcgccgaa aaatctggac aacccgtcca agaaggaaca ggaactgatt 2760
gcaaagaaaa cagaaaaagc taaatacctg agcttagaaa ctatcaaact ggcacttgag 2820
gaatttaata aacatcgtga tattgataaa cagtgtcgtt ttgaggaaat tctggcgaac 2880
tttgcggcaa tcccgatgat cttcgacgaa attgctcaaa acaaagacaa tctggcgcag 2940
atctctatca agtaccagaa tcagggtaag aaagatctgc ttcaagcatc tgcggaggac 3000
gatgtgaaag caattaaaga cttattagat cagacgaata acttattaca caagctcaaa 3060
atcttccaca tcagccagag cgaggacaag gcgaacattc tggataaaga tgaacacttc 3120
tatctggtgt tcgaagaatg ttacttcgaa ctggcaaaca tcgtccctct ctacaataaa 3180
atccgcaact acatcacgca gaagccttac tctgacgaga aattcaaact gaacttcgaa 3240
aacagcacgc tggcgaacgg ctgggataag aacaaagagc cggacaacac cgcaatcctg 3300
ttcatcaaag acgacaaata ctatctgggc gtaatgaaca agaagaacaa caagatcttc 3360
gacgataaag cgatcaaaga aaacaagggt gaaggctata agaaaatcgt gtacaagctc 3420
ctgccgggtg cgaataaaat gttaccgaaa gtgttctttt ccgcgaaaag catcaaattc 3480
tacaacccgt ctgaggatat tctgcgcatc cgcaatcata gcacgcacac taaaaacggt 3540
agcccgcaga aagggtatga aaaattcgaa tttaatatag aggactgccg taagttcatc 3600
gacttctata aacagagcat ttccaaacat ccggaatgga aagacttcgg cttccgtttc 3660
tctgacactc agcgctataa tagcatcgac gagttctacc gcgaagtgga gaatcagggc 3720
tataaactga ccttcgagaa cattagtgag tcgtacatcg actccgttgt gaatcagggt 3780
aaactgtacc tgtttcagat ctataataaa gactttagcg cgtacagcaa aggccgtccg 3840
aatctgcaca ccctttactg gaaagcatta tttgacgaac gtaacctgca agatgtggtg 3900
tataaactga acggtgaggc ggaacttttc taccgtaaac agagtatccc gaagaaaatc 3960
acgcatccgg caaaagaagc tattgccaac aaaaacaaag acaacccgaa gaaagaatca 4020
gtattcgaat atgacctgat caaagataaa cgtttcaccg aagataagtt ctttttccac 4080
tgtccgatta ccatcaactt caaatctagc ggtgcgaaca agttcaacga tgaaattaac 4140
ttattactga aagagaaagc taatgacgta cacatcttat ctattgatcg cggtgaacgt 4200
catttagcat actatacact ggtagatggt aaaggtaata ttattaaaca ggatactttc 4260
aatattatcg gtaatgaccg tatgaaaacc aactatcacg ataagctggc ggcgatcgaa 4320
aaagatcgtg attctgcgcg taaagattgg aagaaaatta acaatatcaa agaaatgaaa 4380
gaaggctatc tgagccaagt ggtgcacgag atcgcaaaac tggtgattga atataacgct 4440
atcgtggttt tcgaagatct gaactttggt tttaaacgtg gtcgcttcaa agtagaaaaa 4500
caggtgtacc aaaaactgga aaaaatgctg attgaaaaac tgaactatct ggtttttaaa 4560
gacaacgaat ttgacaaaac gggtggcgta ctccgtgcct atcagctgac cgctccgttc 4620
gaaacgttca agaaaatggg taaacaaacg gggattatct attatgtgcc agctggtttc 4680
acctccaaga tttgtccagt tacgggcttc gttaaccagc tgtacccgaa atacgagagc 4740
gttagcaaat ctcaagaatt tttcagcaaa ttcgacaaga tctgctataa tctggataaa 4800
ggctatttcg agttcagctt cgattacaaa aacttcggcg ataaagcggc taaaggtaag 4860
tggactattg ctagctttgg tagccgtctg attaactttc gcaactccga caaaaaccat 4920
aattgggaca cgcgtgaagt gtatccgacc aaagaactgg aaaaattact gaaagactat 4980
tccatcgaat atggtcatgg ggagtgcatt aaagcggcga tttgcggtga atccgataag 5040
aaatttttcg ccaaactgac cagcgtgctt aacaccattc tgcaaatgcg taattctaaa 5100
acgggtacgg agctggacta cctgatttct ccggtagccg acgttaacgg caacttcttc 5160
gattctcgtc aagcaccgaa aaatatgcca caagacgcgg atgccaacgg tgcataccat 5220
atcggcttaa aaggcttaat gttattaggc cgtatcaaga ataatcagga gggcaagaaa 5280
ttaaatctgg ttatcaaaaa cgaagaatac ttcgagttcg ttcagaatcg taacaattaa 5340
tgtatgctta agcagctcgg taccaaagac gaacaataag acgctgaaaa gcgtcttttt 5400
tcgttttggt cctgttgcgg cgcgatagtg tgaacatgct atagacttct ggtgctaccc 5460
gactgacagc tagctcagtc ctaggtataa tgctagcaat ttctactgtt gtagatagaa 5520
gagcttcatc gctcttcatc gagacgaaca ataaggcctc cctaacgggg ggcctttttt 5580
attgataaca aaagtaactt cgagcttgtc tacctcctag cactttatag ctagctcagc 5640
ccttggtaca atgctagcgt tttcattaaa gaggagaaag gaagccatga gtaaaggtga 5700
ggaattattt actggtgttg ttccgatctt agttgaactg gacggcgatg ttaacggtca 5760
taaattcagt gttcgtggtg aaggtgaagg tgatgcaacc aacggtaagc tgaccctgaa 5820
attcatctgc actactggaa aattaccagt accgtggcct actctggtga ctaccctgac 5880
ctatggtgtt cagtgttttt ctcgttaccc tgaccacatg aagcaacatg atttcttcaa 5940
atctgcaatg ccggaaggtt atgtacagga gcgcaccatt tctttcaaag acgatggcac 6000
gtataaaacc cgtgcagagg ttaaatttga aggtgacact ctggtgaatc gtattgaact 6060
gaaaggcatt gatttcaaag aggacggcaa tattttaggc cacaaactgg aatataactt 6120
caactcccat aacgtttaca tcaccgcaga caaacagaag aacggtatca aagctaactt 6180
caaaattcgc cataacgttg aagatggtag cgtacagctg gcggatcatt accaacagaa 6240
cactccgatt ggagatgctc ctgttttact gccggataac cactacctgt ccacccagtc 6300
taaactgtcg aaggatccga acgaaaagcg cgaccacatg gtgttattag agttcgttac 6360
cgctagtggt atcacgcacg gtatggatga actctacaaa taagacgaac aataagggga 6420
gcgggaaacc gctccccttt tttattgata acaaaagtaa attgcacgct gatagtctcc 6480
caattgcgaa ggaccaaaac gaaaaaacac cctttcgggt gtcttttctg gaatttggta 6540
ccgagtacta ggtatcgtgt aagtagcgaa ggcccgtacg cgagataaac tgctaggcaa 6600
ccgcgactct acgactggtg ctcgatttaa tttcgctgac gtaaagaaat tatcggcagt 6660
gcgtcaactg ccgtatcttt atcttaatta ggtagttgga caagcccttg aaagaaatag 6720
caagagcctg cctctctatt gaagtcacgg cgaaagtcgg gtagaaatca aagaaagcag 6780
aaattaaatc ggagtaacac taaggtggga taactccgta actgactacg cctttctcta 6840
gactttactt gaccagatac actgtctttg acacgttgaa ggattagagc aatcaaatcc 6900
aagactggct aagcacgaag caactcttga gtgttaaaaa gttatctcct gtattcggga 6960
agcgggtact agaagattgc agggactccg acgttaagta aattacaaag taataagtat 7020
cgttcaggat cacgttaccg caataagaag cgagaataat ataatttccg aagtgcttac 7080
cccagtagtg actattccta taacccttct gagtgtccgg aggcggaaat ttgccacgaa 7140
agagaaagta tttccccgac aataataaag gggcgctcct cagcttttcc acttggttgg 7200
gtaagctagg caactctgaa aggagtttcg gcgaattgaa gccgacagct ttgaattgtt 7260
ttaggggcgt tattcgaggg caatcggagc taacttcaag actacttctt tgttgaatac 7320
taaatagtgc aaaggtcgtg tttcctcaag gatactccgc taacaatata ggattccaat 7380
cagattcagc actggcggta cgggtgttgc ggtgaggcgt tcgggtttac ggctcgaagc 7440
tagcacggta ggaagcctga caatcaccaa gcaaaagggc cgtcgaaggc ccacaagata 7500
cgaaagctct cgaagcctta tccttgaccg atccacctat ttaggcagtt acgcacaaaa 7560
gctacccaat aatccgtgac aggcacaata tcacggaaca aaaccgaaaa ctctcgtaca 7620
cggttaggtt ttcgctagga agaataaacc tctatcttga ttataagaag gctccccaag 7680
cacccccaaa accgaaatag cggtttgcaa taagggacaa gttacgagtg tagacacgca 7740
gaattatcca gcctttagtc tttaggaagg caaagctatt gtacgcggta gccgtcgtag 7800
caatttacca actgtagaat tattggacac acgtaggaag ggcttacagt tgaagtttaa 7860
taaggtcaca cgcaaaaccg ctaaggaata atcgcaccgt tagcgaaaga atatttcaga 7920
gcggttagta aaggttgagt aaagtgagat tccaaagtga gcctttataa aaagtaaaga 7980
gctataataa aaccgtcgag cagaaaacaa tcgcctgaaa tctcaagcac gttgcccttt 8040
ctaacgtcgc taaggtttcg taaacccgtt tgattaggaa gaagaataag taacccgatt 8100
aggtttgaga tcgcgggtta tcggtttgga ttaaaagtgg ataccagcgg agtcaacgcc 8160
gacgcaaacg tacagtgatc caatcctgtt gcacggtcaa gcacaatcag ctcgcaagat 8220
cttggaatag tgtgcccaac agtttagttg agggccacgt tccgactaca agttgcttca 8280
agaggggaat ttggatttgg caatagcccc ccgtttctac ctcaagaggc gacgagtatt 8340
aaccgcgcca gctgtcggca caagggccaa agaagattcc aatttcttat tcccgaataa 8400
cctccgaatc cctgcgggaa aatcaccgac cgaatagcct agaagcaagg gggaacagat 8460
aggtataatt agcttaagag agtaccagcc gtgacaacag cgtagtaacc acaaacttac 8520
gctggggctt ctttggcgga tttttacaga tactaacaag gtgatttgaa gtaccttagt 8580
tgaggattta aacgcgctat ccggtaatct ccaaattggg aaataccgtt caaagagggc 8640
tagaattact taaaagcctt cacaccgcct gcgctatacg cgcccactct cccgtttatc 8700
cgtccaagcg gaagcagggc gatcctccgc taagatattc ttacgtgtaa cgtagctaag 8760
tatcccaaat agctggcgta cgcgttgaac accgcctaga ggatcgtgac tcgccggacg 8820
agcgtgttat tggggactta cgccagcgta gactacaacg cgcccagatt aaccctgcac 8880
gtattgcctt gaataacgta ctaatctctc cggctctcga caatctatcg agcgactcga 8940
ttatcaacgg gtgtcttgca gttctaatct cttgcccccg cccgtaatag cctccaagag 9000
attgaagata gtaaagggca agagctgatt cggcgttgaa ggatagcgga ctttcggtca 9060
accacaattc cccactcgac aaaaccagcc gtgcgaataa ctctgaaagt acaagcaacc 9120
caagagggct gagcctaaac tcagctaatt cctaagtgag ctaaagactc gaagtgacag 9180
ctcttaataa atagagcggg aacgtcgaac ggtcgtgaaa gtaatagtac aacgggtatt 9240
aacttactga ggatattgct tgaagctgta ccgttttatt gggtgaacga ataagatcca 9300
gcaattcagc caaagaagct accaattttt agtttaagag tgtcacgtct gacctcgcgg 9360
gtagattgcc gaacgtagag cttacgagcc agcggaaaca gtagccgcag gataagtaag 9420
gggagtaagt gatcgaacga atcagaagtg acaatatact taggctggat ctcgtcccgt 9480
gaatcccaac cctcaccaac tacgagataa gaggtaagcc aaaaatcgac ttggtggcga 9540
ccaacgactg ttccccccct gtaactaatc gttccgtcaa aacctgactt acttcaaggc 9600
caattccaag cgcaaacaat accgtcctag ttcttcggtt aagtttccga agtaggagtg 9660
agcctacctc cgtttgcgtc ttgttaccac tgacccagct atttactttg tattgcctgc 9720
aatcgaattt ctgaactctc agatagtggg gataacggga aagttcctat atttgcgaac 9780
taacttagcc gtccacctcg aagctaccta ctcacaccca ccccgcgcgg ggtaaataag 9840
gcactaatcc cagctgagag ctggcgtagc acttagccac aagttaatta acagttgtct 9900
ggtagtttgg cggtattagg aagatcctag aagcaaggca gagttagttc taacctaaag 9960
ccacaaataa gacaggttgc caaagcccgc cggaaattaa atcttgctca gttcggtaac 10020
ggagtttccc tcccgcgtac ttaattccca ataagaaacg cgcccaagtc ctatcaggca 10080
aaattcagcc ccttcccgtg ttagaacgag ggtaaaaata caagccgatt gaacaagggt 10140
tgggggcttc aaatcgtcgt ttaccccact ttacaacgga gattaagtag ttcaccctat 10200
agtacgaagc agaactattt cgaggggcgt gcaataatcg aatcttctgc ggttgactta 10260
acacgctagg gacgtgccct cgattcaatc gaaggtactc ctactcagac tgcctcacac 10320
ccagctagtc actgagcgat aaaattgacc cgccctctag ggaagcgagt acgtcccaaa 10380
gggctccgga cagggctata taggagagtt tgatctcgcc ccgacaactg caaccctcaa 10440
ctcccttaga taatattgtt agccgaagtt gcacgacccg ccgtccacgg actgctctta 10500
gggtgtggct ccttaatctg acaacgtgca acccctatcg aagtcgattg tttctgcgaa 10560
aggtgttgtc ctaatagtcc cgaaatttgg cccttgtagg tgtgaaacca cttagcttcg 10620
cgccgtagtc ctaaaggccc acctattgac tttgtttcgg gtagcactag gaatcttaac 10680
aatttgaatt tggacgtgga acgcgtacac cttaatctcc gaataattct agggatttgg 10740
aagtcctcta cgttgacaca cctacactgc tcgaagtaaa tatacgaata acgcgggcct 10800
cgcggagccg ttccgaatcg tcacgtgttc gtttactgtt aattggtggc aaataagcaa 10860
tatcgtagtc cgtcaggccc agccctgtta tccacggcgt tatttgtcaa attgcgtaga 10920
actggattga ctgcctgaca atacctaatt atcggtacga agtccccgaa tctgtcgggc 10980
tatttcacta atactttcca aacgccccgt atccaagaag aacgaattta tccacgctcc 11040
cgtctttggg acgaataccg ctacaagtgg acagaggatc ggtacgggcc tctaataaat 11100
ccaacactct acgccctctt caagagctag aagaacaggg tgcagttgga aagggaatta 11160
tttcgtaagg cgagccaata ccgtaattaa ttcggaagag ttaacacgat tggaagtagg 11220
aatagtttct aaccacggtt actaatccta ataacggaac gctgtctgat agattagtgt 11280
cagcgctcgg taccaaagaa aaataaaaag acgctgaaaa gcgtcttttt atttttcggt 11340
ccagtgtaac tcaggcaaaa gcacgtaata ttcgtacttt cttcctccgt aagcgtcacc 11400
cacattcctt aaagagtgca tgtgcatatt ttgttatcaa taaaaaaggc cgcgatttgc 11460
ggccttattg ttcgtcttgc cggattacgc cccgccctgc cactcatcgc agtattgttg 11520
taattcatta agcattctgc cgacatggaa gccatcacaa acggcatgat gaacttggat 11580
cgccagtggc attaacacct tgtcgccttg cgtataatat tttcccatag tgaaaacggg 11640
ggcgaagaag ttgtccatat ttgctacgtt taaatcaaaa ctggtgaaac tcacccacgg 11700
attggcactg acgaaaaaca tattttcgat aaacccttta gggaaatatg ctaagttttc 11760
accgtaacac gccacatctt gactatatat gtgtagaaac tgccggaaat cgtcgtggta 11820
ttctgaccag agcgatgaaa acgtttcagt ttgctcatgg aaaacggtgt aacaagggtg 11880
aacactatcc catatcacca gctcaccgtc tttcattgcc atacgaaact ccggatgtgc 11940
attcatcagg cgggcaagaa tgtgaataaa ggccggataa aacttgtgct tatttttctt 12000
tacggttttt aaaaaggccg taatatccag ctgaacggtt tggttatagg tgcactgagc 12060
aactgactgg aatgcctcaa aatgttcttt acgatgccat tgacttatat caactgtagt 12120
atatccagtg atttttttct ccattttagc ttccttagct tgcgaaatct cgataactca 12180
aaaaatagta gtgatcttat ttcattatgg tgaaagttgt cttacgtgca acattttcgc 12240
aaaaagttgg cgctttatca ac 12262
<210> 9
<211> 7300
<212> DNA
<213> 人工序列
<220>
<223> p7.3kb (p513)
<400> 9
cctttaggga aatatgctaa gttttcaccg taacacgcca catcttgact atatatgtgt 60
agaaactgcc ggaaatcgtc gtggtattct gaccagagcg atgaaaacgt ttcagtttgc 120
tcatggaaaa cggtgtaaca agggtgaaca ctatcccata tcaccagctc accgtctttc 180
attgccatac gaaactccgg atgtgcattc atcaggcggg caagaatgtg aataaaggcc 240
ggataaaact tgtgcttatt tttctttacg gtttttaaaa aggccgtaat atccagctga 300
acggtttggt tataggtgca ctgagcaact gactggaatg cctcaaaatg ttctttacga 360
tgccattgac ttatatcaac tgtagtatat ccagtgattt ttttctccat tttagcttcc 420
ttagcttgcg aaatctcgat aactcaaaaa atagtagtga tcttatttca ttatggtgaa 480
agttgtctta cgtgcaacat tttcgcaaaa agttggcgct ttatcaacac tgtccctcct 540
gttcagctac tgacggtact gcggaactga ctaaagtagt gcgtaacggc aaaagcaccg 600
ccggacatct gcgctagcgg agtgtatact ggcttactat gttggcactg atgagggtgt 660
aagtgaagtg cttcatgtgg caggagaaaa aaggctgcat cggtgcgtca gcagaatatg 720
tgatacagga tatattccgc ttcctcgctc actgactcgc tacgctcggt cgttcgactg 780
tggcgagcgg aaatggctta cgaacggggc ggagatttcc tggaagatgc caggaagata 840
cttaacaggg aagtgagagg gtcgcggcaa agccgttttt ccataggctc cgcccccctg 900
acaagcatca cgaaatctga cgctcaaatc agtggtggcg aaacctgaca ggactataaa 960
gataccaggc gtttccccct ggcggctccc tcgtgcgctc tcctgttcct gcctttcggt 1020
ttgccggtgt cattcctctg ttacggccga gtttgtctca ttccacgcct gacactcagt 1080
tccgggtagg cagttcgctc caagctggac tgtatgcacg aaccccccgt tcagtccgac 1140
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggaaagaca tgcaaaagca 1200
ccactggcag cagccactgg taattgattt agaggagtta gtcttgaagt catgcgccgg 1260
ataaggctaa actgaaagga caagttttgg cgactgcgct cctccaagcc agttacctcg 1320
gttcaaagag ttggtagctc agagaacctt cgaaaaaccg ccctgcaagg cggttttttc 1380
gttttcagag caagagatta cgcgcagacc aaaacgatct caagaagatc atcttattaa 1440
tcagataaaa tatttctaga tttcagtgca atttatctct tcaaatgtag cactttatag 1500
ctagctcagc ccttggtaca atgctagcgt tttcattaaa gaggagaaag gaagccatga 1560
gtaaaggtga ggaattattt actggtgttg ttccgatctt agttgaactg gacggcgatg 1620
ttaacggtca taaattcagt gttcgtggtg aaggtgaagg tgatgcaacc aacggtaagc 1680
tgaccctgaa attcatctgc actactggaa aattaccagt accgtggcct actctggtga 1740
ctaccctgac ctatggtgtt cagtgttttt ctcgttaccc tgaccacatg aagcaacatg 1800
atttcttcaa atctgcaatg ccggaaggtt atgtacagga gcgcaccatt tctttcaaag 1860
acgatggcac gtataaaacc cgtgcagagg ttaaatttga aggtgacact ctggtgaatc 1920
gtattgaact gaaaggcatt gatttcaaag aggacggcaa tattttaggc cacaaactgg 1980
aatataactt caactcccat aacgtttaca tcaccgcaga caaacaaaag aacggtatca 2040
aagctaactt caaaattcgc cataacgttg aagacggtag cgtacagctg gcggatcatt 2100
accaacagaa cactccgatt ggagatgctc ctgttttact gccggataac cactacctgt 2160
ccacccagtc taaactgtcg aaggatccga acgaaaagcg cgaccacatg gtgttattag 2220
agttcgttac cgctagtggt atcacgcacg gtatggatga actctacaaa taagtcagtt 2280
tcacctgttt tacgttaaaa cccgcttcgg cgggttttta cttttgggtt tagccgaacg 2340
ccccaaaaag cctcgctttc agcacctgtc gtttcctttc ttttcagagg gtattttaaa 2400
taaaaacatt aagttatgac gaagaagaac ggaaacgcct taaaccggaa aattttcata 2460
aatagcgaaa acccgcgagg tcgccgcccc gtaacctgtc ggatcaccgg aaagaacctg 2520
taaagtgata atgattatca tctacatatc acaacgtgcg taaagggact ataacaagac 2580
gcaaacggag gtaggctcac tcctacttcg gaaacttaac cgaagaacta ggacggtatt 2640
gtttgcgctt ggaattggcc ttgaagtaag tcaggttttg acggaacgat tagttacagg 2700
gggggaacag tcgttggtcg ccaccaagtc gatttttggc ttacctctta tctcgtagtt 2760
ggtgagggtt gggattcacg ggacgagatc cagcctaagt atattgtcac ttctgattcg 2820
ttcgatcact tactcccctt acttatcctg cggctactgt ttccgctggc tcgtaagctc 2880
tacgttcggc aatctacccg cgaggtcaga cgtgacactc ttaaactaaa aattggtagc 2940
ttctttggct gaattgctgg atcttattcg ttcacccaat aaaacggtac agcttcaagc 3000
aatatcctca gtaagttaat acccgttgta ctattacttt cacgaccgtt cgacgttccc 3060
gctctattta ttaagagctg tcacttcgag tctttagctc acttaggaat tagctgagtt 3120
taggctcagc cctcttgggt tgcttgtact ttcagagtta ttcgcacggc tggttttgtc 3180
gagtggggaa ttgtggttga ccgaaagtcc gctatccttc aacgccgaat cagctcttgc 3240
cctttactat cttcaatctc ttggaggcta ttacgggcgg gggcaagaga ttagaactgc 3300
aagacacccg ttgataatcg agtcgctcga tagattgtcg agagccggag agattagtac 3360
gttattcaag gcaatacgtg cagggttaat ctgggcgcgt tgtagtctac gctggcgtaa 3420
gtccccaata acacgctcgt ccggcgagtc acgatcctct aggcggtgtt caacgcgtac 3480
gccagctatt tgggatactt agctacgtta cacgtaagaa tatcttagcg gaggatcgcc 3540
ctgcttccgc ttggacggat aaacgggaga gtgggcgcgt atagcgcagg cggtgtgaag 3600
gcttttaagt aattctagcc ctctttgaac ggtatttccc aatttggaga ttaccggata 3660
gcgcgtttaa atgagtgtca gagaaacgga agccgaagtc tttccattcc ggatgtttgg 3720
aaatgctctg tttatagaag tcgatgaact tacggcagtc ctctatatta aattcgaatt 3780
tttcataccc tttctgcggg ctaccgtttt tagtgtgcgt gctatgattg cggatgcgca 3840
gaatatcctc agacgggttg tagaatttga tgcttttcgc ggaaaagaac actttcggta 3900
acattttatt cgcacccggc aggagcttgt acacgatttt cttatagcct tcacccttgt 3960
tttctttgat cgctttatcg tcgaagatct tgttgttctt cttgttcatt acgcccagat 4020
agtatttgtc gtctttgatg aacaggattg cggtgttgtc cggctctttg ttcttatccc 4080
agccgttcgc cagcgtgctg ttttcgaagt tcagtttgaa tttctcgtca gagtaaggct 4140
tctgcgtgat gtagttgcgg attttattgt agagagggac gatgtttgcc agttcgaagt 4200
aacattcttc gaacaccaga tagaagtgtt catctttatc cagaatgttc gccttgtcct 4260
cgctctggct gatgtggaag attttgagct tgtgtaataa gttattcgtc tgatctaata 4320
agtctttaat tgctttcaca tcgtcctccg cagatgcttg aagcagatct ttcttaccct 4380
gattctggta cttgatagag atctgcgcca gattgtcttt gttttgagca atttcgtcga 4440
agatcatcgg gattgccgca aagttcgcca gaatttcctc aaaacgacac tgtttatcaa 4500
tatcacgatg tttattaaat tcctcaagtg ccagtttgat agtttctaag ctcaggtatt 4560
tagctttttc tgttttcttt gcaatcagtt cctgttcctt cttggacggg ttgtccagat 4620
ttttcggcgc gatttgttgg gtgatgtatt ccaaaactgc cgtgccgatc acgctatagt 4680
catcgaaaac ttgttgactg agatcggtca gagatttgtc gtttttaaag taaatcttag 4740
acagatctag tttctgcgct ttgaggtcgt caaagagcag ggacagagtt tctttaatag 4800
atttctcttc cacggttttg aacgccgcaa tctgctcata aaagctctgc atcgtggtga 4860
caacgtcgct atcatcttcc agtttatcaa ttacgaagga tttagattcg gtgtccgata 4920
aaatctgttt aaacagaacg gacattttat actttttcag ggttttgtcg ttgatttgtt 4980
ggctatacag gttaatgtat tcgttgatgc ccttacgctt ggtgttttcg ccgttaacaa 5040
atttgccacc aataatggtg ttgaatttgg tgatgccaga ttgattcagg taattgttga 5100
aattagcgat ttcgaaaacc tcgtccagtg agaaaacacg ctggttaact tcggaggttt 5160
tatagtcgat gtcgaaggtc agttcttccg ccagatcttt cttgatctgt tcatagttaa 5220
tagcttccgg tgctttgtct ttcagagatt catatttcgc tttgttttcc agaaacttcg 5280
gcaggttgtc gtccacgata cgataaataa tagaggtcgg aatatcgttg ctcgaatata 5340
cattcttacg gttttcatga aaacctttga aatacgtcgt ccagcctttg aaagacttga 5400
tgatttcggt attcgaatat gacctgatca aagataaacg tttcaccgaa gataagttct 5460
ttttccactg tccgattacc atcaacttca aatctagcgg tgcgaacaag ttcaacgatg 5520
aaattaactt attactgaaa gagaaagcta atgacgtaca catcttatct attgatcgcg 5580
gtgaacgtca tttagcatac tatacactgg tagatggtaa aggtaatatt attaaacagg 5640
atactttcaa tattatcggt aatgaccgta tgaaaaccaa ctatcacgat aagctggcgg 5700
cgatcgaaaa agatcgtgat tctgcgcgta aagattggaa gaaaattaac aatatcaaag 5760
aaatgaaaga aggctatctg agccaagtgg tgcacgagat cgcaaaactg gtgattgaat 5820
ataacgctat cgtggttttc gaagatctga actttggttt taaacgtggt cgcttcaaag 5880
tagaaaaaca ggtgtaccaa aaactggaaa aaatgctgat tgaaaaactg aactatctgg 5940
tttttaaaga caacgaattt gacaaaacgg gtggcgtact ccgtgcctat cagctgaccg 6000
ctccgttcga aacgttcaag aaaatgggta aacaaacggg gattatctat tatgtgccag 6060
ctggtttcac ctccaagatt tgtccagtta cgggcttcgt taaccagctg tacccgaaat 6120
acgagagcgt tagcaaatct caagaatttt tcagcaaatt cgacaagatc tgctataatc 6180
tggataaagg ctatttcgag ttcagcttcg attacaaaaa cttcggcgat aaagcggcta 6240
aaggtaagtg gactattgct agctttggta gccgtctgat taactttcgc aactccgaca 6300
aaaaccataa ttgggacacg cgtgaagtgt atccgaccaa agaactggaa aaattactga 6360
aagactattc cggacactca gaagggttat aggaatagtc actactgggg taagcacttc 6420
ggaaattata ttattctcgc ttcttattgc ggtaacgtga tcctgaacga tacttattac 6480
tttgtaattt acttaacgtc ggagtccctg caatcttcta gtacccgctt cccgaataca 6540
ggagataact ttttaacact caagagttgc ttcgtgctta gccagtcttg gatttgattg 6600
ctctaatcct tcaacgtgtc aaagacagtg tatctggtca agtaaagtct agagaaaggc 6660
gtagtcagtt acggagttat cccaccttag tgttactccg atttaatttc tgctttcttt 6720
gatttctacc cgactttcgc cgtgacttca atagagaggc aggctcttgc tatttctttc 6780
aagggcttgt ccaactacct aattaagata aagatacggc agttgacgca ctgccgataa 6840
tttctttacg tcagcgaaat taaatcgagc accagtcgta gagtcgcggt tgcctagcag 6900
tttatctcgc gtacgggcct tcgctactta cacgatacct agtacgtgga ttcgggtagc 6960
accagaagtc tatagcatgt gcataccttt ggtcgaaaaa aaaagcccgc actgtcaggt 7020
gcgggctttt ttcagtgttt ccttgccgga ttacgccccg ccctgccact catcgcagta 7080
ttgttgtaat tcattaagca ttctgccgac atggaagcca tcacaaacgg catgatgaac 7140
ttggatcgcc agtggcatta acaccttgtc gccttgcgta taatattttc ccatagtgaa 7200
aacgggggcg aagaagttgt ccatatttgc tacgtttaaa tcaaaactgg tgaaactcac 7260
ccagggattg gcactgacga aaaacatatt ttcgataaac 7300
<210> 10
<211> 1132
<212> PRT
<213> 埃希氏菌属噬菌体λ(细菌噬菌体λ)
<220>
<221> MISC_FEATURE
<222> (814)..(821)
<223> 图7中的框1
<220>
<221> MISC_FEATURE
<222> (958)..(966)
<223> 图7中的框2
<400> 10
Met Gly Lys Gly Ser Ser Lys Gly His Thr Pro Arg Glu Ala Lys Asp
1 5 10 15
Asn Leu Lys Ser Thr Gln Leu Leu Ser Val Ile Asp Ala Ile Ser Glu
20 25 30
Gly Pro Ile Glu Gly Pro Val Asp Gly Leu Lys Ser Val Leu Leu Asn
35 40 45
Ser Thr Pro Val Leu Asp Thr Glu Gly Asn Thr Asn Ile Ser Gly Val
50 55 60
Thr Val Val Phe Arg Ala Gly Glu Gln Glu Gln Thr Pro Pro Glu Gly
65 70 75 80
Phe Glu Ser Ser Gly Ser Glu Thr Val Leu Gly Thr Glu Val Lys Tyr
85 90 95
Asp Thr Pro Ile Thr Arg Thr Ile Thr Ser Ala Asn Ile Asp Arg Leu
100 105 110
Arg Phe Thr Phe Gly Val Gln Ala Leu Val Glu Thr Thr Ser Lys Gly
115 120 125
Asp Arg Asn Pro Ser Glu Val Arg Leu Leu Val Gln Ile Gln Arg Asn
130 135 140
Gly Gly Trp Val Thr Glu Lys Asp Ile Thr Ile Lys Gly Lys Thr Thr
145 150 155 160
Ser Gln Tyr Leu Ala Ser Val Val Met Gly Asn Leu Pro Pro Arg Pro
165 170 175
Phe Asn Ile Arg Met Arg Arg Met Thr Pro Asp Ser Thr Thr Asp Gln
180 185 190
Leu Gln Asn Lys Thr Leu Trp Ser Ser Tyr Thr Glu Ile Ile Asp Val
195 200 205
Lys Gln Cys Tyr Pro Asn Thr Ala Leu Val Gly Val Gln Val Asp Ser
210 215 220
Glu Gln Phe Gly Ser Gln Gln Val Ser Arg Asn Tyr His Leu Arg Gly
225 230 235 240
Arg Ile Leu Gln Val Pro Ser Asn Tyr Asn Pro Gln Thr Arg Gln Tyr
245 250 255
Ser Gly Ile Trp Asp Gly Thr Phe Lys Pro Ala Tyr Ser Asn Asn Met
260 265 270
Ala Trp Cys Leu Trp Asp Met Leu Thr His Pro Arg Tyr Gly Met Gly
275 280 285
Lys Arg Leu Gly Ala Ala Asp Val Asp Lys Trp Ala Leu Tyr Val Ile
290 295 300
Gly Gln Tyr Cys Asp Gln Ser Val Pro Asp Gly Phe Gly Gly Thr Glu
305 310 315 320
Pro Arg Ile Thr Cys Asn Ala Tyr Leu Thr Thr Gln Arg Lys Ala Trp
325 330 335
Asp Val Leu Ser Asp Phe Cys Ser Ala Met Arg Cys Met Pro Val Trp
340 345 350
Asn Gly Gln Thr Leu Thr Phe Val Gln Asp Arg Pro Ser Asp Lys Thr
355 360 365
Trp Thr Tyr Asn Arg Ser Asn Val Val Met Pro Asp Asp Gly Ala Pro
370 375 380
Phe Arg Tyr Ser Phe Ser Ala Leu Lys Asp Arg His Asn Ala Val Glu
385 390 395 400
Val Asn Trp Ile Asp Pro Asn Asn Gly Trp Glu Thr Ala Thr Glu Leu
405 410 415
Val Glu Asp Thr Gln Ala Ile Ala Arg Tyr Gly Arg Asn Val Thr Lys
420 425 430
Met Asp Ala Phe Gly Cys Thr Ser Arg Gly Gln Ala His Arg Ala Gly
435 440 445
Leu Trp Leu Ile Lys Thr Glu Leu Leu Glu Thr Gln Thr Val Asp Phe
450 455 460
Ser Val Gly Ala Glu Gly Leu Arg His Val Pro Gly Asp Val Ile Glu
465 470 475 480
Ile Cys Asp Asp Asp Tyr Ala Gly Ile Ser Thr Gly Gly Arg Val Leu
485 490 495
Ala Val Asn Ser Gln Thr Arg Thr Leu Thr Leu Asp Arg Glu Ile Thr
500 505 510
Leu Pro Ser Ser Gly Thr Ala Leu Ile Ser Leu Val Asp Gly Ser Gly
515 520 525
Asn Pro Val Ser Val Glu Val Gln Ser Val Thr Asp Gly Val Lys Val
530 535 540
Lys Val Ser Arg Val Pro Asp Gly Val Ala Glu Tyr Ser Val Trp Glu
545 550 555 560
Leu Lys Leu Pro Thr Leu Arg Gln Arg Leu Phe Arg Cys Val Ser Ile
565 570 575
Arg Glu Asn Asp Asp Gly Thr Tyr Ala Ile Thr Ala Val Gln His Val
580 585 590
Pro Glu Lys Glu Ala Ile Val Asp Asn Gly Ala His Phe Asp Gly Glu
595 600 605
Gln Ser Gly Thr Val Asn Gly Val Thr Pro Pro Ala Val Gln His Leu
610 615 620
Thr Ala Glu Val Thr Ala Asp Ser Gly Glu Tyr Gln Val Leu Ala Arg
625 630 635 640
Trp Asp Thr Pro Lys Val Val Lys Gly Val Ser Phe Leu Leu Arg Leu
645 650 655
Thr Val Thr Ala Asp Asp Gly Ser Glu Arg Leu Val Ser Thr Ala Arg
660 665 670
Thr Thr Glu Thr Thr Tyr Arg Phe Thr Gln Leu Ala Leu Gly Asn Tyr
675 680 685
Arg Leu Thr Val Arg Ala Val Asn Ala Trp Gly Gln Gln Gly Asp Pro
690 695 700
Ala Ser Val Ser Phe Arg Ile Ala Ala Pro Ala Ala Pro Ser Arg Ile
705 710 715 720
Glu Leu Thr Pro Gly Tyr Phe Gln Ile Thr Ala Thr Pro His Leu Ala
725 730 735
Val Tyr Asp Pro Thr Val Gln Phe Glu Phe Trp Phe Ser Glu Lys Gln
740 745 750
Ile Ala Asp Ile Arg Gln Val Glu Thr Ser Thr Arg Tyr Leu Gly Thr
755 760 765
Ala Leu Tyr Trp Ile Ala Ala Ser Ile Asn Ile Lys Pro Gly His Asp
770 775 780
Tyr Tyr Phe Tyr Ile Arg Ser Val Asn Thr Val Gly Lys Ser Ala Phe
785 790 795 800
Val Glu Ala Val Gly Arg Ala Ser Asp Asp Ala Glu Gly Tyr Leu Asp
805 810 815
Phe Phe Lys Gly Lys Ile Thr Glu Ser His Leu Gly Lys Glu Leu Leu
820 825 830
Glu Lys Val Glu Leu Thr Glu Asp Asn Ala Ser Arg Leu Glu Glu Phe
835 840 845
Ser Lys Glu Trp Lys Asp Ala Ser Asp Lys Trp Asn Ala Met Trp Ala
850 855 860
Val Lys Ile Glu Gln Thr Lys Asp Gly Lys His Tyr Val Ala Gly Ile
865 870 875 880
Gly Leu Ser Met Glu Asp Thr Glu Glu Gly Lys Leu Ser Gln Phe Leu
885 890 895
Val Ala Ala Asn Arg Ile Ala Phe Ile Asp Pro Ala Asn Gly Asn Glu
900 905 910
Thr Pro Met Phe Val Ala Gln Gly Asn Gln Ile Phe Met Asn Asp Val
915 920 925
Phe Leu Lys Arg Leu Thr Ala Pro Thr Ile Thr Ser Gly Gly Asn Pro
930 935 940
Pro Ala Phe Ser Leu Thr Pro Asp Gly Lys Leu Thr Ala Lys Asn Ala
945 950 955 960
Asp Ile Ser Gly Ser Val Asn Ala Asn Ser Gly Thr Leu Ser Asn Val
965 970 975
Thr Ile Ala Glu Asn Cys Thr Ile Asn Gly Thr Leu Arg Ala Glu Lys
980 985 990
Ile Val Gly Asp Ile Val Lys Ala Ala Ser Ala Ala Phe Pro Arg Gln
995 1000 1005
Arg Glu Ser Ser Val Asp Trp Pro Ser Gly Thr Arg Thr Val Thr
1010 1015 1020
Val Thr Asp Asp His Pro Phe Asp Arg Gln Ile Val Val Leu Pro
1025 1030 1035
Leu Thr Phe Arg Gly Ser Lys Arg Thr Val Ser Gly Arg Thr Thr
1040 1045 1050
Tyr Ser Met Cys Tyr Leu Lys Val Leu Met Asn Gly Ala Val Ile
1055 1060 1065
Tyr Asp Gly Ala Ala Asn Glu Ala Val Gln Val Phe Ser Arg Ile
1070 1075 1080
Val Asp Met Pro Ala Gly Arg Gly Asn Val Ile Leu Thr Phe Thr
1085 1090 1095
Leu Thr Ser Thr Arg His Ser Ala Asp Ile Pro Pro Tyr Thr Phe
1100 1105 1110
Ala Ser Asp Val Gln Val Met Val Ile Lys Lys Gln Ala Leu Gly
1115 1120 1125
Ile Ser Val Val
1130
<210> 11
<211> 1132
<212> PRT
<213> 人工序列
<220>
<223> gpJ 591
<400> 11
Met Gly Lys Gly Ser Ser Lys Gly His Thr Pro Arg Glu Ala Lys Asp
1 5 10 15
Asn Leu Lys Ser Thr Gln Leu Leu Ser Val Ile Asp Ala Ile Ser Glu
20 25 30
Gly Pro Ile Glu Gly Pro Val Asp Gly Leu Lys Ser Val Leu Leu Asn
35 40 45
Ser Thr Pro Val Leu Asp Thr Glu Gly Asn Thr Asn Ile Ser Gly Val
50 55 60
Thr Val Val Phe Arg Ala Gly Glu Gln Glu Gln Thr Pro Pro Glu Gly
65 70 75 80
Phe Glu Ser Ser Gly Ser Glu Thr Val Leu Gly Thr Glu Val Lys Tyr
85 90 95
Asp Thr Pro Ile Thr Arg Thr Ile Thr Ser Ala Asn Ile Asp Arg Leu
100 105 110
Arg Phe Thr Phe Gly Val Gln Ala Leu Val Glu Thr Thr Ser Lys Gly
115 120 125
Asp Arg Asn Pro Ser Glu Val Arg Leu Leu Val Gln Ile Gln Arg Asn
130 135 140
Gly Gly Trp Val Thr Glu Lys Asp Ile Thr Ile Lys Gly Lys Thr Thr
145 150 155 160
Ser Gln Tyr Leu Ala Ser Val Val Met Gly Asn Leu Pro Pro Arg Pro
165 170 175
Phe Asn Ile Arg Met Arg Arg Met Thr Pro Asp Ser Thr Thr Asp Gln
180 185 190
Leu Gln Asn Lys Thr Leu Trp Ser Ser Tyr Thr Glu Ile Ile Asp Val
195 200 205
Lys Gln Cys Tyr Pro Asn Thr Ala Leu Val Gly Val Gln Val Asp Ser
210 215 220
Glu Gln Phe Gly Ser Gln Gln Val Ser Arg Asn Tyr His Leu Arg Gly
225 230 235 240
Arg Ile Leu Gln Val Pro Ser Asn Tyr Asn Pro Gln Thr Arg Gln Tyr
245 250 255
Ser Gly Ile Trp Asp Gly Thr Phe Lys Pro Ala Tyr Ser Asn Asn Met
260 265 270
Ala Trp Cys Leu Trp Asp Met Leu Thr His Pro Arg Tyr Gly Met Gly
275 280 285
Lys Arg Leu Gly Ala Ala Asp Val Asp Lys Trp Ala Leu Tyr Val Ile
290 295 300
Gly Gln Tyr Cys Asp Gln Ser Val Pro Asp Gly Phe Gly Gly Thr Glu
305 310 315 320
Pro Arg Ile Thr Cys Asn Ala Tyr Leu Thr Thr Gln Arg Lys Ala Trp
325 330 335
Asp Val Leu Ser Asp Phe Cys Ser Ala Met Arg Cys Met Pro Val Trp
340 345 350
Asn Gly Gln Thr Leu Thr Phe Val Gln Asp Arg Pro Ser Asp Lys Thr
355 360 365
Trp Thr Tyr Asn Arg Ser Asn Val Val Met Pro Asp Asp Gly Ala Pro
370 375 380
Phe Arg Tyr Ser Phe Ser Ala Leu Lys Asp Arg His Asn Ala Val Glu
385 390 395 400
Val Asn Trp Ile Asp Pro Asn Asn Gly Trp Glu Thr Ala Thr Glu Leu
405 410 415
Val Glu Asp Thr Gln Ala Ile Ala Arg Tyr Gly Arg Asn Val Thr Lys
420 425 430
Met Asp Ala Phe Gly Cys Thr Ser Arg Gly Gln Ala His Arg Ala Gly
435 440 445
Leu Trp Leu Ile Lys Thr Glu Leu Leu Glu Thr Gln Thr Val Asp Phe
450 455 460
Ser Val Gly Ala Glu Gly Leu Arg His Val Pro Gly Asp Val Ile Glu
465 470 475 480
Ile Cys Asp Asp Asp Tyr Ala Gly Ile Ser Thr Gly Gly Arg Val Leu
485 490 495
Ala Val Asn Ser Gln Thr Arg Thr Leu Thr Leu Asp Arg Glu Ile Thr
500 505 510
Leu Pro Ser Ser Gly Thr Ala Leu Ile Ser Leu Val Asp Gly Ser Gly
515 520 525
Asn Pro Val Ser Val Glu Val Gln Ser Val Thr Asp Gly Val Lys Val
530 535 540
Lys Val Ser Arg Val Pro Asp Gly Val Ala Glu Tyr Ser Val Trp Glu
545 550 555 560
Leu Lys Leu Pro Thr Leu Arg Gln Arg Leu Phe Arg Cys Val Ser Ile
565 570 575
Arg Glu Asn Asp Asp Gly Thr Tyr Ala Ile Thr Ala Val Gln His Val
580 585 590
Pro Glu Lys Glu Ala Ile Val Asp Asn Gly Ala His Phe Asp Gly Glu
595 600 605
Gln Ser Gly Thr Val Asn Gly Val Thr Pro Pro Ala Val Gln His Leu
610 615 620
Thr Ala Glu Val Thr Ala Asp Ser Gly Glu Tyr Gln Val Leu Ala Arg
625 630 635 640
Trp Asp Thr Pro Lys Val Val Lys Gly Val Ser Phe Leu Leu Arg Leu
645 650 655
Thr Val Thr Ala Asp Asp Gly Ser Glu Arg Leu Val Ser Thr Ala Arg
660 665 670
Thr Thr Glu Thr Thr Tyr Arg Phe Thr Gln Leu Ala Leu Gly Asn Tyr
675 680 685
Arg Leu Thr Val Arg Ala Val Asn Ala Trp Gly Gln Gln Gly Asp Pro
690 695 700
Ala Ser Val Ser Phe Arg Ile Ala Ala Pro Ala Ala Pro Ser Arg Ile
705 710 715 720
Glu Leu Thr Pro Gly Tyr Phe Gln Ile Thr Ala Thr Pro His Leu Ala
725 730 735
Val Tyr Asp Pro Thr Val Gln Phe Glu Phe Trp Phe Ser Glu Lys Gln
740 745 750
Ile Ala Asp Ile Arg Gln Val Glu Thr Ser Thr Arg Tyr Leu Gly Thr
755 760 765
Ala Leu Tyr Trp Ile Ala Ala Ser Ile Asn Ile Lys Pro Gly His Asp
770 775 780
Tyr Tyr Phe Tyr Ile Arg Ser Val Asn Thr Val Gly Lys Ser Ala Phe
785 790 795 800
Val Glu Ala Val Gly Arg Ala Ser Asp Asp Ala Glu Gly Tyr Leu Asp
805 810 815
Phe Phe Lys Gly Lys Ile Thr Glu Ser His Leu Gly Lys Glu Leu Leu
820 825 830
Glu Lys Val Glu Leu Thr Glu Asp Asn Ala Ser Arg Leu Glu Glu Phe
835 840 845
Ser Lys Glu Trp Lys Asp Ala Ser Asp Lys Trp Asn Ala Met Trp Ala
850 855 860
Val Lys Ile Glu Gln Thr Lys Asp Gly Lys His Tyr Val Ala Gly Ile
865 870 875 880
Gly Leu Ser Met Glu Asp Thr Glu Glu Gly Lys Leu Ser Gln Phe Leu
885 890 895
Val Ala Ala Asn Arg Ile Ala Phe Ile Asp Pro Ala Asn Gly Asn Glu
900 905 910
Thr Pro Met Phe Val Ala Gln Gly Asn Gln Ile Phe Met Asn Asp Val
915 920 925
Phe Leu Lys Arg Leu Thr Ala Pro Thr Ile Thr Ser Gly Gly Asn Pro
930 935 940
Pro Ala Phe Ser Leu Thr Pro Asp Gly Lys Leu Thr Ala Lys Asn Ala
945 950 955 960
Asp Ile Ser Gly Asn Val Asn Ala Asn Ser Gly Thr Leu Asn Asn Val
965 970 975
Thr Ile Asn Glu Asn Cys Gln Ile Lys Gly Lys Leu Ser Ala Asn Gln
980 985 990
Ile Glu Gly Asp Ile Val Lys Thr Val Ser Lys Ser Phe Pro Arg Thr
995 1000 1005
Asn Ser Tyr Ala Ser Gly Thr Ile Thr Val Arg Ile Ser Asp Asp
1010 1015 1020
Gln Lys Phe Asp Arg Gln Val Met Ile Pro Pro Val Leu Phe Arg
1025 1030 1035
Gly Gly Lys His Glu Asn Phe Asn Ser Asn Asn Gln Gln Ser Tyr
1040 1045 1050
Trp Tyr Ser Thr Cys Arg Leu Arg Val Thr Arg Asn Gly Gln Glu
1055 1060 1065
Ile Phe Asn Gln Ser Thr Thr Asp Ala Gln Gly Val Phe Ser Ser
1070 1075 1080
Val Ile Asp Met Pro Ala Gly Gln Gly Thr Leu Thr Leu Thr Phe
1085 1090 1095
Thr Val Ser Ser Ser Gly Ala Asn Asn Trp Thr Pro Thr Thr Ser
1100 1105 1110
Ile Ser Asp Leu Leu Val Val Val Met Lys Lys Ser Thr Ala Gly
1115 1120 1125
Ile Ser Ile Ser
1130
<210> 12
<211> 1159
<212> PRT
<213> 人工序列
<220>
<223> gpJ Z2145
<400> 12
Met Gly Lys Gly Ser Ser Lys Gly His Thr Pro Arg Glu Ala Lys Asp
1 5 10 15
Asn Leu Lys Ser Thr Gln Leu Leu Ser Val Ile Asp Ala Ile Ser Glu
20 25 30
Gly Pro Ile Glu Gly Pro Val Asp Gly Leu Lys Ser Val Leu Leu Asn
35 40 45
Ser Thr Pro Val Leu Asp Thr Glu Gly Asn Thr Asn Ile Ser Gly Val
50 55 60
Thr Val Val Phe Arg Ala Gly Glu Gln Glu Gln Thr Pro Pro Glu Gly
65 70 75 80
Phe Glu Ser Ser Gly Ser Glu Thr Val Leu Gly Thr Glu Val Lys Tyr
85 90 95
Asp Thr Pro Ile Thr Arg Thr Ile Thr Ser Ala Asn Ile Asp Arg Leu
100 105 110
Arg Phe Thr Phe Gly Val Gln Ala Leu Val Glu Thr Thr Ser Lys Gly
115 120 125
Asp Arg Asn Pro Ser Glu Val Arg Leu Leu Val Gln Ile Gln Arg Asn
130 135 140
Gly Gly Trp Val Thr Glu Lys Asp Ile Thr Ile Lys Gly Lys Thr Thr
145 150 155 160
Ser Gln Tyr Leu Ala Ser Val Val Met Gly Asn Leu Pro Pro Arg Pro
165 170 175
Phe Asn Ile Arg Met Arg Arg Met Thr Pro Asp Ser Thr Thr Asp Gln
180 185 190
Leu Gln Asn Lys Thr Leu Trp Ser Ser Tyr Thr Glu Ile Ile Asp Val
195 200 205
Lys Gln Cys Tyr Pro Asn Thr Ala Leu Val Gly Val Gln Val Asp Ser
210 215 220
Glu Gln Phe Gly Ser Gln Gln Val Ser Arg Asn Tyr His Leu Arg Gly
225 230 235 240
Arg Ile Leu Gln Val Pro Ser Asn Tyr Asn Pro Gln Thr Arg Gln Tyr
245 250 255
Ser Gly Ile Trp Asp Gly Thr Phe Lys Pro Ala Tyr Ser Asn Asn Met
260 265 270
Ala Trp Cys Leu Trp Asp Met Leu Thr His Pro Arg Tyr Gly Met Gly
275 280 285
Lys Arg Leu Gly Ala Ala Asp Val Asp Lys Trp Ala Leu Tyr Val Ile
290 295 300
Gly Gln Tyr Cys Asp Gln Ser Val Pro Asp Gly Phe Gly Gly Thr Glu
305 310 315 320
Pro Arg Ile Thr Cys Asn Ala Tyr Leu Thr Thr Gln Arg Lys Ala Trp
325 330 335
Asp Val Leu Ser Asp Phe Cys Ser Ala Met Arg Cys Met Pro Val Trp
340 345 350
Asn Gly Gln Thr Leu Thr Phe Val Gln Asp Arg Pro Ser Asp Lys Thr
355 360 365
Trp Thr Tyr Asn Arg Ser Asn Val Val Met Pro Asp Asp Gly Ala Pro
370 375 380
Phe Arg Tyr Ser Phe Ser Ala Leu Lys Asp Arg His Asn Ala Val Glu
385 390 395 400
Val Asn Trp Ile Asp Pro Asn Asn Gly Trp Glu Thr Ala Thr Glu Leu
405 410 415
Val Glu Asp Thr Gln Ala Ile Ala Arg Tyr Gly Arg Asn Val Thr Lys
420 425 430
Met Asp Ala Phe Gly Cys Thr Ser Arg Gly Gln Ala His Arg Ala Gly
435 440 445
Leu Trp Leu Ile Lys Thr Glu Leu Leu Glu Thr Gln Thr Val Asp Phe
450 455 460
Ser Val Gly Ala Glu Gly Leu Arg His Val Pro Gly Asp Val Ile Glu
465 470 475 480
Ile Cys Asp Asp Asp Tyr Ala Gly Ile Ser Thr Gly Gly Arg Val Leu
485 490 495
Ala Val Asn Ser Gln Thr Arg Thr Leu Thr Leu Asp Arg Glu Ile Thr
500 505 510
Leu Pro Ser Ser Gly Thr Ala Leu Ile Ser Leu Val Asp Gly Ser Gly
515 520 525
Asn Pro Val Ser Val Glu Val Gln Ser Val Thr Asp Gly Val Lys Val
530 535 540
Lys Val Ser Arg Val Pro Asp Gly Val Ala Glu Tyr Ser Val Trp Glu
545 550 555 560
Leu Lys Leu Pro Thr Leu Arg Gln Arg Leu Phe Arg Cys Val Ser Ile
565 570 575
Arg Glu Asn Asp Asp Gly Thr Tyr Ala Ile Thr Ala Val Gln His Val
580 585 590
Pro Glu Lys Glu Ala Ile Val Asp Asn Gly Ala His Phe Asp Gly Glu
595 600 605
Gln Ser Gly Thr Val Asn Gly Val Thr Pro Pro Ala Val Gln His Leu
610 615 620
Thr Ala Glu Val Thr Ala Asp Ser Gly Glu Tyr Gln Val Leu Ala Arg
625 630 635 640
Trp Asp Thr Pro Lys Val Val Lys Gly Val Ser Phe Leu Leu Arg Leu
645 650 655
Thr Val Thr Ala Asp Asp Gly Ser Glu Arg Leu Val Ser Thr Ala Arg
660 665 670
Thr Thr Glu Thr Thr Tyr Arg Phe Thr Gln Leu Ala Leu Gly Asn Tyr
675 680 685
Arg Leu Thr Val Arg Ala Val Asn Ala Trp Gly Gln Gln Gly Asp Pro
690 695 700
Ala Ser Val Ser Phe Arg Ile Ala Ala Pro Ala Ala Pro Ser Arg Ile
705 710 715 720
Glu Leu Thr Pro Gly Tyr Phe Gln Ile Thr Ala Thr Pro His Leu Ala
725 730 735
Val Tyr Asp Pro Thr Val Gln Phe Glu Phe Trp Phe Ser Glu Lys Gln
740 745 750
Ile Ala Asp Ile Arg Gln Val Glu Thr Ser Thr Arg Tyr Leu Gly Thr
755 760 765
Ala Leu Tyr Trp Ile Ala Ala Ser Ile Asn Ile Lys Pro Gly His Asp
770 775 780
Tyr Tyr Phe Tyr Ile Arg Ser Val Asn Thr Val Gly Lys Ser Ala Phe
785 790 795 800
Val Glu Ala Val Gly Arg Ala Ser Asp Asp Ala Glu Gly Tyr Leu Asp
805 810 815
Phe Phe Lys Gly Glu Ile Gly Lys Thr His Leu Ala Gln Glu Leu Trp
820 825 830
Thr Gln Ile Asp Asn Gly Gln Leu Ala Pro Asp Leu Ala Glu Ile Arg
835 840 845
Thr Ser Ile Thr Asp Val Ser Asn Glu Ile Thr Gln Thr Val Asn Lys
850 855 860
Lys Leu Glu Asp Gln Ser Ala Ala Ile Gln Gln Ile Gln Lys Val Gln
865 870 875 880
Val Asp Thr Asn Asn Asn Leu Asn Ser Met Trp Ala Val Lys Leu Gln
885 890 895
Gln Met Gln Asp Gly Arg Leu Tyr Ile Ala Gly Ile Gly Ala Gly Ile
900 905 910
Glu Asn Thr Ser Asp Gly Met Gln Ser Gln Val Leu Leu Ala Ala Asp
915 920 925
Arg Ile Ala Met Ile Asn Pro Ala Asn Gly Asn Thr Lys Pro Met Phe
930 935 940
Val Gly Gln Gly Asp Gln Ile Phe Met Asn Glu Val Phe Leu Lys Tyr
945 950 955 960
Leu Thr Ala Pro Thr Ile Thr Ser Gly Gly Asn Pro Pro Ala Phe Ser
965 970 975
Leu Thr Ser Asp Gly Lys Leu Thr Ala Lys Asn Ala Asp Ile Ser Gly
980 985 990
Ser Val Asn Ala Asn Ser Gly Thr Leu Asn Asn Val Thr Ile Asn Glu
995 1000 1005
Asn Cys Arg Val Leu Gly Lys Leu Ser Ala Asn Gln Ile Glu Gly
1010 1015 1020
Asp Leu Val Lys Thr Val Gly Lys Ala Phe Pro Arg Asp Ser Arg
1025 1030 1035
Ala Pro Glu Arg Trp Pro Ser Gly Thr Ile Thr Val Arg Val Tyr
1040 1045 1050
Asp Asp Gln Pro Phe Asp Arg Gln Ile Val Ile Pro Ala Val Ala
1055 1060 1065
Phe Ser Gly Ala Lys His Glu Arg Glu His Thr Asp Ile Tyr Ser
1070 1075 1080
Ser Cys Arg Leu Ile Val Arg Lys Asn Gly Ala Glu Ile Tyr Asn
1085 1090 1095
Arg Thr Ala Leu Asp Asn Thr Leu Ile Tyr Ser Gly Val Ile Asp
1100 1105 1110
Met Pro Ala Gly His Gly His Met Thr Leu Glu Phe Ser Val Ser
1115 1120 1125
Ala Trp Leu Val Asn Asn Trp Tyr Pro Thr Ala Ser Ile Ser Asp
1130 1135 1140
Leu Leu Val Val Val Met Lys Lys Ala Thr Ala Gly Ile Ser Ile
1145 1150 1155
Ser
<210> 13
<211> 1131
<212> PRT
<213> 人工序列
<220>
<223> 1A2
<400> 13
Met Gly Lys Gly Ser Ser Lys Gly His Thr Pro Arg Glu Ala Lys Asp
1 5 10 15
Asn Leu Lys Ser Thr Gln Leu Leu Ser Val Ile Asp Ala Ile Ser Glu
20 25 30
Gly Pro Ile Glu Gly Pro Val Asp Gly Leu Lys Ser Val Leu Leu Asn
35 40 45
Ser Thr Pro Val Leu Asp Thr Glu Gly Asn Thr Asn Ile Ser Gly Val
50 55 60
Thr Val Val Phe Arg Ala Gly Glu Gln Glu Gln Thr Pro Pro Glu Gly
65 70 75 80
Phe Glu Ser Ser Gly Ser Glu Thr Val Leu Gly Thr Glu Val Lys Tyr
85 90 95
Asp Thr Pro Ile Thr Arg Thr Ile Thr Ser Ala Asn Ile Asp Arg Leu
100 105 110
Arg Phe Thr Phe Gly Val Gln Ala Leu Val Glu Thr Thr Ser Lys Gly
115 120 125
Asp Arg Asn Pro Ser Glu Val Arg Leu Leu Val Gln Ile Gln Arg Asn
130 135 140
Gly Gly Trp Val Thr Glu Lys Asp Ile Thr Ile Lys Gly Lys Thr Thr
145 150 155 160
Ser Gln Tyr Leu Ala Ser Val Val Met Gly Asn Leu Pro Pro Arg Pro
165 170 175
Phe Asn Ile Arg Met Arg Arg Met Thr Pro Asp Ser Thr Thr Asp Gln
180 185 190
Leu Gln Asn Lys Thr Leu Trp Ser Ser Tyr Thr Glu Ile Ile Asp Val
195 200 205
Lys Gln Cys Tyr Pro Asn Thr Ala Leu Val Gly Val Gln Val Asp Ser
210 215 220
Glu Gln Phe Gly Ser Gln Gln Val Ser Arg Asn Tyr His Leu Arg Gly
225 230 235 240
Arg Ile Leu Gln Val Pro Ser Asn Tyr Asn Pro Gln Thr Arg Gln Tyr
245 250 255
Ser Gly Ile Trp Asp Gly Thr Phe Lys Pro Ala Tyr Ser Asn Asn Met
260 265 270
Ala Trp Cys Leu Trp Asp Met Leu Thr His Pro Arg Tyr Gly Met Gly
275 280 285
Lys Arg Leu Gly Ala Ala Asp Val Asp Lys Trp Ala Leu Tyr Val Ile
290 295 300
Gly Gln Tyr Cys Asp Gln Ser Val Pro Asp Gly Phe Gly Gly Thr Glu
305 310 315 320
Pro Arg Ile Thr Cys Asn Ala Tyr Leu Thr Thr Gln Arg Lys Ala Trp
325 330 335
Asp Val Leu Ser Asp Phe Cys Ser Ala Met Arg Cys Met Pro Val Trp
340 345 350
Asn Gly Gln Thr Leu Thr Phe Val Gln Asp Arg Pro Ser Asp Lys Thr
355 360 365
Trp Thr Tyr Asn Arg Ser Asn Val Val Met Pro Asp Asp Gly Ala Pro
370 375 380
Phe Arg Tyr Ser Phe Ser Ala Leu Lys Asp Arg His Asn Ala Val Glu
385 390 395 400
Val Asn Trp Ile Asp Pro Asn Asn Gly Trp Glu Thr Ala Thr Glu Leu
405 410 415
Val Glu Asp Thr Gln Ala Ile Ala Arg Tyr Gly Arg Asn Val Thr Lys
420 425 430
Met Asp Ala Phe Gly Cys Thr Ser Arg Gly Gln Ala His Arg Ala Gly
435 440 445
Leu Trp Leu Ile Lys Thr Glu Leu Leu Glu Thr Gln Thr Val Asp Phe
450 455 460
Ser Val Gly Ala Glu Gly Leu Arg His Val Pro Gly Asp Val Ile Glu
465 470 475 480
Ile Cys Asp Asp Asp Tyr Ala Gly Ile Ser Thr Gly Gly Arg Val Leu
485 490 495
Ala Val Asn Ser Gln Thr Arg Thr Leu Thr Leu Asp Arg Glu Ile Thr
500 505 510
Leu Pro Ser Ser Gly Thr Ala Leu Ile Ser Leu Val Asp Gly Ser Gly
515 520 525
Asn Pro Val Ser Val Glu Val Gln Ser Val Thr Asp Gly Val Lys Val
530 535 540
Lys Val Ser Arg Val Pro Asp Gly Val Ala Glu Tyr Ser Val Trp Glu
545 550 555 560
Leu Lys Leu Pro Thr Leu Arg Gln Arg Leu Phe Arg Cys Val Ser Ile
565 570 575
Arg Glu Asn Asp Asp Gly Thr Tyr Ala Ile Thr Ala Val Gln His Val
580 585 590
Pro Glu Lys Glu Ala Ile Val Asp Asn Gly Ala His Phe Asp Gly Glu
595 600 605
Gln Ser Gly Thr Val Asn Gly Val Thr Pro Pro Ala Val Gln His Leu
610 615 620
Thr Ala Glu Val Thr Ala Asp Ser Gly Glu Tyr Gln Val Leu Ala Arg
625 630 635 640
Trp Asp Thr Pro Lys Val Val Lys Gly Val Ser Phe Leu Leu Arg Leu
645 650 655
Thr Val Thr Ala Asp Asp Gly Ser Glu Arg Leu Val Ser Thr Ala Arg
660 665 670
Thr Thr Glu Thr Thr Tyr Arg Phe Thr Gln Leu Ala Leu Gly Asn Tyr
675 680 685
Arg Leu Thr Val Arg Ala Val Asn Ala Trp Gly Gln Gln Gly Asp Pro
690 695 700
Ala Ser Val Ser Phe Arg Ile Ala Ala Pro Ala Ala Pro Ser Arg Ile
705 710 715 720
Glu Leu Thr Pro Gly Tyr Phe Gln Ile Thr Ala Thr Pro His Leu Ala
725 730 735
Val Tyr Asp Pro Thr Val Gln Phe Glu Phe Trp Phe Ser Glu Lys Gln
740 745 750
Ile Ala Asp Ile Arg Gln Val Glu Thr Ser Thr Arg Tyr Leu Gly Thr
755 760 765
Ala Leu Tyr Trp Ile Ala Ala Ser Ile Asn Ile Lys Pro Gly His Asp
770 775 780
Tyr Tyr Phe Tyr Ile Arg Ser Val Asn Thr Val Gly Lys Ser Ala Phe
785 790 795 800
Val Glu Ala Val Gly Arg Ala Ser Asp Asp Ala Glu Gly Tyr Leu Asp
805 810 815
Phe Phe Lys Gly Lys Ile Thr Glu Ser His Leu Gly Lys Glu Leu Leu
820 825 830
Glu Lys Val Glu Leu Thr Glu Asp Asn Ala Ser Arg Leu Glu Glu Phe
835 840 845
Ser Lys Glu Trp Lys Asp Ala Ser Asp Lys Trp Asn Ala Met Trp Ala
850 855 860
Val Lys Ile Glu Gln Thr Lys Asp Gly Lys His Tyr Val Ala Gly Ile
865 870 875 880
Gly Leu Ser Met Glu Asp Thr Glu Glu Gly Lys Leu Ser Gln Phe Leu
885 890 895
Val Ala Ala Asn Arg Ile Ala Phe Ile Asp Pro Ala Asn Gly Asn Glu
900 905 910
Thr Pro Met Phe Val Ala Gln Gly Asn Gln Ile Phe Met Asn Asp Val
915 920 925
Phe Leu Lys Arg Leu Thr Ala Pro Thr Ile Thr Ser Gly Gly Asn Pro
930 935 940
Pro Ala Phe Ser Leu Thr Pro Asp Gly Lys Leu Thr Ala Lys Asn Ala
945 950 955 960
Asp Ile Ser Gly Asn Val Asn Ala Asn Ser Gly Thr Leu Asn Asn Val
965 970 975
Thr Ile Asn Glu Asn Cys Arg Val Leu Gly Lys Leu Ser Ala Asn Gln
980 985 990
Ile Glu Gly Asp Leu Val Lys Thr Val Gly Lys Ala Phe Pro Arg Asp
995 1000 1005
Ser Arg Ala Pro Glu Arg Trp Pro Ser Gly Thr Ile Thr Val Arg
1010 1015 1020
Val Tyr Asp Asp Gln Pro Phe Asp Arg Gln Ile Val Ile Pro Ala
1025 1030 1035
Val Ala Phe Ser Gly Ala Lys His Glu Lys Glu His Thr Asp Ile
1040 1045 1050
Tyr Ser Ser Cys Arg Leu Ile Val Arg Lys Asn Gly Ala Glu Ile
1055 1060 1065
Tyr Asn Arg Thr Ala Leu Asp Asn Thr Leu Ile Tyr Ser Gly Val
1070 1075 1080
Ile Asp Met Pro Ala Gly His Gly His Met Thr Leu Glu Phe Ser
1085 1090 1095
Val Ser Ala Trp Leu Val Asn Asn Trp Tyr Pro Thr Ala Ser Ile
1100 1105 1110
Ser Asp Leu Leu Val Val Val Met Lys Lys Ala Thr Ala Gly Ile
1115 1120 1125
Thr Ile Ser
1130
<210> 14
<211> 774
<212> PRT
<213> 埃希氏菌属噬菌体λ(细菌噬菌体λ)
<400> 14
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Val Val Met Asp Glu Thr Asn Arg Lys Ala Pro Leu Asp Ser Pro
385 390 395 400
Ala Leu Thr Gly Thr Pro Thr Ala Pro Thr Ala Leu Arg Gly Thr Asn
405 410 415
Asn Thr Gln Ile Ala Asn Thr Ala Phe Val Leu Ala Ala Ile Ala Asp
420 425 430
Val Ile Asp Ala Ser Pro Asp Ala Leu Asn Thr Leu Asn Glu Leu Ala
435 440 445
Ala Ala Leu Gly Asn Asp Pro Asp Phe Ala Thr Thr Met Thr Asn Ala
450 455 460
Leu Ala Gly Lys Gln Pro Lys Asn Ala Thr Leu Thr Ala Leu Ala Gly
465 470 475 480
Leu Ser Thr Ala Lys Asn Lys Leu Pro Tyr Phe Ala Glu Asn Asp Ala
485 490 495
Ala Ser Leu Thr Glu Leu Thr Gln Val Gly Arg Asp Ile Leu Ala Lys
500 505 510
Asn Ser Val Ala Asp Val Leu Glu Tyr Leu Gly Ala Gly Glu Asn Ser
515 520 525
Ala Phe Pro Ala Gly Ala Pro Ile Pro Trp Pro Ser Asp Ile Val Pro
530 535 540
Ser Gly Tyr Val Leu Met Gln Gly Gln Ala Phe Asp Lys Ser Ala Tyr
545 550 555 560
Pro Lys Leu Ala Val Ala Tyr Pro Ser Gly Val Leu Pro Asp Met Arg
565 570 575
Gly Trp Thr Ile Lys Gly Lys Pro Ala Ser Gly Arg Ala Val Leu Ser
580 585 590
Gln Glu Gln Asp Gly Ile Lys Ser His Thr His Ser Ala Ser Ala Ser
595 600 605
Gly Thr Asp Leu Gly Thr Lys Thr Thr Ser Ser Phe Asp Tyr Gly Thr
610 615 620
Lys Thr Thr Gly Ser Phe Asp Tyr Gly Thr Lys Ser Thr Asn Asn Thr
625 630 635 640
Gly Ala His Ala His Ser Leu Ser Gly Ser Thr Gly Ala Ala Gly Ala
645 650 655
His Ala His Thr Ser Gly Leu Arg Met Asn Ser Ser Gly Trp Ser Gln
660 665 670
Tyr Gly Thr Ala Thr Ile Thr Gly Ser Leu Ser Thr Val Lys Gly Thr
675 680 685
Ser Thr Gln Gly Ile Ala Tyr Leu Ser Lys Thr Asp Ser Gln Gly Ser
690 695 700
His Ser His Ser Leu Ser Gly Thr Ala Val Ser Ala Gly Ala His Ala
705 710 715 720
His Thr Val Gly Ile Gly Ala His Gln His Pro Val Val Ile Gly Ala
725 730 735
His Ala His Ser Phe Ser Ile Gly Ser His Gly His Thr Ile Thr Val
740 745 750
Asn Ala Ala Gly Asn Ala Glu Asn Thr Val Lys Asn Ile Ala Phe Asn
755 760 765
Tyr Ile Val Arg Leu Ala
770
<210> 15
<211> 194
<212> PRT
<213> 埃希氏菌属噬菌体λ(细菌噬菌体λ)
<400> 15
Met Ala Phe Arg Met Ser Glu Gln Pro Arg Thr Ile Lys Ile Tyr Asn
1 5 10 15
Leu Leu Ala Gly Thr Asn Glu Phe Ile Gly Glu Gly Asp Ala Tyr Ile
20 25 30
Pro Pro His Thr Gly Leu Pro Ala Asn Ser Thr Asp Ile Ala Pro Pro
35 40 45
Asp Ile Pro Ala Gly Phe Val Ala Val Phe Asn Ser Asp Glu Ala Ser
50 55 60
Trp His Leu Val Glu Asp His Arg Gly Lys Thr Val Tyr Asp Val Ala
65 70 75 80
Ser Gly Asp Ala Leu Phe Ile Ser Glu Leu Gly Pro Leu Pro Glu Asn
85 90 95
Phe Thr Trp Leu Ser Pro Gly Gly Glu Tyr Gln Lys Trp Asn Gly Thr
100 105 110
Ala Trp Val Lys Asp Thr Glu Ala Glu Lys Leu Phe Arg Ile Arg Glu
115 120 125
Ala Glu Glu Thr Lys Lys Ser Leu Met Gln Val Ala Ser Glu His Ile
130 135 140
Ala Pro Leu Gln Asp Ala Ala Asp Leu Glu Ile Ala Thr Lys Glu Glu
145 150 155 160
Thr Ser Leu Leu Glu Ala Trp Lys Lys Tyr Arg Val Leu Leu Asn Arg
165 170 175
Val Asp Thr Ser Thr Ala Pro Asp Ile Glu Trp Pro Ala Val Pro Val
180 185 190
Met Glu
<210> 16
<211> 1194
<212> PRT
<213> 人工序列
<220>
<223> STF λ-WW11.2
<400> 16
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Val Val Met Asp Glu Thr Asn Arg Lys Ala Pro Leu Asp Ser Pro
385 390 395 400
Ala Leu Thr Gly Thr Pro Thr Ala Pro Thr Ala Leu Arg Gly Thr Asn
405 410 415
Asn Thr Gln Ile Ala Asn Thr Ala Phe Val Leu Ala Ala Ile Ala Asp
420 425 430
Val Ile Asp Ala Ser Pro Asp Ala Leu Asn Thr Leu Asn Glu Leu Ala
435 440 445
Ala Ala Leu Gly Asn Asp Pro Asp Phe Ala Thr Thr Met Thr Asn Ala
450 455 460
Leu Ala Gly Lys Gln Pro Lys Asn Ala Thr Leu Thr Ala Leu Ala Gly
465 470 475 480
Leu Ser Thr Ala Lys Asn Lys Leu Pro Tyr Phe Ala Glu Asn Asp Ala
485 490 495
Ala Ser Leu Thr Glu Leu Thr Gln Val Gly Arg Asp Ile Leu Ala Lys
500 505 510
Asn Ser Val Ala Asp Val Leu Glu Tyr Leu Gly Ala Gly Glu Asn Ser
515 520 525
Ala Lys Gln Asp Gly Leu Ser Leu Ile Gly Gln Cys Asn Ser Ile Ala
530 535 540
Asp Leu Arg Asn Val Glu Pro Val Met Asp Gly Gln Arg Ile Leu Val
545 550 555 560
Lys Gln His Thr Ala Gly Thr Gly Lys Gly Gly Gly Thr Phe Gln Ala
565 570 575
Lys Leu Ser Gly Val Gly Leu Thr Asp Asp Asn Gly Val Thr Val Lys
580 585 590
Thr Val Gly Gly Ala Ala Trp Val Arg Val Gly Ala Asp Arg Val Asn
595 600 605
Pro Tyr Met Tyr Gly Ala Leu Gly Ser Gly Asn Asp Asp Thr Leu Ala
610 615 620
Val Gln Ala Cys Leu Asn Ser Gly Lys Ala Thr Asn Ile Thr Asp Val
625 630 635 640
His His Val Ser Asn Val Thr Met Asn Lys Ser Ser Ala Ser Ile Tyr
645 650 655
Gly Ser Gly Leu His Tyr Thr Arg Leu His Gln Leu Pro Ala Ala Val
660 665 670
Gly Ser Leu Leu Thr Ile Ala Asp Thr Cys Ser Leu Thr Val Ile Asp
675 680 685
Ser Leu Gly Leu Tyr Gly Thr Gly Tyr Lys Gln Gly Thr Ala Phe Thr
690 695 700
Thr Gly Thr Arg Gly Ile Asp Val Leu Thr Pro Thr Gly Leu Ser Asn
705 710 715 720
Asn Tyr Pro Asp His Thr Thr Ser Asp Pro Arg Arg Asp Leu Val Ile
725 730 735
Thr Lys Val His Ile Ala Gly Phe Asp Glu Tyr Gly Leu Asn Val Asp
740 745 750
Ser Gly Asn Phe Ser Val Thr Thr Glu Ser Val Leu Ile Asn His Ile
755 760 765
Lys Gln Val Gly Ala Arg Cys Ala Thr Thr Asp Trp Thr Trp Thr Asn
770 775 780
Ile Gln Ile Asn Thr Cys Gly Lys Gln Cys Leu Ile Leu Asp Gly Cys
785 790 795 800
Gly Asn Gly Arg Ile Ile Gly Gly Lys Phe Ile Trp Ala Asn Trp Leu
805 810 815
Pro Tyr Gly Ala Ser Gly Gln Phe Pro Gly Ile Thr Ile Asn Asn Ser
820 825 830
Gln Asn Met Val Ile Asn Gly Ile Glu Val Gln Asp Cys Gly Gly Asn
835 840 845
Gly Ile Glu Phe Thr Asp Ser Tyr Ser Ile Ser Met Asn Gly Leu Asn
850 855 860
Thr Asn Arg Asn Gly Ile Asn Ser Thr Ala Glu Phe Tyr Asn Leu Val
865 870 875 880
Phe Asn Arg Ser Asp Val Glu Ile Asn Gly Phe Val Gly Leu Asn Tyr
885 890 895
Lys Val Asn Ser Gly Ser Pro Asp Asn Ser Ser Ser Gly Asn Leu Lys
900 905 910
Phe Leu Ser Ser Asp Cys Asn Val Thr Leu Asn Gly Lys Leu Glu Thr
915 920 925
Gly Tyr Met Gly Ile Glu Phe Ile Gly Asp Thr Arg Val Ile Gln Pro
930 935 940
Thr Ser Ser Tyr Ile Lys Leu Asn Gly Leu Val Asn Tyr Ala Gly Ser
945 950 955 960
Gly Ile Gln Thr Ile Asn Glu Val Pro Thr Phe Asp Gly Val Ser Thr
965 970 975
Thr Pro Val Tyr Val Pro Ile Ser Ser Val Val Gly Gln Thr Asn Gly
980 985 990
Leu Arg Leu Ser Gln Ala Asn Lys Asp Lys Val Ile Tyr Thr Arg Lys
995 1000 1005
Val Gly Pro Glu Gly Val Thr Met Ala Ala Val Ile Thr Pro Thr
1010 1015 1020
Ile Gly Gly Ala Glu Ile Phe Asn Leu Met Ala Ile Gly Thr Gly
1025 1030 1035
Phe Ser Ser Ala Ser Asn Ser Leu Tyr Phe Gln Leu Glu Ile Ala
1040 1045 1050
Ala Asp Gly Ser Gln Asn Val Ser Leu Leu Leu Ser Gly Asp Gly
1055 1060 1065
Thr Thr Gln Ile Leu Pro Gly Thr Leu Pro Ala Ala Leu Lys Leu
1070 1075 1080
Gln Ser Gly Glu Pro Tyr His Val Ala Leu Gly Ala Lys Ala Gly
1085 1090 1095
Tyr Phe Trp Trp Ser Ile Leu Asn Leu Asn Thr Gly Lys Arg Ile
1100 1105 1110
Arg Arg Ser Phe Arg Gly Ala Tyr Leu Pro Lys Pro Phe Ala Ser
1115 1120 1125
Ile Phe Gly Leu Val Ser Ser Pro Val Phe Phe Ser Gly Ala Gly
1130 1135 1140
Ile Gly Asp Ser Gly Cys Ser Gly Val Gly Ala Lys Ile Tyr Leu
1145 1150 1155
Gly Ser Phe Ser Asp Glu Asn Asp Tyr Val Ser Ser Arg Tyr Tyr
1160 1165 1170
Ser Leu Val Asn Pro Val Asp Pro Thr Lys Met Tyr Ser Phe Arg
1175 1180 1185
Ile Leu Asp Ser Thr Ile
1190
<210> 17
<211> 757
<212> PRT
<213> 人工序列
<220>
<223> STF λ-75
<400> 17
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Val Val Met Asp Glu Thr Asn Arg Lys Ala Pro Leu Asn Ser Pro
385 390 395 400
Ala Leu Thr Gly Thr Pro Thr Thr Pro Thr Ala Arg Gln Gly Thr Asn
405 410 415
Asn Thr Gln Ile Ala Ser Thr Ala Phe Val Met Ala Ala Ile Ala Ala
420 425 430
Leu Val Asp Ser Ser Pro Asp Ala Leu Asn Thr Leu Asn Glu Leu Ala
435 440 445
Ala Ala Leu Gly Asn Asp Pro Asn Phe Ala Thr Thr Met Thr Asn Ala
450 455 460
Leu Ala Gly Lys Gln Pro Lys Asp Ala Thr Leu Thr Ala Leu Ala Gly
465 470 475 480
Leu Ala Thr Ala Ala Asp Arg Phe Pro Tyr Phe Thr Gly Asn Asp Val
485 490 495
Ala Ser Leu Ala Thr Leu Thr Lys Val Gly Arg Asp Ile Leu Ala Lys
500 505 510
Ser Thr Val Ala Ala Val Ile Glu Tyr Leu Gly Leu Arg Glu Leu Gly
515 520 525
Thr Ser Gly Glu Lys Ile Pro Leu Leu Ser Thr Ala Asn Thr Trp Thr
530 535 540
Asn Arg Gln Thr Leu Ser Gly Gly Leu Ser Gly Glu Leu Ser Gly Asn
545 550 555 560
Ala Ala Thr Ala Thr Lys Leu Lys Thr Ala Arg Lys Ile Ala Gly Val
565 570 575
Gly Phe Asp Gly Ser Ser Asp Ile Ser Ile Ser Ala Lys Asn Val Asn
580 585 590
Ala Phe Ala Leu Arg Gln Thr Gly Asn Thr Val Asn Gly Asp Thr Ser
595 600 605
Val Gly Trp Asn Trp Asp Ser Gly Ala Tyr Asn Ala Leu Ile Gly Gly
610 615 620
Ala Ser Ala Leu Ile Leu His Phe Asn Ile Asn Ala Gly Ser Cys Pro
625 630 635 640
Ala Val Gln Phe Arg Val Asn Tyr Lys Asn Gly Gly Ile Ser Tyr Arg
645 650 655
Ser Ala Arg Asp Gly Tyr Gly Phe Glu Leu Gly Trp Ser Asp Phe Tyr
660 665 670
Thr Thr Thr Arg Lys Pro Ser Ala Gly Asp Val Gly Ala Tyr Thr Gln
675 680 685
Ala Glu Cys Asn Ser Arg Phe Ile Thr Gly Ile Arg Leu Gly Gly Leu
690 695 700
Ser Ser Val Gln Thr Trp Asn Gly Pro Gly Trp Ser Asp Arg Ser Gly
705 710 715 720
Tyr Val Val Thr Gly Ser Val Asn Gly Asn Arg Asp Glu Leu Ile Asp
725 730 735
Thr Thr Gln Ala Arg Pro Ile Gln Tyr Cys Ile Asn Gly Thr Trp Tyr
740 745 750
Asn Ala Gly Ser Ile
755
<210> 18
<211> 177
<212> PRT
<213> 人工序列
<220>
<223> λ-STF75的辅助蛋白
<400> 18
Met Met His Leu Lys Asn Ile Ile Ala Gly Asn Pro Lys Thr Lys Glu
1 5 10 15
Gln Tyr Gln Leu Thr Lys Gln Phe Asn Ile Lys Trp Leu Tyr Ser Asp
20 25 30
Asp Gly Lys Asn Trp Tyr Glu Glu Gln Lys Asn Phe Gln Pro Asp Thr
35 40 45
Leu Lys Met Val Tyr Asp His Asn Gly Val Ile Ile Cys Ile Glu Lys
50 55 60
Asp Val Ser Ala Ile Asn Pro Glu Gly Ala Ser Val Val Glu Leu Pro
65 70 75 80
Asp Ile Thr Ala Asn Arg Arg Ala Asp Ile Ser Gly Lys Trp Met Phe
85 90 95
Lys Asp Gly Val Val Ile Lys Arg Thr Tyr Thr Glu Glu Glu Gln Arg
100 105 110
Gln Gln Ala Glu Asn Glu Lys Gln Ser Leu Leu Gln Leu Val Arg Asp
115 120 125
Lys Thr Gln Leu Trp Asp Ser Gln Leu Arg Leu Gly Ile Ile Ser Asp
130 135 140
Glu Asn Lys Gln Lys Leu Thr Glu Trp Met Leu Phe Ala Gln Lys Val
145 150 155 160
Glu Ser Thr Asp Thr Ser Ser Leu Pro Val Thr Tyr Pro Glu Gln Pro
165 170 175
Glu
<210> 19
<211> 745
<212> PRT
<213> 人工序列
<220>
<223> STF λ-EB6
<400> 19
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Ile Ala Met Asp Asn Ala Asn Ala Arg Leu Ala Lys Asp Arg Asn
385 390 395 400
Gly Ala Asp Ile Pro Asn Lys Pro Leu Phe Ile Gln Asn Leu Gly Leu
405 410 415
Gln Glu Thr Val Asn Lys Ala Gly Asn Ala Val Gln Lys Thr Gly Asp
420 425 430
Thr Leu Ser Gly Gly Leu Thr Phe Glu Asn Asp Ser Ile Leu Ala Trp
435 440 445
Ile Arg Asn Thr Asp Trp Ala Lys Ile Gly Phe Lys Asn Asp Ala Asp
450 455 460
Ser Asp Thr Asp Ser Tyr Met Trp Phe Glu Thr Gly Asp Asn Gly Asn
465 470 475 480
Glu Tyr Phe Lys Trp Arg Ser Arg Gln Ser Thr Thr Thr Lys Asp Leu
485 490 495
Met Asn Leu Lys Trp Asp Ala Leu Tyr Val Leu Val Asn Ala Ile Val
500 505 510
Asn Gly Glu Val Ile Ser Lys Ser Ala Asn Gly Leu Arg Ile Ala Tyr
515 520 525
Gly Asn Tyr Gly Phe Phe Ile Arg Asn Asp Gly Ser Asn Thr Tyr Phe
530 535 540
Met Leu Thr Asn Ser Gly Asp Asn Met Gly Thr Tyr Asn Gly Leu Arg
545 550 555 560
Pro Leu Trp Ile Asn Asn Ala Thr Gly Ala Val Ser Met Gly Arg Gly
565 570 575
Leu Asn Val Ser Gly Glu Thr Leu Ser Asp Arg Phe Ala Ile Asn Ser
580 585 590
Ser Asn Gly Met Trp Ile Gln Met Arg Asp Asn Asn Ala Ile Phe Gly
595 600 605
Lys Asn Ile Val Asn Thr Asp Ser Ala Gln Ala Leu Leu Arg Gln Asn
610 615 620
His Ala Asp Arg Lys Phe Met Ile Gly Gly Leu Gly Asn Lys Gln Phe
625 630 635 640
Gly Ile Tyr Met Ile Asn Asn Ser Arg Thr Ala Asn Gly Thr Asp Gly
645 650 655
Gln Ala Tyr Met Asp Asn Asn Gly Asn Trp Leu Cys Gly Ala Gln Val
660 665 670
Ile Pro Gly Asn Tyr Gly Asn Phe Asp Ser Arg Tyr Val Arg Asp Val
675 680 685
Arg Leu Gly Thr Arg Val Val Gln Leu Met Ala Arg Gly Gly Arg Tyr
690 695 700
Glu Lys Ala Gly His Ala Ile Thr Gly Leu Arg Ile Ile Gly Glu Val
705 710 715 720
Asp Gly Asp Asp Glu Ala Ile Phe Arg Pro Ile Gln Lys Tyr Ile Asn
725 730 735
Gly Thr Trp Tyr Asn Val Ala Gln Val
740 745
<210> 20
<211> 175
<212> PRT
<213> 人工序列
<220>
<223> λ-EB6的辅助蛋白
<400> 20
Met Gln His Leu Lys Asn Ile Lys Ser Gly Asn Pro Lys Thr Lys Glu
1 5 10 15
Gln Tyr Gln Leu Thr Lys Asn Phe Asp Val Ile Trp Leu Trp Ser Glu
20 25 30
Asp Gly Lys Asn Trp Tyr Glu Glu Val Asn Asn Phe Gln Asp Asp Thr
35 40 45
Ile Lys Ile Val Tyr Asp Glu Asn Asn Ile Ile Val Ala Ile Thr Lys
50 55 60
Asp Ala Ser Thr Leu Asn Pro Glu Gly Phe Ser Val Val Glu Ile Pro
65 70 75 80
Asp Ile Thr Ala Asn Arg Arg Ala Asp Asp Ser Gly Lys Trp Met Phe
85 90 95
Lys Asp Gly Ala Val Val Lys Arg Ile Tyr Thr Ala Asp Glu Gln Gln
100 105 110
Gln Gln Ala Glu Ser Gln Lys Ala Ala Leu Leu Ser Glu Ala Glu Asn
115 120 125
Val Ile Gln Pro Leu Glu Arg Ala Val Arg Leu Asn Met Ala Thr Asp
130 135 140
Glu Glu Arg Ala Arg Leu Glu Ser Trp Glu Arg Tyr Ser Val Leu Val
145 150 155 160
Ser Arg Val Asp Thr Ala Lys Pro Glu Trp Pro Gln Lys Pro Glu
165 170 175
<210> 21
<211> 757
<212> PRT
<213> 人工序列
<220>
<223> STF λ-23
<400> 21
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Val Val Met Asp Glu Thr Asn Arg Lys Ala Pro Leu Asn Ser Pro
385 390 395 400
Ala Leu Thr Gly Thr Pro Thr Thr Pro Thr Ala Arg Gln Gly Thr Asn
405 410 415
Asn Thr Gln Ile Ala Ser Thr Ala Phe Val Met Ala Ala Ile Ala Ala
420 425 430
Leu Val Asp Ser Ser Pro Asp Ala Leu Asn Thr Leu Asn Glu Leu Ala
435 440 445
Ala Ala Leu Gly Asn Asp Pro Asn Phe Ala Thr Thr Met Thr Asn Ala
450 455 460
Leu Ala Gly Lys Gln Pro Lys Asp Ala Thr Leu Thr Ala Leu Ala Gly
465 470 475 480
Leu Ala Thr Ala Ala Asp Arg Phe Pro Tyr Phe Thr Gly Asn Asp Val
485 490 495
Ala Ser Leu Ala Thr Leu Thr Lys Val Gly Arg Asp Ile Leu Ala Lys
500 505 510
Ser Thr Val Ala Ala Val Ile Glu Tyr Leu Gly Leu Arg Glu Leu Gly
515 520 525
Thr Ser Gly Glu Lys Ile Pro Leu Leu Ser Thr Ala Asn Thr Trp Thr
530 535 540
Asn Arg Gln Thr Phe Ser Gly Gly Leu Ser Gly Gly Leu Ser Gly Asn
545 550 555 560
Ala Ala Thr Ala Thr Lys Leu Lys Thr Ala Arg Lys Ile Ala Gly Val
565 570 575
Gly Phe Asp Gly Ser Ser Asp Ile Ser Ile Ser Ala Lys Asn Val Asn
580 585 590
Ala Phe Ala Leu Arg Gln Thr Gly Asn Thr Val Asn Gly Asp Thr Ser
595 600 605
Val Gly Trp Asn Trp Asp Ser Gly Ala Tyr Asn Ala Leu Ile Gly Gly
610 615 620
Ala Ser Ala Leu Ile Leu His Phe Asn Ile Asn Ala Gly Ser Cys Pro
625 630 635 640
Ala Val Gln Phe Arg Val Asn Tyr Lys Asn Gly Gly Ile Ser Tyr Arg
645 650 655
Ser Ala Arg Asp Gly Tyr Gly Phe Glu Leu Gly Trp Ser Asp Phe Tyr
660 665 670
Thr Thr Thr Arg Lys Pro Ser Ala Gly Asp Val Gly Ala Tyr Thr Arg
675 680 685
Ala Glu Cys Asn Ser Arg Phe Ile Thr Gly Ile Arg Leu Gly Gly Leu
690 695 700
Ser Ser Val Gln Thr Trp Asn Gly Pro Gly Trp Ser Asp Arg Ser Gly
705 710 715 720
Tyr Val Val Thr Gly Ser Val Asn Gly Asn Arg Asp Glu Leu Ile Asp
725 730 735
Thr Thr Gln Ala Arg Pro Ile Gln Tyr Cys Ile Asn Gly Thr Trp Tyr
740 745 750
Asn Ala Gly Ser Ile
755
<210> 22
<211> 177
<212> PRT
<213> 人工序列
<220>
<223> λ-STF23的辅助蛋白
<400> 22
Met Met His Leu Lys Asn Ile Thr Ala Gly Asn Pro Lys Thr Lys Glu
1 5 10 15
Gln Tyr Gln Leu Thr Lys Gln Phe Asn Ile Lys Trp Leu Tyr Ser Asp
20 25 30
Asp Gly Lys Asn Trp Tyr Glu Glu Gln Lys Asn Phe Gln Pro Asp Thr
35 40 45
Leu Lys Met Val Tyr Asp His Asn Gly Val Ile Ile Cys Ile Glu Lys
50 55 60
Asp Val Ser Ala Ile Asn Pro Glu Gly Ala Ser Val Val Glu Leu Pro
65 70 75 80
Asp Ile Thr Ala Asn Arg Arg Ala Asp Ile Ser Gly Lys Trp Leu Phe
85 90 95
Lys Asp Gly Val Val Ile Lys Arg Thr Tyr Thr Glu Glu Glu Gln Arg
100 105 110
Gln Gln Ala Glu Asn Glu Lys Gln Ser Leu Leu Gln Leu Val Arg Asp
115 120 125
Lys Thr Gln Leu Trp Asp Ser Gln Leu Arg Leu Gly Ile Ile Ser Asp
130 135 140
Glu Asn Lys Gln Lys Leu Thr Glu Trp Met Leu Tyr Ala Gln Lys Val
145 150 155 160
Glu Ser Thr Asp Thr Ser Ser Leu Pro Val Thr Phe Pro Glu Gln Pro
165 170 175
Glu
<210> 23
<211> 853
<212> PRT
<213> 埃希氏菌属噬菌体λ(细菌噬菌体λ)
<220>
<221> MISC_FEATURE
<222> (187)..(208)
<223> 图9A中的远端区域框
<220>
<221> MISC_FEATURE
<222> (301)..(414)
<223> 图9A中的近端区域框
<400> 23
Met Ala Glu Pro Val Gly Asp Leu Val Val Asp Leu Ser Leu Asp Ala
1 5 10 15
Ala Arg Phe Asp Glu Gln Met Ala Arg Val Arg Arg His Phe Ser Gly
20 25 30
Thr Glu Ser Asp Ala Lys Lys Thr Ala Ala Val Val Glu Gln Ser Leu
35 40 45
Ser Arg Gln Ala Leu Ala Ala Gln Lys Ala Gly Ile Ser Val Gly Gln
50 55 60
Tyr Lys Ala Ala Met Arg Met Leu Pro Ala Gln Phe Thr Asp Val Ala
65 70 75 80
Thr Gln Leu Ala Gly Gly Gln Ser Pro Trp Leu Ile Leu Leu Gln Gln
85 90 95
Gly Gly Gln Val Lys Asp Ser Phe Gly Gly Met Ile Pro Met Phe Arg
100 105 110
Gly Leu Ala Gly Ala Ile Thr Leu Pro Met Val Gly Ala Thr Ser Leu
115 120 125
Ala Val Ala Thr Gly Ala Leu Ala Tyr Ala Trp Tyr Gln Gly Asn Ser
130 135 140
Thr Leu Ser Asp Phe Asn Lys Thr Leu Val Leu Ser Gly Asn Gln Ala
145 150 155 160
Gly Leu Thr Ala Asp Arg Met Leu Val Leu Ser Arg Ala Gly Gln Ala
165 170 175
Ala Gly Leu Thr Phe Asn Gln Thr Ser Glu Ser Leu Ser Ala Leu Val
180 185 190
Lys Ala Gly Val Ser Gly Glu Ala Gln Ile Ala Ser Ile Ser Gln Ser
195 200 205
Val Ala Arg Phe Ser Ser Ala Ser Gly Val Glu Val Asp Lys Val Ala
210 215 220
Glu Ala Phe Gly Lys Leu Thr Thr Asp Pro Thr Ser Gly Leu Thr Ala
225 230 235 240
Met Ala Arg Gln Phe His Asn Val Ser Ala Glu Gln Ile Ala Tyr Val
245 250 255
Ala Gln Leu Gln Arg Ser Gly Asp Glu Ala Gly Ala Leu Gln Ala Ala
260 265 270
Asn Glu Ala Ala Thr Lys Gly Phe Asp Asp Gln Thr Arg Arg Leu Lys
275 280 285
Glu Asn Met Gly Thr Leu Glu Thr Trp Ala Asp Arg Thr Ala Arg Ala
290 295 300
Phe Lys Ser Met Trp Asp Ala Val Leu Asp Ile Gly Arg Pro Asp Thr
305 310 315 320
Ala Gln Glu Met Leu Ile Lys Ala Glu Ala Ala Tyr Lys Lys Ala Asp
325 330 335
Asp Ile Trp Asn Leu Arg Lys Asp Asp Tyr Phe Val Asn Asp Glu Ala
340 345 350
Arg Ala Arg Tyr Trp Asp Asp Arg Glu Lys Ala Arg Leu Ala Leu Glu
355 360 365
Ala Ala Arg Lys Lys Ala Glu Gln Gln Thr Gln Gln Asp Lys Asn Ala
370 375 380
Gln Gln Gln Ser Asp Thr Glu Ala Ser Arg Leu Lys Tyr Thr Glu Glu
385 390 395 400
Ala Gln Lys Ala Tyr Glu Arg Leu Gln Thr Pro Leu Glu Lys Tyr Thr
405 410 415
Ala Arg Gln Glu Glu Leu Asn Lys Ala Leu Lys Asp Gly Lys Ile Leu
420 425 430
Gln Ala Asp Tyr Asn Thr Leu Met Ala Ala Ala Lys Lys Asp Tyr Glu
435 440 445
Ala Thr Leu Lys Lys Pro Lys Gln Ser Ser Val Lys Val Ser Ala Gly
450 455 460
Asp Arg Gln Glu Asp Ser Ala His Ala Ala Leu Leu Thr Leu Gln Ala
465 470 475 480
Glu Leu Arg Thr Leu Glu Lys His Ala Gly Ala Asn Glu Lys Ile Ser
485 490 495
Gln Gln Arg Arg Asp Leu Trp Lys Ala Glu Ser Gln Phe Ala Val Leu
500 505 510
Glu Glu Ala Ala Gln Arg Arg Gln Leu Ser Ala Gln Glu Lys Ser Leu
515 520 525
Leu Ala His Lys Asp Glu Thr Leu Glu Tyr Lys Arg Gln Leu Ala Ala
530 535 540
Leu Gly Asp Lys Val Thr Tyr Gln Glu Arg Leu Asn Ala Leu Ala Gln
545 550 555 560
Gln Ala Asp Lys Phe Ala Gln Gln Gln Arg Ala Lys Arg Ala Ala Ile
565 570 575
Asp Ala Lys Ser Arg Gly Leu Thr Asp Arg Gln Ala Glu Arg Glu Ala
580 585 590
Thr Glu Gln Arg Leu Lys Glu Gln Tyr Gly Asp Asn Pro Leu Ala Leu
595 600 605
Asn Asn Val Met Ser Glu Gln Lys Lys Thr Trp Ala Ala Glu Asp Gln
610 615 620
Leu Arg Gly Asn Trp Met Ala Gly Leu Lys Ser Gly Trp Ser Glu Trp
625 630 635 640
Glu Glu Ser Ala Thr Asp Ser Met Ser Gln Val Lys Ser Ala Ala Thr
645 650 655
Gln Thr Phe Asp Gly Ile Ala Gln Asn Met Ala Ala Met Leu Thr Gly
660 665 670
Ser Glu Gln Asn Trp Arg Ser Phe Thr Arg Ser Val Leu Ser Met Met
675 680 685
Thr Glu Ile Leu Leu Lys Gln Ala Met Val Gly Ile Val Gly Ser Ile
690 695 700
Gly Ser Ala Ile Gly Gly Ala Val Gly Gly Gly Ala Ser Ala Ser Gly
705 710 715 720
Gly Thr Ala Ile Gln Ala Ala Ala Ala Lys Phe His Phe Ala Thr Gly
725 730 735
Gly Phe Thr Gly Thr Gly Gly Lys Tyr Glu Pro Ala Gly Ile Val His
740 745 750
Arg Gly Glu Phe Val Phe Thr Lys Glu Ala Thr Ser Arg Ile Gly Val
755 760 765
Gly Asn Leu Tyr Arg Leu Met Arg Gly Tyr Ala Thr Gly Gly Tyr Val
770 775 780
Gly Thr Pro Gly Ser Met Ala Asp Ser Arg Ser Gln Ala Ser Gly Thr
785 790 795 800
Phe Glu Gln Asn Asn His Val Val Ile Asn Asn Asp Gly Thr Asn Gly
805 810 815
Gln Ile Gly Pro Ala Ala Leu Lys Ala Val Tyr Asp Met Ala Arg Lys
820 825 830
Gly Ala Arg Asp Glu Ile Gln Thr Gln Met Arg Asp Gly Gly Leu Phe
835 840 845
Ser Gly Gly Gly Arg
850
<210> 24
<211> 859
<212> PRT
<213> 人工序列
<220>
<223> gpH-IAI
<400> 24
Met Ala Glu Pro Val Gly Asp Leu Val Val Asp Leu Ser Leu Asp Ala
1 5 10 15
Ala Arg Phe Asp Glu Gln Met Ala Arg Val Arg Arg His Phe Ser Gly
20 25 30
Thr Glu Ser Asp Ala Lys Lys Thr Ala Ala Val Val Glu Gln Ser Leu
35 40 45
Ser Arg Gln Ala Leu Ala Ala Gln Lys Ala Gly Ile Ser Val Gly Gln
50 55 60
Tyr Lys Ala Ala Met Arg Met Leu Pro Ala Gln Phe Thr Asp Val Ala
65 70 75 80
Thr Gln Leu Ala Gly Gly Gln Ser Pro Trp Leu Ile Leu Leu Gln Gln
85 90 95
Gly Gly Gln Val Lys Asp Ser Phe Gly Gly Met Ile Pro Met Phe Arg
100 105 110
Gly Leu Ala Gly Ala Ile Thr Leu Pro Met Val Gly Ala Thr Ser Leu
115 120 125
Ala Val Ala Thr Gly Ala Leu Ala Tyr Ala Trp Tyr Gln Gly Asn Ser
130 135 140
Thr Leu Ser Asp Phe Asn Lys Thr Leu Val Leu Ser Gly Asn Gln Ala
145 150 155 160
Gly Leu Thr Ala Asp Arg Met Leu Val Leu Ser Arg Ala Gly Gln Ala
165 170 175
Ala Gly Leu Thr Phe Asn Gln Thr Ser Glu Ser Leu Thr Ala Leu Val
180 185 190
Asn Ala Gly Val Arg Gly Gly Glu Gln Phe Glu Ala Ile Ser Gln Ser
195 200 205
Val Ala Arg Phe Ser Ser Ala Ser Gly Val Glu Val Asp Lys Val Ala
210 215 220
Glu Ala Phe Gly Lys Leu Thr Thr Asp Pro Thr Ser Gly Leu Thr Ala
225 230 235 240
Met Ala Arg Gln Phe His Asn Val Thr Ala Glu Gln Ile Ala Tyr Val
245 250 255
Ala Gln Leu Gln Arg Ser Gly Asp Glu Ala Gly Ala Leu Gln Ala Ala
260 265 270
Asn Glu Ala Ala Thr Lys Gly Phe Asp Asp Gln Thr Arg Arg Leu Lys
275 280 285
Glu Asn Met Gly Thr Leu Glu Thr Trp Ala Asp Arg Thr Ala Arg Ala
290 295 300
Phe Lys Ser Met Trp Asp Ser Val Leu Asp Ile Gly Arg Pro Asp Thr
305 310 315 320
Ala Gln Gly Met Leu Glu Lys Ala Glu Lys Ala Phe Asp Glu Ala Asp
325 330 335
Lys Lys Trp Gln Trp Tyr Gln Ser Arg Ser His Arg Arg Gly Lys Thr
340 345 350
Ser Ala Phe Leu Ala Asn Leu Arg Gly Ala Trp Glu Asp Arg Ala Asn
355 360 365
Ala Gln Leu Gly Leu Ser Ala Ala Thr Leu Gln Ala Asp Leu Glu Lys
370 375 380
Ala Arg Glu Met Ala Ala Lys Asp Trp Ala Glu Ser Glu Ala Ser Arg
385 390 395 400
Leu Lys Tyr Thr Glu Glu Ala Gln Lys Ala Tyr Glu Arg Leu Gln Thr
405 410 415
Pro Leu Glu Lys Tyr Thr Ala Arg Gln Glu Glu Leu Asn Lys Ala Leu
420 425 430
Lys Asp Gly Lys Ile Leu Gln Ala Asp Tyr Asn Thr Leu Met Ala Ala
435 440 445
Ala Lys Lys Asp Tyr Glu Ala Thr Leu Lys Lys Pro Lys Gln Ser Ser
450 455 460
Val Lys Val Ser Ala Gly Asp Arg Gln Glu Asp Ser Ala His Ala Ala
465 470 475 480
Leu Leu Thr Leu Gln Ala Glu Leu Arg Thr Leu Glu Lys His Ala Gly
485 490 495
Ala Asn Glu Lys Ile Ser Gln Gln Arg Arg Asp Leu Trp Lys Ala Glu
500 505 510
Ser Gln Phe Ala Val Leu Glu Glu Ala Ala Gln Arg Arg Gln Leu Ser
515 520 525
Ala Gln Glu Lys Ser Leu Leu Ala His Lys Asp Glu Thr Leu Glu Tyr
530 535 540
Lys Arg Gln Leu Ala Ala Leu Gly Asp Lys Val Thr Tyr Gln Glu Arg
545 550 555 560
Leu Asn Ala Leu Ala Gln Gln Ala Asp Lys Phe Ala Gln Gln Gln Arg
565 570 575
Ala Lys Arg Ala Ala Ile Asp Ala Lys Ser Arg Gly Leu Thr Asp Arg
580 585 590
Gln Ala Glu Arg Glu Ala Thr Glu Gln Arg Leu Lys Glu Gln Tyr Gly
595 600 605
Asp Asn Pro Leu Ala Leu Asn Asn Val Met Ser Glu Gln Lys Lys Thr
610 615 620
Trp Ala Ala Glu Asp Gln Leu Arg Gly Asn Trp Met Ala Gly Leu Lys
625 630 635 640
Ser Gly Trp Ser Glu Trp Glu Glu Ser Ala Thr Asp Ser Met Ser Gln
645 650 655
Val Lys Ser Ala Ala Thr Gln Thr Phe Asp Gly Ile Ala Gln Asn Met
660 665 670
Ala Ala Met Leu Thr Gly Ser Glu Gln Asn Trp Arg Ser Phe Thr Arg
675 680 685
Ser Val Leu Ser Met Met Thr Glu Ile Leu Leu Lys Gln Ala Met Val
690 695 700
Gly Ile Val Gly Ser Ile Gly Ser Ala Ile Gly Gly Ala Val Gly Gly
705 710 715 720
Gly Ala Ser Ala Ser Gly Gly Thr Ala Ile Gln Ala Ala Ala Ala Lys
725 730 735
Phe His Phe Ala Thr Gly Gly Phe Thr Gly Thr Gly Gly Lys Tyr Glu
740 745 750
Pro Ala Gly Ile Val His Arg Gly Glu Phe Val Phe Thr Lys Glu Ala
755 760 765
Thr Ser Arg Ile Gly Val Gly Asn Leu Tyr Arg Leu Met Arg Gly Tyr
770 775 780
Ala Thr Gly Gly Tyr Val Gly Thr Pro Gly Ser Met Ala Asp Ser Arg
785 790 795 800
Ser Gln Ala Ser Gly Thr Phe Glu Gln Asn Asn His Val Val Ile Asn
805 810 815
Asn Asp Gly Thr Asn Gly Gln Ile Gly Pro Ala Ala Leu Lys Ala Val
820 825 830
Tyr Asp Met Ala Arg Lys Gly Ala Arg Asp Glu Ile Gln Thr Gln Met
835 840 845
Arg Asp Gly Gly Leu Phe Ser Gly Gly Gly Arg
850 855
<210> 25
<211> 3396
<212> DNA
<213> 人工序列
<220>
<223> 编码H591的核酸
<400> 25
atgggtaaag gaagcagtaa ggggcatacc ccgcgcgaag cgaaggacaa cctgaagtcc 60
acgcagttgc tgagtgtgat cgatgccatc agcgaagggc cgattgaagg tccggtggat 120
ggcttaaaaa gcgtgctgct gaacagtacg ccggtgctgg acactgaggg gaataccaac 180
atatccggtg tcacggtggt gttccgggct ggtgagcagg agcagactcc gccggaggga 240
tttgaatcct ccggctccga gacggtgctg ggtacggaag tgaaatatga cacgccgatc 300
acccgcacca ttacgtctgc aaacatcgac cgtctgcgct ttaccttcgg tgtacaggca 360
ctggtggaaa ccacctcaaa gggtgacagg aatccgtcgg aagtccgcct gctggttcag 420
atacaacgta acggtggctg ggtgacggaa aaagacatca ccattaaggg caaaaccacc 480
tcgcagtatc tggcctcggt ggtgatgggt aacctgccgc cgcgcccgtt taatatccgg 540
atgcgcagga tgacgccgga cagcaccaca gaccagctgc agaacaaaac gctctggtcg 600
tcatacactg aaatcatcga tgtgaaacag tgctacccga acacggcact ggtcggcgtg 660
caggtggact cggagcagtt cggcagccag caggtgagcc gtaattatca tctgcgcggg 720
cgtattctgc aggtgccgtc gaactataac ccgcagacgc ggcaatacag cggtatctgg 780
gacggaacgt ttaaaccggc atacagcaac aacatggcct ggtgtctgtg ggatatgctg 840
acccatccgc gctacggcat ggggaaacgt cttggtgcgg cggatgtgga taaatgggcg 900
ctgtatgtca tcggccagta ctgcgaccag tcagtgccgg acggctttgg cggcacggag 960
ccgcgcatca cctgtaatgc gtacctgacc acacagcgta aggcgtggga tgtgctcagc 1020
gatttctgct cggcgatgcg ctgtatgccg gtatggaacg ggcagacgct gacgttcgtg 1080
caggaccgac cgtcggataa gacgtggacc tataaccgca gtaatgtggt gatgccggat 1140
gatggcgcgc cgttccgcta cagcttcagc gccctgaagg accgccataa tgccgttgag 1200
gtgaactgga ttgacccgaa caacggctgg gagacggcga cagagcttgt tgaagatacg 1260
caggccattg cccgttacgg tcgtaatgtt acgaagatgg atgcctttgg ctgtaccagc 1320
cgggggcagg cacaccgcgc cgggctgtgg ctgattaaaa cagaactgct ggaaacgcag 1380
accgtggatt tcagcgtcgg cgcagaaggg cttcgccatg taccgggcga tgttattgaa 1440
atctgcgatg atgactatgc cggtatcagc accggtggtc gtgtgctggc ggtgaacagc 1500
cagacccgga cgctgacgct cgaccgtgaa atcacgctgc catcctccgg taccgcgctg 1560
ataagcctgg ttgacggaag tggcaatccg gtcagcgtgg aggttcagtc cgtcaccgac 1620
ggcgtgaagg taaaagtgag ccgtgttcct gacggtgttg ctgaatacag cgtatgggag 1680
ctgaagctgc cgacgctgcg ccagcgactg ttccgctgcg tgagtatccg tgagaacgac 1740
gacggcacgt atgccatcac cgccgtgcag catgtgccgg aaaaagaggc catcgtggat 1800
aacggggcgc actttgacgg cgaacagagt ggcacggtga atggtgtcac gccgccagcg 1860
gtgcagcacc tgaccgcaga agtcactgca gacagcgggg aatatcaggt gctggcgcga 1920
tgggacacac cgaaggtggt gaagggcgtg agtttcctgc tccgtctgac cgtaacagcg 1980
gacgacggca gtgagcggct ggtcagcacg gcccggacga cggaaaccac ataccgcttc 2040
acgcaactgg cgctggggaa ctacaggctg acagtccggg cggtaaatgc gtgggggcag 2100
cagggcgatc cggcgtcggt atcgttccgg attgccgcac cggcagcacc gtcgaggatt 2160
gagctgacgc cgggctattt tcagataacc gccacgccgc atcttgccgt ttatgacccg 2220
acggtacagt ttgagttctg gttctcggaa aagcagattg cggatatcag acaggttgaa 2280
accagcacgc gttatcttgg tacggcgctg tactggatag ccgccagtat caatatcaaa 2340
ccgggccatg attattactt ttatatccgc agtgtgaaca ccgttggcaa atcggcattc 2400
gtggaggccg tcggtcgggc gagcgatgat gcggaaggtt acctggattt tttcaaaggc 2460
aagataaccg aatcccatct cggcaaggag ctgctggaaa aagtcgagct gacggaggat 2520
aacgccagca gactggagga gttttcgaaa gagtggaagg atgccagtga taagtggaat 2580
gccatgtggg ctgtcaaaat tgagcagacc aaagacggca aacattatgt cgcgggtatt 2640
ggcctcagca tggaggacac ggaggaaggc aaactgagcc agtttctggt tgccgccaat 2700
cgtatcgcat ttattgaccc ggcaaacggg aatgaaacgc cgatgtttgt ggcgcagggc 2760
aaccagatat tcatgaacga cgtgttcctg aagcgcctga cggcccccac cattaccagc 2820
ggcggcaatc ctccggcctt ttccctgaca ccggacggaa agctgaccgc taaaaatgcg 2880
gatatcagtg gcaatgtgaa tgcaaattca gggacgctca acaatgtcac gattaatgaa 2940
aactgtcaga ttaaagggaa actgtcagcc aatcagattg aaggcgatat tgtcaaaacg 3000
gtcagcaagt ctttcccccg cacgaacagt tatgccagtg gcaccatcac ggtaagaatc 3060
agtgatgatc agaaatttga ccggcaggtc atgataccgc cagtgttatt ccgcggtggt 3120
aagcatgaga atttcaacag taataaccaa cagtcatact ggtattcaac ctgccggtta 3180
agagtgaccc gcaatggtca ggagattttt aatcagtcca cgacggatgc tcagggcgta 3240
ttttcctcag ttatagatat gcctgccgga caggggacac tgacactgac attcaccgta 3300
tcttcatcag gagcgaataa ctggacacca acaaccagta tcagcgatct gctggttgtg 3360
gtgatgaaga aatccacagc aggtatcagt atcagc 3396
<210> 26
<211> 3477
<212> DNA
<213> 人工序列
<220>
<223> 编码Z2145的核酸
<400> 26
atgggtaaag gaagcagtaa ggggcatacc ccgcgcgaag cgaaggacaa cctgaagtcc 60
acgcagttgc tgagtgtgat cgatgccatc agcgaagggc cgattgaagg tccggtggat 120
ggcttaaaaa gcgtgctgct gaacagtacg ccggtgctgg acactgaggg gaataccaac 180
atatccggtg tcacggtggt gttccgggct ggtgagcagg agcagactcc gccggaggga 240
tttgaatcct ccggctccga gacggtgctg ggtacggaag tgaaatatga cacgccgatc 300
acccgcacca ttacgtctgc aaacatcgac cgtctgcgct ttaccttcgg tgtacaggca 360
ctggtggaaa ccacctcaaa gggtgacagg aatccgtcgg aagtccgcct gctggttcag 420
atacaacgta acggtggctg ggtgacggaa aaagacatca ccattaaggg caaaaccacc 480
tcgcagtatc tggcctcggt ggtgatgggt aacctgccgc cgcgcccgtt taatatccgg 540
atgcgcagga tgacgccgga cagcaccaca gaccagctgc agaacaaaac gctctggtcg 600
tcatacactg aaatcatcga tgtgaaacag tgctacccga acacggcact ggtcggcgtg 660
caggtggact cggagcagtt cggcagccag caggtgagcc gtaattatca tctgcgcggg 720
cgtattctgc aggtgccgtc gaactataac ccgcagacgc ggcaatacag cggtatctgg 780
gacggaacgt ttaaaccggc atacagcaac aacatggcct ggtgtctgtg ggatatgctg 840
acccatccgc gctacggcat ggggaaacgt cttggtgcgg cggatgtgga taaatgggcg 900
ctgtatgtca tcggccagta ctgcgaccag tcagtgccgg acggctttgg cggcacggag 960
ccgcgcatca cctgtaatgc gtacctgacc acacagcgta aggcgtggga tgtgctcagc 1020
gatttctgct cggcgatgcg ctgtatgccg gtatggaacg ggcagacgct gacgttcgtg 1080
caggaccgac cgtcggataa gacgtggacc tataaccgca gtaatgtggt gatgccggat 1140
gatggcgcgc cgttccgcta cagcttcagc gccctgaagg accgccataa tgccgttgag 1200
gtgaactgga ttgacccgaa caacggctgg gagacggcga cagagcttgt tgaagatacg 1260
caggccattg cccgttacgg tcgtaatgtt acgaagatgg atgcctttgg ctgtaccagc 1320
cgggggcagg cacaccgcgc cgggctgtgg ctgattaaaa cagaactgct ggaaacgcag 1380
accgtggatt tcagcgtcgg cgcagaaggg cttcgccatg taccgggcga tgttattgaa 1440
atctgcgatg atgactatgc cggtatcagc accggtggtc gtgtgctggc ggtgaacagc 1500
cagacccgga cgctgacgct cgaccgtgaa atcacgctgc catcctccgg taccgcgctg 1560
ataagcctgg ttgacggaag tggcaatccg gtcagcgtgg aggttcagtc cgtcaccgac 1620
ggcgtgaagg taaaagtgag ccgtgttcct gacggtgttg ctgaatacag cgtatgggag 1680
ctgaagctgc cgacgctgcg ccagcgactg ttccgctgcg tgagtatccg tgagaacgac 1740
gacggcacgt atgccatcac cgccgtgcag catgtgccgg aaaaagaggc catcgtggat 1800
aacggggcgc actttgacgg cgaacagagt ggcacggtga atggtgtcac gccgccagcg 1860
gtgcagcacc tgaccgcaga agtcactgca gacagcgggg aatatcaggt gctggcgcga 1920
tgggacacac cgaaggtggt gaagggcgtg agtttcctgc tccgtctgac cgtaacagcg 1980
gacgacggca gtgagcggct ggtcagcacg gcccggacga cggaaaccac ataccgcttc 2040
acgcaactgg cgctggggaa ctacaggctg acagtccggg cggtaaatgc gtgggggcag 2100
cagggcgatc cggcgtcggt atcgttccgg attgccgcac cggcagcacc gtcgaggatt 2160
gagctgacgc cgggctattt tcagataacc gccacgccgc atcttgccgt ttatgacccg 2220
acggtacagt ttgagttctg gttctcggaa aagcagattg cggatatcag acaggttgaa 2280
accagcacgc gttatcttgg tacggcgctg tactggatag ccgccagtat caatatcaaa 2340
ccgggccatg attattactt ttatatccgc agtgtgaaca ccgttggcaa atcggcattc 2400
gtggaggccg tcggtcgggc gagcgatgat gcggaaggtt acctggattt tttcaaaggc 2460
gagataggga aaacccatct ggctcaggag ttgtggactc agattgataa cggtcagctt 2520
gcgcctgacc tggcggaaat cagaacgtcc atcacggatg tcagtaatga aatcacgcag 2580
accgtcaata agaaactgga agaccagagt gcagcgatcc agcagataca gaaggttcag 2640
gttgatacaa ataataacct gaacagcatg tgggcagtga agctgcagca gatgcaggac 2700
ggacgccttt atattgcggg tatcggtgcc ggtattgaga acacctctga cggcatgcag 2760
agtcaggtgc tgctggcggc agacaggatt gcgatgatta atcctgcgaa tggcaacaca 2820
aagccgatgt ttgttggtca gggcgatcag atattcatga atgaagtgtt cctgaaatat 2880
ctgacggctc ccaccattac cagtggcggc aatcctccgg cattttccct gacatcagac 2940
ggaaagctga ccgctaaaaa tgcggatatc agtggcagtg tgaatgcgaa ctccgggacg 3000
ctcaacaacg tcacgattaa cgagaactgt cgggttctgg gaaaactgtc cgcgaaccag 3060
attgaaggcg atctcgttaa aacagtgggc aaagctttcc cccgggactc ccgtgcaccg 3120
gaacggtggc catcagggac cattaccgtc agggtttatg acgatcagcc gtttgaccgg 3180
cagattgtta ttccggcggt ggcattcagc ggcgctaaac atgagagaga gcatactgat 3240
atttactcct catgccgtct gatagtgcgg aaaaacggtg ctgaaattta taaccgtacc 3300
gcgctggata atacgctgat ttacagtggc gttattgata tgcctgccgg tcacggtcac 3360
atgacgctgg agttttcggt gtcagcatgg ctggtgaata actggtatcc cacagcaagt 3420
atcagcgatt tgctggttgt ggtgatgaag aaagccaccg caggcatcag tatcagc 3477
<210> 27
<211> 3393
<212> DNA
<213> 人工序列
<220>
<223> 编码1A2的核酸
<400> 27
atgggtaaag gaagcagtaa ggggcatacc ccgcgcgaag cgaaggacaa cctgaagtcc 60
acgcagttgc tgagtgtgat cgatgccatc agcgaagggc cgattgaagg tccggtggat 120
ggcttaaaaa gcgtgctgct gaacagtacg ccggtgctgg acactgaggg gaataccaac 180
atatccggtg tcacggtggt gttccgggct ggtgagcagg agcagactcc gccggaggga 240
tttgaatcct ccggctccga gacggtgctg ggtacggaag tgaaatatga cacgccgatc 300
acccgcacca ttacgtctgc aaacatcgac cgtctgcgct ttaccttcgg tgtacaggca 360
ctggtggaaa ccacctcaaa gggtgacagg aatccgtcgg aagtccgcct gctggttcag 420
atacaacgta acggtggctg ggtgacggaa aaagacatca ccattaaggg caaaaccacc 480
tcgcagtatc tggcctcggt ggtgatgggt aacctgccgc cgcgcccgtt taatatccgg 540
atgcgcagga tgacgccgga cagcaccaca gaccagctgc agaacaaaac gctctggtcg 600
tcatacactg aaatcatcga tgtgaaacag tgctacccga acacggcact ggtcggcgtg 660
caggtggact cggagcagtt cggcagccag caggtgagcc gtaattatca tctgcgcggg 720
cgtattctgc aggtgccgtc gaactataac ccgcagacgc ggcaatacag cggtatctgg 780
gacggaacgt ttaaaccggc atacagcaac aacatggcct ggtgtctgtg ggatatgctg 840
acccatccgc gctacggcat ggggaaacgt cttggtgcgg cggatgtgga taaatgggcg 900
ctgtatgtca tcggccagta ctgcgaccag tcagtgccgg acggctttgg cggcacggag 960
ccgcgcatca cctgtaatgc gtacctgacc acacagcgta aggcgtggga tgtgctcagc 1020
gatttctgct cggcgatgcg ctgtatgccg gtatggaacg ggcagacgct gacgttcgtg 1080
caggaccgac cgtcggataa gacgtggacc tataaccgca gtaatgtggt gatgccggat 1140
gatggcgcgc cgttccgcta cagcttcagc gccctgaagg accgccataa tgccgttgag 1200
gtgaactgga ttgacccgaa caacggctgg gagacggcga cagagcttgt tgaagatacg 1260
caggccattg cccgttacgg tcgtaatgtt acgaagatgg atgcctttgg ctgtaccagc 1320
cgggggcagg cacaccgcgc cgggctgtgg ctgattaaaa cagaactgct ggaaacgcag 1380
accgtggatt tcagcgtcgg cgcagaaggg cttcgccatg taccgggcga tgttattgaa 1440
atctgcgatg atgactatgc cggtatcagc accggtggtc gtgtgctggc ggtgaacagc 1500
cagacccgga cgctgacgct cgaccgtgaa atcacgctgc catcctccgg taccgcgctg 1560
ataagcctgg ttgacggaag tggcaatccg gtcagcgtgg aggttcagtc cgtcaccgac 1620
ggcgtgaagg taaaagtgag ccgtgttcct gacggtgttg ctgaatacag cgtatgggag 1680
ctgaagctgc cgacgctgcg ccagcgactg ttccgctgcg tgagtatccg tgagaacgac 1740
gacggcacgt atgccatcac cgccgtgcag catgtgccgg aaaaagaggc catcgtggat 1800
aacggggcgc actttgacgg cgaacagagt ggcacggtga atggtgtcac gccgccagcg 1860
gtgcagcacc tgaccgcaga agtcactgca gacagcgggg aatatcaggt gctggcgcga 1920
tgggacacac cgaaggtggt gaagggcgtg agtttcctgc tccgtctgac cgtaacagcg 1980
gacgacggca gtgagcggct ggtcagcacg gcccggacga cggaaaccac ataccgcttc 2040
acgcaactgg cgctggggaa ctacaggctg acagtccggg cggtaaatgc gtgggggcag 2100
cagggcgatc cggcgtcggt atcgttccgg attgccgcac cggcagcacc gtcgaggatt 2160
gagctgacgc cgggctattt tcagataacc gccacgccgc atcttgccgt ttatgacccg 2220
acggtacagt ttgagttctg gttctcggaa aagcagattg cggatatcag acaggttgaa 2280
accagcacgc gttatcttgg tacggcgctg tactggatag ccgccagtat caatatcaaa 2340
ccgggccatg attattactt ttatatccgc agtgtgaaca ccgttggcaa atcggcattc 2400
gtggaggccg tcggtcgggc gagcgatgat gcggaaggtt acctggattt tttcaaaggc 2460
aagataaccg aatcccatct cggcaaggag ctgctggaaa aagtcgagct gacggaggat 2520
aacgccagca gactggagga gttttcgaaa gagtggaagg atgccagtga taagtggaat 2580
gccatgtggg ctgtcaaaat tgagcagacc aaagacggca aacattatgt cgcgggtatt 2640
ggcctcagca tggaggacac ggaggaaggc aaactgagcc agtttctggt tgccgccaat 2700
cgtatcgcat ttattgaccc ggcaaacggg aatgaaacgc cgatgtttgt ggcgcagggc 2760
aaccagatat tcatgaacga cgtgttcctg aagcgcctga cggcccccac cattaccagc 2820
ggcggcaatc ctccggcctt ttccctgaca ccggacggaa agctgaccgc taaaaatgcg 2880
gatatcagcg gtaacgtgaa tgcgaactcc gggacgctca acaacgtcac gattaacgag 2940
aactgtcggg ttctgggaaa attgtccgcg aaccagattg aaggcgatct cgttaaaaca 3000
gtgggcaaag ctttcccccg ggactcccgt gcaccggagc ggtggccatc aggaaccatt 3060
accgtcaggg tttatgacga tcagccgttt gaccggcaga ttgttattcc ggcggtggca 3120
ttcagcggcg ctaaacatga gaaagagcat actgatattt actcctcatg ccgtctgata 3180
gtgcggaaaa acggtgctga aatttataac cgtaccgcgc tggataatac gctgatttac 3240
agtggcgtta ttgatatgcc tgccggtcac ggtcacatga cactggagtt ttcggtgtca 3300
gcatggctgg taaataactg gtatcccaca gcaagtatca gcgatttgct ggttgtggtg 3360
atgaagaaag ccactgcagg catcacgatt agc 3393
<210> 28
<211> 2325
<212> DNA
<213> 埃希氏菌属噬菌体λ(细菌噬菌体λ)
<400> 28
atggcagtaa agatttcagg agtcctgaaa gacggcacag gaaaaccggt acagaactgc 60
accattcagc tgaaagccag acgtaacagc accacggtgg tggtgaacac ggtgggctca 120
gagaatccgg atgaagccgg gcgttacagc atggatgtgg agtacggtca gtacagtgtc 180
atcctgcagg ttgacggttt tccaccatcg cacgccggga ccatcaccgt gtatgaagat 240
tcacaaccgg ggacgctgaa tgattttctc tgtgccatga cggaggatga tgcccggccg 300
gaggtgctgc gtcgtcttga actgatggtg gaagaggtgg cgcgtaacgc gtccgtggtg 360
gcacagagta cggcagacgc gaagaaatca gccggcgatg ccagtgcatc agctgctcag 420
gtcgcggccc ttgtgactga tgcaactgac tcagcacgcg ccgccagcac gtccgccgga 480
caggctgcat cgtcagctca ggaagcgtcc tccggcgcag aagcggcatc agcaaaggcc 540
actgaagcgg aaaaaagtgc cgcagccgca gagtcctcaa aaaacgcggc ggccaccagt 600
gccggtgcgg cgaaaacgtc agaaacgaat gctgcagcgt cacaacaatc agccgccacg 660
tctgcctcca ccgcggccac gaaagcgtca gaggccgcca cttcagcacg agatgcggtg 720
gcctcaaaag aggcagcaaa atcatcagaa acgaacgcat catcaagtgc cggtcgtgca 780
gcttcctcgg caacggcggc agaaaattct gccagggcgg caaaaacgtc cgagacgaat 840
gccaggtcat ctgaaacagc agcggaacgg agcgcctctg ccgcggcaga cgcaaaaaca 900
gcggcggcgg ggagtgcgtc aacggcatcc acgaaggcga cagaggctgc gggaagtgcg 960
gtatcagcat cgcagagcaa aagtgcggca gaagcggcgg caatacgtgc aaaaaattcg 1020
gcaaaacgtg cagaagatat agcttcagct gtcgcgcttg aggatgcgga cacaacgaga 1080
aaggggatag tgcagctcag cagtgcaacc aacagcacgt ctgaaacgct tgctgcaacg 1140
ccaaaggcgg ttaaggtggt aatggatgag actaatcgta aggcacctct ggacagtccg 1200
gcactgaccg gaacgccaac agcaccaacc gcgctcaggg gaacaaacaa tacccagatt 1260
gcgaacaccg cttttgtact ggccgcgatt gcagatgtta tcgacgcgtc acctgacgca 1320
ctgaatacgc tgaatgaact ggccgcagcg ctcgggaatg atccagattt tgctaccacc 1380
atgactaacg cgcttgcggg taaacaaccg aagaatgcga cactgacggc gctggcaggg 1440
ctttccacgg cgaaaaataa attaccgtat tttgcggaaa atgatgccgc cagcctgact 1500
gaactgactc aggttggcag ggatattctg gcaaaaaatt ccgttgcaga tgttcttgaa 1560
taccttgggg ccggtgagaa ttcggccttt ccggcaggtg cgccgatccc gtggccatca 1620
gatatcgttc cgtctggcta cgtcctgatg caggggcagg cgtttgacaa atcagcctac 1680
ccaaaacttg ctgtcgcgta tccatcgggt gtgcttcctg atatgcgagg ctggacaatc 1740
aaggggaaac ccgccagcgg tcgtgctgta ttgtctcagg aacaggatgg aattaagtcg 1800
cacacccaca gtgccagtgc atccggtacg gatttgggga cgaaaaccac atcgtcgttt 1860
gattacggga cgaaaacaac aggcagtttc gattacggca ccaaatcgac gaataacacg 1920
ggggctcatg ctcacagtct gagcggttca acaggggccg cgggtgctca tgcccacaca 1980
agtggtttaa ggatgaacag ttctggctgg agtcagtatg gaacagcaac cattacagga 2040
agtttatcca cagttaaagg aaccagcaca cagggtattg cttatttatc gaaaacggac 2100
agtcagggca gccacagtca ctcattgtcc ggtacagccg tgagtgccgg tgcacatgcg 2160
catacagttg gtattggtgc gcaccagcat ccggttgtta tcggtgctca tgcccattct 2220
ttcagtattg gttcacacgg acacaccatc accgttaacg ctgcgggtaa cgcggaaaac 2280
accgtcaaaa acattgcatt taactatatt gtgaggcttg cataa 2325
<210> 29
<211> 585
<212> DNA
<213> 埃希氏菌属噬菌体λ(细菌噬菌体λ)
<400> 29
atggcattca gaatgagtga acaaccacgg accataaaaa tttataatct gctggccgga 60
actaatgaat ttattggtga aggtgacgca tatattccgc ctcataccgg tctgcctgca 120
aacagtaccg atattgcacc gccagatatt ccggctggct ttgtggctgt tttcaacagt 180
gatgaggcat cgtggcatct cgttgaagac catcggggta aaaccgtcta tgacgtggct 240
tccggcgacg cgttatttat ttctgaactc ggtccgttac cggaaaattt tacctggtta 300
tcgccgggag gggaatatca gaagtggaac ggcacagcct gggtgaagga tacggaagca 360
gaaaaactgt tccggatccg ggaggcggaa gaaacaaaaa aaagcctgat gcaggtagcc 420
agtgagcata ttgcgccgct tcaggatgct gcagatctgg aaattgcaac gaaggaagaa 480
acctcgttgc tggaagcctg gaagaagtat cgggtgttgc tgaaccgtgt tgatacatca 540
actgcacctg atattgagtg gcctgctgtc cctgttatgg agtaa 585
<210> 30
<211> 3585
<212> DNA
<213> 人工序列
<220>
<223> 编码STF λ-WW11.2的核酸
<400> 30
atggcagtaa agatttcagg agtcctgaaa gacggcacag gaaaaccggt acagaactgc 60
accattcagc tgaaagccag acgtaacagc accacggtgg tggtgaacac ggtgggctca 120
gagaatccgg atgaagccgg gcgttacagc atggatgtgg agtacggtca gtacagtgtc 180
atcctgcagg ttgacggttt tccaccatcg cacgccggga ccatcaccgt gtatgaagat 240
tcacaaccgg ggacgctgaa tgattttctc tgtgccatga cggaggatga tgcccggccg 300
gaggtgctgc gtcgtcttga actgatggtg gaagaggtgg cgcgtaacgc gtccgtggtg 360
gcacagagta cggcagacgc gaagaaatca gccggcgatg ccagtgcatc agctgctcag 420
gtcgcggccc ttgtgactga tgcaactgac tcagcacgcg ccgccagcac gtccgccgga 480
caggctgcat cgtcagctca ggaagcgtcc tccggcgcag aagcggcatc agcaaaggcc 540
actgaagcgg aaaaaagtgc cgcagccgca gagtcctcaa aaaacgcggc ggccaccagt 600
gccggtgcgg cgaaaacgtc agaaacgaat gctgcagcgt cacaacaatc agccgccacg 660
tctgcctcca ccgcggccac gaaagcgtca gaggccgcca cttcagcacg agatgcggtg 720
gcctcaaaag aggcagcaaa atcatcagaa acgaacgcat catcaagtgc cggtcgtgca 780
gcttcctcgg caacggcggc agaaaattct gccagggcgg caaaaacgtc cgagacgaat 840
gccaggtcat ctgaaacagc agcggaacgg agcgcctctg ccgcggcaga cgcaaaaaca 900
gcggcggcgg ggagtgcgtc aacggcatcc acgaaggcga cagaggctgc gggaagtgcg 960
gtatcagcat cgcagagcaa aagtgcggca gaagcggcgg caatacgtgc aaaaaattcg 1020
gcaaaacgtg cagaagatat agcttcagct gtcgcgcttg aggatgcgga cacaacgaga 1080
aaggggatag tgcagctcag cagtgcaacc aacagcacgt ctgaaacgct tgctgcaacg 1140
ccaaaggcgg ttaaggtggt aatggatgag actaatcgta aggcacctct ggacagtccg 1200
gcactgaccg gaacgccaac agcaccaacc gcgctcaggg gaacaaacaa tacccagatt 1260
gcgaacaccg cttttgtact ggccgcgatt gcagatgtta tcgacgcgtc acctgacgca 1320
ctgaatacgc tgaatgaact ggccgcagcg ctcgggaatg atccagattt tgctaccacc 1380
atgactaacg cgcttgcggg taaacaaccg aagaatgcga cactgacggc gctggcaggg 1440
ctttccacgg cgaaaaataa attaccgtat tttgcggaaa atgatgccgc cagcctgact 1500
gaactgactc aggttggcag ggatattctg gcaaaaaatt ccgttgcaga tgttcttgaa 1560
taccttgggg ccggtgagaa ttcggctaag caggatggcc tgagtctaat tggtcagtgt 1620
aatagtattg ctgatttaag aaacgtagaa ccagttatgg atggtcaacg cattcttgtt 1680
aaacagcata ctgctggaac aggtaaaggt ggtggcacat tccaggcaaa gctttctggg 1740
gtaggtttaa cagatgataa tggtgtaacc gttaagacgg ttgggggtgc agcatgggtt 1800
cgtgttggag cagaccgagt taacccatac atgtatggtg cacttggttc cggtaatgat 1860
gataccttag cagtacaggc atgtcttaat agtggtaaag ctaccaatat tacagatgtt 1920
caccatgttt ctaacgttac aatgaataag agcagtgcct ctatttatgg ttctggattg 1980
cactatacca gactacatca actacctgct gctgtaggtt ctttgcttac tattgcagat 2040
acctgctcat tgactgttat tgatagtctt gggctgtatg gcacgggtta taagcagggt 2100
actgctttta ccacaggtac tcgcggcatt gatgtactaa ccccaactgg tttatccaat 2160
aactacccag accatactac ttcagaccca cgcagagatt tggttattac taaggttcat 2220
attgcaggtt ttgatgagta tggccttaat gtggactctg gtaactttag cgttactaca 2280
gagtctgtat tgattaacca cattaaacag gttggtgcac gttgtgccac tactgactgg 2340
acttggacaa acatccagat taatacctgc ggtaaacaat gtcttatttt ggatggctgt 2400
ggcaatggtc gtatcatcgg aggtaagttt atctgggcca actggttacc atatggtgca 2460
tccggtcagt ttccgggtat taccatcaat aacagtcaaa acatggttat caacggtatt 2520
gaggtgcagg actgtggtgg taatggtatt gagtttactg atagctactc aatcagcatg 2580
aatggattga atactaaccg taacggtatt aactctacgg cagaattcta taacctggtg 2640
ttcaatcgtt ctgatgtaga aatcaatggt tttgttggtc ttaactataa agttaatagt 2700
ggctcaccag acaattctag ctcaggcaac cttaagttct tgtcgagtga ttgtaatgta 2760
actcttaatg gaaaacttga gacaggctat atgggtatag agttcattgg cgatactcgt 2820
gtaattcagc caacgtcttc ttacattaaa cttaacggtc tggttaacta tgctggttct 2880
ggtattcaga ctattaatga agtacctact tttgatggag ttagtactac tcctgtatac 2940
gtaccaattt cttctgttgt tgggcagacc aatggattac gcctgtctca agctaacaaa 3000
gacaaggtta tttatactcg taaggttggg ccagaaggtg taacaatggc tgctgttatt 3060
actccaacaa ttgggggggc agagatattt aacctcatgg ctattggtac aggttttagc 3120
tctgcaagta acagtctgta tttccagtta gaaatagctg ctgatggttc tcagaatgtg 3180
tctttacttc tgagtgggga tggtactacg cagattctgc ctggtacttt acctgctgca 3240
cttaagttac aatccggcga accgtatcat gtagctttgg gggctaaggc tggatacttc 3300
tggtggagta ttttaaatct caatactggt aagcgtatcc gtcgttcctt ccgaggtgct 3360
tacttaccta aaccattcgc ttctatcttt ggtttagtca gttctccagt attcttctct 3420
ggggcaggta ttggtgattc aggatgctct ggtgttggtg ccaagattta tcttggttcc 3480
ttctctgacg agaatgatta tgtatcctct cgttattata gtttggttaa cccagttgac 3540
ccaactaaga tgtatagctt ccgtatatta gacagtacta tttaa 3585
<210> 31
<211> 2274
<212> DNA
<213> 人工序列
<220>
<223> 编码STF λ-75的核酸
<400> 31
atggcagtaa agatttcagg agtcctgaaa gacggcacag gaaaaccggt acagaactgc 60
accattcagc tgaaagccag acgtaacagc accacggtgg tggtgaacac ggtgggctca 120
gagaatccgg atgaagccgg gcgttacagc atggatgtgg agtacggtca gtacagtgtc 180
atcctgcagg ttgacggttt tccaccatcg cacgccggga ccatcaccgt gtatgaagat 240
tcacaaccgg ggacgctgaa tgattttctc tgtgccatga cggaggatga tgcccggccg 300
gaggtgctgc gtcgtcttga actgatggtg gaagaggtgg cgcgtaacgc gtccgtggtg 360
gcacagagta cggcagacgc gaagaaatca gccggcgatg ccagtgcatc agctgctcag 420
gtcgcggccc ttgtgactga tgcaactgac tcagcacgcg ccgccagcac gtccgccgga 480
caggctgcat cgtcagctca ggaagcgtcc tccggcgcag aagcggcatc agcaaaggcc 540
actgaagcgg aaaaaagtgc cgcagccgca gagtcctcaa aaaacgcggc ggccaccagt 600
gccggtgcgg cgaaaacgtc agaaacgaat gctgcagcgt cacaacaatc agccgccacg 660
tctgcctcca ccgcggccac gaaagcgtca gaggccgcca cttcagcacg agatgcggtg 720
gcctcaaaag aggcagcaaa atcatcagaa acgaacgcat catcaagtgc cggtcgtgca 780
gcttcctcgg caacggcggc agaaaattct gccagggcgg caaaaacgtc cgagacgaat 840
gccaggtcat ctgaaacagc agcggaacgg agcgcctctg ccgcggcaga cgcaaaaaca 900
gcggcggcgg ggagtgcgtc aacggcatcc acgaaggcga cagaggctgc gggaagtgcg 960
gtatcagcat cgcagagcaa aagtgcggca gaagcggcgg caatacgtgc aaaaaattcg 1020
gcaaaacgtg cagaagatat agcttcagct gtcgcgcttg aggatgcgga cacaacgaga 1080
aaggggatag tgcagctcag cagtgcaacc aacagcacgt ctgaaacgct tgctgcaacg 1140
ccaaaggcgg ttaaggtggt aatggatgag actaatcgta aagcgccctt aaacagtcct 1200
gcgctgaccg gaacgccaac aacgccaact gcgcgacagg gaacgaataa tacccaaatc 1260
gcaagcacgg ctttcgttat ggctgcgatt gccgcccttg tagattcgtc acctgacgca 1320
ctgaatacgc tgaacgagtt agcggcggcg ctgggaaacg acccgaattt tgcgaccacc 1380
atgactaacg cgcttgcggg taagcaaccg aaagatgcca ccctgacggc gctggccggg 1440
cttgctactg cggcagacag gtttccgtat tttacgggga atgatgtcgc cagcctggca 1500
accctgacaa aagtcgggcg ggatattctt gcgaaatcga ccgttgctgc cgttatcgaa 1560
tacctcggtt tacgagaact cggcacaagc ggggagaaaa taccgttact cagtacagcg 1620
aatacctgga ccaatcgaca aacactcagc ggtggccttt ctggggaact gtccggcaat 1680
gccgctactg caacaaagct gaaaacagca cgaaaaattg ctggagttgg ttttgatggt 1740
tctagcgata tttcaattag tgccaaaaat gtcaatgcat ttgcactccg acaaacaggt 1800
aatactgtta atggtgatac atccgttgga tggaattggg atagtggtgc atataacgcc 1860
ctgattggtg gtgcatctgc attaattctt cactttaata taaatgctgg tagctgtcct 1920
gccgtacaat tccgtgtgaa ttataaaaat ggtggcattt cctacaggtc ggctcgtgat 1980
ggttatgggt ttgaattagg ttggtcagat ttctatacca cgacacgaaa accttcagcg 2040
ggagatgttg gtgcatatac gcaggcagaa tgtaactcaa ggtttattac aggtattcgc 2100
cttggcggtc tgtcatctgt tcagacatgg aatggtcccg gctggtctga caggtcaggt 2160
tatgtcgtta cgggttcagt taacggaaac cgtgatgaat taattgatac aacacaggca 2220
aggccaattc agtattgcat taatgggacg tggtataacg cggggagtat ttaa 2274
<210> 32
<211> 534
<212> DNA
<213> 人工序列
<220>
<223> 编码λ-STF75辅助蛋白的核酸
<400> 32
atgatgcact taaaaaacat tattgctggc aaccctaaaa caaaagagca ataccagcta 60
acaaagcaat ttaacatcaa atggctttat tcagatgatg gaaaaaactg gtatgaggaa 120
caaaagaatt tccagccaga cactttgaaa atggtctatg accataacgg cgttattatt 180
tgtattgaaa aggatgtttc agcaattaat ccggaaggcg caagcgtcgt tgaattacct 240
gatattacag caaatcgccg ggctgatatt tcggggaaat ggatgttcaa agatggcgtg 300
gtgataaagc gaacttatac cgaggaagag cagagacaac aagcggaaaa tgaaaagcaa 360
agcctgttgc aacttgtcag ggataaaacc cagctatggg actcacagct acggctgggc 420
atcatttccg acgagaataa gcagaaatta accgagtgga tgctctttgc gcagaaagtc 480
gaatctacag acacctccag cctgccagta acgtatcccg aacaaccaga atga 534
<210> 33
<211> 2238
<212> DNA
<213> 人工序列
<220>
<223> 编码STF λ-EB6的核酸
<400> 33
atggcagtaa agatttcagg agtcctgaaa gacggcacag gaaaaccggt acagaactgc 60
accattcagc tgaaagccag acgtaacagc accacggtgg tggtgaacac ggtgggctca 120
gagaatccgg atgaagccgg gcgttacagc atggatgtgg agtacggtca gtacagtgtc 180
atcctgcagg ttgacggttt tccaccatcg cacgccggga ccatcaccgt gtatgaagat 240
tcacaaccgg ggacgctgaa tgattttctc tgtgccatga cggaggatga tgcccggccg 300
gaggtgctgc gtcgtcttga actgatggtg gaagaggtgg cgcgtaacgc gtccgtggtg 360
gcacagagta cggcagacgc gaagaaatca gccggcgatg ccagtgcatc agctgctcag 420
gtcgcggccc ttgtgactga tgcaactgac tcagcacgcg ccgccagcac gtccgccgga 480
caggctgcat cgtcagctca ggaagcgtcc tccggcgcag aagcggcatc agcaaaggcc 540
actgaagcgg aaaaaagtgc cgcagccgca gagtcctcaa aaaacgcggc ggccaccagt 600
gccggtgcgg cgaaaacgtc agaaacgaat gctgcagcgt cacaacaatc agccgccacg 660
tctgcctcca ccgcggccac gaaagcgtca gaggccgcca cttcagcacg agatgcggtg 720
gcctcaaaag aggcagcaaa atcatcagaa acgaacgcat catcaagtgc cggtcgtgca 780
gcttcctcgg caacggcggc agaaaattct gccagggcgg caaaaacgtc cgagacgaat 840
gccaggtcat ctgaaacagc agcggaacgg agcgcctctg ccgcggcaga cgcaaaaaca 900
gcggcggcgg ggagtgcgtc aacggcatcc acgaaggcga cagaggctgc gggaagtgcg 960
gtatcagcat cgcagagcaa aagtgcggca gaagcggcgg caatacgtgc aaaaaattcg 1020
gcaaaacgtg cagaagatat agcttcagct gtcgcgcttg aggatgcgga cacaacgaga 1080
aaggggatag tgcagctcag cagtgcaacc aacagcacgt ctgaaacgct tgctgcaacg 1140
ccaaaggcgg ttaagattgc gatggataat gccaatgccc gtctggcaaa agaccggaac 1200
ggagcagata ttcccaataa gccgctgttt atccaaaacc tcggtttaca ggaaacggta 1260
aacaaggctg gtaacgccgt tcaaaagaca ggcgatacct tgtccggcgg acttactttt 1320
gaaaacgact caatccttgc ctggattcgg aatactgact gggcaaagat tggatttaaa 1380
aatgatgccg acagcgacac tgattcatac atgtggtttg aaacaggcga caacggcaat 1440
gaatatttca aatggagaag ccgccagagc accacaacaa aagacctgat gaatcttaaa 1500
tgggatgctt tgtatgttct tgtcaatgcc attgtaaatg gcgaagtcat atcaaaatca 1560
gcaaacggcc tacgtattgc ttatggtaat tacggattct ttattcgtaa tgatggttca 1620
aatacatact tcatgttgac aaactccggt gacaacatgg ggacttataa cggattaagg 1680
ccattatgga ttaataacgc tactggcgct gtttcgatgg ggcgtggtct taatgtttca 1740
ggggagacac tttcagaccg ttttgctatt aacagcagta atggtatgtg gattcagatg 1800
cgcgataaca acgctatctt tgggaaaaat atagttaaca ctgatagcgc tcaggcgtta 1860
cttcgccaga atcacgccga ccgaaagttc atgataggtg gactggggaa caagcaattt 1920
ggcatctaca tgattaataa ctcaaggaca gccaatggca ccgatggtca ggcgtacatg 1980
gataataacg gtaactggct ttgtggtgcg caagttattc ccggcaatta tggcaatttt 2040
gactcacgct atgtgagaga tgtccgactt ggcacacgtg ttgttcaatt gatggcgcgt 2100
ggtggtcgtt atgaaaaagc cggacacgca attaccggat taagaatcat tggtgaagta 2160
gatggcgatg atgaagccat cttcaggcca atacaaaaat acatcaatgg cacatggtat 2220
aacgtcgcac aggtgtaa 2238
<210> 34
<211> 528
<212> DNA
<213> 人工序列
<220>
<223> 编码λ-EB6辅助蛋白的核酸
<400> 34
atgcagcatt taaaaaatat taagtctgga aatcctaaaa cgaaagaaca atatcagcta 60
acaaagaatt ttgatgttat ctggttatgg tccgaagacg gtaaaaactg gtatgaagaa 120
gtaaataact ttcaggacga caccataaag attgtatacg acgaaaataa tattattgtt 180
gccataacca aagatgcctc aacgcttaat cccgaaggct ttagcgtcgt tgagattcca 240
gatataacag ccaatcgtcg tgccgatgat tcagggaagt ggatgtttaa ggacggagct 300
gtggttaaac ggatttatac ggcagacgag caacaacaac aggccgaatc acaaaaggcc 360
gcgttacttt ccgaagcaga aaacgttatt cagccactgg aacgcgctgt cagactgaat 420
atggcgacgg atgaggaacg cgcacgactg gagtcatggg aacgctacag tgttctggtc 480
agccgtgtgg atacggcaaa gccagaatgg ccacaaaagc ctgaataa 528
<210> 35
<211> 2274
<212> DNA
<213> 人工序列
<220>
<223> 编码STF λ-23的核酸
<400> 35
atggcagtaa agatttcagg agtcctgaaa gacggcacag gaaaaccggt acagaactgc 60
accattcagc tgaaagccag acgtaacagc accacggtgg tggtgaacac ggtgggctca 120
gagaatccgg atgaagccgg gcgttacagc atggatgtgg agtacggtca gtacagtgtc 180
atcctgcagg ttgacggttt tccaccatcg cacgccggga ccatcaccgt gtatgaagat 240
tcacaaccgg ggacgctgaa tgattttctc tgtgccatga cggaggatga tgcccggccg 300
gaggtgctgc gtcgtcttga actgatggtg gaagaggtgg cgcgtaacgc gtccgtggtg 360
gcacagagta cggcagacgc gaagaaatca gccggcgatg ccagtgcatc agctgctcag 420
gtcgcggccc ttgtgactga tgcaactgac tcagcacgcg ccgccagcac gtccgccgga 480
caggctgcat cgtcagctca ggaagcgtcc tccggcgcag aagcggcatc agcaaaggcc 540
actgaagcgg aaaaaagtgc cgcagccgca gagtcctcaa aaaacgcggc ggccaccagt 600
gccggtgcgg cgaaaacgtc agaaacgaat gctgcagcgt cacaacaatc agccgccacg 660
tctgcctcca ccgcggccac gaaagcgtca gaggccgcca cttcagcacg agatgcggtg 720
gcctcaaaag aggcagcaaa atcatcagaa acgaacgcat catcaagtgc cggtcgtgca 780
gcttcctcgg caacggcggc agaaaattct gccagggcgg caaaaacgtc cgagacgaat 840
gccaggtcat ctgaaacagc agcggaacgg agcgcctctg ccgcggcaga cgcaaaaaca 900
gcggcggcgg ggagtgcgtc aacggcatcc acgaaggcga cagaggctgc gggaagtgcg 960
gtatcagcat cgcagagcaa aagtgcggca gaagcggcgg caatacgtgc aaaaaattcg 1020
gcaaaacgtg cagaagatat agcttcagct gtcgcgcttg aggatgcgga cacaacgaga 1080
aaggggatag tgcagctcag cagtgcaacc aacagcacgt ctgaaacgct tgctgcaacg 1140
ccaaaggcgg ttaaggtggt aatggatgag actaatcgta aagccccatt aaacagcccg 1200
gcgctgaccg gaacgccaac aacaccaact gcgcgacagg gaacgaataa tacccaaatc 1260
gcaagcacgg ctttcgttat ggctgcgatt gccgcccttg tagattcgtc acctgatgca 1320
ctgaacacgc tgaacgagct ggctgcggcg ttgggcaacg acccgaattt tgcgaccacc 1380
atgactaacg cgcttgcggg taagcaaccg aaagatgcca ccctgacggc gctggccggg 1440
cttgctactg cggcagacag gtttccgtat tttacgggga atgatgtcgc cagcctggca 1500
accctgacaa aagtcgggcg ggatattctt gcgaaatcga ccgttgctgc cgttatcgaa 1560
tacctcggtt tacgagaact cggcacaagc ggggagaaaa taccgttact cagtacagcg 1620
aatacctgga ccaatcgaca aacattcagc ggtggccttt ctgggggact gtccggcaat 1680
gccgctactg caacaaagct gaaaacagca cgaaaaattg ctggagttgg ttttgatggt 1740
tctagcgata tttcaattag tgccaaaaat gtcaatgcat ttgcactccg acaaacaggt 1800
aatactgtta atggtgatac atccgttgga tggaattggg atagtggtgc atataacgcc 1860
ctgattggtg gtgcatctgc attaattctt cactttaata taaatgctgg tagctgtcct 1920
gccgtacaat tccgtgtgaa ttataaaaat ggtggcattt cctacaggtc ggctcgtgat 1980
ggttatgggt ttgaattagg ttggtcagat ttctatacca cgacacgaaa accttcagcg 2040
ggagatgttg gtgcatatac gcgggcagaa tgtaactcaa ggtttattac aggtattcgc 2100
cttggcggtc tgtcatctgt tcagacatgg aatggtcccg gctggtctga caggtcaggt 2160
tatgtcgtta cgggttcagt taacggaaac cgtgatgaat taattgatac aacacaggca 2220
aggccaattc agtattgcat taatgggacg tggtataacg cggggagtat ttaa 2274
<210> 36
<211> 531
<212> DNA
<213> 人工序列
<220>
<223> 编码λ-STF23辅助蛋白的核酸
<400> 36
atgatgcact taaaaaacat tactgctggc aaccctaaaa caaaagagca ataccagcta 60
acaaagcaat ttaacatcaa atggctttat tcagatgatg gaaaaaactg gtatgaggaa 120
caaaagaatt tccagccaga cactttgaaa atggtctatg accataacgg cgttattatt 180
tgtattgaaa aggatgtttc agcaattaat ccggaaggcg caagcgtcgt tgaattacct 240
gatattacag caaatcgccg ggctgatatt tcggggaaat ggttgttcaa agatggcgta 300
gtgataaagc gaacttatac cgaggaagag cagaggcaac aagcggaaaa tgaaaagcaa 360
agcctgttgc aacttgtcag ggataaaacc cagctatggg actcacagct acggctgggc 420
atcatttccg acgagaataa acaaaaatta accgagtgga tgctctatgc gcagaaagtc 480
gaatctacag acacctccag cctgccagta acgtttcccg aacaaccaga a 531
<210> 37
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 插入位点SAGDAS
<400> 37
Ser Ala Gly Asp Ala Ser
1 5
<210> 38
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 插入位点ADAKKS
<400> 38
Ala Asp Ala Lys Lys Ser
1 5
<210> 39
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 插入位点MDETNR
<400> 39
Met Asp Glu Thr Asn Arg
1 5
<210> 40
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 插入位点SASAAA
<400> 40
Ser Ala Ser Ala Ala Ala
1 5
<210> 41
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 插入位点GAGENS
<400> 41
Gly Ala Gly Glu Asn Ser
1 5
<210> 42
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 插入点1图7
<400> 42
Tyr Leu Asp Phe Phe Lys
1 5
<210> 43
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 插入点2图7
<400> 43
Asn Ala Asp Ile Ser Gly
1 5
<210> 44
<211> 1186
<212> PRT
<213> 人工序列
<220>
<223> 嵌合STF-V10
<400> 44
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Val Val Met Asp Glu Thr Asn Arg Lys Ala Pro Leu Asp Ser Pro
385 390 395 400
Ala Leu Thr Gly Thr Pro Thr Ala Pro Thr Ala Leu Arg Gly Thr Asn
405 410 415
Asn Thr Gln Ile Ala Asn Thr Ala Phe Val Leu Ala Ala Ile Ala Asp
420 425 430
Val Ile Asp Ala Ser Pro Asp Ala Leu Asn Thr Leu Asn Glu Leu Ala
435 440 445
Ala Ala Leu Gly Asn Asp Pro Asp Phe Ala Thr Thr Met Thr Asn Ala
450 455 460
Leu Ala Gly Lys Gln Pro Lys Asn Ala Thr Leu Thr Ala Leu Ala Gly
465 470 475 480
Leu Ser Thr Ala Lys Asn Lys Leu Pro Tyr Phe Ala Glu Asn Asp Ala
485 490 495
Ala Ser Leu Thr Glu Leu Thr Gln Val Gly Arg Asp Ile Leu Ala Lys
500 505 510
Asn Ser Val Ala Asp Val Leu Glu Tyr Leu Gly Ala Gly Glu Asn Ser
515 520 525
Ala Ala Asn Asp Gly Phe Lys Phe Ile Gly Gln Cys Pro Asp Ile Leu
530 535 540
Thr Leu Arg Thr Ile Glu Pro Glu Lys Asn Gly Gln Arg Ile Thr Leu
545 550 555 560
Arg Gln His Thr Ile Gly Thr Gly Leu Gly Gly Gly Val Phe Arg Ala
565 570 575
Val Leu Asp Gly Thr Gly Tyr Thr Asp Asp Asp Gly Val Val Ile Lys
580 585 590
Thr Ala Gly Gly Ser Val Trp Leu Arg Val Asn Ala Asp Lys Val Asn
595 600 605
Pro Phe Met Phe Gly Ala Thr Gly Val Ala Asp Asp Thr Ala Ala Leu
610 615 620
Gln Lys Met Leu Glu Cys Gly Arg Ala Ala Glu Leu Gly Thr Asn Val
625 630 635 640
Trp Lys Ala Ser Asn Leu Glu Leu Asn Asn Lys Ser Cys Ser Leu Ser
645 650 655
Gly Ser Gly Leu His Val Ser Arg Ile Glu Gln Ile Ser Gly Ala Thr
660 665 670
Gly Ala Leu Leu Thr Ile Thr Gln Asp Cys Ser Leu Ile Tyr Leu Ser
675 680 685
Asp Cys Gly Leu Tyr Gly Asp Gly Ile Thr Ala Gly Thr Ser Gly Val
690 695 700
Thr Met Glu Thr Gly Asn Pro Gly Gly Ala Pro Ser Tyr Pro Phe Asn
705 710 715 720
Thr Ala Pro Asp Val Arg Arg Asp Leu Tyr Ile Ser Asn Val His Ile
725 730 735
Thr Gly Phe Asp Glu Leu Gly Phe Asp Tyr Pro Glu Thr Asn Phe Ser
740 745 750
Val Ser Thr His Gly Leu Phe Ile Arg Asn Ile Lys Lys Thr Gly Ala
755 760 765
Lys Ile Gly Thr Thr Asp Phe Thr Trp Thr Asn Leu Gln Ile Asp Thr
770 775 780
Cys Gly Gln Glu Cys Leu Val Leu Asp Gly Ala Gly Asn Cys Arg Ile
785 790 795 800
Ile Gly Ala Lys Leu Ile Trp Ala Gly Ser Glu Asn Glu Thr Pro Tyr
805 810 815
Ser Gly Leu Arg Ile Ser Asn Ser Gln Asn Val Asn Met Thr Gly Val
820 825 830
Glu Leu Gln Asp Cys Ala Tyr Asp Gly Leu Tyr Ile Lys Asn Ser Thr
835 840 845
Val Ala Ile Ser Gly Leu Asn Thr Asn Arg Asn Ser Ala Ser Ser Asn
850 855 860
Leu Ser Tyr His Asn Met Val Phe Glu Asn Ser Ile Val Thr Val Asp
865 870 875 880
Gly Tyr Val Cys Arg Asn Tyr Ala Ala Thr Ser Leu Tyr Asp Leu Asn
885 890 895
Ser Gln Ala Gly Asn Val Arg Cys Ile Gly Ser Asp Ser Thr Val Leu
900 905 910
Ile Asn Gly Ile Tyr Glu Ser Glu Val Asn Ser Glu Arg Leu Met Gly
915 920 925
Asp Asn Asn Leu Ile Gln Pro Tyr Ser Gly Asp Leu Ile Ile Asn Gly
930 935 940
Leu Lys Asn Tyr Tyr Thr Tyr Thr Gly Ser Val Lys Asn Asn Ile Pro
945 950 955 960
Thr Phe Asp Gly Val Val Thr Thr Ala Thr Tyr Val Ser Ala Pro Ser
965 970 975
Ile Leu Gly Gln Gly Asn Met Leu Lys Leu Thr Gln Ser Asn Lys Asp
980 985 990
Lys Leu Leu Phe Ser Asp Lys Val Ser Arg His Gly Cys Thr Ile Gly
995 1000 1005
Leu Val Leu Ile Pro Ser Phe Thr Gly Ala Thr Thr Met Thr Ala
1010 1015 1020
Phe Thr Leu Gly Ser Gly Tyr Ser Pro Ser Gly Asn Ser Ala Val
1025 1030 1035
Met Gln Phe Ile Val Asn Ser Ser Gly Val Gln Thr Ile Ala Ile
1040 1045 1050
Leu Leu Ser Gly Asp Gly Ile Thr Gln Thr Leu Thr Ser Asp Leu
1055 1060 1065
Thr Thr Glu Gln Ala Leu Ala Ser Gly Gly Val Tyr His Phe Ala
1070 1075 1080
Met Gly Phe Ala Pro Gly Arg Leu Trp Trp Ser Ile Ile Asp Ile
1085 1090 1095
Asn Thr Gly Arg Arg Ile Arg Arg Ala Tyr Arg Gln Pro Asp Leu
1100 1105 1110
His Ala Ala Phe Asn Ser Ile Phe Asn Ser Gly Thr Ser Ser Ile
1115 1120 1125
Thr Ala Phe Ser Gly Pro Leu Ala Gly Asp Ile Ala Cys Glu Gly
1130 1135 1140
Ala Gly Ser His Val Tyr Val Gly Gly Phe Ser Ser Glu Ser Asp
1145 1150 1155
Tyr Ala Ala Ser Arg Met Tyr Gly Leu Phe Thr Pro Val Asp Leu
1160 1165 1170
Asp Lys Gln Tyr Ser Phe Arg Thr Leu Asn Gly Asn Ile
1175 1180 1185
<210> 45
<211> 1186
<212> PRT
<213> 人工序列
<220>
<223> 嵌合STF-V10f
<400> 45
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Val Val Met Asp Glu Thr Asn Arg Lys Ala Pro Leu Asp Ser Pro
385 390 395 400
Ala Leu Thr Gly Thr Pro Thr Ala Pro Thr Ala Leu Arg Gly Thr Asn
405 410 415
Asn Thr Gln Ile Ala Asn Thr Ala Phe Val Leu Ala Ala Ile Ala Asp
420 425 430
Val Ile Asp Ala Ser Pro Asp Ala Leu Asn Thr Leu Asn Glu Leu Ala
435 440 445
Ala Ala Leu Gly Asn Asp Pro Asp Phe Ala Thr Thr Met Thr Asn Ala
450 455 460
Leu Ala Gly Lys Gln Pro Lys Asn Ala Thr Leu Thr Ala Leu Ala Gly
465 470 475 480
Leu Ser Thr Ala Lys Asn Lys Leu Pro Tyr Phe Ala Glu Asn Asp Ala
485 490 495
Ala Ser Leu Thr Glu Leu Thr Gln Val Gly Arg Asp Ile Leu Ala Lys
500 505 510
Asn Ser Val Ala Asp Val Leu Glu Tyr Leu Gly Ala Gly Glu Asn Ser
515 520 525
Ala Ala Asn Asp Gly Phe Ala Phe Ile Gly Gln Cys Pro Asp Ile Leu
530 535 540
Thr Leu Arg Thr Ile Glu Pro Glu Lys Asn Gly Gln Arg Ile Thr Leu
545 550 555 560
Arg Gln His Thr Ile Gly Thr Gly Leu Gly Gly Gly Val Phe Arg Ala
565 570 575
Val Leu Asp Gly Thr Gly Tyr Thr Asp Asp Asp Gly Val Val Ile Lys
580 585 590
Thr Ala Gly Gly Ser Val Trp Leu Arg Val Asn Ala Asp Lys Val Asn
595 600 605
Pro Phe Met Phe Gly Ala Thr Gly Val Ala Asp Asp Thr Ala Ala Leu
610 615 620
Gln Lys Met Leu Glu Cys Gly Arg Ala Ala Glu Leu Gly Thr Asn Val
625 630 635 640
Trp Lys Ala Ser Asn Leu Glu Leu Asn Asn Lys Ser Cys Ser Leu Ser
645 650 655
Gly Ser Gly Leu His Val Ser Arg Ile Glu Gln Ile Ser Gly Ala Thr
660 665 670
Gly Ala Leu Leu Thr Ile Thr Gln Asp Cys Ser Leu Ile Tyr Leu Ser
675 680 685
Asp Cys Gly Leu Tyr Gly Asp Gly Ile Thr Ala Gly Thr Ser Gly Val
690 695 700
Thr Met Glu Thr Gly Asn Pro Gly Gly Ala Pro Ser Tyr Pro Phe Asn
705 710 715 720
Thr Ala Pro Asp Val Arg Arg Asp Leu Tyr Ile Ser Asn Val His Ile
725 730 735
Thr Gly Phe Asp Glu Leu Gly Phe Asp Tyr Pro Glu Thr Asn Phe Ser
740 745 750
Val Ser Thr His Gly Leu Phe Ile Arg Asn Ile Lys Lys Thr Gly Ala
755 760 765
Lys Ile Gly Thr Thr Asp Phe Thr Trp Thr Asn Leu Gln Ile Asp Thr
770 775 780
Cys Gly Gln Glu Cys Leu Val Leu Asp Gly Ala Gly Asn Cys Arg Ile
785 790 795 800
Ile Gly Ala Lys Leu Ile Trp Ala Gly Ser Glu Asn Glu Thr Pro Tyr
805 810 815
Ser Gly Leu Arg Ile Ser Asn Ser Gln Asn Val Asn Met Thr Gly Val
820 825 830
Glu Leu Gln Asp Cys Ala Tyr Asp Gly Leu Tyr Ile Lys Asn Ser Thr
835 840 845
Val Ala Ile Ser Gly Leu Asn Thr Asn Arg Asn Ser Ala Ser Ser Asn
850 855 860
Leu Ser Tyr His Asn Met Val Phe Glu Asn Ser Ile Val Thr Val Asp
865 870 875 880
Gly Tyr Val Cys Arg Asn Tyr Ala Ala Thr Ser Leu Tyr Asp Leu Asn
885 890 895
Ser Gln Ala Gly Asn Val Arg Cys Ile Gly Ser Asp Ser Thr Val Leu
900 905 910
Ile Asn Gly Ile Tyr Glu Ser Glu Val Asn Ser Glu Arg Leu Met Gly
915 920 925
Asp Asn Asn Leu Ile Gln Pro Tyr Ser Gly Asp Leu Ile Ile Asn Gly
930 935 940
Leu Lys Asn Tyr Tyr Thr Tyr Thr Gly Ser Val Lys Asn Asn Ile Pro
945 950 955 960
Thr Phe Asp Gly Val Val Thr Thr Ala Thr Tyr Val Ser Ala Pro Ser
965 970 975
Ile Leu Gly Gln Gly Asn Met Leu Lys Leu Thr Gln Ser Asn Lys Asp
980 985 990
Lys Leu Leu Phe Ser Asp Lys Val Ser Arg His Gly Cys Thr Ile Gly
995 1000 1005
Leu Val Leu Ile Pro Ser Phe Thr Gly Ala Thr Thr Met Thr Ala
1010 1015 1020
Phe Thr Leu Gly Ser Gly Tyr Ser Pro Ser Gly Asn Ser Ala Val
1025 1030 1035
Met Gln Phe Ile Val Asn Ser Ser Gly Val Gln Thr Ile Ala Ile
1040 1045 1050
Leu Leu Ser Gly Asp Gly Ile Thr Gln Thr Leu Thr Ser Asp Leu
1055 1060 1065
Thr Thr Glu Gln Ala Leu Ala Ser Gly Gly Val Tyr His Phe Ala
1070 1075 1080
Met Gly Phe Ala Pro Gly Arg Leu Trp Trp Ser Ile Ile Asp Ile
1085 1090 1095
Asn Thr Gly Arg Arg Ile Arg Arg Ala Tyr Arg Gln Pro Asp Leu
1100 1105 1110
His Ala Ala Phe Asn Ser Ile Phe Asn Ser Gly Thr Ser Ser Ile
1115 1120 1125
Thr Ala Phe Ser Gly Pro Leu Ala Gly Asp Ile Ala Cys Glu Gly
1130 1135 1140
Ala Gly Ser His Val Tyr Val Gly Gly Phe Ser Ser Glu Ser Asp
1145 1150 1155
Tyr Ala Ala Ser Arg Met Tyr Gly Leu Phe Thr Pro Val Asp Leu
1160 1165 1170
Asp Lys Gln Tyr Ser Phe Arg Thr Leu Asn Gly Asn Ile
1175 1180 1185
<210> 46
<211> 1186
<212> PRT
<213> 人工序列
<220>
<223> 嵌合STF-V10a
<400> 46
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Val Val Met Asp Glu Thr Asn Arg Lys Ala Pro Leu Asp Ser Pro
385 390 395 400
Ala Leu Thr Gly Thr Pro Thr Ala Pro Thr Ala Leu Arg Gly Thr Asn
405 410 415
Asn Thr Gln Ile Ala Asn Thr Ala Phe Val Leu Ala Ala Ile Ala Asp
420 425 430
Val Ile Asp Ala Ser Pro Asp Ala Leu Asn Thr Leu Asn Glu Leu Ala
435 440 445
Ala Ala Leu Gly Asn Asp Pro Asp Phe Ala Thr Thr Met Thr Asn Ala
450 455 460
Leu Ala Gly Lys Gln Pro Lys Asn Ala Thr Leu Thr Ala Leu Ala Gly
465 470 475 480
Leu Ser Thr Ala Lys Asn Lys Leu Pro Tyr Phe Ala Glu Asn Asp Ala
485 490 495
Ala Ser Leu Thr Glu Leu Thr Gln Val Gly Arg Asp Ile Leu Ala Lys
500 505 510
Asn Ser Val Ala Asp Val Leu Glu Tyr Leu Gly Ala Gly Glu Asn Ser
515 520 525
Ala Ala Asn Asp Gly Ala Ala His Ile Gly Gln Cys Pro Asp Ile Leu
530 535 540
Thr Leu Arg Thr Ile Glu Pro Glu Lys Asn Gly Gln Arg Ile Thr Leu
545 550 555 560
Arg Gln His Thr Ile Gly Thr Gly Leu Gly Gly Gly Val Phe Arg Ala
565 570 575
Val Leu Asp Gly Thr Gly Tyr Thr Asp Asp Asp Gly Val Val Ile Lys
580 585 590
Thr Ala Gly Gly Ser Val Trp Leu Arg Val Asn Ala Asp Lys Val Asn
595 600 605
Pro Phe Met Phe Gly Ala Thr Gly Val Ala Asp Asp Thr Ala Ala Leu
610 615 620
Gln Lys Met Leu Glu Cys Gly Arg Ala Ala Glu Leu Gly Thr Asn Val
625 630 635 640
Trp Lys Ala Ser Asn Leu Glu Leu Asn Asn Lys Ser Cys Ser Leu Ser
645 650 655
Gly Ser Gly Leu His Val Ser Arg Ile Glu Gln Ile Ser Gly Ala Thr
660 665 670
Gly Ala Leu Leu Thr Ile Thr Gln Asp Cys Ser Leu Ile Tyr Leu Ser
675 680 685
Asp Cys Gly Leu Tyr Gly Asp Gly Ile Thr Ala Gly Thr Ser Gly Val
690 695 700
Thr Met Glu Thr Gly Asn Pro Gly Gly Ala Pro Ser Tyr Pro Phe Asn
705 710 715 720
Thr Ala Pro Asp Val Arg Arg Asp Leu Tyr Ile Ser Asn Val His Ile
725 730 735
Thr Gly Phe Asp Glu Leu Gly Phe Asp Tyr Pro Glu Thr Asn Phe Ser
740 745 750
Val Ser Thr His Gly Leu Phe Ile Arg Asn Ile Lys Lys Thr Gly Ala
755 760 765
Lys Ile Gly Thr Thr Asp Phe Thr Trp Thr Asn Leu Gln Ile Asp Thr
770 775 780
Cys Gly Gln Glu Cys Leu Val Leu Asp Gly Ala Gly Asn Cys Arg Ile
785 790 795 800
Ile Gly Ala Lys Leu Ile Trp Ala Gly Ser Glu Asn Glu Thr Pro Tyr
805 810 815
Ser Gly Leu Arg Ile Ser Asn Ser Gln Asn Val Asn Met Thr Gly Val
820 825 830
Glu Leu Gln Asp Cys Ala Tyr Asp Gly Leu Tyr Ile Lys Asn Ser Thr
835 840 845
Val Ala Ile Ser Gly Leu Asn Thr Asn Arg Asn Ser Ala Ser Ser Asn
850 855 860
Leu Ser Tyr His Asn Met Val Phe Glu Asn Ser Ile Val Thr Val Asp
865 870 875 880
Gly Tyr Val Cys Arg Asn Tyr Ala Ala Thr Ser Leu Tyr Asp Leu Asn
885 890 895
Ser Gln Ala Gly Asn Val Arg Cys Ile Gly Ser Asp Ser Thr Val Leu
900 905 910
Ile Asn Gly Ile Tyr Glu Ser Glu Val Asn Ser Glu Arg Leu Met Gly
915 920 925
Asp Asn Asn Leu Ile Gln Pro Tyr Ser Gly Asp Leu Ile Ile Asn Gly
930 935 940
Leu Lys Asn Tyr Tyr Thr Tyr Thr Gly Ser Val Lys Asn Asn Ile Pro
945 950 955 960
Thr Phe Asp Gly Val Val Thr Thr Ala Thr Tyr Val Ser Ala Pro Ser
965 970 975
Ile Leu Gly Gln Gly Asn Met Leu Lys Leu Thr Gln Ser Asn Lys Asp
980 985 990
Lys Leu Leu Phe Ser Asp Lys Val Ser Arg His Gly Cys Thr Ile Gly
995 1000 1005
Leu Val Leu Ile Pro Ser Phe Thr Gly Ala Thr Thr Met Thr Ala
1010 1015 1020
Phe Thr Leu Gly Ser Gly Tyr Ser Pro Ser Gly Asn Ser Ala Val
1025 1030 1035
Met Gln Phe Ile Val Asn Ser Ser Gly Val Gln Thr Ile Ala Ile
1040 1045 1050
Leu Leu Ser Gly Asp Gly Ile Thr Gln Thr Leu Thr Ser Asp Leu
1055 1060 1065
Thr Thr Glu Gln Ala Leu Ala Ser Gly Gly Val Tyr His Phe Ala
1070 1075 1080
Met Gly Phe Ala Pro Gly Arg Leu Trp Trp Ser Ile Ile Asp Ile
1085 1090 1095
Asn Thr Gly Arg Arg Ile Arg Arg Ala Tyr Arg Gln Pro Asp Leu
1100 1105 1110
His Ala Ala Phe Asn Ser Ile Phe Asn Ser Gly Thr Ser Ser Ile
1115 1120 1125
Thr Ala Phe Ser Gly Pro Leu Ala Gly Asp Ile Ala Cys Glu Gly
1130 1135 1140
Ala Gly Ser His Val Tyr Val Gly Gly Phe Ser Ser Glu Ser Asp
1145 1150 1155
Tyr Ala Ala Ser Arg Met Tyr Gly Leu Phe Thr Pro Val Asp Leu
1160 1165 1170
Asp Lys Gln Tyr Ser Phe Arg Thr Leu Asn Gly Asn Ile
1175 1180 1185
<210> 47
<211> 11615
<212> DNA
<213> 人工序列
<220>
<223> 有效载荷序列的实例
<400> 47
gtttgcaata agggacaagt tacgagtgta gacacgcaga attatccagc ctttagtctt 60
taggaaggca aagctattgt acgcggtagc cgtcgtagca atttaccaac tgtagaatta 120
ttggacacac gtaacaaggg cttacagttg aagtttaata aggtcacacg caaaaccgct 180
aaggaataat cgcaccgtta gcgaaagaat atttcagagc ggttagtaaa ggttgagtaa 240
agtgagattc caaagtgagc ctttataaaa agtaaagagc tataataaaa ccgtcgatcg 300
gaaaacaatc gcctgaaatc tcaagcacgt tgccctttct aacgtcgcta aggtttcgta 360
aacccgtttg attaggaaga agaataagta acccgattag gtttgagatc gcgggttatc 420
ggtttggatt aaaagtggat accagcggag tcaacgccga cgcaaacgta cagtgatcca 480
atcctgttcc acggtcaagc acaatcagct agcaagatct tggaatagag tcgttgcacc 540
gctttgattt acatgctctc cattgcacaa cattccggaa ggactggctt ctctgccatg 600
atcggataat gaaaaacatc agtatgccct gtcatttttc tttgggtgtc ctcaaataat 660
tgccctcacg ttatcgtatg tgacgcgctc atctatgctc gaagtattcc ttgttctccc 720
atcttttaat agaaagtctt taatgaacgt gtcgttacgc agtgtatgaa ctcttgtttt 780
atagggcaga ctttggcgtg gcctaagtgt gttcgataag aaggcaagga caactagctg 840
acgcgctgta atacggatat tatggcacgg ttgatacaaa cgctgatatc ctgatttgct 900
aatgtgccca acactttagt tgagtgccac gttccgacta caagttgctt caagagggga 960
atttggattt ggcaatagcc ccccgtttct acctcaagag gcgacgagta ttaaccgcgc 1020
cagctttcgg cacaagggcc aaagaagatt ccaatttctt attcccgaat aacctccgaa 1080
tccctgcggg aaaatcaccg accgaatagc ctagaagcaa gggggaacag ataggtataa 1140
ttagcttaag agagtaccag ccgtgacaac accgtagtaa ccacaaactt acgctggggc 1200
ttctttggcg gatttttaca gatactaaca aggtgatttg aagtacctta gttgaggatt 1260
taaacgcgct atccggtagt ctacaaattg ggaaataccg ttcaaagagg gctagaatta 1320
cttaaaagcc ttcacaccgc ctgcgctata cgcgcccact ctcccgttta tccgtccaag 1380
cggaagcagg gcgaacttcc gctaagatat tcttacgtgt aacgtagcta agtatcccaa 1440
atagctggcg tacgcgttga acaccgccta gaggatcggg agtcgccgga cgagcgtgtt 1500
attggggact tacgccagcg tagactacaa cgcgcccaga ttaaccctgc acgtattgcc 1560
ttgaataacg tactaatctc tccggctctc gacaatctat cgagcgactc gattatcaac 1620
gggtgtcttg cagttctaat ctcttgcccc cgcccgtaat agcctccaag tgattcaaga 1680
tagtaaaggg caagagctta ttcggcgttg aaggatagcg gactttcggt caaccacaat 1740
tccccactcg acaaaaccag ccgtgcgaag aactctgaaa gtacaagcaa cccaagaggg 1800
ctgagcctaa actcagctaa ttcctaagtg agctaaagac tcgaagtgac agctattaat 1860
aaatagagcg ggaacgtcga acggtcgtga aagtaatagt acaacgggta ttaacttact 1920
gaggatattg cttgaagctg taccgtttta ttgggtgaac gaataagatc cagcaattca 1980
gccaaagaag ctaccaattt ttagtttaag agtgtcacgt ctgacctcgc gggtggatag 2040
ccgaacgtag agcttacgag ccagcggaaa cagtagccgc aggataagta aggggagtaa 2100
gtgatcgaac gaatcagaag tgacaatata cttaggctgg atctcgtccc gtgaatccca 2160
accctcacca actacgagat aagaggtaag ccagaaatcg gcatggtggc gaccaacgac 2220
tgttcccccc ctgtaactaa tcgttccgtc aaaacctgac ttacttcaag gccaattcca 2280
agcgcaaaca ataccgtcct agttcttcgg ttaagtttcc gaagtaggag tgagcctacc 2340
tccgtttgcg tcttgttacc actgacccag ctatttactt tgtattgcct gcaatcgaat 2400
ttctgaactc tcagatagtg gggataacgg gaaagttcct atatttgcga actaacttag 2460
ccgtccacct cgaagctacc tactcacacc caccccgcgc ggggtaaata aggcactaat 2520
cccagcttag agcttgcgta gcacttagcc acaagttaat taacagttgt ctggtagttt 2580
ggcggtatta gcgagatcct agaagcaagg cagagttagt tctaacctaa agccacaaat 2640
aagacaggtt gccaaagccc gccggaaatt aaatcttgct cagttcggta acggagtttc 2700
cctcccgcgt acttaattcc caataagaaa cgcgcccaag tcctatcagg caaaattcag 2760
ccccttcccg tgttagaacg agggtaaaaa tacaagccga ttgaacaagg gttgggggct 2820
tcaaatcgtc gtttacccca ctttacaacg gagggtaagt agttcaccct atagtacgaa 2880
gcagaactat ttcgaggggc gtgcaataat cgaatcttct gcggttgact taacacgcta 2940
gggacgtgcc ctcgattcag tcgcaggtac tcctactcag actgcctcac acccagctag 3000
tcactgagcg ataaaattga cccgccctct aaggtagcga gtacgtccca aagggctccg 3060
gacagggcta tataggagag tttgatctcg ccccgacaac tgcaaccctc aactccctta 3120
gataatattg ttagccgaag ttgcacgacc cgccgtccac ggactgctct tagggtgtgg 3180
ctccttaatc tgacaacgtg caacccctat cgagggcgat tgtttctgcg aaaggtgttg 3240
tcctaatagt cgcgacattt ggcccttgta ggtgtgaaac cacttagctt cgcgccgtag 3300
tcctaaaggc ccacctattg actttgtttc gggtagcact aggaatctta acaatttgaa 3360
tttggacgtg gaacgcgtac accttgatct tcgaataatt ctagggattt ggaagtcctc 3420
tacgttgaca cacctacaat gctccaagta aatatacgaa taacgcgggc ctcgcggagc 3480
cgttccgaat cgtcacgtgt tcgtttactg ttaattggtg gcaaataagc aatatcgtag 3540
tccgtcaggc ccagccctgt tatccacggc gttatttgtc aaattgcgta gaactggatt 3600
gactgcctga caatacctaa ttatcggtac gaagtccccg aatctgtccg gctatttcac 3660
taatactttc caaacgcccc gtatccaaga agaacgaatt tatccacgct cccgtctttg 3720
ggacgaatac cgctacaagt ggacagagga tcggtacggg cctctaataa atccaacact 3780
ctacgccctc ttcaagagct agaagaacag ggtgcagttg gaaagggaat tatttcgtaa 3840
ggcgagccaa taccgtaatt aattcggaag agttaacacg attggaagta ggaatagttt 3900
ctaaccacgg ttactaatcc taataacgga acgctgtctg atagattagt gtcagcgctc 3960
actaccaaag aaaaataaaa agacgctgaa aagcgtcttt ttatttttcg gtccagtgta 4020
actcaggcaa aagcacgtaa tattcgtact caccaaacga aactcatccg gcgcatcgcg 4080
cttcttcctc cgtaagcgtc acccccatta cttaaagagt gcatgtgcat attttgttat 4140
caataaaaaa ggccgcgatt tgcggcctta ttgttcgtct tgccggatta gatagctacc 4200
ggtgctttaa tacccggatg cggatcatag ccttcgattt cgaagtcctc aaaacgataa 4260
tcgaagatgc tttccggttt gcgtttgata atcagtttcg ggagcgggcg tggctcacgg 4320
cttaattgta aatgcgtctg atccatgtga tttgagtaca ggtgagtatc cccaccagtc 4380
caaacaaagt caccaacttc cagatcacac tgctgtgcca tcatatgaac taataaggcg 4440
taggaggcaa tgttaaacgg taagcccaga aacacgtcgc aagaacgctg gtacagttgg 4500
cacgataact taccatccgc aacatagaat tgaaagaagg catgacacgg tgctaaagcc 4560
attttgtcta attcccccac gttccatgcg gacacgataa tccggcgaga gtccggatca 4620
tttttcagtt ggttaagaac ggtagtgatc tgatcaatat gccgaccatc cggcgtaggc 4680
catgcacgcc attgcttacc atacactggc cctaagtcac cgttttcatc tgcccactca 4740
tcccagatgg taacgttatt ctcgtgcagg tacgcaatgt tcgtatcgcc ttgcagaaac 4800
cataataact cgtgaataat agaacggagg tggcaacgct tggtagtgac cagcgggaaa 4860
ccgtcttgca ggttgaaacg catctgatga ccaaagatag acagcgtacc agtgccagta 4920
cgatcattct tctgagtgcc ttcgtccagc actttttgca tcagttccag atactgtttc 4980
attttagctt ccttagcttg cgaaatctcg ataactcaaa aaatagtagt gatcttattt 5040
cattatggtg aaagttgtct tacgtgcaac attttcgcaa aaagttggcg ctttatcaac 5100
actgtccgaa tgacaaatgg ttacaattat tgaacaccct tcggggtgtt tttttgtttc 5160
tggtttcccg aggccgaact tttgttgcaa tggctgtcta ccctgtctac ctgagtaaag 5220
aaaaatacat ttaattcagt atattaactt gggtagacag ccttttttta ctgtctacct 5280
tctgtctacc ctctctacct gattttacct gaatcagaca gggaggtaga cacggggtag 5340
acagtggata aaagcactct accccactga aagcagtgcc attactggca tggttgccag 5400
taaggttgat aaggtagaca aggggaggga caactcaaaa ctttttaaac gagggggtaa 5460
aacgcagatc aaaacgatct caagaagatc atcttattaa tcagataaaa tatttctaga 5520
tttcagtgca atttatctct tcaaatgtag caccggcgcg ccgtgaccaa ttattgaagg 5580
ccgctaacgc ggcctttttt tgtttctggt ttcccgaata gagcgacttc tccccaaaaa 5640
gcctcgcttt cagcacctgt cgtttccttt cttttcagag ggtattttaa ataaaaacat 5700
taagttatga cgaagaagaa cggaaacgcc ttaaaccgga aaattttcat aaatagcgaa 5760
aacccgcgag gtcgccgccc cgtaacctgt cggatcaccg gaaagaacct gtaaagtgat 5820
aatgattatc atctacatat cacaacgtgc gtaaagggta agtatgaagg tcgtgtactc 5880
catcgctacc aaattccaga aaacagacgc tttcgagcgt cttttttcgt tttggtcacg 5940
acgtacggtg gaagattcgt taccaattga cagctagctc agtcctaggt atatacatac 6000
atgcttgttt gtttgtaaac tactgttttc attaaagagg agaaaggaag ccatgtccat 6060
ctatcaggag tttgttaaca agtattccct gtctaaaacc ctgcgttttg aactgatccc 6120
gcagggcaaa actttggaaa acattaaagc gcgtggcctg attctggatg acgaaaaacg 6180
tgcaaaggat tacaagaaag ctaaacagat catcgacaaa tatcaccagt tctttatcga 6240
agaaattctg tcctcggtgt gcatcagtga ggatctgtta cagaattatt ctgatgtata 6300
ctttaaactt aaaaagtccg atgacgataa tctgcaaaaa gatttcaagt cagccaaaga 6360
taccatcaag aaacagatct cagaatatat taaagatagc gaaaagttca aaaacctgtt 6420
taaccaaaac ctcattgatg ctaagaaagg ccaagaatct gacctgatct tatggctgaa 6480
acagagcaaa gataacggca ttgaactgtt caaagctaat agcgacatca ccgatattga 6540
tgaagcgctc gaaatcatca agtctttcaa aggctggacg acgtatttca aaggttttca 6600
tgaaaaccgt aagaatgtat attcgagcaa cgatattccg acctctatta tttatcgtat 6660
cgtggacgac aacctgccga agtttctgga aaacaaagcg aaatatgaat ctctgaaaga 6720
caaagcaccg gaagctatta actatgaaca gatcaagaaa gatctggcgg aagaactgac 6780
cttcgacatc gactataaaa cctccgaagt taaccagcgt gttttctcac tggacgaggt 6840
tttcgaaatc gctaatttca acaattacct gaatcaatct ggcatcacca aattcaacac 6900
cattattggt ggcaaatttg ttaacggcga aaacaccaag cgtaagggca tcaacgaata 6960
cattaacctc tatagccaac aaatcaacga caaaaccctg aaaaagtata aaatgtccgt 7020
tctgtttaaa cagattttat cggacaccga atctaaatcc ttcgtaattg ataaactgga 7080
agatgatagc gacgttgtca ccacgatgca gagcttttat gagcagattg cggcgttcaa 7140
aaccgtcgaa gagaaatcta ttaaagaaac tctgtccctg ctctttgacg acctcaaagc 7200
gcagaaacta gatctgtcta agatttactt taaaaacgac aaatctctga ccgatctcag 7260
tcaacaagtt ttcgatgact atagcgtgat cggcacggca gttttggaat acatcaccca 7320
acaaatcgcg ccgaaaaatc tggacaaccc gtccaagaag gaacaggaac tgattgcaaa 7380
gaaaacagaa aaagctaaat acctgagctt agaaactatc aaactggcac ttgaggaatt 7440
taataaacat cgtgatattg ataaacagtg tcgttttgag gaaattctgg cgaactttgc 7500
ggcaatcccg atgatcttcg acgaaattgc tcaaaacaaa gacaatctgg cgcagatctc 7560
tatcaagtac cagaatcagg gtaagaaaga tctgcttcaa gcatctgcgg aggacgatgt 7620
caaagcaatt aaagacttat tagatcagac gaataactta ttacacaagc tcaaaatctt 7680
ccacatcagc cagagcgagg acaaggcgaa cattctggat aaagatgaac acttctatct 7740
ggtgttcgaa gaatgttact tcgaactggc aaacatcgta cctctctaca ataaaatccg 7800
caactacatc acgcagaagc cttacagtga cgagaaattc aaactgaact tcgaaaacag 7860
cacgctggcg aacggctggg ataagaacaa agagccggac aacaccgcaa tcctgttcat 7920
caaagacgac aaatactatc tgggcgtaat gaacaagaag aacaacaaga tcttcgacga 7980
taaagcgatc aaagaaaaca agggtgaagg ctataagaaa atcgtgtaca agctcctgcc 8040
gggtgcgaac aaaatgttac cgaaagtgtt cttttccgcg aaaagcatca aattctacaa 8100
cccgtctgag gatattctgc gcatccgcaa tcatagcacg cacactaaaa acggtagccc 8160
gcagaaaggg tatgaaaaat tcgaatttaa tatagaggac tgccgtaaat tcatcgactt 8220
ctataaacag agcatttcca aacatccgga atggaaagac ttcggcttcc gtttctctga 8280
cactcagcgc tataatagca tcgacgagtt ctaccgcgaa gtggagaatc agggctataa 8340
actgaccttc gagaacatta gtgagtcgta catcgactcc gttgtgaatc agggtaaact 8400
gtacctgttt cagatctata ataaagactt tagcgcgtac agcaaaggcc gcccgaatct 8460
gcacaccctt tactggaaag cattatttga cgaacgtaac ctgcaagatg tggtgtataa 8520
actgaacggt gaggcggaac ttttctaccg taaacagagt atcccgaaga aaatcacgca 8580
tccggcaaaa gaagctattg ccaacaaaaa caaagacaac ccgaagaaag aaagtgtatt 8640
cgaatatgac ctgatcaaag ataaacgttt caccgaagat aagttctttt tccactgtcc 8700
gattaccatc aacttcaaat ctagcggtgc gaacaagttc aacgatgaaa ttaacttatt 8760
actgaaagag aaagctaatg acgtacacat cttatctatt gatcgcggtg aacgtcattt 8820
agcatactat acactggtag acggtaaagg taatattatt aaacaggata ctttcaatat 8880
tatcggtaat gaccgtatga aaaccaacta tcacgataag ctggcggcga tcgaaaaaga 8940
tcgtgattct gcgcgtaaag attggaagaa aattaacaat atcaaagaaa tgaaagaagg 9000
ctatctgagc caagtggtgc acgagatcgc aaaactggtg attgaatata acgctatcgt 9060
ggttttcgaa gatctgaact ttggttttaa acgtggtcgc ttcaaagtag aaaaacaggt 9120
gtaccaaaaa ctggaaaaaa tgctgattga aaaactgaac tatctggttt ttaaagacaa 9180
cgaatttgac aaaacgggtg gcgtactccg tgcctatcag cttaccgctc cgttcgaaac 9240
gtttaagaaa atgggtaaac aaacggggat tatctattat gtgccagccg gtttcacctc 9300
caagatttgt ccagttacgg gcttcgttaa ccagctttac ccgaaatacg agagcgttag 9360
caaatctcaa gaatttttca gcaaattcga caagatctgc tataatctgg ataaaggcta 9420
tttcgagttc agctttgatt acaaaaactt cggcgataaa gcggctaaag gtaagtggac 9480
tattgctagc tttggtagcc gtctgattaa ctttcgcaac tccgacaaaa accataattg 9540
ggacacgcgt gaagtgtatc cgaccaaaga actggaaaaa ttactgaaag actattccat 9600
cgaatatggt catggggagt gcattaaagc ggcgatttgc ggtgaatccg ataagaaatt 9660
tttcgccaaa ctgaccagcg tgcttaacac cattctccaa atgcgtaatt ctaaaacggg 9720
tacggagctt gactacctga tttctccggt agccgacgtt aacggcaact tcttcgattc 9780
tcgtcaagca ccgaaaaata tgccacaaga cgcggatgcc aacggtgcat accatatcgg 9840
ccttaaaggc ttaatgttat taggccgtat caagaataat caggagggca agaaattaaa 9900
tctggttatc aaaaacgaag aatacttcga gttcgttcag aatcgtaaca attaatgtat 9960
gcttaagcag atcggtaata aagacgaaca ataagacgct gaaaagcgtc ttttttcgtt 10020
ttggtcctgt tccggcgcga tagtgtgaac atgctataga cttctggtgc tacccgactg 10080
acaattaatc atccggctcg tataatgcta gcaatttcta ctgttgtaga tcattccgga 10140
acgttccagc gctgcaattt ctactgttgt agatctgatt tttcacatgt tacctttcaa 10200
tttctactgt tgtagatccg aaaacgtaaa gcttcagctg taatttctac tgttgtagat 10260
atcatatctg gcgttaatgg agtttcgtga cgaacaataa gtcctcccta acggggggca 10320
atttttattg ataacaaaag taacttcgag cttgtctacc tcctagctcg taaattgcac 10380
gctgatagtc tcccaattgc gaaggaccaa aacgaaaaaa caccctttcg ggtgtctttt 10440
ctggaatttg gtacgcagta ctaggtatcg tgtaagtagc gaaggcccgt acgcgagata 10500
aactgctagg caaccgcgac tctacgactg gtgctcgatt taatttcgct gacgtaaaga 10560
aattatcggc agtgcgtcaa ctgccgtatc tttatcttaa ttaggtagtt ggacaagccc 10620
ttgaaagaaa tagcaagagc ctgcctctct attgaagtca cggcgaaagt cgggtagaaa 10680
tcaaagaaag cagaaattaa atcggagtaa tactaagttg ggataactcc gtaactgact 10740
acgcctttct ctagacttta cttgaccaga tacactgtct ttgacacgtt gaaggattag 10800
agcaatcaaa tccaagactg gctaagcacg aagcaactct tgagtgttaa aaagttactt 10860
cctgtattcg ggacgagggt actagaagat tgcagggact ccgacgttaa gtaaattaca 10920
aagtaataag tatcgttcag gatcacgtta ccgcaataag aagcgagaat aatataattt 10980
ccgaagtgct taccccagta gtgactattc ctataaccct tctgagtgtc cggaggcgga 11040
aatttgccac gaaagagaaa gtatttcccc gacaataata aaggggcgct cctcagcttt 11100
tccacttggt tgggtaagct aggcaactct gaaaggagtt tcggcgaagt gaagccgaca 11160
cctttgaatt gttttagggg cgttattcga gggcaatcgg agctaacttc aagactactt 11220
ctttgttgaa tactaaatag tgcaaaggtc gtgtttcctc aaggatactc cgctaacaat 11280
ataggattcc aatcagattc agcactggcg gtacgggtgt tgcggtgagg cgttcgggtt 11340
tacggctcga agctagcacg gtaggaagcc tgacaatcac caagcaaaag ggccgtcgaa 11400
ggcccacaag atacgaaagc tctcgaagcc ttatccttga ccgatccacc tatttaggca 11460
gttacgcaca aaagctaccc aataatccgt gacaggcaca atatcacgga acaaaaccga 11520
aaactctcgt acacggttag gttttcgcta ggaagaataa acctctatct tgattataag 11580
aaggctcccc aagcaccccc aaaaccgaaa tagcg 11615
<210> 48
<211> 1196
<212> PRT
<213> 人工序列
<220>
<223> 嵌合STF-V10h
<400> 48
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Val Val Met Asp Glu Thr Asn Arg Lys Ala Pro Leu Asp Ser Pro
385 390 395 400
Ala Leu Thr Gly Thr Pro Thr Ala Pro Thr Ala Leu Arg Gly Thr Asn
405 410 415
Asn Thr Gln Ile Ala Asn Thr Ala Phe Val Leu Ala Ala Ile Ala Asp
420 425 430
Val Ile Asp Ala Ser Pro Asp Ala Leu Asn Thr Leu Asn Glu Leu Ala
435 440 445
Ala Ala Leu Gly Asn Asp Pro Asp Phe Ala Thr Thr Met Thr Asn Ala
450 455 460
Leu Ala Gly Lys Gln Pro Lys Asn Ala Thr Leu Thr Ala Leu Ala Gly
465 470 475 480
Leu Ser Thr Ala Lys Asn Lys Leu Pro Tyr Phe Ala Glu Asn Asp Ala
485 490 495
Ala Ser Leu Thr Glu Leu Thr Gln Val Gly Arg Asp Ile Leu Ala Lys
500 505 510
Asn Ser Val Ala Asp Val Leu Glu Tyr Leu Gly Ala Gly Glu Asn Ser
515 520 525
Gly Ser Ala Thr Asp Val Met Ile Gln Leu Ala Ala Asn Asp Gly Phe
530 535 540
Lys Phe Ile Gly Gln Cys Pro Asp Ile Leu Thr Leu Arg Thr Ile Glu
545 550 555 560
Pro Glu Lys Asn Gly Gln Arg Ile Thr Leu Arg Gln His Thr Ile Gly
565 570 575
Thr Gly Leu Gly Gly Gly Val Phe Arg Ala Val Leu Asp Gly Thr Gly
580 585 590
Tyr Thr Asp Asp Asp Gly Val Val Ile Lys Thr Ala Gly Gly Ser Val
595 600 605
Trp Leu Arg Val Asn Ala Asp Lys Val Asn Pro Phe Met Phe Gly Ala
610 615 620
Thr Gly Val Ala Asp Asp Thr Ala Ala Leu Gln Lys Met Leu Glu Cys
625 630 635 640
Gly Arg Ala Ala Glu Leu Gly Thr Asn Val Trp Lys Ala Ser Asn Leu
645 650 655
Glu Leu Asn Asn Lys Ser Cys Ser Leu Ser Gly Ser Gly Leu His Val
660 665 670
Ser Arg Ile Glu Gln Ile Ser Gly Ala Thr Gly Ala Leu Leu Thr Ile
675 680 685
Thr Gln Asp Cys Ser Leu Ile Tyr Leu Ser Asp Cys Gly Leu Tyr Gly
690 695 700
Asp Gly Ile Thr Ala Gly Thr Ser Gly Val Thr Met Glu Thr Gly Asn
705 710 715 720
Pro Gly Gly Ala Pro Ser Tyr Pro Phe Asn Thr Ala Pro Asp Val Arg
725 730 735
Arg Asp Leu Tyr Ile Ser Asn Val His Ile Thr Gly Phe Asp Glu Leu
740 745 750
Gly Phe Asp Tyr Pro Glu Thr Asn Phe Ser Val Ser Thr His Gly Leu
755 760 765
Phe Ile Arg Asn Ile Lys Lys Thr Gly Ala Lys Ile Gly Thr Thr Asp
770 775 780
Phe Thr Trp Thr Asn Leu Gln Ile Asp Thr Cys Gly Gln Glu Cys Leu
785 790 795 800
Val Leu Asp Gly Ala Gly Asn Cys Arg Ile Ile Gly Ala Lys Leu Ile
805 810 815
Trp Ala Gly Ser Glu Asn Glu Thr Pro Tyr Ser Gly Leu Arg Ile Ser
820 825 830
Asn Ser Gln Asn Val Asn Met Thr Gly Val Glu Leu Gln Asp Cys Ala
835 840 845
Tyr Asp Gly Leu Tyr Ile Lys Asn Ser Thr Val Ala Ile Ser Gly Leu
850 855 860
Asn Thr Asn Arg Asn Ser Ala Ser Ser Asn Leu Ser Tyr His Asn Met
865 870 875 880
Val Phe Glu Asn Ser Ile Val Thr Val Asp Gly Tyr Val Cys Arg Asn
885 890 895
Tyr Ala Ala Thr Ser Leu Tyr Asp Leu Asn Ser Gln Ala Gly Asn Val
900 905 910
Arg Cys Ile Gly Ser Asp Ser Thr Val Leu Ile Asn Gly Ile Tyr Glu
915 920 925
Ser Glu Val Asn Ser Glu Arg Leu Met Gly Asp Asn Asn Leu Ile Gln
930 935 940
Pro Tyr Ser Gly Asp Leu Ile Ile Asn Gly Leu Lys Asn Tyr Tyr Thr
945 950 955 960
Tyr Thr Gly Ser Val Lys Asn Asn Ile Pro Thr Phe Asp Gly Val Val
965 970 975
Thr Thr Ala Thr Tyr Val Ser Ala Pro Ser Ile Leu Gly Gln Gly Asn
980 985 990
Met Leu Lys Leu Thr Gln Ser Asn Lys Asp Lys Leu Leu Phe Ser Asp
995 1000 1005
Lys Val Ser Arg His Gly Cys Thr Ile Gly Leu Val Leu Ile Pro
1010 1015 1020
Ser Phe Thr Gly Ala Thr Thr Met Thr Ala Phe Thr Leu Gly Ser
1025 1030 1035
Gly Tyr Ser Pro Ser Gly Asn Ser Ala Val Met Gln Phe Ile Val
1040 1045 1050
Asn Ser Ser Gly Val Gln Thr Ile Ala Ile Leu Leu Ser Gly Asp
1055 1060 1065
Gly Ile Thr Gln Thr Leu Thr Ser Asp Leu Thr Thr Glu Gln Ala
1070 1075 1080
Leu Ala Ser Gly Gly Val Tyr His Phe Ala Met Gly Phe Ala Pro
1085 1090 1095
Gly Arg Leu Trp Trp Ser Ile Ile Asp Ile Asn Thr Gly Arg Arg
1100 1105 1110
Ile Arg Arg Ala Tyr Arg Gln Pro Asp Leu His Ala Ala Phe Asn
1115 1120 1125
Ser Ile Phe Asn Ser Gly Thr Ser Ser Ile Thr Ala Phe Ser Gly
1130 1135 1140
Pro Leu Ala Gly Asp Ile Ala Cys Glu Gly Ala Gly Ser His Val
1145 1150 1155
Tyr Val Gly Gly Phe Ser Ser Glu Ser Asp Tyr Ala Ala Ser Arg
1160 1165 1170
Met Tyr Gly Leu Phe Thr Pro Val Asp Leu Asp Lys Gln Tyr Ser
1175 1180 1185
Phe Arg Thr Leu Asn Gly Asn Ile
1190 1195
<210> 49
<211> 1132
<212> PRT
<213> 人工序列
<220>
<223> A8
<400> 49
Met Gly Lys Gly Ser Ser Lys Gly His Thr Pro Arg Glu Ala Lys Asp
1 5 10 15
Asn Leu Lys Ser Thr Gln Leu Leu Ser Val Ile Asp Ala Ile Ser Glu
20 25 30
Gly Pro Ile Glu Gly Pro Val Asp Gly Leu Lys Ser Val Leu Leu Asn
35 40 45
Ser Thr Pro Val Leu Asp Thr Glu Gly Asn Thr Asn Ile Ser Gly Val
50 55 60
Thr Val Val Phe Arg Ala Gly Glu Gln Glu Gln Thr Pro Pro Glu Gly
65 70 75 80
Phe Glu Ser Ser Gly Ser Glu Thr Val Leu Gly Thr Glu Val Lys Tyr
85 90 95
Asp Thr Pro Ile Thr Arg Thr Ile Thr Ser Ala Asn Ile Asp Arg Leu
100 105 110
Arg Phe Thr Phe Gly Val Gln Ala Leu Val Glu Thr Thr Ser Lys Gly
115 120 125
Asp Arg Asn Pro Ser Glu Val Arg Leu Leu Val Gln Ile Gln Arg Asn
130 135 140
Gly Gly Trp Val Thr Glu Lys Asp Ile Thr Ile Lys Gly Lys Thr Thr
145 150 155 160
Ser Gln Tyr Leu Ala Ser Val Val Met Gly Asn Leu Pro Pro Arg Pro
165 170 175
Phe Asn Ile Arg Met Arg Arg Met Thr Pro Asp Ser Thr Thr Asp Gln
180 185 190
Leu Gln Asn Lys Thr Leu Trp Ser Ser Tyr Thr Glu Ile Ile Asp Val
195 200 205
Lys Gln Cys Tyr Pro Asn Thr Ala Leu Val Gly Val Gln Val Asp Ser
210 215 220
Glu Gln Phe Gly Ser Gln Gln Val Ser Arg Asn Tyr His Leu Arg Gly
225 230 235 240
Arg Ile Leu Gln Val Pro Ser Asn Tyr Asn Pro Gln Thr Arg Gln Tyr
245 250 255
Ser Gly Ile Trp Asp Gly Thr Phe Lys Pro Ala Tyr Ser Asn Asn Met
260 265 270
Ala Trp Cys Leu Trp Asp Met Leu Thr His Pro Arg Tyr Gly Met Gly
275 280 285
Lys Arg Leu Gly Ala Ala Asp Val Asp Lys Trp Ala Leu Tyr Val Ile
290 295 300
Gly Gln Tyr Cys Asp Gln Ser Val Pro Asp Gly Phe Gly Gly Thr Glu
305 310 315 320
Pro Arg Ile Thr Cys Asn Ala Tyr Leu Thr Thr Gln Arg Lys Ala Trp
325 330 335
Asp Val Leu Ser Asp Phe Cys Ser Ala Met Arg Cys Met Pro Val Trp
340 345 350
Asn Gly Gln Thr Leu Thr Phe Val Gln Asp Arg Pro Ser Asp Lys Thr
355 360 365
Trp Thr Tyr Asn Arg Ser Asn Val Val Met Pro Asp Asp Gly Ala Pro
370 375 380
Phe Arg Tyr Ser Phe Ser Ala Leu Lys Asp Arg His Asn Ala Val Glu
385 390 395 400
Val Asn Trp Ile Asp Pro Asn Asn Gly Trp Glu Thr Ala Thr Glu Leu
405 410 415
Val Glu Asp Thr Gln Ala Ile Ala Arg Tyr Gly Arg Asn Val Thr Lys
420 425 430
Met Asp Ala Phe Gly Cys Thr Ser Arg Gly Gln Ala His Arg Ala Gly
435 440 445
Leu Trp Leu Ile Lys Thr Glu Leu Leu Glu Thr Gln Thr Val Asp Phe
450 455 460
Ser Val Gly Ala Glu Gly Leu Arg His Val Pro Gly Asp Val Ile Glu
465 470 475 480
Ile Cys Asp Asp Asp Tyr Ala Gly Ile Ser Thr Gly Gly Arg Val Leu
485 490 495
Ala Val Asn Ser Gln Thr Arg Thr Leu Thr Leu Asp Arg Glu Ile Thr
500 505 510
Leu Pro Ser Ser Gly Thr Ala Leu Ile Ser Leu Val Asp Gly Ser Gly
515 520 525
Asn Pro Val Ser Val Glu Val Gln Ser Val Thr Asp Gly Val Lys Val
530 535 540
Lys Val Ser Arg Val Pro Asp Gly Val Ala Glu Tyr Ser Val Trp Glu
545 550 555 560
Leu Lys Leu Pro Thr Leu Arg Gln Arg Leu Phe Arg Cys Val Ser Ile
565 570 575
Arg Glu Asn Asp Asp Gly Thr Tyr Ala Ile Thr Ala Val Gln His Val
580 585 590
Pro Glu Lys Glu Ala Ile Val Asp Asn Gly Ala His Phe Asp Gly Glu
595 600 605
Gln Ser Gly Thr Val Asn Gly Val Thr Pro Pro Ala Val Gln His Leu
610 615 620
Thr Ala Glu Val Thr Ala Asp Ser Gly Glu Tyr Gln Val Leu Ala Arg
625 630 635 640
Trp Asp Thr Pro Lys Val Val Lys Gly Val Ser Phe Leu Leu Arg Leu
645 650 655
Thr Val Thr Ala Asp Asp Gly Ser Glu Arg Leu Val Ser Thr Ala Arg
660 665 670
Thr Thr Glu Thr Thr Tyr Arg Phe Thr Gln Leu Ala Leu Gly Asn Tyr
675 680 685
Arg Leu Thr Val Arg Ala Val Asn Ala Trp Gly Gln Gln Gly Asp Pro
690 695 700
Ala Ser Val Ser Phe Arg Ile Ala Ala Pro Ala Ala Pro Ser Arg Ile
705 710 715 720
Glu Leu Thr Pro Gly Tyr Phe Gln Ile Thr Ala Thr Pro His Leu Ala
725 730 735
Val Tyr Asp Pro Thr Val Gln Phe Glu Phe Trp Phe Ser Glu Lys Gln
740 745 750
Ile Ala Asp Ile Arg Gln Val Glu Thr Ser Thr Arg Tyr Leu Gly Thr
755 760 765
Ala Leu Tyr Trp Ile Ala Ala Ser Ile Asn Ile Lys Pro Gly His Asp
770 775 780
Tyr Tyr Phe Tyr Ile Arg Ser Val Asn Thr Val Gly Lys Ser Ala Phe
785 790 795 800
Val Glu Ala Val Gly Arg Ala Ser Asp Asp Ala Glu Gly Tyr Leu Asp
805 810 815
Phe Phe Lys Gly Lys Ile Thr Glu Ser His Leu Gly Lys Glu Leu Leu
820 825 830
Glu Lys Val Glu Leu Thr Glu Asp Asn Ala Ser Arg Leu Glu Glu Phe
835 840 845
Ser Lys Glu Trp Lys Asp Ala Ser Asp Lys Trp Asn Ala Met Trp Ala
850 855 860
Val Lys Ile Glu Gln Thr Lys Asp Gly Lys His Tyr Val Ala Gly Ile
865 870 875 880
Gly Leu Ser Met Glu Asp Thr Glu Glu Gly Lys Leu Ser Gln Phe Leu
885 890 895
Val Ala Ala Asn Arg Ile Ala Phe Ile Asp Pro Ala Asn Gly Asn Glu
900 905 910
Thr Pro Met Phe Val Ala Gln Gly Asn Gln Ile Phe Met Asn Asp Val
915 920 925
Phe Leu Lys Arg Leu Thr Ala Pro Thr Ile Thr Ser Gly Gly Asn Pro
930 935 940
Pro Ala Phe Ser Leu Thr Pro Asp Gly Lys Leu Thr Ala Lys Asn Ala
945 950 955 960
Asp Ile Ser Gly Ser Val Asn Ala Asn Ser Gly Thr Leu Asn Asn Val
965 970 975
Thr Ile Asn Glu Asn Cys Gln Ile Lys Gly Lys Leu Ser Ala Asn Gln
980 985 990
Ile Glu Gly Asp Ile Val Lys Thr Val Ser Lys Ser Phe Pro Arg Thr
995 1000 1005
Asn Ser Tyr Ala Ser Gly Thr Ile Thr Val Arg Ile Ser Asp Asp
1010 1015 1020
Gln Lys Phe Asp Arg Gln Val Met Ile Pro Pro Val Leu Phe Arg
1025 1030 1035
Gly Gly Lys His Glu Asn Phe Asn Ser Asn Asn Gln Gln Ser Tyr
1040 1045 1050
Trp Tyr Ser Thr Cys Arg Leu Arg Val Thr Arg Asn Gly Gln Glu
1055 1060 1065
Ile Phe Asn Gln Ser Thr Thr Asp Ala Gln Gly Val Phe Ser Ser
1070 1075 1080
Val Ile Asp Met Pro Ala Gly Gln Gly Thr Leu Thr Leu Thr Phe
1085 1090 1095
Thr Val Ser Ser Ser Gly Ala Asn Asn Trp Thr Pro Thr Thr Ser
1100 1105 1110
Ile Ser Asp Leu Leu Val Val Val Met Lys Lys Ser Thr Ala Gly
1115 1120 1125
Ile Ser Ile Ser
1130
<210> 50
<211> 812
<212> PRT
<213> 人工序列
<220>
<223> 嵌合STF λ-P2
<400> 50
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Val Val Met Asp Glu Thr Asn Arg Lys Ala Pro Leu Asn Ser Pro
385 390 395 400
Ala Leu Thr Gly Thr Pro Thr Thr Pro Thr Ala Arg Gln Gly Thr Asn
405 410 415
Asn Thr Gln Ile Ala Asn Thr Ala Phe Val Met Ala Ala Ile Ala Ala
420 425 430
Leu Val Asp Ser Ser Pro Asp Ala Leu Asn Thr Leu Asn Glu Leu Ala
435 440 445
Ala Ala Leu Gly Asn Asp Pro Asn Phe Ala Thr Thr Met Thr Asn Ala
450 455 460
Leu Ala Gly Lys Gln Pro Lys Asp Ala Thr Leu Thr Ala Leu Ala Gly
465 470 475 480
Leu Ala Thr Ala Ala Asp Arg Phe Pro Tyr Phe Thr Gly Asn Asp Val
485 490 495
Ala Ser Leu Ala Thr Leu Thr Lys Val Gly Arg Asp Ile Leu Ala Lys
500 505 510
Ser Thr Val Ala Ala Val Ile Glu Tyr Leu Gly Leu Gln Glu Thr Val
515 520 525
Asn Arg Ala Gly Asn Ala Val Gln Lys Asn Gly Asp Thr Leu Ser Gly
530 535 540
Gly Leu Thr Phe Glu Asn Asp Ser Ile Leu Ala Trp Ile Arg Asn Thr
545 550 555 560
Asp Trp Ala Lys Ile Gly Phe Lys Asn Asp Ala Asp Gly Asp Thr Asp
565 570 575
Ser Tyr Met Trp Phe Glu Thr Gly Asp Asn Gly Asn Glu Tyr Phe Lys
580 585 590
Trp Arg Ser Arg Gln Ser Thr Thr Thr Lys Asp Leu Met Thr Leu Lys
595 600 605
Trp Asp Ala Leu Asn Ile Leu Val Asn Ala Val Ile Asn Gly Cys Phe
610 615 620
Gly Val Gly Thr Thr Asn Ala Leu Gly Gly Ser Ser Ile Val Leu Gly
625 630 635 640
Asp Asn Asp Thr Gly Phe Lys Gln Asn Gly Asp Gly Ile Leu Asp Val
645 650 655
Tyr Ala Asn Ser Gln Arg Val Phe Arg Phe Gln Asn Gly Val Ala Ile
660 665 670
Ala Phe Lys Asn Ile Gln Ala Gly Asp Ser Lys Lys Phe Ser Leu Ser
675 680 685
Ser Ser Asn Thr Ser Thr Lys Asn Ile Thr Phe Asn Leu Trp Gly Ala
690 695 700
Ser Thr Arg Pro Val Val Ala Glu Leu Gly Asp Glu Ala Gly Trp His
705 710 715 720
Phe Tyr Ser Gln Arg Asn Thr Asp Asn Ser Val Ile Phe Ala Val Asn
725 730 735
Gly Gln Met Gln Pro Ser Asn Trp Gly Asn Phe Asp Ser Arg Tyr Val
740 745 750
Lys Asp Val Arg Leu Gly Thr Arg Val Val Gln Leu Met Ala Arg Gly
755 760 765
Gly Arg Tyr Glu Lys Ala Gly His Thr Ile Thr Gly Leu Arg Ile Ile
770 775 780
Gly Glu Val Asp Gly Asp Asp Glu Ala Ile Phe Arg Pro Ile Gln Lys
785 790 795 800
Tyr Ile Asn Gly Thr Trp Tyr Asn Val Ala Gln Val
805 810
<210> 51
<211> 3558
<212> DNA
<213> 人工序列
<220>
<223> 编码嵌合STF-V10的核酸
<400> 51
atggcagtaa agatttcagg agtcctgaaa gacggcacag gaaaaccggt acagaactgc 60
accattcagc tgaaagccag acgtaacagc accacggtgg tggtgaacac ggtgggctca 120
gagaatccgg atgaagccgg gcgttacagc atggatgtgg agtacggtca gtacagtgtc 180
atcctgcagg ttgacggttt tccaccatcg cacgccggga ccatcaccgt gtatgaagat 240
tcacaaccgg ggacgctgaa tgattttctc tgtgccatga cggaggatga tgcccggccg 300
gaggtgctgc gtcgtcttga actgatggtg gaagaggtgg cgcgtaacgc gtccgtggtg 360
gcacagagta cggcagacgc gaagaaatca gccggcgatg ccagtgcatc agctgctcag 420
gtcgcggccc ttgtgactga tgcaactgac tcagcacgcg ccgccagcac gtccgccgga 480
caggctgcat cgtcagctca ggaagcgtcc tccggcgcag aagcggcatc agcaaaggcc 540
actgaagcgg aaaaaagtgc cgcagccgca gagtcctcaa aaaacgcggc ggccaccagt 600
gccggtgcgg cgaaaacgtc agaaacgaat gctgcagcgt cacaacaatc agccgccacg 660
tctgcctcca ccgcggccac gaaagcgtca gaggccgcca cttcagcacg agatgcggtg 720
gcctcaaaag aggcagcaaa atcatcagaa acgaacgcat catcaagtgc cggtcgtgca 780
gcttcctcgg caacggcggc agaaaattct gccagggcgg caaaaacgtc cgagacgaat 840
gccaggtcat ctgaaacagc agcggaacgg agcgcctctg ccgcggcaga cgcaaaaaca 900
gcggcggcgg ggagtgcgtc aacggcatcc acgaaggcga cagaggctgc gggaagtgcg 960
gtatcagcat cgcagagcaa aagtgcggca gaagcggcgg caatacgtgc aaaaaattcg 1020
gcaaaacgtg cagaagatat agcttcagct gtcgcgcttg aggatgcgga cacaacgaga 1080
aaggggatag tgcagctcag cagtgcaacc aacagcacgt ctgaaacgct tgctgcaacg 1140
ccaaaggcgg ttaaggtggt aatggatgag actaatcgta aggcacctct ggacagtccg 1200
gcactgaccg gaacgccaac agcaccaacc gcgctcaggg gaacaaacaa tacccagatt 1260
gcgaacaccg cttttgtact ggccgcgatt gcagatgtta tcgacgcgtc acctgacgca 1320
ctgaatacgc tgaatgaact ggccgcagcg ctcgggaatg atccagattt tgctaccacc 1380
atgactaacg cgcttgcggg taaacaaccg aagaatgcga cactgacggc gctggcaggg 1440
ctttccacgg cgaaaaataa attaccgtat tttgcggaaa atgatgccgc cagcctgact 1500
gaactgactc aggttggcag ggatattctg gcaaaaaatt ccgttgcaga tgttcttgaa 1560
taccttgggg ccggtgagaa ttcggcggca aatgatggct tcaaattcat cggtcagtgc 1620
ccagacatct tgaccctgcg tactatcgag ccggaaaaaa acggtcagcg tatcacctta 1680
cgtcaacata cgattggcac tggcttaggc ggtggcgttt tccgtgcagt tctggacggc 1740
actggctata ccgatgacga cggtgtggtg atcaaaaccg ctgggggcag cgtttggctg 1800
cgtgtcaacg ctgacaaagt taacccgttc atgttcggtg caaccggagt agcggacgac 1860
accgccgccc tgcaaaaaat gctggaatgc ggtcgtgcgg cggaactggg gactaacgta 1920
tggaaagcaa gcaatctgga actgaacaac aaatcttgct ctctgtccgg cagtggcctg 1980
cacgtttctc gtattgaaca gatttccggt gcaaccggag cattgttaac catcacccaa 2040
gactgttcgc tgatttacct gtccgattgt ggcctgtacg gcgatggcat caccgcaggc 2100
acgagcggtg ttactatgga aacgggtaat ccgggtggcg ctccgtctta ccctttcaat 2160
accgctccgg acgttcgtcg tgacctgtac atctctaacg tgcacatcac gggcttcgac 2220
gagctgggtt ttgattatcc ggaaaccaat ttctctgttt cgacgcatgg cctcttcatc 2280
cgtaacatca aaaaaacggg tgcaaagatt ggtactacgg acttcacttg gactaacctg 2340
caaattgata cttgcggtca ggaatgtctg gtgctggacg gtgcgggtaa ctgccgtatt 2400
attggtgcaa aactgatttg ggcaggtagc gaaaacgaaa cgccatactc tggcctgcgt 2460
attagcaact ctcaaaatgt aaatatgact ggcgtagagt tacaagactg cgcgtatgat 2520
ggtttataca tcaagaactc tacggttgca atttcaggct taaacaccaa tcgcaatagc 2580
gcatcctcta atctgtccta ccataacatg gtattcgaaa attctattgt aactgttgat 2640
ggttatgtgt gtcgtaacta cgcggcgact tcgctgtacg acctgaacag ccaagcaggc 2700
aacgtccgtt gcatcggtag cgacagcacc gttttaatca acggcatcta cgaaagcgaa 2760
gtcaatagcg agcgcctgat gggtgataac aacctgatcc agccgtatag tggtgatctg 2820
atcattaacg gcctgaaaaa ttactacacc tatactggta gcgtaaaaaa caacattccg 2880
accttcgacg gcgttgttac tacggcaacc tatgtgagcg caccgtctat tctgggtcag 2940
ggcaatatgc tcaaactgac ccagtctaat aaagacaaac tgttatttag cgataaagtt 3000
agccgtcatg gctgtaccat cggcttagtt ctgattccgt cctttacggg cgcgaccact 3060
atgacggcgt tcacgctggg tagcggttac tctccatccg gtaactccgc cgtgatgcag 3120
ttcattgtta acagttccgg tgtacaaacc attgcgattt tattatccgg cgacggtatt 3180
acccaaaccc tgaccagcga tctgaccacg gaacaagcac tggcgagcgg tggcgtgtat 3240
cattttgcaa tgggttttgc gccgggtcgt ttatggtgga gcattatcga tattaacacg 3300
ggcaggcgta ttcgtcgcgc ctaccgtcag ccggatctgc acgcggcgtt caactctatc 3360
ttcaactccg gcacgtcgtc tattaccgca tttagcgggc cactggcggg cgacattgct 3420
tgcgaaggtg caggtagcca tgtatacgtt ggcggttttt cgtcggaatc tgattacgcg 3480
gctagccgta tgtatggcct gttcactccg gtcgatctgg acaagcagta tagcttccgt 3540
accctgaacg gtaacatt 3558
<210> 52
<211> 3558
<212> DNA
<213> 人工序列
<220>
<223> 编码STF-V10f的核酸
<400> 52
atggcagtaa agatttcagg agtcctgaaa gacggcacag gaaaaccggt acagaactgc 60
accattcagc tgaaagccag acgtaacagc accacggtgg tggtgaacac ggtgggctca 120
gagaatccgg atgaagccgg gcgttacagc atggatgtgg agtacggtca gtacagtgtc 180
atcctgcagg ttgacggttt tccaccatcg cacgccggga ccatcaccgt gtatgaagat 240
tcacaaccgg ggacgctgaa tgattttctc tgtgccatga cggaggatga tgcccggccg 300
gaggtgctgc gtcgtcttga actgatggtg gaagaggtgg cgcgtaacgc gtccgtggtg 360
gcacagagta cggcagacgc gaagaaatca gccggcgatg ccagtgcatc agctgctcag 420
gtcgcggccc ttgtgactga tgcaactgac tcagcacgcg ccgccagcac gtccgccgga 480
caggctgcat cgtcagctca ggaagcgtcc tccggcgcag aagcggcatc agcaaaggcc 540
actgaagcgg aaaaaagtgc cgcagccgca gagtcctcaa aaaacgcggc ggccaccagt 600
gccggtgcgg cgaaaacgtc agaaacgaat gctgcagcgt cacaacaatc agccgccacg 660
tctgcctcca ccgcggccac gaaagcgtca gaggccgcca cttcagcacg agatgcggtg 720
gcctcaaaag aggcagcaaa atcatcagaa acgaacgcat catcaagtgc cggtcgtgca 780
gcttcctcgg caacggcggc agaaaattct gccagggcgg caaaaacgtc cgagacgaat 840
gccaggtcat ctgaaacagc agcggaacgg agcgcctctg ccgcggcaga cgcaaaaaca 900
gcggcggcgg ggagtgcgtc aacggcatcc acgaaggcga cagaggctgc gggaagtgcg 960
gtatcagcat cgcagagcaa aagtgcggca gaagcggcgg caatacgtgc aaaaaattcg 1020
gcaaaacgtg cagaagatat agcttcagct gtcgcgcttg aggatgcgga cacaacgaga 1080
aaggggatag tgcagctcag cagtgcaacc aacagcacgt ctgaaacgct tgctgcaacg 1140
ccaaaggcgg ttaaggtggt aatggatgag actaatcgta aggcacctct ggacagtccg 1200
gcactgaccg gaacgccaac agcaccaacc gcgctcaggg gaacaaacaa tacccagatt 1260
gcgaacaccg cttttgtact ggccgcgatt gcagatgtta tcgacgcgtc acctgacgca 1320
ctgaatacgc tgaatgaact ggccgcagcg ctcgggaatg atccagattt tgctaccacc 1380
atgactaacg cgcttgcggg taaacaaccg aagaatgcga cactgacggc gctggcaggg 1440
ctttccacgg cgaaaaataa attaccgtat tttgcggaaa atgatgccgc cagcctgact 1500
gaactgactc aggttggcag ggatattctg gcaaaaaatt ccgttgcaga tgttcttgaa 1560
taccttgggg ccggtgagaa ttcggcggca aatgatggct tcgcattcat cggtcagtgc 1620
ccagacatct tgaccctgcg tactatcgag ccggaaaaaa acggtcagcg tatcacctta 1680
cgtcaacata cgattggcac tggcttaggc ggtggcgttt tccgtgcagt tctggacggc 1740
actggctata ccgatgacga cggtgtggtg atcaaaaccg ctgggggcag cgtttggctg 1800
cgtgtcaacg ctgacaaagt taacccgttc atgttcggtg caaccggagt agcggacgac 1860
accgccgccc tgcaaaaaat gctggaatgc ggtcgtgcgg cggaactggg gactaacgta 1920
tggaaagcaa gcaatctgga actgaacaac aaatcttgct ctctgtccgg cagtggcctg 1980
cacgtttctc gtattgaaca gatttccggt gcaaccggag cattgttaac catcacccaa 2040
gactgttcgc tgatttacct gtccgattgt ggcctgtacg gcgatggcat caccgcaggc 2100
acgagcggtg ttactatgga aacgggtaat ccgggtggcg ctccgtctta ccctttcaat 2160
accgctccgg acgttcgtcg tgacctgtac atctctaacg tgcacatcac gggcttcgac 2220
gagctgggtt ttgattatcc ggaaaccaat ttctctgttt cgacgcatgg cctcttcatc 2280
cgtaacatca aaaaaacggg tgcaaagatt ggtactacgg acttcacttg gactaacctg 2340
caaattgata cttgcggtca ggaatgtctg gtgctggacg gtgcgggtaa ctgccgtatt 2400
attggtgcaa aactgatttg ggcaggtagc gaaaacgaaa cgccatactc tggcctgcgt 2460
attagcaact ctcaaaatgt aaatatgact ggcgtagagt tacaagactg cgcgtatgat 2520
ggtttataca tcaagaactc tacggttgca atttcaggct taaacaccaa tcgcaatagc 2580
gcatcctcta atctgtccta ccataacatg gtattcgaaa attctattgt aactgttgat 2640
ggttatgtgt gtcgtaacta cgcggcgact tcgctgtacg acctgaacag ccaagcaggc 2700
aacgtccgtt gcatcggtag cgacagcacc gttttaatca acggcatcta cgaaagcgaa 2760
gtcaatagcg agcgcctgat gggtgataac aacctgatcc agccgtatag tggtgatctg 2820
atcattaacg gcctgaaaaa ttactacacc tatactggta gcgtaaaaaa caacattccg 2880
accttcgacg gcgttgttac tacggcaacc tatgtgagcg caccgtctat tctgggtcag 2940
ggcaatatgc tcaaactgac ccagtctaat aaagacaaac tgttatttag cgataaagtt 3000
agccgtcatg gctgtaccat cggcttagtt ctgattccgt cctttacggg cgcgaccact 3060
atgacggcgt tcacgctggg tagcggttac tctccatccg gtaactccgc cgtgatgcag 3120
ttcattgtta acagttccgg tgtacaaacc attgcgattt tattatccgg cgacggtatt 3180
acccaaaccc tgaccagcga tctgaccacg gaacaagcac tggcgagcgg tggcgtgtat 3240
cattttgcaa tgggttttgc gccgggtcgt ttatggtgga gcattatcga tattaacacg 3300
ggcaggcgta ttcgtcgcgc ctaccgtcag ccggatctgc acgcggcgtt caactctatc 3360
ttcaactccg gcacgtcgtc tattaccgca tttagcgggc cactggcggg cgacattgct 3420
tgcgaaggtg caggtagcca tgtatacgtt ggcggttttt cgtcggaatc tgattacgcg 3480
gctagccgta tgtatggcct gttcactccg gtcgatctgg acaagcagta tagcttccgt 3540
accctgaacg gtaacatt 3558
<210> 53
<211> 3558
<212> DNA
<213> 人工序列
<220>
<223> 编码STF-V10a的核酸
<400> 53
atggcagtaa agatttcagg agtcctgaaa gacggcacag gaaaaccggt acagaactgc 60
accattcagc tgaaagccag acgtaacagc accacggtgg tggtgaacac ggtgggctca 120
gagaatccgg atgaagccgg gcgttacagc atggatgtgg agtacggtca gtacagtgtc 180
atcctgcagg ttgacggttt tccaccatcg cacgccggga ccatcaccgt gtatgaagat 240
tcacaaccgg ggacgctgaa tgattttctc tgtgccatga cggaggatga tgcccggccg 300
gaggtgctgc gtcgtcttga actgatggtg gaagaggtgg cgcgtaacgc gtccgtggtg 360
gcacagagta cggcagacgc gaagaaatca gccggcgatg ccagtgcatc agctgctcag 420
gtcgcggccc ttgtgactga tgcaactgac tcagcacgcg ccgccagcac gtccgccgga 480
caggctgcat cgtcagctca ggaagcgtcc tccggcgcag aagcggcatc agcaaaggcc 540
actgaagcgg aaaaaagtgc cgcagccgca gagtcctcaa aaaacgcggc ggccaccagt 600
gccggtgcgg cgaaaacgtc agaaacgaat gctgcagcgt cacaacaatc agccgccacg 660
tctgcctcca ccgcggccac gaaagcgtca gaggccgcca cttcagcacg agatgcggtg 720
gcctcaaaag aggcagcaaa atcatcagaa acgaacgcat catcaagtgc cggtcgtgca 780
gcttcctcgg caacggcggc agaaaattct gccagggcgg caaaaacgtc cgagacgaat 840
gccaggtcat ctgaaacagc agcggaacgg agcgcctctg ccgcggcaga cgcaaaaaca 900
gcggcggcgg ggagtgcgtc aacggcatcc acgaaggcga cagaggctgc gggaagtgcg 960
gtatcagcat cgcagagcaa aagtgcggca gaagcggcgg caatacgtgc aaaaaattcg 1020
gcaaaacgtg cagaagatat agcttcagct gtcgcgcttg aggatgcgga cacaacgaga 1080
aaggggatag tgcagctcag cagtgcaacc aacagcacgt ctgaaacgct tgctgcaacg 1140
ccaaaggcgg ttaaggtggt aatggatgag actaatcgta aggcacctct ggacagtccg 1200
gcactgaccg gaacgccaac agcaccaacc gcgctcaggg gaacaaacaa tacccagatt 1260
gcgaacaccg cttttgtact ggccgcgatt gcagatgtta tcgacgcgtc acctgacgca 1320
ctgaatacgc tgaatgaact ggccgcagcg ctcgggaatg atccagattt tgctaccacc 1380
atgactaacg cgcttgcggg taaacaaccg aagaatgcga cactgacggc gctggcaggg 1440
ctttccacgg cgaaaaataa attaccgtat tttgcggaaa atgatgccgc cagcctgact 1500
gaactgactc aggttggcag ggatattctg gcaaaaaatt ccgttgcaga tgttcttgaa 1560
taccttgggg ccggtgagaa ttcggcggca aatgatggcg cggcacacat cggtcagtgc 1620
ccagacatct tgaccctgcg tactatcgag ccggaaaaaa acggtcagcg tatcacctta 1680
cgtcaacata cgattggcac tggcttaggc ggtggcgttt tccgtgcagt tctggacggc 1740
actggctata ccgatgacga cggtgtggtg atcaaaaccg ctgggggcag cgtttggctg 1800
cgtgtcaacg ctgacaaagt taacccgttc atgttcggtg caaccggagt agcggacgac 1860
accgccgccc tgcaaaaaat gctggaatgc ggtcgtgcgg cggaactggg gactaacgta 1920
tggaaagcaa gcaatctgga actgaacaac aaatcttgct ctctgtccgg cagtggcctg 1980
cacgtttctc gtattgaaca gatttccggt gcaaccggag cattgttaac catcacccaa 2040
gactgttcgc tgatttacct gtccgattgt ggcctgtacg gcgatggcat caccgcaggc 2100
acgagcggtg ttactatgga aacgggtaat ccgggtggcg ctccgtctta ccctttcaat 2160
accgctccgg acgttcgtcg tgacctgtac atctctaacg tgcacatcac gggcttcgac 2220
gagctgggtt ttgattatcc ggaaaccaat ttctctgttt cgacgcatgg cctcttcatc 2280
cgtaacatca aaaaaacggg tgcaaagatt ggtactacgg acttcacttg gactaacctg 2340
caaattgata cttgcggtca ggaatgtctg gtgctggacg gtgcgggtaa ctgccgtatt 2400
attggtgcaa aactgatttg ggcaggtagc gaaaacgaaa cgccatactc tggcctgcgt 2460
attagcaact ctcaaaatgt aaatatgact ggcgtagagt tacaagactg cgcgtatgat 2520
ggtttataca tcaagaactc tacggttgca atttcaggct taaacaccaa tcgcaatagc 2580
gcatcctcta atctgtccta ccataacatg gtattcgaaa attctattgt aactgttgat 2640
ggttatgtgt gtcgtaacta cgcggcgact tcgctgtacg acctgaacag ccaagcaggc 2700
aacgtccgtt gcatcggtag cgacagcacc gttttaatca acggcatcta cgaaagcgaa 2760
gtcaatagcg agcgcctgat gggtgataac aacctgatcc agccgtatag tggtgatctg 2820
atcattaacg gcctgaaaaa ttactacacc tatactggta gcgtaaaaaa caacattccg 2880
accttcgacg gcgttgttac tacggcaacc tatgtgagcg caccgtctat tctgggtcag 2940
ggcaatatgc tcaaactgac ccagtctaat aaagacaaac tgttatttag cgataaagtt 3000
agccgtcatg gctgtaccat cggcttagtt ctgattccgt cctttacggg cgcgaccact 3060
atgacggcgt tcacgctggg tagcggttac tctccatccg gtaactccgc cgtgatgcag 3120
ttcattgtta acagttccgg tgtacaaacc attgcgattt tattatccgg cgacggtatt 3180
acccaaaccc tgaccagcga tctgaccacg gaacaagcac tggcgagcgg tggcgtgtat 3240
cattttgcaa tgggttttgc gccgggtcgt ttatggtgga gcattatcga tattaacacg 3300
ggcaggcgta ttcgtcgcgc ctaccgtcag ccggatctgc acgcggcgtt caactctatc 3360
ttcaactccg gcacgtcgtc tattaccgca tttagcgggc cactggcggg cgacattgct 3420
tgcgaaggtg caggtagcca tgtatacgtt ggcggttttt cgtcggaatc tgattacgcg 3480
gctagccgta tgtatggcct gttcactccg gtcgatctgg acaagcagta tagcttccgt 3540
accctgaacg gtaacatt 3558
<210> 54
<211> 3588
<212> DNA
<213> 人工序列
<220>
<223> 编码STF-V10h的核酸
<400> 54
atggcagtaa agatttcagg agtcctgaaa gacggcacag gaaaaccggt acagaactgc 60
accattcagc tgaaagccag acgtaacagc accacggtgg tggtgaacac ggtgggctca 120
gagaatccgg atgaagccgg gcgttacagc atggatgtgg agtacggtca gtacagtgtc 180
atcctgcagg ttgacggttt tccaccatcg cacgccggga ccatcaccgt gtatgaagat 240
tcacaaccgg ggacgctgaa tgattttctc tgtgccatga cggaggatga tgcccggccg 300
gaggtgctgc gtcgtcttga actgatggtg gaagaggtgg cgcgtaacgc gtccgtggtg 360
gcacagagta cggcagacgc gaagaaatca gccggcgatg ccagtgcatc agctgctcag 420
gtcgcggccc ttgtgactga tgcaactgac tcagcacgcg ccgccagcac gtccgccgga 480
caggctgcat cgtcagctca ggaagcgtcc tccggcgcag aagcggcatc agcaaaggcc 540
actgaagcgg aaaaaagtgc cgcagccgca gagtcctcaa aaaacgcggc ggccaccagt 600
gccggtgcgg cgaaaacgtc agaaacgaat gctgcagcgt cacaacaatc agccgccacg 660
tctgcctcca ccgcggccac gaaagcgtca gaggccgcca cttcagcacg agatgcggtg 720
gcctcaaaag aggcagcaaa atcatcagaa acgaacgcat catcaagtgc cggtcgtgca 780
gcttcctcgg caacggcggc agaaaattct gccagggcgg caaaaacgtc cgagacgaat 840
gccaggtcat ctgaaacagc agcggaacgg agcgcctctg ccgcggcaga cgcaaaaaca 900
gcggcggcgg ggagtgcgtc aacggcatcc acgaaggcga cagaggctgc gggaagtgcg 960
gtatcagcat cgcagagcaa aagtgcggca gaagcggcgg caatacgtgc aaaaaattcg 1020
gcaaaacgtg cagaagatat agcttcagct gtcgcgcttg aggatgcgga cacaacgaga 1080
aaggggatag tgcagctcag cagtgcaacc aacagcacgt ctgaaacgct tgctgcaacg 1140
ccaaaggcgg ttaaggtggt aatggatgag actaatcgta aggcacctct ggacagtccg 1200
gcactgaccg gaacgccaac agcaccaacc gcgctcaggg gaacaaacaa tacccagatt 1260
gcgaacaccg cttttgtact ggccgcgatt gcagatgtta tcgacgcgtc acctgacgca 1320
ctgaatacgc tgaatgaact ggccgcagcg ctcgggaatg atccagattt tgctaccacc 1380
atgactaacg cgcttgcggg taaacaaccg aagaatgcga cactgacggc gctggcaggg 1440
ctttccacgg cgaaaaataa attaccgtat tttgcggaaa atgatgccgc cagcctgact 1500
gaactgactc aggttggcag ggatattctg gcaaaaaatt ccgttgcaga tgttcttgaa 1560
taccttgggg ccggtgagaa ttcggggagc gctacagacg ttatgattca gctggcggca 1620
aatgatggct tcaaattcat cggtcagtgc ccagacatct tgaccctgcg tactatcgag 1680
ccggaaaaaa acggtcagcg tatcacctta cgtcaacata cgattggcac tggcttaggc 1740
ggtggcgttt tccgtgcagt tctggacggc actggctata ccgatgacga cggtgtggtg 1800
atcaaaaccg ctgggggcag cgtttggctg cgtgtcaacg ctgacaaagt taacccgttc 1860
atgttcggtg caaccggagt agcggacgac accgccgccc tgcaaaaaat gctggaatgc 1920
ggtcgtgcgg cggaactggg gactaacgta tggaaagcaa gcaatctgga actgaacaac 1980
aaatcttgct ctctgtccgg cagtggcctg cacgtttctc gtattgaaca gatttccggt 2040
gcaaccggag cattgttaac catcacccaa gactgttcgc tgatttacct gtccgattgt 2100
ggcctgtacg gcgatggcat caccgcaggc acgagcggtg ttactatgga aacgggtaat 2160
ccgggtggcg ctccgtctta ccctttcaat accgctccgg acgttcgtcg tgacctgtac 2220
atctctaacg tgcacatcac gggcttcgac gagctgggtt ttgattatcc ggaaaccaat 2280
ttctctgttt cgacgcatgg cctcttcatc cgtaacatca aaaaaacggg tgcaaagatt 2340
ggtactacgg acttcacttg gactaacctg caaattgata cttgcggtca ggaatgtctg 2400
gtgctggacg gtgcgggtaa ctgccgtatt attggtgcaa aactgatttg ggcaggtagc 2460
gaaaacgaaa cgccatactc tggcctgcgt attagcaact ctcaaaatgt aaatatgact 2520
ggcgtagagt tacaagactg cgcgtatgat ggtttataca tcaagaactc tacggttgca 2580
atttcaggct taaacaccaa tcgcaatagc gcatcctcta atctgtccta ccataacatg 2640
gtattcgaaa attctattgt aactgttgat ggttatgtgt gtcgtaacta cgcggcgact 2700
tcgctgtacg acctgaacag ccaagcaggc aacgtccgtt gcatcggtag cgacagcacc 2760
gttttaatca acggcatcta cgaaagcgaa gtcaatagcg agcgcctgat gggtgataac 2820
aacctgatcc agccgtatag tggtgatctg atcattaacg gcctgaaaaa ttactacacc 2880
tatactggta gcgtaaaaaa caacattccg accttcgacg gcgttgttac tacggcaacc 2940
tatgtgagcg caccgtctat tctgggtcag ggcaatatgc tcaaactgac ccagtctaat 3000
aaagacaaac tgttatttag cgataaagtt agccgtcatg gctgtaccat cggcttagtt 3060
ctgattccgt cctttacggg cgcgaccact atgacggcgt tcacgctggg tagcggttac 3120
tctccatccg gtaactccgc cgtgatgcag ttcattgtta acagttccgg tgtacaaacc 3180
attgcgattt tattatccgg cgacggtatt acccaaaccc tgaccagcga tctgaccacg 3240
gaacaagcac tggcgagcgg tggcgtgtat cattttgcaa tgggttttgc gccgggtcgt 3300
ttatggtgga gcattatcga tattaacacg ggcaggcgta ttcgtcgcgc ctaccgtcag 3360
ccggatctgc acgcggcgtt caactctatc ttcaactccg gcacgtcgtc tattaccgca 3420
tttagcgggc cactggcggg cgacattgct tgcgaaggtg caggtagcca tgtatacgtt 3480
ggcggttttt cgtcggaatc tgattacgcg gctagccgta tgtatggcct gttcactccg 3540
gtcgatctgg acaagcagta tagcttccgt accctgaacg gtaacatt 3588
<210> 55
<211> 2032
<212> DNA
<213> 人工序列
<220>
<223> 编码A8的核酸
<400> 55
atgggtaaag gaagcagtaa ggggcatacc ccgcgcgaag cgaaggacaa cctgaagtcc 60
acgcagttgc tgagtgtgat cgatgccatc agcgaagggc cgattgaagg tccggtggat 120
ggcttaaaaa gcgtgctgct gaacagtacg ccggtgctgg acactgaggg gaataccaac 180
atatccggtg tcacggtggt gttccgggct ggtgagcagg agcagactcc gccggaggga 240
tttgaatcct ccggctccga gacggtgctg ggtacggaag tgaaatatga cacgccgatc 300
acccgcacca ttacgtctgc aaacatcgac cgtctgcgct ttaccttcgg tgtacaggca 360
ctggtggaaa ccacctcaaa gggtgacagg aatccgtcgg aagtccgcct gctggttcag 420
atacaacgta acggtggctg ggtgacggaa aaagacatca ccattaaggg caaaaccacc 480
tcgcagtatc tggcctcggt ggtgatgggt aacctgccgc cgcgcccgtt taatatccgg 540
atgcgcagga tgacgccgga cagcaccaca gaccagctgc agaacaaaac gctctggtcg 600
tcatacactg aaatcatcga tgtgaaacag tgctacccga acacggcact ggtcggcgtg 660
caggtggact cggagcagtt cggcagccag caggtgagcc gtaattatca tctgcgcggg 720
cgtattctgc aggtgccgtc gaactataac ccgcagacgc ggcaatacag cggtatctgg 780
gacggaacgt ttaaaccggc atacagcaac aacatggcct ggtgtctgtg ggatatgctg 840
acccatccgc gctacggcat ggggaaacgt cttggtgcgg cggatgtgga taaatgggcg 900
ctgtatgtca tcggccagta ctgcgaccag tcagtgccgg acggctttgg cggcacggag 960
ccgcgcatca cctgtaatgc gtacctgacc acacagcgta aggcgtggga tgtgctcagc 1020
gatttctgct cggcgatgcg ctgtatgccg gtatggaacg ggcagacgct gacgttcgtg 1080
caggaccgac cgtcggataa gacgtggacc tataaccgca gtaatgtggt gatgccggat 1140
gatggcgcgc cgttccgcta cagcttcagc gccctgaagg accgccataa tgccgttgag 1200
gtgaactgga ttgacccgaa caacggctgg gagacggcga cagagcttgt tgaagatacg 1260
caggccattg cccgttacgg tcgtaatgtt acgaagatgg atgcctttgg ctgtaccagc 1320
cgggggcagg cacaccgcgc cgggctgtgg ctgattaaaa cagaactgct ggaaacgcag 1380
accgtggatt tcagcgtcgg cgcagaaggg cttcgccatg taccgggcga tgttattgaa 1440
atctgcgatg atgactatgc cggtatcagc accggtggtc gtgtgctggc ggtgaacagc 1500
cagacccgga cgctgacgct cgaccgtgaa atcacgctgc catcctccgg taccgcgctg 1560
ataagcctgg ttgacggaag tggcaatccg gtcagcgtgg aggttcagtc cgtcaccgac 1620
ggcgtgaagg taaaagtgag ccgtgttcct gacggtgttg ctgaatacag cgtatgggag 1680
ctgaagctgc cgacgctgcg ccagcgactg ttccgctgcg tgagtatccg tgagaacgac 1740
gacggcacgt atgccatcac cgccgtgcag catgtgccgg aaaaagaggc catcgtggat 1800
aacggggcgc actttgacgg cgaacagagt ggcacggtga atggtgtcac gccgccagcg 1860
gtgcagcacc tgaccgcaga agtcactgca gacagcgggg aatatcaggt gctggcgcga 1920
tgggacacac cgaaggtggt gaagggcgtg agtttcctgc tccgtctgac cgtaacagcg 1980
gacgacggca gtgagcggct ggtcagcacg gcccggacga cggaaaccac at 2032
<210> 56
<211> 2045
<212> DNA
<213> 人工序列
<220>
<223> 编码STF λ-P2的核酸
<400> 56
atggcagtaa agatttcagg agtcctgaaa gacggcacag gaaaaccggt acagaactgc 60
accattcagc tgaaagccag acgtaacagc accacggtgg tggtgaacac ggtgggctca 120
gagaatccgg atgaagccgg gcgttacagc atggatgtgg agtacggtca gtacagtgtc 180
atcctgcagg ttgacggttt tccaccatcg cacgccggga ccatcaccgt gtatgaagat 240
tcacaaccgg ggacgctgaa tgattttctc tgtgccatga cggaggatga tgcccggccg 300
gaggtgctgc gtcgtcttga actgatggtg gaagaggtgg cgcgtaacgc gtccgtggtg 360
gcacagagta cggcagacgc gaagaaatca gccggcgatg ccagtgcatc agctgctcag 420
gtcgcggccc ttgtgactga tgcaactgac tcagcacgcg ccgccagcac gtccgccgga 480
caggctgcat cgtcagctca ggaagcgtcc tccggcgcag aagcggcatc agcaaaggcc 540
actgaagcgg aaaaaagtgc cgcagccgca gagtcctcaa aaaacgcggc ggccaccagt 600
gccggtgcgg cgaaaacgtc agaaacgaat gctgcagcgt cacaacaatc agccgccacg 660
tctgcctcca ccgcggccac gaaagcgtca gaggccgcca cttcagcacg agatgcggtg 720
gcctcaaaag aggcagcaaa atcatcagaa acgaacgcat catcaagtgc cggtcgtgca 780
gcttcctcgg caacggcggc agaaaattct gccagggcgg caaaaacgtc cgagacgaat 840
gccaggtcat ctgaaacagc agcggaacgg agcgcctctg ccgcggcaga cgcaaaaaca 900
gcggcggcgg ggagtgcgtc aacggcatcc acgaaggcga cagaggctgc gggaagtgcg 960
gtatcagcat cgcagagcaa aagtgcggca gaagcggcgg caatacgtgc aaaaaattcg 1020
gcaaaacgtg cagaagatat agcttcagct gtcgcgcttg aggatgcgga cacaacgaga 1080
aaggggatag tgcagctcag cagtgcaacc aacagcacgt ctgaaacgct tgctgcaacg 1140
ccaaaggcgg ttaaggtggt aatggatgag actaatcgta aagcgccatt aaacagccct 1200
gcactgaccg gaacgccaac gacgccaact gcgcgacagg gaacgaataa tactcagatc 1260
gcaaacacgg ctttcgttat ggccgcgatt gccgcccttg tagactcgtc gcctgacgca 1320
ctgaatacgc tgaacgagct ggcggcggcg ctgggcaatg acccgaattt tgctaccacc 1380
atgactaatg cgcttgcggg taagcaaccg aaagatgcta ccctgacggc gctggcgggg 1440
cttgctactg cggcagacag gtttccgtat tttacgggga atgatgttgc cagcctggcg 1500
accctgacaa aagtcgggcg ggatattctg gctaaatcga ccgttgccgc cgttatcgaa 1560
tatctcggtt tacaggaaac ggtaaaccga gccgggaacg ccgtgcaaaa aaatggcgat 1620
accttgtccg gtggacttac ttttgaaaac gactcaatcc ttgcctggat tcgaaatact 1680
gactgggcga agattggatt taaaaatgat gccgatggtg acactgattc atacatgtgg 1740
tttgaaacgg gggataacgg caatgaatat ttcaaatgga gaagccgcca gagtaccaca 1800
acaaaagacc tgatgacgtt gaaatgggat gcactaaata ttcttgttaa tgccgtcatt 1860
aatggctgtt ttggagttgg tacgacgaat gcactaggtg gtagctctat tgttcttggt 1920
gataatgata ccggatttaa acagaatgga gacggtattc ttgatgttta tgctaacagt 1980
cagcgtgtat tccgttttca gaatggagtg gctattgctt ttaaaaatat tcaggcaggt 2040
gatag 2045
<210> 57
<211> 175
<212> PRT
<213> 人工序列
<220>
<223> P2辅助蛋白1
<400> 57
Met Gln His Leu Lys Asn Ile Lys Ser Gly Asn Pro Lys Thr Lys Glu
1 5 10 15
Gln Tyr Gln Leu Thr Lys Asn Phe Asp Val Ile Trp Leu Trp Ser Glu
20 25 30
Asp Gly Lys Asn Trp Tyr Glu Glu Val Lys Asn Phe Gln Pro Asp Thr
35 40 45
Ile Lys Ile Val Tyr Asp Glu Asn Asn Ile Ile Val Ala Ile Thr Arg
50 55 60
Asp Ala Ser Thr Leu Asn Pro Glu Gly Phe Ser Val Val Glu Val Pro
65 70 75 80
Asp Ile Thr Ser Asn Arg Arg Ala Asp Asp Ser Gly Lys Trp Met Phe
85 90 95
Lys Asp Gly Ala Val Val Lys Arg Ile Tyr Thr Ala Asp Glu Gln Gln
100 105 110
Gln Gln Ala Glu Ser Gln Lys Ala Ala Leu Leu Ser Glu Ala Glu Asn
115 120 125
Val Ile Gln Pro Leu Glu Arg Ala Val Arg Leu Asn Met Ala Thr Asp
130 135 140
Glu Glu Arg Ala Arg Leu Glu Ser Trp Glu Arg Tyr Ser Val Leu Val
145 150 155 160
Ser Arg Val Asp Pro Ala Asn Pro Glu Trp Pro Glu Met Pro Gln
165 170 175
<210> 58
<211> 525
<212> DNA
<213> 人工序列
<220>
<223> 编码P2辅助蛋白1的核酸
<400> 58
atgcagcatt taaagaacat taagtcaggt aatccaaaaa caaaagagca atatcagcta 60
acaaagaatt ttgatgttat ctggttatgg tccgaagacg gaaaaaactg gtatgaggaa 120
gtgaagaact ttcagccaga cacaataaag attgtttacg atgaaaataa tattattgtc 180
gctatcacca gagatgcttc aacgcttaat cctgaaggtt ttagcgttgt tgaggttcct 240
gatattacct ccaaccgacg tgctgacgac tcaggtaaat ggatgtttaa ggatggtgct 300
gtggttaaac ggatttatac ggcagatgaa cagcaacaac aggcagaatc acaaaaggcc 360
gcgttacttt ccgaagcgga aaacgttatt cagccactgg aacgcgctgt caggctgaat 420
atggcgacgg atgaggaacg tgcacgactg gagtcatggg aacgttacag cgttctggtc 480
agccgtgtgg atcctgcaaa tcctgaatgg ccggaaatgc cgcaa 525
<210> 59
<211> 1158
<212> PRT
<213> 人工序列
<220>
<223> 图7的Z2145 gpJ的序列
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> Xaa可为任何氨基酸
<220>
<221> MISC_FEATURE
<222> (495)..(495)
<223> Xaa可为任何氨基酸
<220>
<221> MISC_FEATURE
<222> (813)..(820)
<223> 框1
<220>
<221> MISC_FEATURE
<222> (985)..(993)
<223> 框2
<400> 59
Met Gly Lys Gly Gly Gly Lys Gly Xaa Thr Pro Val Glu Ala Lys Asp
1 5 10 15
Asn Leu Lys Ser Thr Gln Met Met Ser Val Ile Asp Ala Ile Gly Glu
20 25 30
Gly Pro Ile Glu Gly Pro Val Lys Gly Leu Gln Ser Ile Leu Val Asn
35 40 45
Lys Thr Pro Leu Thr Asp Thr Asp Gly Asn Pro Val Ile His Gly Val
50 55 60
Thr Ala Val Trp Arg Ala Gly Glu Gln Glu Gln Thr Pro Pro Glu Gly
65 70 75 80
Phe Glu Ser Ser Gly Ala Glu Thr Ala Leu Gly Val Glu Val Thr Lys
85 90 95
Ala Lys Pro Val Thr Arg Thr Ile Thr Ser Ala Asn Ile Asp Arg Leu
100 105 110
Arg Val Thr Phe Gly Val Gln Ser Leu Leu Glu Thr Thr Ser Lys Gly
115 120 125
Asp Arg Asn Pro Ser Ser Val Arg Leu Leu Ile Gln Leu Gln Arg Asn
130 135 140
Gly Asn Trp Val Thr Glu Lys Asp Val Thr Ile Asn Gly Lys Thr Thr
145 150 155 160
Ser Gln Phe Leu Ala Ser Val Ile Leu Asp Asn Leu Pro Pro Arg Pro
165 170 175
Phe Asn Ile Arg Met Val Arg Glu Thr Ala Asp Ser Thr Ser Asp Gln
180 185 190
Leu Gln Asn Lys Thr Leu Trp Ser Ser Tyr Thr Glu Ile Ile Asp Val
195 200 205
Lys Gln Cys Tyr Pro Asn Thr Ala Ile Val Gly Leu Gln Val Asp Ala
210 215 220
Glu Gln Phe Gly Gly Gln Gln Met Thr Val Asn Tyr His Ile Arg Gly
225 230 235 240
Arg Ile Ile Gln Val Pro Ser Asn Tyr Asp Pro Glu Lys Arg Thr Tyr
245 250 255
Ser Gly Ile Trp Asp Gly Ser Leu Lys Pro Ala Tyr Ser Asn Asn Pro
260 265 270
Ala Trp Cys Leu Trp Asp Met Leu Thr His Pro Arg Tyr Gly Met Gly
275 280 285
Lys Arg Leu Gly Ala Ala Asp Val Asp Lys Trp Ala Leu Tyr Ala Ile
290 295 300
Ala Gln Tyr Cys Asp Gln Met Val Pro Asp Gly Phe Gly Gly Thr Glu
305 310 315 320
Pro Arg Met Thr Phe Asn Ala Tyr Leu Ser Gln Gln Arg Lys Ala Trp
325 330 335
Asp Val Leu Ser Asp Phe Cys Ser Ala Met Arg Cys Met Pro Val Trp
340 345 350
Asn Gly Gln Thr Leu Thr Phe Val Gln Asp Ser Pro Ser Asp Val Val
355 360 365
Trp Pro Tyr Thr Asn Ser Asp Val Val Val Asp Asp Asn Gly Val Gly
370 375 380
Phe Arg Tyr Ser Phe Ser Ala Leu Lys Asp Arg His Thr Ala Val Glu
385 390 395 400
Val Asn Tyr Thr Asp Pro Gln Asn Gly Trp Gln Thr Ser Thr Glu Leu
405 410 415
Val Glu Asp Pro Glu Ala Ile Leu Arg Tyr Gly Arg Asn Leu Leu Lys
420 425 430
Met Asp Ala Phe Gly Cys Thr Ser Arg Gly Gln Ala His Arg Ala Gly
435 440 445
Leu Trp Val Ile Lys Thr Gly Leu Leu Glu Thr Gln Thr Val Asp Phe
450 455 460
Thr Leu Gly Ser Gln Gly Leu Arg His Thr Pro Gly Asp Ile Ile Glu
465 470 475 480
Ile Cys Asp Asn Asp Tyr Ala Gly Thr Met Thr Gly Gly Arg Xaa Leu
485 490 495
Ser Ile Asp Ala Ala Ser Arg Thr Leu Thr Leu Asp Arg Glu Val Thr
500 505 510
Leu Pro Glu Thr Gly Ala Ala Thr Val Asn Leu Ile Asn Gly Ser Gly
515 520 525
Lys Pro Val Ser Val Ala Ile Thr Ala His Pro Ala Pro Asp Arg Ile
530 535 540
Gln Val Ser Thr Leu Pro Asp Gly Val Glu Thr Tyr Gly Val Trp Gly
545 550 555 560
Leu Ser Leu Pro Ser Leu Arg Arg Arg Leu Phe Arg Cys Val Ser Val
565 570 575
Arg Glu Asn Thr Asp Gly Thr Phe Ala Ile Thr Ala Val Gln His Val
580 585 590
Pro Glu Lys Glu Ala Ile Val Asp Asn Gly Ala Arg Phe Glu Pro Gln
595 600 605
Ser Gly Thr Leu Asn Ser Val Ile Pro Pro Ala Val Gln His Leu Thr
610 615 620
Val Glu Val Ser Ala Ala Asp Gly Gln Tyr Leu Ala Gln Ala Lys Trp
625 630 635 640
Asp Thr Pro Lys Val Val Lys Gly Val Ser Phe Met Leu Arg Leu Thr
645 650 655
Val Ala Ala Asp Asp Gly Ser Glu Arg Leu Val Ser Thr Ala Arg Thr
660 665 670
Thr Glu Thr Thr Tyr Arg Phe Thr Gln Leu Ala Pro Gly Asn Tyr Arg
675 680 685
Leu Thr Val Arg Ala Val Asn Ala Trp Gly Gln Gln Gly Asp Pro Ala
690 695 700
Ser Val Ser Phe Arg Ile Ala Ala Pro Ala Ala Pro Ser Gln Ile Glu
705 710 715 720
Leu Thr Pro Gly Tyr Phe Gln Ile Thr Ala Val Pro Arg Leu Ala Val
725 730 735
Tyr Asp Pro Thr Val Gln Phe Glu Phe Trp Phe Ser Glu Thr Arg Ile
740 745 750
Thr Asp Ile Arg Gln Val Glu Thr Thr Ala Arg Tyr Leu Gly Thr Gly
755 760 765
Leu Tyr Trp Ile Ala Ala Ser Ile Asn Ile Lys Pro Gly His Asp Tyr
770 775 780
Tyr Phe Tyr Ile Arg Ser Val Asn Thr Val Gly Lys Ser Ala Phe Val
785 790 795 800
Glu Ala Val Gly Gln Pro Ser Asp Asp Ala Ser Gly Tyr Leu Asp Phe
805 810 815
Phe Lys Gly Glu Ile Gly Lys Thr His Leu Ala Gln Glu Leu Trp Thr
820 825 830
Gln Ile Asp Asn Gly Gln Leu Ala Pro Asp Leu Ala Glu Ile Arg Thr
835 840 845
Ser Ile Thr Asp Val Ser Asn Glu Ile Thr Gln Thr Val Asn Lys Lys
850 855 860
Leu Glu Asp Gln Ser Ala Ala Ile Gln Gln Ile Gln Lys Val Gln Val
865 870 875 880
Asp Thr Asn Asn Asn Leu Asn Ser Met Trp Ala Val Lys Leu Gln Gln
885 890 895
Met Gln Asp Gly Arg Leu Tyr Ile Ala Gly Ile Gly Ala Gly Ile Glu
900 905 910
Asn Thr Ser Asp Gly Met Gln Ser Gln Val Leu Leu Ala Ala Asp Arg
915 920 925
Ile Ala Met Ile Asn Pro Ala Asn Gly Asn Thr Lys Pro Met Phe Val
930 935 940
Gly Gln Gly Asp Gln Ile Phe Met Asn Glu Val Phe Leu Lys Tyr Leu
945 950 955 960
Thr Ala Pro Thr Ile Thr Ser Gly Gly Asn Pro Pro Ala Phe Ser Leu
965 970 975
Thr Ser Asp Gly Lys Leu Thr Ala Lys Asn Ala Asp Ile Ser Gly Ser
980 985 990
Val Asn Ala Asn Ser Gly Thr Leu Asn Asn Val Thr Ile Asn Glu Asn
995 1000 1005
Cys Arg Val Leu Gly Lys Leu Ser Ala Asn Gln Ile Glu Gly Asp
1010 1015 1020
Leu Val Lys Thr Val Gly Lys Ala Phe Pro Arg Asp Ser Arg Ala
1025 1030 1035
Pro Glu Arg Trp Pro Ser Gly Thr Ile Thr Val Arg Val Tyr Asp
1040 1045 1050
Asp Gln Pro Phe Asp Arg Gln Ile Val Ile Pro Ala Val Ala Phe
1055 1060 1065
Ser Gly Ala Lys His Glu Arg Glu His Thr Asp Ile Tyr Ser Ser
1070 1075 1080
Cys Arg Leu Ile Val Arg Lys Asn Gly Ala Glu Ile Tyr Asn Arg
1085 1090 1095
Thr Ala Leu Asp Asn Thr Leu Ile Tyr Ser Gly Val Ile Asp Met
1100 1105 1110
Pro Ala Gly His Gly His Met Thr Leu Glu Phe Ser Val Ser Ala
1115 1120 1125
Trp Leu Val Asn Asn Trp Tyr Pro Thr Ala Ser Ile Ser Asp Leu
1130 1135 1140
Leu Val Val Val Met Lys Lys Ala Thr Ala Gly Ile Ser Ile Ser
1145 1150 1155
<210> 60
<211> 1131
<212> PRT
<213> 人工序列
<220>
<223> 图7的1A2 gpJ的序列
<220>
<221> MISC_FEATURE
<222> (814)..(821)
<223> 框1
<220>
<221> MISC_FEATURE
<222> (958)..(966)
<223> 框2
<400> 60
Met Gly Lys Gly Ser Ser Lys Gly His Thr Pro Arg Glu Ala Lys Asp
1 5 10 15
Asn Leu Lys Ser Thr Gln Leu Leu Ser Val Ile Asp Ala Ile Ser Glu
20 25 30
Gly Pro Val Glu Gly Pro Val Asp Gly Leu Lys Ser Val Leu Leu Asn
35 40 45
Ser Thr Pro Val Leu Asp Ser Glu Gly Asn Thr Asn Ile Ser Gly Val
50 55 60
Thr Val Val Phe Arg Ala Gly Glu Gln Glu Gln Thr Pro Pro Glu Gly
65 70 75 80
Phe Glu Ser Ser Gly Ser Glu Thr Val Leu Gly Thr Glu Val Lys Tyr
85 90 95
Asp Thr Pro Ile Thr Arg Thr Ile Thr Ser Ala Asn Ile Asp Arg Leu
100 105 110
Arg Phe Thr Phe Gly Val Gln Ala Leu Val Glu Thr Thr Ser Lys Gly
115 120 125
Asp Arg Asn Pro Ser Glu Val Arg Leu Leu Val Gln Ile Gln Arg Asn
130 135 140
Gly Gly Trp Val Thr Glu Lys Asp Ile Thr Ile Lys Gly Lys Thr Thr
145 150 155 160
Ser Gln Tyr Leu Ala Ser Val Val Val Gly Asn Leu Pro Pro Arg Pro
165 170 175
Phe Asn Ile Arg Met Arg Arg Met Thr Pro Asp Ser Thr Thr Asp Gln
180 185 190
Leu Gln Asn Lys Thr Leu Trp Ser Ser Tyr Thr Glu Ile Ile Asp Val
195 200 205
Lys Gln Cys Tyr Pro Asn Thr Ala Leu Val Gly Val Gln Val Asp Ser
210 215 220
Glu Gln Phe Gly Ser Gln Gln Val Ser Arg Asn Tyr His Leu Arg Gly
225 230 235 240
Arg Ile Leu Gln Val Pro Ser Asn Tyr Asn Pro Gln Thr Arg Gln Tyr
245 250 255
Ser Gly Ile Trp Asp Gly Thr Phe Lys Pro Ala Tyr Ser Asn Asn Met
260 265 270
Ala Trp Cys Leu Trp Asp Met Leu Thr His Pro Arg Tyr Gly Met Gly
275 280 285
Lys Arg Leu Gly Ala Ala Asp Val Asp Lys Trp Ala Leu Tyr Val Ile
290 295 300
Gly Gln Tyr Cys Asp Gln Ser Val Pro Asp Gly Phe Gly Gly Thr Glu
305 310 315 320
Pro Arg Ile Thr Cys Asn Ala Tyr Leu Thr Thr Gln Arg Lys Ala Trp
325 330 335
Asp Val Leu Ser Asp Phe Cys Ser Ala Met Arg Cys Met Pro Val Trp
340 345 350
Asn Gly Gln Thr Leu Thr Phe Val Gln Asp Arg Pro Ser Asp Lys Val
355 360 365
Trp Thr Tyr Asn Arg Ser Asn Val Val Met Pro Asp Asp Gly Ala Pro
370 375 380
Phe Arg Tyr Ser Phe Ser Ala Leu Lys Asp Arg His Asn Ala Val Glu
385 390 395 400
Val Asn Trp Ile Asp Pro Asn Asn Gly Trp Glu Thr Ala Ala Glu Leu
405 410 415
Val Glu Asp Thr Gln Ala Ile Ala Arg Tyr Gly Arg Asn Val Thr Lys
420 425 430
Met Asp Ala Phe Gly Cys Thr Ser Arg Gly Gln Ala His Arg Ala Gly
435 440 445
Leu Trp Leu Ile Lys Thr Glu Leu Leu Glu Thr Gln Thr Val Asp Phe
450 455 460
Ser Val Gly Ala Glu Gly Leu Arg His Val Pro Gly Asp Val Ile Glu
465 470 475 480
Ile Cys Asp Asp Asp Tyr Ala Gly Ile Ser Ile Gly Gly Arg Val Leu
485 490 495
Ala Val Asn Ser Gln Thr Arg Thr Leu Thr Leu Asp Arg Glu Ile Thr
500 505 510
Leu Pro Phe Ser Gly Thr Thr Leu Ile Ser Leu Val Asp Gly Ser Gly
515 520 525
Asn Pro Val Ser Val Glu Val Gln Ser Val Thr Asp Gly Val Lys Val
530 535 540
Lys Val Ser Arg Val Pro Asp Gly Val Ala Glu Tyr Ser Val Trp Gly
545 550 555 560
Leu Lys Leu Pro Thr Leu Arg Gln Arg Leu Phe Arg Cys Val Ser Ile
565 570 575
Arg Glu Asn Asp Asp Gly Thr Tyr Ala Ile Thr Ala Val Gln His Val
580 585 590
Pro Glu Lys Glu Ala Ile Val Asp Asn Gly Ala His Phe Asp Gly Asp
595 600 605
Gln Ser Gly Thr Val Asn Gly Val Thr Pro Pro Ala Val Gln His Leu
610 615 620
Thr Ala Glu Val Thr Ala Asp Ser Gly Glu Tyr Gln Val Leu Ala Arg
625 630 635 640
Trp Asp Thr Pro Lys Val Val Lys Gly Val Ser Phe Leu Leu Arg Leu
645 650 655
Thr Val Thr Ala Asp Asp Gly Ser Glu Arg Leu Val Ser Thr Ala Arg
660 665 670
Thr Thr Glu Thr Thr Tyr Arg Phe Thr Gln Leu Ala Leu Gly Asn Tyr
675 680 685
Arg Leu Thr Val Arg Ala Val Asn Ala Trp Gly Gln Gln Gly Asp Pro
690 695 700
Ala Ser Val Ser Phe Arg Ile Ala Ala Pro Ala Ala Pro Ser Arg Ile
705 710 715 720
Glu Leu Thr Pro Gly Tyr Phe Gln Ile Thr Ala Thr Pro His Leu Ala
725 730 735
Val Tyr Asp Pro Thr Val Gln Phe Glu Phe Trp Phe Ser Glu Lys Arg
740 745 750
Ile Ala Asp Ile Arg Gln Val Glu Thr Thr Ala Arg Tyr Leu Gly Thr
755 760 765
Gly Leu Tyr Trp Ile Ala Ala Ser Ile Asn Ile Lys Pro Gly His Asp
770 775 780
Tyr Tyr Phe Tyr Ile Arg Ser Val Asn Thr Val Gly Lys Ser Ala Phe
785 790 795 800
Val Glu Ala Val Gly Arg Ala Ser Asp Asp Ala Glu Gly Tyr Leu Asp
805 810 815
Phe Phe Lys Gly Lys Ile Thr Glu Ser His Leu Gly Lys Glu Leu Leu
820 825 830
Glu Lys Val Asp Leu Thr Glu Asp Asn Ala Ser Arg Leu Asp Gln Phe
835 840 845
Ser Lys Glu Trp Lys Asp Ala Asn Asp Lys Trp Asn Ala Met Trp Gly
850 855 860
Val Lys Ile Glu Gln Thr Glu Asp Gly Lys His Tyr Val Ala Gly Leu
865 870 875 880
Gly Leu Ser Met Glu Asp Thr Glu Glu Gly Lys Leu Ser Gln Phe Leu
885 890 895
Val Ala Ala Asn Arg Ile Ala Phe Ile Asp Pro Ser Asn Gly Asn Thr
900 905 910
Arg Pro Met Phe Val Gly Gln Gly Asp Gln Ile Phe Met Asn Asp Val
915 920 925
Phe Leu Lys Arg Leu Thr Ala Pro Thr Ile Thr Ser Gly Gly Asn Pro
930 935 940
Pro Ala Phe Ser Leu Thr Pro Asp Gly Arg Leu Thr Ala Lys Asn Ala
945 950 955 960
Asp Ile Ser Gly Asn Val Asn Ala Asn Ser Gly Thr Leu Asn Asn Val
965 970 975
Thr Ile Asn Glu Asn Cys Arg Val Leu Gly Lys Leu Ser Ala Asn Gln
980 985 990
Ile Glu Gly Asp Leu Val Lys Thr Val Gly Lys Ala Phe Pro Arg Asp
995 1000 1005
Ser Arg Ala Pro Glu Arg Trp Pro Ser Gly Thr Ile Thr Val Arg
1010 1015 1020
Val Tyr Asp Asp Gln Pro Phe Asp Arg Gln Ile Val Ile Pro Ala
1025 1030 1035
Val Ala Phe Ser Gly Ala Lys His Glu Lys Glu His Thr Asp Ile
1040 1045 1050
Tyr Ser Ser Cys Arg Leu Ile Val Arg Lys Asn Gly Ala Glu Ile
1055 1060 1065
Tyr Asn Arg Thr Ala Leu Asp Asn Thr Leu Ile Tyr Ser Gly Val
1070 1075 1080
Ile Asp Met Pro Ala Gly His Gly His Met Thr Leu Glu Phe Ser
1085 1090 1095
Val Ser Ala Trp Leu Val Asn Asn Trp Tyr Pro Thr Ala Ser Ile
1100 1105 1110
Ser Asp Leu Leu Val Val Val Met Lys Lys Ala Thr Ala Gly Ile
1115 1120 1125
Thr Ile Ser
1130
<210> 61
<211> 1132
<212> PRT
<213> 人工序列
<220>
<223> 图7的591 gpJ序列
<220>
<221> MISC_FEATURE
<222> (814)..(821)
<223> 框1
<220>
<221> MISC_FEATURE
<222> (958)..(966)
<223> 框2
<400> 61
Met Gly Lys Gly Ser Ser Lys Gly His Thr Pro Arg Glu Ala Lys Asp
1 5 10 15
Asn Leu Lys Ser Thr Gln Leu Leu Ser Val Ile Asp Ala Ile Ser Glu
20 25 30
Gly Pro Val Glu Gly Pro Val Asp Gly Leu Lys Ser Val Leu Leu Asn
35 40 45
Ser Thr Pro Val Leu Asp Ser Glu Gly Asn Thr Asn Ile Ser Gly Val
50 55 60
Thr Val Val Phe Arg Ala Gly Glu Gln Glu Gln Thr Pro Pro Glu Gly
65 70 75 80
Phe Glu Ser Ser Gly Ser Glu Thr Val Leu Gly Thr Glu Val Lys Tyr
85 90 95
Asp Thr Pro Ile Thr Arg Thr Ile Thr Ser Ala Asn Ile Asp Arg Leu
100 105 110
Arg Phe Thr Phe Gly Val Gln Ala Leu Val Glu Thr Thr Ser Lys Gly
115 120 125
Asp Arg Asn Pro Ser Glu Val Arg Leu Leu Val Gln Ile Gln Arg Asn
130 135 140
Gly Gly Trp Val Thr Glu Lys Asp Ile Thr Ile Lys Gly Lys Thr Thr
145 150 155 160
Ser Gln Tyr Leu Ala Ser Val Val Val Gly Ser Leu Pro Pro Arg Pro
165 170 175
Phe Asn Ile Arg Met Arg Arg Met Thr Pro Asp Ser Thr Thr Asp Gln
180 185 190
Leu Gln Asn Lys Thr Leu Trp Ser Ser Tyr Thr Glu Ile Ile Asp Val
195 200 205
Lys Gln Cys Tyr Pro Asn Thr Ala Leu Val Gly Val Gln Val Asp Ser
210 215 220
Glu Gln Phe Gly Ser Gln Gln Val Ser Arg Asn Tyr His Leu Arg Gly
225 230 235 240
Arg Ile Leu Gln Val Pro Ser Asn Tyr Asn Pro Gln Thr Arg Gln Tyr
245 250 255
Ser Gly Ile Trp Asp Gly Thr Phe Lys Pro Ala Tyr Ser Asn Asn Pro
260 265 270
Ala Trp Cys Leu Trp Asp Met Leu Thr His Pro Arg Tyr Gly Met Gly
275 280 285
Lys Arg Leu Gly Ala Ala Asp Val Asp Lys Trp Ala Leu Tyr Val Ile
290 295 300
Gly Gln Tyr Cys Asp Gln Ser Val Pro Asp Gly Phe Gly Gly Thr Glu
305 310 315 320
Pro Arg Ile Thr Cys Asn Ala Tyr Leu Thr Thr Gln Arg Lys Ala Trp
325 330 335
Asp Val Leu Ser Asp Phe Cys Ser Ala Met Arg Cys Met Pro Val Trp
340 345 350
Asn Gly Gln Thr Leu Thr Phe Val Gln Asp Arg Pro Ser Asp Lys Val
355 360 365
Trp Thr Tyr Asn Arg Ser Asn Val Val Met Pro Asp Asp Gly Ala Pro
370 375 380
Phe Arg Tyr Ser Phe Ser Ala Leu Lys Asp Arg His Asn Ala Val Glu
385 390 395 400
Val Asn Trp Ile Asp Pro Asn Asn Gly Trp Glu Thr Ala Thr Glu Leu
405 410 415
Val Glu Asp Thr Gln Ala Ile Ala Arg Tyr Gly Arg Asn Val Thr Lys
420 425 430
Met Asp Ala Phe Gly Cys Thr Ser Arg Gly Gln Ala His Arg Ala Gly
435 440 445
Leu Trp Leu Ile Lys Thr Glu Leu Leu Glu Thr Gln Thr Val Asp Phe
450 455 460
Ser Val Gly Ala Glu Gly Leu Arg His Val Pro Gly Asp Val Ile Glu
465 470 475 480
Ile Cys Asp Asp Asp Tyr Ala Gly Ile Ser Thr Gly Gly Arg Val Leu
485 490 495
Ala Val Asn Ser Gln Thr Arg Thr Leu Thr Leu Asp Arg Glu Ile Thr
500 505 510
Leu Pro Ser Ser Gly Thr Thr Leu Ile Ser Leu Val Asp Gly Ser Gly
515 520 525
Asn Pro Val Ser Val Glu Val Gln Ser Val Thr Asp Gly Leu Lys Val
530 535 540
Lys Val Asn Arg Val Pro Asp Gly Val Ala Glu Tyr Ser Val Trp Gly
545 550 555 560
Leu Lys Leu Pro Thr Leu Arg Gln Arg Leu Phe Arg Cys Val Ser Ile
565 570 575
Arg Glu Asn Asp Asp Gly Thr Tyr Ala Ile Thr Ala Val Gln His Val
580 585 590
Pro Glu Lys Glu Ala Ile Val Asp Asn Gly Ala His Phe Asp Gly Asp
595 600 605
Gln Ser Ser Thr Val Asn Gly Val Thr Pro Pro Ala Val Gln His Leu
610 615 620
Thr Ala Glu Val Thr Ala Asp Ser Gly Glu Tyr Gln Val Leu Ala Arg
625 630 635 640
Trp Asp Thr Pro Lys Val Val Lys Gly Val Ser Phe Leu Leu Arg Leu
645 650 655
Thr Val Thr Ala Asp Asp Gly Ser Glu Arg Leu Val Ser Thr Ala Arg
660 665 670
Thr Thr Glu Thr Thr Tyr Arg Phe Thr Gln Leu Ala Leu Gly Asn Tyr
675 680 685
Arg Leu Thr Val Arg Ala Val Asn Ala Trp Gly Gln Gln Gly Asp Pro
690 695 700
Ala Ser Val Ser Phe Arg Ile Ala Ala Pro Ala Ala Pro Ser Arg Ile
705 710 715 720
Glu Leu Thr Pro Gly Tyr Phe Gln Ile Thr Ala Thr Pro His Leu Ala
725 730 735
Val Tyr Asp Pro Thr Val Gln Phe Glu Phe Trp Phe Ser Glu Lys Arg
740 745 750
Ile Thr Asp Ile Arg Gln Val Glu Thr Thr Ala Arg Tyr Leu Gly Thr
755 760 765
Ala Leu Tyr Trp Ile Ala Ala Ser Ile Asn Ile Lys Pro Gly His Asp
770 775 780
Tyr Tyr Phe Tyr Ile Arg Ser Val Asn Thr Val Gly Lys Ser Ala Phe
785 790 795 800
Val Glu Ala Val Gly Arg Ala Ser Asp Asp Ala Glu Gly Tyr Leu Asp
805 810 815
Phe Phe Lys Gly Lys Ile Thr Glu Ser His Leu Gly Lys Glu Leu Leu
820 825 830
Glu Lys Val Glu Leu Thr Glu Asp Asn Ala Ser Arg Leu Glu Glu Phe
835 840 845
Ser Asn Glu Trp Lys Asp Ala Ser Asp Lys Trp Asn Ala Met Trp Ala
850 855 860
Val Lys Ile Glu Gln Thr Lys Asp Gly Lys His Tyr Val Ala Gly Ile
865 870 875 880
Gly Leu Ser Met Glu Asp Thr Glu Glu Gly Lys Leu Ser Gln Phe Leu
885 890 895
Val Ala Ala Asn Arg Ile Ala Phe Ile Asp Pro Ala Asn Gly Asn Glu
900 905 910
Thr Pro Met Phe Val Ala Gln Gly Asn Gln Ile Phe Met Asn Asp Val
915 920 925
Phe Leu Lys Arg Leu Thr Ala Pro Thr Ile Thr Ser Gly Gly Asn Pro
930 935 940
Pro Ala Phe Ser Leu Thr Pro Asp Gly Lys Leu Thr Ala Lys Asn Ala
945 950 955 960
Asp Ile Ser Gly Asn Val Asn Ala Asn Ser Gly Thr Leu Asn Asn Val
965 970 975
Thr Ile Asn Glu Asn Cys Gln Ile Lys Gly Lys Leu Ser Ala Asn Gln
980 985 990
Ile Glu Gly Asp Ile Val Lys Thr Val Ser Lys Ser Phe Pro Arg Thr
995 1000 1005
Asn Ser Tyr Ala Ser Gly Thr Ile Thr Val Arg Ile Ser Asp Asp
1010 1015 1020
Gln Lys Phe Asp Arg Gln Val Met Ile Pro Pro Val Leu Phe Arg
1025 1030 1035
Gly Gly Lys His Glu Asn Phe Asn Ser Asn Asn Gln Gln Ser Tyr
1040 1045 1050
Trp Tyr Ser Thr Cys Arg Leu Arg Val Thr Arg Asn Gly Gln Glu
1055 1060 1065
Ile Phe Asn Gln Ser Thr Thr Asp Ala Gln Gly Val Phe Ser Ser
1070 1075 1080
Val Ile Asp Met Pro Ala Gly Gln Gly Thr Leu Thr Leu Thr Phe
1085 1090 1095
Thr Val Ser Ser Ser Gly Ala Asn Asn Trp Thr Pro Thr Thr Ser
1100 1105 1110
Ile Ser Asp Leu Leu Val Val Val Met Lys Lys Ser Thr Ala Gly
1115 1120 1125
Ile Ser Ile Ser
1130
<210> 62
<211> 859
<212> PRT
<213> 人工序列
<220>
<223> 图9A的E6BTD4-ECOLX gpH的序列
<220>
<221> MISC_FEATURE
<222> (187)..(208)
<223> 远端区域框
<220>
<221> MISC_FEATURE
<222> (301)..(420)
<223> 近端区域框
<400> 62
Met Ala Glu Pro Val Gly Asp Leu Val Val Asp Leu Ser Leu Asp Ala
1 5 10 15
Ala Arg Phe Asp Glu Gln Met Ala Arg Val Arg Arg His Phe Ser Gly
20 25 30
Thr Glu Ser Asp Ala Lys Lys Thr Ala Ala Val Val Glu Gln Ser Leu
35 40 45
Ser Arg Gln Ala Leu Ala Ala Gln Lys Ala Gly Ile Ser Val Gly Gln
50 55 60
Tyr Lys Ala Ala Met Arg Met Leu Pro Ala Gln Phe Thr Asp Val Ala
65 70 75 80
Thr Gln Leu Ala Gly Gly Gln Ser Pro Trp Leu Ile Leu Leu Gln Gln
85 90 95
Gly Gly Gln Val Lys Asp Ser Phe Gly Gly Met Ile Pro Met Phe Arg
100 105 110
Gly Leu Ala Gly Ala Ile Thr Leu Pro Met Val Gly Ala Thr Ser Leu
115 120 125
Ala Val Ala Thr Gly Ala Leu Ala Tyr Ala Trp Tyr Gln Gly Asn Ser
130 135 140
Thr Leu Ser Asp Phe Asn Lys Thr Leu Val Leu Ser Gly Asn Gln Ala
145 150 155 160
Gly Leu Thr Ala Asp Arg Met Leu Val Leu Ser Arg Ala Gly Gln Ala
165 170 175
Ala Gly Leu Thr Phe Asn Gln Thr Ser Glu Ser Leu Thr Ala Leu Val
180 185 190
Asn Ala Gly Val Arg Gly Gly Glu Gln Phe Glu Ala Ile Ser Gln Ser
195 200 205
Val Ala Arg Phe Ser Ser Ala Ser Gly Val Glu Val Asp Lys Val Ala
210 215 220
Glu Ala Phe Gly Lys Leu Thr Thr Asp Pro Thr Ser Gly Leu Thr Ala
225 230 235 240
Met Ala Arg Gln Phe His Asn Val Thr Ala Glu Gln Ile Ala Tyr Val
245 250 255
Ala Gln Leu Gln Arg Ser Gly Asp Glu Ala Gly Ala Leu Gln Ala Ala
260 265 270
Asn Glu Ala Ala Thr Lys Gly Phe Asp Asp Gln Thr Arg Arg Leu Lys
275 280 285
Glu Asn Met Gly Thr Leu Glu Thr Trp Ala Asp Arg Thr Ala Arg Ala
290 295 300
Phe Lys Ser Met Trp Asp Ser Val Leu Asp Ile Gly Arg Pro Asp Thr
305 310 315 320
Ala Gln Gly Met Leu Glu Lys Ala Glu Lys Ala Phe Asp Glu Ala Asp
325 330 335
Lys Lys Trp Gln Trp Tyr Gln Ser Arg Ser His Arg Arg Gly Lys Thr
340 345 350
Ser Ala Phe Leu Ala Asn Leu Arg Gly Ala Trp Glu Asp Arg Ala Asn
355 360 365
Ala Gln Leu Gly Leu Ser Ala Ala Thr Leu Gln Ala Asp Leu Glu Lys
370 375 380
Ala Arg Glu Met Ala Ala Lys Asp Trp Ala Glu Ser Glu Ala Ser Arg
385 390 395 400
Leu Lys Tyr Thr Glu Glu Ala Gln Lys Ala Tyr Glu Arg Leu Gln Thr
405 410 415
Pro Leu Glu Lys Tyr Thr Ala Arg Gln Glu Glu Leu Asn Lys Ala Leu
420 425 430
Lys Asp Gly Lys Ile Leu Gln Ala Asp Tyr Asn Thr Leu Met Ala Ala
435 440 445
Ala Lys Lys Asp Tyr Glu Ala Thr Leu Lys Lys Pro Lys Gln Ser Gly
450 455 460
Val Lys Val Ser Ala Gly Asp Arg Gln Glu Asp Ser Ala His Ala Ala
465 470 475 480
Leu Leu Thr Leu Gln Ala Glu Leu Arg Thr Leu Glu Lys His Ala Gly
485 490 495
Ala Asn Glu Lys Ile Ser Gln Gln Arg Arg Asp Leu Trp Lys Ala Glu
500 505 510
Ser Gln Phe Ala Val Leu Glu Glu Ala Ala Gln Arg Arg Gln Leu Ser
515 520 525
Ala Gln Glu Lys Ser Leu Leu Ala His Lys Asp Glu Thr Leu Glu Tyr
530 535 540
Lys Arg Gln Leu Ala Ala Leu Gly Asp Lys Val Thr Tyr Gln Glu Arg
545 550 555 560
Leu Asn Ala Leu Ala Gln Gln Ala Asp Lys Phe Ala Gln Gln Gln Arg
565 570 575
Ala Lys Arg Ala Ala Ile Asp Ala Lys Ser Arg Gly Leu Thr Asp Arg
580 585 590
Gln Ala Glu Arg Glu Ala Thr Glu Gln Arg Leu Lys Glu Gln Tyr Gly
595 600 605
Asp Asn Pro Leu Ala Leu Asn Asn Val Met Ser Glu Gln Lys Lys Thr
610 615 620
Trp Ala Ala Glu Asp Gln Leu Arg Gly Ser Trp Met Ala Gly Leu Lys
625 630 635 640
Ser Gly Trp Ser Glu Trp Glu Glu Ser Ala Thr Asp Ser Met Ser Gln
645 650 655
Val Lys Ser Ala Ala Thr Gln Thr Phe Asp Gly Ile Ala Gln Asn Met
660 665 670
Ala Ala Met Leu Thr Gly Ser Glu Gln Asn Trp Arg Ser Phe Thr Arg
675 680 685
Ser Val Leu Ser Met Met Thr Glu Ile Leu Leu Lys Gln Ala Met Val
690 695 700
Gly Ile Val Gly Ser Ile Gly Ser Ala Ile Gly Gly Ala Val Gly Gly
705 710 715 720
Gly Ala Ser Ala Ser Gly Gly Thr Ala Ile Gln Ala Ala Ala Ala Lys
725 730 735
Phe His Phe Ala Thr Gly Gly Phe Thr Gly Thr Gly Gly Lys Tyr Glu
740 745 750
Pro Ala Gly Ile Val His Arg Gly Glu Phe Val Phe Thr Lys Glu Ala
755 760 765
Thr Ser Arg Ile Gly Val Gly Asn Leu Tyr Arg Leu Met Arg Gly Tyr
770 775 780
Ala Thr Gly Gly Tyr Val Gly Thr Pro Gly Ser Met Ala Asp Ser Arg
785 790 795 800
Ser Gln Ala Ser Gly Thr Phe Glu Gln Asn Asn His Val Val Ile Asn
805 810 815
Asn Asp Gly Thr Asn Gly Gln Ile Gly Pro Ala Ala Leu Lys Ala Val
820 825 830
Tyr Asp Met Ala Arg Lys Gly Ala Arg Asp Glu Ile Gln Thr Gln Met
835 840 845
Arg Asp Gly Gly Leu Phe Ser Gly Gly Gly Arg
850 855
<210> 63
<211> 686
<212> PRT
<213> 人工序列
<220>
<223> λ-STF29
<400> 63
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Glu Thr Ala Ala Ala Ser Ser Lys Asn Ala Ala Lys Thr Ser
130 135 140
Glu Thr Asn Ala Ala Asn Ser Ala Gln Ala Ala Ala Ala Ser Gln Thr
145 150 155 160
Ala Ser Ala Asn Ser Ala Thr Ala Ala Lys Lys Ser Glu Thr Ser Ala
165 170 175
Lys Asn Ser Glu Thr Ala Thr Lys Ala Ser Glu Lys Asn Ala Lys Ser
180 185 190
Ser Gln Thr Ala Ala Lys Thr Ser Glu Thr Asn Ala Lys Asp Ser Glu
195 200 205
Ala Asn Ala Lys Val Ser Glu Thr Ala Ala Ala Asn Ser Ala Lys Ala
210 215 220
Ser Ala Ala Ser Gln Thr Ala Ala Lys Ala Ser Glu Asp Ala Ala Arg
225 230 235 240
Glu Tyr Ala Asn Gln Thr Ala Glu Pro Tyr Arg Tyr Val Leu Gln Pro
245 250 255
Leu Pro Asp Val Trp Ile Pro Phe Asn Asp Ser Leu Asp Met Ile Thr
260 265 270
Gly Tyr Ser Pro Gly Tyr Lys Lys Val Lys Ile Gly Asp Asn Val Val
275 280 285
Gln Val Ala Ser Asp Lys Gln Val Asn Phe Ser Arg Ala Ser Thr Ala
290 295 300
Thr Tyr Ile Asn Lys Ser Gly Glu Leu Lys Thr Ala Glu Ile Asn Glu
305 310 315 320
Pro Arg Phe Glu Lys Glu Gly Leu Leu Ile Glu Gly Gln Arg Thr Asn
325 330 335
Tyr Met Leu Asn Ser Ala Thr Pro Ala Ser Trp Gly Lys Ser Ala Asn
340 345 350
Met Asn Val Ala Glu Val Gly Thr Asp Ser Phe Gly Phe Thr Tyr Gly
355 360 365
Lys Phe Val Cys Asn Glu Ser Leu Ile Gly Gln Ser Thr Thr Leu Asn
370 375 380
Met Ala Val Val Ser Thr Ser Gly Ala Val Asp Val Ser Gly Asp Asn
385 390 395 400
Lys Cys Val Thr Thr Ser Cys Arg Phe Lys Thr Asp Leu Glu Leu Leu
405 410 415
Leu Arg Ile Arg Phe Glu Ala Phe Asp Gly Ser Ala Ser Ser Asn Leu
420 425 430
Gly Tyr Ala Ile Val Asn Thr Arg Ser Leu Leu Val Glu Ile Thr Gly
435 440 445
Val Ala Ala Asp Arg Leu Thr Ala Arg Val Asn Lys Asp Glu Ala Thr
450 455 460
Gly Trp Ile Phe Val Glu Ala Thr Ile Gln Ala Ser Lys Glu Thr Tyr
465 470 475 480
Ile Thr Ser Ala Ile Gln Tyr Ala Pro Lys Lys Gly Gly Val Val Glu
485 490 495
Ser Gly Asp Tyr Ile Tyr Leu Ala Thr Pro Gln Val Glu Asp Gly Ser
500 505 510
Cys Val Ser Ser Phe Ile Ile Ser Gly Thr Thr Ala Ala Thr Arg Ala
515 520 525
Ser Asp Met Val Thr Val Pro Ile Lys Asn Asn Leu Tyr Asn Leu Pro
530 535 540
Phe Thr Val Leu Cys Glu Val His Lys Asn Trp Tyr Lys Thr Pro Asn
545 550 555 560
Ala Ala Pro Arg Val Phe Asp Thr Gly Gly His Gln Thr Gly Ala Ala
565 570 575
Ile Ile Leu Gly Phe Gly Ser Ser Ala Asp Gly Pro Asp Gly Phe Pro
580 585 590
Tyr Cys Asp Ile Gly Gly Ser Asn Arg Arg Val Asn Glu Asn Ala Ser
595 600 605
Leu Lys Lys Met Val Met Gly Met Arg Val Lys Ser Asp Gln Ser Thr
610 615 620
Cys Ala Val Ser Asn Gly Arg Ile Ser Ser Glu Thr Lys Thr Thr Trp
625 630 635 640
Glu Tyr Ile Arg Ser Thr Ala Thr Ile Arg Ile Gly Gly Gln Thr Thr
645 650 655
Ala Gly Leu Arg His Leu Phe Gly His Val Arg Asn Phe Arg Leu Trp
660 665 670
His Lys Glu Leu Thr Asp Ala Gln Leu Gly Glu Val Val Glu
675 680 685
<210> 64
<211> 824
<212> PRT
<213> 人工序列
<220>
<223> λ-STF118
<400> 64
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Val Val Met Asp Glu Thr Asn Arg Lys Ala Pro Leu Asn Ser Pro
385 390 395 400
Ala Leu Thr Gly Thr Pro Thr Thr Pro Thr Ala Arg Gln Gly Thr Asn
405 410 415
Asn Thr Gln Ile Ala Asn Thr Ala Phe Val Met Ala Ala Ile Ala Ala
420 425 430
Leu Val Asp Ser Ser Pro Asp Ala Leu Asn Thr Leu Asn Glu Leu Ala
435 440 445
Ala Ala Leu Gly Asn Asp Pro Asn Phe Ala Thr Thr Met Thr Asn Ala
450 455 460
Leu Ala Gly Lys Gln Pro Lys Asp Ala Thr Leu Ala Ala Leu Ala Gly
465 470 475 480
Leu Ala Thr Ala Ala Asp Arg Phe Pro Tyr Phe Thr Gly Asn Asp Val
485 490 495
Ala Ser Leu Ala Thr Leu Thr Lys Val Gly Arg Asp Ile Leu Ala Lys
500 505 510
Ser Thr Val Ser Ala Val Ile Glu Tyr Leu Gly Leu Gln Glu Thr Val
515 520 525
Asn Arg Ala Gly Asn Ala Val Gln Lys Asn Gly Asp Thr Leu Ser Gly
530 535 540
Gly Leu Thr Phe Glu Asn Asp Ser Ile Leu Ala Trp Ile Arg Asn Thr
545 550 555 560
Asp Trp Ala Lys Ile Gly Phe Lys Asn Asp Ala Asp Gly Asp Thr Asp
565 570 575
Ser Tyr Met Trp Phe Glu Thr Gly Asp Asn Gly Asn Glu Tyr Phe Lys
580 585 590
Trp Arg Ser Arg Gln Ser Thr Thr Thr Lys Asp Leu Met Asn Leu Lys
595 600 605
Trp Asp Ala Leu Tyr Val Leu Val Lys Ala Leu Phe Ser Ser Glu Val
610 615 620
Lys Ile Ser Thr Val Asn Ala Leu Arg Ile Phe Asn Ser Ser Phe Gly
625 630 635 640
Ala Ile Phe Arg Arg Ser Glu Glu Asn Leu Tyr Ile Ile Pro Thr Arg
645 650 655
Glu Asn Glu Gly Glu Asn Gly Asp Ile Gly Pro Leu Arg Pro Phe Gly
660 665 670
Ile Asn Leu Arg Thr Gly Val Val Ser Val Gly Asn Gly Ala Arg Ile
675 680 685
Asp Gly Gly Leu Ala Leu Gly Thr Asn Asn Ala Leu Gly Gly Asn Ser
690 695 700
Ile Val Leu Gly Asp Asn Asp Thr Gly Phe Lys Gln Asn Gly Asp Gly
705 710 715 720
Asn Leu Asp Val Tyr Ala Asn Asn Val His Val Met Arg Phe Val Ser
725 730 735
Gly Ser Ile Gln Ser Asn Lys Thr Ile Asn Ile Thr Gly Arg Val Asn
740 745 750
Pro Ser Asp Tyr Gly Asn Phe Asp Ser Arg Tyr Val Arg Asp Ile Arg
755 760 765
Leu Gly Thr Arg Val Val Gln Thr Met Gln Lys Gly Val Met Tyr Glu
770 775 780
Lys Ala Gly His Val Ile Thr Gly Leu Gly Ile Val Gly Glu Val Asp
785 790 795 800
Gly Asp Asp Pro Ala Val Phe Arg Pro Ile Gln Lys Tyr Ile Asn Gly
805 810 815
Thr Trp Tyr Asn Val Ala Gln Val
820
<210> 65
<211> 92
<212> PRT
<213> 人工序列
<220>
<223> λ-STF29辅助蛋白
<400> 65
Val Arg Asp Phe Thr Leu Arg Phe Ser Asp Lys Ala Asp Phe Arg Ala
1 5 10 15
Phe Leu Arg Lys Leu Asn Trp Glu Glu Asp Glu Glu Leu Gln Asn Ala
20 25 30
Ile Leu Val Asp Glu Ile Gly Phe Thr Phe Ser Glu Ser Gly Val Ser
35 40 45
Ala Asp Gly Glu Pro Glu Tyr Thr Arg Asp Glu Gly Tyr Phe Val Asn
50 55 60
Ile Arg Leu Leu Asp Asp Gly Phe Asp Glu Ser Val Phe Arg Glu Trp
65 70 75 80
Val Val Thr Pro Glu Arg Pro Leu Arg Glu Trp Phe
85 90
<210> 66
<211> 175
<212> PRT
<213> 人工序列
<220>
<223> λ-STF118辅助蛋白
<400> 66
Met Gln His Leu Lys Asn Ile Thr Ala Gly Asn Pro Lys Thr Val Ala
1 5 10 15
Gln Tyr Gln Leu Thr Lys Asn Phe Asp Val Ile Trp Leu Trp Ser Glu
20 25 30
Glu Gly Lys Asn Trp Tyr Glu Glu Val Ser Asn Phe Gln Glu Asp Thr
35 40 45
Ile Lys Ile Val Tyr Asp Glu Asn Asn Ile Ile Val Gly Ile Thr Arg
50 55 60
Asp Ala Ser Thr Leu Asn Pro Glu Gly Phe Ser Val Val Glu Val Pro
65 70 75 80
Asp Ile Thr Ser Asn Arg Arg Ala Asp Asp Ser Gly Lys Trp Met Phe
85 90 95
Lys Asp Gly Ala Val Ile Lys Arg Ile Tyr Thr Ala Asp Glu Gln Glu
100 105 110
Gln Gln Ala Glu Ser Gln Lys Ala Ala Leu Leu Ser Glu Ala Glu Ser
115 120 125
Val Ile Leu Pro Leu Glu Arg Ala Val Arg Leu Asn Met Ala Thr Asp
130 135 140
Glu Glu Arg Ser Arg Leu Glu Ala Trp Glu Arg Tyr Ser Val Leu Val
145 150 155 160
Ser Arg Val Asp Pro Ala Asn Pro Glu Trp Pro Glu Met Pro Gln
165 170 175

Claims (49)

1.一种用于将感兴趣的DNA有效载荷体内递送到目标细菌细胞中的λ形细菌递送媒介物。
2.权利要求1的细菌递送媒介物,其中所述细菌递送媒介物为细菌噬菌体。
3.权利要求1或2的细菌递送媒介物,其中所述细菌递送媒介物为包含野生型侧尾丝(STF)蛋白、野生型gpH蛋白和野生型gpJ蛋白的细菌噬菌体。
4.权利要求1-3中任何一项的细菌递送媒介物,其中所述细菌递送媒介物为野生型细菌噬菌体。
5.权利要求1的细菌递送媒介物,其中所述细菌递送媒介物为包装的噬菌粒。
6.权利要求1-5中任何一项的细菌递送媒介物,其包含一种或多种选自以下的蛋白:功能性λ形细菌噬菌体STF蛋白、功能性λ形细菌噬菌体gpJ蛋白和功能性λ形细菌噬菌体gpH蛋白。
7.权利要求6的细菌递送媒介物,其包含两种或更多种选自以下的蛋白:功能性λ形STF蛋白、功能性λ形细菌噬菌体gpJ蛋白和功能性λ形细菌噬菌体gpH蛋白。
8.权利要求1-7中任何一项的细菌递送媒介物,其包含:
(i) 功能性λ形细菌噬菌体STF蛋白,和
(ii) 功能性λ形细菌噬菌体gpJ蛋白。
9.权利要求8的细菌递送媒介物,其进一步包含:
(iii) 功能性λ形细菌噬菌体gpH蛋白。
10.权利要求3-9中任何一项的细菌递送媒介物,其中所述STF蛋白、所述gpJ蛋白和/或所述gpH蛋白为野生型λ STF、gpJ和/或gpH蛋白。
11.权利要求6-9中任何一项的细菌递送媒介物,其中所述STF蛋白、所述gpJ蛋白和/或所述gpH蛋白为非天然存在的重组蛋白。
12.权利要求11的细菌递送媒介物,其中所述重组STF蛋白为嵌合蛋白,所述嵌合蛋白包含源于λ形细菌噬菌体的STF蛋白的一部分与源于不同细菌噬菌体的相应STF蛋白的STF蛋白的一部分之间的融合体。
13.权利要求11或12的细菌递送媒介物,其中所述重组gpJ蛋白为嵌合蛋白,所述嵌合蛋白包含源于λ形细菌噬菌体的gpJ蛋白的一部分与源于不同细菌噬菌体的相应gpJ蛋白的gpJ蛋白的一部分之间的融合体。
14.权利要求11-13中任何一项的细菌递送媒介物,其中所述重组gpH蛋白为嵌合蛋白,所述嵌合蛋白包含源于λ形细菌噬菌体的gpH蛋白的一部分与源于不同细菌噬菌体的相应gpH蛋白的gpH蛋白的一部分之间的融合体。
15.权利要求11-14中任何一项的细菌递送媒介物,其中所述STF蛋白包含SEQ ID NO:14的氨基酸序列、SEQ ID NO: 16的氨基酸序列、SEQ ID NO: 17的氨基酸序列、SEQ ID NO:19的氨基酸序列、SEQ ID NO: 21的氨基酸序列、SEQ ID NO: 44的氨基酸序列或SEQ IDNO: 50的氨基酸序列,或由其组成。
16.权利要求11-15中任何一项的细菌递送媒介物,其中所述gpJ蛋白包含SEQ ID NO:10、11、12、13或49的氨基酸序列,或由其组成。
17.权利要求11-16中任何一项的细菌递送媒介物,其中所述gpH蛋白包含SEQ ID NO:23或24的氨基酸序列,或由其组成。
18.权利要求11-17中任何一项的细菌递送媒介物,其中所述重组STF蛋白、gpJ蛋白和/或gpH蛋白经工程改造以允许将感兴趣的DNA有效载荷转移到所述目标细菌细胞中。
19.权利要求11-18中任何一项的细菌递送媒介物,其中所述重组STF蛋白具有酶活性比如解聚酶活性,并且所述目标细菌细胞为封装的细菌细胞。
20.权利要求11-19中任何一项的细菌递送媒介物,其中所述重组STF蛋白、gpJ蛋白和/或gpH蛋白经工程改造以提高将所述DNA有效载荷转移到所述目标细菌细胞中的效率。
21.权利要求1-20中任何一项的细菌递送媒介物,其中所述目标细菌细胞选自耶尔森氏菌属物种、埃希氏菌属物种、克雷伯氏菌属物种、不动杆菌属物种、假单胞菌属物种、螺杆菌属物种、弧菌属物种、沙门氏菌属物种、链球菌属物种、葡萄球菌属物种、拟杆菌属物种、梭菌属物种、志贺氏菌属物种、肠球菌属物种、肠杆菌属物种和李斯特菌属物种,优选地为大肠杆菌。
22.权利要求1-21中任何一项的细菌递送媒介物,其中所述细菌递送媒介物包含所述感兴趣的DNA有效载荷。
23.权利要求1-22中任何一项的细菌递送媒介物,其中所述DNA有效载荷包含选自以下的感兴趣的核酸:Cas核酸酶基因,Cas9核酸酶基因,引导RNA,CRISPR基因座,毒素基因,编码酶比如核酸酶或激酶、TALEN、ZFN、大范围核酸酶、重组酶、细菌受体、膜蛋白、结构蛋白、分泌蛋白的基因,编码对抗生素或一般药物的抗性的基因,编码毒性蛋白或毒性因子的基因和编码毒力蛋白或毒力因子的基因,以及任何它们的组合。
24.权利要求23的细菌递送媒介物,其中所述感兴趣的核酸为编码核酸酶的基因。
25.权利要求24的细菌递送媒介物,其中所述核酸酶选自Cas核酸酶、Cas9核酸酶、TALEN、ZFN和大范围核酸酶。
26.权利要求24或25的细菌递送媒介物,其中所述核酸酶靶向切割宿主细菌细胞染色体或宿主细菌细胞质粒。
27.权利要求24-26中任何一项的细菌递送媒介物,其中所述切割发生在抗生素抗性基因中。
28.权利要求1-27中任何一项的细菌递送媒介物,其中所述DNA有效载荷具有严格大于10.000 kb且严格小于12.000 kb的大小,或者具有严格大于12.500 kb且严格小于16.667kb的大小,或者具有大于或等于18.000 kb且小于或等于25.000 kb的大小。
29.权利要求1-26中任何一项的细菌递送媒介物,其中所述DNA有效载荷包含序列SEQID NO: 47或由其组成。
30.权利要求1-26中任何一项的细菌递送媒介物,其包含含有序列SEQ ID NO: 48或由序列SEQ ID NO: 48组成的重组STF蛋白和含有序列SEQ ID NO: 13或由序列SEQ ID NO:13组成的重组gpJ蛋白,其中所述DNA有效载荷包含序列SEQ ID NO: 47或由序列SEQ IDNO: 47组成,和其中所述目标细菌细胞为产生志贺毒素的大肠杆菌(STEC)。
31.权利要求1-22中任何一项的细菌递送媒介物,其中所述DNA有效载荷包含编码治疗性蛋白的感兴趣的核酸。
32.权利要求1-22中任何一项的细菌递送媒介物,其中所述DNA有效载荷包含编码反义核酸分子的感兴趣的核酸。
33.一种包含权利要求1-32中任何一项的细菌递送媒介物和药学上可接受的载体的药用或兽用组合物。
34.一种用于将感兴趣的DNA有效载荷体内递送到受试者中的方法,其包括给予所述受试者权利要求33的药物或兽用组合物。
35.一种用于治疗由细菌引起的疾病或障碍的方法,其包括给予需要治疗的患有所述由细菌引起的疾病或障碍的受试者权利要求33的药用或兽用组合物。
36.权利要求35的方法,其中所述疾病或障碍为细菌感染、代谢障碍或涉及人类微生物组细菌的病理学。
37.权利要求36的方法,其中所述细菌感染为STEC感染。
38.用于治疗由细菌引起的疾病或障碍的权利要求33的药用或兽用组合物。
39.权利要求38的用于其用途的药用或兽用组合物,其中所述疾病或障碍为细菌感染、代谢障碍或涉及人类微生物组细菌的病理学。
40.权利要求39的用于其用途的药用或兽用组合物,其中所述细菌感染为STEC感染。
41.一种用于减少细菌群体中毒力和/或抗生素抗性细菌的量的方法,其包括使所述细菌群体与权利要求1-32中任何一项的细菌递送媒介物接触。
42.用于减少细菌群体中毒力和/或抗生素抗性细菌的量的方法中的权利要求1-32中任何一项的细菌递送媒介物。
43.权利要求38或39的用于其用途的药用或兽用组合物,其中所述细菌递送媒介物用于减少目标细菌细胞群中的毒力和/或抗生素抗性细菌的量。
44.用于治疗由细菌引起的疾病或障碍的如权利要求1-32中的任何一项定义的细菌递送媒介物。
45.权利要求44的用于用途的细菌递送媒介物,其中所述细菌递送媒介物用于将感兴趣的DNA有效载荷体内递送到目标细菌细胞群中。
46.权利要求44或45的用于用途的细菌递送媒介物,其中所述疾病或障碍为细菌感染、代谢障碍或涉及人类微生物组细菌的病理学。
47.权利要求46的用于用途的细菌递送媒介物,其中所述细菌感染为STEC感染。
48.一种产生如权利要求1-32中的任何一项定义的细菌递送媒介物的生产细胞系。
49.权利要求48的生产细胞系,其中所述生产细胞系产生:
- 包含SEQ ID NO: 14的氨基酸序列或由SEQ ID NO: 14的氨基酸序列组成的STF蛋白及其包含SEQ ID NO: 15的氨基酸序列或由SEQ ID NO: 15的氨基酸序列组成的相关伴侣蛋白,
- 包含SEQ ID NO: 16的氨基酸序列或由SEQ ID NO: 16的氨基酸序列组成的STF蛋白,
- 包含SEQ ID NO: 17的氨基酸序列或由SEQ ID NO: 17的氨基酸序列组成的STF蛋白及其包含SEQ ID NO: 18的氨基酸序列或由SEQ ID NO: 18的氨基酸序列组成的相关伴侣蛋白,
- 包含SEQ ID NO: 19的氨基酸序列或由SEQ ID NO: 19的氨基酸序列组成的STF蛋白及其包含SEQ ID NO: 20的氨基酸序列或由SEQ ID NO: 20的氨基酸序列组成的相关伴侣蛋白,
- 包含SEQ ID NO: 21的氨基酸序列或由SEQ ID NO: 21的氨基酸序列组成的STF蛋白及其包含SEQ ID NO: 22的氨基酸序列或由SEQ ID NO: 22的氨基酸序列组成的相关伴侣蛋白,
- 包含SEQ ID NO: 44的氨基酸序列或由SEQ ID NO: 44的氨基酸序列组成的STF蛋白,或者
- 包含SEQ ID NO: 50的氨基酸序列或由SEQ ID NO: 50的氨基酸序列组成的STF蛋白及任选的其包含SEQ ID NO: 57的氨基酸序列或由SEQ ID NO: 57的氨基酸序列组成的相关伴侣蛋白。
CN202080097730.1A 2019-12-30 2020-12-30 用于体内递送dna有效载荷的细菌递送媒介物 Pending CN115605216A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962955278P 2019-12-30 2019-12-30
US62/955278 2019-12-30
PCT/EP2020/088043 WO2021136812A1 (en) 2019-12-30 2020-12-30 Bacterial delivery vehicles for in vivo delivery of a dna payload

Publications (1)

Publication Number Publication Date
CN115605216A true CN115605216A (zh) 2023-01-13

Family

ID=82309488

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080097730.1A Pending CN115605216A (zh) 2019-12-30 2020-12-30 用于体内递送dna有效载荷的细菌递送媒介物

Country Status (6)

Country Link
EP (1) EP4084817A1 (zh)
JP (1) JP2023508587A (zh)
KR (1) KR20220122702A (zh)
CN (1) CN115605216A (zh)
CA (1) CA3164131A1 (zh)
IL (1) IL294221A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115305226A (zh) * 2022-09-22 2022-11-08 郑州轻工业大学 一株降解烟碱并产氢的抗辐射不动杆菌zj-22及其应用
CN116478882A (zh) * 2023-05-05 2023-07-25 石河子大学 能够提高绵羊日增重和饲料转化率的产酸的混合菌制剂的制备方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113509494A (zh) * 2021-09-06 2021-10-19 南京医科大学 普氏菌在制备治疗胆汁淤积性疾病的药物中的应用

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115305226A (zh) * 2022-09-22 2022-11-08 郑州轻工业大学 一株降解烟碱并产氢的抗辐射不动杆菌zj-22及其应用
CN115305226B (zh) * 2022-09-22 2023-06-16 郑州轻工业大学 一株降解烟碱并产氢的抗辐射不动杆菌zj-22及其应用
CN116478882A (zh) * 2023-05-05 2023-07-25 石河子大学 能够提高绵羊日增重和饲料转化率的产酸的混合菌制剂的制备方法

Also Published As

Publication number Publication date
EP4084817A1 (en) 2022-11-09
CA3164131A1 (en) 2021-07-08
IL294221A (en) 2022-08-01
KR20220122702A (ko) 2022-09-02
JP2023508587A (ja) 2023-03-02

Similar Documents

Publication Publication Date Title
US11534467B2 (en) Modulation of microbiota function by gene therapy of the microbiome to prevent, treat or cure microbiome-associated diseases or disorders
CN115605216A (zh) 用于体内递送dna有效载荷的细菌递送媒介物
US11952594B2 (en) Pharmaceutical compositions comprising bacterial delivery vehicles and uses thereof
US11512116B2 (en) Chimeric receptor binding proteins for use in bacterial delivery vehicles
US11746352B2 (en) Microbiome modulation of a host by delivery of DNA payloads with minimized spread
KR20210107053A (ko) 박테리아 전달 비히클에서 사용을 위한 분지형 수용체 결합 다수-서브유닛 단백질 복합체
US11208437B2 (en) Branched receptor binding multi-subunit protein complexes for use in bacterial delivery vehicles
KR20220024603A (ko) 트레이서 핵산 서열을 포함하는 박테리아 전달 비히클
KR20240021768A (ko) 용해성 파지의 제조
KR20210141999A (ko) Dna-결합 리프레서를 사용한 원핵생물 세포의 전사 제어
US11584781B2 (en) Chimeric receptor binding proteins resistant to proteolytic degradation
US20210196828A1 (en) Bacterial delivery vehicles for in vivo delivery of a dna payload
US20230134572A1 (en) Chimeric receptor binding proteins resistant to proteolytic degradation
US20240102026A1 (en) Microbiome modulation of a host by delivery of dna payloads with minimized spread
US20220064223A1 (en) Branched receptor binding multi-subunit protein complexes for use in bacterial delivery vehicles
KR20230127265A (ko) 최소 확산으로 dna 페이로드의 전달을 통한 숙주의마이크로바이옴 조절
WO2022144382A1 (en) Chimeric receptor binding proteins resistant to proteolytic degradation
CN117616118A (zh) 生产细菌细胞及其在生产方法中的用途
CN116940677A (zh) 通过以最小传播递送dna有效载荷对宿主的微生物组调节

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination