CN116940676A - 抵抗蛋白水解降解的嵌合受体结合蛋白 - Google Patents

抵抗蛋白水解降解的嵌合受体结合蛋白 Download PDF

Info

Publication number
CN116940676A
CN116940676A CN202180094939.7A CN202180094939A CN116940676A CN 116940676 A CN116940676 A CN 116940676A CN 202180094939 A CN202180094939 A CN 202180094939A CN 116940676 A CN116940676 A CN 116940676A
Authority
CN
China
Prior art keywords
virus
chimeric
protein
rbp
bacterial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180094939.7A
Other languages
English (en)
Inventor
J·费尔南德斯罗德里格斯
X·杜波特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Erig Biotechnology Co ltd
Original Assignee
Erig Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Erig Biotechnology Co ltd filed Critical Erig Biotechnology Co ltd
Priority claimed from PCT/EP2021/087775 external-priority patent/WO2022144382A1/en
Publication of CN116940676A publication Critical patent/CN116940676A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本公开提供抵抗蛋白水解消化的嵌合受体结合蛋白(RBP),其中所述RBP包含衍生自细菌噬菌体的受体结合蛋白的一部分,其通过由1‑70个氨基酸组成的设计的接头区与衍生自不同细菌噬菌体的受体结合蛋白的一部分融合,其中所述接头区被设计为抵抗蛋白水解消化。

Description

抵抗蛋白水解降解的嵌合受体结合蛋白
技术领域
本公开涉及嵌合受体结合蛋白,其特别是衍生自细菌噬菌体受体结合蛋白,能够耐受蛋白水解消化,特别是胃肠蛋白水解消化的嵌合受体结合蛋白;包含所述嵌合受体结合蛋白的细菌递送媒介物;以及其在将期望的有效载荷有效转移到目标细菌细胞群的用途,特别是在口服给予之后。
背景
在考虑基于蛋白的DNA递送载体比如包装的噬菌粒或时,待解决的关键方面之一为其在体内条件下的稳定性。取决于给予途径,包装的噬菌粒可能被暴露于可能影响其稳定性和功能性的不同因素。例如,口服给予的包装的噬菌粒将必须穿过胃肠道:恶劣的条件,比如胃中低pH和某些消化酶的存在,可能会对颗粒的结构稳定性具有负面影响。
噬菌体已经演化为在广泛范围的条件下均为稳定的[1]。从演化的观点来看,能够抵抗这些条件对于任何噬菌体均为明显的优势。
然而,众所周知许多噬菌体在很长一段时间内不能抵抗低pH值[1],[2],尽管这可通过使用胃酸中和剂来避免[3]-[6]。类似地,一些噬菌体已经演化为抵抗消化酶,比如在胰液中发现的那些(胰蛋白酶、糜蛋白酶等),而另一些噬菌体则易于被降解[4],[7],[8],尽管降解的确切机制尚未进行详细研究。
从这些事实可以得出结论,为开发高度成功的最佳噬菌体衍生的DNA递送载体比如获得在体内条件下稳定的载体是有用的。
本公开提供对这一需求的解决方案。
如WO2020109339中所公开的,已经开发了强大的工程管线来产生具有改进或改变的宿主范围的噬菌体衍生的DNA递送载体。为做此事,已经利用噬菌体部分的自然变异性在现有的噬菌体支架中产生功能性蛋白嵌合体:例如,能够通过改变λ形噬菌体比如λ噬菌体的两个主要宿主范围决定簇,gpJ和STF(侧尾丝)蛋白,来改变包装的噬菌粒的向性和注射效率。
在载体开发的过程中,观察到必须在功能性和稳定性之间进行区分。给定的蛋白嵌合体(例如STF融合)可表现出理想的功能性,例如可助于在体外条件下进入目标菌株中的高注射效率,但当暴露于胰酶时可能会受到影响(即仍为功能性的但不太稳定)。到目前为止,这是蛋白质设计改造过程的不可预测的方面:从在胰酶的存在下不会降解的两种不同STF开始可能产生不太抵抗蛋白水解消化的蛋白嵌合体。
可以设想不同的直接(在包装的噬菌粒本身上)或间接(在包装的噬菌粒的环境上)的方法来保护这些蛋白嵌合体免受体内蛋白水解消化,例如合适的制剂,比如使得可在肠或结肠中释放显示所述蛋白嵌合体的包装的噬菌粒的控制或延迟释放制剂。本公开表明,另一种解决方案为直接作用于所述蛋白嵌合体。
概述
本公开基于意想不到地发现,即通过专门设计在两个不同的STF之间的小的融合区(也称为接头区),可使得最初被设计改造为完全功能性的但在胰酶的存在下不太稳定的嵌合的基于λ的STF蛋白为既功能性又高度稳定。
值得注意的是,在天然噬菌体STF中,由于构象或与其他残基/蛋白的相互作用而存在的可蛋白水解降解的残基在正常条件下可能无法降解。然而,当这些STF被用于生产嵌合体时,此类残基可变为可降解。已经特别地证明,在对应于邻近于嵌合λSTF-V10的插入位点的约10-12个氨基酸区域的接头区中存在的苯丙氨酸(F)和赖氨酸(K)残基中引入点突变,使得嵌合λSTF-V10蛋白部分地抵抗胰酶,因此具有增加的稳定性,而初始嵌合λSTF-V10蛋白根本不抵抗胰酶。
还已经证明,将接头区设计为包括最初存在于被用于产生嵌合体的V10尾丝的C-末端区的N-末端的短序列,使得嵌合λSTF-V10蛋白高度抵抗胰酶(而不在接头区中引入进一步的突变)。
进一步地已经证明,在另一种嵌合受体结合蛋白,即在胰酶的存在下不是很稳定的功能性嵌合λSTF-K5蛋白中,在接头区引入最初存在于V10尾丝N-末端处的相同的螺旋形成序列,使得嵌合STF-K5蛋白高度抵抗胰酶,因此强烈稳定。
此外,已经证明,在于胰酶的存在下不是很稳定的另一种功能性嵌合λSTF-K5蛋白中,在接头区引入存在于埃希氏菌噬菌体ZG49的STF蛋白内的另一种螺旋形成序列(其与野生型K5蛋白具有同源性),使得嵌合STF-K5蛋白非常高度抵抗胰酶。
因此,本公开涉及抵抗蛋白水解消化(特别是在胃肠道内)的嵌合受体结合蛋白(RBP),其中所述嵌合RBP包含衍生自细菌噬菌体的受体结合蛋白的一部分,其通过由1到至多70个氨基酸(更特别地1到至多30个氨基酸)组成的设计的接头区与衍生自不同细菌噬菌体的受体结合蛋白的一部分融合,其中所述接头区被设计为抵抗蛋白水解消化,特别是在胃肠道内。在特定实施方案中,所述嵌合RBP抵抗通过胰酶的蛋白水解消化,并且所述接头区被设计为抵抗通过胰酶的蛋白水解消化。
在特定实施方案中,所述RBP为侧尾丝(STF)蛋白、L形丝、长尾丝或尾刺尖。在特定实施方案中,所述嵌合RBP包含衍生自λ形细菌噬菌体的STF蛋白一部分,其通过由1到至多70个氨基酸(更特别地1到至多30个氨基酸)组成的设计的接头区与衍生自不同细菌噬菌体的RBP蛋白的一部分融合。在特定实施方案中,所述嵌合RBP包含衍生自λ形细菌噬菌体的STF蛋白的N-末端区,其通过由1到至多70个氨基酸(更特别地1到至多30个氨基酸)组成的设计的接头区与衍生自不同细菌噬菌体的RBP蛋白的C-末端区融合,其中所述N-末端区和C-末端区在与选自氨基酸SAGDAS(SEQ ID NO:1)、ADAKKS(SEQ ID NO:2)、MDETNR(SEQ IDNO:3)、SASAAA(SEQ ID NO:4)和GAGENS(SEQ ID NO:5)的位点具有至少80%同一性的被称为插入位点的N-末端STF区的位点内融合。在特定实施方案中,所述插入位点与序列GAGENS(SEQ ID NO:5)具有至少80%同一性。在特定实施方案中,所述设计的接头区处于插入位点的C-末端处。在特定实施方案中,所述设计的接头区为嵌合RBP的N-末端区或C-末端区的一部分。
在特定实施方案中,对应于可能被胰蛋白酶和/或糜蛋白酶靶向的野生型结构域序列的氨基酸的设计的接头区的至少一个氨基酸与野生型结构域序列相比较为突变的。在所述特定实施方案中,所述设计的接头区可为嵌合RBP的C-末端区的一部分并且所述至少一个氨基酸可位于插入位点后的15个氨基酸内。在仍然所述特定实施方案中,所述至少一个氨基酸可选自赖氨酸(K)、精氨酸(R)、苯丙氨酸(F)、色氨酸(W)、酪氨酸(Y)、亮氨酸(L)和甲硫氨酸(M)。
在另一个特定实施方案中,所述N-末端区或所述C-末端区包含接头区的序列,所述序列与其所衍生自的RBP的N-末端区或C-末端区中的相应序列相同,并且与区别仅为不存在所述接头区的初始嵌合RBP相比较,所述序列赋予所述嵌合RBP对蛋白水解消化的抗性。
在另一个特定实施方案中,所述设计的接头区包含并非衍生自嵌合RBP的N-末端区或C-末端区的异源性氨基酸序列或者由其组成。在所述实施方案中,所述设计的接头区可包含衍生自不是嵌合RBP的N-末端区和C-末端区所衍生自的RBP之一的RBP的氨基酸序列或者由其组成。
在特定实施方案中,所述设计的接头区可由10到至多20个氨基酸组成。在所述实施方案中,所述设计的接头区可包含氨基酸序列GSATDVMIQL(SEQ ID NO:6)或GSATDVMIQLA(SEQ ID NO:7)或者由其组成。在所述实施方案中,所述序列可直接位于插入位点之后。
在备选实施方案中,所述设计的接头区可由50到至多65个氨基酸组成。在所述实施方案中,所述设计的接头区可包含氨基酸序列SEQ ID NO:34或SEQ ID NO:37或者由其组成。在所述实施方案中,所述序列可直接位于插入位点之后。
在特定实施方案中,设计的接头区包含螺旋或螺旋束。
在特定实施方案中,衍生自λ形细菌噬菌体的所述STF蛋白的N-末端区对应于序列SEQ ID NO:8的λSTF蛋白的氨基酸1-528。在特定实施方案中,衍生自所述不同细菌噬菌体的所述STF蛋白的C-末端区对应于序列SEQ ID NO:16的STF蛋白的氨基酸218-875。在所述实施方案中,所述嵌合RBP可包含序列SEQ ID NO:9或SEQ ID NO:10或者由其组成。在另一个特定实施方案中,衍生自所述不同细菌噬菌体的所述STF蛋白的C-末端区对应于序列SEQID NO:16的STF蛋白的氨基酸208-875。在所述实施方案中,所述嵌合RBP可包含序列SEQ IDNO:11或者由其组成。在特定实施方案中,衍生自所述不同细菌噬菌体的所述STF蛋白的C-末端区对应于序列SEQ ID NO:12的STF蛋白的氨基酸28-632。在所述实施方案中,所述嵌合RBP可包含序列SEQ ID NO:13或SEQ ID NO:14或者由其组成。在特定实施方案中,衍生自所述不同细菌噬菌体的所述STF蛋白的C-末端区对应于序列SEQ ID NO:12的STF蛋白的氨基酸62-632。在所述实施方案中,所述嵌合RBP可包含序列SEQ ID NO:38或SEQ ID NO:40或者由其组成。
本公开还涉及用于将感兴趣的DNA有效载荷体内递送到靶标细菌细胞中的λ形细菌递送媒介物,其中所述λ形递送媒介物包含本文提供的嵌合RBP。在特定实施方案中,所述嵌合RBP为如本文公开的嵌合STF蛋白。在所述实施方案中,所述嵌合STF蛋白可为功能性STF蛋白。在仍然所述实施方案中,递送媒介物可进一步包含功能性λ形细菌噬菌体gpJ蛋白和/或功能性λ形细菌噬菌体gpH蛋白。在特定实施方案中,嵌合STF蛋白具有酶活性,比如解聚酶活性,并且感兴趣的细菌细胞群包含包封的细菌。在特定实施方案中,将嵌合STF蛋白、gpJ蛋白和/或gpH蛋白中的一种或多种进行设计改造以提高将DNA有效载荷转移到靶标细菌细胞群中的效率。在特定实施方案中,递送媒介物包含含有序列SEQ ID NO:11或者由其组成的嵌合RBP和含有序列SEQ ID NO:27或者由其组成的gpJ嵌合蛋白1A2。
在特定实施方案中,细菌细胞群选自大肠杆菌细菌、肺炎克雷伯氏菌和感兴趣的其他物种。
在特定实施方案中,所述细菌递送媒介物包含所述感兴趣的DNA有效载荷。在特定实施方案中,DNA有效载荷包含选自以下的感兴趣的核酸:Cas核酸酶基因,Cas9核酸酶基因,引导RNA,CRISPR基因座,毒素基因,表达酶比如核酸酶或激酶、TALEN、ZFN、大范围核酸酶(meganuclease)、重组酶、细菌受体、膜蛋白、结构蛋白、分泌蛋白的基因,表达对抗生素或一般药物的抗性的基因,表达毒性蛋白或毒性因子的基因和表达毒力蛋白或毒力因子的基因,或任何其组合。在所述实施方案中,核酸酶可靶向宿主细菌细胞染色体或宿主细菌细胞质粒的切割。在所述实施方案中,切割可发生在抗生素抗性基因中。在特定实施方案中,感兴趣的核酸编码治疗性蛋白。在另一个特定实施方案中,感兴趣的核酸编码反义核酸分子。
本公开还涉及包含如本文公开的细菌递送和药学上可接受的载剂的药用或兽药用组合物。在特定实施方案中,所述组合物用于口服给予。
本公开还提供用于将感兴趣的DNA有效载荷体内递送到受试者中的方法,其包括给予所述受试者如本文提供的药用或兽药用组合物。
本公开的另一个目的涉及提供用于治疗由细菌引起的疾病或障碍的方法,其包括给予患有需要治疗的疾病或障碍的受试者治疗有效量的本文公开的药用或兽药用组合物。在特定实施方案中,所述疾病或障碍为涉及人类微生物组细菌的细菌感染、代谢障碍或病理学。在仍然特定实施方案中,所述组合物口服给予。
本公开还提供用于在治疗由细菌引起的疾病或障碍的方法中使用的药用或兽药用组合物。在特定实施方案中,所述疾病或障碍为涉及人类微生物组细菌的细菌感染、代谢障碍或病理学。在仍然特定实施方案中,所述组合物口服给予。
本公开进一步涉及用于减少细菌群体中毒力和/或抗生素抗性细菌的量的方法,其包括使细菌群体与如本文提供的细菌递送媒介物接触。另一个目的涉及提供用于减少细菌群体中毒力和/或抗生素抗性细菌的量的方法中使用的细菌递送媒介物。
附图简述
图1:λ包装的噬菌粒在SIF(模拟肠液)中的稳定性。左侧条形组,由MG1655中的CYC3产生的野生型λ包装的噬菌粒;中间条形组,MG1656-OmpCO157中的λ1A2-V10包装的噬菌粒;右侧条形组,基于H10(O157)菌株的1A2-V10包装的噬菌粒。Y轴显示每μL的颗粒滴度。
图2:λSTF-V10设计改造的变体。箭头描绘预测的胰蛋白酶和糜蛋白酶位点(出于清晰的原因,并未显示所有位点)。
图3:λSTF-V10变体在不同条件下的稳定性。左侧条形组,初始λSTF-V10变体(SEQID NO:15);第二条形组,STF-V10-[FA]变体(SEQ ID NO:9);第三条形组,STF-V10-[AAH]变体(SEQ ID NO:10);第四条形组,STF-V10-Helix变体(SEQ ID NO:11)。Y轴显示每μL的CFU计数。
图4:λ包装的噬菌粒1A2 gpJ-STF-V10(1A2-V10)在未定殖小鼠中随着时间推移的脱落(n=3)。左侧剂量条对应于包装的噬菌粒产生之后的滴定。“黑色条”:1A2活性;“灰色条”:V10活性。
图5:在未定殖小鼠中给予之后t=6h时,λ包装的噬菌粒1A2-STF-V10-[FA](n=4)和1A2-STF-V10-[Helix](n=3)的脱落。“黑色圆圈”,1A2活性;“白色三角形”,V10活性。
图6:单次口服给予这些包装的噬菌粒后,λ包装的噬菌粒1A2-STF-V10-[Helix]随着时间推移的脱落(n=5只小鼠)。图例:
H10Δstx=V10活性;MG1656-OmpCO157=1A2活性。
图7:在第一剂混合物(1A2-STF-V10-[FA]和1A2-STF-V10-[Helix])之后的3个不同时间点时,来自体内H10Δstx/pRFP的pRFP治愈百分比(n=10只小鼠):t=6h,黑色;t=24h,浅灰色;t=48h,深灰色。
图8:STEC菌株H10WT在5剂包装的噬菌粒之后随着时间推移的肠去定殖:用缓冲液(蔗糖碳酸氢盐)管饲的对照组随着时间推移的定殖。
图9:STEC菌株H10WT在5剂包装的噬菌粒之后随着时间推移的肠去定殖:用λ包装的噬菌粒1A2-STF-V10-[Helix]处理的测试组随着时间推移的定殖。
图10:λ包装的噬菌粒1A2-K5在PBS中的稳定性。黑色条,仅PBS;白色条,pH 6.8的PBS加胰酶。左侧条组,MG1656-OmpCO157中的活性;右侧条组,LMR_503菌株。Y轴显示每μL的颗粒滴度。
图11:λ包装的噬菌粒1A2-K5 5.0Helix变体的稳定性。黑色条,仅PBS;白色条,pH6.8的PBS加胰酶。左侧条组,MG1656-OmpCO157中的活性;右侧条组,LMR_503菌株。Y轴显示每μL的颗粒滴度。
图12:λ包装的噬菌粒1A2-K5 5.1Helix变体的稳定性。黑色条,仅PBS;白色条,pH6.8的PBS加胰酶。左侧条组,MG1656-OmpCO157中的活性;右侧条组,LMR_503菌株。Y轴显示每μL的颗粒滴度。
图13:实施例3中通过svAUC分析的3个Eligobiotics(EB)批次的沉降系数分布数据的叠加。用3或4个拷贝的有效载荷包装的EB积分范围如虚线所示。
图14:含有3或4个拷贝的有效载荷的的相对丰度。将svAUC中定义的每个群体在260和280nm处的吸光度信号积分,并用于计算其在每批/>中的相对丰度。
图15:λ包装的噬菌粒1A2-K5在PBS中的稳定性。黑色条:仅PBS;白色条:pH 6.8的PBS加胰酶。左侧条组:MG1656-OmpCO157中的活性;右侧条组:LMR_503菌株。Y轴显示每μL的颗粒滴度。
图16:1剂之后LMR_503菌株随着时间推移的肠去定殖。用携带A8gpJ、K5 9.1STF和质粒p775的/>处理的测试组随着时间推移的定殖。D8表示用LMR_503菌株定殖小鼠之后的天数;T0、T8表示用/>处理之后的时间0(预处理水平)和8h。
详述
嵌合受体结合蛋白(RBP)
本公开涉及抵抗蛋白水解消化(特别是在胃肠道内)的嵌合受体结合蛋白(RBP),其中所述嵌合RBP包含衍生自细菌噬菌体的受体结合蛋白的一部分,其通过由1-70个氨基酸(更特别地1-30个氨基酸)组成的设计的接头区与衍生自不同细菌噬菌体的相应受体结合蛋白的一部分融合,其中所述接头区被设计为抵抗蛋白水解消化,特别是在胃肠道内。
对蛋白水解消化的抗性
“蛋白水解消化”在本文中意指由具有任何蛋白酶活性的酶介导的蛋白的蛋白水解。“胃肠道内的蛋白水解消化”在本文中意指在胃肠道的任何部分,比如在口腔、食道、胃、小肠或大肠中,由具有蛋白酶活性的酶介导的蛋白的蛋白水解。在特定实施方案中,所述蛋白水解消化处于小肠内。在更特定实施方案中,所述蛋白水解消化处于十二指肠内。
如技术人员众所周知的,十二指肠内的蛋白水解消化主要地受胆汁盐和胰酶的影响。在特定实施方案中,所述蛋白水解消化通过胰酶进行。“胰酶”在本文中意指胰酶的混合物,包括胰蛋白酶和糜蛋白酶,以及任选地淀粉酶和脂肪酶。在另一个特定实施方案中,所述蛋白水解消化是通过胰蛋白酶和/或糜蛋白酶的。“胰蛋白酶”在本文中意指EC 3.4.21.4类别的酶,其为来自PA家族簇(clan)超家族的丝氨酸蛋白酶,存在于许多脊椎动物的消化系统中,在那里其水解蛋白。一般地,胰蛋白酶在赖氨酸和精氨酸氨基酸残基的C-末端侧切割肽,但如果脯氨酸残基在切割位点的羧基侧,则切割可能不会发生,并且如果酸性残基在切割位点的任一侧,则水解速率可能较慢。“糜蛋白酶”在本文中意指EC 3.4.21.1类别的酶,其为来自PA家族簇超家族的丝氨酸蛋白酶,存在于脊椎动物的消化系统中,在那里其水解蛋白。一般地,糜蛋白酶切割涉及酪氨酸、苯丙氨酸和色氨酸的L-异构体的肽键。
“抵抗蛋白水解消化”在本文中意指嵌合RBP不被所述蛋白酶切割和/或当与所述蛋白酶接触时保持稳定和/或当与所述蛋白酶接触时保持其活性。确定蛋白是否抵抗胰酶,特别是胰蛋白酶和/或糜蛋白酶的蛋白水解消化的技术一般包括在存在或不存在胰酶的情况下,一般在2%w/v下,例如在pH 6.8下,一般持续3h,特别是在37℃下,将所述蛋白暴露于模拟肠液(SIF),然后确定所述经处理蛋白的活性(例如通过在由包含所述RBP的包装的噬菌粒特异性地靶向的细菌中包含所述嵌合RBP的细菌递送媒介物的滴定)并将其与相同但未经处理蛋白的活性进行比较。在本公开的背景下,在用胰酶一般在2%w/v下,例如在pH6.8下,一般持续3h,特别是在37℃下处理之后,如果由所述RBP特异性地靶向的细菌中包含所述嵌合RBP的细菌递送媒介物的滴度与包含靶向相同细菌的相同嵌合RBP的相同但未经处理细菌递送媒介物的滴度相比较降低1个log或更少,则优选地认为嵌合RBP抵抗蛋白水解消化。
嵌合RBP
如本文使用的,受体结合蛋白或RBP为识别和任选地结合和/或修饰或降解位于细菌外包膜上的底物的多肽所述细胞外包膜非限制性地比如细菌外膜、LPS、荚膜、蛋白受体、通道、结构比如鞭毛、菌毛、分泌系统。底物可非限制性地为任何碳水化合物或修饰的碳水化合物、任何脂质或修饰的脂质、任何蛋白或修饰的蛋白、任何氨基酸序列及其任何组合。
此类RBP部分所衍生自的细菌噬菌体RBP包括例如“L形丝”、“侧尾丝(stf)”、“长尾丝”或“尾刺尖”。在优选实施方案中,RBP具有针对宿主或受试者微生物组的特定细菌细胞的宿主范围。在一个具体方面,嵌合RBP的不同RBP衍生自任何细菌噬菌体或任何细菌素。
在实施方案中,所述嵌合RBP为嵌合侧尾丝(STF)蛋白。
在特定实施方案中,嵌合STF包含衍生自λ形细菌噬菌体、优选λ或λ样细菌噬菌体的STF的N-末端区,其通过所述设计的接头区与衍生自不同细菌噬菌体的STF蛋白的C-末端区融合的。此类嵌合RBP包括具有改变的宿主范围和/或生物活性比如解聚酶活性的那些。
如本文使用的,λ形细菌噬菌体包含一组感染细菌的相关病毒。这些病毒被称为λ形,因为第一批描述的成员之一为lambda(λ)。λ形细菌噬菌体为尾(Caudovirus)病毒目(也被称为有尾细菌噬菌体)的成员,并且包括具有相似生活方式(包括例如当互交(intercross)时能够重组、具有相同的粘性末端对)的那些细菌噬菌体,以及可通过紫外线照射诱导的原噬菌体。尽管该目的成员可能具有在核苷酸水平上不同的基因组,但它们携带具有足够核苷酸序列同一性的区域以引导它们之间的重组,一般产生具有所有必需基因的完全功能噬菌体(参见例如Casjens和Hendrix(2015)Virology 479-480:310-330)。出于本公开的目的,本领域的技术人员通常会理解用作递送媒介物的λ形细菌噬菌体以及供使用的λ形STF。
λ形噬菌体可基于基因组分析而被定义为属于λ超级簇(supercluster)[9]。在该超级簇中,可区分几个簇,每个簇具有典型噬菌体。噬菌体样簇及其成员(括号之间)为:λ样(lambda(λ)、HK630、HK629)、phi80样(phi80、HK225、mEp237)、N15样(N15、PY54、phiKO2)、HK97样(HK97、HK022、HK75、HK106、HK140、HK446、HK542、HK544、HK633、mEpX1、mEpX2、mEp234、mEp235、mEp390、ENT39118)、ES18样(ES18、Oslo、SPN3UB)、Gifsy-2样(gifsy-2、gifsy-1、Fels-1、mEp043、mEp213、CP-1639、mEp640、FSL_SP-016)、BP-4795样(BP-4795、2851、stx2-1717、YYZ-2008)、SfV样(SfV、SfII、SfIV、SfI、/>ST64B)、P22样(P22、L、SPN9CC、ST64T、ST104、ST160、ε34、g341、SE1、Emek、/>IME10、Sf6、HK620、CUS-3、SPC-P1)、APSE-1样(APSE-1、APSE-2)、933W样(933W、/> stx2-86、min27、/>P13374、TL-2011c、VT2-sakai、/>)、HK639样(HK639)、/>HS2样(HS2)、ENT47970样(ENT47670)、ZF40样(ZF40)、/>样/>独立于所述细菌噬菌体编码的其他氨基酸序列,在参照λ细菌噬菌体STF序列SEQ ID NO:8的1-150、320-460和495-560位范围内的三氨基酸区域中的一个或多个中,λ形噬菌体进一步涵盖编码具有以下氨基酸序列同源性的RBP的任何细菌噬菌体:对于45个氨基酸或更多具有约35%的同一性、对于30个氨基酸或更多具有约50%的同一性或者对于18个氨基酸或更多具有约90%的同一性。
在本公开中,λ形STF蛋白包括例如包含以下或者由其组成的蛋白:与直至对应于λSTF(Uniprot P03764 SEQ ID NO:8)的氨基酸130的氨基酸,特别是直至所述λSTF的氨基酸130具有至少75%同一性的氨基酸序列。
在一方面,STF蛋白包括包含与SEQ ID NO:8的野生型λSTF蛋白氨基酸序列或与本文公开的任何嵌合STF蛋白具有80、85、90、95、96、97、98或99%序列同一性的氨基酸序列或者由其组成。
如本文使用的,两个序列之间的同源性百分比等于两个序列之间的同一性百分比。同一性百分比相对于其序列已经比对的聚合物(例如多核苷酸或多肽)来计算。两个序列之间的同一性百分比为序列所共享的相同位置数的函数(即%同源性=相同位置数/位置总数x100),考虑需要引入以进行两个序列最佳比对的空位数和每个空位的长度。两个序列之间的序列比较和同一性百分比的确定可使用数学算法来完成,如以下非限制性实例中所述。
可使用已纳入到ALIGN程序(版本2.0)中的E.Meyers和W.Miller的算法(Comput.Appl.Biosci.,4:11-17(1988)),使用PAM120权重残基表、空位长度罚分12和空位罚分4,来确定两个氨基酸序列之间的同一性百分比。另外,可使用已纳入到GCG软件包(可在www.gcg.com获得)中的GAP程序中的Needleman和Wunsch(J.Mol.Biol.48:444-453(1970))算法,使用BLOSUM62矩阵、BLOSUM30矩阵或PAM250矩阵,以及空位权重16、14、12、10、8、6或4和长度权重1、2、3、4、5或6,来确定两个氨基酸序列之间的同一性百分比。在具体实施方案中,使用BLOSUM30矩阵,空位开放罚分为12和空位扩展罚分为4。
在本公开的背景下,所述衍生自细菌噬菌体(自其衍生出了嵌合RBP的N-末端区)的RBP抵抗如上定义的蛋白水解消化,并且所述衍生自不同细菌噬菌体(自其衍生出了嵌合RBP的C-末端区)的RBP也抵抗如上定义的蛋白水解消化。确实,如上所述,已经表明,即使这些“野生型”RBP抵抗蛋白水解消化,使用来自这些稳定RBP的分离区域来产生嵌合体也可能导致产生不抵抗蛋白水解消化的嵌合体。
来自细菌噬菌体的STF蛋白的“N-末端区”在本文中意指始于所述STF蛋白的N-末端并止于所述STF蛋白的80-150、320-460或495-560位的所述STF蛋白的氨基酸区域,所述位置参照λ细菌噬菌体STF序列(SEQ ID NO:8)。来自细菌噬菌体的STF蛋白的“C-末端区”在本文中意指始于所述STF蛋白的25-150、320-460或495-560位并止于所述STF蛋白的C-末端的所述STF蛋白的氨基酸区域,所述位置参照λ细菌噬菌体STF序列(SEQ ID NO:8)。
在特定实施方案中,衍生自λ形细菌噬菌体的STF蛋白的N-末端区对应于序列SEQID NO:8的λSTF蛋白的氨基酸1-528。
在特定实施方案中,所述衍生自不同细菌噬菌体的STF蛋白的C-末端区对应于序列SEQ ID NO:16的STF蛋白的氨基酸218-875。
在另一个特定实施方案中,所述衍生自不同细菌噬菌体的STF蛋白的C-末端区对应于序列SEQ ID NO:16的STF蛋白的氨基酸208-875。
在备选实施方案中,所述衍生自不同细菌噬菌体的STF蛋白的C-末端区对应于序列SEQ ID NO:12的STF蛋白的氨基酸28-632。
在备选实施方案中,所述衍生自不同细菌噬菌体的STF蛋白的C-末端区对应于序列SEQ ID NO:12的STF蛋白的氨基酸62-632。
在一个实施方案中,嵌合STF蛋白包含衍生自λ形细菌噬菌体、优选衍生自λ或λ样细菌噬菌体的STF蛋白的N-末端区,其通过所述设计的接头区与不同STF蛋白的C-末端区融合,其中嵌合STF蛋白的所述N-末端区在选自以下的氨基酸区域之一内与不同STF蛋白的所述C-末端区融合:在参照λ细菌噬菌体STF序列(SEQ ID NO:8)的N-末端区的80-150、320-460或495-560位。在一方面,来自λ形细菌噬菌体、特别是来自λ或λ样细菌噬菌体的STF蛋白和衍生自不同细菌噬菌体的STF蛋白在参照λ细菌噬菌体STF序列(SEQ ID NO:8)的RBP的80-150、320-460和495-560位范围内的三氨基酸区域中的一个或多个中含有同源性。在某些方面,在参照λ细菌噬菌体STF序列的STF蛋白的80-150、320-460和495-560位范围内的三氨基酸区域中的一个或多个内,同源性对于45个氨基酸或更多为约35%的同一性、对于30个氨基酸或更多为约50%的同一性或者对于18个氨基酸或更多为约90%的同一性。在一个具体方面,嵌合STF蛋白的C-末端区衍生自细菌噬菌体或细菌素。在一方面,嵌合STF蛋白包含STF蛋白的N-末端区,其在选自参照λ细菌噬菌体STF序列(SEQ ID NO:8)的N-末端STF区的80-150、320-460和495-560位的氨基酸区域之一内与衍生自不同细菌噬菌体的STF蛋白的C-末端区融合。
在特定实施方案中,嵌合RBP包含衍生自λ形细菌噬菌体的STF蛋白的N-末端区,其通过由1-70个氨基酸(更特别地1-30个氨基酸)组成的设计的接头区与衍生自不同细菌噬菌体的STF蛋白的C-末端区融合,其中所述N-末端区和C-末端区在与选自氨基酸SAGDAS(SEQ ID NO:1)、ADAKKS(SEQ ID NO:2)、MDETNR(SEQ ID NO:3)、SASAAA(SEQ ID NO:4)和GAGENS(SEQ ID NO:5)的位点具有至少80%、85%、90%、95%、99%或100%同一性的被称为插入位点的N-末端STF区的位点内融合。在特定实施方案中,所述插入位点与序列GAGENS(SEQ ID NO:5)的位点具有至少80%、85%、90%、95%、99%或100%同一性。
在特定实施方案中,本文提供的嵌合RBP为设计改造的分支受体结合多亚基蛋白复合物(“分支RBP”)。设计改造的嵌合分支RBP一般包含衍生自细菌噬菌体的两个或更多个相关RBP,其基于相互作用结构域(ID)的存在而彼此缔合。一个亚基与另一个的缔合可为非共价或共价的。每个多肽亚基均含有ID,其作为“锚”起作用而用于一个亚基RBP与另一个缔合。在具体实施方案中,嵌合分支RBP可包含多个RBP亚基,包括例如2、3、4个等亚基。
单个RBP亚基可为整个设计改造的嵌合分支RBP带来不同的生物功能。此类功能包括但不限于宿主识别和酶促活性。此类酶促活性包括解聚酶活性。嵌合分支RBP的两个或更多个相关受体结合蛋白包括但不限于本文所述的嵌合RBP,其包含衍生自λ形细菌噬菌体、特别是衍生自λ或λ样细菌噬菌体的RBP的N-末端区和衍生自不同细菌噬菌体的RBP的C-末端区之间的融合,其中所述嵌合RBP进一步包含ID结构域。
在备选实施方案中,所述嵌合RBP为嵌合gpJ蛋白。
设计的接头区
“设计的接头区”在本文中意指由1-70个氨基酸,更特别地1-65个氨基酸,仍然特别地1-60个氨基酸、仍然特别地1-55个氨基酸,仍然特别地1-50个氨基酸,仍然特别地1-45个氨基酸,仍然特别地1-40个氨基酸,仍然特别地1-35个氨基酸,仍然特别地1-30个氨基酸,更特别地由10-25个氨基酸,或由15-20个氨基酸,特别是由1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70个氨基酸组成的区域,其连接嵌合RBP的N-末端部分和嵌合RBP的C-末端部分。
在特定实施方案中,所述设计的接头区包含如上定义的插入位点。在备选实施方案中,所述设计的接头区邻近如上定义的插入位点。在更特定实施方案中,所述设计的接头区位于如上定义的插入位点的C-末端。换言之,在该实施方案中,设计的接头区始于就在插入位点最后一个氨基酸后的氨基酸。
在特定实施方案中,所述设计的接头区为嵌合RBP的N-末端区或C-末端区的一部分。在该实施方案的特定方面,嵌合RBP的所述N-末端区或所述C-末端区包含接头区的序列,但与其所衍生自的RBP的N-末端区或C-末端区中的相应野生型序列相比较,所述序列已被专门设计改造(即修饰)。因此,在该特定方面,当所述设计的接头区为嵌合RBP的N-末端区或C-末端区的一部分时,该设计的接头区的序列与嵌合RBP的N-末端区所衍生自的RBP的N-末端区中相应区域的序列或者嵌合RBP的C-末端区所衍生自的RBP的C-末端区中相应区域的序列不是100%相同。
在特定实施方案中,所述接头区以这样的方式设计改造,即如上定义的可能被胰蛋白酶和/或糜蛋白酶靶向的接头区的至少一个氨基酸为突变的。
因此,在特定实施方案中,对应于可能被胰蛋白酶和/或糜蛋白酶靶向的野生型区域序列的氨基酸的设计的接头区的至少一个氨基酸与野生型区域序列相比较为突变的。
在特定实施方案中,可能被靶向至胰蛋白酶和/或糜蛋白酶的所述氨基酸选自赖氨酸(K)、精氨酸(R)、苯丙氨酸(F)、色氨酸(W)、酪氨酸(Y)、亮氨酸(L)和甲硫氨酸(M)。在特定实施方案中,所述氨基酸由丙氨酸(A)或由不为赖氨酸、精氨酸、苯丙氨酸、色氨酸、酪氨酸、亮氨酸或甲硫氨酸的任何氨基酸比如由组氨酸(H)取代。
在特定实施方案中,设计的接头区的仅一个氨基酸为突变的。在备选实施方案中,设计的接头区的多于一个氨基酸为突变的,特别是设计的接头区的至少两个或至少三个氨基酸为突变的。
在特定实施方案中,所述接头区为嵌合RBP的C-末端区的一部分,并且所述至少一个氨基酸位于接头区的前15个氨基酸内。在该实施方案中,所述至少一个氨基酸特别是位于如上定义的插入位点后的15个氨基酸内。
在特定实施方案中,所述嵌合RBP,一般包括此类设计的接头区,包含序列SEQ IDNO:9(本文中被称为STF-V10-[FA])或SEQ ID NO:10(本文中被称为STF-V10-[AAH])或者由其组成。
在备选实施方案中,所述接头区以这样的方式设计,即其包含抵抗蛋白水解消化并且因此与区别仅为不存在所述接头区的嵌合RBP相比较一般恢复嵌合RBP的蛋白水解消化抗性的结构。
因此,在其中所述设计的接头区为嵌合RBP的N-末端区或C-末端区的一部分的实施方案的特定方面,嵌合RBP的所述N-末端区或所述C-末端区包含接头区的序列,优选地分别在其C-末端部分或N-末端部分,所述序列与其所衍生自的RBP的N-末端区或C-末端区中的相应序列相同,并且与区别仅为不存在所述接头区的嵌合RBP相比较,所述序列恢复所述嵌合RBP如上定义的对蛋白水解消化的抗性。
换言之,在该特定方面,所述设计的接头区为嵌合RBP的N-末端区或C-末端区的一部分,并且该设计的接头区的序列与其所衍生自的RBP的N-末端区或C-末端区中的野生型序列相比较并未有修饰,而是与不包括它的N-末端区或C-末端区相比较,由于其对如上所定义的对蛋白水解消化的抗性而被特别选择为存在,优选地存在于N-末端区的C-末端部分或C-末端区的N-末端部分。
或者,在特定实施方案中,所述设计的接头区包含非衍生自嵌合RBP的N-末端区和C-末端区所衍生自的RBP之一的异源氨基酸序列或者由其组成。在特定实施方案中,所述设计的接头区包含衍生自不是嵌合RBP的N-末端区和C-末端区所衍生自的RBP之一的RBP的序列或由组成。
在特定实施方案中,所述设计的接头区由10-70个氨基酸,特别是由10-65个氨基酸、由10-64个氨基酸、由10-63个氨基酸、由10-62个氨基酸、由10-61个氨基酸、由10-60个氨基酸、由10-55个氨基酸、由10-50个氨基酸、由10-45个氨基酸、由10-40个氨基酸、由10-35个氨基酸、由10-30个氨基酸、由10-20个氨基酸、特别是由11-20个氨基酸或由12-20个氨基组成。
在特定实施方案中,所述设计的接头区包含本文中被称为螺旋序列的氨基酸序列GSATDVMIQL(SEQ ID NO:6)或GSATDVMIQLA(SEQ ID NO:7)或者由其组成。
在特定实施方案中,所述序列位于设计的接头区的前10或12个氨基酸内。在更特定实施方案中,所述序列直接位于如上定义的插入位点之后。
在特定实施方案中,一般包括此类设计的接头区的所述嵌合RBP包含序列SEQ IDNO:11(本文中被称为STF-V10-[Helix])或者由其组成。在另一个实施方案中,一般包括此类设计的接头区的所述嵌合RBP包含序列SEQ ID NO:13(本文中被称为K5 5.0)或SEQ IDNO:14(本文中被称为K5 5.1)或者由其组成。
在特定实施方案中,所述设计的接头区包含氨基酸序列SEQ ID NO:34或SEQ IDNO:36或者由其组成。在特定实施方案中,所述序列直接位于如上定义的插入位点之后。在特定实施方案中,一般包括此类设计的接头区的所述嵌合RBP包含序列SEQ ID NO:38(本文中被称为K5 9.0)或SEQ ID NO:40(本文中被称为K5 9.1)或者由其组成。
在特定实施方案中,设计的接头区包含螺旋或螺旋束。
“螺旋束(helical bundle)”或“螺旋束(helix bundle)”在本文中意指由几个通常彼此几乎平行或反平行的α螺旋组成的小蛋白折叠。
“螺旋”在本文中意指蛋白二级结构中的基序。
本公开还提供编码如上定义的嵌合RBP的核酸。
在特定实施方案中,所述核酸编码包含序列SEQ ID NO:9或者由其组成的嵌合RBP,并且一般包含序列SEQ ID NO:17或者由其组成。在另一个特定实施方案中,所述核酸编码包含序列SEQ ID NO:10或者由其组成的嵌合RBP,并且一般包含序列SEQ ID NO:18或者由其组成。在另一个特定实施方案中,所述核酸编码包含序列SEQ ID NO:11或者由其组成的嵌合RBP,并且一般包含序列SEQ ID NO:19或者由其组成。在另一个特定实施方案中,所述核酸编码包含序列SEQ ID NO:13或者由其组成的嵌合RBP,并且一般包含序列SEQ IDNO:20或者由其组成。在另一个特定实施方案中,所述核酸编码包含序列SEQ ID NO:14或者由其组成的嵌合RBP,并且一般包含序列SEQ ID NO:21或者由其组成。在另一个特定实施方案中,所述核酸编码包含序列SEQ ID NO:38或者由其组成的嵌合RBP,并且一般包含序列SEQ ID NO:39或者由其组成。在另一个特定实施方案中,所述核酸编码包含序列SEQ IDNO:40或者由其组成的嵌合RBP,并且一般包含序列SEQ ID NO:41或者由其组成。
此类核酸可被包括在载体中,比如细菌噬菌体、质粒、噬菌粒、噬菌体-质粒、病毒和其他媒介物,其使得可转移和表达编码核酸的嵌合RBP。因此,本公开还提供这样的载体,其包含编码如上定义的嵌合RBP的核酸,特别是包含编码包含SEQ ID NO:11或者由其组成的嵌合RBP的核酸,其一般包含序列SEQ ID NO:19或者由其组成。
λ形细菌递送媒介物
本公开涉及λ形细菌递送媒介物,其一般用于将感兴趣的DNA有效载荷体内递送到目标细菌细胞中,其中所述λ形递送媒介物包含抵抗蛋白水解消化(特别是在胃肠道内)的嵌合RBP,如以上“嵌合RBP”部分中所定义的。
本文提供的细菌递送媒介物使得可将编码感兴趣的蛋白或核酸的核酸有效载荷转移到期望的靶标细菌宿主细胞中。
递送媒介物
如本文使用的,术语“递送媒介物”是指允许将有效载荷转移到细菌中的任何手段。存在由本公开涵盖的几种类型的递送媒介物,非限制性地包括:细菌噬菌体支架、病毒支架、基于化学的递送媒介物(例如环糊精、磷酸钙、阳离子聚合物、阳离子脂质体)、基于蛋白或基于肽的递送媒介物、基于脂质的递送媒介物、基于纳米颗粒的递送媒介物、非基于化学的递送媒介物(例如转化、电穿孔、声致穿孔、光学转染)、基于颗粒的递送媒介物(例如基因枪、磁转染、穿刺感染(impalefection)、粒子轰击、细胞穿透肽)或供体细菌(接合)。本公开还涵盖递送媒介物的任何组合。递送媒介物可指细菌噬菌体衍生的支架并且可从天然的、演化的或设计改造的衣壳中获得。
使得可将编码感兴趣的蛋白或核酸的核酸有效载荷转移到期望的靶标细菌宿主细胞中的本文提供的细菌递送媒介物的特征为具有抵抗蛋白水解消化(特别是在胃肠道内)的嵌合RBP,如以上“嵌合RBP”部分中所定义的。
在特定实施方案中,所述嵌合RBP为如以上“嵌合RBP”部分中定义的嵌合STF蛋白。在特定实施方案中,所述嵌合STF蛋白为功能性STF蛋白。
如本文使用的,功能性蛋白通常意指具有生物活性的蛋白;更具体地讲,功能性嵌合蛋白涉及助于将DNA有效载荷有效地递送到目标菌株中的嵌合蛋白。效率阈值取决于许多因素,比如蛋白的类型、靶标菌株的类型和环境的类型。例如,STF和gpJ蛋白允许识别、结合(并且在一些情况下还降解)细胞外表位,比如LPS、荚膜和外膜蛋白;gpH蛋白允许DNA有效载荷有效注入并因此成功穿过周质。
在一些实施方案中,本文公开的细菌递送媒介物进一步包含嵌合RBP的相应天然伴侣蛋白(被命名为“辅助蛋白”或“AP”)。此类AP蛋白助于嵌合RBP的折叠。
在特定实施方案中,嵌合STF蛋白具有酶活性,比如解聚酶活性,并且感兴趣的细菌细胞群包含包封的细菌。
还提供进一步包含重组gpJ蛋白的细菌递送媒介物。此类gpJ蛋白包括允许识别除LamB OMP受体以外的细菌细胞受体的重组gpJ蛋白,其包括如以上“嵌合RBP”部分中定义的嵌合蛋白。已知gpJ的受体识别活性在于蛋白的C-末端部分,小至249个氨基酸的片段赋予与LamB受体结合的能力[10]。在特定实施方案中,此类嵌合gpJ蛋白可包含来自λ形细菌噬菌体、特别是来自λ或λ样细菌噬菌体的gpJ蛋白的N-末端区与不同gpJ蛋白的C-末端区之间的融合。
来自细菌噬菌体的gpJ蛋白的“N-末端区”在本文中意指始于所述gpJ蛋白的N-末端并止于所述gpJ蛋白的810-825或950-970位的所述gpJ蛋白的氨基酸区域,所述位置参照λ细菌噬菌体gpJ蛋白序列(SEQ ID NO:22)。来自细菌噬菌体的gpJ蛋白的“C-末端区”在本文中意指始于所述gpJ蛋白的810-825或950-970位并止于所述gpJ蛋白的C-末端的所述gpJ蛋白的氨基酸区域,所述位置参照λ细菌噬菌体gpJ蛋白序列(SEQ ID NO:22)。
对于嵌合gpJ蛋白的产生,发明人先前已经鉴定了分别位于对应于λ细菌噬菌体gpJ蛋白序列(SEQ ID NO:22)的氨基酸814-821和958-966的位置的两个插入点。在非限制性方面,此类插入位点可被用于产生嵌合蛋白。两者插入点均产生具有改变的受体结合的功能性gpJ嵌合体。在一个实施方案中,细菌递送媒介物含有嵌合gpJ蛋白,其包含衍生自λ形细菌噬菌体、特别是衍生自λ或λ样细菌噬菌体的gpJ蛋白的N-末端区与不同gpJ蛋白的C-末端区之间的融合,其中嵌合gpJ蛋白的所述N-末端区在选自参照λ细菌噬菌体gpJ蛋白序列(SEQ ID NO:22)的N-末端区的810-825或950-970位的氨基酸区域之一内与不同gpJ蛋白的所述C-末端区融合。
在具体实施方案中,嵌合gpJ蛋白包含λ细菌噬菌体gpJ蛋白的N-末端区与来自不同细菌噬菌体的gpJ蛋白的C-末端区之间的融合,其一般识别并结合OmpC,所述N-末端区特别是在参考λ细菌噬菌体gpJ蛋白序列(SEQ ID NO:22)的N-末端区的氨基酸区域950-970内与所述C-末端区融合。在所述实施方案中,嵌合gpJ变体可为包含氨基酸序列SEQ ID NO:23或者由其组成并且一般由核苷酸序列SEQ ID NO:24编码的H591,所述H591嵌合gpJ变体一般识别并结合OmpC。在另一个实施方案中,嵌合gpJ蛋白包含λ细菌噬菌体gpJ蛋白的N-末端区与来自不同细菌噬菌体的gpJ蛋白的C-末端区之间的融合,其一般识别存在于O157菌株中的受体,所述N-末端区特别是在参照λ细菌噬菌体gpJ蛋白序列(SEQ ID NO:22)的N-末端区的氨基酸区域810-825内与所述C-末端区融合。在所述实施方案中,嵌合gpJ变体可为包含氨基酸序列SEQ ID NO:25或者由其组成并且一般由核苷酸序列SEQ ID NO:26编码的Z2145,所述Z2145嵌合gpJ变体一般识别存在于O157菌株中的受体。在仍然另一个实施方案中,嵌合gpJ蛋白包含λ细菌噬菌体gpJ蛋白的N-末端区与来自不同细菌噬菌体的gpJ蛋白的C-末端区之间的融合,其一般识别存在于O157菌株中的OmpC受体,所述N-末端区特别是在参考λ细菌噬菌体gpJ蛋白序列(SEQ ID NO:22)的N-末端区的氨基酸区域950-970内与所述C-末端区融合。在所述实施方案中,嵌合gpJ变体可为包含氨基酸序列SEQ ID NO:27或者由其组成并且一般由核苷酸序列SEQ ID NO:28编码的“1A2”变体,所述1A2嵌合gpJ变体一般识别存在于O157菌株中的OmpC受体。在仍然另一个实施方案中,嵌合gpJ蛋白包含λ细菌噬菌体gpJ蛋白的N-末端区与来自不同细菌噬菌体的gpJ蛋白的C-末端区之间的融合,其一般识别存在于O157和MG1655菌株两者中的OmpC受体,所述N-末端区特别是在参考λ细菌噬菌体gpJ蛋白序列(SEQ ID NO:22)的N-末端区的氨基酸区域950-970内与所述C-末端区融合。在所述实施方案中,嵌合gpJ变体可为包含氨基酸序列SEQ ID NO:29或者由其组成并且一般由核苷酸序列SEQ ID NO:30编码的“A8”变体,所述A8嵌合gpJ变体一般识别O157和MG1655菌株两者中的OmpC受体。
还提供进一步包含重组gpH蛋白的细菌递送媒介物。此类gpH蛋白包括重组gpH蛋白,其允许或容许细菌载体改善地进入通透酶复合物中具有缺陷或改变的细胞中。一种这样的变体为氨基酸序列SEQ ID NO:31的“gpH-IAI”变体。
在特定实施方案中,所述细菌递送媒介物包含序列SEQ ID NO:11的嵌合STF和序列SEQ ID NO:27的嵌合gpJ变体。
在特定实施方案中,如上所述的λ形递送媒介物进一步包含如上定义的功能性λ形细菌噬菌体gpJ蛋白和/或如上定义的功能性λ形细菌噬菌体gpH蛋白。
在一些方面,本文提供的细菌递送媒介物为其中嵌合STF蛋白、gpJ蛋白和/或gpH蛋白中的一种或多种被进一步设计改造以提高将DNA有效载荷转移到靶标细菌细胞群中的效率的媒介物。此类细菌细胞群包括例如大肠杆菌和其他感兴趣的细菌物种。
在特定实施方案中,递送媒介物不能自我繁殖。
在本发明的背景下,“自我繁殖”不同于“自我复制”,“自我复制”是指复制核酸的能力,而“自我繁殖”是指拥有后代、特别是产生新的递送媒介物的能力,所述递送媒介物要么产生空的,要么具有包装的感兴趣的核酸。
“不能自我繁殖的递送媒介物”在本文中意指在所述递送媒介物(以及包括在所述递送媒介物中的所述载体)中不存在产生所述递送媒介物必需的至少一个、几个或所有功能基因。在优选实施方案中,产生所述递送媒介物必需的所述至少一个、几个或所有功能基因存在于如上定义的供体细胞中,优选地存在于如下定义的供体细胞中的质粒、染色体或辅助噬菌体中,使得可在所述供体细胞中产生所述递送媒介物。
在本发明的背景下,产生所述递送媒介物必需的所述一种或多种功能基因可通过以下方式缺失:(i)不存在相应的基因或(ii)存在相应的基因但呈非功能形式。
在一个实施方案中,产生所述递送媒介物必需的所述基因的序列在所述递送媒介物中不存在。在优选实施方案中,产生所述递送媒介物必需的所述基因的序列已被感兴趣的核酸序列替代。
或者,产生所述递送媒介物必需的所述基因以非功能形式存在于所述递送媒介物中,例如以突变体的非功能形式,或以不可表达的形式,例如具有缺失或突变的非功能调节物。在优选实施方案中,产生所述递送媒介物必需的所述基因以突变形式存在于所述递送媒介物中,所述突变形式使得其在靶标细胞中为非功能性的,而在供体细胞中保持为功能性的。
在本发明的背景下,产生所述递送媒介物必需的基因涵盖产生所述递送媒介物所需的任何编码或非编码核酸。
产生所述递送媒介物必需的基因的实例包括编码噬菌体结构蛋白的基因;参与控制基因表达的噬菌体基因;参与转录和/或翻译调控的噬菌体基因;参与噬菌体DNA复制的噬菌体基因;参与产生噬菌体蛋白的噬菌体基因;参与噬菌体蛋白折叠的噬菌体基因;参与噬菌体DNA包装的噬菌体基因;以及编码参与细菌细胞裂解的蛋白的噬菌体基因。
包装的噬菌粒
如本文公开的,递送媒介物包括包装的噬菌粒以及细菌噬菌体。为包装的噬菌粒,即衣壳化于噬菌体衍生衣壳中的有效载荷。此类递送媒介物的设计改造为本领域技术人员众所周知的。此类设计改造技术可采用经设计改造以表达本文公开的STF、gpJ和gpH蛋白的生产细胞系。因此,本公开还提供表达本文提供的嵌合RBP的生产细胞系。
在一方面,提供具有期望的靶标宿主范围的细菌递送媒介物用于将有效载荷转移到宿主的微生物组。细菌递送媒介物特征可为嵌合STF及野生型和设计改造的gpJ和gpH蛋白的组合。
包装的噬菌粒和细菌噬菌体颗粒的产生为本领域技术人员众所周知的常规技术。在一个实施方案中,卫星噬菌体和/或辅助噬菌体可被用于促进将有效载荷包装于本文公开的递送媒介物中。辅助噬菌体提供反式功能并且为本领域技术人员众所周知的。辅助噬菌体包含编码对于待包装的有效载荷必不可少的结构和功能蛋白的所有基因(即辅助噬菌体为组装递送媒介物提供所有必需的基因产物)。辅助噬菌体可含有缺陷型复制起点或包装信号,或者完全缺乏后者,并因此其不能自我包装,因此仅会产生携带有效载荷或质粒的细菌递送颗粒。可选择辅助噬菌体,以使得其不能诱导被用于递送颗粒产生的宿主的裂解。本领域的技术人员将会理解,一些细菌噬菌体为缺陷型的并且需要辅助噬菌体用于有效载荷包装。因此,取决于所选择用于制备细菌递送颗粒的细菌噬菌体,本领域的技术人员将会知道是否需要辅助噬菌体。可反式提供组装或产生包装的有效载荷必需的编码一种或多种蛋白的序列或调控过程。例如,本公开的STF、gpJ和gpH蛋白可在诱导型启动子的控制下在质粒中进行提供或组成型地进行表达。在这种情况下,噬菌体野生型序列可含有或不含反式提供的基因或序列的缺失。另外,编码新功能的嵌合或修饰的噬菌体序列,如设计改造的STF、gpJ或gpH蛋白,可被直接插入到辅助噬菌体基因组中期望的位置,因此绕过反式提供修饰序列的必要性。用于以质粒形式反式提供序列或蛋白两者的方法,以及产生直接基因组插入、修饰和突变的方法均为本领域技术人员众所周知的。
在特定实施方案中,所述辅助噬菌体包含编码含有序列SEQ ID NO:11或者由其组成的嵌合RBP的核酸序列,所述核酸序列一般包含序列SEQ ID NO:19或者由其组成,并且所述辅助噬菌体任选地进一步包含编码含有序列SEQ ID NO:27或者由其组成的嵌合gpJ变体的核酸序列,所述核酸序列一般包含序列SEQ ID NO:28或者由其组成。
在特定实施方案中,所述辅助噬菌体为λ原噬菌体,其中(i)编码野生型STF蛋白的核酸已被编码包含序列SEQ ID NO:11或者由其组成的嵌合RBP的核酸序列替代,所述核酸序列一般包含序列SEQ ID NO:19或者由其组成,(ii)编码野生型gpJ蛋白的核酸已被编码包含序列SEQ ID NO:27或者由其组成的嵌合gpJ变体的核酸序列替代,所述核酸序列一般包含序列SEQ ID NO:28或者由其组成,和(iii)Cos位点已经被去除,和其中任选地(iv)辅助原噬菌体含有防止自发性细胞裂解的突变比如Sam7突变,和(v)辅助原噬菌体含有主cI阻遏物的热敏形式,比如cI857形式。
因此,本公开的另一个目的还涉及提供如上定义的包含如上定义的辅助噬菌体的生产细胞系。
在特定实施方案中,所述细菌递送媒介物包含所述感兴趣的DNA有效载荷。
有效载荷
如本文使用的,术语“有效载荷”是指与递送媒介物一起转移到细菌中的任何核酸序列或氨基酸序列或两者的组合(非限制性地比如肽核酸或肽-寡核苷酸缀合物)。术语“有效载荷”还可指质粒、载体或货物。有效载荷可为从天然的、演化的或设计改造的细菌噬菌体基因组中获得的噬菌粒或质粒。有效载荷也可仅部分地由从天然的、演化的或设计改造的细菌噬菌体基因组中获得的噬菌粒或质粒组成。
在特定实施方案中,有效载荷具有大于或等于4kb且优选地小于或等于51kb的大小。
在所述实施方案中,有效载荷可具有这样的大小,其整数倍在36kb-51kb之间。换言之,在该实施方案中,至少有一个整数n,比如36kb≤n×有效载荷的大小≤51kb。
如本文所述,更特别地证明了当所述有效载荷具有特定范围的大小时,有可能产生包含几乎独特的有效载荷拷贝数的更均匀的细菌递送媒介物群体。
在特定实施方案中,有效载荷具有严格大于10.000kb且严格小于12.000kb的大小。在备选实施方案中,有效载荷具有严格大于12.500kb且严格小于16.667kb的大小,特别是严格大于12.500kb且小于13.000kb的大小。
在另一个特定实施方案中,有效载荷具有大于或等于18.000kb且小于或等于25.000kb,特别是小于或等于24.000kb的大小。
在特定实施方案中,所述有效载荷具有11.6kb的大小。
有效载荷可为能够在转移到靶标细胞中后环化并然后在染色体内复制或整合的核酸质粒。载体DNA的复制依赖于细菌复制起点的存在。一旦复制,则质粒向每个子细胞内的遗传可通过主动分配机制和质粒成瘾系统比如毒素/抗毒素系统的存在来介导。
如本文使用的,术语“核酸”是指共价连接在一起的至少两个核苷酸的序列,其可为单链或双链的,或者可含有单链和双链序列两者的部分。核酸可为天然存在的、重组的或合成的。核酸可呈环状序列或线性序列或两者形式的组合的形式。核酸可为DNA(基因组或cDNA两者)或RNA或两者的组合。核酸可含有脱氧核糖核苷酸和核糖核苷酸的任何组合以及碱基的任何组合,所述碱基包括:尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤、次黄嘌呤、异胞嘧啶、5-羟甲基胞嘧啶和异鸟嘌呤。可使用的修饰碱基的其他实例详述于Chemical Reviews 2016,116(20)12655-12687中。术语“核酸”还涵盖可含有的其他骨架的任何核酸类似物,所述骨架非限制性地包括:磷酰胺、硫代磷酸酯、二硫代磷酸酯、O-甲基亚磷酰胺键和/或脱氧核糖核苷酸和核糖核苷酸核酸。本公开还涵盖以上核酸特征的任何组合。
本领域已知的复制起点已鉴定自物种特异性质粒DNA(例如CoIE1、Rl、pT181、pSC101、pMB1、R6K、RK2、p15a等)、自细菌病毒(例如M13、F1和P4)和自细菌染色体复制起点(例如oriC)。在一个实施方案中,根据本公开的噬菌粒包含在靶标细菌中为功能性的细菌复制起点。
或者,根据本公开的质粒不包含任何功能性细菌复制起点或者含有在靶标细菌中无活性的复制起点。因此,本公开的质粒一旦已由细菌病毒颗粒引入到细菌中就不能自行复制。
在一个实施方案中,待包装质粒上的复制起点在靶标细菌中为无活性的,意指该复制起点在由细菌病毒颗粒靶向的细菌中不是功能性的,从而防止不需要的质粒复制。
在一个实施方案中,质粒包含在被用于产生细菌病毒颗粒的细菌中为功能性的细菌复制起点。
质粒复制依赖于宿主酶和质粒控制的顺式和反式决定簇。例如,一些质粒具有在几乎所有革兰氏阴性细菌中均被识别并且在复制起始和调控期间于每种宿主中均正确地起作用的决定簇。其他质粒仅在一些细菌中具有这种能力(Kues,U和Stahl,U1989Microbiol Rev53:491-516)。
质粒通过始于复制起点的3种一般机制,即θ型、链置换和滚环(由Del Solar等人1998Microhio and Molec Biol.Rev 62:434-464综述)进行复制。这些复制起点含有质粒和/或宿主编码的蛋白相互作用所需的位点。
在本公开的质粒上使用的复制起点可具有中等拷贝数,比如ColE1 ori,其来自pBR322(每细胞15-20个拷贝)或R6K质粒(每细胞15-20个拷贝);或者可为高拷贝数,例如pUC oris(每细胞500-700个拷贝)、pGEM oris(每细胞300-400个拷贝)、pTZ oris(每细胞>1000个拷贝)或pBluescript oris(每细胞300-500个拷贝)。
在一个实施方案中,细菌复制起点选自ColE1、pMB1和变体(pBR322、pET、pUC等)、p15a、ColA、ColE2、pOSAK、pSC101、R6K、IncW(pSa等)、IncFII、pT181、P1、F IncP、IncC、IncJ、IncN、IncP1、IncP4、IncQ、IncH11、RSF1010、CloDF13、NTP16、R1、f5、pPS10、pC194、pE194、BBR1、pBC1、pEP2、pWVO1、pLF1311、pAP1、pWKS1、pLS1、pLS11、pUB6060、pJD4、pIJ101、pSN22、pAMβ1、pIP501、pIP407、ZM6100(Sa)、pCU1、RA3、pMOL98、RK2/RP4/RP1/R68、pB10、R300B、pRO1614、pRO1600、pECB2、pCM1、pFA3、RepFIA、RepFIB、RepFIC、pYVE439-80、R387、phasyl、RA1、TF-FC2、pMV158和pUB113。
在一个实施方案中,细菌复制起点为选自以下的大肠杆菌复制起点:ColE1、pMB1和变体(pBR322、pET、pUC等)、p15a、ColA、ColE2、pOSAK、pSC101、R6K、IncW(pSa等)、IncFII、pT181、P1、F IncP、IncC、IncJ、IncN、IncP1、IncP4、IncQ、IncH11、RSF1010、CloDF13、NTP16、R1、f5和pPS10。
在一个实施方案中,细菌复制起点选自pC194、pE194、BBR1、pBC1、pEP2、pWVO1、pLF1311、pAP1、pWKS1、pLS1、pLS11、pUB6060、pJD4、pIJ101、pSN22、pAMβ1、pIP501、pIP407、ZM6100(Sa)、pCU1、RA3、pMOL98、RK2/RP4/RP1/R68、pB10、R300B、pRO1614、pRO1600、pECB2、pCM1、pFA3、RepFIA、RepFIB、RepFIC、pYVE439-80、R387、phasyl、RA1、TF-FC2、pMV158和pUB113。
在一个实施方案中,细菌复制起点为ColE1。
根据本公开的递送的核酸序列可包含噬菌体复制起点,其可在完整噬菌体基因组互补的情况下启动递送的核酸序列的复制用于随后包封到不同的衣壳中。
包含在本公开的递送的核酸序列中的噬菌体复制起点可为存在于噬菌体中的任何复制起点。
在一个实施方案中,噬菌体复制起点可为M13、f1、P4、λ、P2、λ样、HK022、mEP237、HK97、HK629、HK630、mEP043、mEP213、mEP234、mEP390、mEP460、mEPx1、mEPx2、phi80、mEP234、T2、T4、T5、T7、RB49、phiX174、R17、PRD1 Pl样、P2样、P22、P22样、N15和N15样细菌噬菌体的野生型或非野生型序列。
在一个实施方案中,噬菌体复制起点选自M13、f1、P4和λ的噬菌体复制起点。
在特定实施方案中,噬菌体复制起点为λ或P4复制起点。在特定实施方案中,噬菌体复制起点来自丙酸杆菌属噬菌体:BW样噬菌体,比如Doucette、B22、E6、G4;BV样噬菌体,比如Anatole、E1、B3;BX样噬菌体,比如PFR1和PFR2;丝状B5噬菌体;BU样噬菌体(痤疮皮肤杆菌噬菌体)。
在特定实施方案中,有效载荷或载体包含条件性复制起点,其在靶标细菌中为无活性的,但在供体细菌细胞中具有活性。
在本发明的背景下,“条件性复制起点”是指其功能性可由特定分子的存在来控制的复制起点。
在特定实施方案中,条件性复制起点为这样的复制起点,其复制依赖于一种或多种给定的蛋白、肽、RNA、核酸、分子或其任何组合的存在。
在特定实施方案中,所述复制起点的复制可进一步依赖于过程比如转录,以激活所述复制。
在本发明的背景下,由于所述靶标细菌中不存在所述给定的蛋白、肽、RNA、核酸、分子或其任何组合,因此所述条件性复制起点在靶标细菌中为无活性的。
在特定实施方案中,所述条件性复制起点在所述供体细菌细胞中具有活性,因为所述供体细菌细胞表达所述给定的蛋白、肽、RNA、核酸、分子或其任何组合。在特定实施方案中,所述蛋白、肽、RNA、核酸、分子或其任何组合在所述供体细菌细胞中反式表达。
“反式”在本文中意指所述蛋白、肽、RNA、核酸、分子或其任何组合未被编码在与包含复制起点的相同的核酸分子上。在特定实施方案中,所述蛋白、肽、RNA、核酸、分子或其任何组合被编码在染色体或载体上,特别是质粒上。在特定实施方案中,所述载体包含抗生素抗性标志物。在备选实施方案中,所述载体没有抗生素抗性标志物。
因为所述条件性复制起点由于在所述靶标细菌中不存在所述给定的蛋白、肽、RNA、核酸、分子或其任何组合而在靶标细菌中为无活性的,因此所述条件性复制起点可根据待靶向的特定细菌来选择。
本文公开的条件性复制起点可源于质粒、细菌噬菌体或PICI,其优选地共具以下特征:它们在其复制起点中含有重复序列或重复子(iteron),并且它们编码至少一种与所述复制起点相互作用的对它们具有特异性的蛋白(即Rep、蛋白O、蛋白P、pri)。
举例来说,可提及以下质粒和细菌噬菌体的条件性复制系统:RK2、R1、pSC101、F、Rts1、RSF1010、P1、P4、λ、phi82、phi80。
在特定实施方案中,所述条件性复制起点选自R6KλDNA复制起点及其衍生物、IncPαoriV复制起点及其衍生物、经修饰以处于诱导型启动子下的ColE1复制起点以及来自噬菌体诱导型染色体岛(PICI)的复制起点及其衍生物。
在特定实施方案中,所述条件性复制起点为存在于少于50%或少于40%、少于30%、少于20%、少于10%或少于5%的宿主微生物组细菌中的复制起点。
在另一个特定实施方案中,所述条件性复制起点包含与宿主微生物组的细菌,特别是代表多于50%、更特别地多于60%、多于70%、多于80%、多于90%或多于95%的宿主微生物组的细菌的复制起点的序列具有少于80%同一性,特别是少于70%、少于60%、少于50%、少于40%、少于30%、少于20%、少于10%、少于5%或少于1%同一性的序列或者由其组成。
如本文使用的,术语“噬菌体诱导型染色体岛”或“PICI”是指的可移动基因元件,其具有保守基因组织,并且编码一对不同调控基因,包括PICI主阻遏物。一般地,在革兰氏阳性细菌中,在rpr的左侧并以相同方向转录,PICI编码一小组的基因,包括整合酶(int)基因;在rpr的右侧并以相反方向转录,PICI编码切除功能(xis)及由引发酶同源物(pri)和任选的复制起始物(rep)组成的复制模块,它们有时融合在一起,后接复制起点(ori),紧挨着这些基因并且也以相同方向转录,PICI编码参与噬菌体干扰的基因,以及任选地,末端酶小亚基同源物(terS)。
在特定实施方案中,所述条件性复制起点为衍生自噬菌体诱导型染色体岛(PICI)的复制起点。
特定的条件性复制起点确实衍生自PICI。
已经表明,有可能衍生出新型条件性复制载体或有效载荷,特别是基于来自PICI的引发酶-解旋酶和复制起点。这些起点在靶标菌株中可能相对罕见,并且更有利地,对于每种PICI菌而言,引发酶-ori可为独特的,显著地降低非期望的重组或有效载荷扩散事件的可能性。它们可进一步被修饰以进一步限制重组机会并去除限制性位点以绕过靶标细菌防御系统。
在特定实施方案中,所述条件性复制起点衍生自大肠埃希氏菌菌株CFT073的PICI的复制起点,其在Fillol-Salom等人(2018)The ISME Journal 12:2114-2128中公开。
在特定实施方案中,所述条件性复制起点为来自大肠埃希氏菌菌株CFT073的PICI的引发酶ori,一般具有序列SEQ ID NO:46。
在另一个特定实施方案中,所述条件性复制起点为来自大肠埃希氏菌菌株CFT073的PICI的引发酶ori,没有至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15或至少16个选自以下的限制性位点:GAAABCC、GCCGGC、RCCGGY、GCNGC、TWCANNNNNNTGG(SEQ ID NO:47)、TGGCCA、ACCYAC、YGGCCR、AGACC、GCWGC、GGGANGC、GKAGATD、GCCGGYYD、GGCYAC、RGCCGGYYD和VGCCGGYBD。
在特定实施方案中,所述条件性复制起点为来自大肠埃希氏菌菌株CFT073的PICI的引发酶ori,没有限制性位点GAAABCC。
优选地,所述条件性复制起点具有序列SEQ ID NO:48。
在另一个特定实施方案中,所述条件性复制起点为来自大肠埃希氏菌菌株CFT073的PICI的引发酶ori,没有限制性位点GAAABCC、GCCGGC、RCCGGY、GCNGC、TWCANNNNNNTGG(SEQID NO:47)、TGGCCA、ACCYAC、YGGCCR、AGACC、GCWGC、GGGANGC、GKAGATD、GCCGGYYD、GGCYAC、RGCCGGYYD和VGCCGGYBD。优选地,所述条件性复制起点具有序列SEQ ID NO:49。
在特定实施方案中,其中所述复制起点衍生自噬菌体诱导型染色体岛(PICI),所述条件性复制起点在所述供体细菌细胞中具有活性,因为所述供体细菌细胞表达rep蛋白,特别是引发酶-解旋酶,特别是序列SEQ ID NO:50的引发酶-解旋酶,一般由包含序列SEQID NO:51或者由其组成的核酸编码。
经证明,这些特定的条件性复制起点与基于λ的包装特别地相容,导致微生物群相关应用所需的足够高的滴度(>1010/mL)。
在特定实施方案中,当所述有效载荷或载体为噬菌粒时,所述复制起点可衍生自不同于被用于编码包装所述噬菌粒的衣壳结构元件的微生物。
“供体细菌细胞”在本文中意指能够寄居如上定义的有效载荷或载体、产生如上定义的有效载荷或载体和/或能够将所述如上定义的有效载荷或载体转移到另一种细菌的细菌。在特定实施方案中,所述有效载荷或载体可为噬菌粒,并且所述供体细菌细胞然后可为能够产生所述噬菌粒(更特别地呈装噬菌粒的形式)的细菌细胞。
优选地,所述供体细菌细胞稳定地包含所述有效载荷或载体,并且能够复制所述有效载荷或载体。
在特定实施方案中,当所述有效载荷或载体的条件性复制起点为这样的复制起点,即其复制依赖于给定的蛋白、肽、核酸、RNA、分子或其任何组合的存在时,所述供体细菌细胞表达所述蛋白、肽、核酸、RNA、分子或其任何组合。
优选地,所述蛋白、肽、核酸、RNA、分子或其任何组合反式表达,如上所定义的。
在特定实施方案中,所述供体细菌细胞稳定地包含编码所述蛋白、肽、核酸、RNA、分子或其任何组合的核酸。
在特定实施方案中,当所述复制起点衍生自噬菌体诱导型染色体岛(PICI)时,所述条件性复制起点在所述供体细菌细胞中具有活性,因为所述供体细菌细胞表达rep蛋白,特别是引发酶-解旋酶,特别是序列SEQ ID NO:50的引发酶-解旋酶。
在特定实施方案中,所述供体细菌细胞稳定地包含编码所述rep蛋白、特别是所述引发酶-解旋酶的核酸,所述核酸一般包含序列SEQ ID NO:51或者由其组成。
在特定实施方案中,所述供体细菌细胞为生产细胞系,特别是产生包括本发明有效载荷或载体的包装的噬菌粒的细胞系。
递送的感兴趣的核酸优选地包含在启动子控制下的核酸序列。在某些实施方案中,感兴趣的核酸选自Cas核酸酶基因,Cas9核酸酶基因,引导RNA,CRISPR基因座,毒素基因,表达酶比如核酸酶或激酶、TALEN、ZFN、大范围核酸酶、重组酶、细菌受体、膜蛋白、结构蛋白、分泌蛋白的基因,表达对抗生素或一般药物的抗性的基因,表达毒性蛋白或毒性因子的基因和表达毒力蛋白或毒力因子的基因,及任何其组合。在一个实施方案中,核酸有效载荷编码治疗性蛋白。在另一个实施方案中,核酸有效载荷编码反义核酸分子。
在一个实施方案中,感兴趣的序列为待递送到靶标细菌的可编程核酸酶回路。这种可编程核酸酶回路能够介导体内序列特异性消除含有感兴趣的靶标基因(例如对人类有害的基因)的细菌。本公开的一些实施方案涉及酿脓链球菌的II型CRISPR-Cas(成簇的规律间隔的短回文重复-CRISPR-相关)系统的设计改造的变体。可使用的其他可编程核酸酶包括其他CRISPR-Cas系统,设计改造的TALEN(转录激活因子样效应物核酸酶变体,设计改造的锌指核酸酶(ZFN)变体,天然的、演化的或设计改造的大范围核酸酶或重组酶变体,以及可编程核酸酶的任何组合或杂合体。因此,本文提供的设计改造的自主分布核酸酶回路可被用于选择性地切割编码感兴趣的基因比如毒素基因、毒力因子基因、抗生素抗性基因、重塑基因或调节基因的DNA(参见WO2014124226)。
其他感兴趣的序列比如可编程序列可被添加至递送的核酸序列,以便被递送到目标细菌中。在一个实施方案中,添加至递送的核酸序列的感兴趣的序列导致靶标细菌的细胞死亡。例如,添加至质粒的感兴趣的核酸序列可编码穿孔素(holin)或毒素。
或者,添加至递送的核酸序列的感兴趣的回路序列不会导致细菌死亡。例如,感兴趣的序列可编码导致发光或荧光信号的报告基因。或者,感兴趣的序列可包含实现诸如改变细菌的新陈代谢或其环境的组成等有用功能的蛋白和酶。
在特定实施方案中,感兴趣的核酸选自Cas9,单引导RNA(sgRNA),CRISPR基因座,表达酶比如核酸酶或激酶、TALEN、ZFN、大范围核酸酶、重组酶、细菌受体、膜蛋白、结构蛋白、分泌蛋白、对抗生素或一般药物的抗性的基因,编码毒性蛋白或毒性因子的基因和表达毒力蛋白或毒力因子的基因及任何其组合。
在特定实施方案中,感兴趣的核酸为表达核酸酶的基因。更特别地,核酸酶可靶向宿主细菌细胞染色体或宿主细菌细胞质粒的切割。在更特定实施方案中,切割可发生在抗生素抗性基因中。
在特定实施方案中,根据本公开的递送的核酸序列包含编码细菌素的感兴趣的核酸序列,所述细菌素可为由细菌产生以杀伤或抑制其他细菌生长的蛋白毒素。细菌素按几种方式进行分类,包括生产菌株、共同的抗性机制和杀伤机制。来自革兰氏阴性细菌(例如小菌素、大肠杆菌素样细菌素和尾菌素(tailocin))以及来自革兰氏阳性细菌(例如I类、II类、III类或IV类细菌素)的此类细菌素已得到描述。
在一个实施方案中,根据本公开的递送的核酸序列进一步包含编码选自以下的毒素的感兴趣的序列:小菌素,大肠杆菌素样细菌素,尾菌素,I类、II类、III类和IV类细菌素。
在特定实施方案中,相应的免疫多肽(即抗毒素)可被用于保护的细菌细胞(参见Cotter等人,Nature Reviews Microbiology 11:95,2013的综述,其特此通过参考以其全部结合),以用于递送的核酸序列的产生和衣壳化目的,但在药用组合物以及其中递送本公开的递送的核酸序列的靶标细菌中不存在。
在本公开的一个方面,CRISPR系统被包括在递送的核酸序列中。CRISPR系统含有两种不同的元件,即i)核酸内切酶,在这种情况下为CRISPR相关核酸酶(Cas或“CRISPR相关蛋白”),以及ii)引导RNA。引导RNA呈嵌合RNA的形式,其由CRISPR(RNAcr)细菌RNA和RNAtracr(反式激活RNA CRISPR)的组合组成(Jinek等人,Science2012)。引导RNA在单个转录本中组合了对应于充当Cas蛋白引导的“间隔序列”的RNAcr的靶向特异性以及RNAtracr的构象性质。当引导RNA和Cas蛋白在细胞中同时表达时,靶标基因组序列可永久地被修饰或中断。修饰有利地由修复基质(repair matrix)引导。通常,CRISPR系统根据核酸酶的作用机制包括两个主要类别。1类由多亚基效应物复合物构成,并且包括I、III和IV型。2类由单亚基效应物模块如Cas9核酸酶构成,并且包括II型(II-A、II-B、II-C、II-C变体)、V型(V-A、V-B、V-C、V-D、V-E、V-U1、V-U2、V-U3、V-U4、V-U5)和VI型(VI-A、VI-B1、VI-B2、VI-C、VI-D)。
根据本公开的感兴趣的序列包含编码Cas蛋白的核酸序列。多种CRISPR酶可用于用作质粒上感兴趣的序列。在一些实施方案中,CRISPR酶为II型CRISPR酶。在一些实施方案中,CRISPR酶催化DNA切割。在一些其他实施方案中,CRISPR酶催化RNA切割。在一个实施方案中,CRISPR酶可与sgRNA偶联。在某些实施方案中,sgRNA靶向选自以下的基因:抗生素抗性基因、毒力蛋白或因子基因、毒素蛋白或因子基因、细菌受体基因、膜蛋白基因、结构蛋白基因、分泌蛋白基因和表达对一般药物的抗性的基因。
作为多亚基效应物的一部分或作为单亚基效应物的Cas蛋白的非限制性实例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也被称为Csn1和Csx12)、Cas10、Cas11(SS)、Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、C2c4、C2c8、C2c5、C2c10、C2c9、Cas13a(C2c2)、Cas13b(C2c6)、Cas13c(C2c7)、Cas13d、Csa5、Csc1、Csc2、Cse1、Cse2、Csy1、Csy2、Csy3、Csf1、Csf2、Csf3、Csf4、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csn2、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx13、Csx1、Csx15、SdCpf1、CmtCpf1、TsCpf1、CmaCpf1、PcCpf1、ErCpf1、FbCpf1、UbcCpf1、AsCpf1、LbCpf1、Mad4、Mad7、Cms1、其同源物、其直系同源物、其变体或其修饰形式。在一些实施方案中,CRISPR酶在前间隔序列邻近基序(PAM)位点处切割靶标核酸的两条链。在特定实施方案中,所述Cas蛋白为Cas12a(Cpf1)。
在特定实施方案中,CRISPR酶为任何Cas9蛋白,例如任何天然存在的细菌Cas9及其任何变体、同源物或直系同源物。
“Cas9”意指蛋白Cas9(也被称为Csn1或Csx12)或其功能性蛋白、肽或多肽片段,即能够与(一种或多种)引导RNA相互作用并发挥酶促活性(核酸酶),这允许其对目标基因组的DNA进行双链切割。“Cas9”因此可表示修饰的蛋白,例如被截短以去除对于蛋白的预定功能并非必需的蛋白结构域,特别是对于与(一种或多种)gRNA的相互作用并非必需的结构域。
如本公开的背景下使用的,编码Cas9(整个蛋白或其片段)的序列可从任何已知的Cas9蛋白获得(Fonfara等人,Nucleic Acids Res 42(4),2014;Koonin等人,Nat RevMicrobiol 15(3),2017)。可用于本公开的Cas9蛋白的实例包括但不限于以下的Cas9蛋白:酿脓链球菌(Streptococcus pyogenes)(SpCas9)、嗜热链球菌(Streptococcusthermophiles)(St1Cas9、St3Cas9)、变异链球菌(Streptococcus mutans)、金黄色葡萄球菌(Staphylococcus aureus)(SaCas9)、空肠弯曲杆菌(Campylobacter jejuni)(CjCas9)、新凶手弗朗西斯菌(Francisella novicida)(FnCas9)和脑膜炎奈瑟菌(Neisseriameningitides)(NmCas9)。
如本公开的背景下使用的,编码Cpfl(Cas12a)(整个蛋白或其片段)的序列可从任何已知的Cpfl(Cas12a)蛋白获得(Koonin等人,2017)。可用于本公开的Cpf1(Cas12a)蛋白的实例包括但不限于以下的Cpf1(Cas12a)蛋白:氨基酸球菌属物种(Acidaminococcussp)、毛螺菌科细菌(Lachnospiraceae bacteriu)和新凶手弗朗西斯菌。
编码Cas13a(整个蛋白或其片段)的序列可从任何已知的Cas13a(C2c2)蛋白获得(Abudayyeh等人,2017)。可用于本公开的Cas13a(C2c2)蛋白的实例包括但不限于以下的Cas13a(C2c2)蛋白:韦德纤毛菌(Leptotrichia wadei)(LwaCas13a)。
编码Cas13d(整个蛋白或其片段)的序列可从任何已知的Cas13d蛋白获得(Yan等人,2018)。可用于本公开的Cas13d蛋白的实例包括但不限于以下的Cas13d蛋白:惰性真杆菌(Eubacterium siraeum)和瘤胃球菌属物种(Ruminococcus sp)。
如本发明的背景下使用的,编码Mad4(整个蛋白或其片段)的序列在国际申请WO2018/236548中公开。
如本发明的背景下使用的,编码Mad7(整个蛋白或其片段)的序列在国际申请WO2018/236548中公开。
如本发明的背景下使用的,编码Cms1(整个蛋白或其片段)的序列在国际专利申请WO2017/141173中公开。
在特定实施方案中,感兴趣的核酸序列为CRISPR/cas,特别是CRISPR/Cas9,即用于降低选自以下的基因的基因表达或使其失活的系统:抗生素抗性基因、毒力因子或蛋白基因、毒素因子或蛋白基因,表达细菌受体、膜蛋白、结构蛋白、分泌蛋白的基因和表达对一般药物的抗性的基因。
在一个实施方案中,CRISPR系统被用于靶向毒力因子并使其失活。毒力因子可为由病原体产生的任何物质,其通过增加对宿主造成的损害程度来改变宿主-病原体相互作用。毒力因子被病原体以包括例如以宿主中的细胞粘附或生态位定殖在内的许多方式使用,以逃避宿主的免疫反应,促进进入和离开宿主细胞,以从宿主获取营养,或者以抑制宿主的其他生理过程。毒力因子可包括酶、内毒素、粘附因子、运动因子、参与补体逃逸的因子和促进生物膜形成的因子。例如,此类靶标毒力因子基因可为大肠杆菌毒力因子基因,非限制性地比如:EHEC-HlyA、Stx1(VT1)、Stx2(VT2)、Stx2a(VT2a)、Stx2b(VT2b)、Stx2c(VT2c)、Stx2d(VT2d)、Stx2e(VT2e)和Stx2f(VT2f)、Stx2h(VT2h)、fimA、fimF、fimH、neuC、kpsE、sfa、foc、iroN、aer、iha、papC、papGI、papGII、papGIII、hlyC、cnf1、hra、sat、ireA、uspompT、ibeA、malX、fyuA、irp2、traT、afaD、ipaH、eltB、estA、bfpA、eaeA、espA、aaiC、aatA、TEM、CTX、SHV、csgA、csgB、csgC、csgD、csgE、csgF、csgG、csgH、T1SS、T2SS、T3SS、T4SS、T5SS、T6SS(分泌系统)。例如,此类靶标毒力因子基因可为痢疾志贺氏菌(Shigelladysenteriae)毒力因子基因,非限制性地比如:stx1和stx2。例如,此类靶标毒力因子基因可为鼠疫耶尔森氏菌(Yersinia pestis)毒力因子基因,非限制性地比如:yscF(质粒携带(pCD1)T3SS外针亚基)。例如,此类靶标毒力因子基因可为土拉弗朗西斯菌(Francisellatularensis)毒力因子基因,非限制性地比如:fslA。例如,此类靶标毒力因子基因可为炭疽芽孢杆菌(Bacillus anthracis)毒力因子基因,非限制性地比如:pag(炭疽毒素,细胞结合保护性抗原)。例如,此类靶标毒力因子基因可为霍乱弧菌(Vibrio cholera)毒力因子基因,非限制性地比如:ctxA和ctxB(霍乱毒素)、tcpA(毒素共调菌毛)和toxT(主毒力调节子)。例如,此类靶标毒力因子基因可为铜绿假单胞菌(Pseudomonas aeruginosa)毒力因子基因,非限制性地比如:pyoverdine(例如σ因子pvdS、生物合成基因pvdL、pvdl、pvdJ、pvdH、pvdA、pvdF、pvdQ、pvdN、pvdM、pvdO、pvdP、转运基因pvdE、pvdR、pvdT、opmQ)、铁载体pyochelin(例如pchD、pchC、pchB、pchA、pchE、pchF和pchG及毒素类(例如exoU、exoS和exoT)。例如,此类靶标毒力因子基因可为肺炎克雷伯氏菌(Klebsiella pneumoniae)毒力因子基因,非限制性地比如:fimA(粘附性,I型菌毛主要亚基)和cps(荚膜多糖)。例如,此类靶标毒力因子基因可为鲍曼不动杆菌(Acinetobacter baumannii)毒力因子基因,非限制性地比如:ptk(荚膜聚合)和epsA(组装)。例如,此类靶标毒力因子基因可为伤寒肠道沙门氏菌(Salmonella enterica Typhi)毒力因子基因,非限制性地比如:MIA(入侵,SPI-1调节子)、ssrB(SPI-2调节子),以及与胆汁耐受性相关的那些,包括外流泵基因acrA、acrB和tolC。例如,此类靶标毒力因子基因可为具核梭杆菌(Fusobacterium nucleatum)毒力因子基因,非限制性地比如:FadA和TIGIT。例如,此类靶标毒力因子基因可为脆弱拟杆菌(Bacteroides fragilis)毒力因子基因,非限制性地比如:bft。
在另一个实施方案中,CRISPR/Cas9系统被用于靶向抗生素抗性基因和使其失活,所述基因非限制性地比如GyrB、ParE、ParY、AAC(1)、AAC(2’)、AAC(3)、AAC(6’)、ANT(2”)、ANT(3”)、ANT(4’)、ANT(6)、ANT(9)、APH(2”)、APH(3”)、APH(3’)、APH(4)、APH(6)、APH(7”)、APH(9)、ArmA、RmtA、RmtB、RmtC、Sgm、AER、BLA1、CTX-M、KPC、SHV、TEM、BlaB、CcrA、IMP、NDM、VIM、ACT、AmpC、CMY、LAT、PDC、OXAβ-内酰胺酶、mecA、Omp36、OmpF、PIB、bla(blaI、blaR1)和mec(mecI、mecR1)操纵子、氯霉素乙酰转移酶(CAT)、氯霉素磷酸转移酶、乙胺丁醇抗性阿拉伯糖基转移酶(EmbB)、MupA、MupB、整合膜蛋白MprF、Cfr 23S rRNA甲基转移酶、利福平ADP-核糖基转移酶(Arr)、利福平糖基转移酶、利福平单加氧酶、利福平磷酸转移酶、DnaA、RbpA、利福平抗性RNA聚合酶β亚基(RpoB)、Erm 23S rRNA甲基转移酶、Lsa、MsrA、Vga、VgaB、链阳菌素Vgb裂解酶、Vat乙酰转移酶、氟喹诺酮乙酰转移酶、氟喹诺酮抗性DNA拓扑异构酶、氟喹诺酮抗性GyrA、GyrB、ParC、喹诺酮抗性蛋白(Qnr)、FomA、FomB、FosC、FosA、FosB、FosX、VanA、VanB、VanD、VanR、VanS、林可酰胺核苷酸转移酶(Lin)、EreA、EreB、GimA、Mgt、Ole、大环内酯磷酸转移酶(MPH)、MefA、MefE、Mel、链丝菌素乙酰转移酶(sat)、Sul1、Sul2、Sul3、磺胺抗性FolP、四环素失活酶TetX、TetA、TetB、TetC、Tet30、Tet31、TetM、TetO、TetQ、Tet32、Tet36、MacAB-TolC、MsbA、MsrA、VgaB、EmrD、EmrAB-TolC、NorB、GepA、MepA、AdeABC、AcrD、MexAB-OprM、mtrCDE、EmrE、adeR、acrR、baeSR、mexR、phoPQ、mtrR或综合抗生素抗性数据库(CARD https://card.mcmaster.ca/)中描述的任何抗生素抗性基因。
在另一个实施方案中,CRISPR/Cas9系统被用于靶向细菌毒素基因和使其失活。细菌毒素可被分类为外毒素或内毒素。外毒素为产生并主动分泌的;内毒素保持为细菌的一部分。对细菌毒素的反应可涉及重度炎症并且可导致败血症。此类毒素可为例如肉毒神经毒素、破伤风毒素、葡萄球菌毒素、白喉毒素、炭疽毒素、α毒素、百日咳毒素、志贺毒素、热稳定肠毒素(大肠杆菌ST)、大肠杆菌素、BFT(脆弱拟杆菌毒素)或Henkel等人(Toxins fromBacteria in EXS.2010;100:1-29)中描述的任何毒素。在特定实施方案中,所述毒素为志贺毒素。
在另一个实施方案中,感兴趣的核酸编码基因或基因的组,其编码导致基因修饰的一种或多种外源性酶。
在特定实施方案中,所述感兴趣的核酸为编码碱基编辑器或先导编辑器的基因。
在一些实施方案中,基因修饰用以下酶和系统中的一种或多种进行。
胞嘧啶碱基编辑器(CBE)和腺苷碱基编辑器(ABE),如Rees等人(2018)Nat RevGenet 19:770-788所述,所述文献特此通过参考结合。
到目前为止,已经描述了七种类型的DNA碱基编辑器:
·将C:G转化成T:A的胞嘧啶碱基编辑器(CBE)(Komor等人
(2016)Nature 533:420-424)
·将A:T转化成G:C的腺嘌呤碱基编辑器(ABE)(Gaudelli等人
(2017)Nature 551:464-471)。
·将C:G转化成G:C的胞嘧啶鸟嘌呤碱基编辑器(CABE)(Chen等人(2020)Biorxiv“Precise and programmable C:G to G:C base
editing in genomic DNA”;Kurt等人(2020)Nat.Biotechnol.
“CRISPR C-to-G base editors for inducing targeted DNA
transversions in human cells”)
·将C:G转化成A:T的胞嘧啶腺嘌呤碱基编辑器(CABE)(Zhao等人(2020)NatureBiotechnol.“New base editors change C to A in
bacteria and C to G in mammalian cells”)
·将A:T转化成C:G的腺嘌呤胞嘧啶碱基编辑器(ACBE)
(WO2020181180)
·将A:T转化成T:A的腺嘌呤胸腺嘧啶碱基编辑器(ATBE)
(WO2020181202)
·将T:A转化成A:T的胸腺嘧啶腺嘌呤碱基编辑器(TABE)
(WO2020181193、WO2020181178、WO2020181195)
碱基编辑器在碱基修饰酶方面不同。CBE依赖于ssDNA胞苷脱氨酶,其中:APOBEC1、rAPOBEC1、APOBEC1突变体或演化形式(evoAPOBEC1)以及APOBEC同源物(APOBEC3A(eA3A)、Anc689)、胞苷脱氨酶1(CDA1)、evoCDA1、FERNY、evoFERNY。
ABE依赖于串联融合TadA-TadA*的脱氧腺苷脱氨酶活性,其中TadA*为TadA的演化形式,是大肠杆菌tRNA腺苷脱氨酶,能够在ssDNA上将腺苷转化成肌苷。TadA*包括TadA-8a-e和TadA-7.10。
除碱基修饰酶之外,还存在对碱基编辑器实施以提高编辑效力、精度和模块性的修饰:
·添加一个或两个尿嘧啶DNA糖基化酶抑制剂结构域(UGI),以防止碱基切除修复机制将碱基编辑恢复
·添加Mu-GAM,其通过抑制细胞中的非同源末端连接机制(NHEJ)来降低插入-缺失率
·使用具有切口酶活性的Cas9(nCas9 D10A),其通过在非编辑链上产生切口而有利于其修复并从而固定所编辑的碱基
·使用来自例如不同生物体的不同Cas蛋白、具有不同PAM基序或不同保真度或不同家族的突变体(例如Cas12a)。
基于DNA的编辑蛋白的非限制性实例包括BE1、BE2、BE3、BE4、BE4-GAM、HF-BE3、狙击手-BE3、靶标-AID、靶标-AID-NG、ABE、EE-BE3、YE1-BE3、YE2-BE3、YEE-BE3、BE-PLUS、SaBE3、SaBE4、SaBE4-GAM、Sa(KKH)-BE3、VQR-BE3、VRER-BE3、EQR-BE3、xBE3、Cas12a-BE、Ea3A-BE3、A3A-BE3、TAM、CRISPR-X、ABE7.9、ABE7.10、ABE7.10*、xABE、ABESa、VQR-ABE、VRER-ABE、Sa(KKH)-ABE、ABE8e、SpRY-ABE、SpRY-CBE、SpG-CBE4、SpG-ABE、SpRY-CBE4、SpCas9-NG-ABE、SpCas9-NG-CBE4、enAsBE1.1、enAsBE1.2、enAsBE1.3、enAsBE1.4、AsBE1.1、AsBE1.4、CRISPR-Abest、CRISPR-Cbest、eA3A-BE3、AncBE4。
胞嘧啶鸟嘌呤碱基编辑器(CGBE)由与以下融合的切口酶CRISPR组成:
[a]胞嘧啶脱氨酶(rAPOBEC)和碱基切除修复蛋白(例如rXRCC1)(Chen等人(2020)Biorxiv“Precise and programmable C:G to G:Cbase editing in genomic DNA”)。
[b]大鼠APOBEC1变体(R33A)蛋白和大肠杆菌衍生的尿嘧啶DNA N-糖基化酶(eUNG)(Kurt等人(2020)Nat.Biotechnol.“CRISPR C-to-G base editors for inducingtargeted DNAtransversions in human cells”)。
胞嘧啶腺嘌呤碱基编辑器(CABE)由Cas9切口酶、胞苷脱氨酶(例如AID)和尿嘧啶-DNA糖基化酶(Ung)组成(Zhao等人(2020)Nature Biotechnol.“New base editors changeC to A in bacteria and C to G in mammalian cells”)。
ACBE包括核酸可编程DNA结合蛋白和腺嘌呤氧化酶(WO2020181180)。
ATBE由Cas9切口酶和一种或多种腺苷脱氨酶或氧化酶结构域组成(WO2020181202)。
TABE由Cas9切口酶和腺苷甲基转移酶、胸腺嘧啶烷基转移酶或腺苷脱氨酶结构域组成(WO2020181193、WO2020181178、WO2020181195)。
碱基编辑器分子也可由两个或更多个与Cas蛋白融合的以上所列编辑酶组成(例如ABE和CBE的组合)。这些生物分子被命名为双重碱基编辑器,并且使得可编辑两种不同的碱基(Grunewald等人(2020)Nature Biotechnol.“A dual-deaminase CRISPR baseeditor enables concurrent adenine and cytosine editing”;Li等人(2020)NatureBiotechnol.“Targeted,random mutagenesis of plant genes with dual cytosine andadenine base editors”)。
如特此通过参考结合的Anzalone等人(2019)Nature 576:149-157所述的,先导编辑器(PE)由与逆转录酶融合的nCas9组成,所述逆转录酶与先导编辑RNA(pegRNA,包括用于逆转录的模板区域的引导RNA)组合使用。
先导编辑允许引入插入、缺失(插入缺失(indel))和12种碱基到碱基转化。先导编辑依赖于与Cas切口酶变体融合的逆转录酶(RT)将通过先导编辑引导RNA(pegRNA)带来的RNA序列在由Cas蛋白产生的切口位点处转化成DNA的能力。然后,从该过程中产生的DNA分支被包括或不包括在靶标DNA序列中。
先导编辑系统包括:
·与逆转录酶结构域比如M-MLV RT或其突变体形式(M-MLV
RT(D200N)、M-MLV RT(D200N/L603W)、M-MLV RT
(D200N/L603W/T330P/T306K/W313F)融合的Cas切口酶变体比如Cas9-H840A
·先导编辑引导RNA(pegRNA)
为有利于编辑,先导编辑系统可包括表达另外的sgRNA,其理想地仅在编辑的链分支解析之后使Cas切口酶活性靶向于非编辑的DNA链,这通过设计sgRNA与编辑的链而不与初始链退火来进行。
先导编辑系统的非限制性实例包括PE1、PE1-M1、PE1-M2、PE1-M3、PE1-M6、PE1-M15、PE1-M3inv、PE2、PE3、PE3b。
经由同源物Y(‘CRISPEY’)的Cas9逆转录子precISe平行编辑,一种与sgRNA融合并与Cas9一起表达的逆转录子RNA,并且逆转录子蛋白至少包括逆转录酶(Sharon等人(2018)Cell175:544-557.e16)。
SCRIBE策略:与促进单链DNA重组的重组酶(也被称为单链退火蛋白(SSAP))组合表达的逆转录子系统(Farzadfard和Lu(2014)Science 346:1256272)。此类重组酶包括但不限于噬菌体重组酶,比如lambda red、recET、Sak、Sak4和Wannier等人(2020)Proc NatlAcad Sci U S A 117(24):13689-13698描述的新近描述的SSAP,所述文献特此通过参考结合。
基于第II组内含子的targetron系统描述于Karberg等人(2001)Nat Biotechnol19:1162-7中,其特此通过参考结合,并已适应于许多细菌物种。
其他基于逆转录子的基因靶向方法描述于Simon等人(2019)Nucleic Acids Res47:11007-11019中,其特此通过参考结合。
在各种实施方案中,感兴趣的核酸编码的融合蛋白包含Cas,特别是Cas9(例如Cas9切口酶)结构域和脱氨酶结构域。在一些实施方案中,融合蛋白包含Cas(特别是Cas9)和诸如APOBEC酶等胞嘧啶脱氨酶或诸如ADAT酶等腺苷脱氨酶,例如如在美国专利公开2015/0166980中公开的,所述专利特此通过参考结合。在一个实施方案中,脱氨酶为ACF1/ASE脱氨酶。
在各种实施方案中,APOBEC脱氨酶选自APOBEC1脱氨酶、APOBEC2脱氨酶、APOBEC3A脱氨酶、APOBEC3B脱氨酶、APOBEC3C脱氨酶、APOBEC3D脱氨酶、APOBEC3F脱氨酶、APOBEC3G脱氨酶和APOBEC3H脱氨酶。在各种实施方案中,融合蛋白包含Cas9结构域、胞嘧啶脱氨酶结构域和尿嘧啶糖基化酶抑制剂(UGI)结构域。
在一个实施方案中,脱氨酶为使DNA中的腺苷脱氨基的腺苷脱氨酶,例如如美国专利10,113,163中公开的,所述专利特此通过参考结合。在一些实施方案中,融合蛋白进一步包含碱基修复的抑制剂,比如核酸酶失活肌苷特异性核酸酶(dISN),例如如美国专利10,113,163中公开的。在各种实施方案中,感兴趣的核酸编码融合蛋白,其包含与用先导编辑引导RNA(pegRNA)编程的设计改造的逆转录酶融合的催化受损型Cas(特别是Cas9)核酸内切酶,所述RNA既规定目标位点又编码期望的编辑,例如如Anzalone等人(2019)Nature576:149-157中所述,所述文献特此通过参考结合。
在一些实施方案中,基因修饰为在RNA水平上进行。RNA碱基编辑基于与DNA碱基编辑相同的原理:催化RNA碱基转化成另一种的酶必须靠近靶标碱基以在局部进行其转化。在一个实施方案中,用于RNA编辑的酶为将dsRNA结构中的腺苷转化成肌苷的来自ADAR家族的腺苷脱氨酶。几项开创性的研究利用这种对dsRNA的特异性并将ADAR脱氨酶结构域(ADARDD)与反义寡核苷酸融合,以对局部RNA碱基编辑进行编程。最近以来,一些CRISPR-Cas系统结合RNA分子的能力被改用于RNA编辑。使用与ADAR2脱氨酶结构域的极度活性突变体(ADAR2DD-E488Q用于REPAIRv1和ADAR2DD-E488Q-T375G用于REPAIRv2)融合的催化失活的Cas13b酶(dPspCas13b),与先前RNA编辑策略相比较,Cox等人提高了特异性和效率。基于RNA的编辑蛋白的非限制性实例包括REPAIRv1、REPAIRv2。
在一些实施方案中,感兴趣的核酸编码其他可编程核酸酶。这些包括设计改造的TALEN(转录激活因子样效应物核酸酶)和变体,设计改造的锌指核酸酶(ZFN)变体,天然的、演化的或设计改造的大范围核酸酶或重组酶变体,以及可编程核酸酶的任何组合或杂合体。因此,本文提供的可编程核酸酶可被用于选择性地修饰编码感兴趣的基因比如毒素基因、毒力因子基因、抗生素抗性基因、重塑基因或调节基因的DNA(参见WO2014124226和US2015/0064138)。
特定实施方案中,所述有效载荷包含核酸序列SEQ ID NO:33或者由其组成。在备选实施方案中,所述有效载荷包含核酸序列SEQ ID NO:42或者由其组成。
在备选实施方案中,感兴趣的核酸编码治疗性蛋白。在另一个实施方案中,感兴趣的核酸编码反义核酸分子。
因此,本公开还提供如上定义的生产细胞系,其包含如上定义的辅助原噬菌体的,并且进一步包含含有如上定义的有效载荷、特别是核酸序列SEQ ID NO:33或核酸序列SEQID NO:42或者由其组成的噬菌粒。
在特定实施方案中,本文提供的细菌递送媒介物包含序列SEQ ID NO:11的嵌合STF和序列SEQ ID NO:27的嵌合gpJ变体,并且进一步包含含有核酸序列SEQ ID NO:33或者由其组成的有效载荷。
在另一个特定实施方案中,本文提供的细菌递送媒介物包含序列SEQ ID NO:11的嵌合STF和序列SEQ ID NO:27的嵌合gpJ变体,并且进一步包含含有核酸序列SEQ ID NO:42或者由其组成的有效载荷。
目标细菌
由本文公开的细菌递送媒介物靶向的细菌可为哺乳动物生物体中存在的任何细菌。在某些方面,通过递送媒介物的嵌合RBP与细菌细胞的相互作用来靶向细菌。其可为微生物群或微生物组的任何共栖、共生或致病性细菌。
微生物组可包含多种内源性细菌物种,其任何一种均可按照本公开被靶向。在一些实施方案中,靶标内源性细菌细胞的属和/或种可取决于被用于制备细菌递送媒介物的细菌噬菌体的类型。例如,一些细菌噬菌体表现出对于特定宿主细菌物种的向性或优先地靶向特定宿主细菌物种。其他细菌噬菌体不表现出此种向性,并且可被用于靶向许多不同属和/或种的内源性细菌细胞。
细菌细胞的实例非限制性地包括来自以下属的细菌的细胞:耶尔森氏菌属物种(Yersinia spp.)、埃希氏菌属物种(Escherichia spp.)、克雷伯氏菌属物种(Klebsiellaspp.)、不动杆菌属物种(Acinetobacter spp.)、博德特氏菌属物种(Bordetella spp.)、奈瑟菌属物种(Neisseria spp.)、气单胞菌属物种(Aeromonas spp.)、弗朗西斯菌属物种(Franciesella spp.)、棒状杆菌属物种(Corynebacterium spp.)、柠檬酸杆菌属物种(Citrobacter spp.)、衣原体属物种(Chlamydia spp.)、嗜血杆菌属物种(Hemophilusspp.)、布鲁氏菌属物种(Brucella spp.)、分枝杆菌属物种(Mycobacterium spp.)、军团菌属物种(Legionella spp.)、红球菌属物种(Rhodococcus spp.)、假单胞菌属物种(Pseudomonas spp.)、螺杆菌属物种(Helicobacter spp.)、弧菌属物种(Vibrio spp.)、芽孢杆菌属物种(Bacillus spp.)、丹毒丝菌属物种(Erysipelothrix spp.)、沙门氏菌属物种(Salmonella spp.)、链霉菌属物种(Streptomyces spp.)、链球菌属物种(Streptococcus spp.)、葡萄球菌属物种(Staphylococcus spp.)、拟杆菌属物种(Bacteroides spp.)、普雷沃氏菌属物种(Prevotella spp.)、梭菌属物种(Clostridiumspp.)、双歧杆菌属物种(Bifidobacterium spp.)、梭菌属物种、短杆菌属物种(Brevibacterium spp.)、乳球菌属物种(Lactococcus spp.)、明串珠菌属物种(Leuconostoc spp.)、放线杆菌属物种(Actinobacillus spp.)、硒单胞菌属物种(Selnomonas spp.)、志贺氏菌属物种(Shigella spp.)、发酵单胞菌属物种(Zymonasspp.)、支原体属物种(Mycoplasma spp.)、密螺旋体属物种(Treponema spp.)、明串珠菌属物种、棒状杆菌属物种、肠球菌属物种(Enterococcus spp.)、肠杆菌属物种(Enterobacterspp.)、焦球菌属物种(Pyrococcus spp.)、沙雷氏菌属物种(Serratia spp.)、摩根氏菌属物种(Morganella spp.)、微单胞菌属物种(Parvimonas spp.)、梭杆菌属物种(Fusobacterium spp.)、放线菌属物种(Actinomyces spp.)、卟啉单胞菌属物种(Porphyromonas spp.)、微球菌属物种(Micrococcus spp.)、巴尔通体属物种(Bartonellaspp.)、疏螺旋体属物种(Borrelia spp.)、布鲁氏菌属物种(Brucelia spp.)、弯曲杆菌属物种(Campylobacter spp.)、嗜衣原体属物种(Chlamydophilia spp.)、皮肤杆菌属物种(Cutibacterium(以前的丙酸杆菌属(Propionibacterium)spp.)、埃立克体属物种(Ehrlichia spp.)、嗜血杆菌属物种(Haemophilus spp.)、钩端螺旋体属物种(Leptospiraspp.)、李斯特菌属物种(Listeria spp.)、支原体属物种、诺卡氏菌属物种(Nocardiaspp.)、立克次体属物种(Rickettsia spp.)、脲原体属物种(Ureaplasma spp.)和乳杆菌属物种(Lactobacillus spp.)及其混合物。
因此,细菌递送媒介物可靶向(例如特异性地靶向)来自任何一个或多个上述细菌属的细菌细胞,以特异性地递送根据本公开的感兴趣的有效载荷。
在一个实施方案中,目标细菌可选自耶尔森氏菌属物种、埃希氏菌属物种、克雷伯氏菌属物种、不动杆菌属物种、假单胞菌属物种、螺杆菌属物种、弧菌属物种、沙门氏菌属物种、链球菌属物种、葡萄球菌属物种、拟杆菌属物种、梭菌属物种、志贺氏菌属物种、肠球菌属物种、肠杆菌属物种和李斯特菌属物种。
在一些实施方案中,本公开的靶标细菌细胞为厌氧菌细胞(例如不需要氧用于生长的细胞)。厌氧菌细胞包括兼性厌氧细胞,比如但不限于大肠埃希氏菌(Escherichiacoli)、奥奈达希瓦氏菌(Shewanella oneidensis)和李斯特菌属(Listeria)。厌氧菌细胞还包括专性厌氧细胞,比如拟杆菌属(Bacteroides)和梭菌属(Clostridium)物种。在人类中,厌氧菌最常存在于胃肠道。在一些特定实施方案中,靶标细菌因此为最常存在于胃肠道的细菌。被用于制备细菌病毒颗粒的细菌噬菌体,以及随后的细菌病毒颗粒,可根据本领域技术人员已知的厌氧菌细胞的特定谱来靶向(例如特异性地靶向)厌氧菌细胞,以特异性递送质粒。
在一些实施方案中,靶标细菌细胞非限制性地为多形拟杆菌(Bacteroidesthetaiotaomicron)、脆弱拟杆菌、狄氏拟杆菌(Bacteroides distasonis)、普通拟杆菌(Bacteroides vulgatus)、柔嫩梭菌(Clostridium leptum)、球形梭菌(Clostridiumcoccoides)、金黄色葡萄球菌、枯草芽孢杆菌(Bacillus subtilis)、丁酸梭菌(Clostridium butyricum)、乳酸发酵短杆菌(Brevibacterium lactofermentum)、无乳链球菌(Streptococcus agalactiae)、乳酸乳球菌(Lactococcus lactis)、乳酸明串珠菌(Leuconostoc lactis)、伴放线放线杆菌(Actinobacillus actinomycetemcomitans)、蓝细菌(cyanobacteria)、大肠埃希氏菌、幽门螺杆菌(Helicobacter pylori)、反刍新月形单胞菌(Selenomonas ruminatium)、宋内志贺氏菌(Shigella sonnei)、运动发酵单胞菌(Zymomonas mobilis)、丝状支原体(Mycoplasma mycoides)、栖牙密螺旋体(Treponemadenticola)、苏云金芽孢杆菌(Bacillus thuringiensis)、路邓葡萄球菌(Staphylococcuslugdunensis)、酒明串珠菌(Leuconostoc oenos)、干燥棒状杆菌(Corynebacteriumxerosis)、植物乳杆菌(Lactobacillus plantarum)、鼠李糖乳杆菌(Lactobacillusrhamnosus)、干酪乳杆菌(Lactobacillus casei)、嗜酸乳杆菌(Lactobacillusacidophilus)、粪肠球菌(Enterococcus faecalis)、凝结芽孢杆菌(Bacilluscoagulans)、蜡状芽孢杆菌(Bacillus cereus)、日本金龟子芽孢杆菌(Bacilluspopillae)、集胞藻属(Synechocystis)菌株PCC6803、液化芽孢杆菌(Bacillusliquefaciens)、海底焦球菌(Pyrococcus abyssi)、反刍新月形单胞菌(Selenomonasnominantium)、希氏乳杆菌(Lactobacillus hilgardii)、野鼠链球菌(Streptococcusferus)、戊糖乳杆菌(Lactobacillus pentosus)、脆弱拟杆菌、表皮葡萄球菌(Staphylococcus epidermidis)、暗产色链霉菌(Streptomyces phaechromogenes)、加纳链霉菌(Streptomyces ghanaenis)、肺炎克雷伯氏菌、阴沟肠杆菌(Enterobactercloacae)、产气肠杆菌(Enterobacter aerogenes)、粘质沙雷氏菌(Serratiamarcescens)、摩氏摩根氏菌(Morganella morganii)、弗氏柠檬酸杆菌(Citrobacterfreundii)、铜绿假单胞菌、微小微单胞菌(Parvimonas micra)、中间普雷沃氏菌(Prevotella intermedia)、具核梭杆菌、变黑普雷沃氏菌(Prevotella nigrescens)、以色列放线菌(Actinomyces israelii)、牙髓卟啉单胞菌(Porphyromonas endodontalis)、牙龈卟啉单胞菌(Porphyromonas gingivalis)、藤黄微球菌(Micrococcus luteus)、巨大芽孢杆菌(Bacillus megaterium)、嗜水气单胞菌(Aeromonas hydrophila)、豚鼠气单胞菌(Aeromonas caviae)、炭疽芽孢杆菌、汉氏巴尔通体(Bartonella henselae)、五日热巴尔通体(Bartonella Quintana)、百日咳博德特氏菌(Bordetella pertussis)、伯氏疏螺旋体(Borrelia burgdorferi)、伽氏疏螺旋体(Borrelia garinii)、阿氏疏螺旋体(Borreliaafzelii)、回归热疏螺旋体(Borrelia recurrentis)、流产布鲁氏菌(Brucella abortus)、犬布鲁氏菌(Brucella canis)、羊布鲁氏菌(Brucella melitensis)、猪布鲁氏菌(Brucella suis)、空肠弯曲杆菌、结肠弯曲杆菌(Campylobacter coli)、胎儿弯曲杆菌(Campylobacter fetus)、肺炎衣原体(Chlamydia pneumoniae)、沙眼衣原体(Chlamydiatrachomatis)、鹦鹉热嗜衣原体(Chlamydophila psittaci)、肉毒梭菌(Clostridiumbotulinum)、艰难梭菌(Clostridium difficile)、产气荚膜梭菌(Clostridiumperfringens)、破伤风梭菌(Clostridium tetani)、白喉棒状杆菌(Corynebacteriumdiphtheria)、痤疮皮肤杆菌(Cutibacterium acnes)(以前的痤疮丙酸杆菌(Propionibacterium acnes))、犬埃立克体(Ehrlichia canis)、查菲埃立克体(Ehrlichiachaffeensis)、屎肠球菌(Enterococcus faecium)、土拉弗朗西斯菌、流感嗜血杆菌(Haemophilus influenza)、嗜肺军团菌(Legionella pneumophila)、问号钩端螺旋体(Leptospira interrogans)、桑塔罗萨钩端螺旋体(Leptospira santarosai)、韦氏钩端螺旋体(Leptospira weilii)、野口钩端螺旋体(Leptospira noguchii)、单核细胞增多性李斯特菌(Listeria monocytogenes)、麻风分枝杆菌(Mycobacterium leprae)、结核分枝杆菌(Mycobacterium tuberculosis)、溃疡分枝杆菌(Mycobacterium ulcerans)、肺炎支原体(Mycoplasma pneumonia)、淋病奈瑟菌(Neisseria gonorrhoeae)、脑膜炎奈瑟菌、星形诺卡氏菌(Nocardia asteroids)、立氏立克次体(Rickettsia rickettsia)、肠炎沙门氏菌(Salmonella enteritidis)、伤寒沙门氏菌(Salmonella typhi)、副伤寒沙门氏菌(Salmonella paratyphi)、鼠伤寒沙门氏菌(Salmonella typhimurium)、福氏志贺氏菌(Shigella flexneri)、痢疾志贺氏菌、腐生葡萄球菌(Staphylococcus saprophyticus)、肺炎链球菌(Streptococcus pneumoniae)、酿脓链球菌、草绿色链球菌(Streptococcusviridans)、苍白密螺旋体(Treponema pallidum)、解脲脲原体(Ureaplasmaurealyticum)、霍乱弧菌、副溶血弧菌(Vibrio parahaemolyticus)、鼠疫耶尔森氏菌、小肠结肠炎耶尔森氏菌(Yersinia enterocolitica)、假结核耶尔森氏菌(Yersiniapseudotuberculosis)、鲍曼放线杆菌(Actinobacter baumanii)、铜绿假单胞菌及其混合物。在一个实施方案中,感兴趣的靶标细菌选自大肠埃希氏菌、屎肠球菌、金黄色葡萄球菌、肺炎克雷伯氏菌、鲍曼不动杆菌(Acinetobacter baumanii)、铜绿假单胞菌、阴沟肠杆菌和产气肠杆菌及其混合物。
在一些实施方案中,靶标细菌细胞非限制性地为厌氧棍状菌属(Anaerotruncus)、厌氧醋菌属(Acetanaerobacterium)、聚乙酸菌属(Acetitomaculum)、醋弧菌属(Acetivibrio)、厌氧球菌属(Anaerococcus)、厌氧细杆菌属(Anaerofilum)、厌氧弯曲菌属(Anaerosinus)、厌氧棒杆菌属(Anaerostipes)、厌氧贪噬菌属(Anaerovorax)、丁酸弧菌属(Butyrivibrio)、梭菌属、粪球菌属(Capracoccus)、脱卤素杆菌属(Dehalobacter)、戴阿李斯特菌属(Dialister)、多尔氏菌属(Dorea)、肠球菌属(Enterococcus)、产乙醇杆菌属(Ethanoligenens)、栖粪杆菌属(Faecalibacterium)、梭杆菌属(Fusobacterium)、纤细杆菌属(Gracilibacter)、古根海姆氏菌(Guggenheimella)、海普拉菌属(Hespellia)、毛形杆菌属(Lachnobacterium)、毛螺菌属(Lachnospira)、乳杆菌属(Lactobacillus)、明串珠菌属(Leuconostoc)、巨单胞菌属(Megamonas)、莫利氏菌属(Moryella)、光冈菌属(Mitsuokella)、金杆菌属(Oribacterium)、产醋杆菌属(Oxobacter)、乳头杆菌属(Papillibacter)、丙酸螺菌属(Proprionispira)、假丁酸弧菌属(Pseudobutyrivibrio)、假支杆菌属(Pseudoramibacter)、罗斯拜瑞氏菌属(Roseburia)、瘤胃球菌属(Ruminococcus)、八叠球菌属(Sarcina)、清野氏菌属(Seinonella)、肖特沃思氏菌属(Shuttleworthia)、孢杆菌属(Sporobacter)、孢菌属(Sporobacterium)、链球菌属(Streptococcus)、罕见小球菌属(Subdoligranulum)、互营球菌属(Syntrophococcus)、耐热芽孢杆菌属(Thermobacillus)、苏黎世杆菌属(Turibacter)、魏斯氏菌属(Weisella)、梭菌属、拟杆菌属、瘤胃球菌属、栖粪杆菌属、密螺旋体属(Treponema)、考拉杆菌属(Phascolarctobacterium)、巨球形菌属(Megasphaera)、栖粪杆菌属、双歧杆菌属(Bifidobacterium)、乳杆菌属、萨特氏菌属(Sutterella)和/或普雷沃氏菌属(Prevotella)。
在其他实施方案中,靶标细菌细胞非限制性地为木糖氧化无色杆菌(Achromobacter xylosoxidans)、发酵氨基酸球菌(Acidaminococcus fermentans)、肠氨基酸球菌(Acidaminococcus intestini)、氨基酸球菌属物种、鲍曼不动杆菌、琼氏不动杆菌(Acinetobacter junii)、洛菲不动杆菌(Acinetobacter lwoffii)、荚膜放线杆菌(Actinobacillus capsulatus)、内氏放线菌(Actinomyces naeslundii)、纽氏放线菌(Actinomyces neuii)、溶齿放线菌(Actinomyces odontolyticus)、瑞丁放线菌(Actinomyces radingae)、产液阿德勒克罗伊茨菌(Adlercreutzia equolifaciens)、马赛气微菌(Aeromicrobium massiliense)、伴放线凝聚杆菌(Aggregatibacteractinomycetemcomitans)、嗜黏蛋白阿克曼菌(Akkermansia muciniphila)、海洋别样食藻菌(Aliagarivorans marinus)、芬氏别样杆菌(Alistipes finegoldii)、苍莽别样杆菌(Alistipes indistinctus)、狭边别样杆菌(Alistipes inops)、昂氏别样杆菌(Alistipesonderdonkii)、腐烂别样杆菌(Alistipes putredinis)、塞内加尔别样杆菌(Alistipessenegalensis)、沙氏别样杆菌(Alistipes shahii)、蒂莫内别样杆菌(Alistipestimonensis)、广栖异斯卡多维亚菌(Alloscardovia omnicolens)、多内孢厌氧杆菌(Anaerobacter polyendosporus)、产氢厌氧棒菌(Anaerobaculum hydrogeniformans)、生氢厌氧球菌(Anaerococcus hydrogenalis)、普氏厌氧球菌(Anaerococcus prevotii)、塞内加尔厌氧球菌(Anaerococcus senegalensis)、人粪厌氧棒形菌(Anaerofustisstercorihominis)、粪厌氧棒杆菌(Anaerostipes caccae)、庞大厌氧棒杆菌(Anaerostipes hadrus)、人结肠厌氧棍状菌(Anaerotruncus colihominis)、解硫胺素解硫胺素芽孢杆菌(Aneurinibacillus aneurinilyticus)、地衣形芽孢杆菌(Bacilluslicheniformis)、马赛厌食症芽孢杆菌(Bacillus massilioanorexius)、马赛塞内加尔芽孢杆菌(Bacillus massiliosenegalensis)、简单芽孢杆菌(Bacillus simplex)、史氏芽孢杆菌(Bacillus smithii)、枯草芽孢杆菌、苏云金芽孢杆菌、蒂莫内芽孢杆菌(Bacillustimonensis)、溶木聚糖拟杆菌(Bacteroides xylanisolvens)、产酸拟杆菌(Bacteroidesacidifaciens)、粪拟杆菌(Bacteroides caccae)、多毛拟杆菌(Bacteroidescapillosus)、解纤维素拟杆菌(Bacteroides cellulosilyticus)、克拉鲁斯拟杆菌(Bacteroides clarus)、粪居拟杆菌(Bacteroides coprocola)、嗜粪拟杆菌(Bacteroidescoprophilus)、多氏拟杆菌(Bacteroides dorei)、埃氏拟杆菌(Bacteroides eggerthii)、粪便拟杆菌(Bacteroides faecis)、细金拟杆菌(Bacteroides finegoldii)、氟拟杆菌(Bacteroides fluxus)、脆弱拟杆菌、鸡拟杆菌(Bacteroides gallinarum)、肠道拟杆菌(Bacteroides intestinalis)、北拟杆菌(Bacteroides nordii)、油性拟杆菌(Bacteroides oleiciplenus)、卵形拟杆菌(Bacteroides ovatus)、嗜果胶拟杆菌(Bacteroides pectinophilus)、平常拟杆菌(Bacteroides plebeius)、萨氏拟杆菌(Bacteroides salanitronis)、萨利尔斯氏拟杆菌(Bacteroides salyersiae)、拟杆菌属物种(Bacteroides sp.)、粪便拟杆菌(Bacteroides stercoris)、多形拟杆菌、单形拟杆菌(Bacteroides uniformis)、普通拟杆菌、溶木聚糖拟杆菌、嗜果胶拟杆菌ATCC、人肠道巴恩斯氏菌(Barnesiella intestinihominis)、赛勒氏巴伐利亚球菌(Bavariicoccusseileri)、青春双歧杆菌(Bifidobacterium adolescentis)、角双歧杆菌(Bifidobacterium angulatum)、动物双歧杆菌(Bifidobacterium animalis)、双歧双歧杆菌(Bifidobacterium bifidum)、短双歧杆菌(Bifidobacterium breve)、小链双歧杆菌(Bifidobacterium catenulatum)、齿双歧杆菌(Bifidobacterium dentium)、高卢双歧杆菌(Bifidobacterium gallicum)、长双歧杆菌(Bifidobacterium longum)、假小链双歧杆菌(Bifidobacterium pseudocatenulatum)、粪双歧杆菌(Bifidobacterium stercoris)、沃氏嗜胆菌(Bilophila wadsworthia)、粪布劳特氏菌(Blautia faecis)、汉氏布劳特氏菌(Blautia hansenii)、氢营养布劳特氏菌(Blautia hydrogenotrophica)、卢氏布劳特氏菌(Blautia luti)、卵形布劳特氏菌(Blautia obeum)、生产布劳特氏菌(Blautiaproducta)、韦氏布劳特氏菌(Blautia wexlerae)、摇蚜短枝单胞菌(Brachymonaschironomi)、塞内加尔短杆菌(Brevibacterium senegalense)、需甲酸盐布瑞特氏菌(Bryantella formatexigens)、丁酸盐产生菌(butyrate-producing bacterium)、白痢丁酸球菌(Butyricicoccus pullicaecorum)、有毒丁酸单胞菌(Butyricimonas virosa)、穗状丁酸弧菌(Butyrivibrio crossotus)、溶纤维丁酸弧菌(Butyrivibrio fibrisolvens)、粪钙杆菌(Caldicoprobacter faecalis)、简明弯曲杆菌(Campylobacter concisus)、空肠弯曲杆菌、乌普萨拉弯曲杆菌(Campylobacter upsaliensis)、光冈链型杆菌(Catenibacteriummitsuokai)、戴氏西地西菌(Cedecea davisae)、马赛纤维单胞菌(Cellulomonas massiliensis)、索氏鲸杆菌(Cetobacterium somerae)、布氏柠檬酸杆菌(Citrobacter braakii)、弗氏柠檬酸杆菌、巴氏柠檬酸杆菌(Citrobacter pasteurii)、柠檬酸杆菌属物种(Citrobacter sp.)、杨氏柠檬酸杆菌(Citrobacter youngae)、艾维克洛杆菌(Cloacibacillus evryensis)、梭菌目(Clostridiales)细菌、艰难梭菌(Clostridioides difficile)、天冬形梭菌(Clostridium asparagiforme)、巴特勒梭菌(Clostridium bartlettii)、玻利维亚梭菌(Clostridium boliviensis)、鲍氏梭菌(Clostridium bolteae)、哈氏梭菌(Clostridium hathewayi)、平野梭菌(Clostridiumhiranonis)、海氏梭菌(Clostridium hylemonae)、柔嫩梭菌、甲基戊糖梭菌(Clostridiummethylpentosum)、系结梭菌(Clostridium nexile)、切环梭菌(Clostridiumorbiscindens)、多枝梭菌(Clostridium ramosum)、闪烁梭菌(Clostridium scindens)、梭菌属物种(Clostridium sp)、梭菌属物种、螺旋形梭菌(Clostridium spiroforme)、产孢梭菌(Clostridium sporogenes)、共生梭菌(Clostridium symbiosum)、产气柯林斯菌(Collinsella aerofaciens)、肠道柯林斯菌(Collinsella intestinalis)、粪便柯林斯菌(Collinsella stercoris)、田中柯林斯菌(Collinsella tanakaei)、串珠芽孢杆菌(Coprobacillus cateniformis)、苛求粪杆菌(Coprobacter fastidiosus)、灵巧粪球菌(Coprococcus catus)、陪伴粪球菌(Coprococcus comes)、规则粪球菌(Coprococcuseutactus)、产氨棒状杆菌(Corynebacterium ammoniagenes)、无枝菌酸棒状杆菌(Corynebacterium amycolatum)、假白喉棒状杆菌(Corynebacteriumpseudodiphtheriticum)、痤疮皮肤杆菌、人皮肤杆菌(Dermabacter hominis)、哈夫尼脱亚硫酸菌属(Desulfitobacterium hafniense)、费尔菲尔德脱硫弧菌(Desulfovibriofairfieldensis)、懒惰脱硫弧菌(Desulfovibrio piger)、喜琥珀酸戴阿李斯特菌(Dialister succinatiphilus)、苛求迪尔莫菌(Dielma fastidiosa)、产甲酸多尔氏菌(Dorea formicigenerans)、长链多尔氏菌(Dorea longicatena)、二氧化碳嗜纤维菌样营发酵单胞菌(Dysgonomonas capnocytophagoides)、嘉德营发酵单胞菌(Dysgonomonasgadei)、莫斯氏营发酵单胞菌(Dysgonomonas mossii)、迟钝爱德华菌(Edwardsiellatarda)、迟缓埃格特菌(Eggerthella lenta)、塔一艾森伯格氏菌(Eisenbergiella tayi)、马赛艾诺玛菌(Enorma massiliensis)、产气肠杆菌、阿氏肠杆菌(Enterobacterasburiae)、生癌肠杆菌(Enterobacter cancerogenus)、阴沟肠杆菌、马赛肠杆菌(Enterobacter massiliensis)、铅黄肠球菌(Enterococcus casseliflavus)、耐久肠球菌(Enterococcus durans)、粪肠球菌、屎肠球菌、黄色肠球菌(Enterococcus flavescens)、鸡肠球菌(Enterococcus gallinarum)、肠球菌属物种(Enterococcus sp.)、黑色肠弧菌(Enterovibrio nigricans)、多枝丹毒荚膜菌(Erysipelatoclostridium ramosum)、大肠埃希氏菌、埃希氏菌属物种(Escherichia sp.)、两形真杆菌(Eubacterium biforme)、细长真杆菌(Eubacterium dolichum)、霍氏真杆菌(Eubacterium hallii)、粘液真杆菌(Eubacterium limosum)、细枝真杆菌(Eubacterium ramulus)、直肠真杆菌(Eubacteriumrectale)、惰性真杆菌、凸腹真杆菌(Eubacterium ventriosum)、海微小杆菌(Exiguobacterium marinum)、水域微小杆菌(Exiguobacterium undae)、试认为栖粪杆菌(Faecalibacterium cf)、普氏栖粪杆菌(Faecalibacterium prausnitzii)、圆柱状屎豆菌(Faecalitalea cylindroides)、巴氏铁单胞菌(Ferrimonas balearica)、大芬戈尔德菌(Finegoldia magna)、大田黄杆菌(Flavobacterium daejeonense)、普氏解黄酮菌(Flavonifractor plautii)、食蔗糖纺锤链杆菌(Fusicatenibacter saccharivorans)、刚氏梭杆菌(Fusobacterium gonidiaformans)、死亡梭杆菌(Fusobacteriummortiferum)、坏死梭杆菌(Fusobacterium necrophorum)、具核梭杆菌、牙周梭杆菌(Fusobacteriumperiodonticum)、梭杆菌属物种(Fusobacterium sp.)、溃疡梭杆菌(Fusobacteriumulcerans)、变异梭杆菌(Fusobacterium varium)、鸭源鸡杆菌(Gallibacterium anatis)、甲酸芽殖菌(Gemmiger formicilis)、帕梅莱亚戈登氏杆菌(Gordonibacter pamelaeae)、蜂房哈夫尼菌(Hafnia alvei)、胆汁螺杆菌(Helicobacter bilis)、胆汁螺杆菌(Helicobacter bills)、加拿大螺杆菌(Helicobacter canadensis)、犬螺杆菌(Helicobacter canis)、同性恋螺杆菌(Helicobacter cinaedi)、猕猴螺杆菌(Helicobacter macacae)、帕美特螺杆菌(Helicobacter pametensis)、幼禽螺杆菌(Helicobacter pullorum)、幽门螺杆菌、啮齿类螺杆菌(Helicobacter rodentium)、温哈门螺杆菌(Helicobacter winghamensis)、马赛草螺菌(Herbaspirillum massiliense)、双形霍尔德曼氏菌(Holdemanella biformis)、丝状霍尔德曼氏菌(Holdemania fdiformis)、丝状霍尔德曼氏菌(Holdemania filiformis)、马赛霍尔德曼氏菌(Holdemaniamassiliensis)、丝状霍尔德曼氏菌、哈氏亨盖特菌(Hungatella hathewayi)、巴特勒肠杆菌(Intestinibacter bartlettii)、产丁酸肠单胞菌(Intestinimonasbutyriciproducens)、产酸克雷伯氏菌(Klebsiella oxytoca)、肺炎克雷伯氏菌、马赛库特氏菌(Kurthia massiliensis)、裂果胶毛螺菌(Lachnospira pectinoschiza)、嗜酸乳杆菌、解淀粉乳杆菌(Lactobacillus amylolyticus)、动物乳杆菌(Lactobacillusanimalis)、胃窦乳杆菌(Lactobacillus antri)、短乳杆菌(Lactobacillus brevis)、布氏乳杆菌(Lactobacillus buchneri)、干酪乳杆菌、弯曲乳杆菌(Lactobacillus curvatus)、德氏乳杆菌(Lactobacillus delbrueckii)、发酵乳杆菌(Lactobacillus fermentum)、格氏乳杆菌(Lactobacillus gasseri)、瑞士乳杆菌(Lactobacillus helveticus)、希氏乳杆菌、惰性乳杆菌(Lactobacillus iners)、肠道乳杆菌(Lactobacillus intestinalis)、约氏乳杆菌(Lactobacillus johnsonii)、鼠乳杆菌(Lactobacillus murinus)、副干酪乳杆菌(Lactobacillus paracasei)、植物乳杆菌、罗伊氏乳杆菌(Lactobacillus reuteri)、鼠李糖乳杆菌、瘤胃乳杆菌(Lactobacillus ruminis)、清酒乳杆菌(Lactobacillus sakei)、唾液乳杆菌(Lactobacillus salivarius)、厄尔纳拉乳杆菌(Lactobacillusultunensis)、阴道乳杆菌(Lactobacillus vaginalis)、植物乳杆菌亚种(Lactobacillusplantarum subsp.)、肠膜明串珠菌(Leuconostoc mesenteroides)、假肠膜明串珠菌(Leuconostoc pseudomesenteroides)、格氏李斯特菌(Listeria grayi)、英诺克李斯特菌(Listeria innocua)、肉芽肿性曼氏杆菌(Mannheimia granulomatis)、需甲酸盐马文布莱恩特氏菌(Marvinbryantia formatexigens)、单形巨单胞菌(Megamonas funiformis)、极巨巨单胞菌(Megamonas hypermegale)、史氏甲烷短杆菌(Methanobrevibacter smithii)、史氏甲烷短杆菌、藤黄微球菌、好氧反硝化微枝杆菌(Microvirgula aerodenitrificans)、贾氏光冈菌(Mitsuokella jalaludinii)、多酸光冈菌(Mitsuokella multacida)、柔膜细菌目(Mollicutes)细菌、肠道鼠单胞菌(Murimonas intestini)、猕猴奈瑟菌(Neisseriamacacae)、嗜碱解腈菌(Nitriliruptor alkaliphilus)、马赛海洋芽孢杆菌(Oceanobacillus massiliensis)、绒毛臭杆菌(Odoribacter laneus)、内脏臭杆菌(Odoribacter splanchnicus)、鼻气管炎鸟杆菌(Ornithobacterium rhinotracheale)、产甲酸草酸杆菌(Oxalobacter formigenes)、巴伦氏类芽孢杆菌(Paenibacillusbarengoltzii)、解几丁质类芽孢杆菌(Paenibacillus chitinolyticus)、灿烂类芽孢杆菌(Paenibacillus lautus)、本部类芽孢杆菌(Paenibacillus motobuensis)、塞内加尔类芽孢杆菌(Paenibacillus senegalensis)、废物埋地类芽孢八叠球菌(Paenisporosarcinaquisquiliarum)、狄氏副拟杆菌(Parabacteroides distasonis)、戈氏副拟杆菌(Parabacteroides goldsteinii)、戈登副拟杆菌(Parabacteroides gordonii)、约氏副拟杆菌(Parabacteroides johnsonii)、粪副拟杆菌(Parabacteroides merdae)、嗜木聚糖副普氏菌(Paraprevotella xylaniphila)、人排泄物副萨特氏菌(Parasutterellaexcrementihominis)、微小微单胞菌、乳酸片球菌(Pediococcus acidilactici)、艰难消化梭菌(Peptoclostridium difficile)、兔嗜胨菌(Peptoniphilus harei)、肥胖嗜胨菌(Peptoniphilus obesi)、塞内加尔嗜胨菌(Peptoniphilus senegalensis)、蒂莫内嗜胨菌(Peptoniphilus timonensis)、琥珀酸考拉杆菌(Phascolarctobacteriumsuccinatutens)、不解糖卟啉单胞菌(Porphyromonas asaccharolytica)、上野卟啉单胞菌(Porphyromonas uenonis)、巴氏普雷沃氏菌(Prevotella baroniae)、二路普雷沃氏菌(Prevotella bivia)、粪便普雷沃氏菌(Prevotella copri)、牙普雷沃氏菌(Prevotelladentalis)、彩虹普雷沃氏菌(Prevotella micans)、食多糖普雷沃氏菌(Prevotellamultisaccharivorax)、口腔普雷沃氏菌(Prevotella oralis)、唾液普雷沃氏菌(Prevotella salivae)、粪普雷沃氏菌(Prevotella stercorea)、真口腔普雷沃氏菌(Prevotella veroralis)、痤疮丙酸杆菌、贪婪丙酸杆菌(Propionibacterium avidum)、费氏丙酸杆菌(Propionibacterium freudenreichii)、嗜淋巴丙酸微菌(Propionimicrobiumlymphophilum)、奇异变形杆菌(Proteus mirabilis)、彭氏变形杆菌(Proteus penneri)ATCC、产碱普罗威登斯菌(Providencia alcalifaciens)、雷氏普罗威登斯菌(Providenciarettgeri)、拉氏普罗威登斯菌(Providencia rustigianii)、斯氏普罗威登斯菌(Providencia stuartii)、多毛假解黄酮菌(Pseudoflavonifractor capillosus)、铜绿假单胞菌、浅黄色假单胞菌(Pseudomonas luteola)、皮氏罗尔斯通氏菌(Ralstoniapickettii)、透明莱茵海默氏菌(Rheinheimera perlucida)、德克萨斯莱茵海默氏菌(Rheinheimera texasensis)、鸽里默菌(Riemerella columbina)、象牙海岸罗姆布茨菌(Romboutsia lituseburensis)、粪便罗斯拜瑞氏菌(Roseburia faecis)、肠道罗斯拜瑞氏菌(Roseburia intestinalis)、食菊粉罗斯拜瑞氏菌(Roseburia inulinivorans)、双环瘤胃球菌(Ruminococcus bicirculans)、布氏瘤胃球菌(Ruminococcus bromii)、伶俐瘤胃球菌(Ruminococcus callidus)、尚帕内尔瘤胃球菌(Ruminococcus champanellensis)、粪便瘤胃球菌(Ruminococcus faecis)、活泼瘤胃球菌(Ruminococcus gnavus)、酸奶瘤胃球菌(Ruminococcus lactaris)、卵形瘤胃球菌(Ruminococcus obeum)、瘤胃球菌属物种、瘤胃球菌属物种、扭链瘤胃球菌(Ruminococcus torques)、胃八叠球菌(Sarcina ventriculi)、肠道粪便单胞菌(Sellimonas intestinalis)、厌氧塞内加尔马赛菌(Senegalimassiliaanaerobia)、宋内志贺氏菌、梨形斯奈克氏菌(Slackia piriformis)、表皮葡萄球菌、缓慢葡萄球菌(Staphylococcus lentus)、尼泊尔葡萄球菌(Staphylococcus nepalensis)、假中间葡萄球菌(Staphylococcus pseudintermedius)、木糖葡萄球菌(Staphylococcusxylosus)、嗜麦芽窄食单胞菌(Stenotrophomonas maltophilia)、无乳链球菌、咽峡炎链球菌(Streptococcus anginosus)、澳大利亚链球菌(Streptococcus australis)、家马链球菌(Streptococcus caballi)、河狸链球菌(Streptococcus castoreus)、负鼠链球菌(Streptococcus didelphis)、马链球菌(Streptococcus equinus)、戈登链球菌(Streptococcus gordonii)、亨利链球菌(Streptococcus henryi)、猪阴道链球菌(Streptococcus hyovaginalis)、婴幼儿链球菌(Streptococcus infantarius)、婴儿链球菌(Streptococcus infantis)、巴黎链球菌(Streptococcus lutetiensis)、沙鼠链球菌(Streptococcus merionis)、缓症链球菌(Streptococcus mitis)、变异链球菌、口腔链球菌(Streptococcus oralis)、绵羊链球菌(Streptococcus ovis)、副血链球菌(Streptococcus parasanguinis)、多内脏链球菌(Streptococcus plurextorum)、猪链球菌(Streptococcus porci)、酿脓链球菌、唾液链球菌(Streptococcus salivarius)、表兄链球菌(Streptococcus sobrinus)、嗜热链球菌(Streptococcus thermophilus)、托尔豪特链球菌(Streptococcus thoraltensis)、白色链霉菌(Streptomyces albus)、变形罕见小球菌(Subdoligranulum variabile)、希贝琥珀酸单胞菌(Succinatimonas hippei)、小红萨特氏菌(Sutterella parvirubra)、沃兹沃斯萨特氏菌(Sutterellawadsworthensis)、产乙二醇土孢杆菌(Terrisporobacter glycolicus)、马犹姆贝土孢杆菌(Terrisporobacter mayombei)、食有机物深海芽孢杆菌(Thalassobacillusdevorans)、塞内加尔蒂莫内菌(Timonella senegalensis)、血苏黎世杆菌(Turicibactersanguinis)、未知物种(unknown sp)、未知物种、坎布里亚弯曲短杆菌(Varibaculumcambriense)、非典型韦荣菌(Veillonella atypica)、殊异韦荣菌(Veillonella dispar)、小韦荣菌(Veillonella parvula)、辛辛那提弧菌(Vibrio cincinnatiensis)、需盐枝芽孢杆菌(Virgibacillus salexigens)或类肠膜魏斯氏菌(Weissella paramesenteroides)。
在其他实施方案中,靶标细菌细胞为通常存在于皮肤微生物群上的那些,并且非限制性地为法氏醋酸杆菌(Acetobacter farinalis)、苹果醋酸杆菌(Acetobactermalorum)、奥尔良醋酸杆菌(Acetobacter orleanensis)、果酒醋酸杆菌(Acetobactersicerae)、焦虑无色杆菌(Achromobacter anxifer)、反硝化无色杆菌(Achromobacterdenitrificans)、马德普拉塔无色杆菌(Achromobacter marplatensis)、少见无色杆菌(Achromobacter spanius)、木糖氧化无色杆菌木糖氧化亚种(Achromobacterxylosoxidans subsp.xylosoxidans)、魔芋噬酸菌(Acidovorax konjaci)、根噬酸菌(Acidovorax radicis)、约氏不动杆菌(Acinetobacter johnsonii)、柠檬马杜拉放线菌(Actinomadura citrea)、青蓝马杜拉放线菌(Actinomadura coerulea)、纤维状马杜拉放线菌(Actinomadura fibrosa)、棕黄马杜拉放线菌(Actinomadura fulvescens)、蛟河马杜拉放线菌(Actinomadura jiaoheensis)、藤黄荧光马杜拉放线菌(Actinomaduraluteofluorescens)、墨西哥马杜拉放线菌(Actinomadura mexicana)、产亚硝酸马杜拉放线菌(Actinomadura nitritigenes)、疣孢马杜拉放线菌(Actinomaduraverrucosispora)、尤马马杜拉放线菌(Actinomadura yumaensis)、溶齿放线菌、非典型放线链孢菌(Actinomycetospora atypica)、居树皮放线链孢菌(Actinomycetosporacorticicola)、嗜根放线链孢菌(Actinomycetospora rhizophila)、利尻放线链孢菌(Actinomycetospora rishiriensis)、澳洲气单胞菌(Aeromonas australiensis)、兽气单胞菌(Aeromonas bestiarum)、双壳气单胞菌(Aeromonas bivalvium)、鳗鱼气单胞菌(Aeromonas encheleia)、嗜矿泉气单胞菌(Aeromonas eucrenophila)、嗜水气单胞菌嗜水亚种(Aeromonas hydrophila subsp.hydrophila)、居鱼气单胞菌(Aeromonaspiscicola)、波氏气单胞菌(Aeromonas popoffii)、溪气单胞菌(Aeromonas rivuli)、杀鲑气单胞菌溶果胶亚种(Aeromonas salmonicida subsp.pectinolytica)、杀鲑气单胞菌史氏亚种(Aeromonas salmonicida subsp.smithia)、卡普利采下水道球菌(Amaricoccuskaplicensis)、维罗纳下水道球菌(Amaricoccus veronensis)、阿贺野氨基杆菌(Aminobacter aganoensis)、奇切罗内氨基杆菌(Aminobacter ciceronei)、里萨拉氨基杆菌(Aminobacter lissarensis)、新泻氨基杆菌(Aminobacter niigataensis)、多形弯杆菌(Ancylobacter polymorphus)、好热黄无氧芽孢杆菌云南亚种(Anoxybacillusflavithermus subsp.yunnanensis)、气生水微菌(Aquamicrobium aerolatum)、过渡原囊菌(Archangium gephyra)、过渡原囊菌、小原囊菌(Archangium minus)、紫原囊菌(Archangium violaceum)、粘节杆菌(Arthrobacter viscosus)、炭疽芽孢杆菌、南中国海芽孢杆菌(Bacillus australimaris)、德伦特芽孢杆菌(Bacillus drentensis)、蕈状芽孢杆菌(Bacillus mycoides)、假蕈状芽孢杆菌(Bacillus pseudomycoides)、短小芽孢杆菌(Bacillus pumilus)、沙福芽孢杆菌(Bacillus safensis)、死谷芽孢杆菌(Bacillusvallismortis)、硫氧化博斯氏菌(Bosea thiooxidans)、黄淮海慢生根瘤菌(Bradyrhizobium huanghuaihaiense)、大豆慢生根瘤菌(Bradyrhizobium japonicum)、橙色短波单胞菌(Brevundimonas aurantiaca)、中间短波单胞菌(Brevundimonasintermedia)、松雀花伯克霍尔德菌(Burkholderia aspalathi)、大地伯克霍尔德菌(Burkholderia choica)、科尔多瓦伯克霍尔德菌(Burkholderia cordobensis)、广布伯克霍尔德氏菌(Burkholderia diffusa)、平淡伯克霍尔德氏菌(Burkholderia insulsa)、鹿藿伯克霍尔德氏菌(Burkholderia rhynchosiae)、土伯克霍尔德氏菌(Burkholderiaterrestris)、地面伯克霍尔德氏菌(Burkholderia udeis)、加氏布丘氏菌(Buttiauxellagaviniae)、土地污泥单胞菌(Caenimonas terrae)、牙龈二氧化碳噬纤维菌(Capnocytophaga gingivalis)、鼎湖山噬几丁质菌(Chitinophaga dinghuensis)、粘金黄杆菌(Chryseobacterium gleum)、格陵兰金黄杆菌(Chryseobacterium greenlandense)、济州岛金黄杆菌(Chryseobacterium jejuense)、鱼金黄杆菌(Chryseobacteriumpiscium)、沉积物金黄杆菌(Chryseobacterium sediminis)、鳟金黄杆菌(Chryseobacterium tructae)、解脲金黄杆菌(Chryseobacterium ureilyticum)、越南金黄杆菌(Chryseobacterium vietnamense)、拥挤棒状杆菌(Corynebacterium accolens)、非发酵棒状杆菌嗜脂亚种(Corynebacterium afermentans subsp.lipophilum)、极小棒状杆菌(Corynebacterium minutissimum)、松兹瓦尔棒状杆菌(Corynebacteriumsundsvallense)、耐金属贪铜菌(Cupriavidus metallidurans)、南通嗜铜菌(Cupriavidusnantongensis)、杀虫贪铜菌(Cupriavidus necator)、潘帕贪铜菌(Cupriavidus pampae)、涟川贪铜菌(Cupriavidus yeoncheonensis)、萎蔫短小杆菌(Curtobacteriumflaccumfaciens)、水蛭皮肤s德沃斯氏菌(Devosia epidermidihirudinis)、核黄素氧化德沃斯氏菌(Devosia riboflavina)、核黄素氧化德沃斯氏菌、稻有益杆菌(Diaphorobacteroryzae)、嗜碱冷迪茨氏菌(Dietzia psychralcaliphila)、粘着剑菌(Ensiferadhaerens)、美洲剑菌(Ensifer americanus)、病臭肠球菌(Enterococcus malodoratus)、假鸟肠球菌(Enterococcus pseudoavium)、维埃基肠球菌(Enterococcus viikkiensis)、香坊肠球菌(Enterococcus xiangfangensis)、大黄欧文氏菌(Erwinia rhapontici)、耐盐错红杆菌(Falsirhodobacter halotolerans)、阿劳坎黄杆菌(Flavobacteriumaraucananum)、冷海水黄杆菌(Flavobacterium frigidimaris)、弗氏葡糖杆菌(Gluconobacter frateurii)、泰国葡糖杆菌(Gluconobacter thailandicus)、食烷烃戈登氏菌(Gordonia alkanivorans)、海水盐单胞菌(Halomonas aquamarina)、轴向海山盐单胞菌(Halomonas axialensis)、南方盐单胞菌(Halomonas meridiana)、橄榄油盐单胞菌(Halomonas olivaria)、松嫩盐单胞菌(Halomonas songnenensis)、变异盐单胞菌(Halomonas variabilis)、氯酚草螺菌(Herbaspirillum chlorophenolicum)、弗赖森草螺菌(Herbaspirillum frisingense)、希尔特纳氏草螺菌(Herbaspirillum hiltneri)、下哈特草螺菌井亚种(Herbaspirillum huttiense subsp.putei)、葡萄牙草螺菌(Herbaspirillum lusitanum)、居泉赫山单胞菌(Herminiimonas fonticola)、中间氢噬胞菌(Hydrogenophaga intermedia)、假黄氢噬胞菌(Hydrogenophaga pseudoflava)、产酸克雷伯氏菌、蔗糖小迫氏菌(Kosakonia sacchari)、德氏乳杆菌保加利亚亚种(Lactobacillus delbrueckii subsp.bulgaricus)、谦逊乳杆菌(Lactobacillusmodestisalitolerans)、植物乳杆菌阿根图拉特亚种(Lactobacillus plantarumsubsp.argentoratensis)、香坊乳杆菌(Lactobacillus xiangfangensis)、罗塞莉氏列契瓦尼尔氏菌(Lechevalieria roselyniae)、微白伦茨氏菌(Lentzea albida)、加利福尼亚伦茨氏菌(Lentzea californiensis)、肉质明串珠菌(Leuconostoc carnosum)、柠檬色明串珠菌(Leuconostoc citreum)、冷明串珠菌伴气亚种(Leuconostoc gelidumsubsp.gasicomitatum)、肠膜明串珠菌瑞典亚种(Leuconostoc mesenteroidessubsp.suionicum)、潮汐藤黄色单胞菌(Luteimonas aestuarii)、抗生物溶杆菌(Lysobacter antibioticus)、韩国溶杆菌(Lysobacter koreensis)、稻溶杆菌(Lysobacter oryzae)、莫斯科磁螺菌(Magnetospirillum moscoviense)、阿氏海单胞菌(Marinomonas alcarazii)、普利莫耶海单胞菌(Marinomonas primoryensis)、金色马赛菌(Massilia aurea)、济州岛马赛菌(Massilia jejuensis)、京畿马赛菌(Massiliakyonggiensis)、蒂莫内马赛菌(Massilia timonae)、金合欢中慢生根瘤菌(Mesorhizobiumacaciae)、庆笙中慢生根瘤菌(Mesorhizobium qingshengii)、肖恩中慢生根瘤菌(Mesorhizobium shonense)、小羽藓甲基杆菌(Methylobacterium haplocladii)、悬铃木甲基杆菌(Methylobacterium platani)、矢竹甲基杆菌(Methylobacteriumpseudosasicola)、扎氏甲基杆菌(Methylobacterium zatmanii)、氧化微杆菌(Microbacterium oxydan)、猜也蓬府小单胞菌(Micromonospora chaiyaphumensis)、青铜小单孢菌(Micromonospora chalcea)、柠檬小单孢菌(Micromonospora citrea)、科克斯小单孢菌(Micromonospora coxensis)、海胆棕色小单孢菌(Micromonospora echinofusca)、嗜盐小单孢菌(Micromonospora halophytica)、康莱帕克小单孢菌(Micromonosporakangleipakensis)、海栖小单胞(Micromonospora maritima)、黑色小单孢菌(Micromonospora nigra)、绛红产色小单孢菌(Micromonospora purpureochromogene)、根际小单孢菌(Micromonospora rhizosphaerae)、赛利塞斯小单孢菌(Micromonosporasaelicesensis)、地下微枝形杆菌(Microvirga subterranea)、赞比亚微枝形杆菌(Microvirga zambiensis)、河床分枝杆菌(Mycobacterium alvei)、鸟分枝杆菌森林土壤亚种(Mycobacterium avium subsp.silvaticum)、哥伦比亚分枝杆菌(Mycobacteriumcolombiense)、康塞普申分枝杆菌(Mycobacterium conceptionense)、康塞普申分枝杆菌、皮肤疽分枝杆菌(Mycobacterium farcinogenes)、偶发分枝杆菌偶发亚种(Mycobacteriumfortuitum subsp.fortuitum)、古氏分枝杆菌(Mycobacterium goodii)、英苏布里亚分枝杆菌(Mycobacteriuminsubricum)、利泽分枝杆菌(Mycobacterium llatzerense)、新金色分枝杆菌(Mycobacterium neoaurum)、新奥尔良分枝杆菌(Mycobacteriumneworleansense)、大府分枝杆菌(Mycobacterium obuense)、外来分枝杆菌(Mycobacterium peregrinum)、圣保罗拟分枝杆菌(Mycobacterium saopaulense)、脓毒分枝杆菌(Mycobacterium septicum)、赛特分枝杆菌(Mycobacterium setense)、耻垢分枝杆菌(Mycobacterium smegmatis)、微黄奈瑟菌(Neisseria subflava)、丽江诺卡氏菌(Nocardia lijiangensis)、泰国诺卡氏菌(Nocardia thailandica)、吧哈伊姆新鞘氨醇菌(Novosphingobium barchaimii)、解林丹新鞘氨醇菌(Novosphingobiumlindaniclasticum)、解林丹新鞘氨醇菌、马图拉新鞘氨醇菌(Novosphingobiummathurense)、假格里尼翁苍白杆菌(Ochrobactrum pseudogrignonense)、城市土壤草酸杆菌(Oxalicibacterium solurbis)、格氏副伯克霍尔德氏菌(Paraburkholderia glathei)、土地副伯克霍尔德氏菌(Paraburkholderia humi)、吩嗪副伯克霍尔德氏菌(Paraburkholderia phenazinium)、固植副伯克霍尔德氏菌(Paraburkholderiaphytofirmans)、栖白腐菌副伯克霍尔德氏菌(Paraburkholderia sordidicola)、栖土副伯克霍尔德氏菌(Paraburkholderia terricola)、异食副伯克霍尔德氏菌(Paraburkholderia xenovorans)、噬左旋葡萄糖副球菌(Paracoccuslaeviglucosivorans)、人参沼散生杆菌(Patulibacter ginsengiterrae)、红色多形孢菌(Polymorphospora rubra)、泳池产卟啉杆菌(Porphyrobacter colymbi)、空肠普雷沃氏菌(Prevotella jejuni)、产黑素普雷沃氏菌(Prevotella melaninogenica)、痤疮丙酸杆菌长亚种(Propionibacterium acnes subsp.Elongatum)、普通变形杆菌(Proteusvulgaris)、拉氏普罗威登斯菌、食琼脂假交替单胞菌(Pseudoalteromonas agarivorans)、大西洋假交替单胞菌(Pseudoalteromonas atlantica)、栖珊瑚假交替单胞菌(Pseudoalteromonas paragorgicola)、铁角蕨假单胞菌(Pseudomonas asplenii)、亚利桑那州立大学假单胞菌(Pseudomonas asuensis)、食苯假单胞菌(Pseudomonasbenzenivorans)、大麻假单胞菌(Pseudomonas cannabina)、栖白粉藤假单胞菌(Pseudomonas cissicola)、结冰假单胞菌(Pseudomonas congelans)、康氏假单胞菌(Pseudomonas costantinii)、天仙果假单胞菌(Pseudomonas ficuserectae)、弗雷德里克斯堡假单胞菌(Pseudomonas frederiksbergensis)、草假单胞菌(Pseudomonasgraminis)、杰氏假单胞菌(Pseudomonas jessenii)、韩国假单胞菌(Pseudomonaskoreensis)、韩国假单胞菌、昆明假单胞菌(Pseudomonas kunmingensis)、边缘假单胞菌(Pseudomonas marginalis)、霉味假单胞菌(Pseudomonas mucidolens)、人参假单胞菌(Pseudomonas panacis)、杀香鱼假单胞菌(Pseudomonas plecoglossicida)、草假单胞菌(Pseudomonas poae)、假产碱假单胞菌(Pseudomonas pseudoalcaligenes)、恶臭假单胞菌(Pseudomonas putida)、雷氏假单胞菌(Pseudomonas reinekei)、根际假单胞菌(Pseudomonas rhizosphaerae)、硒沉淀假单胞菌(Pseudomonas seleniipraecipitans)、阴城假单胞菌(Pseudomonas umsongensis)、肇东假单胞菌(Pseudomonaszhaodongensis)、嗜丙氨酸假诺卡氏菌(Pseudonocardia alaniniphila)、氧化氨假诺卡氏菌(Pseudonocardia ammonioxydans)、自养假诺卡氏菌(Pseudonocardia autotrophica)、公州假诺卡氏菌(Pseudonocardia kongjuensis)、云南假诺卡氏菌(Pseudonocardiayunnanensis)、土壤假红育菌(Pseudorhodoferax soli)、大田假黄单胞菌(Pseudoxanthomonas daejeonensis)、印度假黄单胞菌(Pseudoxanthomonas indica)、高雄假黄单胞菌(Pseudoxanthomonas kaohsiungensis)、水生嗜冷杆菌(Psychrobacteraquaticus)、北极嗜冷杆菌(Psychrobacter arcticus)、速生嗜冷杆菌(Psychrobacterceler)、居海嗜冷杆菌(Psychrobacter marincola)、海雪嗜冷杆菌(Psychrobacternivimaris)、鄂霍次克海嗜冷杆菌(Psychrobacter okhotskensis)、鄂霍次克海嗜冷杆菌、鱼坊嗜冷杆菌(Psychrobacter piscatorii)、肺嗜冷杆菌(Psychrobacter pulmonis)、人参皂苷转化沙壤土杆菌(Ramlibacter ginsenosidimutans)、日本莱茵海默氏菌(Rheinheimera japonica)、梦曾博格莱茵海默氏菌(Rheinheimera muenzenbergensis)、土壤莱茵海默氏菌(Rheinheimera soli)、唐山莱茵海默氏菌(Rheinheimeratangshanensis)、德克萨斯莱茵海默氏菌(Rheinheimera texasensis)、罗非鱼莱茵海默氏菌(Rheinheimera tilapiae)、阿拉米根瘤菌(Rhizobium alamii)、阿齐布根瘤菌(Rhizobium azibense)、孟加拉核农业研究所根瘤菌(Rhizobium binae)、大田根瘤菌(Rhizobium daejeonense)、植物内生根瘤菌(Rhizobium endophyticum)、豆根瘤菌(Rhizobium etli)、蚕豆根瘤菌(Rhizobium fabae)、弗莱雷氏根瘤菌(Rhizobiumfreirei)、高卢根瘤菌(Rhizobium gallicum)、黄土根瘤菌(Rhizobium loessense)、槐树根根瘤菌(Rhizobium sophoriradicis)、太白山根瘤菌(Rhizobium taibaishanense)、河谷根瘤菌(Rhizobium vallis)、豇豆根瘤菌(Rhizobium vignae)、豇豆根瘤菌、杨凌根瘤菌(Rhizobium yanglingense)、拜科罗尔红球菌(Rhodococcus baikonurensis)、印度国家化学实验室红球菌(Rhodococcus enclensis)、赛登巴赫红育菌(Rhodoferaxsaidenbachensis)、加拿大立克次体(Rickettsia canadensis)、黑龙江立克次体(Rickettsia heilongjiangensis)、霍恩立克次体(Rickettsia honei)、拉乌尔立克次体(Rickettsia raoultii)、水生玫瑰色半光合菌(Roseateles aquatilis)、水生玫瑰色半光合菌、肠道沙门氏菌萨拉姆亚种(Salmonella enterica subsp.salamae)、无花果沙雷氏菌(Serratia ficaria)、鼠耳蝠沙雷氏菌(Serratia myotis)、蝠沙雷氏菌(Serratiavespertilionis)、潮汐希瓦氏菌(Shewanella aestuarii)、脱色希瓦氏菌(Shewanelladecolorationis)、阿见鞘氨醇菌(Sphingobium amiense)、巴氏鞘氨醇菌(Sphingobiumbaderi)、巴萨鞘氨醇菌(Sphingobium barthaii)、氯酚鞘氨醇菌(Sphingobiumchlorophenolicum)、铜抗性鞘氨醇菌(Sphingobiumcupriresistens)、捷克鞘氨醇菌(Sphingobium czechense)、煤灰鞘氨醇菌(Sphingobium fuliginis)、印度鞘氨醇菌(Sphingobiumindicum)、印度鞘氨醇菌、日本鞘氨醇菌(Sphingobium japonicum)、乳糖同化鞘氨醇菌(Sphingobium lactosutens)、独岛鞘氨醇单胞菌(Sphingomonasdokdonensis)、假血鞘氨醇单胞菌(Sphingomonas pseudosanguinis)、智利鞘氨醇盒菌(Sphingopyxis chilensis)、弗莱堡鞘氨醇盒菌(Sphingopyxis fribergensis)、细粒鞘氨醇盒菌(Sphingopyxis granuli)、印度鞘氨醇盒菌(Sphingopyxis indica)、威特弗拉里亚鞘氨醇盒菌(Sphingopyxis witflariensis)、阿涅蒂斯葡萄球菌(Staphylococcusagnetis)、金黄色葡萄球菌金黄色亚种(Staphylococcus aureus subsp.aureus)、表皮葡萄球菌、人葡萄球菌新生霉素脓毒亚种(Staphylococcus hominissubsp.novobiosepticus)、尼泊尔葡萄球菌、腐生葡萄球菌牛亚种(Staphylococcussaprophyticus subsp.bovis)、松鼠葡萄球菌肉亚种(Staphylococcus sciurisubsp.carnaticus)、黑蓝链霉菌(Streptomyces caeruleatus)、雀黄链霉菌(Streptomyces canarius)、上升岛链霉菌(Streptomyces capoamus)、内高加索链霉菌(Streptomyces ciscaucasicus)、灰锈赤链霉菌(Streptomyces griseorubiginosus)、橄榄绿链霉菌(Streptomyces olivaceoviridis)、人参根链霉菌(Streptomycespanaciradicis)、暗绛红链霉菌(Streptomyces phaeopurpureus)、假委内瑞拉链霉菌(Streptomyces pseudovenezuelae)、产抗霉素链霉菌(Streptomycesresistomycificus)、沉积物谭天伟氏菌(Tianweitania sediminis)、微变冢村氏菌(Tsukamurella paurometabola)、广西贪噬菌(Variovorax guangxiensis)、嗜碱福格斯氏菌(Vogesella alkaliphila)、树生黄单胞菌(Xanthomonas arboricola)、地毯草黄单胞菌(Xanthomonas axonopodis)、木薯黄单胞菌(Xanthomonas cassavae)、葫芦科黄单胞菌(Xanthomonas cucurbitae)、蓟黄单胞菌(Xanthomonas cynarae)、生疱黄单胞菌(Xanthomonas euvesicatoria)、草莓黄单胞菌(Xanthomonas fragariae)、加氏黄单胞菌(Xanthomonas gardneri)、穿孔黄单胞菌(Xanthomonas perforans)、豌豆黄单胞菌(Xanthomonas pisi)、杨树黄单胞菌(Xanthomonas populi)、栖血管黄单胞菌(Xanthomonas vasicola)、气生嗜异生质菌(Xenophilus aerolatus)、努米耶尔森氏菌(Yersinia nurmii)、软弱贫养菌(Abiotrophia defectiva)、解氨酸胞菌(Acidocellaaminolytica)、广东不动杆菌(Acinetobacter guangdongensis)、微小不动杆菌(Acinetobacter parvus)、抗辐射不动杆菌(Acinetobacter radioresistens)、土壤不动杆菌(Acinetobacter soli)、变异不动杆菌(Acinetobacter variabilis)、加地夫放线菌(Actinomyces cardiffensis)、牙放线菌(Actinomyces dentalis)、欧洲放线菌(Actinomyces europaeus)、戈氏放线菌(Actinomyces gerencseriae)、革氏放线菌(Actinomyces graevenitzii)、鲍放线菌(Actinomyces haliotis)、约氏放线菌(Actinomyces johnsonii)、马赛放线菌(Actinomyces massiliensis)、麦氏放线菌(Actinomyces meyeri)、麦氏放线菌、内氏放线菌、纽氏放线菌无硝亚种(Actinomycesneuii subsp.anitratus)、溶齿放线菌、口腔放线菌(Actinomyces oris)、苏黎世放线菌(Actinomyces turicensis)、居树皮放线链孢菌、斯氏放线杆菌(Actinotignumschaalii)、柯氏气球菌(Aerococcus christensenii)、脲气球菌(Aerococcus urinae)、黄色气微菌(Aeromicrobium flavum)、马赛气微菌、耽罗国气微菌(Aeromicrobiumtamlense)、沙玛娜气单胞菌(Aeromonas sharmana)、嗜沫凝聚杆菌(Aggregatibacteraphrophilus)、惰性凝聚杆菌(Aggregatibacter segnis)、光神农球菌(Agrococcusbaldri)、食甲基白杆菌(Albibacter methylovorans)、粪产碱菌粪亚种(Alcaligenesfaecalis subsp.faecalis)、拉氏噬冷菌(Algoriphagus ratkowskyi)、橄榄渣碱杆菌(Alkalibacterium olivapovliticus)、海碱杆菌(Alkalibacterium pelagium)、海碱杆菌、灰色异普雷沃氏菌(Alloprevotella rava)、耐金属林杆菌(Alsobactermetallidurans)、卡普利采下水道球菌、维罗纳下水道球菌、生氢厌氧球菌、溶乳厌氧球菌(Anaerococcus lactolyticus)、莫道克厌氧球菌(Anaerococcus murdochii)、八度厌氧球菌(Anaerococcus octavius)、普氏厌氧球菌、阴道厌氧球菌(Anaerococcus vaginalis)、嗜柠檬水杆菌(Aquabacterium citratiphilum)、油水杆菌(Aquabacterium olei)、油水杆菌、微小水杆菌(Aquabacterium parvum)、叔碳水居菌(Aquincola tertiaricarbonis)、蛤仔弓形杆菌(Arcobacter venerupis)、博利登砷球菌(Arsenicicoccus bolidensis)、俄罗斯节杆菌(Arthrobacter russicus)、离中不粘柄菌(Asticcacaulis excentricus)、德尔塔奇异菌(Atopobium deltae)、极小奇异菌(Atopobium parvulum)、龈裂奇异菌(Atopobium rimae)、阴道奇异菌(Atopobium vaginae)、阿尔塔米拉金色单胞菌(Aureimonas altamirensis)、锈金色单胞菌(Aureimonas rubiginis)、稻曲菌(Azospiraoryzae)、稻固氮螺菌(Azospirillum oryzae)、环状芽胞杆菌(Bacillus circulans)、德伦特芽孢杆菌、苛求芽孢杆菌(Bacillus fastidiosus)、列城芽孢杆菌(Bacilluslehensis)、海洋沉积物芽孢杆菌(Bacillus oceanisediminis)、根际芽孢杆菌(Bacillusrhizosphaerae)、斯托普噬菌弧菌(Bacteriovorax stolpii)、凝结拟杆菌(Bacteroidescoagulans)、多氏拟杆菌、脆弱拟杆菌、卵形拟杆菌、粪便拟杆菌、单形拟杆菌、普通拟杆菌、噬菌蛭弧菌(Bdellovibrio bacteriovorus)、外来蛭弧菌(Bdellovibrio exovorus)、摩押别尔纳普氏菌(Belnapia moabensis)、土壤别尔纳普氏菌(Belnapia soli)、汉氏布劳特氏菌、卵形布劳特氏菌、韦氏布劳特氏菌、山黧豆博斯氏菌(Bosea lathyri)、壁画小短杆菌(Brachybacterium fresconis)、小鼠小短杆菌(Brachybacterium muris)、解氨短杆菌(Brevibacterium ammoniilyticum)、干酪短杆菌(Brevibacterium casei)、表皮短杆菌(Brevibacterium epidermidis)、碘短杆菌(Brevibacterium iodinum)、微黄短杆菌(Brevibacterium luteolum)、少食短杆菌(Brevibacterium paucivorans)、松蛾短杆菌(Brevibacterium pityocampae)、血短杆菌(Brevibacterium sanguinis)、黄白短波单胞菌(Brevundimonas albigilva)、缺陷短波单胞菌(Brevundimonas diminuta)、范侃尼特短波单胞菌(Brevundimonas vancanneytii)、土地污泥单胞菌、印度温泉杆菌(Calidifontibacter indicus)、简明弯曲杆菌、纤细弯曲杆菌(Campylobactergracilis)、人弯曲杆菌(Campylobacter hominis)、直肠弯曲杆菌(Campylobacterrectus)、昭和弯曲杆菌(Campylobacter showae)、溶脲弯曲杆菌(Campylobacterureolyticus)、牙龈二氧化碳噬纤维菌、立德贝特二氧化碳噬纤维菌(Capnocytophagaleadbetteri)、黄褐二氧化碳噬纤维菌(Capnocytophaga ochracea)、生痰二氧化碳噬纤维菌(Capnocytophaga sputigena)、人心杆菌(Cardiobacterium hominis)、瓣膜心杆菌(Cardiobacterium valvarum)、广布肉杆菌(Carnobacterium divergens)、疾卡氏(Catonella morbi)、亨氏柄杆菌(Caulobacter henricii)、地下空洞菌(Cavicellasubterranea)、解木聚糖纤维单胞菌(Cellulomonas xylanilytica)、普通纤维弧菌(Cellvibrio vulgaris)、台湾几丁质单胞菌(Chitinimonas taiwanensis)、花生金黄杆菌(Chryseobacterium arachidis)、大清湖金黄杆菌(Chryseobacterium daecheongense)、福尔摩萨金黄杆菌(Chryseobacterium formosense)、福尔摩萨金黄杆菌、格陵兰金黄杆菌、产吲哚金黄杆菌(Chryseobacterium indologenes)、鱼金黄杆菌、湿地金黄杆菌(Chryseobacterium rigui)、茄金黄杆菌(Chryseobacterium solani)、塔克拉玛干金黄杆菌(Chryseobacterium taklimakanense)、解脲金黄杆菌、解脲金黄杆菌、玉米金黄杆菌(Chryseobacterium zeae)、金黄色金黄杆菌(Chryseomicrobium aureum)、鲍管道杆菌(Cloacibacterium haliotis)、诺曼管道杆菌(Cloacibacterium normanense)、诺曼管道杆菌、产气柯林斯菌、反硝化丛毛单胞菌(Comamonas denitrificans)、土生丛毛单胞菌(Comamonas terrigena)、拥挤棒状杆菌、非发酵棒状杆菌嗜脂亚种、产氨棒状杆菌、无枝菌酸棒状杆菌、粘金色棒状杆菌(Corynebacterium aurimucosum)、粘金色棒状杆菌、科伊尔棒状杆菌(Corynebacteriumcoyleae)、坚硬棒状杆菌(Corynebacterium durum)、弗莱堡棒状杆菌(Corynebacterium freiburgense)、灰绿棒状杆菌(Corynebacterium glaucum)、嗜甘氨酸棒状杆菌(Corynebacterium glyciniphilum)、模仿棒状杆菌(Corynebacteriumimitans)、约凯二氏棒状杆菌(Corynebacterium jeikeium)、约凯二氏棒状杆菌、柯氏棒状杆菌(Corynebacterium kroppenstedtii)、亲脂黄色棒状杆菌(Corynebacteriumlipophiloflavum)、马赛棒状杆菌(Corynebacterium massiliense)、乳腺炎棒状杆菌(Corynebacterium mastitidis)、马氏棒状杆菌(Corynebacteriummatruchotii)、极小棒状杆菌、产粘液棒状杆菌(Corynebacteriummucifaciens)、雪貂棒状杆菌(Corynebacterium mustelae)、类真菌棒状杆菌(Corynebacterium mycetoides)、产丙酮酸棒状杆菌(Corynebacterium pyruviciproducens)、模拟棒状杆菌(Corynebacteriumsimulans)、独特棒状杆菌(Corynebacterium singulare)、痰液棒状杆菌(Corynebacterium sputi)、猪心棒状杆菌(Corynebacterium suicordis)、结核硬脂酸棒状杆菌(Corynebacterium tuberculostearicum)、结核硬脂酸棒状杆菌、速噬脲棒状杆菌(Corynebacterium ureicelerivorans)、变异棒状杆菌(Corynebacterium variabile)、青蓝科奇氏游动菌青蓝亚种(Couchioplanes caeruleus subsp.caeruleus)、耐金属贪铜菌、草本短小杆菌(Curtobacterium herbarum)、兴奋性脱氯单胞菌(Dechloromonasagitata)、硬抗射线异常球菌(Deinococcus actinosclerus)、南极异常球菌(Deinococcusantarcticus)、污泥异常球菌(Deinococcus caeni)、无花果异常球菌(Deinococcusficus)、地热异常球菌(Deinococcus geothermalis)、耐辐射异常球菌(Deinococcusradiodurans)、乌鲁木齐异常球菌(Deinococcus wulumuqiensis)、新疆异常球菌(Deinococcus xinjiangensis)、人皮肤杆菌、阴道皮肤杆菌(Dermabacter vaginalis)、西宫皮肤球菌(Dermacoccus nishinomiyaensis)、未定德库菌(Desemzia incerta)、玫瑰沙漠杆菌(Desertibacter roseus)、浑浊戴阿李斯特菌(Dialister invisus)、微好气戴阿李斯特菌(Dialister micraerophilus)、产丙酸戴阿李斯特菌(Dialisterpropionicifaciens)、橙色迪茨氏菌(Dietzia aurantiaca)、连香树迪茨氏菌(Dietziacercidiphylli)、帝汶迪茨氏菌(Dietzia timorensis)、帝汶迪茨氏菌、韩国独岛杆菌(Dokdonella koreensis)、韩国独岛杆菌、懒惰狡诈球菌(Dolosigranulum pigrum)、啮蚀艾肯菌(Eikenella corrodens)、米尔伊丽莎白菌(Elizabethkingia miricola)、海滨埃尔斯特菌(Elstera litoralis)、短稳杆菌(Empedobacter brevis)、气囊水栖菌(Enhydrobacter aerosaccus)、香坊肠杆菌(Enterobacter xiangfangensis)、海水肠球菌(Enterococcus aquimarinus)、粪肠球菌、橄榄肠球菌(Enterococcus olivae)、大黄欧文氏菌、挑剔真杆菌(Eubacterium eligens)、娇弱真杆菌(Eubacteriuminfirmum)、直肠真杆菌、隐藏真杆菌(Eubacterium saphenum)、沟迹真杆菌(Eubacterium sulci)、墨西哥微小杆菌(Exiguobacterium mexicanum)、鼻烟费克蓝姆菌(Facklamia tabacinasalis)、耐盐错红杆菌、大芬戈尔德菌、表皮水蛭素黄杆菌(Flavobacterium cutihirudinis)、耐林丹黄杆菌(Flavobacterium lindanitolerans)、抗性黄杆菌(Flavobacterium resistens)、荚膜弗莱德门氏菌(Friedmanniella capsulata)、具核梭杆菌多形亚种(Fusobacteriumnucleatum subsp.polymorphum)、溶血孪生球菌(Gemella haemolysans)、麻疹孪生球菌(Gemella morbillorum)、犬腭孪生球菌(Gemella palaticanis)、血孪生球菌(Gemellasanguinis)、水生芽殖杆菌(Gemmobacter aquaticus)、污泥芽殖杆菌(Gemmobactercaeni)、金华戈登氏菌(Gordonia jinhuaensis)、柯氏戈登氏菌(Gordoniakroppenstedtii)、食聚异戊二烯戈登氏菌(Gordonia polyisoprenivorans)、食聚异戊二烯戈登氏菌、毗邻颗粒链球菌(Granulicatella adiacens)、雅致颗粒链球菌(Granulicatella elegans)、副流感嗜血杆菌(Haemophilus parainfluenzae)、痰嗜血杆菌(Haemophilus sputorum)、硫化物矿盐单胞菌(Halomonas sulfidaeris)、橙色滑柱菌(Herpetosiphon aurantiacus)、扩展食烃菌(Hydrocarboniphaga effusa)、海海源菌(Idiomarina maris)、按蚊两面神菌(Janibacter anophelis)、霍伊尔两面神菌(Janibacter hoylei)、印度两面神菌(Janibacter indicus)、泥两面神菌(Janibacterlimosus)、瓜两面神菌(Janibacter melonis)、嗜盐咸海鲜球菌(Jeotgalicoccushalophilus)、人类荣凯菌(Jonquetella anthropi)、金湖韩国科学技术院菌(Kaistiageumhonensis)、反硝化金氏菌(Kingella denitrificans)、口腔金氏菌(Kingellaoralis)、产酸克雷伯氏菌、气生诺尔氏菌(Knoellia aerolata)、和平地诺尔氏菌(Knoellia locipacati)、江珧库克菌(Kocuria atrinae)、嗜肉库克菌(Kocuriacarniphila)、克氏库克菌(Kocuria kristinae)、沼泽库克菌(Kocuria palustris)、吐鲁番库克菌(Kocuria turfanensis)、砂毛绒厌氧杆菌(Lachnoanaerobaculum saburreum)、砂毛绒厌氧杆菌、卷曲乳杆菌(Lactobacillus crispatus)、惰性乳杆菌、乳酸乳球菌乳酸亚种(Lactococcus lactis subsp.lactis)、乳酸乳球菌乳酸亚种、鱼乳球菌(Lactococcuspiscium)、济州岛小石球菌(Lapillicoccus jejuensis)、奇异劳特普罗菌(Lautropiamirabilis)、贝利亚德军团菌(Legionella beliardensis)、口颊纤毛菌(Leptotrichiabuccalis)、古德菲勒纤毛菌(Leptotrichia goodfellowii)、赫氏纤毛菌(Leptotrichiahofstadii)、香港纤毛菌(Leptotrichia hongkongensis)、沙氏纤毛菌(Leptotrichiashahii)、特氏纤毛菌(Leptotrichia trevisanii)、韦德纤毛菌、栖土藤黄色单胞菌(Luteimonas terricola)、纺缍形赖氨酸芽孢杆菌(Lysinibacillus fusiformis)、居海绵溶杆菌(Lysobacter spongiicola)、新疆溶杆菌(Lysobacter xinjiangensis)、溶酪大球菌(Macrococcus caseolyticus)、抱川栖大理石菌(Marmoricola pocheonensis)、石渣栖大理石菌(Marmoricola scoriae)、耐碱马赛菌(Massilia alkalitolerans)、耐碱马赛菌、金色马赛菌、折叠马赛菌(Massilia plicata)、蒂莫内马赛菌、拉罗谢尔巨单胞菌(Megamonas rupellensis)、西尔瓦栖热菌(Meiothermus silvanus)、檀国甲基杆菌(Methylobacterium dankookense)、格辛甲基杆菌(Methylobacterium goesingense)、格辛甲基杆菌、伊斯比利亚甲基杆菌(Methylobacterium isbiliense)、咸海鲜甲基杆菌(Methylobacterium jeotgali)、酢浆草甲基杆菌(Methylobacterium oxalidis)、悬铃木甲基杆菌、矢竹甲基杆菌、广泛多用甲基菌(Methyloversatilis universalis)、叶片微杆菌(Microbacterium foliorum)、水热微杆菌(Microbacterium hydrothermale)、水热微杆菌、乳微杆菌(Microbacterium lacticum)、乳微杆菌、产左聚糖微杆菌(Microbacteriumlaevaniformans)、栖沼泽微杆菌(Microbacterium paludicola)、石油微杆菌(Microbacterium petrolearium)、叶际微杆菌(Microbacterium phyllosphaerae)、抗性微杆菌(Microbacterium resistens)、南极微球菌(Micrococcus antarcticus)、科氏微球菌(Micrococcus cohnii)、黄色微球菌(Micrococcus flavus)、里拉微球菌(Micrococcuslylae)、土微球菌(Micrococcus terreus)、橙色小月菌(Microlunatus aurantiacus)、糖原性微白霜菌(Micropruina glycogenica)、气生微枝形杆菌(Microvirga aerilata)、气生微枝形杆菌、地下微枝形杆菌、豇豆微枝形杆菌(Microvirga vignae)、赞比亚微枝形杆菌、好氧反硝化微枝杆菌、胆怯艰难杆菌(Mogibacterium timidum)、亚特兰大莫拉菌(Moraxella atlantae)、黏膜炎莫拉菌(Moraxella catarrhalis)、摩氏摩根氏菌摩根亚种(Morganella morganii subsp.morganii)、耐冷摩根氏菌(Morganellapsychrotolerans)、不解糖默多克菌(Murdochiella asaccharolytica)、亚洲分枝杆菌(Mycobacterium asiaticum)、中部分枝杆菌(Mycobacterium chubuense)、藏红花分枝杆菌(Mycobacterium crocinum)、加地斯分枝杆菌(Mycobacterium gadium)、荷斯坦分枝杆菌(Mycobacterium holsaticum)、伊朗分枝杆菌(Mycobacterium iranicum)、伦巴第分枝杆菌(Mycobacterium longobardum)、新金色分枝杆菌、新金色分枝杆菌、大府分枝杆菌、食琥珀酸阴性球菌(Negativicoccus succinicivorans)、杆状奈瑟菌(Neisseriabacilliformis)、口腔奈瑟菌(Neisseria oralis)、干燥奈瑟菌(Neisseria sicca)、微黄奈瑟菌、艾霍湖涅斯捷连科氏菌(Nesterenkonia lacusekhoensis)、根际涅斯捷连科氏菌(Nesterenkonia rhizosphaerae)、珀瑟芬涅瓦菌(Nevskia persephonica)、分支涅瓦菌(Nevskia ramosa)、盐山尼阿巴菌(Niabella yanshanensis)、潮湿白杆菌(Niveibacterium umoris)、丹羽诺卡氏菌(Nocardia niwae)、泰国诺卡氏菌、嗜琼脂类诺卡氏菌(Nocardioides agariphilus)、稀释类诺卡氏菌(Nocardioides dilutus)、江华岛类诺卡氏菌(Nocardioides ganghwensis)、和顺类诺卡氏菌(Nocardioideshwasunensis)、南海类诺卡氏菌(Nocardioides nanhaiensis)、沉积物类诺卡氏菌(Nocardioides sediminis)、安瓿医院球菌(Nosocomiicoccus ampullae)、软沥青新草螺菌(Noviherbaspirillummalthae)、解林丹新鞘氨醇菌、玫瑰色新鞘氨醇菌(Novosphingobium rosa)、根际苍白杆菌(Ochrobactrum rhizosphaerae)、齿龈欧氏菌(Olsenella uli)、壁鸟氨酸微菌(Ornithinimicrobium murale)、天津鸟氨酸微菌(Ornithinimicrobium tianjinense)、土地稻杆菌(Oryzobacter terrae)、北京奥托氏菌(Ottowia beijingensis)、水原类产碱杆菌(Paenalcaligenes suwonensis)、食琼脂类芽孢杆菌(Paenibacillus agaridevorans)、凤凰类芽孢杆菌(Paenibacillus phoenicis)、解木聚糖类芽孢杆菌(Paenibacillus xylanexedens)、龙沼帕氏杆菌(Paludibacteriumyongneupense)、杓兰泛菌(Pantoea cypripedii)、狄氏副拟杆菌、须芒草副伯克霍尔德氏菌(Paraburkholderia andropogonis)、嗜碱副球菌(Paracoccus alcaliphilus)、狭直副球菌(Paracoccus angustae)、柯居尔氏副球菌(Paracoccus kocurii)、噬左旋葡萄糖副球菌、沉积物副球菌(Paracoccus sediminis)、苦马豆副球菌(Paracoccus sphaerophysae)、耶氏副球菌(Paracoccus yeei)、微小微单胞菌、多鞭毛小土杆菌(Parviterribactermultiflagellatus)、人参沼散生杆菌、水生土地杆菌(Pedobacter aquatilis)、人参土土地杆菌(Pedobacter ginsengisoli)、西溪土土地杆菌(Pedobacter xixiisoli)、黑色消化球菌(Peptococcus niger)、考氏嗜胨菌(Peptoniphilus coxii)、戈巴赫嗜胨菌(Peptoniphilus gorbachii)、兔嗜胨菌、克氏嗜胨菌(Peptoniphilus koenoeneniae)、泪腺嗜胨菌(Peptoniphilus lacrimalis)、厌氧消化链球菌(Peptostreptococcusanaerobius)、口消化链球菌(Peptostreptococcus stomatis)、粪考拉杆菌(Phascolarctobacterium faecium)、嗜血苯基杆菌(Phenylobacterium haematophilum)、昆山苯基杆菌(Phenylobacterium kunshanense)、日勾维多细菌源菌(Pluralibactergergoviae)、多指状多形杆菌(Polymorphobacter multimanifer)、辨野卟啉单胞菌(Porphyromonas bennonis)、牙髓卟啉单胞菌、牙龈卟啉单胞菌、犬齿龈卟啉单胞菌(Porphyromonas gingivicanis)、巴斯特卟啉单胞菌(Porphyromonas pasteri)、鬃狮蜥卟啉单胞菌(Porphyromonas pogonae)、索氏卟啉单胞菌(Porphyromonas somerae)、葡萄聚乙烯醇杆菌(Povalibacter uvarum)、橙色普雷沃氏菌(Prevotella aurantiaca)、巴氏普雷沃氏菌、二路普雷沃氏菌、颊普雷沃氏菌(Prevotella buccae)、口颊普雷沃氏菌(Prevotella buccalis)、粪便普雷沃氏菌、人体普雷沃氏菌(Prevotella corporis)、栖牙普雷沃氏菌(Prevotella denticola)、栖居普雷沃氏菌(Prevotella enoeca)、栖组织普雷沃氏菌(Prevotella histicola)、中间普雷沃氏菌、空肠普雷沃氏菌、空肠普雷沃氏菌、小斑点普雷沃氏菌(Prevotella maculosa)、产黑素普雷沃氏菌、产黑素普雷沃氏菌、彩虹普雷沃氏菌、多形普雷沃氏菌(Prevotella multiformis)、南锡普雷沃氏菌(Prevotellananceiensis)、变黑普雷沃氏菌、口腔普雷沃氏菌(Prevotella oris)、龈炎普雷沃氏菌(Prevotella oulorum)、苍白普雷沃氏菌(Prevotella pallens)、胸膜炎普雷沃氏菌(Prevotella pleuritidis)、解糖普雷沃氏菌(Prevotella saccharolytica)、唾液普雷沃氏菌、沙氏普雷沃氏菌(Prevotella shahii)、蒂莫内普雷沃氏菌(Prevotellatimonensis)、真口腔普雷沃氏菌、产酸丙酸杆菌(Propionibacterium acidifaciens)、痤疮丙酸杆菌痤疮亚种(Propionibacterium acnes subsp.acnes)、痤疮丙酸杆菌痤疮亚种、痤疮丙酸杆菌长亚种、颗粒丙酸杆菌(Propionibacterium granulosum)、嗜淋巴丙酸微菌、弓形丙酸螺菌(Propionispira arcuata)、葡萄牙假动球菌(Pseudokineococcuslusitanus)、铜绿假单胞菌、成都假单胞菌(Pseudomonas chengduensis)、食苯假诺卡氏菌(Pseudonocardia benzenivorans)、波斯湾假红游动菌(Pseudorhodoplanessinuspersici)、血嗜冷杆菌(Psychrobacter sanguinis)、人参皂苷转化沙壤土杆菌、海水莱茵海默氏菌(Rheinheimera aquimaris)、河床根瘤菌(Rhizobium alvei)、大田根瘤菌、拉氏根瘤菌(Rhizobium larrymoorei)、稻根根瘤菌(Rhizobium rhizoryzae)、土壤根瘤菌(Rhizobium soli)、太白山根瘤菌、豇豆根瘤菌、甘氨酸罗纳河杆菌(Rhodanobacterglycinis)、维氏红杆菌(Rhodobacter veldkampii)、印度国家化学实验室红球菌、束红球菌(Rhodococcus fascians)、束红球菌、环脂肪酸红变色菌(Rhodovarius lipocyclicus)、屏东栖溪菌(Rivicola pingtungensis)、食菊粉罗斯拜瑞氏菌、花蜜罗森伯格菌(Rosenbergiella nectarea)、气生玫瑰单胞菌(Roseomonas aerilata)、水生玫瑰单胞菌(Roseomonas aquatica)、粘玫瑰单胞菌(Roseomonas mucosa)、玫瑰色玫瑰单胞菌(Roseomonas rosea)、葡萄酒色玫瑰单胞菌(Roseomonas vinacea)、空气罗斯氏菌(Rothiaaeria)、污水沟罗斯氏菌(Rothia amarae)、龋齿罗斯氏菌(Rothia dentocariosa)、植物内生罗斯氏菌(Rothia endophytica)、产粘液罗斯氏菌(Rothia mucilaginosa)、鼠鼻罗斯氏菌(Rothia nasimurium)、嗜中温微红微菌(Rubellimicrobium mesophilum)、粉红色微红微菌(Rubellimicrobium roseum)、布加拉红色杆菌(Rubrobacter bracarensis)、解纤维素韩国农村振兴厅菌(Rudaea cellulosilytica)、活泼瘤胃球菌、玉米古字状菌(Runellazeae)、直杆糖多孢菌(Saccharopolyspora rectivirgula)、青岛盐水球菌(Salinicoccusqingdaonensis)、韦格斯卡多维亚菌(Scardovia wiggsiae)、人参土沉积物杆状菌(Sediminibacterium ginsengisoli)、阿耳忒弥斯新月形单胞菌(Selenomonasartemidis)、不幸新月形单胞菌(Selenomonas infelix)、有害新月形单胞菌(Selenomonasnoxia)、生痰新月形单胞菌(Selenomonas sputigena)、潮汐希瓦氏菌、卫星肖特沃思氏菌(Shuttleworthia satelles)、穆勒西蒙斯氏菌(Simonsiella muelleri)、气生斯克尔曼氏菌(Skermanella aerolata)、抗锑斯克尔曼氏菌(Skermanella stibiiresistens)、稀疏斯奈克氏菌(Slackia exigua)、新泻孔雀石球菌(Smaragdicoccus niigatensis)、需血斯尼思氏菌(Sneathia sanguinegens)、土壤土壤红杆菌(Solirubrobacter soli)、污泥鞘氨醇杆菌(Sphingobacterium caeni)、大田鞘氨醇杆菌(Sphingobacterium daejeonense)、和田鞘氨醇杆菌(Sphingobacterium hotanense)、京畿鞘氨醇杆菌(Sphingobacteriumkyonggiense)、多食鞘氨醇杆菌(Sphingobacterium multivorum)、杀线虫鞘氨醇杆菌(Sphingobacterium nematocida)、食神鞘氨醇杆菌(Sphingobacterium spiritivorum)、阿见鞘氨醇菌、印度鞘氨醇菌、乳糖同化鞘氨醇菌(S、地下鞘氨醇菌(Sphingobiumsubterraneum)、桌鞘氨醇单胞菌(Sphingomonas abaci)、潮汐鞘氨醇单胞菌(Sphingomonas aestuarii)、加拿大鞘氨醇单胞菌(Sphingomonas canadensis)、大清鞘氨醇单胞菌(Sphingomonas daechungensis)、独岛鞘氨醇单胞菌、海胆状鞘氨醇单胞菌(Sphingomonas echinoides)、居泉鞘氨醇单胞菌(Sphingomonas fonticola)、居泉鞘氨醇单胞菌、福尔摩萨鞘氨醇单胞菌(Sphingomonas formosensis)、路边青鞘氨醇单胞菌(Sphingomonas gei)、韩国鞘氨醇单胞菌(Sphingomonas hankookensis)、韩国鞘氨醇单胞菌、南韩鞘氨醇单胞菌(Sphingomonas koreensis)、京畿鞘氨醇单胞菌(Sphingomonaskyeonggiensis)、砖窑鞘氨醇单胞菌(Sphingomonas laterariae)、至粘鞘氨醇单胞菌(Sphingomonas mucosissima)、寡酚鞘氨醇单胞菌(Sphingomonas oligophenolica)、假血鞘氨醇单胞菌、栖沉积物鞘氨醇单胞菌(Sphingomonas sediminicola)、盐亭鞘氨醇单胞菌(Sphingomonas yantingensis)、云南鞘氨醇单胞菌(Sphingomonas yunnanensis)、印度鞘氨醇盒菌、湿地螺菌(Spirosoma rigui)、嗜中温生孢产醋菌(Sporacetigeniummesophilum)、粘球生孢噬纤维菌(Sporocytophaga myxococcoides)、耳葡萄球菌、表皮葡萄球菌、表皮葡萄球菌、人葡萄球菌新生霉素脓毒亚种、路邓葡萄球菌、佩藤科费尔葡萄球菌(Staphylococcus pettenkoferi)、韩国窄食单胞菌(Stenotrophomonas koreensis)、嗜根窄食单胞菌(Stenotrophomonas rhizophila)、嗜根窄食单胞菌、无乳链球菌、犬链球菌(Streptococcus canis)、嵴链球菌(Streptococcus cristatus)、戈登链球菌、婴儿链球菌、中间链球菌(Streptococcus intermedius)、变异链球菌、寡发酵链球菌(Streptococcus oligofermentans)、口腔链球菌、血链球菌(Streptococcus sanguinis)、以哥念链霉菌(Streptomyces iconiensis)、阳林链霉菌(Streptomyces yanglinensis)、水生居大不里士杆菌(Tabrizicola aquatica)、污泥塔希杆菌(Tahibacter caeni)、福赛坦氏菌(Tannerella forsythia)、沙维尔暖胞菌(Tepidicella xavieri)、温泉温暖单胞菌(Tepidimonas fonticaldi)、藤黄土壤球菌(Terracoccus luteus)、变黄四合球菌(Tessaracoccus flavescens)、嗜热栖热菌(Thermus thermophilus)、沉积物谭天伟氏菌、沉积物谭天伟氏菌、食淀粉密螺旋体(Treponema amylovorum)、栖牙密螺旋体、解卵黄密螺旋体(Treponema lecithinolyticum)、中间密螺旋体(Treponema medium)、耳炎苏黎士菌(Turicella otitidis)、血苏黎世杆菌、嗜寡碳水杆形菌(Undibacteriumoligocarboniphilum)、虾水杆形菌(Undibacterium squillarum)、鲑鱼漫游球菌(Vagococcus salmoninarum)、坎布里亚弯曲短杆菌、梅氏弧菌(Vibrio metschnikovii)、万寿菊黄色杆菌(Xanthobacter tagetidis)、气生嗜异生质菌、抗砷嗜异生质菌(Xenophilus arseniciresistens)、橙色云微所菌(Yimella lutea)、白齐默曼氏菌(Zimmermannella alba)、双裂齐默曼氏菌(Zimmermannella bifidahe)或污泥动胶菌(Zoogloea caeni)。
在其他实施方案中,靶标细菌细胞为通常存在于阴道微生物群中的那些,并且非限制性地为抗病毒不动杆菌(Acinetobacter antiviralis)、鲍曼不动杆菌、醋酸钙不动杆菌(Acinetobacter calcoaceticus)、约氏不动杆菌、马赛放线棒菌(Actinobaculummassiliense)、沙氏放线棒菌(Actinobaculum schaalii)、欧洲放线菌、革氏放线菌、以色列放线菌、麦氏放线菌、内氏放线菌、纽氏放线菌、溶齿放线菌、苏黎世放线菌、泌尿生殖器放线菌(Actinomyces urogenitalis)、粘放线菌(Actinomyces viscosus)、柯氏气球菌、脲气球菌、草绿色气球菌(Aerococcus viridans)、鳗鱼气单胞菌、杀鲑气单胞菌(Aeromonassalmonicida)、马赛阿菲普菌(Afipia massiliensis)、根癌农杆菌(Agrobacteriumtumefaciens)、水生噬冷菌(Algoriphagus aquatilis)、奥丁另类弧菌(Aliivibriowodanis)、芬氏别样杆菌、耳炎差异球菌(Alloiococcus otitis)、坦纳异普雷沃氏菌(Alloprevotella tannerae)、广栖异斯卡多维亚菌、食环氧化物交替红色杆菌(Altererythrobacter epoxidivorans)、草酸盐嗜氨菌(Ammoniphilus oxalaticus)、京畿羊膜杆菌(Amnibacterium kyonggiense)、生氢厌氧球菌、溶乳厌氧球菌、莫道克厌氧球菌、肥胖症相关厌氧球菌(Anaerococcus obesiensis)、普氏厌氧球菌、四联厌氧球菌(Anaerococcus tetradius)、阴道厌氧球菌、成双厌氧球状菌(Anaeroglobus geminatus)、普西诺无氧芽孢杆菌(Anoxybacillus pushchinoensis)、微小水杆菌、海豹隐秘杆菌(Arcanobacterium phocae)、金黄节杆菌(Arthrobacter aurescens)、离中不黏柄菌、微小奇异菌(Atopobium minutum)、极小奇异菌、龈裂奇异菌、阴道奇异菌、鸡禽杆菌(Avibacterium gallinarum)、居酸芽孢杆菌(Bacillus acidicola)、深褐芽孢杆菌(Bacillus atrophaeus)、蜡状芽孢杆菌、食物芽孢杆菌(Bacillus cibi)、科阿韦拉芽孢杆菌(Bacillus coahuilensis)、开目芽孢杆菌(Bacillus gaemokensis)、甲醇芽孢杆菌(Bacillus methanolicus)、奥列仑芽孢杆菌(Bacillus oleronius)、短小芽孢杆菌、沙氏芽孢杆菌(Bacillus shackletonii)、耐热孢子芽孢杆菌(Bacillus sporothermodurans)、枯草芽孢杆菌、和光芽孢杆菌(Bacillus wakoensis)、魏恩施蒂芬芽孢杆菌(Bacillusweihenstephanensis)、巴氏拟杆菌(Bacteroides barnesiae)、凝结拟杆菌、多氏拟杆菌、粪拟杆菌、福塞斯拟杆菌(Bacteroides forsythus)、脆弱拟杆菌、北拟杆菌、卵形拟杆菌、萨利尔斯氏拟杆菌、粪便拟杆菌、单形拟杆菌、普通拟杆菌、溶木聚糖拟杆菌、产动胶拟杆菌(Bacteroides zoogleoformans)、居肠巴恩斯氏菌(Barnesiella viscericola)、细胞分子生物学中心巴尔加瓦氏菌(Bhargavaea cecembensis)、青春双歧杆菌、双歧双歧杆菌、短双歧杆菌、齿双歧杆菌、长双歧杆菌婴儿亚种(Bifidobacterium logum subsp.infantis)、长双歧杆菌、假小链双歧杆菌、史卡杜维双歧杆菌(Bifidobacterium scardovii)、沃氏嗜胆菌、氢营养布劳特氏菌、卵形布劳特氏菌、生产布劳特氏菌、粪小短杆菌(Brachybacteriumfaecium)、大豆慢生根瘤菌、麦埃二氏短杆菌(Brevibacterium mcbrellneri)、耳炎短杆菌(Brevibacterium otitidis)、少食短杆菌、缓慢布雷德菌(Bulleidia extructa)、真菌伯克霍尔德氏菌(Burkholderia fungorum)、解酚伯克霍尔德氏菌(Burkholderiaphenoliruptix)、解糖热解纤维素菌(Caldicellulosiruptor saccharolyticus)、台湾热单胞菌(Caldimonas taiwanensis)、纤细弯曲杆菌、人弯曲杆菌、痰弯曲杆菌(Campylobacter sputorum)、溶脲弯曲杆菌、黄褐二氧化碳噬纤维菌、人心杆菌、疾卡氏菌、沙眼衣原体、流产嗜衣原体(Chlamydophila abortus)、粗柄软骨真菌(Chondromycesrobustus)、水生金黄杆菌(Chryseobacterium aquaticum)、杨氏柠檬酸杆菌、诺曼管道杆菌、卡文迪许梭菌(Clostridium cavendishii)、狗肠梭菌(Clostridium colicanis)、济州岛梭菌(Clostridium jejuense)、产气荚膜梭菌、多枝梭菌、索氏梭菌(Clostridiumsordellii)、绿色梭菌(Clostridium viride)、土生丛毛单胞菌、拥挤棒状杆菌、阑尾炎棒状杆菌(Corynebacterium appendicis)、科伊尔棒状杆菌、解葡糖醛酸棒状杆菌(Corynebacterium glucuronolyticum)、谷氨酸棒状杆菌(Corynebacteriumglutamicum)、约凯二氏棒状杆菌、柯氏棒状杆菌、亲脂黄色棒状杆菌、极小棒状杆菌、粘液棒状杆菌、酒曲棒状杆菌(Corynebacterium nuruki)、假生殖道棒状杆菌(Corynebacterium pseudogenitalium)、产丙酮酸棒状杆菌、独特棒状杆菌、纹带棒状杆菌(Corynebacterium striatum)、结核硬脂酸棒状杆菌、干燥棒状杆菌、嗜冷冷杆菌(Cryobacterium psychrophilum)、萎蔫短小杆菌、痤疮皮肤杆菌、贪婪皮肤杆菌(Cutibacterium avidum)、解木聚糖噬纤维菌(Cytophaga xylanolytica)、嗜放射异常球菌(Deinococcus radiophilus)、鹤羽田戴尔福特菌(Delftia tsuruhatensis)、脱硫脱硫弧菌(Desulfovibrio desulfuricans)、浑浊戴阿李斯特菌、微好气戴阿李斯特菌、侵肺戴阿李斯特菌(Dialister pneumosintes)、产丙酸戴阿李斯特菌、菊花迪克氏菌(Dickeyachrysanthemi)、长链多尔氏菌、迟缓埃格特菌、链状埃格斯氏菌(Eggerthiacatenaformis)、啮蚀艾肯菌、气囊水栖菌、阿氏肠杆菌、阴沟肠杆菌、鸟肠球菌(Enterococcus avium)、耐久肠球菌、粪肠球菌、屎肠球菌、肠道肠球菌(Enterococcushirae)、桃色欧文氏菌(Erwinia persicina)、大黄欧文氏菌、托利多欧文氏菌(Erwiniatoletana)、大肠埃希氏菌、费格森埃希氏菌(Escherichia fergusonii)、短真杆菌(Eubacterium brachy)、挑剔真杆菌、纠缠真杆菌(Eubacterium nodatum)、直肠真杆菌、隐藏真杆菌、惰性真杆菌、沟迹真杆菌、尤氏真杆菌(Eubacterium yurii)、乙酰微小杆菌(Exiguobacterium acetylicum)、懒惰费克蓝姆菌(Facklamia ignava)、普氏栖粪杆菌、龈沟产线菌(Filifactor alocis)、大芬戈尔德菌、刚氏梭杆菌、具核梭杆菌、牙周梭杆菌、阴道加德纳菌(Gardnerella vaginalis)、不解糖孪生球菌(Gemella asaccharolytica)、伯氏孪生球菌(Gemella bergeri)、溶血孪生球菌、血孪生球菌、嗜热脂肪土芽孢杆菌(Geobacillus stearothermophilus)、热小链土芽孢杆菌(Geobacillus
thermocatenulatus)、热葡糖苷酶土芽孢杆菌(Geobacillus
thermoglucosidasius)、格比克土杆菌(Geobacter grbiciae)、雅致颗粒链球菌、杜克雷嗜血杆菌(Haemophilus ducreyi)、溶血嗜血杆菌(Haemophilus haemolyticus)、副溶血嗜血杆菌(Haemophilus parahaemolyticus)、副流感嗜血杆菌、蜂房哈夫尼菌、南方盐单胞菌、福西亚盐单胞菌(Halomonas phoceae)、美丽盐单胞菌(Halomonas venusta)、瑟罗佩奇卡草螺菌(Herbaspirillum seropedicae)、深蓝紫色杆菌(Janthinobacteriumlividum)、人类荣凯菌、肉芽肿克雷伯氏菌(Klebsiella granulomatis)、产酸克雷伯氏菌、肺炎克雷伯氏菌、嗜酸乳杆菌、食淀粉乳杆菌(Lactobacillus amylovorus)、短乳杆菌、人阴道乳杆菌(Lactobacillus coleohominis)、卷曲乳杆菌、弯曲乳杆菌、德氏乳杆菌、发酵乳杆菌、格氏乳杆菌、瑞士乳杆菌、惰性乳杆菌、詹氏乳杆菌(Lactobacillus jensenii)、约氏乳杆菌、卡利克斯镇乳杆菌(Lactobacillus kalixensis)、开菲尔多糖乳杆菌(Lactobacillus kefiranofaciens)、泡菜乳杆菌(Lactobacillus kimchicus)、北里乳杆菌(Lactobacillus kitasatonis)、粘膜乳杆菌(Lactobacillus mucosae)、面包乳杆菌(Lactobacillus panis)、副干酪乳杆菌、植物乳杆菌、桥乳杆菌(Lactobacillus pontis)、罗伊氏乳杆菌、鼠李糖乳杆菌、唾液乳杆菌、厄尔纳拉乳杆菌、阴道乳杆菌、乳酸乳球菌(Lactococcus lactis)、口颊纤毛菌、肉质明串珠菌、柠檬色明串珠菌、大蒜明串珠菌(Leuconostoc garlicum)、乳酸明串珠菌、肠膜明串珠菌、韩国生命工学研究院赖氨酸单胞菌(Lysinimonas kribbensis)、吲哚马吉杆菌(Mageeibacillus indolicus)、东方海洋杆菌(Maribacter orientalis)、变形海单胞菌(Marinomonas protea)、海岛海螺菌(Marinospirilluminsulare)、蒂莫内马赛菌、埃氏巨球形菌(Megasphaera elsdenii)、微坚果形巨球形菌(Megasphaera micronuciformis)、紫穗槐中慢生根瘤菌(Mesorhizobiumamorphae)、耐辐射甲基杆菌(Methylobacterium radiotolerans)、多用甲基娇养杆菌(Methylotenera versatilis)、嗜盐微杆菌(Microbacterium halophilum)、藤黄微球菌、乐园小土居菌(Microterricola viridarii)、克氏动弯杆菌(Mobiluncus curtisii)、羞怯动弯杆菌(Mobiluncus mulieris)、胆怯艰难杆菌、甘油穆尔氏菌(Moorella glycerini)、奥斯陆莫拉菌(Moraxella osloensis)、摩氏摩根氏菌、产吲哚莫利氏菌(Moryellaindoligenes)、不解糖默多克菌、肠支原体(Mycoplasma alvi)、生殖道支原体(Mycoplasmagenitalium)、人支原体(Mycoplasma hominis)、小鼠支原体(Mycoplasma muris)、唾液支原体(Mycoplasma salivarium)、食琥珀酸阴性球菌、黄色奈瑟菌(Neisseria flava)、淋病奈瑟菌、粘奈瑟菌(Neisseria mucosa)、微黄奈瑟菌、分支涅瓦菌、土壤涅瓦菌(Nevskiasoli)、嗜碱解腈菌、内脏臭杆菌、尿道寡养杆菌(Oligella urethralis)、齿龈欧氏菌、解淀粉类芽孢杆菌(Paenibacillus amylolyticus)、腐殖质类芽孢杆菌(Paenibacillushumicus)、饲料类芽孢杆菌(Paenibacillus pabuli)、帕萨迪纳类芽孢杆菌(Paenibacillus pasadenensis)、松木类芽孢杆菌(Paenibacillus pini)、强壮类芽孢杆菌(Paenibacillus validus)、成团泛菌(Pantoea agglomerans)、粪副拟杆菌、石竹副伯克霍尔德氏菌(Paraburkholderia caryophylli)、耶氏副球菌、脓肿副链霉菌(Parastreptomyces abscessus)、微小微单胞菌、甜菜维管果胶杆菌(Pectobacteriumbetavasculorum)、胡萝卜软腐果胶杆菌(Pectobacteriumcarotovorum)、乳酸片球菌、耐乙醇片球菌(Pediococcus ethanolidurans)、冲积地土地杆菌(Pedobacter alluvionis)、完州土地杆菌(Pedobacter wanjuense)、水生污泥单胞菌(Pelomonas aquatica)、黑色消化球菌、不解糖嗜胨菌(Peptoniphilus asaccharolyticus)、戈巴赫嗜胨菌、兔嗜胨菌、吲哚嗜胨菌(Peptoniphilus indolicus)、泪嗜胨菌、马赛嗜胨菌(Peptoniphilusmassiliensis)、厌氧消化链球菌、马赛消化链球菌(Peptostreptococcus massiliae)、口消化链球菌、狭小发光杆菌(Photobacterium angustum)、嗜冷发光杆菌(Photobacteriumfrigidiphilum)、明亮发光杆菌(Photobacterium phosphoreum)、不解糖卟啉单胞菌、辨野卟啉单胞菌(Porphyromonas bennonis)、卡氏卟啉单胞菌(Porphyromonas catoniae)、牙髓卟啉单胞菌、牙龈卟啉单胞菌、索氏卟啉单胞菌、上野卟啉单胞菌、羊膜普雷沃氏菌(Prevotella amnii)、巴氏普雷沃氏菌、卑尔根普雷沃氏菌(Prevotella bergensis)、二路普雷沃氏菌、颊普雷沃氏菌、口颊普雷沃氏菌、彩色普雷沃氏菌(Prevotella colorans)、粪便普雷沃氏菌、人体普雷沃氏菌、牙普雷沃氏菌、栖牙普雷沃氏菌、解糖胨普雷沃氏菌(Prevotella disiens)、中间普雷沃氏菌、洛氏普雷沃氏菌(Prevotella loescheii)、马氏普雷沃氏菌(Prevotella marshii)、产黑素普雷沃氏菌、彩虹普雷沃氏菌、变黑普雷沃氏菌、口腔普雷沃氏菌、胸膜炎普雷沃氏菌、栖瘤胃普雷沃氏菌(Prevotella ruminicola)、沙氏普雷沃氏菌、粪普雷沃氏菌、蒂莫内普雷沃氏菌、真口腔普雷沃氏菌、嗜淋巴丙酸杆菌、奇异变形杆菌、嗜松香烷假单胞菌(Pseudomonas abietaniphila)、铜绿假单胞菌、扁桃假单胞菌(Pseudomonas amygdali)、产氮假单胞菌(Pseudomonas azotoformans)、绿叶假单胞菌(Pseudomonas chlororaphis)、夸特罗谢内加斯假单胞菌(Pseudomonascuatrocienegasensis)、荧光假单胞菌(Pseudomonas fluorescens)、黄褐假单胞菌(Pseudomonas fulva)、浅黄假单胞菌(Pseudomonas lutea)、霉味假单胞菌、食油假单胞菌(Pseudomonas oleovorans)、东方假单胞菌(Pseudomonas orientalis)、假产碱假单胞菌、嗜冷假单胞菌(Pseudomonas psychrophila)、恶臭假单胞菌、伴黄假单胞菌(Pseudomonassynxantha)、丁香假单胞菌(Pseudomonas syringae)、托拉氏假单胞菌(Pseudomonastolaasii)、丙酸假丙酸杆菌(Pseudopropionibacterium propionicum)、水生拉恩氏菌(Rahnella aquatilis)、皮氏罗尔斯通氏菌、茄科罗尔斯通氏菌(Ralstoniasolanacearum)、居植物拉乌尔菌(Raoultella planticola)、胡萝卜根杆菌(Rhizobacterdauci)、豆根瘤菌、束红球菌(Rhodococcus fascians)、沼泽红假单胞菌(Rhodopseudomonas palustris)、肠道罗斯拜瑞氏菌、食菊粉罗斯拜瑞氏菌、产粘液罗斯氏菌、布氏瘤胃球菌、活泼瘤胃球菌、扭链瘤胃球菌、凯迪血杆菌(Sanguibacter keddieii)、鲑色沉积物杆状菌(Sediminibacterium salmoneum)、牛新月形单胞菌(Selenomonasbovis)、居泉沙雷氏菌(Serratia fonticola)、液化沙雷氏菌(Serratia liquefaciens)、粘质沙雷氏菌、海藻希瓦氏菌(Shewanella algae)、亚马逊希瓦氏菌(Shewanellaamazonensis)、波伊德氏志贺氏菌(Shigella boydii)、宋内志贺氏菌、稀疏斯奈克氏菌、羊膜斯尼思氏菌(Sneathia amnii)、需血斯尼思氏菌、莫尔雷单独杆菌(Solobacteriummoorei)、纤维堆囊菌(Sorangium cellulosum)、阿见鞘氨醇菌、日本鞘氨醇菌、矢野氏鞘氨醇菌(Sphingobium yanoikuyae)、维氏鞘氨醇单胞菌(Sphingomonas wittichii)、海水芽孢八叠球菌(Sporosarcina aquimarina)、金黄色葡萄球菌、耳葡萄球菌、头葡萄球菌(Staphylococcus capitis)、表皮葡萄球菌、溶血葡萄球菌(Staphylococcushaemolyticus)、人葡萄球菌(Staphylococcus hominis)、路邓葡萄球菌、腐生葡萄球菌、施氏葡萄球菌(Staphylococcus schleiferi)、猿猴葡萄球菌(Staphylococcus simiae)、模拟葡萄球菌(Staphylococcus simulans)、沃氏葡萄球菌(Staphylococcus warneri)、嗜麦芽窄食单胞菌、食醋窄氧杆菌(Stenoxybacter acetivorans)、无乳链球菌、咽峡炎链球菌、澳大利亚链球菌、马链球菌、解没食子酸链球菌(Streptococcus gallolyticus)、婴儿链球菌、中间链球菌、巴黎链球菌、海洋哺乳动物链球菌(Streptococcus marimammalium)、缓症链球菌、变异链球菌、口腔链球菌、副血链球菌、海豹链球菌(Streptococcus phocae)、假肺炎链球菌(Streptococcus pseudopneumoniae)、唾液链球菌、血链球菌、嗜热链球菌、沃兹沃斯萨特氏菌、福赛坦氏菌、食芳烃土地嗜血杆菌(Terrahaemophilus aromaticivorans)、栖牙密螺旋体、嗜麦芽糖密螺旋体(Treponema maltophilum)、微小密螺旋体(Treponemaparvum)、文氏密螺旋体(Treponema vincentii)、伯尔纳德储珀菌(Trueperellabernardiae)、耳炎苏黎士菌、微小脲原体(Ureaplasma parvum)、解脲脲原体、坎布里亚弯曲短杆菌、奇特贪噬菌(Variovorax paradoxus)、非典型韦荣菌、殊异韦荣菌、蒙彼利埃韦荣菌(Veillonella montpellierensis)、小韦荣菌、普氏枝芽孢杆菌(Virgibacillusproomii)、沙地绿芽孢杆菌(Viridibacillus arenosi)、田地绿芽孢杆菌(Viridibacillusarvi)、食物魏斯氏菌(Weissella cibaria)、土壤魏斯氏菌(Weissella soli)、野油菜黄单胞菌(Xanthomonas campestris)、生疱黄单胞菌(Xanthomonas vesicatoria)、褐藻卓贝尔氏菌(Zobellia laminariae)或生枝动胶菌(Zoogloea ramigera)。
在一个实施方案中,靶标细菌为大肠埃希氏菌。
因此,用于制备细菌递送媒介物的细菌噬菌体,以及随后的细菌递送媒介物,可靶向(例如特异性地靶向)来自任何一个或多个上述细菌属和/或种的细菌细胞,以特异性地递送感兴趣的有效载荷。
在一个实施方案中,靶标细菌为致病性细菌。靶标细菌可为毒力细菌。
目标细菌可为抗菌抗性细菌,包括选自产生超广谱β-内酰胺酶(ESBL)大肠埃希氏菌、ESBL肺炎克雷伯氏菌、万古霉素抗性肠球菌属(VRE)、甲氧西林抗性金黄色葡萄球菌(MRSA)、多药抗性(MDR)鲍曼不动杆菌、MDR肠杆菌属物种及其组合的那些细菌。靶标细菌可选自产生超广谱β-内酰胺酶(ESBL)的大肠埃希氏菌菌株。在特定实施方案中,所述靶标细菌为ESBL大肠埃希氏菌和/或ESBL肺炎克雷伯氏菌。
或者,靶标细菌可为给定物种的微生物组的细菌,包括人类微生物群的细菌。
本公开涉及含有如本文所述的有效载荷的细菌递送媒介物。细菌递送媒介物一般制备自细菌病毒。一般选择细菌递送媒介物以便能够将有效载荷引入到靶标细菌中。
本文公开的细菌递送媒介物可衍生自其的细菌病毒包括细菌噬菌体。任选地,细菌噬菌体选自有尾噬菌体(Caudovirales)目,其基于Krupovic等人,Arch Virol,2015的分类法由肌尾噬菌体(Myoviridae)科、短尾噬菌体(Podoviridae)科、长尾噬菌体(Siphoviridae)科和埃凯曼病毒(Ackermannviridae)科组成。
细菌噬菌体可选自肌尾噬菌体科(非限制性地比如以下属:Cp220病毒、Cp8病毒、Ea214病毒、Felixo1病毒、Moogle病毒、Susp病毒、Hp1病毒、P2病毒、Kay病毒、P100病毒、Silvia病毒、Spo1病毒、Tsarbomba病毒、Twort病毒、Cc31病毒、Jd18病毒、Js98病毒、Kp15病毒、Moon病毒、Rb49病毒、Rb69病毒、S16病毒、Schizot4病毒、Sp18病毒、T4病毒、Cr3病毒、Se1病毒、V5病毒、Abouo病毒、Agate病毒、Agrican357病毒、Ap22病毒、Arv1病毒、B4病毒、Bastille病毒、Bc431病毒、Bcep78病毒、Bcepmu病毒、Biquarta病毒、Bxz1病毒、Cd119病毒、Cp51病毒、Cvm10病毒、Eah2病毒、El病毒、Hapuna病毒、Jimmer病毒、Kpp10病毒、M12病毒、Machina病毒、Martha病毒、Msw3病毒、Mu病毒、Myohalo病毒、Nit1病毒、P1病毒、Pakpuna病毒、Pbuna病毒、Phikz病毒、Rheph4病毒、Rsl2病毒、Rsluna病毒、Secunda5病毒、Sep1病毒、Spn3病毒、Svuna病毒、Tg1病毒、Vhml病毒和Wph病毒)。
细菌噬菌体可选自短尾噬菌体科(非限制性地比如以下属:Fri1病毒、Kp32病毒、Kp34病毒、Phikmv病毒、Prado病毒、Sp6病毒、T7病毒、Cp1病毒、P68病毒、Phi29病毒、Nona33病毒、Pocj病毒、Tl2011病毒、Bcep22病毒、Bpp1病毒、Cba41病毒、Dfl12病毒、Ea92病毒、Epsilon15病毒、F116病毒、G7c病毒、Jwalpha病毒、Kf1病毒、Kpp25病毒、Lit1病毒、Luz24病毒、Luz7病毒、N4病毒、Nonana病毒、P22病毒、Page病毒、Phieco32病毒、Prtb病毒、Sp58病毒、Una961病毒和Vp5病毒)。
细菌噬菌体可选自长尾噬菌体科(非限制性地比如以下属:Cam病毒、Lika病毒、R4病毒、Acadian病毒、Cooper病毒、Pg1病毒、Pipefish病毒、Rosebush病毒、Brujita病毒、Che9c病毒、Hawkeye病毒、Plot病毒、Jersey病毒、K1g病毒、Sp31病毒、Lmd1病毒、Una4病毒、Bongo病毒、Rey病毒、Butters病毒、Charlie病毒、Redi病毒、Baxter病毒、Nymphadora病毒、Bignuz病毒、Fishburne病毒、Phayonce病毒、Kp36病毒、Rogue1病毒、Rtp病毒、T1病毒、Tls病毒、Ab18病毒、Amigo病毒、Anatole病毒、Andromeda病毒、Attis病毒、Barnyard病毒、Bernal13病毒、Biseptima病毒、Bron病毒、C2病毒、C5病毒、Cba181病毒、Cbast病毒、Ceci病毒、Che8病毒、Chi病毒、Cjw1病毒、Corndog病毒、Cronus病毒、D3112病毒、D3病毒、Decurro病毒、Demosthenes病毒、Doucette病毒、E125病毒、Eiau病毒、Ff47病毒、Gaia病毒、Giles病毒、Gordon病毒、Gordtnk病毒、Harrison病毒、Hk578病毒、Hk97病毒、Jenst病毒、Jwx病毒、Kellezio病毒、Korra病毒、L5病毒、lambda病毒、Laroye病毒、Liefie病毒、Marvin病毒、Mudcat病毒、N15病毒、Nonag病毒、Np1病毒、Omega病毒、P12002病毒、P12024病毒、P23病毒、P70病毒、Pa6病毒、Pamx74病毒、Patience病毒、Pbi1病毒、Pepy6病毒、Pfr1病毒、Phic31病毒、Phicbk病毒、Phieta病毒、Phifel病毒、Phijl1病毒、Pis4a病毒、Psa病毒、Psimuna病毒、Rdjl病毒、Rer2病毒、Sap6病毒、Send513病毒、Septima3病毒、Seurat病毒、Sextaec病毒、Sfi11病毒、Sfi21dt1病毒、Sitara病毒、Sk1病毒、Slash病毒、Smoothie病毒、Soups病毒、Spbeta病毒、Ssp2病毒、T5病毒、Tank病毒、Tin2病毒、Titan病毒、Tm4病毒、Tp21病毒、Tp84病毒、Tria病毒、Trigintaduo病毒、Vegas病毒、Vendetta病毒、Wbeta病毒、Wildcat病毒、Wizard病毒、Woes病毒、Xp10病毒、Ydn12病毒和Yua病毒)。
细菌噬菌体可选自埃凯曼病毒科(非限制性地比如以下属:Ag3病毒、Limestone病毒、Cba120病毒和Vi1病毒)。
任选地,细菌噬菌体不为有尾噬菌体目的一部分,而是来自具有未指定目的科,非限制性地比如以下科:复层噬菌体科(Tectiviridae)(比如以下属:甲型复层噬菌体属(Alphatectivirus)、乙型复层噬菌体属(Betatectivirus))、覆盖噬菌体科(Corticoviridae)(比如以下属:覆盖噬菌体属(Corticovirus))、丝状噬菌体科(Inoviridae)(比如以下属:纤维噬菌体属(Fibrovirus)、束带噬菌体属(Habenivirus)、丝状噬菌体属(Inovirus)、线状噬菌体属(Lineavirus)、短杆状噬菌体属(Plectrovirus)、马毛噬菌体属(Saetivirus)、蝙蝠噬菌体属(Vespertiliovirus))、囊状噬菌体科(Cystoviridae)(比如以下属:囊状噬菌体属(Cystovirus))、光滑噬菌体科(Leviviridae)(比如以下属:异光滑噬菌体属(Allolevivirus)、光滑噬菌体属(Levivirus))、微小噬菌体科(Microviridae)(比如以下属:α3微小噬菌体属、G4微小噬菌体属、Phix174微小噬菌体属、蛭弧菌微小噬菌体属(Bdellomicrovirus)、衣原体微小噬菌体属(Chlamydiamicrovirus)、螺原体微小噬菌体属(Spiromicrovirus))和原体噬菌体科(Plasmaviridae)(比如以下属:原体噬菌体属(Plasmavirus))。
任选地,细菌噬菌体靶向的古细菌并不是尾噬菌体目的一部分,而是来自具有未指定目的科,非限制性地比如:瓶状噬菌体科(Ampullaviridae)、微小纺锤形噬菌体科(FuselloViridae)、球状病毒科(Globuloviridae)、微滴形噬菌体科(Guttaviridae)、脂毛噬菌体科(Lipothrixviridae)、多形性包膜病毒科(Pleolipoviridae)、竿形噬菌体科(Rudiviridae)、盐末端蛋白噬菌体属(Salterprovirus)和双尾病毒科(Bicaudaviridae)。
以下段落中呈现了细菌属及其已知宿主特异性细菌病毒的非详尽列表。作为非限制性实例,本文公开的嵌合RBP和/或重组gpJ蛋白和/或重组gpH蛋白以及细菌递送媒介物可设计改造自以下噬菌体。括号中表示同义词和拼写变体。同音异义词的重复与其出现频率一样高(例如D、D、d)。未命名的噬菌体通过在其属旁边的“NN”指示,并且其编号在括号中给出。
属放线菌属的细菌可由以下噬菌体感染:Av-I、Av-2、Av-3、BF307、CTl、CT2、CT3、CT4、CT6、CT7、CT8和1281。
属气单胞菌属的细菌可由以下噬菌体感染:AA-I、Aeh2、N、PMl、TP446、3、4、11、13、29、31、32、37、43、43-10T、51、54、55R.1、56、56RR2、57、58、59.1、60、63、Aehl、F、PM2、1、25、31、40RR2.8t、(同义词=44R)、(同义词=44RR2.8t)、65、PM3、PM4、PM5和PM6。
属芽孢杆菌属的细菌可由以下噬菌体感染:A、aizl、Al-K-I、B、BCJAl、BCl、BC2、BLLl、BLl、BP142、BSLl、BSL2、BSl、BS3、BS8、BS15、BS18、BS22、BS26、BS28、BS31、BS104、BS105、BS106、BTB、B1715V1、C、CK-I、Coll、Corl、CP-53、CS-I、CSi、D、D、D、D5、entl、FP8、FP9、FSi、FS2、FS3、FS5、FS8、FS9、G、GH8、GT8、GV-I、GV-2、GT-4、g3、gl2、gl3、gl4、gl6、gl7、g21、g23、g24、g29、H2、kenl、KK-88、Kuml、Kyul、J7W-1、LP52、(同义词=LP-52)、L7、Mexl、MJ-I、mor2、MP-7、MPlO、MP12、MP14、MP15、Neol、N°2、N5、N6P、PBCl、PBLA、PBPl、P2、S-a、SF2、SF6、Shal、Sill、SP02、(同义词=ΦSPP1)、SPβ、STI、STi、SU-Il、t、TbI、Tb2、Tb5、TbIO、Tb26、Tb51、Tb53、Tb55、Tb77、Tb97、Tb99、Tb560、Tb595、Td8、Td6、Tdl5、TgI、Tg4、Tg6、Tg7、Tg9、TgIO、TgIl、Tgl3、Tgl5、Tg21、Tinl、Tin7、Tin8、Tinl3、Tm3、Tocl、Togl、toll、TP-I、TP-10vir、TP-15c、TP-16c、TP-17c、TP-19、TP35、TP51、TP-84、Tt4、Tt6、A型、B型、C型、D型、E型、VA-9、W、wx23、wx26、Yunl、α、γ、pll、/> IA、IB、1-97A、1-97B、2、2、3、3、3、5、12、14、20、30、35、36、37、38、41C、51、63、64、138D、I、II、IV、NN-芽孢杆菌属(13)、alel、ARl、AR2、AR3、AR7、AR9、Bace-11、(同义词=11)、Bastille、BLl、BL2、BL3、BL4、BL5、BL6、BL8、BL9、BP124、BS28、BS80、Ch、CP-51、CP-54、D-5、darl、denl、DP-7、entl、FoSi、FoS2、FS4、FS6、FS7、G、gall、γ、GEl、GF-2、GSi、GT-I、GT-2、GT-3、GT-4、GT-5、GT-6、GT-7、GV-6、gl5、19、110、Isi、K、MP9、MP13、MP21、MP23、MP24、MP28、MP29、MP30、MP32、MP34、MP36、MP37、MP39、MP40、MP41、MP43、MP44、MP45、MP47、MP50、NLP-I、No.l、N17、N19、PBSl、PKl、PMBl、PMB12、PMJl、S、SPOl、SP3、SP5、SP6、SP7、SP8、SP9、SPlO、SP-15、SP50、(同义词=SP-50)、SP82、SST、subl、SW、Tg8、Tgl2、Tgl3、Tgl4、thul、thuΛ、thuS、Tin4、Tin23、TP-13、TP33、TP50、TSP-I、V型、VI型、V、Vx、β22、/> 1、1、2、2C、3NT、4、5、6、7、8、9、10、12、12、17、18、19、21、138、III、4(巨大芽孢杆菌(B.megateriwn))、4(球形芽孢杆菌(B.sphaericus))、AR13、BPP-IO、BS32、BS107、Bl、B2、GA-I、GP-IO、GV-3、GV-5、g8、MP20、MP27、MP49、Nf、PP5、PP6、SF5、Tgl8、TP-I、Versailles、/>1-97、837/IV、/>芽孢杆菌属(1)、BatlO、BSLlO、BSLIl、BS6、BSI l、BS16、BS23、BSlOl、BS102、gl8、morl、PBLl、SN45、thu2、thu3、TmI、Tm2、TP-20、TP21、TP52、F型、G型、IV型、HN-BacMus(3)、BLE、(同义词=θc)、BS2、BS4、BS5、BS7、BlO、B12、BS20、BS21、F、MJ-4、PBA12、AP50、AP50-04、AP50-11、AP50-23、AP50-26、AP50-27和Bam35。以下芽孢杆菌属特异性噬菌体为缺陷型的:DLP10716、DLP-11946、DPB5、DPB12、DPB21、DPB22、DPB23、GA-2、M、No.IM、PBLB、PBSH、PBSV、PBSW、PBSX、PBSY、PBSZ、phi、Spa、1型和μ。
属拟杆菌属的细菌可由以下噬菌体感染:ad I2、Baf-44、Baf-48B、Baf-64、Bf-I、Bf-52、B40-8、Fl、βl、11、67.1、67.3、68.1、mt-拟杆菌属(3)、Bf42、Bf71、HN-蛭弧菌属(1)和BF-41。
属博德特氏菌属的细菌可由以下噬菌体感染:134和NN-博德特氏菌属(3)。
属疏螺旋体属的细菌可由以下噬菌体感染:NN-疏螺旋体属(1)和NN-疏螺旋体属(2)。
属布鲁氏菌属的细菌可由以下噬菌体感染:A422、Bk、(同义词=Berkeley)、BM29、FOi、(同义词=FOl)、(同义词=FQl)、D、FP2、(同义词=FP2)、(同义词=FD2)、Fz、(同义词=Fz75/13)、(同义词=Firenze75/13)、(同义词=Fi)、Fi、(同义词=Fl)、Fim、(同义词=FIm)、(同义词=Fim)、FiU、(同义词=FlU)、(同义词=FiU)、F2、(同义词=F2)、F3、(同义词=F3)、F4、(同义词=F4)、F5、(同义词=F5)、F6、F7、(同义词=F7)、F25、(同义词=F25)、(同义词=£25)、F25U、(同义词=F25u)、(同义词=F25U)、(同义词=F25V)、F44、(同义词-F44)、F45、(同义词=F45)、F48、(同义词=F48)、I、Im、M、MC/75、M51、(同义词=M85)、P、(同义词=D)、S708、R、Tb、(同义词=TB)、(同义词=Tbilisi)、W、(同义词=Wb)、(同义词=Weybridge)、X、3、6、7、10/1、(同义词=10)、(同义词=F8)、(同义词=F8)、12m、24/11、(同义词=24)、(同义词=F9)、(同义词=F9)、45/111、(同义词=45)、75、84、212/XV、(同义词=212)、(同义词=Fi0)、(同义词=FlO)、371/XXIX、(同义词=371)、(同义词=Fn)、(同义词=Fl l)和513。
属伯克霍尔德氏菌属的细菌可由以下噬菌体感染:CP75、NN-伯克霍尔德氏菌属(1)和42。
属弯曲杆菌属的细菌可由以下噬菌体感染:C型、NTCC12669、NTCC12670、NTCC12671、NTCC12672、NTCC12673、NTCC12674、NTCC12675、NTCC12676、NTCC12677、NTCC12678、NTCC12679、NTCC12680、NTCC12681、NTCC12682、NTCC12683、NTCC12684、32f、111c、191、NN-弯曲杆菌属(2)、Vfi-6、(同义词=V19)、VfV-3、V2、V3、V8、V16、(同义词=Vfi-1)、V19、V20(V45)、V45、(同义词=V-45)和NN-弯曲杆菌属(1)。
属衣原体属的细菌可由以下噬菌体感染:Chpl。
属梭菌属的细菌可由以下噬菌体感染:CAKl、CA5、Ca7、CEβ、(同义词=1C)、CEγ、Cldl、c-n71、c-203Tox-、Deβ、(同义词=ID)、(同义词=lDt0X+)、HM3、KMl、KT、Ms、NAl、(同义词=Naltox+)、PA135Oe、Pfó、PL73、PL78、PL81、Pl、P50、P5771、P19402、lCt0X+、2Ct0X\2D3(同义词=2Dt0X+)、3C、(同义词=3Ctox+)、4C、(同义词=4Ct0X+)、56、III-l、NN-梭菌属(61)、NBlt0X+、αl、CAl、HMT、HM2、PFl5 P-23、P-46、Q-05、Q-oe、Q-16、Q-21、Q-26、Q-40、Q-46、S111、SA02、WA01、WA03、Wm、W523、80、C、CA2、CA3、CPTl、CPT4、cl、c4、c5、HM7、H11/A1、H18/Ax、FWS23、Hi58ZA1、K2ZA1、K21ZS23、ML、NA2t0X;Pf2、Pf3、Pf4、S9ZS3、S41ZA1、S44ZS23、α2、41、112ZS23、214/S23、233/Ai、234/S23、235/S23、II-l、II-2、II-3、NN-梭菌属(12)、CAl、Fl、K、S2、1、5和NN-梭菌属(8)。
属棒状杆菌属的细菌可由以下噬菌体感染:CGKl(缺陷型)、A、A2、A3、AlOl、A128、A133、A137、A139、A155、A182、B、BF、B17、B18、B51、B271、B275、B276、B277、B279、B282、C、capi、CCl、CGl、CG2、CG33、CL31、Cog、(同义词=CG5)、D、E、F、H、H-I、hqi、hq2、11ZH33、Ii/31、J、K、K、(同义词=Ktox”)、L、L、(同义词=Ltox+)、M、MC-I、MC-2、MC-3、MC-4、MLMa、N、O、ovi、ov2、ov3、P、P、R、RP6、RS29、S、T、U、UB1、ub2、UH1、UH3、uh3、uh5、uh6、β、(同义词=βtox+)、βhv64、βvir、γ、(同义词=γtoχ-)、γl9、δ、(同义词=δ’ox+)、p、(同义词=ptoχ-)、Φ9、ω、IA、1/1180、2、2/1180、5/1180、5ad/9717、7/4465、8/4465、8ad/10269、10/9253、13Z9253、15/3148、21/9253、28、29、55、2747、2893、4498和5848。/>
属肠球菌属的细菌可由以下噬菌体感染:DF78、Fl、F2、1、2、4、14、41、867、Dl、SB24、2BV、182、225、C2、C2F、E3、E62、DS96、H24、M35、P3、P9、SBlOl、S2、2BII、5、182a、705、873、881、940、1051、1057、21096C、NN-肠球菌属(1)、PEl、Fl、F3、F4、VD13、1、200、235和341。
属丹毒丝菌属的细菌可由以下噬菌体感染:NN-丹毒丝菌属(1)。
属埃希氏菌属的细菌可由以下噬菌体感染:BW73、B278、D6、D108、E、El、E24、E41、FI-2、FI-4、FI-5、HI8A、Ffl8B、i、MM、Mu、(同义词=mu)、(同义词=MuI)、(同义词=Mu-I)、(同义词=MU-I)、(同义词=MuI)、(同义词=μ)、025、PhI-5、Pk、PSP3、Pl、PlD、P2、P4(缺陷型)、Sl、(缺陷型)、/>ψ(缺陷型)、7A、/>15(缺陷型)、18、28-1、186、299、HH-埃希氏菌属(2)、AB48、CM、C4、C16、DD-VI、(同义词=Dd-Vi)、(同义词=DDVI)、(同义词=DDVi)、E4、E7、E28、FIl、FI3、H、Hl、H3、H8、K3、M、N、ND-2、ND-3、ND4、ND-5、ND6、ND-7、Ox-I(同义词=OXl)、(同义词=HF)、Ox-2(同义词=0x2)、(同义词=0X2)、Ox-3、Ox-4、Ox-5、(同义词=0X5)、Ox-6、(同义词=66F)、/> 5 0111、PhI-I、RB42、RB43、RB49、RB69、S、SaI-I、Sal-2、Sal-3、Sal-4、Sal-5、Sal-6、TC23、TC45、TuII*-6、(同义词=TuII*)、TuIP-24、TuII*46、TuIP-60、T2、(同义词=ganuTia)、(同义词=γ)、(同义词=PC)、(同义词=P.C.)、(同义词=T-2)、(同义词=T2)、(同义词=P4)、T4、(同义词=T-4)、(同义词=T4)、T6、T35、αl、1、IA、3、(同义词=Ac3)、3A、3T+、(同义词=3)、(同义词=Ml)、/>9266Q、CFO103、HK620、J、K、KlF、m59、no.A、no.E、no.3、no.9、N4、sd、(同义词=Sd)、(同义词=SD)、(同义词=Sa)3(同义词=sd)、(同义词=SD)、(同义词=CD)、T3、(同义词=T-3)、(同义词=T3)、T7、(同义词=T-7)、(同义词=T7)、WPK、W31、ΔH、Φ04-CF、Φ05、Φ06、Φ07、 Ω8、1、3、7、8、26、27、28-2、29、30、31、32、38、39、42、933W、NN-埃希氏菌属(1)、Esc-7-11、AC30、CVX-5、Cl、DDUP、ECl、EC2、E21、E29、Fl、F26S、F27S、Hi、HK022、HK97、(同义词=ΦHK97)、HK139、HK253、HK256、K7、ND-I、no.D、PA-2、q、S2、Tl、(同义词=α)、(同义词=P28)、(同义词=T-I)、(同义词=Tx)、T3C、T5、(同义词=T-5)、(同义词=T5)、UC-I、w、β4、γ2、λ(同义词=λ)、(同义词=Φλ)、ΦD326、/>Φ06、Φ7、Φ10、/>χ、(同义词=χi)、/> 2、4、4A、6、8A、102、150、168、174、3000、AC6、AC7、AC28、AC43、AC50、AC57、AC81、AC95、HK243、KlO、ZG/3A、5、5A、21EL、H19-J和933H。
属梭杆菌属的细菌可由以下噬菌体感染:NN-梭杆菌属(2)、fv83-554/3、fv88-531/2、227、fv2377、fv2527和fv8501。
属嗜血杆菌属的细菌可由以下噬菌体感染:HPl、S2和N3。
属螺杆菌属的细菌可由以下噬菌体感染:HPl和^^-螺杆菌属(1)。
属克雷伯氏菌属的细菌可由以下噬菌体感染:AIO-2、KI4B、Kl6B、Kl9、(同义词=K19)、Kl14、Kl15、Kl21、Kl28、Kl29、KI32、Kl33、Kl35、Kl106B、Kl171B、Kl181B、Kl832B、AIO-I、AO-I、AO-2、AO-3、FC3-10、K、Kl1、(同义词=KIl)、Kl2、(同义词=K12)、Kl3、(同义词=K13)、(同义词=Kl 70/11)、Kl4、(同义词=K14)、Kl5、(同义词=K15)、Kl6、(同义词=K16)、Kl7、(同义词=K17)、Kl8、(同义词=K18)、Kl19、(同义词=K19)、Kl27、(同义词=K127)、Kl31、(同义词=K131)、Kl35、Kl171B、II、VI、IX、CI-I、Kl4B、Kl8、Kl11、Kl12、Kl13、Kl16、Kl17、Kl18、Kl20、Kl22、Kl23、Kl24、Kl26、Kl30、Kl34、Kl106B、KIi65B、Kl328B、KLXI、K328、P5046、11、380、III、IV、VII、VIII、FC3-11、Kl2B、(同义词=K12B)、Kl25、(同义词=K125)、Kl42B、(同义词=K142)、(同义词=K142B)、Kl181B、(同义词=KIl 81)、(同义词=K1181B)、Kl765/!、(同义词=K1765/1)、Kl842B、(同义词=K1832B)、Kl937B、(同义词=K1937B)、Ll、7、231、483、490、632和864/100。
属钩端螺旋体属的细菌可由以下噬菌体感染:LEl、LE3、LE4和~NN-钩端螺旋体属(1)。
属李斯特菌属的细菌可由以下噬菌体感染:A511、01761、4211、4286、(同义词=BO54)、A005、A006、A020、A500、A502、A511、Al 18、A620、A640、B012、B021、B024、B025、B035、B051、B053、B054、B055、B056、BlOl、BI lO、B545、B604、B653、C707、D441、HSO47、HlOG、H8/73、H19、H21、H43、H46、H107、H108、HI lO、H163/84、H312、H340、H387、H391/73、H684/74、H924A、PSA、U153、(同义词=P35)、00241、00611、02971A、02971C、5/476、5/911、5/939、5/11302、5/11605、5/11704、184、575、633、699/694、744、900、1090、1317、1444、1652、1806、1807、1921/959、1921/11367、1921/11500、1921/11566、1921/12460、1921/12582、1967、2389、2425、2671、2685、3274、3550、3551、3552、4276、4277、4292、4477、5337、5348/11363、5348/11646、5348/12430、5348/12434、10072、11355C、11711A、12029、12981、13441、90666、90816、93253、907515、910716和NN-李斯特菌属(15)。
属摩根氏菌属的细菌可由以下噬菌体感染:47。
属分枝杆菌属的细菌可由以下噬菌体感染:13、AGl、Ali、ATCC 11759、A2、B.C3、BG2、BKl、BK5、butyricum、B-I、B5、B7、B30、B35、Clark、Cl、C2、DNAIII、DSP1、D4、D29、GS4E、(syn=GS4E)、GS7、(同义词=GS-7)、(同义词=GS7)、IPa、lacticola、Legendre、Leo、L5、(同义词=ΦL-5)、MC-I、MC-3、MC-4、minetti、MTPHI l、Mx4、MyF3P/59a、phlei、(同义词=phlei 1)、phlei 4、Polonus II、rabinovitschi、smegmatis、TM4、TM9、TMlO、TM20、Y7、YlO、IB、IF、IH、1/1、67、106、1430、Bl、(同义词=Bol)、B24、D、D29、F-K、F-S、HP、PolonusI、Roy、Rl、(同义词=Rl-Myb)、(同义词=Ri)、11、31、40、50、103a、103b、128、3111-D、3215-D和NN-分枝杆菌属(1)。
属奈瑟菌属的细菌可由以下噬菌体感染:I组、II组和NPl。
属诺卡氏菌属的细菌可由以下噬菌体感染:MNP8、NJ-L、NS-8、N5和TtiN-诺卡氏菌属。
属变形杆菌属的细菌可由以下噬菌体感染:Pm5、13vir、2/44、4/545、6/1004、13/807、20/826、57、67b、78、107/69、121、9/0、22/608、30/680、PmI、Pm3、Pm4、Pm6、Pm7、Pm9、PmIO、PmI l、Pv2、πl、7/549、9B/2、10A/31、12/55、14、15、16/789、17/971、19A/653、23/532、25/909、26/219、27/953、32A/909、33/971、34/13、65、5006M、7480b、VI、13/3a、Clichy12、π2600、/>1/1004、5/742、9、12、14、22、24/860、2600/D52、Pm8和24/2514。
属普罗威登斯菌属的细菌可由以下噬菌体感染:PL25、PL26、PL37、9211/9295、9213/921Ib、9248、7/R49、7476/322、7478/325、7479、7480、9000/9402和9213/921Ia。
属假单胞菌属的细菌可由以下噬菌体感染:PfI、(同义词=Pf-I)、Pf2、Pf3、PP7、PRRl、7s、im-假单胞菌属(1)、AI-I、AI-2、B17、B89、CB3、Col 2、Col 11、Col 18、Col 21、C154、C163、C167、C2121、E79、F8、ga、gb、H22、K1、M4、N2、Nu、PB-I、(同义词=PBl)、pfl6、PMN17、PPl、PP8、Psal、PsPl、PsP2、PsP3、PsP4、PsP5、PS3、PS17、PTB80、PX4、PX7、PYOl、PYO2、PYO5、PYO6、PYO9、PYOlO、PYO13、PYO14、PYO16、PYO18、PYO19、PYO20、PYO29、PYO32、PYO33、PYO35、PYO36、PYO37、PYO38、PYO39、PYO41、PYO42、PYO45、PYO47、PYO48、PYO64、PYO69、PYO103、PlK、SLPl、SL2、S2、UNL-I、wy、Yai、Ya4、Yan、 (同义词=ΦKZ)、/>Φmu78、/> 1/72、2/79、3、3/DO、4/237、5/406、6C、6/6660、7、7v、7/184、8/280、9/95、10/502、11/DE、12/100、12S、16、21、24、25F、27、31、44、68、71、95、109、188、337、352、1214、HN-假单胞菌属(23)、A856、B26、CI-I、CI-2、C5、D、gh-1、Fl 16、HF、H90、K5、K6、Kl 04、K109、K166、K267、N4、N5、O6N-25P、PE69、Pf、PPN25、PPN35、PPN89、PPN91、PP2、PP3、PP4、PP6、PP7、PP8、PP56、PP87、PPl 14、PP206、PP207、PP306、PP651、Psp231a、Pssy401、Pssy9220、psi、PTB2、PTB20、PTB42、PXl、PX3、PXlO、PX12、PX14、PYO70、PYO71、R、SH6、SH133、tf、Ya5、Ya7、/>ΦKf77、/>ΦmnF82、1、2、2、3、4、5、6、7、7、8、9、10、11、12、12B、13、14、15、14、15、16、17、18、19、20、20、21、21、22、23、23、24、25、31、53、73、119x、145、147、170、267、284、308、525、NN-假单胞菌属(5)、af、A7、B3、B33、B39、BI-I、C22、D3、D37、D40、D62、D3112、F7、FlO、g、gd、ge、gξHwl2、Jb 19、KFl、L°、OXN-32P、O6N-52P、PCH-I、PC13-1、PC35-1、PH2、PH51、PH93、PH132、PMW、PM13、PM57、PM61、PM62、PM63、PM69、PM105、PMl 13、PM681、PM682、PO4、PPl、PP4、PP5、PP64、PP65、PP66、PP71、PP86、PP88、PP92、PP401、PP711、PP891、Pssy41、Pssy42、Pssy403、Pssy404、Pssy420、Pssy923、PS4、PS-IO、Pz、SDl、SLl、SL3、SL5、SM、/> 2、2F、5、7m、11、13、13/441、14、20、24、40、45、49、61、73、148、160、198、218、222、236、242、246、249、258、269、295、297、309、318、342、350、351、357-1、400-1、HN-假单胞菌属(6)、GlOl、M6、M6a、Ll、PB2、Pssyl5、Pssy4210、Pssy4220、PYO12、PYO34、PYO49、PYO50、PYO51、PYO52、PYO53、PYO57、PYO59、PYO200、PX2、PX5、SL4、/>和1214。
属立克次体属的细菌可由以下噬菌体感染:NN-立克次体属。
属沙门氏菌属的细菌可由以下噬菌体感染:b、Beccles、CT、d、Dundee、f、FeIs 2、GI、GUI、GVI、GVIII、k、K、i、j、L、01、(同义词=0-1)、(同义词=O1)、(同义词=O-I)、(同义词=7)、02、03、P3、P9a、PlO、Sab3、Sab5、SanlS、Sanl7、SI、Taunton、ViI、(同义词=ViI)、9、imSalmonella(1)、N-I、N-5、N-IO、N-17、N-22、11、12、16-19、20.2、36、449C/C178、966A/C259、a、B.A.O.R.、e、G4、GUI、L、LP7、M、MG40、N-18、PSA68、P4、P9c、P22、(同义词=P22)、(同义词=PLT22)、(同义词=PLT22)、P22al、P22-4、P22-7、P22-11、SNT-I、SNT-2、SP6、Villi、ViIV、ViV、ViVI、ViVII、Worksop、Sj5、ε34、1、37、1(40)、1、422、2、2.5、3b、4、5、6、14(18)、8、14(6,7)、10、27、28B、30、31、32、33、34、36、37、39、1412、SNT-3、7-11、40.3、c、C236、C557、C625、C966N、g、GV、G5、Gl 73、h、IRA、Jersey、MB78、P22-1、P22-3、P22-12、Sabl、Sab2、Sab2、Sab4、Sanl、San2、San3、San4、San6、San7、San8、San9、Sanl3、Sanl4、Sanl6、Sanl8、Sanl9、San20、San21、San22、San23、San24、San25、San26、SasLl、SasL2、SasL3、SasL4、SasL5、SlBL、SII、ViII、/>1、2、3a、3al、1010、Ym-沙门氏菌属(1)、N-4、SasL6和27。
属沙雷氏菌属的细菌可由以下噬菌体感染:A2P、PS20、SMB3、SMP、SMP5、SM2、V40、V56、ic、ΦCP-3、ΦCP-6、3M、10/la、20A、34CC、34H、38T、345G、345P、501B、SMB2、SMP2、BC、BT、CW2、CW3、CW4、CW5、Lt232、L2232、L34、L.228、SLP、SMPA、V.43、σ、ΦCP6-1、ΦCP6-2、ΦCP6-5、3T、5、8、9F、10/1、2OE、32/6、34B、34CT、34P、37、41、56、56D、56P、6OP、61/6、74/6、76/4、101/8900、226、227、228、229F、286、289、290F、512、764a、2847/10、2847/1Oa、L.359和SMBl。
属志贺氏菌属的细菌可由以下噬菌体感染:Fsa、(同义词=a)、FSD2d、(同义词=D2d)、(同义词=W2d)、FSD2E、(同义词=W2e)、fv、F6、f7.8、H-Sh、PE5、P90、SfII、Sh、SHm、SHrv、(同义词=HIV)、SHvi、(同义词=HVI)、SHVvm、(同义词=HVIII)、SKγ66、(同义词=gamma 66)、(同义词=yββ)、(同义词=γ66b)、SKm、(同义词=SIIIb)5、(同义词=UI)、SKw、(同义词=Siva)、(同义词=IV)、SICTM、(同义词=SIVA.)、(同义词=IVA)、SKvi、(同义词=KVI)、(同义词=Svi)、(同义词=VI)、SKvm、(同义词=Svm)、(同义词=VIII)、SKVΠIA、(同义词=SvmA)、(同义词=VIIIA)、STvi、STK、STx1、STxn、S66、W2、(同义词=D2c)、(同义词=D20)、3-SO-R、8368-SO-R、F7、(同义词=FS7)、(同义词=K29)、FlO、(同义词=FSlO)、(同义词=K31)、I1、(同义词=alfa)、(同义词=FSa)、(同义词=Kl 8、(同义词=α)、I2、(同义词=a)、(同义词=K19)、SG33、(同义词=G35)、(同义词=
SO-35/G)、SG35、(同义词=SO-55/G)、SG3201、(同义词=SO-3201/G)、SHn、(同义词=HII)、SHv、(同义词=SHV)、SHx、SHX、SKn、(同义词=K2)、(同义词=KII)、(同义词=Sn)、(同义词=SsII)、(同义词=II)、SKrv、(同义词=Sm)、(同义词=SsIV)、(同义词=IV)、SK1Va、(同义词=Swab)、(同义词=SsIVa)、(同义词=IVa)、SKV、(同义词=K4)、(同义词=KV)、(同义词=SV)、(同义词=SsV)、(同义词=V)SKx、(同义词=K9)、(同义词=KX)、(同义词=SX)、(同义词=SsX)、(同义词=X)、STV、(同义词=T35)、(同义词=35-50-R)、STvm、(同义词=T8345)、(同义词=8345-SO-S-R)、W1、(同义词=D8)、(同义词=FSD8)、W2a、(同义词=D2A)、(同义词=FS2a)、DD-2、Sf6、FSi、(同义词=Fl)、SF6、(同义词=F6)、SG42、(同义词=SO-42/G)、SG3203、(同义词=SO-3203/G)、SKF12、(同义词=SsF12)、(同义词=F12)、(同义词=F12)、STn、(同义词=1881-SO-R)、γ66、(同义词=gamma 66a)、(同义词=Ssγ66)、BIl、DDVII、(同义词=DD7)、FSD2b、(同义词=W2B)、FS2、(同义词=F2)、(同义词=F2)、FS4、(同义词=F4)、(同义词=F4)、FS5、(同义词=F5)、(同义词=F5)、FS9、(同义词=F9)、(同义词=F9)、FI l、P2-S0-S、SG36、(同义词=SO-36/G)、(同义词=G36)、SG3204、(同义词SO-3204/G)、SG3244、(同义词=SO-3244/G)、SHi、(同义词=HI)、SHvπ、(同义词=HVII)、SHK、(同义词=HIX)、SHx1、SHxπ、(同义词=HXn)、SKI、KI、(同义词=S1)、(同义词=SsI)、SKVII、(同义词=KVII)、(同义词=Svπ)、(同义词=SsVII)、SKIX、(同义词=KIX)、(同义词=S1x)、(同义词=SsIX)、SKXII、(同义词=KXII)、(同义词=Sxn)、(同义词=SsXII)、STi、STffl、STrv、STVi、STvπ、S70、S206、U2-S0-S、3210-SO-S、3859-SO-S、4020-SO-S、/> SHm、(同义词=Hπi)、SHχi、(同义词=HXt)和SKxI、(同义词=KXI)、(同义词=Sχi)、(syn=SsXI)、(同义词=XI)。
属葡萄球菌属的细菌可由以下噬菌体感染:A、EW、K、Ph5、Ph9、PhIO、Phl3、Pl、P2、P3、P4、P8、P9、PlO、RG、SB-i、(同义词=Sb-I)、S3K、Twort、ΦSK311、06、40、58、119、130、131、200、1623、STCl、(同义词=stcl)、STC2、(同义词=stc2)、44AHJD、68、ACl、AC2、A“C”、A9“C”、b581、CA-I、CA-2、CA-3、CA-4、CA-5、DI l、L39x35、L54a、M42、Nl、N2、N3、N4、N5、N7、N8、NlO、Ni l、N12、N13、N14、N16、Ph6、Phl2、Phl4、UC-18、U4、U15、Sl、S2、S3、S4、S5、X2、Z1、/>ω、11、/> (同义词=P11-M15)、15、28、28A、29、31、31B、37、42D、(同义词=P42D)、44A、48、51、52、52A、(同义词=P52A)、52B、53、55、69、71、(同义词=P71)、71A、72、75、76、77、79、80、80α、82、82A、83A、84、85、86、88、88A、89、90、92、95、96、102、107、108、111、129-26、130、130A、155、157、157A、165、187、275、275A、275B、356、456、459、471、471A、489、581、676、898、1139、1154A、1259、1314、1380、1405、1563、2148、2638A、2638B、2638C、2731、2792A、2792B、2818、2835、2848A、3619、5841、12100、AC3、A8、AlO、A13、b594n、D、HK2、N9、N15、P52、P87、Sl、S6、Z4、/>3A、3B、3C、6、7、16、21、42B、42C、42E、44、47、47A5 47C、51、54、54x1、70、73、75、78、81、82、88、93、94、101、105、110、115、129/16、174、594n、1363/14、2460和mS-葡萄球菌属(1)。
属链球菌属的细菌可由以下噬菌体感染:EJ-I、NN-链球菌属(1)、a、Cl、FL0Ths、H39、Cp-I、Cρ-5、Cp-7、Cp-9、Cp-IO、AT298、A5、alO/Jl、alO/J2、alO/J5、alO/J9、A25、BTI l、b6、CAl、c20-l、c20-2、DP-I、Dp-4、DTl、ET42、elO、FA101、FEThs、Fκ、FKKIOI、FKLIO、FKP74、FKH、FLOThs、FyIOl、fl、F10、F20140/76、g、GT-234、HB3、(同义词=HB-3)、HB-623、HB-746、M102、O1205、PST、PO、Pl、P2、P3、P5、P6、P8、P9、P9、P12、P13、P14、P49、P50、P51、P52、P53、P54、P55、P56、P57、P58、P59、P64、P67、P69、P71、P73、P75、P76、P77、P82、P83、P88、sc、sch、sf、SfIl 1、(同义词=SFiI l)、/>(同义词=ΦSfil l)、sfil9、(同义词=SFil9)、/> Sfi21、(同义词=SFi21)、/>ST0、STX、st2、ST2、ST4、S3、/>s265、Φ17、/>Φ57、 Φ7201、ωl、ω2、ω3、ω4、ω5、ω6、ω8、ωlO、1、6、9、1OF、12/12、14、17SR、19S、24、50/33、50/34、55/14、55/15、70/35、70/36、71/ST15、71/45、71/46、74F、79/37、79/38、80/J4、80/J9、80/ST16、80/15、80/47、80/48、101、103/39、103/40、121/41、121/42、123/43、123/44、124/44、337/ST17和m链球菌属(34)。
属密螺旋体属的细菌可由以下噬菌体感染:NN-密螺旋体属(1)。
属弧菌属的细菌可由以下噬菌体感染:CTXΦ、fs、(同义词=si)、fs2、Ivpf5、Vfl2、Vf33、VPIΦ、VSK、v6、493、CP-Tl、ET25、κ、K139、Labol、)XN-69P、OXN-86、O6N-21P、PB-I、P147、rp-1、SE3、VA-I、(同义词=VcA-I)、VcA-2、VPl、VP2、VP4、VP7、VP8、VP9、VPlO、VP17、VP18、VP19、X29、(同义词=29d’Herelle)、t、ΦHAWI-1、ΦHAWI-2、ΦHAWI-3、ΦHAWI-4、ΦHAWI-5、ΦHAWI-6、ΦHAWI-7、XHAWI-8、ΦHAWI-9、ΦHAWI-10、ΦHCl-1、ΦHC1-2、ΦHC1-3、ΦHC1-4、ΦHC2-1、>HC2-2、ΦHC2-3、ΦHC2-4、ΦHC3-1、ΦHC3-2、ΦHC3-3、ΦHD1S-1、ΦHD1S-2、ΦHD2S-1、ΦHD2S-2、ΦHD2S-3、ΦHD2S-4、ΦHD2S-5、ΦHDO-1、ΦHDO-2、ΦHDO-3、ΦHDO-4、ΦHDO-5、ΦHDO-6、ΦKL-33、ΦKL-34、ΦKL-35、ΦKL-36、ΦKWH-2、ΦKWH-3、ΦKWH-4、ΦMARQ-1、ΦMARQ-2、ΦMARQ-3、ΦMOAT-1、ΦO139、ΦPEL1A-1、ΦPEL1A-2、ΦPEL8A-1、ΦPEL8A-2、ΦPEL8A-3、ΦPEL8C-1、ΦPEL8C-2、ΦPEL13A-1、ΦPEL13B-1、ΦPEL13B-2、ΦPEL13B-3、ΦPEL13B-4、ΦPEL13B-5、ΦPEL13B-6、ΦPEL13B-7、ΦPEL13B-8、ΦPEL13B-9、ΦPEL13B-10、Φ16、/>1-II、5、13、14、16、24、32、493、6214、7050、7227、II、(同义词=II组)、/>V、VIII、~m-弧菌属(13)、KVP20、KVP40、nt-1、O6N-22P、P68、el、e2、e3、e4、e5、FK、G、I、K、nt-6、Nl、N2、N3、N4、N5、O6N-34P、OXN-72P、OXN-85P、OXN-100P、P、Ph-I、PL163/10、Q、S、T、/>1-9、37、51、57、70A-8、72A-4、72A-10、110A-4、333、4996、I(同义词=I组)、III(同义词=III组)、VI、(同义词=A-Saratov)、VII、IX、X、HN-弧菌属(6)、pAl、7、7-8、70A-2、71A-6、72A-5、72A-8、108A-10、109A-6、109A-8、l lOA-1、110A-5、110A-7、hv-1、OXN-52P、P13、P38、P53、P65、P108、Pill、TPl3 VP3、VP6、VP12、VP13、70A-3、70A-4、70A-10、72A-1、108A-3、109-B1、110A-2、149、/>IV、(同义词=IV组)、NN-弧菌属(22)、VP5、VPIl、VP15、VP16、αl、α2、α3a、α3b、353B和HN-弧菌属(7)。
属耶尔森氏菌属的细菌可由以下噬菌体感染:H、H-I、H-2、H-3、H-4、Lucas 110、Lucas 303、Lucas 404、YerA3、YerA7、YerA20、YerA41、3/M64-76、5/G394-76、6/C753-76、8/C239-76、9/F18167、1701、1710、PST、1/F2852-76、D’Herelle、EV、H、Kotljarova、PTB、R、Y、YerA41、3、4/C1324-76、7/F783-76、903、1/M6176和Yer2AT。
在一个实施方案中,细菌噬菌体选自沙门氏菌属病毒SKML39、志贺氏菌属病毒AG3、迪克氏菌属病毒Limestone、迪克氏菌属病毒RC2014、埃希氏菌属病毒CBA120、埃希氏菌属病毒PhaxI、沙门氏菌属病毒38、沙门氏菌属病毒Det7、沙门氏菌属病毒GG32、沙门氏菌属病毒PM10、沙门氏菌属病毒SFP10、沙门氏菌属病毒SH19、沙门氏菌属病毒SJ3、埃希氏菌属病毒ECML4、沙门氏菌属病毒Marshall、沙门氏菌属病毒Maynard、沙门氏菌属病毒SJ2、沙门氏菌属病毒STML131、沙门氏菌属病毒ViI、欧文氏菌属病毒Ea2809、克雷伯氏菌属病毒0507KN21、沙雷氏菌属病毒IME250、沙雷氏菌属病毒MAM1、弯曲杆菌属病毒CP21、弯曲杆菌属病毒CP220、弯曲杆菌属病毒CPt10、弯曲杆菌属病毒IBB35、弯曲杆菌属病毒CP81、弯曲杆菌属病毒CP30A、弯曲杆菌属病毒CPX、弯曲杆菌属病毒NCTC12673、欧文氏菌属病毒Ea214、欧文氏菌属病毒M7、埃希氏菌属病毒AYO145A、埃希氏菌属病毒EC6、埃希氏菌属病毒HY02、埃希氏菌属病毒JH2、埃希氏菌属病毒TP1、埃希氏菌属病毒VpaE1、埃希氏菌属病毒wV8、沙门氏菌属病毒FelixO1、沙门氏菌属病毒HB2014、沙门氏菌属病毒Mushroom、沙门氏菌属病毒UAB87、柠檬酸杆菌属病毒Moogle、柠檬酸杆菌属病毒Mordin、埃希氏菌属病毒SUSP1、埃希氏菌属病毒SUSP2、气单胞菌属病毒phiO18P、嗜血杆菌属病毒HP1、嗜血杆菌属病毒HP2、巴斯德氏菌属(Pasteurella)病毒F108、弧菌属病毒K139、弧菌属病毒Kappa、伯克霍尔德氏菌属病毒phi52237、伯克霍尔德氏菌属病毒phiE122、伯克霍尔德氏菌属病毒phiE202、埃希氏菌属病毒186、埃希氏菌属病毒P4、埃希氏菌属病毒P2、埃希氏菌属病毒Wphi、曼氏杆菌属病毒PHL101、假单胞菌属病毒phiCTX、罗尔斯通氏菌属病毒RSA1、沙门氏菌属病毒Fels2、沙门氏菌属病毒PsP3、沙门氏菌属病毒SopEphi、耶尔森氏菌属病毒L413C、葡萄球菌属病毒G1、葡萄球菌属病毒G15、葡萄球菌属病毒JD7、葡萄球菌属病毒K、葡萄球菌属病毒MCE2014、葡萄球菌属病毒P108、葡萄球菌属病毒Rodi、葡萄球菌属病毒S253、葡萄球菌属病毒S25-4、葡萄球菌属病毒SA12、李斯特菌属病毒A511、李斯特菌属病毒P100、葡萄球菌属病毒Remus、葡萄球菌属病毒SA11、葡萄球菌属病毒Stau2、芽孢杆菌属病毒Camphawk、芽孢杆菌属病毒SPO1、芽孢杆菌属病毒BCP78、芽孢杆菌属病毒TsarBomba、葡萄球菌属病毒Twort、肠球菌属病毒phiEC24C、乳杆菌属病毒Lb338-1、乳杆菌属病毒LP65、肠杆菌属病毒PG7、埃希氏菌属病毒CC31、克雷伯氏菌属病毒JD18、克雷伯氏菌属病毒PKO111、埃希氏菌属病毒Bp7、埃希氏菌属病毒IME08、埃希氏菌属病毒JS10、埃希氏菌属病毒JS98、埃希氏菌属病毒QL01、埃希氏菌属病毒VR5、肠杆菌属病毒Eap3、克雷伯氏菌属病毒KP15、克雷伯氏菌属病毒KP27、克雷伯氏菌属病毒Matisse、克雷伯氏菌属病毒Miro、柠檬酸杆菌属病毒Merlin、柠檬酸杆菌属病毒Moon、埃希氏菌属病毒JSE、埃希氏菌属病毒phi1、埃希氏菌属病毒RB49、埃希氏菌属病毒HX01、埃希氏菌属病毒JS09、埃希氏菌属病毒RB69、志贺氏菌属病毒UTAM、沙门氏菌属病毒S16、沙门氏菌属病毒STML198、弧菌属病毒KVP40、弧菌属病毒nt1、弧菌属病毒ValKK3、埃希氏菌属病毒VR7、埃希氏菌属病毒VR20、埃希氏菌属病毒VR25、埃希氏菌属病毒VR26、志贺氏菌属病毒SP18、埃希氏菌属病毒AR1、埃希氏菌属病毒C40、埃希氏菌属病毒E112、埃希氏菌属病毒ECML134、埃希氏菌属病毒HY01、埃希氏菌属病毒Ime09、埃希氏菌属病毒RB3、埃希氏菌属病毒RB14、埃希氏菌属病毒T4、志贺氏菌属病毒Pss1、志贺氏菌属病毒Shfl2、耶尔森氏菌属病毒D1、耶尔森氏菌属病毒PST、不动杆菌属病毒133、气单胞菌属病毒65、气单胞菌属病毒Aeh1、埃希氏菌属病毒RB16、埃希氏菌属病毒RB32、埃希氏菌属病毒RB43、假单胞菌属病毒42、克罗诺杆菌属(Cronobacter)病毒CR3、克罗诺杆菌属病毒CR8、克罗诺杆菌属病毒CR9、克罗诺杆菌属病毒PBES02、果胶杆菌属(Pectobacterium)病毒phiTE、克罗诺杆菌属病毒GAP31、埃希氏菌属病毒4MG、沙门氏菌属病毒SE1、沙门氏菌属病毒SSE121、埃希氏菌属病毒FFH2、埃希氏菌属病毒FV3、埃希氏菌属病毒JES2013、埃希氏菌属病毒V5、短芽孢杆菌属(Brevibacillus)病毒Abouo、短芽孢杆菌属病毒Davies、芽孢杆菌属病毒Agate、芽孢杆菌属病毒Bobb、芽孢杆菌属病毒Bp8pC、欧文氏菌属病毒Deimos、欧文氏菌属病毒Ea35-70、欧文氏菌属病毒RAY、欧文氏菌属病毒Simmy50、欧文氏菌属病毒SpecialG、不动杆菌属病毒AB1、不动杆菌属病毒AB2、不动杆菌属病毒AbC62、不动杆菌属病毒AP22、节杆菌属病毒ArV1、节杆菌属病毒Trina、芽孢杆菌属病毒AvesoBmore、芽孢杆菌属病毒B4、芽孢杆菌属病毒Bigbertha、芽孢杆菌属病毒Riley、芽孢杆菌属病毒Spock、芽孢杆菌属病毒Troll、芽孢杆菌属病毒Bastille、芽孢杆菌属病毒CAM003、芽孢杆菌属病毒Bc431、芽孢杆菌属病毒Bcp1、芽孢杆菌属病毒BCP82、芽孢杆菌属病毒BM15、芽孢杆菌属病毒Deepblue、芽孢杆菌属病毒JBP901、伯克霍尔德氏菌属病毒Bcep1、伯克霍尔德氏菌属病毒Bcep43、伯克霍尔德氏菌属病毒Bcep781、伯克霍尔德氏菌属病毒BcepNY3、黄单胞菌属病毒OP2、伯克霍尔德氏菌属病毒BcepMu、伯克霍尔德氏菌属病毒phiE255、气单胞菌属病毒44RR2、分枝杆菌属病毒Alice、分枝杆菌属病毒Bxz1、分枝杆菌属病毒Dandelion、分枝杆菌属病毒HyRo、分枝杆菌属病毒I3、分枝杆菌属病毒Nappy、分枝杆菌属病毒Sebata、梭菌属病毒phiC2、梭菌属病毒phiCD27、梭菌属病毒phiCD119、芽孢杆菌属病毒CP51、芽孢杆菌属病毒JL、芽孢杆菌属病毒Shanette、埃希氏菌属病毒CVM10、埃希氏菌属病毒ep3、欧文氏菌属病毒Asesino、欧文氏菌属病毒EaH2、假单胞菌属病毒EL、盐单胞菌属(Halomonas)病毒HAP1、弧菌属病毒VP882、短芽孢杆菌属病毒Jimmer、短芽孢杆菌属病毒Osiris、假单胞菌属病毒Ab03、假单胞菌属病毒KPP10、假单胞菌属病毒PAKP3、中华根瘤菌属(Sinorhizobium)病毒M7、中华根瘤菌属病毒M12、中华根瘤菌属病毒N3、欧文氏菌属病毒Machina、节杆菌属病毒Brent、节杆菌属病毒Jawnski、节杆菌属病毒Martha、节杆菌属病毒Sonny、爱德华菌属(Edwardsiella)病毒MSW3、爱德华菌属病毒PEi21、埃希氏菌属病毒Mu、志贺氏菌属病毒SfMu、盐杆菌属(Halobacterium)病毒phiH、芽孢杆菌属病毒Grass、芽孢杆菌属病毒NIT1、芽孢杆菌属病毒SPG24、气单胞菌属病毒43、埃希氏菌属病毒P1、假单胞菌属病毒CAb1、假单胞菌属病毒CAb02、假单胞菌属病毒JG004、假单胞菌属病毒PAKP1、假单胞菌属病毒PAKP4、假单胞菌属病毒PaP1、伯克霍尔德氏菌属病毒BcepF1、假单胞菌属病毒141、假单胞菌属病毒Ab28、假单胞菌属病毒DL60、假单胞菌属病毒DL68、假单胞菌属病毒F8、假单胞菌属病毒JG024、假单胞菌属病毒KPP12、假单胞菌属病毒LBL3、假单胞菌属病毒LMA2、假单胞菌属病毒PB1、假单胞菌属病毒SN、假单胞菌属病毒PA7、假单胞菌属病毒phiKZ、根瘤菌属病毒RHEph4、罗尔斯通氏菌属病毒RSF1、罗尔斯通氏菌属病毒RSL2、罗尔斯通氏菌属病毒RSL1、气单胞菌属病毒25、气单胞菌属病毒31、气单胞菌属病毒Aes12、气单胞菌属病毒Aes508、气单胞菌属病毒AS4、窄食单胞菌属病毒IME13、葡萄球菌属病毒IPLAC1C、葡萄球菌属病毒SEP1、沙门氏菌属病毒SPN3US、芽孢杆菌属病毒1、土芽孢杆菌属病毒GBSV1、耶尔森氏菌属病毒R1RT、耶尔森氏菌属病毒TG1、芽孢杆菌属病毒G、芽孢杆菌属病毒PBS1、微囊藻属(Microcystis)病毒Ma-LMM01、弧菌属病毒MAR、弧菌属病毒VHML、弧菌属病毒VP585、芽孢杆菌属病毒BPS13、芽孢杆菌属病毒Hakuna、芽孢杆菌属病毒Megatron、芽孢杆菌属病毒WPh、不动杆菌属病毒AB3、不动杆菌属病毒Abp1、不动杆菌属病毒Fri1、不动杆菌属病毒IME200、不动杆菌属病毒PD6A3、不动杆菌属病毒PDAB9、不动杆菌属病毒phiAB1、埃希氏菌属病毒K30、克雷伯氏菌属病毒K5、克雷伯氏菌属病毒K11、克雷伯氏菌属病毒Kp1、克雷伯氏菌属病毒KP32、克雷伯氏菌属病毒KpV289、克雷伯氏菌属病毒F19、克雷伯氏菌属病毒K244、克雷伯氏菌属病毒Kp2、克雷伯氏菌属病毒KP34、克雷伯氏菌属病毒KpV41、克雷伯氏菌属病毒KpV71、克雷伯氏菌属病毒KpV475、克雷伯氏菌属病毒SU503、克雷伯氏菌属病毒SU552A、泛菌属(Pantoea)病毒Limelight、泛菌属病毒Limezero、假单胞菌属病毒LKA1、假单胞菌属病毒phiKMV、黄单胞菌属病毒f20、黄单胞菌属病毒f30、木杆菌属(Xylella)病毒Prado、欧文氏菌属病毒Era103、埃希氏菌属病毒K5、埃希氏菌属病毒K1-5、埃希氏菌属病毒K1E、沙门氏菌属病毒SP6、埃希氏菌属病毒T7、克吕沃尔氏菌属(Kluyvera)病毒Kvp1、假单胞菌属病毒gh1、原绿球菌属(Prochlorococcus)病毒PSSP7、聚球藻属(Synechococcus)病毒P60、聚球藻属病毒Syn5、链球菌属病毒Cp1、链球菌属病毒Cp7、葡萄球菌属病毒44AHJD、链球菌属病毒C1、芽孢杆菌属病毒B103、芽孢杆菌属病毒GA1、芽孢杆菌属病毒phi29、库特氏菌属(Kurthia)病毒6、放线菌属病毒Av1、支原体属病毒P1、埃希氏菌属病毒24B、埃希氏菌属病毒933W、埃希氏菌属病毒Min27、埃希氏菌属病毒PA28、埃希氏菌属病毒Stx2 II、志贺氏菌属病毒7502Stx、志贺氏菌属病毒POCJ13、埃希氏菌属病毒191、埃希氏菌属病毒PA2、埃希氏菌属病毒TL2011、志贺氏菌属病毒VASD、伯克霍尔德氏菌属病毒Bcep22、伯克霍尔德氏菌属病毒Bcepil02、伯克霍尔德氏菌属病毒Bcepmigl、伯克霍尔德氏菌属病毒DC1、博德特氏菌属病毒BPP1、伯克霍尔德氏菌属病毒BcepC6B、噬纤维素菌属(Cellulophaga)病毒Cba41、噬纤维素菌属病毒Cba172、沟鞭藻玫瑰杆菌属(Dinoroseobacter)病毒DFL12、欧文氏菌属病毒Ea9-2、欧文氏菌属病毒Frozen、埃希氏菌属病毒phiV10、沙门氏菌属病毒Epsilon15、沙门氏菌属病毒SPN1S、假单胞菌属病毒F116、假单胞菌属病毒H66、埃希氏菌属病毒APEC5、埃希氏菌属病毒APEC7、埃希氏菌属病毒Bp4、埃希氏菌属病毒EC1UPM、埃希氏菌属病毒ECBP1、埃希氏菌属病毒G7C、埃希氏菌属病毒IME11、志贺氏菌属病毒Sb1、无色杆菌属病毒Axp3、无色杆菌属病毒JWAlpha、爱德华菌属病毒KF1、假单胞菌属病毒KPP25、假单胞菌属病毒R18、假单胞菌属病毒Ab09、假单胞菌属病毒LIT1、假单胞菌属病毒PA26、假单胞菌属病毒Ab22、假单胞菌属病毒CHU、假单胞菌属病毒LUZ24、假单胞菌属病毒PAA2、假单胞菌属病毒PaP3、假单胞菌属病毒PaP4、假单胞菌属病毒TL、假单胞菌属病毒KPP21、假单胞菌属病毒LUZ7、埃希氏菌属病毒N4、沙门氏菌属病毒9NA、沙门氏菌属病毒SP069、沙门氏菌属病毒BTP1、沙门氏菌属病毒HK620、沙门氏菌属病毒P22、沙门氏菌属病毒ST64T、志贺氏菌属病毒Sf6、芽孢杆菌属病毒Page、芽孢杆菌属病毒Palmer、芽孢杆菌属病毒Pascal、芽孢杆菌属病毒Pony、芽孢杆菌属病毒Pookie、埃希氏菌属病毒172-1、埃希氏菌属病毒ECB2、埃希氏菌属病毒NJ01、埃希氏菌属病毒phiEco32、埃希氏菌属病毒Septima11、埃希氏菌属病毒SU10、布鲁氏菌属病毒Pr、布鲁氏菌属病毒Tb、埃希氏菌属病毒Pollock、沙门氏菌属病毒FSL SP-058、沙门氏菌属病毒FSL SP-076、螺杆菌属病毒1961P、螺杆菌属病毒KHP30、螺杆菌属病毒KHP40、、汉密尔顿氏菌属(Hamiltonella)病毒APSE1、乳球菌属病毒KSY1、席藻属(Phormidium)病毒WMP3、席藻属病毒WMP4、假单胞菌属病毒119X、玫瑰杆菌属病毒SIO1、弧菌属病毒VpV262、弧菌属病毒VC8、弧菌属病毒VP2、弧菌属病毒VP5、链霉菌属病毒Amela、链霉菌属病毒phiCAM、链霉菌属病毒Aaronocolus、链霉菌属病毒Caliburn、链霉菌属病毒Danzina、链霉菌属病毒Hydra、链霉菌属病毒Izzy、链霉菌属病毒Lannister、链霉菌属病毒Lika、链霉菌属病毒Sujidade、链霉菌属病毒Zemlya、链霉菌属病毒ELB20、链霉菌属病毒R4、链霉菌属病毒phiHau3、分枝杆菌属病毒Acadian、分枝杆菌属病毒Baee、分枝杆菌属病毒Reprobate、分枝杆菌属病毒Adawi、分枝杆菌属病毒Bane1、分枝杆菌属病毒BrownCNA、分枝杆菌属病毒Chrisnmich、分枝杆菌属病毒Cooper、分枝杆菌属病毒JAMaL、分枝杆菌属病毒Nigel、分枝杆菌属病毒Stinger、分枝杆菌属病毒Vincenzo、分枝杆菌属病毒Zemanar、分枝杆菌属病毒Apizium、分枝杆菌属病毒Manad、分枝杆菌属病毒Oline、分枝杆菌属病毒Osmaximus、分枝杆菌属病毒Pg1、分枝杆菌属病毒Soto、分枝杆菌属病毒Suffolk、分枝杆菌属病毒Athena、分枝杆菌属病毒Bernardo、分枝杆菌属病毒Gadjet、分枝杆菌属病毒Pipefish、分枝杆菌属病毒Godines、分枝杆菌属病毒Rosebush、分枝杆菌属病毒Babsiella、分枝杆菌属病毒Brujita、分枝杆菌属病毒Che9c、分枝杆菌属病毒Sbash、分枝杆菌属病毒Hawkeye、分枝杆菌属病毒Plot、沙门氏菌属病毒AG11、沙门氏菌属病毒Ent1、沙门氏菌属病毒f18SE、沙门氏菌属病毒Jersey、沙门氏菌属病毒L13、沙门氏菌属病毒LSPA1、沙门氏菌属病毒SE2、沙门氏菌属病毒ETP3、沙门氏菌属病毒SETP7、沙门氏菌属病毒SETP13、沙门氏菌属病毒SP101、沙门氏菌属病毒SS3e、沙门氏菌属病毒wksl3、埃希氏菌属病毒K1G、埃希氏菌属病毒K1H、埃希氏菌属病毒K1ind1、埃希氏菌属病毒K1ind2、沙门氏菌属病毒SP31、明串珠菌属病毒Lmd1、明串珠菌属病毒LN03、明串珠菌属病毒LN04、明串珠菌属病毒LN12、明串珠菌属病毒LN6B、明串珠菌属病毒P793、明串珠菌属病毒1A4、明串珠菌属病毒Ln8、明串珠菌属病毒Ln9、明串珠菌属病毒LN25、明串珠菌属病毒LN34、明串珠菌属病毒LNTR3、分枝杆菌属病毒Bongo、分枝杆菌属病毒Rey、分枝杆菌属病毒Butters、分枝杆菌属病毒Michelle、分枝杆菌属病毒Charlie、分枝杆菌属病毒Pipsqueaks、分枝杆菌属病毒Xeno、分枝杆菌属病毒Panchino、分枝杆菌属病毒Phrann、分枝杆菌属病毒Redi、分枝杆菌属病毒Skinnyp、戈登氏菌属病毒BaxterFox、戈登氏菌属病毒Yeezy、戈登氏菌属病毒Kita、戈登氏菌属病毒Zirinka、戈登氏菌属病毒Nymphadora、分枝杆菌属病毒Bignuz、分枝杆菌属病毒Brusacoram、分枝杆菌属病毒Donovan、分枝杆菌属病毒Fishburne、分枝杆菌属病毒Jebeks、分枝杆菌属病毒Malithi、分枝杆菌属病毒Phayonce、肠杆菌属病毒F20、克雷伯氏菌属病毒1513、克雷伯氏菌属病毒KLPN1、克雷伯氏菌属病毒KP36、克雷伯氏菌属病毒PKP126、克雷伯氏菌属病毒Sushi、埃希氏菌属病毒AHP42、埃希氏菌属病毒AHS24、埃希氏菌属病毒AKS96、埃希氏菌属病毒C119、埃希氏菌属病毒E41c、埃希氏菌属病毒Eb49、埃希氏菌属病毒Jk06、埃希氏菌属病毒KP26、埃希氏菌属病毒Rogue1、埃希氏菌属病毒ACGM12、埃希氏菌属病毒Rtp、埃希氏菌属病毒ADB2、埃希氏菌属病毒JMPW1、埃希氏菌属病毒JMPW2、埃希氏菌属病毒T1、志贺氏菌属病毒PSf2、志贺氏菌属病毒Shfl1、柠檬酸杆菌属病毒Stevie、埃希氏菌属病毒TLS、沙门氏菌属病毒SP126、克罗诺杆菌属病毒Esp2949-1、假单胞菌属病毒Ab18、假单胞菌属病毒Ab19、假单胞菌属病毒PaMx11、节杆菌属病毒Amigo、丙酸杆菌属病毒Anatole、丙酸杆菌属病毒B3、芽孢杆菌属病毒Andromeda、芽孢杆菌属病毒Blastoid、芽孢杆菌属病毒Curly、芽孢杆菌属病毒Eoghan、芽孢杆菌属病毒Finn、芽孢杆菌属病毒Glittering、芽孢杆菌属病毒Riggi、芽孢杆菌属病毒Taylor、戈登氏菌属病毒Attis、分枝杆菌属病毒Barnyard、分枝杆菌属病毒Konstantine、分枝杆菌属病毒Predator、分枝杆菌属病毒Bernal13、葡萄球菌属病毒13、葡萄球菌属病毒77、葡萄球菌属病毒108PVL、分枝杆菌属病毒Bron、分枝杆菌属病毒Faith1、分枝杆菌属病毒Joedirt、分枝杆菌属病毒Rumpelstiltskin、乳球菌属病毒bIL67、乳球菌属病毒c2、乳杆菌属病毒c5、乳杆菌属病毒Ld3、乳杆菌属病毒Ld17、乳杆菌属病毒Ld25A、乳杆菌属病毒LLKu、乳杆菌属病毒phiLdb、噬纤维素菌属病毒Cba121、噬纤维素菌属病毒Cba171、噬纤维素菌属病毒Cba181、噬纤维素菌属病毒ST、芽孢杆菌属病毒250、芽孢杆菌属病毒IEBH、分枝杆菌属病毒Ardmore、分枝杆菌属病毒Avani、分枝杆菌属病毒Boomer、分枝杆菌属病毒Che8、分枝杆菌属病毒Che9d、分枝杆菌属病毒Deadp、分枝杆菌属病毒Dlane、分枝杆菌属病毒Dorothy、分枝杆菌属病毒Dotproduct、分枝杆菌属病毒Drago、分枝杆菌属病毒Fruitloop、分枝杆菌属病毒Gumbie、分枝杆菌属病毒Ibhubesi、分枝杆菌属病毒Llij、分枝杆菌属病毒Mozy、分枝杆菌属病毒Mutaforma13、分枝杆菌属病毒Pacc40、分枝杆菌属病毒PMC、分枝杆菌属病毒Ramsey、分枝杆菌属病毒Rockyhorror、分枝杆菌属病毒SG4、分枝杆菌属病毒Shauna1、分枝杆菌属病毒Shilan、分枝杆菌属病毒Spartacus、分枝杆菌属病毒Taj、分枝杆菌属病毒Tweety、分枝杆菌属病毒Wee、分枝杆菌属病毒Yoshi、沙门氏菌属病毒Chi、沙门氏菌属病毒FSLSP030、沙门氏菌属病毒FSLSP088、沙门氏菌属病毒iEPS5、沙门氏菌属病毒SPN19、分枝杆菌属病毒244、分枝杆菌属病毒Bask21、分枝杆菌属病毒CJW1、分枝杆菌属病毒Eureka、分枝杆菌属病毒Kostya、分枝杆菌属病毒Porky、分枝杆菌属病毒Pumpkin、分枝杆菌属病毒Sirduracell、分枝杆菌属病毒Toto、分枝杆菌属病毒Corndog、分枝杆菌属病毒Firecracker、红细菌属病毒RcCronus、假单胞菌属病毒D3112、假单胞菌属病毒DMS3、假单胞菌属病毒FHA0480、假单胞菌属病毒LPB1、假单胞菌属病毒MP22、假单胞菌属病毒MP29、假单胞菌属病毒MP38、假单胞菌属病毒PA1KOR、假单胞菌属病毒D3、假单胞菌属病毒PMG1、节杆菌属病毒Decurro、戈登氏菌属病毒Demosthenes、戈登氏菌属病毒Katyusha、戈登氏菌属病毒Kvothe、丙酸杆菌属病毒B22、丙酸杆菌属病毒Doucette、丙酸杆菌属病毒E6、丙酸杆菌属病毒G4、伯克霍尔德氏菌属病毒phi6442、伯克霍尔德氏菌属病毒phi1026b、伯克霍尔德氏菌属病毒phiE125、爱德华菌属病毒eiAU、分枝杆菌属病毒Ff47、分枝杆菌属病毒Muddy、分枝杆菌属病毒Gaia、分枝杆菌属病毒Giles、节杆菌属病毒Captnmurica、节杆菌属病毒Gordon、戈登氏菌属病毒GordTnk2、类芽孢杆菌属病毒Harrison、埃希氏菌属病毒EK99P1、埃希氏菌属病毒HK578、埃希氏菌属病毒JL1、埃希氏菌属病毒SSL2009a、埃希氏菌属病毒YD2008s、志贺氏菌属病毒EP23、伴突属(Sodalis)病毒SO1、埃希氏菌属病毒HK022、埃希氏菌属病毒HK75、埃希氏菌属病毒HK97、埃希氏菌属病毒HK106、埃希氏菌属病毒HK446、埃希氏菌属病毒HK542、埃希氏菌属病毒HK544、埃希氏菌属病毒HK633、埃希氏菌属病毒mEp234、埃希氏菌属病毒mEp235、埃希氏菌属病毒mEpX1、埃希氏菌属病毒mEpX2、埃希氏菌属病毒mEp043、埃希氏菌属病毒mEp213、埃希氏菌属病毒mEp237、埃希氏菌属病毒mEp390、埃希氏菌属病毒mEp460、埃希氏菌属病毒mEp505、埃希氏菌属病毒mEp506、短芽孢杆菌属病毒Jenst、无色杆菌属病毒83-24、无色杆菌属病毒JWX、节杆菌属病毒Kellezzio、节杆菌属病毒Kitkat、节杆菌属病毒Bennie、节杆菌属病毒DrRobert、节杆菌属病毒Glenn、节杆菌属病毒HunterDalle、节杆菌属病毒Joann、节杆菌属病毒Korra、节杆菌属病毒Preamble、节杆菌属病毒Pumancara、节杆菌属病毒Wayne、分枝杆菌属病毒Alma、分枝杆菌属病毒Arturo、分枝杆菌属病毒Astro、分枝杆菌属病毒Backyardigan、分枝杆菌属病毒BBPiebs31、分枝杆菌属病毒Benedict、分枝杆菌属病毒Bethlehem、分枝杆菌属病毒Billknuckles、分枝杆菌属病毒Bruns、分枝杆菌属病毒Bxb1、分枝杆菌属病毒Bxz2、分枝杆菌属病毒Che12、分枝杆菌属病毒Cuco、分枝杆菌属病毒D29、分枝杆菌属病毒Doom、分枝杆菌属病毒Ericb、分枝杆菌属病毒Euphoria、分枝杆菌属病毒George、分枝杆菌属病毒Gladiator、分枝杆菌属病毒Goose、分枝杆菌属病毒Hammer、分枝杆菌属病毒Heldan、分枝杆菌属病毒Jasper、分枝杆菌属病毒JC27、分枝杆菌属病毒Jeffabunny、分枝杆菌属病毒JHC117、分枝杆菌属病毒KBG、分枝杆菌属病毒Kssjeb、分枝杆菌属病毒Kugel、分枝杆菌属病毒L5、分枝杆菌属病毒Lesedi、分枝杆菌属病毒LHTSCC、分枝杆菌属病毒lockley、分枝杆菌属病毒Marcell、分枝杆菌属病毒Microwolf、分枝杆菌属病毒Mrgordo、分枝杆菌属病毒Museum、分枝杆菌属病毒Nepal、分枝杆菌属病毒Packman、分枝杆菌属病毒Peaches、分枝杆菌属病毒Perseus、分枝杆菌属病毒Pukovnik、分枝杆菌属病毒Rebeuca、分枝杆菌属病毒Redrock、分枝杆菌属病毒Ridgecb、分枝杆菌属病毒Rockstar、分枝杆菌属病毒Saintus、分枝杆菌属病毒Skipole、分枝杆菌属病毒Solon、分枝杆菌属病毒Switzer、分枝杆菌属病毒SWU1、分枝杆菌属病毒Ta17a、分枝杆菌属病毒Tiger、分枝杆菌属病毒Timshel、分枝杆菌属病毒Trixie、分枝杆菌属病毒Turbido、分枝杆菌属病毒Twister、分枝杆菌属病毒U2、分枝杆菌属病毒Violet、分枝杆菌属病毒Wonder、埃希氏菌属病毒DE3、埃希氏菌属病毒HK629、埃希氏菌属病毒HK630、埃希氏菌属病毒lambda、节杆菌属病毒Laroye、分枝杆菌属病毒Halo、分枝杆菌属病毒Liefie、分枝杆菌属病毒Marvin、分枝杆菌属病毒Mosmoris、节杆菌属病毒Circum、节杆菌属病毒Mudcat、埃希氏菌属病毒N15、埃希氏菌属病毒9g、埃希氏菌属病毒JenK1、埃希氏菌属病毒JenP1、埃希氏菌属病毒JenP2、假单胞菌属病毒NP1、假单胞菌属病毒PaMx25、分枝杆菌属病毒Baka、分枝杆菌属病毒Courthouse、分枝杆菌属病毒Littlee、分枝杆菌属病毒Omega、分枝杆菌属病毒Optimus、分枝杆菌属病毒Thibault、极地杆菌属(Polaribacter)病毒P12002L、极地杆菌属病毒P12002S、不滑动菌属(Nonlabens)病毒P12024L、不滑动菌属病毒P12024S、栖热菌属(Thermus)病毒P23-45、栖热菌属病毒P74-26、李斯特菌属病毒LP26、李斯特菌属病毒LP37、李斯特菌属病毒LP110、李斯特菌属病毒LP114、李斯特菌属病毒P70、丙酸杆菌属病毒ATCC29399BC、丙酸杆菌属病毒ATCC29399BT、丙酸杆菌属病毒Attacne、丙酸杆菌属病毒Keiki、丙酸杆菌属病毒Kubed、丙酸杆菌属病毒Lauchelly、丙酸杆菌属病毒MrAK、丙酸杆菌属病毒Ouroboros、丙酸杆菌属病毒P91、丙酸杆菌属病毒P105、丙酸杆菌属病毒P144、丙酸杆菌属病毒P1001、丙酸杆菌属病毒P1.1、丙酸杆菌属病毒P100A、丙酸杆菌属病毒P100D、丙酸杆菌属病毒P101A、丙酸杆菌属病毒P104A、丙酸杆菌属病毒PA6、丙酸杆菌属病毒Pacnes201215、丙酸杆菌属病毒PAD20、丙酸杆菌属病毒PAS50、丙酸杆菌属病毒PHL009M11、丙酸杆菌属病毒PHL025M00、丙酸杆菌属病毒PHL037M02、丙酸杆菌属病毒PHL041M10、丙酸杆菌属病毒PHL060L00、丙酸杆菌属病毒PHL067M01、丙酸杆菌属病毒PHL070N00、丙酸杆菌属病毒PHL071N05、丙酸杆菌属病毒PHL082M03、丙酸杆菌属病毒PHL092M00、丙酸杆菌属病毒PHL095N00、丙酸杆菌属病毒PHL111M01、丙酸杆菌属病毒PHL112N00、丙酸杆菌属病毒PHL113M01、丙酸杆菌属病毒PHL114L00、丙酸杆菌属病毒PHL116M00、丙酸杆菌属病毒PHL117M00、丙酸杆菌属病毒PHL117M01、丙酸杆菌属病毒PHL132N00、丙酸杆菌属病毒PHL141N00、丙酸杆菌属病毒PHL151M00、丙酸杆菌属病毒PHL151N00、丙酸杆菌属病毒PHL152M00、丙酸杆菌属病毒PHL163M00、丙酸杆菌属病毒PHL171M01、丙酸杆菌属病毒PHL179M00、丙酸杆菌属病毒PHL194M00、丙酸杆菌属病毒PHL199M00、丙酸杆菌属病毒PHL301M00、丙酸杆菌属病毒PHL308M00、丙酸杆菌属病毒Pirate、丙酸杆菌属病毒Procrass1、丙酸杆菌属病毒SKKY、丙酸杆菌属病毒Solid、丙酸杆菌属病毒Stormborn、丙酸杆菌属病毒Wizzo、假单胞菌属病毒PaMx28、假单胞菌属病毒PaMx74、分枝杆菌属病毒Patience、分枝杆菌属病毒PBI1、红球菌属病毒Pepy6、红球菌属病毒Poco6、丙酸杆菌属病毒PFR1、链霉菌属病毒phiBT1、链霉菌属病毒phiC31、链霉菌属病毒TG1、柄杆菌属(Caulobacter)病毒Karma、柄杆菌属病毒Magneto、柄杆菌属病毒phiCbK、柄杆菌属病毒Rogue、柄杆菌属病毒Swift、葡萄球菌属病毒11、葡萄球菌属病毒29、葡萄球菌属病毒37、葡萄球菌属病毒53、葡萄球菌属病毒55、葡萄球菌属病毒69、葡萄球菌属病毒71、葡萄球菌属病毒80、葡萄球菌属病毒85、葡萄球菌属病毒88、葡萄球菌属病毒92、葡萄球菌属病毒96、葡萄球菌属病毒187、葡萄球菌属病毒52a、葡萄球菌属病毒80alpha、葡萄球菌属病毒CNPH82、葡萄球菌属病毒EW、葡萄球菌属病毒IPLA5、葡萄球菌属病毒IPLA7、葡萄球菌属病毒IPLA88、葡萄球菌属病毒PH15、葡萄球菌属病毒phiETA、葡萄球菌属病毒phiETA2、葡萄球菌属病毒phiETA3、葡萄球菌属病毒phiMR11、葡萄球菌属病毒phiMR25、葡萄球菌属病毒phiNM1、葡萄球菌属病毒phiNM2、葡萄球菌属病毒phiNM4、葡萄球菌属病毒SAP26、葡萄球菌属病毒X2、肠球菌属病毒FL1、肠球菌属病毒FL2、肠球菌属病毒FL3、乳杆菌属病毒ATCC8014、乳杆菌属病毒phiJL1、片球菌属(Pediococcus)病毒cIP1、气单胞菌属病毒pIS4A、李斯特菌属病毒LP302、李斯特菌属病毒PSA、甲烷杆菌属(Methanobacterium)病毒psiM1、玫瑰杆菌属病毒RDJL1、玫瑰杆菌属病毒RDJL2、红球菌属病毒RER2、肠球菌属病毒BC611、肠球菌属病毒IMEEF1、肠球菌属病毒SAP6、肠球菌属病毒VD13、链球菌属病毒SPQS1、分枝杆菌属病毒Papyrus、分枝杆菌属病毒Send513、伯克霍尔德氏菌属病毒KL1、假单胞菌属病毒73、假单胞菌属病毒Ab26、假单胞菌属病毒Kakheti25、埃希氏菌属病毒Cajan、埃希氏菌属病毒Seurat、葡萄球菌属病毒SEP9、葡萄球菌属病毒Sextaec、链球菌属病毒858、链球菌属病毒2972、链球菌属病毒ALQ132、链球菌属病毒O1205、链球菌属病毒Sfi11、链球菌属病毒7201、链球菌属病毒DT1、链球菌属病毒phiAbc2、链球菌属病毒Sfi19、链球菌属病毒Sfi21、类芽孢杆菌属病毒Diva、类芽孢杆菌属病毒Hb10c2、类芽孢杆菌属病毒Rani、类芽孢杆菌属病毒Shelly、类芽孢杆菌属病毒Sitara、类芽孢杆菌属病毒Willow、乳球菌属病毒712、乳球菌属病毒ASCC191、乳球菌属病毒ASCC273、乳球菌属病毒ASCC281、乳球菌属病毒ASCC465、乳球菌属病毒ASCC532、乳球菌属病毒Bibb29、乳球菌属病毒bIL170、乳球菌属病毒CB13、乳球菌属病毒CB14、乳球菌属病毒CB19、乳球菌属病毒CB20、乳球菌属病毒jj50、乳球菌属病毒P2、乳球菌属病毒P008、乳球菌属病毒sk1、乳球菌属病毒Sl4、芽孢杆菌属病毒Slash、芽孢杆菌属病毒Stahl、芽孢杆菌属病毒Staley、芽孢杆菌属病毒Stills、戈登氏菌属病毒Bachita、戈登氏菌属病毒ClubL、戈登氏菌属病毒OneUp、戈登氏菌属病毒Smoothie、戈登氏菌属病毒Soups、芽孢杆菌属病毒SPbeta、弧菌属病毒MAR10、弧菌属病毒SSP002、埃希氏菌属病毒AKFV33、埃希氏菌属病毒BF23、埃希氏菌属病毒DT57C、埃希氏菌属病毒EPS7、埃希氏菌属病毒FFH1、埃希氏菌属病毒H8、埃希氏菌属病毒slur09、埃希氏菌属病毒T5、沙门氏菌属病毒118970sal2、沙门氏菌属病毒Shivani、沙门氏菌属病毒SPC35、沙门氏菌属病毒Stitch、节杆菌属病毒Tank、冢村氏菌属(Tsukamurella)病毒TIN2、冢村氏菌属病毒TIN3、冢村氏菌属病毒TIN4、红细菌属病毒RcSpartan、红细菌属病毒RcTitan、分枝杆菌属病毒Anaya、分枝杆菌属病毒Angelica、分枝杆菌属病毒Crimd、分枝杆菌属病毒Fionnbarth、分枝杆菌属病毒Jaws、分枝杆菌属病毒Larva、分枝杆菌属病毒Macncheese、分枝杆菌属病毒Pixie、分枝杆菌属病毒TM4、芽孢杆菌属病毒BMBtp2、芽孢杆菌属病毒TP21、土芽孢杆菌属病毒Tp84、葡萄球菌属病毒47、葡萄球菌属病毒3a、葡萄球菌属病毒42e、葡萄球菌属病毒IPLA35、葡萄球菌属病毒phi12、葡萄球菌属病毒phiSLT、分枝杆菌属病毒32HC、红球菌属病毒RGL3、类芽孢杆菌属病毒Vegas、戈登氏菌属病毒Vendetta、芽孢杆菌属病毒Wbeta、分枝杆菌属病毒Wildcat、戈登氏菌属病毒Twister6、戈登氏菌属病毒Wizard、戈登氏菌属病毒Hotorobo、戈登氏菌属病毒Monty、戈登氏菌属病毒Woes、黄单胞菌属病CP1、黄单胞菌属病毒OP1、黄单胞菌属病phil7、黄单胞菌属病Xop411、黄单胞菌属病Xp10、链霉菌属病毒TP1604、链霉菌属病毒YDN12、α-变形菌纲(Alphaproteobacteria)病毒phiJl001、假单胞菌属病毒LKO4、假单胞菌属病毒M6、假单胞菌属病毒MP1412、假单胞菌属病毒PAE1、假单胞菌属病毒Yua、假交替单胞菌属(Pseudoalteromonas)病毒PM2、假单胞菌属病毒phi6、假单胞菌属病毒phi8、假单胞菌属病毒phi12、假单胞菌属病毒phi13、假单胞菌属病毒phi2954、假单胞菌属病毒phiNN、假单胞菌属病毒phiYY、弧菌属病毒fs1、弧菌属病毒VGJ、罗尔斯通氏菌属病毒RS603、罗尔斯通氏菌属病毒RSM1、罗尔斯通氏菌属病毒RSM3、埃希氏菌属病毒M13、埃希氏菌属病毒I22、沙门氏菌属病毒IKe、无胆甾原体属(Acholeplasma)病毒L51、弧菌属病毒fs2、弧菌属病毒VFJ、埃希氏菌属病毒If1、丙酸杆菌属病毒B5、假单胞菌属病毒Pf1、假单胞菌属病毒Pf3、罗尔斯通氏菌属病毒PE226、罗尔斯通氏菌属病毒RSS1、螺原体属(Spiroplasma)病毒SVTS2、窄食单胞菌属病毒PSH1、窄食单胞菌属病毒SMA6、窄食单胞菌属病毒SMA7、窄食单胞菌属病毒SMA9、弧菌属病毒CTXphi、弧菌属病毒KSF1、弧菌属病毒VCY、弧菌属病毒Vf33、弧菌属病毒VfO3K6、黄单胞菌属病毒Cf1c、螺原体属病毒C74、螺原体属病毒R8A2B、螺原体属病毒SkV1CR23x、埃希氏菌属病毒FI、埃希氏菌属病毒Qbeta、埃希氏菌属病毒BZ13、埃希氏菌属病毒MS2、埃希氏菌属病毒alpha3、埃希氏菌属病毒ID21、埃希氏菌属病毒ID32、埃希氏菌属病毒ID62、埃希氏菌属病毒NC28、埃希氏菌属病毒NC29、埃希氏菌属病毒NC35、埃希氏菌属病毒phiK、埃希氏菌属病毒St1、埃希氏菌属病毒WA45、埃希氏菌属病毒G4、埃希氏菌属病毒ID52、埃希氏菌属病毒Talmos、埃希氏菌属病毒phiX174、蛭弧菌属病毒MAC1、蛭弧菌属病毒MH2K、衣原体属病毒Chp1、衣原体属病毒Chp2、衣原体属病毒CPAR39、衣原体属病毒CPG1、螺原体属病毒SpV4、无胆甾原体属病毒L2、假单胞菌属病毒PR4、假单胞菌属病毒PRD1、芽孢杆菌属病毒AP50、芽孢杆菌属病毒Bam35、芽孢杆菌属病毒GIL16、芽孢杆菌属病毒Wip1、埃希氏菌属病毒phi80、埃希氏菌属病毒RB42、埃希氏菌属病毒T2、埃希氏菌属病毒T3、埃希氏菌属病毒T6、埃希氏菌属病毒VT2-Sa、埃希氏菌属病毒VT1-Sakai、埃希氏菌属病毒VT2-Sakai、埃希氏菌属病毒CP-933V、埃希氏菌属病毒P27、埃希氏菌属病毒Stx2phi-I、埃希氏菌属病毒Stx1phi、埃希氏菌属病毒Stx2phi-II、埃希氏菌属病毒CP-1639、基于埃希氏菌属病毒BP-4795、埃希氏菌属病毒86、埃希氏菌属病毒Min27、埃希氏菌属病毒2851、埃希氏菌属病毒1717、埃希氏菌属病毒YYZ-2008、埃希氏菌属病毒EC026_P06、埃希氏菌属病毒ECO103_P15、埃希氏菌属病毒ECO103_P12、埃希氏菌属病毒ECO111_P16、埃希氏菌属病毒ECO111_P11、埃希氏菌属病毒VT2phi_272、埃希氏菌属病毒TL-2011c、埃希氏菌属病毒P13374、埃希氏菌属病毒Sp5。
在一个实施方案中,细菌病毒颗粒一般靶向大肠杆菌,并且包括选自以下的细菌噬菌体的衣壳:BW73、B278、D6、D108、E、El、E24、E41、FI-2、FI-4、FI-5、HI8A、Ffl8B、i、MM、Mu、025、PhI-5、Pk、PSP3、Pl、PlD、P2、P4、Sl、7A、18、28-1、186、299、HH-埃希氏菌属(2)、AB48、CM、C4、C16、DD-VI、E4、E7、E28、FIl、FI3、H、Hl、H3、H8、K3、M、N、ND-2、ND-3、ND4、ND-5、ND6、ND-7、Ox-I、Ox-2、Ox-3、Ox-4、Ox-5、Ox-6、PhI-I、RB42、RB43、RB49、RB69、S、SaI-I、Sal-2、Sal-3、Sal-4、Sal-5、Sal-6、TC23、TC45、TuII*-6、TuIP-24、TuII*46、TuIP-60、T2、T4、T6、T35、αl、1、IA、3、3A、3T+、/>9266Q、CFO103、HK620、J、K、KlF、m59、no.A、no.E、no.3、no.9、N4、sd、T3、T7、WPK、W31、ΔH、 Φ04-CF、Φ05、Φ06、Φ07、 Ω8、1、3、7、8、26、27、28-2、29、30、31、32、38、39、42、933W、NN-埃希氏菌属(1)、Esc-7-11、AC30、CVX-5、Cl、DDUP、ECl、EC2、E21、E29、Fl、F26S、F27S、Hi、HK022、HK97、HK139、HK253、HK256、K7、ND-I、PA-2、q、S2、Tl、)、T3C、T5、UC-I、w、β4、γ2、λ、ΦD326、/>Φ06、Φ7、Φ10、/>χ、2、4、4A、6、8A、102、150、168、174、3000、AC6、AC7、AC28、AC43、AC50、AC57、AC81、AC95、HK243、KlO、ZG/3A、5、5A、21EL、H19-J和933H。
药用或兽药用组合物
本公开还提供药用或兽药用组合物,其包含如以上“细菌递送媒介物”部分中定义的细菌递送媒介物和药学上可接受的载剂。
通常,对于药用用途,细菌递送媒介物可被配制为包含至少一种细菌递送媒介物和至少一种药学上可接受的载剂、稀释剂或赋形剂以及任选地一种或多种另外的药用活性化合物的药用制剂或组合物。此种制剂可呈适合于口服给予,适合于胃肠外给予(比如通过静脉内、肌内或皮下注射或静脉内输注),适合于局部给予,适合于通过吸入、皮肤贴剂、植入剂、栓剂等给予的形式。在特定实施方案中,所述组合物用于口服给予。此类给予形式可为固体、半固体或液体,这取决于给予方式和途径。例如,用于口服给予的制剂可被提供有将会允许制剂中的合成细菌递送媒介物抵抗胃环境并进入肠道的肠溶包衣。更通常地,用于口服给予的合成细菌递送媒介物制剂可被适当地配制成用于递送到胃肠道的任何期望部分中。另外,合适的栓剂可被用于递送到胃肠道中。用于细菌递送媒介物组合物的各种药学上可接受的载剂、稀释剂和赋形剂为技术人员已知的。
根据本公开的药用或兽药用组合物可进一步包含药学上可接受的媒介物。固体药学上可接受的媒介物可包括也可用作矫味剂、润滑剂、增溶剂、助悬剂、染料、填充剂、助流剂、压缩助剂、惰性粘合剂、甜味剂、防腐剂、染料、包衣剂或片剂崩解剂的一种或多种物质。合适的固体媒介物包括例如磷酸钙、硬脂酸镁、滑石粉、糖、乳糖、糊精、淀粉、明胶、纤维素、聚乙烯吡咯烷酮、低熔点蜡和离子交换树脂。
药用或兽药用组合物可被制备为无菌固体组合物,其可在给予时使用无菌水、盐水或其他适当的无菌可注射介质进行悬浮。本文公开的药用或兽药用组合物可以含有以下的无菌溶液剂或混悬剂的形式口服给予:其他溶质或助悬剂(例如足够的盐水或葡萄糖以使溶液等渗)、胆汁盐、阿拉伯胶、明胶、失水山梨醇单油酸酯、聚山梨酯80(与环氧乙烷共聚合的山梨醇及其酸酐的油酸酯)等。根据本公开的颗粒也可以液体或固体组合物的形式口服给予。适合于口服给予的组合物包括固体形式(比如丸剂、胶囊剂、颗粒剂、片剂和粉剂)以及液体形式(比如溶液剂、糖浆剂、酏剂和混悬剂)。可用于肠内给予的形式包括无菌溶液剂、乳剂和混悬剂。
本文公开的细菌递送媒介物可被溶解或悬浮于药学上可接受的液体媒介物中,所述液体媒介物比如水、有机溶剂、两者的混合物或者药学上可接受的油或脂肪。液体媒介物可含有其他合适的药用添加剂,比如增溶剂、乳化剂、缓冲剂、防腐剂、甜味剂、矫味剂、助悬剂、增稠剂、着色剂、粘度调节剂、稳定剂或渗透压调节剂。用于口服和肠内给予的液体媒介物的合适实例包括水(部分地含有如上的添加剂,例如纤维素衍生物,优选羧甲基纤维素钠溶液)、醇(包括一元醇和多元醇,例如二醇)及其衍生物以及油(例如分馏的椰子油和花生油)。对于胃肠外给予,媒介物也可为油性酯,比如油酸乙酯和肉豆蔻酸异丙酯。无菌液体媒介物可用于肠内给予的无菌液体形式组合物。用于加压组合物的液体媒介物可为卤代烃或其他药学上可接受的推进剂。
对于透皮给予,药用或兽药用组合物可被配制成软膏剂、乳膏剂或凝胶剂形式,并且可使用适当的渗透剂或去污剂来促进渗透,比如二甲基亚砜、二甲基乙酰胺和二甲基甲酰胺。
对于经粘膜给予,可使用鼻喷雾剂、直肠或阴道栓剂。可通过本领域已知的方法将活性化合物掺入到任何已知的栓剂基质中。此类基质的实例包括可可脂、聚乙二醇(碳蜡)、聚乙烯失水山梨醇单硬脂酸酯以及这些与其他相容性材料的混合物,以改变熔点或溶出速率。
在另一个特定实施方案中,本公开提供用于改善药物有效性的如上定义的药用或兽药用组合物。确实,已知微生物组的一些细菌尽管本身并不具有致病性,但能够代谢药物并将它们修饰为无效或有害分子。
在另一个特定实施方案中,本公开提供一种组合物,其可进一步包含至少一种另外的活性成分,例如益生元和/或益生菌和/或抗生素,和/或另一种抗菌或抗生物膜剂,和/或增强细菌递送媒介物对细菌的靶向和/或有效载荷向细菌中的递送的任何试剂。
如本文使用的,“益生元”是指允许可为宿主赋予益处的胃肠微生物群中组成和/或活性两者的特定变化的成分。益生元可为可食用的食物或饮料或其成分。益生元可为选择性地发酵的成分。益生元可包括复合碳水化合物、氨基酸、肽、矿物质或用于细菌组合物存活的其他必需营养组分。益生元包括但不限于氨基酸、生物素、果寡糖、半乳寡糖、半纤维素(例如阿拉伯木聚糖、木聚糖、木葡聚糖和葡甘露聚糖)、菊粉、几丁质、乳果糖、甘露寡糖、富含低聚果糖的菊粉、胶(例如瓜尔胶、阿拉伯树胶和角叉菜胶)、低聚果糖、低聚右旋糖、塔格糖、抗性麦芽糖糊精(例如抗性淀粉)、反式半乳寡糖、果胶(例如木糖半乳糖醛酸(xylogalactouronan)、柑橘果胶、苹果果胶和鼠李半乳糖醛酸(rhamnogalacturonan)-I)、膳食纤维(例如大豆纤维、甜菜纤维、豌豆纤维、玉米麸和燕麦纤维)和木寡糖。
如本文使用的,“益生菌”是指基于活微生物的膳食补充剂,其在以足够量摄入时,通过增强肠道生态系统而对宿主生物体具有有益影响。益生菌可包含非致病性细菌或真菌群体,例如免疫调节性细菌群体,比如抗炎细菌群体,具有或不具有一种或多种益生元。它们含有足够高数量的存活且有活性的益生菌微生物,其可通过直接定殖而对肠道菌群发挥平衡作用。必须注意的是,出于本说明书的目的,采用术语“益生菌”以意指益生菌的任何生物活性形式,优选地包括但不限于乳酸杆菌(lactobacilli)、双歧杆菌(bifidobacteria)、链球菌(streptococci)、肠球菌(enterococci)、丙酸杆菌(propionibacteria)或酵母菌(saccharomycetes),而且甚至包括组成正常肠道菌群的其他微生物,或者还包括这些微生物的细菌壁或DNA的片段。这些组合物对于适合于安全给予人类和其他哺乳动物受试者为有利的,并且对于治疗、预防由细菌引起的疾病或障碍比如细菌感染为有效的。益生菌包括但不限于乳酸杆菌、双歧杆菌、链球菌、肠球菌、丙酸杆菌、酵母菌、乳酸杆菌、双歧杆菌或变形菌门。
抗生素可选自青霉素类,比如青霉素G、青霉素K、青霉素N、青霉素O、青霉素V、甲氧西林、苄基青霉素、萘夫西林、苯唑西林、氯唑西林、双氯西林、氨苄西林、阿莫西林、匹氨西林、海他西林、巴氨西林、美坦西林、酞氨西林、依匹西林、羧苄西林、替卡西林、替莫西林、美洛西林和哌拉西林;头孢菌素类,比如头孢乙腈、头孢羟氨苄、头孢氨苄、头孢来星、头孢洛宁、头孢噻啶、头孢噻吩、头孢匹林、头孢曲嗪、头孢氮氟、头孢西酮、头孢唑啉、头孢拉定、头孢沙定、头孢替唑、头孢克洛、头孢尼西、头孢丙烯、头孢呋辛、头孢唑南、头孢美唑、头孢替坦、头孢西丁、氯碳头孢、头孢拉宗、头孢米诺、头孢替坦、头孢西丁、头孢替安、头孢卡品、头孢达肟、头孢地尼、头孢托仑、头孢他美、头孢克肟、头孢甲肟、头孢地嗪、头孢噻肟、头孢维星、头孢咪唑、头孢泊肟、头孢特仑、ceftamere、头孢布烯、头孢噻呋、头孢噻林、头孢唑肟、头孢曲松、头孢哌酮、头孢他啶、拉氧头孢、头孢克定、头孢吡肟、头孢瑞南、头孢噻利、头孢唑兰、头孢匹罗、头孢喹肟、氟氧头孢、头孢比罗、头孢洛林、头孢洛扎、头孢洛仑、头孢帕罗、头孢卡奈、头孢屈洛、头孢吡酮、头孢三唑、头孢维曲、头孢替林、cefmepidium、头孢噁唑、头孢罗替、头孢舒米、头孢噻氧、头孢呋汀和头孢硝噻吩;多粘菌素类,比如多孢菌素、新孢霉素、多粘菌素B和多粘菌素E;利福平类,比如利福平、利福喷丁和利福昔明;非达霉素;喹诺酮类,比如西诺沙星、萘啶酸、噁喹酸、吡咯米酸、吡哌酸、罗索沙星、环丙沙星、依诺沙星、氟罗沙星、洛美沙星、那氟沙星、诺氟沙星、氧氟沙星、培氟沙星、芦氟沙星、巴洛沙星、格帕沙星、左氧氟沙星、帕珠沙星、替马沙星、托氟沙星、克林沙星、加替沙星、吉米沙星、莫西沙星、西他沙星、曲伐沙星、普卢利沙星、德拉沙星、奈诺沙星和扎波沙星;磺胺类,比如磺胺异噁唑、磺胺醋酰、磺胺嘧啶、磺胺二甲嘧啶、磺胺异噁唑、磺胺索嘧啶、磺胺多辛、磺胺甲噁唑、磺胺二甲唑、磺胺硝苯、磺胺地索辛、磺胺甲氧基哒嗪、磺胺对甲氧嘧啶、磺胺多辛、磺胺甲氧吡嗪和terephtyl;大环内酯类,比如阿奇霉素、克拉霉素、红霉素、非达霉素、泰利霉素、卡波霉素A、交沙霉素、吉他霉素、麦迪霉素、竹桃霉素、索利霉素、螺旋霉素、醋竹桃霉素、泰乐菌素和罗红霉素;酮内酯类,比如泰利霉素和赛红霉素;氟酮内酯类,比如索利霉素;林可酰胺类,比如林可霉素、克林霉素和吡利霉素;四环素类,比如地美环素、多西环素、米诺环素、土霉素和四环素;氨基糖苷类,比如阿米卡星、地贝卡星、庆大霉素、卡那霉素、新霉素、奈替米星、西索米星、妥布霉素、巴龙霉素和链霉素;安莎霉素类,比如格尔德霉素、除莠霉素和利福昔明;碳头孢烯类,比如氯碳头孢;碳青霉烯类,比如厄他培南、多利培南、亚胺培南(或西司他丁)和美罗培南;糖肽类,比如替考拉宁、万古霉素、特拉万星、达巴万星和奥利万星;林可酰胺类,比如克林霉素和林可霉素;脂肽类,比如达托霉素;单环内酰胺类,比如氨曲南;硝基呋喃类,比如呋喃唑酮和呋喃妥因;噁唑烷酮类,比如利奈唑胺、泼斯唑来、雷德唑来和特地唑胺;泰斯巴汀、氯法齐明、氨苯砜、卷曲霉素、环丝氨酸、乙胺丁醇、乙硫异烟胺、异烟肼、吡嗪酰胺、利福布汀、胂凡钠明、氯霉素、磷霉素、夫西地酸、甲硝唑、莫匹罗星、平板霉素、喹奴普丁(或达福普汀)、甲砜霉素、替加环素、替硝唑、甲氧苄啶、阿拉曲沙星、非达霉素、萘啶酸、利福平、其衍生物和组合。
应用
本公开提供用于将感兴趣的DNA有效载荷体内递送到受试者中的方法,其包括给予所述受试者如本文公开的药用或兽药用组合物。
还提供用于使用本文公开的细菌递送媒介物或组合物治疗由细菌引起的疾病或障碍比如细菌感染的方法。方法包括给予患有需要治疗的细菌感染的受试者治疗有效量的本文公开的细菌递送媒介物或组合物。
本公开还提供在用于治疗由细菌引起的疾病或障碍的方法中使用的本文公开的药用或兽药用组合物或者本文公开的细菌递送媒介物。
本公开的另一个目的涉及提供如本文所述的细菌递送媒介物用于制造预期治疗由细菌引起的疾病或障碍的药物的用途。
在一些实施方案中,受试者为哺乳动物。在一些实施方案中,受试者为人类。
所述疾病或障碍可为细菌感染、代谢障碍或涉及人类微生物组细菌的病理学。
由细菌引起的疾病或障碍可选自腹部绞痛、寻常痤疮、急性会厌炎、关节炎、菌血症、血性腹泻、肉毒中毒、布鲁氏菌病、脑部脓肿、软下疳性病、衣原体病、克罗恩病、结膜炎、胆囊炎、结直肠癌、息肉病、菌群失调(dysbiosis)、莱姆病、腹泻、白喉、十二指肠溃疡、心内膜炎、丹毒丝菌病(erysipelothricosis)、肠热症、发热、肾小球肾炎、胃肠炎、胃溃疡、格巴二氏综合征、破伤风、淋病、牙龈炎、炎症性肠病、肠易激综合征、钩端螺旋体病、麻风病、李斯特菌病、结核病、温夫人综合征、军团病、脑膜炎、粘液脓性结膜炎、多药抗性细菌感染、多药抗性细菌携带、肌坏死-气性坏疽、鸟分枝杆菌综合征(mycobacterium avium complex)、新生儿坏死性小肠结肠炎、诺卡氏菌病、院内感染、耳炎、牙周炎、咽炎、肺炎、腹膜炎、紫癜热、落基山斑疹热、志贺氏菌病、梅毒、窦炎、乙状结肠炎、败血病、皮下脓肿、土拉菌病、气管支气管炎、扁桃体炎、伤寒热、溃疡性结肠炎、尿路感染、百日咳。
由细菌引起的疾病或障碍可为选自以下的细菌感染:皮肤感染比如痤疮,肠道感染比如食道炎、胃炎、肠炎、结肠炎、乙状结肠炎、直肠炎和腹膜炎,尿路感染,阴道感染,女性上生殖道感染比如输卵管炎、子宫内膜炎、卵巢炎、子宫肌炎、子宫旁组织炎和盆腔腹膜感染,呼吸道感染比如肺炎,羊膜内感染,牙源性感染,牙髓性感染,纤维化,脑膜炎,血流感染,院内感染比如导管相关感染、医院获得性肺炎、产后感染、医院获得性胃肠炎、医院获得性尿路感染,及其组合。在一个实施方案中,根据本公开的感染由呈现抗生素抗性的细菌引起。在特定实施方案中,感染由如上在靶标细菌中列出的细菌引起。
由细菌引起的疾病或障碍也可为代谢障碍,例如肥胖症和/或糖尿病。因此,本公开还涉及用于治疗包括例如肥胖症和/或糖尿病在内的代谢障碍的如本文公开的药用或兽药用组合物。其进一步涉及包括给予治疗有效量的如本文公开的药用或兽药用组合物的用于治疗代谢障碍的方法,以及如本文公开的药用或兽药用组合物用于制造用于治疗代谢障碍的药物的用途。
由细菌引起的疾病或障碍也可为涉及人类微生物组细菌的病理学。因此,在特定实施方案中,本公开涉及用于治疗涉及人类微生物组细菌的病理学比如炎症性和自身免疫疾病、癌症、感染或脑部障碍的如本文公开的药用或兽药用组合物。其进一步涉及包括给予治疗有效量的如本文公开的药物或兽药用组合物的用于治疗涉及人类微生物组细菌的病理学的方法,以及如本文公开的药用或兽药用组合物用于制造用于治疗涉及人类微生物组细菌的病理学的药物的用途。确实,微生物组的一些细菌在不触发任何感染的情况下可分泌将会诱导和/或增强炎症性或自身免疫性疾病或癌症发展的分子。更具体地讲,本公开还涉及调节微生物组的组成以改善免疫疗法的效力,所述免疫疗法基于例如CAR-T(嵌合抗原受体T)细胞、TIL(肿瘤浸润性淋巴细胞)以及也被称为抑制性T细胞的Treg(调节性T细胞)。调节微生物组的组成以改善免疫疗法的效力还可包括使用本领域众所周知的免疫检查点抑制剂,其非限制性地比如为PD-1(程序性细胞死亡蛋白1)抑制剂、PD-L1(程序性死亡配体1)抑制剂和CTLA-4(细胞毒性T淋巴细胞相关蛋白4)。
在某些实施方案中,待治疗的疾病为癌症或增殖性障碍,包括但不限于乳腺癌(例如三阴性乳腺癌、ER+乳腺癌或ER-乳腺癌)、基底细胞癌、皮肤癌、肺癌、小细胞肺癌、非小细胞肺癌、脑癌、髓母细胞瘤、神经胶质瘤(包括胶质母细胞瘤、少突神经胶质瘤、星形细胞瘤、室管膜瘤)、神经母细胞瘤、结直肠癌、卵巢癌、肝癌、胰腺癌(例如癌、血管肉瘤、腺肉瘤)、胃癌、胃食道连接部癌、前列腺癌、宫颈癌、膀胱癌、头颈癌、淋巴瘤(例如套细胞淋巴瘤、弥漫性大B细胞淋巴瘤)、可切除实体瘤或无法通过手术移除的实体瘤、局部晚期实体瘤、转移性实体瘤、白血病(例如急性髓系白血病(AML)、急性淋巴母细胞性白血病(ALL)或慢性髓系白血病(CML))或者复发性或难治性肿瘤。
在一个实施方案中,待治疗的疾病包括但不限于炎症性或过敏性疾病,包括全身性过敏反应和超敏反应障碍、特应性皮炎、荨麻疹、药物过敏、昆虫叮咬过敏、食物过敏(包括乳糜泻等)和肥大细胞增多症;炎症性肠病,包括克罗恩病、溃疡性结肠炎、回肠炎和肠炎;血管炎和白塞综合征;银屑病和炎症性皮肤病,包括皮炎、湿疹、特应性皮炎、过敏性接触性皮炎、荨麻疹、病毒性皮肤病理学(包括源于人类乳头瘤病毒、HIV或RLV感染的那些)、细菌性、真菌性(flugal)和其他寄生皮肤病理学以及皮肤红斑狼疮;哮喘和呼吸道过敏性疾病,包括过敏性哮喘、运动诱发哮喘、过敏性鼻炎、中耳炎、过敏性结膜炎、过敏性肺病和慢性阻塞性肺病;自身免疫性疾病,包括关节炎(包括类风湿性和银屑病性)、系统性红斑狼疮、I型糖尿病、重症肌无力、多发性硬化、格雷夫斯病和肾小球肾炎;移植物排斥(包括同种异体移植物排斥和移植物抗宿主病),例如皮肤移植物排斥、实体器官移植物排斥、骨髓移植物排斥;发热;心血管障碍,包括急性心力衰竭、低血压、高血压、心绞痛、心肌梗塞、心肌病、充血性心力衰竭、动脉粥样硬化、冠状动脉疾病、再狭窄和血管狭窄;脑血管障碍,包括创伤性脑损伤、中风、缺血性再灌注损伤和动脉瘤;纤维化、结缔组织病和结节病、生殖器和生殖性病症包括勃起功能障碍;胃肠障碍,包括胃炎、溃疡、恶心、胰腺炎和呕吐;神经障碍,包括阿尔茨海默病;睡眠障碍,包括失眠、发作性睡病、睡眠呼吸暂停综合征和匹克威克综合征;疼痛;肾脏障碍;眼部障碍,包括青光眼;和非细菌性感染性疾病,包括HIV。
在一些方面,待治疗的疾病可为自身免疫性疾病,比如自身免疫性溶血性贫血、自身免疫性新生儿血小板减少、自身免疫性中性粒细胞减少、自身免疫性血细胞减少(autoimmunocytopenia)、抗磷脂综合征、皮炎、麸质过敏性肠病、过敏性脑脊髓炎、心肌炎、复发性多软骨炎、风湿性心脏病、肾小球肾炎、多发性硬化、神经炎、葡萄膜炎、眼炎、多内分泌腺病、紫癜、莱特尔氏病(Reiter’s Disease)、僵人综合征、自身免疫性肺部炎症、心肌炎、IgA肾小球肾炎、致密物沉积病(dense deposit disease)、风湿性心脏病、格巴二氏综合征、胰岛素依赖型糖尿病、自身免疫性炎症性眼病(autoimmune inflammatory eye)、自身免疫性甲状腺炎、甲状腺功能减退、系统性红斑狼疮、盘状狼疮、古德帕斯综合征(Goodpasture’s syndrome)、天疱疮、格雷夫斯病、重症肌无力以及胰岛素抵抗、自身免疫性溶血性贫血、自身免疫性血小板减少性紫癜、类风湿性关节炎、具有抗胶原抗体的硬皮病(schleroderma)、混合性结缔组织病、多发性肌炎/皮肌炎、恶性贫血、特发性艾迪生病、不孕症、肾小球肾炎、大疱性类天疱疮、舍格伦综合征(Sjogren's syndrome)、糖尿病、伴随哮喘或囊性纤维化的肾上腺素能药物抗性、慢性活动性肝炎、原发性胆汁性肝硬化、内分泌腺衰竭、白癜风、血管炎、MI后(post-MI)、心切开术综合征、荨麻疹、特应性皮炎、哮喘、炎症性肌病、炎症性障碍、肉芽肿性障碍、萎缩性障碍或同种异体免疫性疾病。
待治疗的受试者可能已经被诊断患有感染、障碍和/或疾病,或者可能处于发展感染、障碍和/或疾病的风险下,优选地由于细菌所致。此类感染、障碍和/或疾病的诊断方法为本领域技术人员众所周知的。
在特定实施方案中,感染、障碍和/或疾病呈现出对治疗的抗性,优选地感染、障碍或疾病呈现出抗生素抗性。
在特定实施方案中,受试者在给予根据本发明的递送媒介物或者根据本发明的药用或兽药用组合物之前从未接受过任何治疗。
在特定实施方案中,受试者在给予根据本发明的递送媒介物或者根据本发明的药用或兽药用组合物之前已经至少接受一个治疗线,优选地几个治疗线。
优选地,治疗定期给予,优选地在每天到每月之间,更优选地在每天到每两周之间,更优选地在每天到每周之间,甚至更优选地治疗每天给予。在特定实施方案中,治疗一天几次地给予,优选一天2或3次,甚至更优选一天3次。
用根据本发明的递送媒介物或者用根据本发明的药用或兽药用组合物治疗的持续时间,优选被包括在1天到20周之间,更优选在1天到10周之间,仍然更优选在1天到4周之间,甚至更优选在1天到2周之间。在特定实施方案中,治疗的持续时间为约1周。或者,只要感染、障碍和/疾病持续存在,治疗即可持续。
药用或兽药用组合物的形式、根据本发明的递送媒介物或者根据本发明药用或兽药用组合物的给予途径和给予剂量,可由本领域技术人员根据感染的类型和严重程度(例如根据疾病、障碍和/或感染所涉及的细菌种类及其在患者或受试者体内的定位)以及患者或受试者,特别是其年龄、体重、性别和一般身体状况进行调整。
特别地,待给予的根据本发明的递送媒介物或者根据本发明的药用或兽药用组合物的量,必须通过本领域普通技术人员众所周知的标准程序来确定。必须考虑到患者或受试者的生理数据(例如年龄、大小和体重)和给予途径来确定适当的剂量,从而将会给予患者或受试者治疗有效量。
例如,用于每次给予的根据本发明的递送媒介物的总量在104-1015递送媒介物之间。
在特定实施方案中,在治疗方法或用途中,口服给予所述组合物或细菌递送媒介物。
微生物组的一些细菌也可分泌将会影响脑部的分子,比如用于治疗抑郁、痴呆或睡眠障碍的血清素和褪黑素。
因此,本公开的另一目的为用于控制受试者微生物组的方法,其包括在所述受试者中给予有效量的如本文公开的药用或兽药用组合物。
在特定实施方案中,本公开还涉及用于对需要治疗疾病或障碍比如细菌感染的个体进行个性化治疗的方法,其包括:i)从个体获得生物样品并测定来自样品的一组细菌DNA序列;ii)基于序列的测定,鉴定样品中的一种或多种致病性细菌菌株或物种;和iii)给予个体能够识别样品中所鉴定的每种致病性细菌菌株或物种并递送包装的有效载荷的根据本公开的药用或兽药用组合物。
在一个实施方案中,生物样品包含病理性和非病理性细菌物种,并且在给予个体根据本公开的药用或兽药用组合物之后,个体之上或之内致病性细菌的量减少,但非致病性细菌的量并未减少。
在另一个特定实施方案中,本公开涉及用于改善药物有效性的根据本公开的药用或兽药用组合物。确实,已知微生物组的一些细菌尽管本身并不具有致病性,但能够代谢药物并将其修饰为无效或有害分子。
在另一方面,本文所述的方法和组合物提供感兴趣的基因在宿主微生物组中的长期稳定表达。在此种情况下,递送媒介物包含编码感兴趣的基因的核酸分子,其中该核酸被设计改造为整合到细菌染色体中,或者在宿主的靶标微生物组内稳定地复制。一旦被递送到感兴趣的细菌(即微生物组)中,感兴趣的基因一般就会被表达。在特定实施方案中,本公开涉及任何感兴趣的化合物的原位细菌产生,所述化合物包括治疗性化合物,比如用于哺乳动物的预防性和治疗性疫苗。感兴趣的化合物可在靶标细菌内产生、从靶标细菌分泌或在靶标细菌表面表达。在更特定实施方案中,抗原在用于预防性和/或治疗性疫苗接种的靶标细菌表面表达。
本公开还提供用于减少细菌群体中毒力和/或抗生素抗性细菌量的方法,其包括使细菌群体与有效量的如以上“细菌递送媒介物”部分中定义的细菌递送媒介物接触。本公开进一步提供如以上“细菌递送媒介物”部分中定义的细菌递送媒介物,其用于在用于减少细菌群体中毒力和/或抗生素抗性细菌的量的方法中,特别是在一般由于毒力和/或抗生素抗性细菌所致的细菌感染的治疗中使用。本公开的另一个目的提供如以上“细菌递送媒介物”部分中定义的细菌递送媒介物用于制造预期减少细菌群体中毒力和/或抗生素抗性细菌的量,特别是用于治疗一般由于毒力和/或抗生素抗性细菌所致的细菌感染的药物的用途。
本公开还涉及细菌递送颗粒的非治疗性用途。例如,非治疗性用途可为美容用途或用于改善受试者、特别是并未患有疾病的受试者的健康的用途。因此,本公开还涉及包含本公开细菌递送颗粒的美容组合物或非治疗性组合物。
序列简述
/>
/>
实施例
实施例1
已经表明,λSTF和V10 STF(源于在O157菌株中发现的原噬菌体)之间的嵌合体能够通过识别和降解O157抗原IV组荚膜而在体外以高效率靶向O157菌株,所述嵌合体具有序列SEQ ID NO:15。然而,初始体内实验表明,含有V10嵌合STF的λ包装的噬菌粒不能以高效率递送到定殖于小鼠肠道的O157菌株中。这种小鼠模型中的递送效率平均为20%,并且递送没有通过增加给予小鼠的剂量(MOI)而改善。
该观察的一个可能原因是,含有V10融合的嵌合λ颗粒在体外条件下为稳定的,在所述体外条件下递送和杀伤实验在存在已知试剂(例如LB)的情况下进行,但一旦它们穿过小鼠肠道就失去其部分活性。
已经观察到野生型λ颗粒能够在肠道中通过和复制,表明产生λ-V10融合的工程化过程的某些部分已使得其在体内条件下至少不太稳定并且部分地易于降解。除λSTF-V10融合之外,这些实验中使用的λ颗粒也已在gpJ水平上进行了设计改造以修饰其主要受体,并且含有1A2 gpJ变体(并因此在本文中被称为1A2-V10颗粒)。因此,1A2gpJ变体和/或STF-V10融合可能是体内条件下稳定性降低的来源。
建立了体外测定以在1A2 gpJ活性和STF-V10活性之间进行区分,这是基于以下事实,即对于一些菌株,功能性STF的存在对于注射是可有可无的,就像MG1655 K-12菌株的情况一样。由于1A2 gpJ变体识别O157菌株而不是MG1655的OmpC受体,因此设计改造了MG1655变体,其中使OmpC受体被替代以编码O157变体的OmpC受体。该菌株称为MG1656-OmpCO157。另一方面,O157菌株中的有效递送完全依赖于含有V10的功能性STF的存在。因此,通过使1A2-V10包装的噬菌粒暴露于不同条件并且体外评估gpJ相对于STF-V10的活性,来确定包装的噬菌粒的哪一部分不稳定是可能的。
然后在存在或不存在胰酶(其含有消化酶胰蛋白酶和糜蛋白酶)和胆汁盐的情况下使1A2-V10包装的噬菌粒暴露于模拟肠液(SIF)。具体地讲,产生包装的噬菌粒,将其在选择的缓冲液中以1:100稀释并于37℃下温育3小时。在那之后,在MG1656-OmpCO157和H10(O157)-δ-stx菌株上直接滴定包装的噬菌粒。作为对照,将使用CYC3菌株产生的野生型λ包装的噬菌粒也暴露于相同条件。H10-δ-stx为O157菌株的变体,其stx基因已经缺失。简言之,用包装的λ噬菌粒转导野生型H10菌株,所述噬菌粒含有λ-V10 STF嵌合体和编码被编程为靶向stx2基因的Cpf1核酸酶的包装的回路。转导之后,通过PCR检查存活菌落以验证stx基因存在与否并且仅保留stx基因缺失的菌落。
如图1所示,用CYC3菌株产生的野生型λ颗粒在任何条件下均为稳定的,因为在所有实验中滴度保持相同。然而,对于1A2-V10变体,观察到恒定的gpJ活性(图1中的中间条形),这表明该gpJ变体在存在胰酶的情况下没有降解。最后,当仅在存在胰酶的情况下于H10-δ-stx(O157)菌株中滴定时,1A2-V10的滴度下降2log倍。胆汁盐本身并不影响包装的噬菌粒的活性。这些结果清楚地证明STF-V10嵌合体在存在胰酶的情况下至少部分被降解。
据假设,稳定性降低的来源不是V10部分本身,而是在于产生与λSTF融合的方式。进一步地,据假设,尽管在初始λSTF-V10嵌合体中没有插入接头氨基酸,但融合的背景不是天然的,并且因此在存在蛋白水解酶的情况下没有对稳定性进行过选择。为检验这一假设,产生了两种类型的λSTF-V10嵌合体:第一种类型含有存在于λSTF和V10 STF之间融合点中的苯丙氨酸(F)和赖氨酸(K)残基的点突变(图2);对于第二种类型,进行了更详细的结构分析。与初始V10融合的结构同源性分析显示,结晶的STF与V10部分具有高度同一性(PDBID:5W6S):这种STF在其N-末端含有短螺旋,该短螺旋在V10中具有同源物,但其未被包括在初始λSTF-V10嵌合体中。螺旋形成非常紧密的束,将紧接在它之后的结构域“紧固”在晶体结构中。基于用初始λSTF-V10形式获得的递送效率结果,该螺旋对于活性可能不重要,但其对于稳定性可能重要,因为其可赋予适当的折叠,其中暴露的胰蛋白酶和糜蛋白酶可接近残基被掩蔽(图2)。
因此,构建了3种λ-STF-V10融合变体:V10-[FA](SEQ ID NO:9),其中赖氨酸(K)残基由丙氨酸(A)交换;V10-[AAH](SEQ ID NO:10),其中FKF三肽被交换为AAH三肽;和V10-Helix(SEQ ID NO:11),其中就在插入位点之后包括短的10个氨基酸的螺旋束GSATDVMIQLA(SEQ ID NO:7)作为嵌合蛋白一部分。λSTF的插入位点GAGENS(SEQ ID NO:5)对于任何变体均没有变化。
然后在存在或不存在胰酶的情况下使3种变体暴露于不同pH值(5.0和6.8)的缓冲液,如以上对初始λSTF-V10融合所详述的那样。如图3中可见,所有变体对胰酶处理均显示出某种程度的抗性:V10-[FA]和V10-[AAH]变体显示出比初始V10对应物高1-1.5log的颗粒水平,尽管稳定性并不完全且取决于pH。然而,V10-Helix变体在任何测试的pH下均显示出对消化蛋白酶的明显完全抗性。总之,结果表明,人们可通过仅设计改造接头区来设计改造抵抗消化蛋白酶的λSTF-V10变体,并且其为供体内使用的良好候选者,V10-Helix在体外显示出高度阳性的结果。
接下来进行了体内研究。难以以相当高的效率(最高40%,但一般低于20%)体内递送O157菌株,并且有趣的是,通过增加给予小鼠的MOI并没有改善递送。然而,在使用O157抗原缺失的菌株(ΔwaaJ突变体)时,用相同的载体观察到递送。基于该结果,V10活性可能因某种原因无法在穿越GIT时存活。
进行体内测定以测量口服给予经链霉素处理的未定殖BALB/c小鼠之后,具有1A2gpJ和嵌合λSTF-V10的包装的噬菌粒的脱落动力学以及残余V10活性。通过比较在需要1A2和V10两者的H10Δstx和其中仅需要1A2的MG-ompC_O157上的转导效率来评估特异性V10活性。包装的噬菌粒以高滴度产生,并在蔗糖碳酸氢盐缓冲液中给予3只小鼠,以降低胃酸性并助于包装的噬菌粒到达肠道。在T0、T2h、T4h、T6h和T8h收集粪便样品,并将其重悬于PBS中。离心之后,将含有脱落的包装的噬菌粒的上清液用于针对H10Δstx和MG-ompC_O157的转导测定。
有趣的是,如图4中可见,初始剂量的包装的噬菌粒含有约10%具有V10活性的颗粒。大部分1A2活性可在经口管饲之后6-8小时之间恢复,这表明这种gpJ变体在穿越整个胃肠道(GIT)之后没有降解。然而,测量V10活性的估计滴度非常低。少于1%回收的包装的噬菌粒保持其V10功能性。该结果表明,至少90%具有1A2 gpJ和嵌合λSTF-V10的包装的噬菌粒在GIT中失去其V10活性。肠道中由胰腺分泌的许多蛋白水解酶(胰蛋白酶和糜蛋白酶)的存在可能是这种降解的原因。该实验最终证明,1A2-V10可通过GI道而存活,但失去其V10活性的重要部分,这将解释为什么不能在O157菌株中以高效率递送。
根据该实验和3种新的λ-STF-V10融合变体的体外稳定性测试结果,使用了2种似乎更好地抵抗消化蛋白酶的变体:以上公开的λ-STF-V10-[FA]和λ-STF-V10-[Helix]。确实,体外实验已显示,这些包装的噬菌粒(也被称为eligobiotics或EB)似乎能够在含有胰酶的培养基中抵抗至少1h而不会失去其向需要V10活性的菌株内递送的能力。对于λ-STF-V10-[Helix]变体尤其如此。然后,在与初始1A2-V10完全相同的条件下,本发明人评价了V10在穿过未定殖BALB/c小鼠的整个GI道之后的残余活性。
如图5上可见,变体1A2-V10-[FA]的V10活性在穿过肠道之后为约1%。与该观察相反,新的1A2-V10-[Helix]在穿过GIT之后显示出与该包装的噬菌粒的总活性大致相似的V10活性。这些数据表明,1A2-V10-[Helix]由于其V10活性的高稳定性(与1A2-V10的初始形式相反)而能够在体内最佳地进行表现。为进一步确认这种稳定性,在小鼠进行了一项简化的药代动力学研究,其中在用单次剂量的这种包装的噬菌粒(作为与蔗糖/碳酸氢盐缓冲液的1:1混合物给予)经口管饲未定殖BALB/c小鼠后,观察到1A2-V10-[Helix]随着时间推移的脱落。
如图6所示,STF活性(进入到H10内但不进入到MG1656内所需的)随着时间的推移就像尖端/总体(Tip/overall)衣壳功能性一样稳定,如粪便中脱落的相同模式所示。
在另一个实验中,研究了两种新形式通过质粒治愈的体内递送。将λ-STF-V10-[Helix]和λ-STF-V10-[FA]包装噬菌粒(2个剂量,间隔6h)靶向pRFP质粒的一部分给予到用H10Δstx/pRFP定殖的小鼠中。假定有效载荷为完全有效的(一旦在细胞中表达,切割效力为100%),则递送可被计算为失去靶标质粒的细菌相对于细菌总数的比率。实际上,质粒携带卡那霉素抗性基因;这使得通过简单地将链霉素抗性细菌贴补(patching)到Kan平板上而更容易地检查保留质粒的菌落相对于失去质粒的菌落。
如图7上可见,用这种包装的噬菌粒混合物的治愈效率很高,因为大多数小鼠显示出80%或更高的治愈百分比(10只小鼠中有9只)。尽管在t=6h时单次给予之后观察到一个高峰,但在治疗后24小时时治愈效力的峰值更高,这可能反映第二次给予的重要性,尽管这可能是由于动物之间的转运时间的差别。另一个有趣的观察是,pRFP治愈(即对卡那霉素的敏感性)在T24h和T48h时仍然可见,而有效载荷递送(即对氯霉素的抗性)已强烈地减少。这表明,该治愈方法能够给出递送/核酸酶效力随着时间推移的更稳定的观点。结果清楚地证明,测试的新的包装的噬菌粒混合物更加能够靶向小鼠肠道中感兴趣的菌株。
为优化噬菌粒,对来自粪便的几个克隆进行PCR,以在λ-STF-V10-[Helix]和λ-STF-V10-[FA]之间进行区分:在38个测试的克隆中,71%已接受了来自λ-STF-V10-[Hilix]的有效载荷,表明这种形式在体内条件下为显著有效的。
根据先前结果,用新的突变体1A2-V10-[Helix]对STEC菌株H10WT进行了体内去定殖实验。为避免在用包装的噬菌粒处理之后立即出现定殖反弹,决定去除抗生素压力(链霉素),该抗生素压力被用于清除和保持肠杆菌科(Enterobacteriaceae)在具有常规无特异性病原体菌群的小鼠肠道中的生态位。将小鼠用5个剂量的包装的噬菌粒处理,间隔2天,并与用5个剂量的缓冲液(蔗糖碳酸氢盐)处理的对照组进行比较。
如有关对照组的图8和9中可观察到的,定殖并非随着时间的推移完全稳定。从D6到D12可见日复一日的缓慢下降。然而,缓冲液似乎对定殖水平没有影响。相反,STEC菌株的定殖水平对处理呈现出很大反应。确实,对于5只小鼠中的4只,在第一剂之后观察到2log的减少,以及在第二剂之后观察到多于3log的减少。在完整的5剂方案(D7)之后,总共获得4log的杀伤。有趣的是,在最后一次处理之后没有观察到定殖的反弹。
为了在实验结束时检查对包装的噬菌粒(天然或获得的)的潜在抗性群体,对D7/D8的存活菌落进行贴补,并且进行了转导实验。有趣的是,在该实验中没有观察到抗性(进入或核酸酶)。总之,本文所述的结果显示出变体比如变体1A2-V10-[Helix]使来自小鼠肠道的STEC菌株去定殖的效力增加。
实施例2
为测试以上实施例1中λ-STF-V10嵌合STF所遵循的方法是否可推广到其他STF嵌合体,进行了第二组实验。在这种情况下,在λSTF和K5尾刺尖之间设计改造了一种功能性嵌合STF,被称为λ-K5(SEQ ID NO:37),其在文献中已被描述为感染K5包封的大肠杆菌菌株,并且其晶体结构为可获得的[11]。遵循与λ-V10嵌合体相同的方法,包括λSTF蛋白中的插入点(GAGENS(SEQ ID NO:5))。在这种情况下,K5 STF活性的读取菌株为LMR_503以及gpJ活性的读取为MG1656-OmpCO157,如前所述。在pH 6.8下用或不用胰酶处理之后,在LMR_503或MG1656-OmpCO157两者中产生并滴定携带1A2-gpJ(SEQ ID:27)和λ-K5-STF的包装噬菌粒。
如图10中可见,尽管λ-K5 STF嵌合体为完全功能性的,如通过其在PBS中注射到LMR_503菌株中的能力所测量的那样,但在存在胰酶的情况下其不是非常稳定,显示出功能性颗粒的数量至多4-log的失去。这类似于对λ-STF-V10嵌合STF所观察到的。
接下来,分析初始K5 STF(PDB ID:2X3H)的晶体结构,并观察到在其N-末端也含有三螺旋束。然而,与V10结构相反,K5的螺旋束由一个转角加帽,该转角在λ-K5 STF中直接位于融合点。据假设,这个非天然插入点可能是观察到的胰酶稳定性降低的原因。为验证该假设,构建了几个λ-K5变体,其中融合点被修饰为含有不同形式的螺旋束。
·λK5 5.0(SEQ ID NO:13):含有来自V10的螺旋束的一部分
(GSATDVMIQL(SEQ ID NO:6)),其融合于没有其初始螺旋束的K5 STF
·λK5 5.1(SEQ ID NO:14):含有来自V10的螺旋束
(GSATDVMIQLA(SED ID NO:7)),其融合于没有其初始束的K5 STF
如上所述,在MG1656-OmpCO157或LMR_503上产生并滴定携带1A2-gpJ和每种K5螺旋嵌合体的包装噬菌粒。
图11和12表明,含有V10螺旋形式K5 5.0和K5 5.1的变体通常抵抗胰酶处理,因为与其他STF融合相比较,只有1log的失去。同样重要的是要注意,对任何所构建的K5变体均没有观察到在滴度方面的功能性差异,这表明当创建非同源性STF嵌合体时,在待使用的接头方面具有高度灵活性。
因此已经表明,在功能(在给定菌株中注射)和稳定性之间没有相关性,并且后者取决于融合点的氨基酸含量。另外,本发明人表明了源于V10 Helix的序列GSATDVMIQL(A)(SEQ ID NO:6和7)可被用作胰酶抗性接头(甚至在与V10 STF(K5 STF)不含同源性的蛋白中)并保护新的嵌合体免受胰酶降解。
实施例3
赋予λSTF-K5嵌合体稳定性的备选胰酶抗性接头设计自在其C-末端部分与始于氨基酸G62的K5 STF的C-末端部分具有同源性的STF蛋白,即来自埃希氏菌属噬菌体ZG49的候选STF蛋白(SEQ ID NO:43和SEQ ID NO:44)。
使用HHPRED软件对该ZG49 STF蛋白的分析(等人(2005)Nucleic AcidsRes.33:W244-8)表明其含有从氨基酸212到氨基酸217的螺旋束。该螺旋束被包括在由本发明人设计的接头中。更特别地,这些接头包含位于ZG49噬菌体STF蛋白的氨基酸G210或D211到氨基酸E272之间的氨基酸序列。它们一般具有序列SEQ ID NO:34或SEQ ID NO:36。
然后构建两个嵌合STF,它们含有λSTF的N-末端直至氨基酸序列GAGENS(SEQ IDNO:5),然后是以上设计的序列SEQ ID NO:34或SEQ ID NO:36的接头,并且然后是始于G62位的K5部分。设计的接头的DNA序列被重新编码用于在大肠埃希氏菌中表达,并且分别具有序列SEQ ID NO:35和SEQ ID NO:37。这两种嵌合STF被称为K5 9.0(对于始于G210位的接头,为SEQ ID NO:38和SEQ ID NO:49)和K5 9.1(对于始于D211位的接头,为SEQ ID NO:40和SEQ ID NO:41),并且区别仅为在接头起始处分别存在或不存在甘氨酸。
如实施例1和2所示地完成两种嵌合STF的产生和胰酶测试,并且表明使用设计自在该C-末端部分与K5 STF具有同源性的STF蛋白的接头也向嵌合STF提供胰酶抗性,并且与K5 5.0和K5 5.1相比较,甚至改善了嵌合体的胰酶抗性(图15)。
最后,进行体内测定以尝试LMR_503菌株的去定殖,所述菌株只有当嵌合STF抵抗蛋白水解酶时才应当在肠道中被靶向,如实施例2所示。为做此事,用链霉素处理10只BALB/c小鼠并将其用菌株LMR_503定殖。产生携带A8 gpJ和嵌合K5 9.1STF的其携带编码核酸酶的质粒(p775,SEQ ID NO:45)和靶向菌株LMR_503中存在的ctx基因的引导物。在单次剂量/>后,去定殖测定与对菌株H10WT所述的相同(图16)。
在用处理之后,观察到菌株水平的2.6log的中值降低,这表明K59.1STF的设计改造是成功的,并且K5 9.1STF能够承受小鼠肠道中的蛋白水解降解。
本发明人因此表明了可设计其他接头以向嵌合RBP蛋白赋予胰酶抗性。特别是,本文表明了设计自ZG49噬菌体STF蛋白的序列SEQ ID NO:34和SEQ ID NO:36可被用作胰酶抗性接头,以保护包含λSTF N-末端部分和K5 STF C-末端部分的嵌合体免受胰酶降解。
实施例4
为评估DNA有效载荷大小对中包装的有效载荷的数量的影响,使用3种不同有效载荷来产生/>如表1所概述的。
表1:产生 的批次
Eligobiotic代码/批号 有效载荷 大小(kb)
eb512/EB003-DS-008 p1085 12.125
eb393/EB003-DS-009 p779 12.428
eb827/EB003-DS-011 p1392 11.615
在发酵、裂解(在37℃下用0.1% Triton X-100、2000U/L Benzonase温育3h)和在Zeta Plus Capsule(3M)上澄清之后,Sartobind Q capsule(Sartorius)上通过阴离子交换色谱纯化该初始纯化后接缓冲液交换和通过在Pellicon2minicassette Biomax 300kDa(Millipore)上的切向流过滤进行的浓缩步骤。进行在Sepharose 6FF树脂(GE Healthcare)上的尺寸排阻色谱的最后精制步骤以产生纯化的
的DNA含量的分析通过在Beckman Coulter Optima AUC中使用AN50Ti转子在6krpm下的分析型超速离心进行。从沉降速度数据(在260和280nm处获得)提取每个EB批次在溶液中存在的不同颗粒的沉降系数。
基于从其沉降系数及其260/280nm比率计算的分子量,可将检测到的不同颗粒群体分离为含有3个拷贝(以290S为中心)或4个拷贝(以330-340S为中心)有效载荷的(图13)。
根据包装有效载荷的大小,在之间观察到重要差异。尽管包装较小p1392(11.615kb)的/>几乎仅产生含有4个拷贝的有效载荷的颗粒,但有效载荷大小的小幅增加(至多800bp)与向包装3个拷贝的转变有关。因此,用p779(12.428kb)产生的/>优先地包装了3个拷贝的有效载荷,而约三分之一的颗粒含有4个拷贝(图14)。
因此,似乎p1392接近理想的大小,以在颗粒中仅包装4个拷贝的有效载荷,产生同质群体。与p1392相比较,增加有效载荷的大小产生更异质的/>群体,其中含有3个拷贝的有效载荷的颗粒比例增加。如文献[28]中所述,根据该数据集,似乎存在接近36kb的多连体(concatemer)包装的下限。大小为12.125kb的p1085可包装每头3个拷贝(36.375kb)或每头4个拷贝(48.5kb),尽管如图14中所见,4个拷贝的种类为优选的。将大小增加至12.428kb将允许包装每头3个拷贝(37.284kb)和每头4个拷贝(49.712kb);在这种情况下,4个拷贝为优选的。根据这两个数据点,本发明人推断出包装的下限确实为约36kb,但效率较低。将大小仅增加909bp会将包装的种类完全转变为4个拷贝:可能是由衣壳中的压力信号驱动的对最佳包装效率的限制位于这两个大小之内。最后,11.615kb的有效载荷实际上每头仅包装4个拷贝(46.46kb),因为3个拷贝的物种略低于包装限制,甚至在低效率下(34.845kb)。
从这些数据中,还可预测哪些大小将产生单一和多聚体种类的包装,如以下表2和3所示。出于几个原因,产生单一包装的种类的较小大小通常为优选的,包括易于操纵和引入不想要的限制性位点的可能性较低。最后,在一些情况下,允许非常有效的包装种类的不会太小(26-39kb)或太大(50-51kb)的大小也为优选的,因为已经表明了衣壳中存在的DNA的量可能会由于衣壳内压力而改变颗粒的包装和稳定性[29]-[30]。最后,足够大以允许以高滴度产生包装的噬菌粒的大小也为更特别优选的。
表2:根据单体大小预测的衣壳中包装的多连体数量。
具有厚重深色边框并呈粗体的单元格代表更好的种类,具有细边框且非粗体的单元格代表对于最佳包装而言太小或太大的种类。有效包装的下限和上限已分别设置为36kb和51kb。
表3:根据9到13kb之间的单体大小预测的衣壳中包装的多连体数量。
具有厚重深色边框并呈粗体的单元格代表更好的种类,具有细边框且非粗体的单元格代表对于最佳包装而言太小或太大的种类。有效包装的下限和上限已分别设置为36kb和51kb。
参考文献
[1]E.Jończyk,M.R./>and A.Górski,“Theinfluence ofexternal factors on bacteriophages—review,”Folia Microbiol.(Praha),vol.56,no.3,pp.191–200,May 2011,doi:10.1007/s12223-011-0039-8.
[2]K.“Phage therapy:What factors shapephagepharmacokinetics and bioavailability?Systematic and critical review,”Med.Res.Rev.,vol.39,no.5,pp.2000–2025,Sep.2019,doi:10.1002/med.21572.
[3]H.W.Smith,M.B.Huggins,and K.M.Shaw,“Factorsinfluencing thesurvival and multiplication of bacteriophages in calves andin theirenvironment,”J.Gen.Microbiol.,vol.133,no.5,pp.1127–1135,May 1987,doi:10.1099/00221287-133-5-1127.
[4]K.Verthé,S.Possemiers,N.Boon,M.Vaneechoutte,and W.Verstraete,“Stability and activity of an Enterobacter aerogenes-specificbacteriophageunder simulated gastro-intestinal conditions,”Appl.Microbiol.Biotechnol.,vol.65,no.4,pp.465–472,Sep.2004,doi:10.1007/s00253-004-1585-7.
[5]N.Jamalludeen,R.P.Johnson,P.E.Shewen,and C.L.Gyles,“Evaluation ofbacteriophages for prevention and treatment of diarrheadue to experimentalenterotoxigenic Escherichia coli O149 infection ofpigs,”Vet.Microbiol.,vol.136,no.1,pp.135–141,Apr.2009,doi:10.1016/j.vetmic.2008.10.021.
[6]Y.Tanji,T.Shimada,H.Fukudomi,K.Miyanaga,Y.Nakai,andH.Unno,“Therapeutic use of phage cocktail for controlling Escherichiacoli O157:H7 ingastrointestinal tract of mice,”J.Biosci.Bioeng.,vol.100,no.3,pp.280–287,Sep.2005,doi:10.1263/jbb.100.280.
[7]J.H.Northrop,“THE EFFECT OF PROTEOLYTIC ENZYMESON E.COLI PHAGESAND ON NATIVE PROTEINS,”J.Gen.Physiol.,vol.48,pp.73–78,Sep.1964,doi:10.1085/jgp.48.1.73.
[8]P.K.Chanda and S.N.Chatterjee,“Properties of the choleraphage PL163/10,”Acta Virol.,vol.19,no.3,pp.197–203,May 1975.
[9]Y.Zivanovic et al.,J.Virol.,vol.88,no.2,pp.1162–1174,Jan.2014.
[10]J.Wang,M.Hofnung,and A.Charbit,“The C-terminal portionof the tailfiber protein of bacteriophage lambda is responsible for bindingto LamB,itsreceptor at the surface of Escherichia coli K-12,”J.Bacteriol.,vol.182,no.2,pp.508–512,Jan.2000,doi:10.1128/jb.182.2.508-512.2000.
[11]James E Thompson,Meraj Pourhossein,Amy Waterhouse,Thomas Hudson,Marie Goldrick,Jeremy P Derrick,Ian S Roberts,“TheK5 lyase KflA combines aviral tail spike structure with a bacterialpolysaccharide lyase mechanism”,JBiol Chem,vol.285,no.31,pp.23963-9,Jul 2010.
序列表
<110> 艾力格生物科技有限公司
<120> 抵抗蛋白水解降解的嵌合受体结合蛋白
<130> EB2020-08
<150> US63/132090
<151> 2020-12-30
<150> PCT/EP2020/088043
<151> 2020-12-30
<150> US17/138084
<151> 2020-12-30
<150> US63/132,190
<151> 2020-12-30
<150> US63/137,989
<151> 2021-01-15
<160> 51
<170> PatentIn version 3.5
<210> 1
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 插入位点序列SAGDAS
<400> 1
Ser Ala Gly Asp Ala Ser
1 5
<210> 2
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 插入位点序列ADAKKS
<400> 2
Ala Asp Ala Lys Lys Ser
1 5
<210> 3
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 插入位点序列MDETNR
<400> 3
Met Asp Glu Thr Asn Arg
1 5
<210> 4
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 插入位点序列SASAAA
<400> 4
Ser Ala Ser Ala Ala Ala
1 5
<210> 5
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 插入位点序列GAGENS
<400> 5
Gly Ala Gly Glu Asn Ser
1 5
<210> 6
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> GSATDVMIQL序列
<400> 6
Gly Ser Ala Thr Asp Val Met Ile Gln Leu
1 5 10
<210> 7
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> GSATDVMIQLA序列
<400> 7
Gly Ser Ala Thr Asp Val Met Ile Gln Leu Ala
1 5 10
<210> 8
<211> 774
<212> PRT
<213> 细菌噬菌体λ
<400> 8
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Val Val Met Asp Glu Thr Asn Arg Lys Ala Pro Leu Asp Ser Pro
385 390 395 400
Ala Leu Thr Gly Thr Pro Thr Ala Pro Thr Ala Leu Arg Gly Thr Asn
405 410 415
Asn Thr Gln Ile Ala Asn Thr Ala Phe Val Leu Ala Ala Ile Ala Asp
420 425 430
Val Ile Asp Ala Ser Pro Asp Ala Leu Asn Thr Leu Asn Glu Leu Ala
435 440 445
Ala Ala Leu Gly Asn Asp Pro Asp Phe Ala Thr Thr Met Thr Asn Ala
450 455 460
Leu Ala Gly Lys Gln Pro Lys Asn Ala Thr Leu Thr Ala Leu Ala Gly
465 470 475 480
Leu Ser Thr Ala Lys Asn Lys Leu Pro Tyr Phe Ala Glu Asn Asp Ala
485 490 495
Ala Ser Leu Thr Glu Leu Thr Gln Val Gly Arg Asp Ile Leu Ala Lys
500 505 510
Asn Ser Val Ala Asp Val Leu Glu Tyr Leu Gly Ala Gly Glu Asn Ser
515 520 525
Ala Phe Pro Ala Gly Ala Pro Ile Pro Trp Pro Ser Asp Ile Val Pro
530 535 540
Ser Gly Tyr Val Leu Met Gln Gly Gln Ala Phe Asp Lys Ser Ala Tyr
545 550 555 560
Pro Lys Leu Ala Val Ala Tyr Pro Ser Gly Val Leu Pro Asp Met Arg
565 570 575
Gly Trp Thr Ile Lys Gly Lys Pro Ala Ser Gly Arg Ala Val Leu Ser
580 585 590
Gln Glu Gln Asp Gly Ile Lys Ser His Thr His Ser Ala Ser Ala Ser
595 600 605
Gly Thr Asp Leu Gly Thr Lys Thr Thr Ser Ser Phe Asp Tyr Gly Thr
610 615 620
Lys Thr Thr Gly Ser Phe Asp Tyr Gly Thr Lys Ser Thr Asn Asn Thr
625 630 635 640
Gly Ala His Ala His Ser Leu Ser Gly Ser Thr Gly Ala Ala Gly Ala
645 650 655
His Ala His Thr Ser Gly Leu Arg Met Asn Ser Ser Gly Trp Ser Gln
660 665 670
Tyr Gly Thr Ala Thr Ile Thr Gly Ser Leu Ser Thr Val Lys Gly Thr
675 680 685
Ser Thr Gln Gly Ile Ala Tyr Leu Ser Lys Thr Asp Ser Gln Gly Ser
690 695 700
His Ser His Ser Leu Ser Gly Thr Ala Val Ser Ala Gly Ala His Ala
705 710 715 720
His Thr Val Gly Ile Gly Ala His Gln His Pro Val Val Ile Gly Ala
725 730 735
His Ala His Ser Phe Ser Ile Gly Ser His Gly His Thr Ile Thr Val
740 745 750
Asn Ala Ala Gly Asn Ala Glu Asn Thr Val Lys Asn Ile Ala Phe Asn
755 760 765
Tyr Ile Val Arg Leu Ala
770
<210> 9
<211> 1186
<212> PRT
<213> 人工序列
<220>
<223> STF-V10-[FA]
<400> 9
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Val Val Met Asp Glu Thr Asn Arg Lys Ala Pro Leu Asp Ser Pro
385 390 395 400
Ala Leu Thr Gly Thr Pro Thr Ala Pro Thr Ala Leu Arg Gly Thr Asn
405 410 415
Asn Thr Gln Ile Ala Asn Thr Ala Phe Val Leu Ala Ala Ile Ala Asp
420 425 430
Val Ile Asp Ala Ser Pro Asp Ala Leu Asn Thr Leu Asn Glu Leu Ala
435 440 445
Ala Ala Leu Gly Asn Asp Pro Asp Phe Ala Thr Thr Met Thr Asn Ala
450 455 460
Leu Ala Gly Lys Gln Pro Lys Asn Ala Thr Leu Thr Ala Leu Ala Gly
465 470 475 480
Leu Ser Thr Ala Lys Asn Lys Leu Pro Tyr Phe Ala Glu Asn Asp Ala
485 490 495
Ala Ser Leu Thr Glu Leu Thr Gln Val Gly Arg Asp Ile Leu Ala Lys
500 505 510
Asn Ser Val Ala Asp Val Leu Glu Tyr Leu Gly Ala Gly Glu Asn Ser
515 520 525
Ala Ala Asn Asp Gly Phe Ala Phe Ile Gly Gln Cys Pro Asp Ile Leu
530 535 540
Thr Leu Arg Thr Ile Glu Pro Glu Lys Asn Gly Gln Arg Ile Thr Leu
545 550 555 560
Arg Gln His Thr Ile Gly Thr Gly Leu Gly Gly Gly Val Phe Arg Ala
565 570 575
Val Leu Asp Gly Thr Gly Tyr Thr Asp Asp Asp Gly Val Val Ile Lys
580 585 590
Thr Ala Gly Gly Ser Val Trp Leu Arg Val Asn Ala Asp Lys Val Asn
595 600 605
Pro Phe Met Phe Gly Ala Thr Gly Val Ala Asp Asp Thr Ala Ala Leu
610 615 620
Gln Lys Met Leu Glu Cys Gly Arg Ala Ala Glu Leu Gly Thr Asn Val
625 630 635 640
Trp Lys Ala Ser Asn Leu Glu Leu Asn Asn Lys Ser Cys Ser Leu Ser
645 650 655
Gly Ser Gly Leu His Val Ser Arg Ile Glu Gln Ile Ser Gly Ala Thr
660 665 670
Gly Ala Leu Leu Thr Ile Thr Gln Asp Cys Ser Leu Ile Tyr Leu Ser
675 680 685
Asp Cys Gly Leu Tyr Gly Asp Gly Ile Thr Ala Gly Thr Ser Gly Val
690 695 700
Thr Met Glu Thr Gly Asn Pro Gly Gly Ala Pro Ser Tyr Pro Phe Asn
705 710 715 720
Thr Ala Pro Asp Val Arg Arg Asp Leu Tyr Ile Ser Asn Val His Ile
725 730 735
Thr Gly Phe Asp Glu Leu Gly Phe Asp Tyr Pro Glu Thr Asn Phe Ser
740 745 750
Val Ser Thr His Gly Leu Phe Ile Arg Asn Ile Lys Lys Thr Gly Ala
755 760 765
Lys Ile Gly Thr Thr Asp Phe Thr Trp Thr Asn Leu Gln Ile Asp Thr
770 775 780
Cys Gly Gln Glu Cys Leu Val Leu Asp Gly Ala Gly Asn Cys Arg Ile
785 790 795 800
Ile Gly Ala Lys Leu Ile Trp Ala Gly Ser Glu Asn Glu Thr Pro Tyr
805 810 815
Ser Gly Leu Arg Ile Ser Asn Ser Gln Asn Val Asn Met Thr Gly Val
820 825 830
Glu Leu Gln Asp Cys Ala Tyr Asp Gly Leu Tyr Ile Lys Asn Ser Thr
835 840 845
Val Ala Ile Ser Gly Leu Asn Thr Asn Arg Asn Ser Ala Ser Ser Asn
850 855 860
Leu Ser Tyr His Asn Met Val Phe Glu Asn Ser Ile Val Thr Val Asp
865 870 875 880
Gly Tyr Val Cys Arg Asn Tyr Ala Ala Thr Ser Leu Tyr Asp Leu Asn
885 890 895
Ser Gln Ala Gly Asn Val Arg Cys Ile Gly Ser Asp Ser Thr Val Leu
900 905 910
Ile Asn Gly Ile Tyr Glu Ser Glu Val Asn Ser Glu Arg Leu Met Gly
915 920 925
Asp Asn Asn Leu Ile Gln Pro Tyr Ser Gly Asp Leu Ile Ile Asn Gly
930 935 940
Leu Lys Asn Tyr Tyr Thr Tyr Thr Gly Ser Val Lys Asn Asn Ile Pro
945 950 955 960
Thr Phe Asp Gly Val Val Thr Thr Ala Thr Tyr Val Ser Ala Pro Ser
965 970 975
Ile Leu Gly Gln Gly Asn Met Leu Lys Leu Thr Gln Ser Asn Lys Asp
980 985 990
Lys Leu Leu Phe Ser Asp Lys Val Ser Arg His Gly Cys Thr Ile Gly
995 1000 1005
Leu Val Leu Ile Pro Ser Phe Thr Gly Ala Thr Thr Met Thr Ala
1010 1015 1020
Phe Thr Leu Gly Ser Gly Tyr Ser Pro Ser Gly Asn Ser Ala Val
1025 1030 1035
Met Gln Phe Ile Val Asn Ser Ser Gly Val Gln Thr Ile Ala Ile
1040 1045 1050
Leu Leu Ser Gly Asp Gly Ile Thr Gln Thr Leu Thr Ser Asp Leu
1055 1060 1065
Thr Thr Glu Gln Ala Leu Ala Ser Gly Gly Val Tyr His Phe Ala
1070 1075 1080
Met Gly Phe Ala Pro Gly Arg Leu Trp Trp Ser Ile Ile Asp Ile
1085 1090 1095
Asn Thr Gly Arg Arg Ile Arg Arg Ala Tyr Arg Gln Pro Asp Leu
1100 1105 1110
His Ala Ala Phe Asn Ser Ile Phe Asn Ser Gly Thr Ser Ser Ile
1115 1120 1125
Thr Ala Phe Ser Gly Pro Leu Ala Gly Asp Ile Ala Cys Glu Gly
1130 1135 1140
Ala Gly Ser His Val Tyr Val Gly Gly Phe Ser Ser Glu Ser Asp
1145 1150 1155
Tyr Ala Ala Ser Arg Met Tyr Gly Leu Phe Thr Pro Val Asp Leu
1160 1165 1170
Asp Lys Gln Tyr Ser Phe Arg Thr Leu Asn Gly Asn Ile
1175 1180 1185
<210> 10
<211> 1186
<212> PRT
<213> 人工序列
<220>
<223> STF-V10-[AAH]
<400> 10
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Val Val Met Asp Glu Thr Asn Arg Lys Ala Pro Leu Asp Ser Pro
385 390 395 400
Ala Leu Thr Gly Thr Pro Thr Ala Pro Thr Ala Leu Arg Gly Thr Asn
405 410 415
Asn Thr Gln Ile Ala Asn Thr Ala Phe Val Leu Ala Ala Ile Ala Asp
420 425 430
Val Ile Asp Ala Ser Pro Asp Ala Leu Asn Thr Leu Asn Glu Leu Ala
435 440 445
Ala Ala Leu Gly Asn Asp Pro Asp Phe Ala Thr Thr Met Thr Asn Ala
450 455 460
Leu Ala Gly Lys Gln Pro Lys Asn Ala Thr Leu Thr Ala Leu Ala Gly
465 470 475 480
Leu Ser Thr Ala Lys Asn Lys Leu Pro Tyr Phe Ala Glu Asn Asp Ala
485 490 495
Ala Ser Leu Thr Glu Leu Thr Gln Val Gly Arg Asp Ile Leu Ala Lys
500 505 510
Asn Ser Val Ala Asp Val Leu Glu Tyr Leu Gly Ala Gly Glu Asn Ser
515 520 525
Ala Ala Asn Asp Gly Ala Ala His Ile Gly Gln Cys Pro Asp Ile Leu
530 535 540
Thr Leu Arg Thr Ile Glu Pro Glu Lys Asn Gly Gln Arg Ile Thr Leu
545 550 555 560
Arg Gln His Thr Ile Gly Thr Gly Leu Gly Gly Gly Val Phe Arg Ala
565 570 575
Val Leu Asp Gly Thr Gly Tyr Thr Asp Asp Asp Gly Val Val Ile Lys
580 585 590
Thr Ala Gly Gly Ser Val Trp Leu Arg Val Asn Ala Asp Lys Val Asn
595 600 605
Pro Phe Met Phe Gly Ala Thr Gly Val Ala Asp Asp Thr Ala Ala Leu
610 615 620
Gln Lys Met Leu Glu Cys Gly Arg Ala Ala Glu Leu Gly Thr Asn Val
625 630 635 640
Trp Lys Ala Ser Asn Leu Glu Leu Asn Asn Lys Ser Cys Ser Leu Ser
645 650 655
Gly Ser Gly Leu His Val Ser Arg Ile Glu Gln Ile Ser Gly Ala Thr
660 665 670
Gly Ala Leu Leu Thr Ile Thr Gln Asp Cys Ser Leu Ile Tyr Leu Ser
675 680 685
Asp Cys Gly Leu Tyr Gly Asp Gly Ile Thr Ala Gly Thr Ser Gly Val
690 695 700
Thr Met Glu Thr Gly Asn Pro Gly Gly Ala Pro Ser Tyr Pro Phe Asn
705 710 715 720
Thr Ala Pro Asp Val Arg Arg Asp Leu Tyr Ile Ser Asn Val His Ile
725 730 735
Thr Gly Phe Asp Glu Leu Gly Phe Asp Tyr Pro Glu Thr Asn Phe Ser
740 745 750
Val Ser Thr His Gly Leu Phe Ile Arg Asn Ile Lys Lys Thr Gly Ala
755 760 765
Lys Ile Gly Thr Thr Asp Phe Thr Trp Thr Asn Leu Gln Ile Asp Thr
770 775 780
Cys Gly Gln Glu Cys Leu Val Leu Asp Gly Ala Gly Asn Cys Arg Ile
785 790 795 800
Ile Gly Ala Lys Leu Ile Trp Ala Gly Ser Glu Asn Glu Thr Pro Tyr
805 810 815
Ser Gly Leu Arg Ile Ser Asn Ser Gln Asn Val Asn Met Thr Gly Val
820 825 830
Glu Leu Gln Asp Cys Ala Tyr Asp Gly Leu Tyr Ile Lys Asn Ser Thr
835 840 845
Val Ala Ile Ser Gly Leu Asn Thr Asn Arg Asn Ser Ala Ser Ser Asn
850 855 860
Leu Ser Tyr His Asn Met Val Phe Glu Asn Ser Ile Val Thr Val Asp
865 870 875 880
Gly Tyr Val Cys Arg Asn Tyr Ala Ala Thr Ser Leu Tyr Asp Leu Asn
885 890 895
Ser Gln Ala Gly Asn Val Arg Cys Ile Gly Ser Asp Ser Thr Val Leu
900 905 910
Ile Asn Gly Ile Tyr Glu Ser Glu Val Asn Ser Glu Arg Leu Met Gly
915 920 925
Asp Asn Asn Leu Ile Gln Pro Tyr Ser Gly Asp Leu Ile Ile Asn Gly
930 935 940
Leu Lys Asn Tyr Tyr Thr Tyr Thr Gly Ser Val Lys Asn Asn Ile Pro
945 950 955 960
Thr Phe Asp Gly Val Val Thr Thr Ala Thr Tyr Val Ser Ala Pro Ser
965 970 975
Ile Leu Gly Gln Gly Asn Met Leu Lys Leu Thr Gln Ser Asn Lys Asp
980 985 990
Lys Leu Leu Phe Ser Asp Lys Val Ser Arg His Gly Cys Thr Ile Gly
995 1000 1005
Leu Val Leu Ile Pro Ser Phe Thr Gly Ala Thr Thr Met Thr Ala
1010 1015 1020
Phe Thr Leu Gly Ser Gly Tyr Ser Pro Ser Gly Asn Ser Ala Val
1025 1030 1035
Met Gln Phe Ile Val Asn Ser Ser Gly Val Gln Thr Ile Ala Ile
1040 1045 1050
Leu Leu Ser Gly Asp Gly Ile Thr Gln Thr Leu Thr Ser Asp Leu
1055 1060 1065
Thr Thr Glu Gln Ala Leu Ala Ser Gly Gly Val Tyr His Phe Ala
1070 1075 1080
Met Gly Phe Ala Pro Gly Arg Leu Trp Trp Ser Ile Ile Asp Ile
1085 1090 1095
Asn Thr Gly Arg Arg Ile Arg Arg Ala Tyr Arg Gln Pro Asp Leu
1100 1105 1110
His Ala Ala Phe Asn Ser Ile Phe Asn Ser Gly Thr Ser Ser Ile
1115 1120 1125
Thr Ala Phe Ser Gly Pro Leu Ala Gly Asp Ile Ala Cys Glu Gly
1130 1135 1140
Ala Gly Ser His Val Tyr Val Gly Gly Phe Ser Ser Glu Ser Asp
1145 1150 1155
Tyr Ala Ala Ser Arg Met Tyr Gly Leu Phe Thr Pro Val Asp Leu
1160 1165 1170
Asp Lys Gln Tyr Ser Phe Arg Thr Leu Asn Gly Asn Ile
1175 1180 1185
<210> 11
<211> 1196
<212> PRT
<213> 人工序列
<220>
<223> STF-V10-[Helix]
<400> 11
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Val Val Met Asp Glu Thr Asn Arg Lys Ala Pro Leu Asp Ser Pro
385 390 395 400
Ala Leu Thr Gly Thr Pro Thr Ala Pro Thr Ala Leu Arg Gly Thr Asn
405 410 415
Asn Thr Gln Ile Ala Asn Thr Ala Phe Val Leu Ala Ala Ile Ala Asp
420 425 430
Val Ile Asp Ala Ser Pro Asp Ala Leu Asn Thr Leu Asn Glu Leu Ala
435 440 445
Ala Ala Leu Gly Asn Asp Pro Asp Phe Ala Thr Thr Met Thr Asn Ala
450 455 460
Leu Ala Gly Lys Gln Pro Lys Asn Ala Thr Leu Thr Ala Leu Ala Gly
465 470 475 480
Leu Ser Thr Ala Lys Asn Lys Leu Pro Tyr Phe Ala Glu Asn Asp Ala
485 490 495
Ala Ser Leu Thr Glu Leu Thr Gln Val Gly Arg Asp Ile Leu Ala Lys
500 505 510
Asn Ser Val Ala Asp Val Leu Glu Tyr Leu Gly Ala Gly Glu Asn Ser
515 520 525
Gly Ser Ala Thr Asp Val Met Ile Gln Leu Ala Ala Asn Asp Gly Phe
530 535 540
Lys Phe Ile Gly Gln Cys Pro Asp Ile Leu Thr Leu Arg Thr Ile Glu
545 550 555 560
Pro Glu Lys Asn Gly Gln Arg Ile Thr Leu Arg Gln His Thr Ile Gly
565 570 575
Thr Gly Leu Gly Gly Gly Val Phe Arg Ala Val Leu Asp Gly Thr Gly
580 585 590
Tyr Thr Asp Asp Asp Gly Val Val Ile Lys Thr Ala Gly Gly Ser Val
595 600 605
Trp Leu Arg Val Asn Ala Asp Lys Val Asn Pro Phe Met Phe Gly Ala
610 615 620
Thr Gly Val Ala Asp Asp Thr Ala Ala Leu Gln Lys Met Leu Glu Cys
625 630 635 640
Gly Arg Ala Ala Glu Leu Gly Thr Asn Val Trp Lys Ala Ser Asn Leu
645 650 655
Glu Leu Asn Asn Lys Ser Cys Ser Leu Ser Gly Ser Gly Leu His Val
660 665 670
Ser Arg Ile Glu Gln Ile Ser Gly Ala Thr Gly Ala Leu Leu Thr Ile
675 680 685
Thr Gln Asp Cys Ser Leu Ile Tyr Leu Ser Asp Cys Gly Leu Tyr Gly
690 695 700
Asp Gly Ile Thr Ala Gly Thr Ser Gly Val Thr Met Glu Thr Gly Asn
705 710 715 720
Pro Gly Gly Ala Pro Ser Tyr Pro Phe Asn Thr Ala Pro Asp Val Arg
725 730 735
Arg Asp Leu Tyr Ile Ser Asn Val His Ile Thr Gly Phe Asp Glu Leu
740 745 750
Gly Phe Asp Tyr Pro Glu Thr Asn Phe Ser Val Ser Thr His Gly Leu
755 760 765
Phe Ile Arg Asn Ile Lys Lys Thr Gly Ala Lys Ile Gly Thr Thr Asp
770 775 780
Phe Thr Trp Thr Asn Leu Gln Ile Asp Thr Cys Gly Gln Glu Cys Leu
785 790 795 800
Val Leu Asp Gly Ala Gly Asn Cys Arg Ile Ile Gly Ala Lys Leu Ile
805 810 815
Trp Ala Gly Ser Glu Asn Glu Thr Pro Tyr Ser Gly Leu Arg Ile Ser
820 825 830
Asn Ser Gln Asn Val Asn Met Thr Gly Val Glu Leu Gln Asp Cys Ala
835 840 845
Tyr Asp Gly Leu Tyr Ile Lys Asn Ser Thr Val Ala Ile Ser Gly Leu
850 855 860
Asn Thr Asn Arg Asn Ser Ala Ser Ser Asn Leu Ser Tyr His Asn Met
865 870 875 880
Val Phe Glu Asn Ser Ile Val Thr Val Asp Gly Tyr Val Cys Arg Asn
885 890 895
Tyr Ala Ala Thr Ser Leu Tyr Asp Leu Asn Ser Gln Ala Gly Asn Val
900 905 910
Arg Cys Ile Gly Ser Asp Ser Thr Val Leu Ile Asn Gly Ile Tyr Glu
915 920 925
Ser Glu Val Asn Ser Glu Arg Leu Met Gly Asp Asn Asn Leu Ile Gln
930 935 940
Pro Tyr Ser Gly Asp Leu Ile Ile Asn Gly Leu Lys Asn Tyr Tyr Thr
945 950 955 960
Tyr Thr Gly Ser Val Lys Asn Asn Ile Pro Thr Phe Asp Gly Val Val
965 970 975
Thr Thr Ala Thr Tyr Val Ser Ala Pro Ser Ile Leu Gly Gln Gly Asn
980 985 990
Met Leu Lys Leu Thr Gln Ser Asn Lys Asp Lys Leu Leu Phe Ser Asp
995 1000 1005
Lys Val Ser Arg His Gly Cys Thr Ile Gly Leu Val Leu Ile Pro
1010 1015 1020
Ser Phe Thr Gly Ala Thr Thr Met Thr Ala Phe Thr Leu Gly Ser
1025 1030 1035
Gly Tyr Ser Pro Ser Gly Asn Ser Ala Val Met Gln Phe Ile Val
1040 1045 1050
Asn Ser Ser Gly Val Gln Thr Ile Ala Ile Leu Leu Ser Gly Asp
1055 1060 1065
Gly Ile Thr Gln Thr Leu Thr Ser Asp Leu Thr Thr Glu Gln Ala
1070 1075 1080
Leu Ala Ser Gly Gly Val Tyr His Phe Ala Met Gly Phe Ala Pro
1085 1090 1095
Gly Arg Leu Trp Trp Ser Ile Ile Asp Ile Asn Thr Gly Arg Arg
1100 1105 1110
Ile Arg Arg Ala Tyr Arg Gln Pro Asp Leu His Ala Ala Phe Asn
1115 1120 1125
Ser Ile Phe Asn Ser Gly Thr Ser Ser Ile Thr Ala Phe Ser Gly
1130 1135 1140
Pro Leu Ala Gly Asp Ile Ala Cys Glu Gly Ala Gly Ser His Val
1145 1150 1155
Tyr Val Gly Gly Phe Ser Ser Glu Ser Asp Tyr Ala Ala Ser Arg
1160 1165 1170
Met Tyr Gly Leu Phe Thr Pro Val Asp Leu Asp Lys Gln Tyr Ser
1175 1180 1185
Phe Arg Thr Leu Asn Gly Asn Ile
1190 1195
<210> 12
<211> 632
<212> PRT
<213> 细菌噬菌体K5
<400> 12
Met Ala Lys Leu Thr Lys Pro Lys Thr Glu Gly Ile Leu His Lys Gly
1 5 10 15
Gln Ser Leu Tyr Glu Tyr Leu Asp Ala Arg Val Leu Thr Ser Lys Pro
20 25 30
Phe Gly Ala Ala Gly Asp Ala Thr Thr Asp Asp Thr Glu Val Ile Ala
35 40 45
Ala Ser Leu Asn Ser Gln Lys Ala Val Thr Ile Ser Asp Gly Val Phe
50 55 60
Ser Ser Ser Gly Ile Asn Ser Asn Tyr Cys Asn Leu Asp Gly Arg Gly
65 70 75 80
Ser Gly Val Leu Ser His Arg Ser Ser Thr Gly Asn Tyr Leu Val Phe
85 90 95
Asn Asn Pro Arg Thr Gly Arg Leu Ser Asn Ile Thr Val Glu Ser Asn
100 105 110
Lys Ala Thr Asp Thr Thr Gln Gly Gln Gln Val Ser Leu Ala Gly Gly
115 120 125
Ser Asp Val Thr Val Ser Asp Val Asn Phe Ser Asn Val Lys Gly Thr
130 135 140
Gly Phe Ser Leu Ile Ala Tyr Pro Asn Asp Ala Pro Pro Asp Gly Leu
145 150 155 160
Met Ile Lys Gly Ile Arg Gly Ser Tyr Ser Gly Tyr Ala Thr Asn Lys
165 170 175
Ala Ala Gly Cys Val Leu Ala Asp Ser Ser Val Asn Ser Leu Ile Asp
180 185 190
Asn Val Ile Ala Lys Asn Tyr Pro Gln Phe Gly Ala Val Glu Leu Lys
195 200 205
Gly Thr Ala Ser Tyr Asn Ile Val Ser Asn Val Ile Gly Ala Asp Cys
210 215 220
Gln His Val Thr Tyr Asn Gly Thr Glu Gly Pro Ile Ala Pro Ser Asn
225 230 235 240
Asn Leu Ile Lys Gly Val Met Ala Asn Asn Pro Lys Tyr Ala Ala Val
245 250 255
Val Ala Gly Lys Gly Ser Thr Asn Leu Ile Ser Asp Val Leu Val Asp
260 265 270
Tyr Ser Thr Ser Asp Ala Arg Gln Ala His Gly Val Thr Val Glu Gly
275 280 285
Ser Asp Asn Val Ile Asn Asn Val Leu Met Ser Gly Cys Asp Gly Thr
290 295 300
Asn Ser Leu Gly Gln Arg Gln Thr Ala Thr Ile Ala Arg Phe Ile Gly
305 310 315 320
Thr Ala Asn Asn Asn Tyr Ala Ser Val Phe Pro Ser Tyr Ser Ala Thr
325 330 335
Gly Val Ile Thr Phe Glu Ser Gly Ser Thr Arg Asn Phe Val Glu Val
340 345 350
Lys His Pro Gly Arg Arg Asn Asp Leu Leu Ser Ser Ala Ser Thr Ile
355 360 365
Asp Gly Ala Ala Thr Ile Asp Gly Thr Ser Asn Ser Asn Val Val His
370 375 380
Ala Pro Ala Leu Gly Gln Tyr Ile Gly Ser Met Ser Gly Arg Phe Glu
385 390 395 400
Trp Arg Ile Lys Ser Met Ser Leu Pro Ser Gly Val Leu Thr Ser Ala
405 410 415
Asp Lys Tyr Arg Met Leu Gly Asp Gly Ala Val Ser Leu Ala Val Gly
420 425 430
Gly Gly Thr Ser Ser Gln Val Arg Leu Phe Thr Ser Asp Gly Thr Ser
435 440 445
Arg Thr Val Ser Leu Thr Asn Gly Asn Val Arg Leu Ser Thr Ser Ser
450 455 460
Thr Gly Tyr Leu Gln Leu Gly Ala Asp Ala Met Thr Pro Asp Ser Thr
465 470 475 480
Gly Thr Tyr Ala Leu Gly Ser Ala Ser Arg Ala Trp Ser Gly Gly Phe
485 490 495
Thr Gln Ala Ala Phe Thr Val Thr Ser Asp Ala Arg Cys Lys Thr Glu
500 505 510
Pro Leu Thr Ile Ser Asp Ala Leu Leu Asp Ala Trp Ser Glu Val Asp
515 520 525
Phe Val Gln Phe Gln Tyr Leu Asp Arg Val Glu Glu Lys Gly Ala Asp
530 535 540
Ser Ala Arg Trp His Phe Gly Ile Ile Ala Gln Arg Ala Lys Glu Ala
545 550 555 560
Phe Glu Arg His Gly Ile Asp Ala His Arg Tyr Gly Phe Leu Cys Phe
565 570 575
Asp Ser Trp Asp Asp Val Tyr Glu Glu Asp Ala Asn Gly Ser Arg Lys
580 585 590
Leu Ile Thr Pro Ala Gly Ser Arg Tyr Gly Ile Arg Tyr Glu Glu Val
595 600 605
Leu Ile Leu Glu Ala Ala Leu Met Arg Arg Thr Ile Lys Arg Met Gln
610 615 620
Glu Ala Leu Ala Ala Leu Pro Lys
625 630
<210> 13
<211> 1143
<212> PRT
<213> 人工序列
<220>
<223> K5 5.0
<400> 13
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Val Val Met Asp Glu Thr Asn Arg Lys Ala Pro Leu Asp Ser Pro
385 390 395 400
Ala Leu Thr Gly Thr Pro Thr Ala Pro Thr Ala Leu Arg Gly Thr Asn
405 410 415
Asn Thr Gln Ile Ala Asn Thr Ala Phe Val Leu Ala Ala Ile Ala Asp
420 425 430
Val Ile Asp Ala Ser Pro Asp Ala Leu Asn Thr Leu Asn Glu Leu Ala
435 440 445
Ala Ala Leu Gly Asn Asp Pro Asp Phe Ala Thr Thr Met Thr Asn Ala
450 455 460
Leu Ala Gly Lys Gln Pro Lys Asn Ala Thr Leu Thr Ala Leu Ala Gly
465 470 475 480
Leu Ser Thr Ala Lys Asn Lys Leu Pro Tyr Phe Ala Glu Asn Asp Ala
485 490 495
Ala Ser Leu Thr Glu Leu Thr Gln Val Gly Arg Asp Ile Leu Ala Lys
500 505 510
Asn Ser Val Ala Asp Val Leu Glu Tyr Leu Gly Ala Gly Glu Asn Ser
515 520 525
Gly Ser Ala Thr Asp Val Met Ile Gln Leu Leu Thr Ser Lys Pro Phe
530 535 540
Gly Ala Ala Gly Asp Ala Thr Thr Asp Asp Thr Glu Val Ile Ala Ala
545 550 555 560
Ser Leu Asn Ser Gln Lys Ala Val Thr Ile Ser Asp Gly Val Phe Ser
565 570 575
Ser Ser Gly Ile Asn Ser Asn Tyr Cys Asn Leu Asp Gly Arg Gly Ser
580 585 590
Gly Val Leu Ser His Arg Ser Ser Thr Gly Asn Tyr Leu Val Phe Asn
595 600 605
Asn Pro Arg Thr Gly Arg Leu Ser Asn Ile Thr Val Glu Ser Asn Lys
610 615 620
Ala Thr Asp Thr Thr Gln Gly Gln Gln Val Ser Leu Ala Gly Gly Ser
625 630 635 640
Asp Val Thr Val Ser Asp Val Asn Phe Ser Asn Val Lys Gly Thr Gly
645 650 655
Phe Ser Leu Ile Ala Tyr Pro Asn Asp Ala Pro Pro Asp Gly Leu Met
660 665 670
Ile Lys Gly Ile Arg Gly Ser Tyr Ser Gly Tyr Ala Thr Asn Lys Ala
675 680 685
Ala Gly Cys Val Leu Ala Asp Ser Ser Val Asn Ser Leu Ile Asp Asn
690 695 700
Val Ile Ala Lys Asn Tyr Pro Gln Phe Gly Ala Val Glu Leu Lys Gly
705 710 715 720
Thr Ala Ser Tyr Asn Ile Val Ser Asn Val Ile Gly Ala Asp Cys Gln
725 730 735
His Val Thr Tyr Asn Gly Thr Glu Gly Pro Ile Ala Pro Ser Asn Asn
740 745 750
Leu Ile Lys Gly Val Met Ala Asn Asn Pro Lys Tyr Ala Ala Val Val
755 760 765
Ala Gly Lys Gly Ser Thr Asn Leu Ile Ser Asp Val Leu Val Asp Tyr
770 775 780
Ser Thr Ser Asp Ala Arg Gln Ala His Gly Val Thr Val Glu Gly Ser
785 790 795 800
Asp Asn Val Ile Asn Asn Val Leu Met Ser Gly Cys Asp Gly Thr Asn
805 810 815
Ser Leu Gly Gln Arg Gln Thr Ala Thr Ile Ala Arg Phe Ile Gly Thr
820 825 830
Ala Asn Asn Asn Tyr Ala Ser Val Phe Pro Ser Tyr Ser Ala Thr Gly
835 840 845
Val Ile Thr Phe Glu Ser Gly Ser Thr Arg Asn Phe Val Glu Val Lys
850 855 860
His Pro Gly Arg Arg Asn Asp Leu Leu Ser Ser Ala Ser Thr Ile Asp
865 870 875 880
Gly Ala Ala Thr Ile Asp Gly Thr Ser Asn Ser Asn Val Val His Ala
885 890 895
Pro Ala Leu Gly Gln Tyr Ile Gly Ser Met Ser Gly Arg Phe Glu Trp
900 905 910
Arg Ile Lys Ser Met Ser Leu Pro Ser Gly Val Leu Thr Ser Ala Asp
915 920 925
Lys Tyr Arg Met Leu Gly Asp Gly Ala Val Ser Leu Ala Val Gly Gly
930 935 940
Gly Thr Ser Ser Gln Val Arg Leu Phe Thr Ser Asp Gly Thr Ser Arg
945 950 955 960
Thr Val Ser Leu Thr Asn Gly Asn Val Arg Leu Ser Thr Ser Ser Thr
965 970 975
Gly Tyr Leu Gln Leu Gly Ala Asp Ala Met Thr Pro Asp Ser Thr Gly
980 985 990
Thr Tyr Ala Leu Gly Ser Ala Ser Arg Ala Trp Ser Gly Gly Phe Thr
995 1000 1005
Gln Ala Ala Phe Thr Val Thr Ser Asp Ala Arg Cys Lys Thr Glu
1010 1015 1020
Pro Leu Thr Ile Ser Asp Ala Leu Leu Asp Ala Trp Ser Glu Val
1025 1030 1035
Asp Phe Val Gln Phe Gln Tyr Leu Asp Arg Val Glu Glu Lys Gly
1040 1045 1050
Ala Asp Ser Ala Arg Trp His Phe Gly Ile Ile Ala Gln Arg Ala
1055 1060 1065
Lys Glu Ala Phe Glu Arg His Gly Ile Asp Ala His Arg Tyr Gly
1070 1075 1080
Phe Leu Cys Phe Asp Ser Trp Asp Asp Val Tyr Glu Glu Asp Ala
1085 1090 1095
Asn Gly Ser Arg Lys Leu Ile Thr Pro Ala Gly Ser Arg Tyr Gly
1100 1105 1110
Ile Arg Tyr Glu Glu Val Leu Ile Leu Glu Ala Ala Leu Met Arg
1115 1120 1125
Arg Thr Ile Lys Arg Met Gln Glu Ala Leu Ala Ala Leu Pro Lys
1130 1135 1140
<210> 14
<211> 1144
<212> PRT
<213> 人工序列
<220>
<223> K5 5.1
<400> 14
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Val Val Met Asp Glu Thr Asn Arg Lys Ala Pro Leu Asp Ser Pro
385 390 395 400
Ala Leu Thr Gly Thr Pro Thr Ala Pro Thr Ala Leu Arg Gly Thr Asn
405 410 415
Asn Thr Gln Ile Ala Asn Thr Ala Phe Val Leu Ala Ala Ile Ala Asp
420 425 430
Val Ile Asp Ala Ser Pro Asp Ala Leu Asn Thr Leu Asn Glu Leu Ala
435 440 445
Ala Ala Leu Gly Asn Asp Pro Asp Phe Ala Thr Thr Met Thr Asn Ala
450 455 460
Leu Ala Gly Lys Gln Pro Lys Asn Ala Thr Leu Thr Ala Leu Ala Gly
465 470 475 480
Leu Ser Thr Ala Lys Asn Lys Leu Pro Tyr Phe Ala Glu Asn Asp Ala
485 490 495
Ala Ser Leu Thr Glu Leu Thr Gln Val Gly Arg Asp Ile Leu Ala Lys
500 505 510
Asn Ser Val Ala Asp Val Leu Glu Tyr Leu Gly Ala Gly Glu Asn Ser
515 520 525
Gly Ser Ala Thr Asp Val Met Ile Gln Leu Ala Leu Thr Ser Lys Pro
530 535 540
Phe Gly Ala Ala Gly Asp Ala Thr Thr Asp Asp Thr Glu Val Ile Ala
545 550 555 560
Ala Ser Leu Asn Ser Gln Lys Ala Val Thr Ile Ser Asp Gly Val Phe
565 570 575
Ser Ser Ser Gly Ile Asn Ser Asn Tyr Cys Asn Leu Asp Gly Arg Gly
580 585 590
Ser Gly Val Leu Ser His Arg Ser Ser Thr Gly Asn Tyr Leu Val Phe
595 600 605
Asn Asn Pro Arg Thr Gly Arg Leu Ser Asn Ile Thr Val Glu Ser Asn
610 615 620
Lys Ala Thr Asp Thr Thr Gln Gly Gln Gln Val Ser Leu Ala Gly Gly
625 630 635 640
Ser Asp Val Thr Val Ser Asp Val Asn Phe Ser Asn Val Lys Gly Thr
645 650 655
Gly Phe Ser Leu Ile Ala Tyr Pro Asn Asp Ala Pro Pro Asp Gly Leu
660 665 670
Met Ile Lys Gly Ile Arg Gly Ser Tyr Ser Gly Tyr Ala Thr Asn Lys
675 680 685
Ala Ala Gly Cys Val Leu Ala Asp Ser Ser Val Asn Ser Leu Ile Asp
690 695 700
Asn Val Ile Ala Lys Asn Tyr Pro Gln Phe Gly Ala Val Glu Leu Lys
705 710 715 720
Gly Thr Ala Ser Tyr Asn Ile Val Ser Asn Val Ile Gly Ala Asp Cys
725 730 735
Gln His Val Thr Tyr Asn Gly Thr Glu Gly Pro Ile Ala Pro Ser Asn
740 745 750
Asn Leu Ile Lys Gly Val Met Ala Asn Asn Pro Lys Tyr Ala Ala Val
755 760 765
Val Ala Gly Lys Gly Ser Thr Asn Leu Ile Ser Asp Val Leu Val Asp
770 775 780
Tyr Ser Thr Ser Asp Ala Arg Gln Ala His Gly Val Thr Val Glu Gly
785 790 795 800
Ser Asp Asn Val Ile Asn Asn Val Leu Met Ser Gly Cys Asp Gly Thr
805 810 815
Asn Ser Leu Gly Gln Arg Gln Thr Ala Thr Ile Ala Arg Phe Ile Gly
820 825 830
Thr Ala Asn Asn Asn Tyr Ala Ser Val Phe Pro Ser Tyr Ser Ala Thr
835 840 845
Gly Val Ile Thr Phe Glu Ser Gly Ser Thr Arg Asn Phe Val Glu Val
850 855 860
Lys His Pro Gly Arg Arg Asn Asp Leu Leu Ser Ser Ala Ser Thr Ile
865 870 875 880
Asp Gly Ala Ala Thr Ile Asp Gly Thr Ser Asn Ser Asn Val Val His
885 890 895
Ala Pro Ala Leu Gly Gln Tyr Ile Gly Ser Met Ser Gly Arg Phe Glu
900 905 910
Trp Arg Ile Lys Ser Met Ser Leu Pro Ser Gly Val Leu Thr Ser Ala
915 920 925
Asp Lys Tyr Arg Met Leu Gly Asp Gly Ala Val Ser Leu Ala Val Gly
930 935 940
Gly Gly Thr Ser Ser Gln Val Arg Leu Phe Thr Ser Asp Gly Thr Ser
945 950 955 960
Arg Thr Val Ser Leu Thr Asn Gly Asn Val Arg Leu Ser Thr Ser Ser
965 970 975
Thr Gly Tyr Leu Gln Leu Gly Ala Asp Ala Met Thr Pro Asp Ser Thr
980 985 990
Gly Thr Tyr Ala Leu Gly Ser Ala Ser Arg Ala Trp Ser Gly Gly Phe
995 1000 1005
Thr Gln Ala Ala Phe Thr Val Thr Ser Asp Ala Arg Cys Lys Thr
1010 1015 1020
Glu Pro Leu Thr Ile Ser Asp Ala Leu Leu Asp Ala Trp Ser Glu
1025 1030 1035
Val Asp Phe Val Gln Phe Gln Tyr Leu Asp Arg Val Glu Glu Lys
1040 1045 1050
Gly Ala Asp Ser Ala Arg Trp His Phe Gly Ile Ile Ala Gln Arg
1055 1060 1065
Ala Lys Glu Ala Phe Glu Arg His Gly Ile Asp Ala His Arg Tyr
1070 1075 1080
Gly Phe Leu Cys Phe Asp Ser Trp Asp Asp Val Tyr Glu Glu Asp
1085 1090 1095
Ala Asn Gly Ser Arg Lys Leu Ile Thr Pro Ala Gly Ser Arg Tyr
1100 1105 1110
Gly Ile Arg Tyr Glu Glu Val Leu Ile Leu Glu Ala Ala Leu Met
1115 1120 1125
Arg Arg Thr Ile Lys Arg Met Gln Glu Ala Leu Ala Ala Leu Pro
1130 1135 1140
Lys
<210> 15
<211> 1186
<212> PRT
<213> 人工序列
<220>
<223> STF-V10
<400> 15
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Val Val Met Asp Glu Thr Asn Arg Lys Ala Pro Leu Asp Ser Pro
385 390 395 400
Ala Leu Thr Gly Thr Pro Thr Ala Pro Thr Ala Leu Arg Gly Thr Asn
405 410 415
Asn Thr Gln Ile Ala Asn Thr Ala Phe Val Leu Ala Ala Ile Ala Asp
420 425 430
Val Ile Asp Ala Ser Pro Asp Ala Leu Asn Thr Leu Asn Glu Leu Ala
435 440 445
Ala Ala Leu Gly Asn Asp Pro Asp Phe Ala Thr Thr Met Thr Asn Ala
450 455 460
Leu Ala Gly Lys Gln Pro Lys Asn Ala Thr Leu Thr Ala Leu Ala Gly
465 470 475 480
Leu Ser Thr Ala Lys Asn Lys Leu Pro Tyr Phe Ala Glu Asn Asp Ala
485 490 495
Ala Ser Leu Thr Glu Leu Thr Gln Val Gly Arg Asp Ile Leu Ala Lys
500 505 510
Asn Ser Val Ala Asp Val Leu Glu Tyr Leu Gly Ala Gly Glu Asn Ser
515 520 525
Ala Ala Asn Asp Gly Phe Lys Phe Ile Gly Gln Cys Pro Asp Ile Leu
530 535 540
Thr Leu Arg Thr Ile Glu Pro Glu Lys Asn Gly Gln Arg Ile Thr Leu
545 550 555 560
Arg Gln His Thr Ile Gly Thr Gly Leu Gly Gly Gly Val Phe Arg Ala
565 570 575
Val Leu Asp Gly Thr Gly Tyr Thr Asp Asp Asp Gly Val Val Ile Lys
580 585 590
Thr Ala Gly Gly Ser Val Trp Leu Arg Val Asn Ala Asp Lys Val Asn
595 600 605
Pro Phe Met Phe Gly Ala Thr Gly Val Ala Asp Asp Thr Ala Ala Leu
610 615 620
Gln Lys Met Leu Glu Cys Gly Arg Ala Ala Glu Leu Gly Thr Asn Val
625 630 635 640
Trp Lys Ala Ser Asn Leu Glu Leu Asn Asn Lys Ser Cys Ser Leu Ser
645 650 655
Gly Ser Gly Leu His Val Ser Arg Ile Glu Gln Ile Ser Gly Ala Thr
660 665 670
Gly Ala Leu Leu Thr Ile Thr Gln Asp Cys Ser Leu Ile Tyr Leu Ser
675 680 685
Asp Cys Gly Leu Tyr Gly Asp Gly Ile Thr Ala Gly Thr Ser Gly Val
690 695 700
Thr Met Glu Thr Gly Asn Pro Gly Gly Ala Pro Ser Tyr Pro Phe Asn
705 710 715 720
Thr Ala Pro Asp Val Arg Arg Asp Leu Tyr Ile Ser Asn Val His Ile
725 730 735
Thr Gly Phe Asp Glu Leu Gly Phe Asp Tyr Pro Glu Thr Asn Phe Ser
740 745 750
Val Ser Thr His Gly Leu Phe Ile Arg Asn Ile Lys Lys Thr Gly Ala
755 760 765
Lys Ile Gly Thr Thr Asp Phe Thr Trp Thr Asn Leu Gln Ile Asp Thr
770 775 780
Cys Gly Gln Glu Cys Leu Val Leu Asp Gly Ala Gly Asn Cys Arg Ile
785 790 795 800
Ile Gly Ala Lys Leu Ile Trp Ala Gly Ser Glu Asn Glu Thr Pro Tyr
805 810 815
Ser Gly Leu Arg Ile Ser Asn Ser Gln Asn Val Asn Met Thr Gly Val
820 825 830
Glu Leu Gln Asp Cys Ala Tyr Asp Gly Leu Tyr Ile Lys Asn Ser Thr
835 840 845
Val Ala Ile Ser Gly Leu Asn Thr Asn Arg Asn Ser Ala Ser Ser Asn
850 855 860
Leu Ser Tyr His Asn Met Val Phe Glu Asn Ser Ile Val Thr Val Asp
865 870 875 880
Gly Tyr Val Cys Arg Asn Tyr Ala Ala Thr Ser Leu Tyr Asp Leu Asn
885 890 895
Ser Gln Ala Gly Asn Val Arg Cys Ile Gly Ser Asp Ser Thr Val Leu
900 905 910
Ile Asn Gly Ile Tyr Glu Ser Glu Val Asn Ser Glu Arg Leu Met Gly
915 920 925
Asp Asn Asn Leu Ile Gln Pro Tyr Ser Gly Asp Leu Ile Ile Asn Gly
930 935 940
Leu Lys Asn Tyr Tyr Thr Tyr Thr Gly Ser Val Lys Asn Asn Ile Pro
945 950 955 960
Thr Phe Asp Gly Val Val Thr Thr Ala Thr Tyr Val Ser Ala Pro Ser
965 970 975
Ile Leu Gly Gln Gly Asn Met Leu Lys Leu Thr Gln Ser Asn Lys Asp
980 985 990
Lys Leu Leu Phe Ser Asp Lys Val Ser Arg His Gly Cys Thr Ile Gly
995 1000 1005
Leu Val Leu Ile Pro Ser Phe Thr Gly Ala Thr Thr Met Thr Ala
1010 1015 1020
Phe Thr Leu Gly Ser Gly Tyr Ser Pro Ser Gly Asn Ser Ala Val
1025 1030 1035
Met Gln Phe Ile Val Asn Ser Ser Gly Val Gln Thr Ile Ala Ile
1040 1045 1050
Leu Leu Ser Gly Asp Gly Ile Thr Gln Thr Leu Thr Ser Asp Leu
1055 1060 1065
Thr Thr Glu Gln Ala Leu Ala Ser Gly Gly Val Tyr His Phe Ala
1070 1075 1080
Met Gly Phe Ala Pro Gly Arg Leu Trp Trp Ser Ile Ile Asp Ile
1085 1090 1095
Asn Thr Gly Arg Arg Ile Arg Arg Ala Tyr Arg Gln Pro Asp Leu
1100 1105 1110
His Ala Ala Phe Asn Ser Ile Phe Asn Ser Gly Thr Ser Ser Ile
1115 1120 1125
Thr Ala Phe Ser Gly Pro Leu Ala Gly Asp Ile Ala Cys Glu Gly
1130 1135 1140
Ala Gly Ser His Val Tyr Val Gly Gly Phe Ser Ser Glu Ser Asp
1145 1150 1155
Tyr Ala Ala Ser Arg Met Tyr Gly Leu Phe Thr Pro Val Asp Leu
1160 1165 1170
Asp Lys Gln Tyr Ser Phe Arg Thr Leu Asn Gly Asn Ile
1175 1180 1185
<210> 16
<211> 875
<212> PRT
<213> 细菌噬菌体V10
<400> 16
Met Thr Val Ser Thr Glu Val Asn His Asn Glu Tyr Thr Gly Asn Gly
1 5 10 15
Val Thr Thr Ser Phe Pro Tyr Thr Phe Arg Val Phe Lys Glu Ser Asp
20 25 30
Leu Val Val Gln Val Val Asp Leu Asn Asp Asn Ile Thr Val Leu Thr
35 40 45
Leu Asp Thr Asp Tyr Thr Val Thr Gly Ala Gly Gly Tyr Glu Gly Gly
50 55 60
Asn Val Ile Leu Ala Thr Ala Leu Ala Asn Gly Tyr Gln Ile Ser Ile
65 70 75 80
Ser Arg Glu Leu Ser Val Thr Gln Glu Thr Asp Leu Arg Asn Gln Gly
85 90 95
Lys Phe Phe Ala Glu Val His Glu Asp Ala Phe Asp Lys Leu Thr Met
100 105 110
Leu Ile Gln Gln Val Arg Ser Trp Phe Ser Leu Ala Leu Arg Lys Pro
115 120 125
Ser Phe Val Ala Asn Tyr Tyr Asp Ala Met Asp Asn Tyr Ile Arg Asn
130 135 140
Leu Arg Asp Pro Val Arg Pro Gln Asp Ala Ala Thr Lys Lys Tyr Val
145 150 155 160
Asp Gly Val Ala Glu Thr Asn Leu Ser Arg Thr Leu Arg Thr Pro Glu
165 170 175
Pro Ile Pro Ala Leu Pro Gly Ile Glu Gln Arg Lys Asn Lys Ile Val
180 185 190
Ala Met Asp Asp Thr Gly Asn Pro Ile Met Val Leu Pro Glu Ser Gly
195 200 205
Ser Ala Thr Asp Val Met Ile Gln Leu Ala Ala Asn Asp Gly Phe Lys
210 215 220
Phe Ile Gly Gln Cys Pro Asp Ile Leu Thr Leu Arg Thr Ile Glu Pro
225 230 235 240
Glu Lys Asn Gly Gln Arg Ile Thr Leu Arg Gln His Thr Ile Gly Thr
245 250 255
Gly Leu Gly Gly Gly Val Phe Arg Ala Val Leu Asp Gly Thr Gly Tyr
260 265 270
Thr Asp Asp Asp Gly Val Val Ile Lys Thr Ala Gly Gly Ser Val Trp
275 280 285
Leu Arg Val Asn Ala Asp Lys Val Asn Pro Phe Met Phe Gly Ala Thr
290 295 300
Gly Val Ala Asp Asp Thr Ala Ala Leu Gln Lys Met Leu Glu Cys Gly
305 310 315 320
Arg Ala Ala Glu Leu Gly Thr Asn Val Trp Lys Ala Ser Asn Leu Glu
325 330 335
Leu Asn Asn Lys Ser Cys Ser Leu Ser Gly Ser Gly Leu His Val Ser
340 345 350
Arg Ile Glu Gln Ile Ser Gly Ala Thr Gly Ala Leu Leu Thr Ile Thr
355 360 365
Gln Asp Cys Ser Leu Ile Tyr Leu Ser Asp Cys Gly Leu Tyr Gly Asp
370 375 380
Gly Ile Thr Ala Gly Thr Ser Gly Val Thr Met Glu Thr Gly Asn Pro
385 390 395 400
Gly Gly Ala Pro Ser Tyr Pro Phe Asn Thr Ala Pro Asp Val Arg Arg
405 410 415
Asp Leu Tyr Ile Ser Asn Val His Ile Thr Gly Phe Asp Glu Leu Gly
420 425 430
Phe Asp Tyr Pro Glu Thr Asn Phe Ser Val Ser Thr His Gly Leu Phe
435 440 445
Ile Arg Asn Ile Lys Lys Thr Gly Ala Lys Ile Gly Thr Thr Asp Phe
450 455 460
Thr Trp Thr Asn Leu Gln Ile Asp Thr Cys Gly Gln Glu Cys Leu Val
465 470 475 480
Leu Asp Gly Ala Gly Asn Cys Arg Ile Ile Gly Ala Lys Leu Ile Trp
485 490 495
Ala Gly Ser Glu Asn Glu Thr Pro Tyr Ser Gly Leu Arg Ile Ser Asn
500 505 510
Ser Gln Asn Val Asn Met Thr Gly Val Glu Leu Gln Asp Cys Ala Tyr
515 520 525
Asp Gly Leu Tyr Ile Lys Asn Ser Thr Val Ala Ile Ser Gly Leu Asn
530 535 540
Thr Asn Arg Asn Ser Ala Ser Ser Asn Leu Ser Tyr His Asn Met Val
545 550 555 560
Phe Glu Asn Ser Ile Val Thr Val Asp Gly Tyr Val Cys Arg Asn Tyr
565 570 575
Ala Ala Thr Ser Leu Tyr Asp Leu Asn Ser Gln Ala Gly Asn Val Arg
580 585 590
Cys Ile Gly Ser Asp Ser Thr Val Leu Ile Asn Gly Ile Tyr Glu Ser
595 600 605
Glu Val Asn Ser Glu Arg Leu Met Gly Asp Asn Asn Leu Ile Gln Pro
610 615 620
Tyr Ser Gly Asp Leu Ile Ile Asn Gly Leu Lys Asn Tyr Tyr Thr Tyr
625 630 635 640
Thr Gly Ser Val Lys Asn Asn Ile Pro Thr Phe Asp Gly Val Val Thr
645 650 655
Thr Ala Thr Tyr Val Ser Ala Pro Ser Ile Leu Gly Gln Gly Asn Met
660 665 670
Leu Lys Leu Thr Gln Ser Asn Lys Asp Lys Leu Leu Phe Ser Asp Lys
675 680 685
Val Ser Arg His Gly Cys Thr Ile Gly Leu Val Leu Ile Pro Ser Phe
690 695 700
Thr Gly Ala Thr Thr Met Thr Ala Phe Thr Leu Gly Ser Gly Tyr Ser
705 710 715 720
Pro Ser Gly Asn Ser Ala Val Met Gln Phe Ile Val Asn Ser Ser Gly
725 730 735
Val Gln Thr Ile Ala Ile Leu Leu Ser Gly Asp Gly Ile Thr Gln Thr
740 745 750
Leu Thr Ser Asp Leu Thr Thr Glu Gln Ala Leu Ala Ser Gly Gly Val
755 760 765
Tyr His Phe Ala Met Gly Phe Ala Pro Gly Arg Leu Trp Trp Ser Ile
770 775 780
Ile Asp Ile Asn Thr Gly Arg Arg Ile Arg Arg Ala Tyr Arg Gln Pro
785 790 795 800
Asp Leu His Ala Ala Phe Asn Ser Ile Phe Asn Ser Gly Thr Ser Ser
805 810 815
Ile Thr Ala Phe Ser Gly Pro Leu Ala Gly Asp Ile Ala Cys Glu Gly
820 825 830
Ala Gly Ser His Val Tyr Val Gly Gly Phe Ser Ser Glu Ser Asp Tyr
835 840 845
Ala Ala Ser Arg Met Tyr Gly Leu Phe Thr Pro Val Asp Leu Asp Lys
850 855 860
Gln Tyr Ser Phe Arg Thr Leu Asn Gly Asn Ile
865 870 875
<210> 17
<211> 3558
<212> DNA
<213> 人工序列
<220>
<223> STF-V10-[FA]
<400> 17
atggcagtaa agatttcagg agtcctgaaa gacggcacag gaaaaccggt acagaactgc 60
accattcagc tgaaagccag acgtaacagc accacggtgg tggtgaacac ggtgggctca 120
gagaatccgg atgaagccgg gcgttacagc atggatgtgg agtacggtca gtacagtgtc 180
atcctgcagg ttgacggttt tccaccatcg cacgccggga ccatcaccgt gtatgaagat 240
tcacaaccgg ggacgctgaa tgattttctc tgtgccatga cggaggatga tgcccggccg 300
gaggtgctgc gtcgtcttga actgatggtg gaagaggtgg cgcgtaacgc gtccgtggtg 360
gcacagagta cggcagacgc gaagaaatca gccggcgatg ccagtgcatc agctgctcag 420
gtcgcggccc ttgtgactga tgcaactgac tcagcacgcg ccgccagcac gtccgccgga 480
caggctgcat cgtcagctca ggaagcgtcc tccggcgcag aagcggcatc agcaaaggcc 540
actgaagcgg aaaaaagtgc cgcagccgca gagtcctcaa aaaacgcggc ggccaccagt 600
gccggtgcgg cgaaaacgtc agaaacgaat gctgcagcgt cacaacaatc agccgccacg 660
tctgcctcca ccgcggccac gaaagcgtca gaggccgcca cttcagcacg agatgcggtg 720
gcctcaaaag aggcagcaaa atcatcagaa acgaacgcat catcaagtgc cggtcgtgca 780
gcttcctcgg caacggcggc agaaaattct gccagggcgg caaaaacgtc cgagacgaat 840
gccaggtcat ctgaaacagc agcggaacgg agcgcctctg ccgcggcaga cgcaaaaaca 900
gcggcggcgg ggagtgcgtc aacggcatcc acgaaggcga cagaggctgc gggaagtgcg 960
gtatcagcat cgcagagcaa aagtgcggca gaagcggcgg caatacgtgc aaaaaattcg 1020
gcaaaacgtg cagaagatat agcttcagct gtcgcgcttg aggatgcgga cacaacgaga 1080
aaggggatag tgcagctcag cagtgcaacc aacagcacgt ctgaaacgct tgctgcaacg 1140
ccaaaggcgg ttaaggtggt aatggatgag actaatcgta aggcacctct ggacagtccg 1200
gcactgaccg gaacgccaac agcaccaacc gcgctcaggg gaacaaacaa tacccagatt 1260
gcgaacaccg cttttgtact ggccgcgatt gcagatgtta tcgacgcgtc acctgacgca 1320
ctgaatacgc tgaatgaact ggccgcagcg ctcgggaatg atccagattt tgctaccacc 1380
atgactaacg cgcttgcggg taaacaaccg aagaatgcga cactgacggc gctggcaggg 1440
ctttccacgg cgaaaaataa attaccgtat tttgcggaaa atgatgccgc cagcctgact 1500
gaactgactc aggttggcag ggatattctg gcaaaaaatt ccgttgcaga tgttcttgaa 1560
taccttgggg ccggtgagaa ttcggcggca aatgatggct tcgcattcat cggtcagtgc 1620
ccagacatct tgaccctgcg tactatcgag ccggaaaaaa acggtcagcg tatcacctta 1680
cgtcaacata cgattggcac tggcttaggc ggtggcgttt tccgtgcagt tctggacggc 1740
actggctata ccgatgacga cggtgtggtg atcaaaaccg ctgggggcag cgtttggctg 1800
cgtgtcaacg ctgacaaagt taacccgttc atgttcggtg caaccggagt agcggacgac 1860
accgccgccc tgcaaaaaat gctggaatgc ggtcgtgcgg cggaactggg gactaacgta 1920
tggaaagcaa gcaatctgga actgaacaac aaatcttgct ctctgtccgg cagtggcctg 1980
cacgtttctc gtattgaaca gatttccggt gcaaccggag cattgttaac catcacccaa 2040
gactgttcgc tgatttacct gtccgattgt ggcctgtacg gcgatggcat caccgcaggc 2100
acgagcggtg ttactatgga aacgggtaat ccgggtggcg ctccgtctta ccctttcaat 2160
accgctccgg acgttcgtcg tgacctgtac atctctaacg tgcacatcac gggcttcgac 2220
gagctgggtt ttgattatcc ggaaaccaat ttctctgttt cgacgcatgg cctcttcatc 2280
cgtaacatca aaaaaacggg tgcaaagatt ggtactacgg acttcacttg gactaacctg 2340
caaattgata cttgcggtca ggaatgtctg gtgctggacg gtgcgggtaa ctgccgtatt 2400
attggtgcaa aactgatttg ggcaggtagc gaaaacgaaa cgccatactc tggcctgcgt 2460
attagcaact ctcaaaatgt aaatatgact ggcgtagagt tacaagactg cgcgtatgat 2520
ggtttataca tcaagaactc tacggttgca atttcaggct taaacaccaa tcgcaatagc 2580
gcatcctcta atctgtccta ccataacatg gtattcgaaa attctattgt aactgttgat 2640
ggttatgtgt gtcgtaacta cgcggcgact tcgctgtacg acctgaacag ccaagcaggc 2700
aacgtccgtt gcatcggtag cgacagcacc gttttaatca acggcatcta cgaaagcgaa 2760
gtcaatagcg agcgcctgat gggtgataac aacctgatcc agccgtatag tggtgatctg 2820
atcattaacg gcctgaaaaa ttactacacc tatactggta gcgtaaaaaa caacattccg 2880
accttcgacg gcgttgttac tacggcaacc tatgtgagcg caccgtctat tctgggtcag 2940
ggcaatatgc tcaaactgac ccagtctaat aaagacaaac tgttatttag cgataaagtt 3000
agccgtcatg gctgtaccat cggcttagtt ctgattccgt cctttacggg cgcgaccact 3060
atgacggcgt tcacgctggg tagcggttac tctccatccg gtaactccgc cgtgatgcag 3120
ttcattgtta acagttccgg tgtacaaacc attgcgattt tattatccgg cgacggtatt 3180
acccaaaccc tgaccagcga tctgaccacg gaacaagcac tggcgagcgg tggcgtgtat 3240
cattttgcaa tgggttttgc gccgggtcgt ttatggtgga gcattatcga tattaacacg 3300
ggcaggcgta ttcgtcgcgc ctaccgtcag ccggatctgc acgcggcgtt caactctatc 3360
ttcaactccg gcacgtcgtc tattaccgca tttagcgggc cactggcggg cgacattgct 3420
tgcgaaggtg caggtagcca tgtatacgtt ggcggttttt cgtcggaatc tgattacgcg 3480
gctagccgta tgtatggcct gttcactccg gtcgatctgg acaagcagta tagcttccgt 3540
accctgaacg gtaacatt 3558
<210> 18
<211> 3558
<212> DNA
<213> 人工序列
<220>
<223> STF-V10-[AAH]
<400> 18
atggcagtaa agatttcagg agtcctgaaa gacggcacag gaaaaccggt acagaactgc 60
accattcagc tgaaagccag acgtaacagc accacggtgg tggtgaacac ggtgggctca 120
gagaatccgg atgaagccgg gcgttacagc atggatgtgg agtacggtca gtacagtgtc 180
atcctgcagg ttgacggttt tccaccatcg cacgccggga ccatcaccgt gtatgaagat 240
tcacaaccgg ggacgctgaa tgattttctc tgtgccatga cggaggatga tgcccggccg 300
gaggtgctgc gtcgtcttga actgatggtg gaagaggtgg cgcgtaacgc gtccgtggtg 360
gcacagagta cggcagacgc gaagaaatca gccggcgatg ccagtgcatc agctgctcag 420
gtcgcggccc ttgtgactga tgcaactgac tcagcacgcg ccgccagcac gtccgccgga 480
caggctgcat cgtcagctca ggaagcgtcc tccggcgcag aagcggcatc agcaaaggcc 540
actgaagcgg aaaaaagtgc cgcagccgca gagtcctcaa aaaacgcggc ggccaccagt 600
gccggtgcgg cgaaaacgtc agaaacgaat gctgcagcgt cacaacaatc agccgccacg 660
tctgcctcca ccgcggccac gaaagcgtca gaggccgcca cttcagcacg agatgcggtg 720
gcctcaaaag aggcagcaaa atcatcagaa acgaacgcat catcaagtgc cggtcgtgca 780
gcttcctcgg caacggcggc agaaaattct gccagggcgg caaaaacgtc cgagacgaat 840
gccaggtcat ctgaaacagc agcggaacgg agcgcctctg ccgcggcaga cgcaaaaaca 900
gcggcggcgg ggagtgcgtc aacggcatcc acgaaggcga cagaggctgc gggaagtgcg 960
gtatcagcat cgcagagcaa aagtgcggca gaagcggcgg caatacgtgc aaaaaattcg 1020
gcaaaacgtg cagaagatat agcttcagct gtcgcgcttg aggatgcgga cacaacgaga 1080
aaggggatag tgcagctcag cagtgcaacc aacagcacgt ctgaaacgct tgctgcaacg 1140
ccaaaggcgg ttaaggtggt aatggatgag actaatcgta aggcacctct ggacagtccg 1200
gcactgaccg gaacgccaac agcaccaacc gcgctcaggg gaacaaacaa tacccagatt 1260
gcgaacaccg cttttgtact ggccgcgatt gcagatgtta tcgacgcgtc acctgacgca 1320
ctgaatacgc tgaatgaact ggccgcagcg ctcgggaatg atccagattt tgctaccacc 1380
atgactaacg cgcttgcggg taaacaaccg aagaatgcga cactgacggc gctggcaggg 1440
ctttccacgg cgaaaaataa attaccgtat tttgcggaaa atgatgccgc cagcctgact 1500
gaactgactc aggttggcag ggatattctg gcaaaaaatt ccgttgcaga tgttcttgaa 1560
taccttgggg ccggtgagaa ttcggcggca aatgatggcg cggcacacat cggtcagtgc 1620
ccagacatct tgaccctgcg tactatcgag ccggaaaaaa acggtcagcg tatcacctta 1680
cgtcaacata cgattggcac tggcttaggc ggtggcgttt tccgtgcagt tctggacggc 1740
actggctata ccgatgacga cggtgtggtg atcaaaaccg ctgggggcag cgtttggctg 1800
cgtgtcaacg ctgacaaagt taacccgttc atgttcggtg caaccggagt agcggacgac 1860
accgccgccc tgcaaaaaat gctggaatgc ggtcgtgcgg cggaactggg gactaacgta 1920
tggaaagcaa gcaatctgga actgaacaac aaatcttgct ctctgtccgg cagtggcctg 1980
cacgtttctc gtattgaaca gatttccggt gcaaccggag cattgttaac catcacccaa 2040
gactgttcgc tgatttacct gtccgattgt ggcctgtacg gcgatggcat caccgcaggc 2100
acgagcggtg ttactatgga aacgggtaat ccgggtggcg ctccgtctta ccctttcaat 2160
accgctccgg acgttcgtcg tgacctgtac atctctaacg tgcacatcac gggcttcgac 2220
gagctgggtt ttgattatcc ggaaaccaat ttctctgttt cgacgcatgg cctcttcatc 2280
cgtaacatca aaaaaacggg tgcaaagatt ggtactacgg acttcacttg gactaacctg 2340
caaattgata cttgcggtca ggaatgtctg gtgctggacg gtgcgggtaa ctgccgtatt 2400
attggtgcaa aactgatttg ggcaggtagc gaaaacgaaa cgccatactc tggcctgcgt 2460
attagcaact ctcaaaatgt aaatatgact ggcgtagagt tacaagactg cgcgtatgat 2520
ggtttataca tcaagaactc tacggttgca atttcaggct taaacaccaa tcgcaatagc 2580
gcatcctcta atctgtccta ccataacatg gtattcgaaa attctattgt aactgttgat 2640
ggttatgtgt gtcgtaacta cgcggcgact tcgctgtacg acctgaacag ccaagcaggc 2700
aacgtccgtt gcatcggtag cgacagcacc gttttaatca acggcatcta cgaaagcgaa 2760
gtcaatagcg agcgcctgat gggtgataac aacctgatcc agccgtatag tggtgatctg 2820
atcattaacg gcctgaaaaa ttactacacc tatactggta gcgtaaaaaa caacattccg 2880
accttcgacg gcgttgttac tacggcaacc tatgtgagcg caccgtctat tctgggtcag 2940
ggcaatatgc tcaaactgac ccagtctaat aaagacaaac tgttatttag cgataaagtt 3000
agccgtcatg gctgtaccat cggcttagtt ctgattccgt cctttacggg cgcgaccact 3060
atgacggcgt tcacgctggg tagcggttac tctccatccg gtaactccgc cgtgatgcag 3120
ttcattgtta acagttccgg tgtacaaacc attgcgattt tattatccgg cgacggtatt 3180
acccaaaccc tgaccagcga tctgaccacg gaacaagcac tggcgagcgg tggcgtgtat 3240
cattttgcaa tgggttttgc gccgggtcgt ttatggtgga gcattatcga tattaacacg 3300
ggcaggcgta ttcgtcgcgc ctaccgtcag ccggatctgc acgcggcgtt caactctatc 3360
ttcaactccg gcacgtcgtc tattaccgca tttagcgggc cactggcggg cgacattgct 3420
tgcgaaggtg caggtagcca tgtatacgtt ggcggttttt cgtcggaatc tgattacgcg 3480
gctagccgta tgtatggcct gttcactccg gtcgatctgg acaagcagta tagcttccgt 3540
accctgaacg gtaacatt 3558
<210> 19
<211> 3588
<212> DNA
<213> 人工序列
<220>
<223> STF-V10-[Helix]
<400> 19
atggcagtaa agatttcagg agtcctgaaa gacggcacag gaaaaccggt acagaactgc 60
accattcagc tgaaagccag acgtaacagc accacggtgg tggtgaacac ggtgggctca 120
gagaatccgg atgaagccgg gcgttacagc atggatgtgg agtacggtca gtacagtgtc 180
atcctgcagg ttgacggttt tccaccatcg cacgccggga ccatcaccgt gtatgaagat 240
tcacaaccgg ggacgctgaa tgattttctc tgtgccatga cggaggatga tgcccggccg 300
gaggtgctgc gtcgtcttga actgatggtg gaagaggtgg cgcgtaacgc gtccgtggtg 360
gcacagagta cggcagacgc gaagaaatca gccggcgatg ccagtgcatc agctgctcag 420
gtcgcggccc ttgtgactga tgcaactgac tcagcacgcg ccgccagcac gtccgccgga 480
caggctgcat cgtcagctca ggaagcgtcc tccggcgcag aagcggcatc agcaaaggcc 540
actgaagcgg aaaaaagtgc cgcagccgca gagtcctcaa aaaacgcggc ggccaccagt 600
gccggtgcgg cgaaaacgtc agaaacgaat gctgcagcgt cacaacaatc agccgccacg 660
tctgcctcca ccgcggccac gaaagcgtca gaggccgcca cttcagcacg agatgcggtg 720
gcctcaaaag aggcagcaaa atcatcagaa acgaacgcat catcaagtgc cggtcgtgca 780
gcttcctcgg caacggcggc agaaaattct gccagggcgg caaaaacgtc cgagacgaat 840
gccaggtcat ctgaaacagc agcggaacgg agcgcctctg ccgcggcaga cgcaaaaaca 900
gcggcggcgg ggagtgcgtc aacggcatcc acgaaggcga cagaggctgc gggaagtgcg 960
gtatcagcat cgcagagcaa aagtgcggca gaagcggcgg caatacgtgc aaaaaattcg 1020
gcaaaacgtg cagaagatat agcttcagct gtcgcgcttg aggatgcgga cacaacgaga 1080
aaggggatag tgcagctcag cagtgcaacc aacagcacgt ctgaaacgct tgctgcaacg 1140
ccaaaggcgg ttaaggtggt aatggatgag actaatcgta aggcacctct ggacagtccg 1200
gcactgaccg gaacgccaac agcaccaacc gcgctcaggg gaacaaacaa tacccagatt 1260
gcgaacaccg cttttgtact ggccgcgatt gcagatgtta tcgacgcgtc acctgacgca 1320
ctgaatacgc tgaatgaact ggccgcagcg ctcgggaatg atccagattt tgctaccacc 1380
atgactaacg cgcttgcggg taaacaaccg aagaatgcga cactgacggc gctggcaggg 1440
ctttccacgg cgaaaaataa attaccgtat tttgcggaaa atgatgccgc cagcctgact 1500
gaactgactc aggttggcag ggatattctg gcaaaaaatt ccgttgcaga tgttcttgaa 1560
taccttgggg ccggtgagaa ttcggggagc gctacagacg ttatgattca gctggcggca 1620
aatgatggct tcaaattcat cggtcagtgc ccagacatct tgaccctgcg tactatcgag 1680
ccggaaaaaa acggtcagcg tatcacctta cgtcaacata cgattggcac tggcttaggc 1740
ggtggcgttt tccgtgcagt tctggacggc actggctata ccgatgacga cggtgtggtg 1800
atcaaaaccg ctgggggcag cgtttggctg cgtgtcaacg ctgacaaagt taacccgttc 1860
atgttcggtg caaccggagt agcggacgac accgccgccc tgcaaaaaat gctggaatgc 1920
ggtcgtgcgg cggaactggg gactaacgta tggaaagcaa gcaatctgga actgaacaac 1980
aaatcttgct ctctgtccgg cagtggcctg cacgtttctc gtattgaaca gatttccggt 2040
gcaaccggag cattgttaac catcacccaa gactgttcgc tgatttacct gtccgattgt 2100
ggcctgtacg gcgatggcat caccgcaggc acgagcggtg ttactatgga aacgggtaat 2160
ccgggtggcg ctccgtctta ccctttcaat accgctccgg acgttcgtcg tgacctgtac 2220
atctctaacg tgcacatcac gggcttcgac gagctgggtt ttgattatcc ggaaaccaat 2280
ttctctgttt cgacgcatgg cctcttcatc cgtaacatca aaaaaacggg tgcaaagatt 2340
ggtactacgg acttcacttg gactaacctg caaattgata cttgcggtca ggaatgtctg 2400
gtgctggacg gtgcgggtaa ctgccgtatt attggtgcaa aactgatttg ggcaggtagc 2460
gaaaacgaaa cgccatactc tggcctgcgt attagcaact ctcaaaatgt aaatatgact 2520
ggcgtagagt tacaagactg cgcgtatgat ggtttataca tcaagaactc tacggttgca 2580
atttcaggct taaacaccaa tcgcaatagc gcatcctcta atctgtccta ccataacatg 2640
gtattcgaaa attctattgt aactgttgat ggttatgtgt gtcgtaacta cgcggcgact 2700
tcgctgtacg acctgaacag ccaagcaggc aacgtccgtt gcatcggtag cgacagcacc 2760
gttttaatca acggcatcta cgaaagcgaa gtcaatagcg agcgcctgat gggtgataac 2820
aacctgatcc agccgtatag tggtgatctg atcattaacg gcctgaaaaa ttactacacc 2880
tatactggta gcgtaaaaaa caacattccg accttcgacg gcgttgttac tacggcaacc 2940
tatgtgagcg caccgtctat tctgggtcag ggcaatatgc tcaaactgac ccagtctaat 3000
aaagacaaac tgttatttag cgataaagtt agccgtcatg gctgtaccat cggcttagtt 3060
ctgattccgt cctttacggg cgcgaccact atgacggcgt tcacgctggg tagcggttac 3120
tctccatccg gtaactccgc cgtgatgcag ttcattgtta acagttccgg tgtacaaacc 3180
attgcgattt tattatccgg cgacggtatt acccaaaccc tgaccagcga tctgaccacg 3240
gaacaagcac tggcgagcgg tggcgtgtat cattttgcaa tgggttttgc gccgggtcgt 3300
ttatggtgga gcattatcga tattaacacg ggcaggcgta ttcgtcgcgc ctaccgtcag 3360
ccggatctgc acgcggcgtt caactctatc ttcaactccg gcacgtcgtc tattaccgca 3420
tttagcgggc cactggcggg cgacattgct tgcgaaggtg caggtagcca tgtatacgtt 3480
ggcggttttt cgtcggaatc tgattacgcg gctagccgta tgtatggcct gttcactccg 3540
gtcgatctgg acaagcagta tagcttccgt accctgaacg gtaacatt 3588
<210> 20
<211> 3429
<212> DNA
<213> 人工序列
<220>
<223> K5 5.0
<400> 20
atggcagtaa agatttcagg agtcctgaaa gacggcacag gaaaaccggt acagaactgc 60
accattcagc tgaaagccag acgtaacagc accacggtgg tggtgaacac ggtgggctca 120
gagaatccgg atgaagccgg gcgttacagc atggatgtgg agtacggtca gtacagtgtc 180
atcctgcagg ttgacggttt tccaccatcg cacgccggga ccatcaccgt gtatgaagat 240
tcacaaccgg ggacgctgaa tgattttctc tgtgccatga cggaggatga tgcccggccg 300
gaggtgctgc gtcgtcttga actgatggtg gaagaggtgg cgcgtaacgc gtccgtggtg 360
gcacagagta cggcagacgc gaagaaatca gccggcgatg ccagtgcatc agctgctcag 420
gtcgcggccc ttgtgactga tgcaactgac tcagcacgcg ccgccagcac gtccgccgga 480
caggctgcat cgtcagctca ggaagcgtcc tccggcgcag aagcggcatc agcaaaggcc 540
actgaagcgg aaaaaagtgc cgcagccgca gagtcctcaa aaaacgcggc ggccaccagt 600
gccggtgcgg cgaaaacgtc agaaacgaat gctgcagcgt cacaacaatc agccgccacg 660
tctgcctcca ccgcggccac gaaagcgtca gaggccgcca cttcagcacg agatgcggtg 720
gcctcaaaag aggcagcaaa atcatcagaa acgaacgcat catcaagtgc cggtcgtgca 780
gcttcctcgg caacggcggc agaaaattct gccagggcgg caaaaacgtc cgagacgaat 840
gccaggtcat ctgaaacagc agcggaacgg agcgcctctg ccgcggcaga cgcaaaaaca 900
gcggcggcgg ggagtgcgtc aacggcatcc acgaaggcga cagaggctgc gggaagtgcg 960
gtatcagcat cgcagagcaa aagtgcggca gaagcggcgg caatacgtgc aaaaaattcg 1020
gcaaaacgtg cagaagatat agcttcagct gtcgcgcttg aggatgcgga cacaacgaga 1080
aaggggatag tgcagctcag cagtgcaacc aacagcacgt ctgaaacgct tgctgcaacg 1140
ccaaaggcgg ttaaggtggt aatggatgag actaatcgta aggcacctct ggacagtccg 1200
gcactgaccg gaacgccaac agcaccaacc gcgctcaggg gaacaaacaa tacccagatt 1260
gcgaacaccg cttttgtact ggccgcgatt gcagatgtta tcgacgcgtc acctgacgca 1320
ctgaatacgc tgaatgaact ggccgcagcg ctcgggaatg atccagattt tgctaccacc 1380
atgactaacg cgcttgcggg taaacaaccg aagaatgcga cactgacggc gctggcaggg 1440
ctttccacgg cgaaaaataa attaccgtat tttgcggaaa atgatgccgc cagcctgact 1500
gaactgactc aggttggcag ggatattctg gcaaaaaatt ccgttgcaga tgttcttgaa 1560
taccttgggg ccggtgagaa ttcggggagc gctacagacg ttatgattca gctgcttact 1620
tctaagccat tcggtgcagc gggtgatgca acgaccgacg acacggaggt tatcgctgcg 1680
agcctgaaca gccagaaagc tgttaccatc tctgacggcg ttttcagttc ttctggcatc 1740
aactccaact actgtaacct ggatggtcgc ggatccggtg tgctcagcca ccgtagctct 1800
actggtaatt acctggtgtt taacaatccg cgtactggtc gtctgagcaa tatcactgtt 1860
gaatctaaca aagcgaccga taccactcag ggccaacagg tgtccctggc aggtggcagt 1920
gacgtgaccg tgtcagatgt caacttctcc aacgtgaaag gcactggttt tagcctgatt 1980
gcctacccaa acgatgctcc gccggatggc ctgatgatca aaggcattcg cggatcttac 2040
agcggttacg cgaccaacaa agcagctggt tgcgtcctgg cggatagctc cgttaacagc 2100
ctgatcgaca atgtgatcgc taagaattac ccgcaattcg gtgctgttga attaaagggc 2160
actgcaagct acaacattgt atcgaacgtt atcggtgcgg attgtcagca cgtgacttac 2220
aacggcactg agggaccgat cgctcctagt aacaatctga tcaagggcgt tatggcgaac 2280
aacccgaaat acgcggcagt tgtggcgggt aaaggctcga cgaatctgat ctctgatgta 2340
ctggtagact attctaccag cgatgctcgt caggcgcatg gtgttaccgt cgaaggatct 2400
gataacgtga ttaacaacgt actgatgtcc ggttgcgacg gaactaattc cctgggtcag 2460
cgtcaaaccg caactatcgc gcgtttcatc ggtactgcaa ataacaacta tgctagcgtg 2520
ttcccatcct attctgccac tggtgtgatc acgtttgagt ctggcagtac ccgtaacttc 2580
gtcgaggtta agcatccggg ccgtcgcaac gatcttctgt catcggcaag cacgattgac 2640
ggcgctgcga ccatcgacgg gacttctaac tctaacgtag tacacgcgcc tgctctgggc 2700
caatacattg gctccatgag tggtcgcttt gaatggcgta ttaagtcaat gagcctgccg 2760
tccggcgtac tcactagcgc ggataaatac cgtatgctgg gtgacggtgc tgttagcctt 2820
gctgttggcg gaggaactag cagtcaggtg cgcttgttca cctcagacgg tacttctcgc 2880
actgtttctc tgaccaatgg taacgtgcgc ctgagcacgt cctctactgg ctatttacag 2940
ctgggtgcag acgcaatgac tccggactcc actggtactt acgcgttagg ctccgcatct 3000
cgtgcttgga gtggcggatt cactcaggca gcattcaccg ttacttctga cgcacgttgc 3060
aaaactgagc ctttaaccat ctctgacgct ttactggatg cttggagtga agtggacttt 3120
gtccagttcc agtatctgga tcgtgttgaa gagaaaggtg ctgactccgc gcgttggcat 3180
ttcggaatca tcgcccagcg tgctaaagag gcattcgaac gtcacggcat cgatgcgcat 3240
cgttacggtt tcttatgctt tgactcttgg gacgatgtgt acgaagagga tgcaaatgga 3300
tctcgcaaac tgatcactcc ggcgggtagt cgctatggta ttcgctatga ggaagttctg 3360
atcctcgaag cagcgctgat gcgtcgcacg atcaagcgca tgcaggaagc actggctgcg 3420
ttaccgaag 3429
<210> 21
<211> 3432
<212> DNA
<213> 人工序列
<220>
<223> K5 5.1
<400> 21
atggcagtaa agatttcagg agtcctgaaa gacggcacag gaaaaccggt acagaactgc 60
accattcagc tgaaagccag acgtaacagc accacggtgg tggtgaacac ggtgggctca 120
gagaatccgg atgaagccgg gcgttacagc atggatgtgg agtacggtca gtacagtgtc 180
atcctgcagg ttgacggttt tccaccatcg cacgccggga ccatcaccgt gtatgaagat 240
tcacaaccgg ggacgctgaa tgattttctc tgtgccatga cggaggatga tgcccggccg 300
gaggtgctgc gtcgtcttga actgatggtg gaagaggtgg cgcgtaacgc gtccgtggtg 360
gcacagagta cggcagacgc gaagaaatca gccggcgatg ccagtgcatc agctgctcag 420
gtcgcggccc ttgtgactga tgcaactgac tcagcacgcg ccgccagcac gtccgccgga 480
caggctgcat cgtcagctca ggaagcgtcc tccggcgcag aagcggcatc agcaaaggcc 540
actgaagcgg aaaaaagtgc cgcagccgca gagtcctcaa aaaacgcggc ggccaccagt 600
gccggtgcgg cgaaaacgtc agaaacgaat gctgcagcgt cacaacaatc agccgccacg 660
tctgcctcca ccgcggccac gaaagcgtca gaggccgcca cttcagcacg agatgcggtg 720
gcctcaaaag aggcagcaaa atcatcagaa acgaacgcat catcaagtgc cggtcgtgca 780
gcttcctcgg caacggcggc agaaaattct gccagggcgg caaaaacgtc cgagacgaat 840
gccaggtcat ctgaaacagc agcggaacgg agcgcctctg ccgcggcaga cgcaaaaaca 900
gcggcggcgg ggagtgcgtc aacggcatcc acgaaggcga cagaggctgc gggaagtgcg 960
gtatcagcat cgcagagcaa aagtgcggca gaagcggcgg caatacgtgc aaaaaattcg 1020
gcaaaacgtg cagaagatat agcttcagct gtcgcgcttg aggatgcgga cacaacgaga 1080
aaggggatag tgcagctcag cagtgcaacc aacagcacgt ctgaaacgct tgctgcaacg 1140
ccaaaggcgg ttaaggtggt aatggatgag actaatcgta aggcacctct ggacagtccg 1200
gcactgaccg gaacgccaac agcaccaacc gcgctcaggg gaacaaacaa tacccagatt 1260
gcgaacaccg cttttgtact ggccgcgatt gcagatgtta tcgacgcgtc acctgacgca 1320
ctgaatacgc tgaatgaact ggccgcagcg ctcgggaatg atccagattt tgctaccacc 1380
atgactaacg cgcttgcggg taaacaaccg aagaatgcga cactgacggc gctggcaggg 1440
ctttccacgg cgaaaaataa attaccgtat tttgcggaaa atgatgccgc cagcctgact 1500
gaactgactc aggttggcag ggatattctg gcaaaaaatt ccgttgcaga tgttcttgaa 1560
taccttgggg ccggtgagaa ttcggggagc gctacagacg ttatgattca gctggcgctt 1620
acttctaagc cattcggtgc agcgggtgat gcaacgaccg acgacacgga ggttatcgct 1680
gcgagcctga acagccagaa agctgttacc atctctgacg gcgttttcag ttcttctggc 1740
atcaactcca actactgtaa cctggatggt cgcggatccg gtgtgctcag ccaccgtagc 1800
tctactggta attacctggt gtttaacaat ccgcgtactg gtcgtctgag caatatcact 1860
gttgaatcta acaaagcgac cgataccact cagggccaac aggtgtccct ggcaggtggc 1920
agtgacgtga ccgtgtcaga tgtcaacttc tccaacgtga aaggcactgg ttttagcctg 1980
attgcctacc caaacgatgc tccgccggat ggcctgatga tcaaaggcat tcgcggatct 2040
tacagcggtt acgcgaccaa caaagcagct ggttgcgtcc tggcggatag ctccgttaac 2100
agcctgatcg acaatgtgat cgctaagaat tacccgcaat tcggtgctgt tgaattaaag 2160
ggcactgcaa gctacaacat tgtatcgaac gttatcggtg cggattgtca gcacgtgact 2220
tacaacggca ctgagggacc gatcgctcct agtaacaatc tgatcaaggg cgttatggcg 2280
aacaacccga aatacgcggc agttgtggcg ggtaaaggct cgacgaatct gatctctgat 2340
gtactggtag actattctac cagcgatgct cgtcaggcgc atggtgttac cgtcgaagga 2400
tctgataacg tgattaacaa cgtactgatg tccggttgcg acggaactaa ttccctgggt 2460
cagcgtcaaa ccgcaactat cgcgcgtttc atcggtactg caaataacaa ctatgctagc 2520
gtgttcccat cctattctgc cactggtgtg atcacgtttg agtctggcag tacccgtaac 2580
ttcgtcgagg ttaagcatcc gggccgtcgc aacgatcttc tgtcatcggc aagcacgatt 2640
gacggcgctg cgaccatcga cgggacttct aactctaacg tagtacacgc gcctgctctg 2700
ggccaataca ttggctccat gagtggtcgc tttgaatggc gtattaagtc aatgagcctg 2760
ccgtccggcg tactcactag cgcggataaa taccgtatgc tgggtgacgg tgctgttagc 2820
cttgctgttg gcggaggaac tagcagtcag gtgcgcttgt tcacctcaga cggtacttct 2880
cgcactgttt ctctgaccaa tggtaacgtg cgcctgagca cgtcctctac tggctattta 2940
cagctgggtg cagacgcaat gactccggac tccactggta cttacgcgtt aggctccgca 3000
tctcgtgctt ggagtggcgg attcactcag gcagcattca ccgttacttc tgacgcacgt 3060
tgcaaaactg agcctttaac catctctgac gctttactgg atgcttggag tgaagtggac 3120
tttgtccagt tccagtatct ggatcgtgtt gaagagaaag gtgctgactc cgcgcgttgg 3180
catttcggaa tcatcgccca gcgtgctaaa gaggcattcg aacgtcacgg catcgatgcg 3240
catcgttacg gtttcttatg ctttgactct tgggacgatg tgtacgaaga ggatgcaaat 3300
ggatctcgca aactgatcac tccggcgggt agtcgctatg gtattcgcta tgaggaagtt 3360
ctgatcctcg aagcagcgct gatgcgtcgc acgatcaagc gcatgcagga agcactggct 3420
gcgttaccga ag 3432
<210> 22
<211> 1132
<212> PRT
<213> 细菌噬菌体λ
<400> 22
Met Gly Lys Gly Ser Ser Lys Gly His Thr Pro Arg Glu Ala Lys Asp
1 5 10 15
Asn Leu Lys Ser Thr Gln Leu Leu Ser Val Ile Asp Ala Ile Ser Glu
20 25 30
Gly Pro Ile Glu Gly Pro Val Asp Gly Leu Lys Ser Val Leu Leu Asn
35 40 45
Ser Thr Pro Val Leu Asp Thr Glu Gly Asn Thr Asn Ile Ser Gly Val
50 55 60
Thr Val Val Phe Arg Ala Gly Glu Gln Glu Gln Thr Pro Pro Glu Gly
65 70 75 80
Phe Glu Ser Ser Gly Ser Glu Thr Val Leu Gly Thr Glu Val Lys Tyr
85 90 95
Asp Thr Pro Ile Thr Arg Thr Ile Thr Ser Ala Asn Ile Asp Arg Leu
100 105 110
Arg Phe Thr Phe Gly Val Gln Ala Leu Val Glu Thr Thr Ser Lys Gly
115 120 125
Asp Arg Asn Pro Ser Glu Val Arg Leu Leu Val Gln Ile Gln Arg Asn
130 135 140
Gly Gly Trp Val Thr Glu Lys Asp Ile Thr Ile Lys Gly Lys Thr Thr
145 150 155 160
Ser Gln Tyr Leu Ala Ser Val Val Met Gly Asn Leu Pro Pro Arg Pro
165 170 175
Phe Asn Ile Arg Met Arg Arg Met Thr Pro Asp Ser Thr Thr Asp Gln
180 185 190
Leu Gln Asn Lys Thr Leu Trp Ser Ser Tyr Thr Glu Ile Ile Asp Val
195 200 205
Lys Gln Cys Tyr Pro Asn Thr Ala Leu Val Gly Val Gln Val Asp Ser
210 215 220
Glu Gln Phe Gly Ser Gln Gln Val Ser Arg Asn Tyr His Leu Arg Gly
225 230 235 240
Arg Ile Leu Gln Val Pro Ser Asn Tyr Asn Pro Gln Thr Arg Gln Tyr
245 250 255
Ser Gly Ile Trp Asp Gly Thr Phe Lys Pro Ala Tyr Ser Asn Asn Met
260 265 270
Ala Trp Cys Leu Trp Asp Met Leu Thr His Pro Arg Tyr Gly Met Gly
275 280 285
Lys Arg Leu Gly Ala Ala Asp Val Asp Lys Trp Ala Leu Tyr Val Ile
290 295 300
Gly Gln Tyr Cys Asp Gln Ser Val Pro Asp Gly Phe Gly Gly Thr Glu
305 310 315 320
Pro Arg Ile Thr Cys Asn Ala Tyr Leu Thr Thr Gln Arg Lys Ala Trp
325 330 335
Asp Val Leu Ser Asp Phe Cys Ser Ala Met Arg Cys Met Pro Val Trp
340 345 350
Asn Gly Gln Thr Leu Thr Phe Val Gln Asp Arg Pro Ser Asp Lys Thr
355 360 365
Trp Thr Tyr Asn Arg Ser Asn Val Val Met Pro Asp Asp Gly Ala Pro
370 375 380
Phe Arg Tyr Ser Phe Ser Ala Leu Lys Asp Arg His Asn Ala Val Glu
385 390 395 400
Val Asn Trp Ile Asp Pro Asn Asn Gly Trp Glu Thr Ala Thr Glu Leu
405 410 415
Val Glu Asp Thr Gln Ala Ile Ala Arg Tyr Gly Arg Asn Val Thr Lys
420 425 430
Met Asp Ala Phe Gly Cys Thr Ser Arg Gly Gln Ala His Arg Ala Gly
435 440 445
Leu Trp Leu Ile Lys Thr Glu Leu Leu Glu Thr Gln Thr Val Asp Phe
450 455 460
Ser Val Gly Ala Glu Gly Leu Arg His Val Pro Gly Asp Val Ile Glu
465 470 475 480
Ile Cys Asp Asp Asp Tyr Ala Gly Ile Ser Thr Gly Gly Arg Val Leu
485 490 495
Ala Val Asn Ser Gln Thr Arg Thr Leu Thr Leu Asp Arg Glu Ile Thr
500 505 510
Leu Pro Ser Ser Gly Thr Ala Leu Ile Ser Leu Val Asp Gly Ser Gly
515 520 525
Asn Pro Val Ser Val Glu Val Gln Ser Val Thr Asp Gly Val Lys Val
530 535 540
Lys Val Ser Arg Val Pro Asp Gly Val Ala Glu Tyr Ser Val Trp Glu
545 550 555 560
Leu Lys Leu Pro Thr Leu Arg Gln Arg Leu Phe Arg Cys Val Ser Ile
565 570 575
Arg Glu Asn Asp Asp Gly Thr Tyr Ala Ile Thr Ala Val Gln His Val
580 585 590
Pro Glu Lys Glu Ala Ile Val Asp Asn Gly Ala His Phe Asp Gly Glu
595 600 605
Gln Ser Gly Thr Val Asn Gly Val Thr Pro Pro Ala Val Gln His Leu
610 615 620
Thr Ala Glu Val Thr Ala Asp Ser Gly Glu Tyr Gln Val Leu Ala Arg
625 630 635 640
Trp Asp Thr Pro Lys Val Val Lys Gly Val Ser Phe Leu Leu Arg Leu
645 650 655
Thr Val Thr Ala Asp Asp Gly Ser Glu Arg Leu Val Ser Thr Ala Arg
660 665 670
Thr Thr Glu Thr Thr Tyr Arg Phe Thr Gln Leu Ala Leu Gly Asn Tyr
675 680 685
Arg Leu Thr Val Arg Ala Val Asn Ala Trp Gly Gln Gln Gly Asp Pro
690 695 700
Ala Ser Val Ser Phe Arg Ile Ala Ala Pro Ala Ala Pro Ser Arg Ile
705 710 715 720
Glu Leu Thr Pro Gly Tyr Phe Gln Ile Thr Ala Thr Pro His Leu Ala
725 730 735
Val Tyr Asp Pro Thr Val Gln Phe Glu Phe Trp Phe Ser Glu Lys Gln
740 745 750
Ile Ala Asp Ile Arg Gln Val Glu Thr Ser Thr Arg Tyr Leu Gly Thr
755 760 765
Ala Leu Tyr Trp Ile Ala Ala Ser Ile Asn Ile Lys Pro Gly His Asp
770 775 780
Tyr Tyr Phe Tyr Ile Arg Ser Val Asn Thr Val Gly Lys Ser Ala Phe
785 790 795 800
Val Glu Ala Val Gly Arg Ala Ser Asp Asp Ala Glu Gly Tyr Leu Asp
805 810 815
Phe Phe Lys Gly Lys Ile Thr Glu Ser His Leu Gly Lys Glu Leu Leu
820 825 830
Glu Lys Val Glu Leu Thr Glu Asp Asn Ala Ser Arg Leu Glu Glu Phe
835 840 845
Ser Lys Glu Trp Lys Asp Ala Ser Asp Lys Trp Asn Ala Met Trp Ala
850 855 860
Val Lys Ile Glu Gln Thr Lys Asp Gly Lys His Tyr Val Ala Gly Ile
865 870 875 880
Gly Leu Ser Met Glu Asp Thr Glu Glu Gly Lys Leu Ser Gln Phe Leu
885 890 895
Val Ala Ala Asn Arg Ile Ala Phe Ile Asp Pro Ala Asn Gly Asn Glu
900 905 910
Thr Pro Met Phe Val Ala Gln Gly Asn Gln Ile Phe Met Asn Asp Val
915 920 925
Phe Leu Lys Arg Leu Thr Ala Pro Thr Ile Thr Ser Gly Gly Asn Pro
930 935 940
Pro Ala Phe Ser Leu Thr Pro Asp Gly Lys Leu Thr Ala Lys Asn Ala
945 950 955 960
Asp Ile Ser Gly Ser Val Asn Ala Asn Ser Gly Thr Leu Ser Asn Val
965 970 975
Thr Ile Ala Glu Asn Cys Thr Ile Asn Gly Thr Leu Arg Ala Glu Lys
980 985 990
Ile Val Gly Asp Ile Val Lys Ala Ala Ser Ala Ala Phe Pro Arg Gln
995 1000 1005
Arg Glu Ser Ser Val Asp Trp Pro Ser Gly Thr Arg Thr Val Thr
1010 1015 1020
Val Thr Asp Asp His Pro Phe Asp Arg Gln Ile Val Val Leu Pro
1025 1030 1035
Leu Thr Phe Arg Gly Ser Lys Arg Thr Val Ser Gly Arg Thr Thr
1040 1045 1050
Tyr Ser Met Cys Tyr Leu Lys Val Leu Met Asn Gly Ala Val Ile
1055 1060 1065
Tyr Asp Gly Ala Ala Asn Glu Ala Val Gln Val Phe Ser Arg Ile
1070 1075 1080
Val Asp Met Pro Ala Gly Arg Gly Asn Val Ile Leu Thr Phe Thr
1085 1090 1095
Leu Thr Ser Thr Arg His Ser Ala Asp Ile Pro Pro Tyr Thr Phe
1100 1105 1110
Ala Ser Asp Val Gln Val Met Val Ile Lys Lys Gln Ala Leu Gly
1115 1120 1125
Ile Ser Val Val
1130
<210> 23
<211> 1132
<212> PRT
<213> 人工序列
<220>
<223> H591
<400> 23
Met Gly Lys Gly Ser Ser Lys Gly His Thr Pro Arg Glu Ala Lys Asp
1 5 10 15
Asn Leu Lys Ser Thr Gln Leu Leu Ser Val Ile Asp Ala Ile Ser Glu
20 25 30
Gly Pro Ile Glu Gly Pro Val Asp Gly Leu Lys Ser Val Leu Leu Asn
35 40 45
Ser Thr Pro Val Leu Asp Thr Glu Gly Asn Thr Asn Ile Ser Gly Val
50 55 60
Thr Val Val Phe Arg Ala Gly Glu Gln Glu Gln Thr Pro Pro Glu Gly
65 70 75 80
Phe Glu Ser Ser Gly Ser Glu Thr Val Leu Gly Thr Glu Val Lys Tyr
85 90 95
Asp Thr Pro Ile Thr Arg Thr Ile Thr Ser Ala Asn Ile Asp Arg Leu
100 105 110
Arg Phe Thr Phe Gly Val Gln Ala Leu Val Glu Thr Thr Ser Lys Gly
115 120 125
Asp Arg Asn Pro Ser Glu Val Arg Leu Leu Val Gln Ile Gln Arg Asn
130 135 140
Gly Gly Trp Val Thr Glu Lys Asp Ile Thr Ile Lys Gly Lys Thr Thr
145 150 155 160
Ser Gln Tyr Leu Ala Ser Val Val Met Gly Asn Leu Pro Pro Arg Pro
165 170 175
Phe Asn Ile Arg Met Arg Arg Met Thr Pro Asp Ser Thr Thr Asp Gln
180 185 190
Leu Gln Asn Lys Thr Leu Trp Ser Ser Tyr Thr Glu Ile Ile Asp Val
195 200 205
Lys Gln Cys Tyr Pro Asn Thr Ala Leu Val Gly Val Gln Val Asp Ser
210 215 220
Glu Gln Phe Gly Ser Gln Gln Val Ser Arg Asn Tyr His Leu Arg Gly
225 230 235 240
Arg Ile Leu Gln Val Pro Ser Asn Tyr Asn Pro Gln Thr Arg Gln Tyr
245 250 255
Ser Gly Ile Trp Asp Gly Thr Phe Lys Pro Ala Tyr Ser Asn Asn Met
260 265 270
Ala Trp Cys Leu Trp Asp Met Leu Thr His Pro Arg Tyr Gly Met Gly
275 280 285
Lys Arg Leu Gly Ala Ala Asp Val Asp Lys Trp Ala Leu Tyr Val Ile
290 295 300
Gly Gln Tyr Cys Asp Gln Ser Val Pro Asp Gly Phe Gly Gly Thr Glu
305 310 315 320
Pro Arg Ile Thr Cys Asn Ala Tyr Leu Thr Thr Gln Arg Lys Ala Trp
325 330 335
Asp Val Leu Ser Asp Phe Cys Ser Ala Met Arg Cys Met Pro Val Trp
340 345 350
Asn Gly Gln Thr Leu Thr Phe Val Gln Asp Arg Pro Ser Asp Lys Thr
355 360 365
Trp Thr Tyr Asn Arg Ser Asn Val Val Met Pro Asp Asp Gly Ala Pro
370 375 380
Phe Arg Tyr Ser Phe Ser Ala Leu Lys Asp Arg His Asn Ala Val Glu
385 390 395 400
Val Asn Trp Ile Asp Pro Asn Asn Gly Trp Glu Thr Ala Thr Glu Leu
405 410 415
Val Glu Asp Thr Gln Ala Ile Ala Arg Tyr Gly Arg Asn Val Thr Lys
420 425 430
Met Asp Ala Phe Gly Cys Thr Ser Arg Gly Gln Ala His Arg Ala Gly
435 440 445
Leu Trp Leu Ile Lys Thr Glu Leu Leu Glu Thr Gln Thr Val Asp Phe
450 455 460
Ser Val Gly Ala Glu Gly Leu Arg His Val Pro Gly Asp Val Ile Glu
465 470 475 480
Ile Cys Asp Asp Asp Tyr Ala Gly Ile Ser Thr Gly Gly Arg Val Leu
485 490 495
Ala Val Asn Ser Gln Thr Arg Thr Leu Thr Leu Asp Arg Glu Ile Thr
500 505 510
Leu Pro Ser Ser Gly Thr Ala Leu Ile Ser Leu Val Asp Gly Ser Gly
515 520 525
Asn Pro Val Ser Val Glu Val Gln Ser Val Thr Asp Gly Val Lys Val
530 535 540
Lys Val Ser Arg Val Pro Asp Gly Val Ala Glu Tyr Ser Val Trp Glu
545 550 555 560
Leu Lys Leu Pro Thr Leu Arg Gln Arg Leu Phe Arg Cys Val Ser Ile
565 570 575
Arg Glu Asn Asp Asp Gly Thr Tyr Ala Ile Thr Ala Val Gln His Val
580 585 590
Pro Glu Lys Glu Ala Ile Val Asp Asn Gly Ala His Phe Asp Gly Glu
595 600 605
Gln Ser Gly Thr Val Asn Gly Val Thr Pro Pro Ala Val Gln His Leu
610 615 620
Thr Ala Glu Val Thr Ala Asp Ser Gly Glu Tyr Gln Val Leu Ala Arg
625 630 635 640
Trp Asp Thr Pro Lys Val Val Lys Gly Val Ser Phe Leu Leu Arg Leu
645 650 655
Thr Val Thr Ala Asp Asp Gly Ser Glu Arg Leu Val Ser Thr Ala Arg
660 665 670
Thr Thr Glu Thr Thr Tyr Arg Phe Thr Gln Leu Ala Leu Gly Asn Tyr
675 680 685
Arg Leu Thr Val Arg Ala Val Asn Ala Trp Gly Gln Gln Gly Asp Pro
690 695 700
Ala Ser Val Ser Phe Arg Ile Ala Ala Pro Ala Ala Pro Ser Arg Ile
705 710 715 720
Glu Leu Thr Pro Gly Tyr Phe Gln Ile Thr Ala Thr Pro His Leu Ala
725 730 735
Val Tyr Asp Pro Thr Val Gln Phe Glu Phe Trp Phe Ser Glu Lys Gln
740 745 750
Ile Ala Asp Ile Arg Gln Val Glu Thr Ser Thr Arg Tyr Leu Gly Thr
755 760 765
Ala Leu Tyr Trp Ile Ala Ala Ser Ile Asn Ile Lys Pro Gly His Asp
770 775 780
Tyr Tyr Phe Tyr Ile Arg Ser Val Asn Thr Val Gly Lys Ser Ala Phe
785 790 795 800
Val Glu Ala Val Gly Arg Ala Ser Asp Asp Ala Glu Gly Tyr Leu Asp
805 810 815
Phe Phe Lys Gly Lys Ile Thr Glu Ser His Leu Gly Lys Glu Leu Leu
820 825 830
Glu Lys Val Glu Leu Thr Glu Asp Asn Ala Ser Arg Leu Glu Glu Phe
835 840 845
Ser Lys Glu Trp Lys Asp Ala Ser Asp Lys Trp Asn Ala Met Trp Ala
850 855 860
Val Lys Ile Glu Gln Thr Lys Asp Gly Lys His Tyr Val Ala Gly Ile
865 870 875 880
Gly Leu Ser Met Glu Asp Thr Glu Glu Gly Lys Leu Ser Gln Phe Leu
885 890 895
Val Ala Ala Asn Arg Ile Ala Phe Ile Asp Pro Ala Asn Gly Asn Glu
900 905 910
Thr Pro Met Phe Val Ala Gln Gly Asn Gln Ile Phe Met Asn Asp Val
915 920 925
Phe Leu Lys Arg Leu Thr Ala Pro Thr Ile Thr Ser Gly Gly Asn Pro
930 935 940
Pro Ala Phe Ser Leu Thr Pro Asp Gly Lys Leu Thr Ala Lys Asn Ala
945 950 955 960
Asp Ile Ser Gly Asn Val Asn Ala Asn Ser Gly Thr Leu Asn Asn Val
965 970 975
Thr Ile Asn Glu Asn Cys Gln Ile Lys Gly Lys Leu Ser Ala Asn Gln
980 985 990
Ile Glu Gly Asp Ile Val Lys Thr Val Ser Lys Ser Phe Pro Arg Thr
995 1000 1005
Asn Ser Tyr Ala Ser Gly Thr Ile Thr Val Arg Ile Ser Asp Asp
1010 1015 1020
Gln Lys Phe Asp Arg Gln Val Met Ile Pro Pro Val Leu Phe Arg
1025 1030 1035
Gly Gly Lys His Glu Asn Phe Asn Ser Asn Asn Gln Gln Ser Tyr
1040 1045 1050
Trp Tyr Ser Thr Cys Arg Leu Arg Val Thr Arg Asn Gly Gln Glu
1055 1060 1065
Ile Phe Asn Gln Ser Thr Thr Asp Ala Gln Gly Val Phe Ser Ser
1070 1075 1080
Val Ile Asp Met Pro Ala Gly Gln Gly Thr Leu Thr Leu Thr Phe
1085 1090 1095
Thr Val Ser Ser Ser Gly Ala Asn Asn Trp Thr Pro Thr Thr Ser
1100 1105 1110
Ile Ser Asp Leu Leu Val Val Val Met Lys Lys Ser Thr Ala Gly
1115 1120 1125
Ile Ser Ile Ser
1130
<210> 24
<211> 3396
<212> DNA
<213> 人工序列
<220>
<223> H591
<400> 24
atgggtaaag gaagcagtaa ggggcatacc ccgcgcgaag cgaaggacaa cctgaagtcc 60
acgcagttgc tgagtgtgat cgatgccatc agcgaagggc cgattgaagg tccggtggat 120
ggcttaaaaa gcgtgctgct gaacagtacg ccggtgctgg acactgaggg gaataccaac 180
atatccggtg tcacggtggt gttccgggct ggtgagcagg agcagactcc gccggaggga 240
tttgaatcct ccggctccga gacggtgctg ggtacggaag tgaaatatga cacgccgatc 300
acccgcacca ttacgtctgc aaacatcgac cgtctgcgct ttaccttcgg tgtacaggca 360
ctggtggaaa ccacctcaaa gggtgacagg aatccgtcgg aagtccgcct gctggttcag 420
atacaacgta acggtggctg ggtgacggaa aaagacatca ccattaaggg caaaaccacc 480
tcgcagtatc tggcctcggt ggtgatgggt aacctgccgc cgcgcccgtt taatatccgg 540
atgcgcagga tgacgccgga cagcaccaca gaccagctgc agaacaaaac gctctggtcg 600
tcatacactg aaatcatcga tgtgaaacag tgctacccga acacggcact ggtcggcgtg 660
caggtggact cggagcagtt cggcagccag caggtgagcc gtaattatca tctgcgcggg 720
cgtattctgc aggtgccgtc gaactataac ccgcagacgc ggcaatacag cggtatctgg 780
gacggaacgt ttaaaccggc atacagcaac aacatggcct ggtgtctgtg ggatatgctg 840
acccatccgc gctacggcat ggggaaacgt cttggtgcgg cggatgtgga taaatgggcg 900
ctgtatgtca tcggccagta ctgcgaccag tcagtgccgg acggctttgg cggcacggag 960
ccgcgcatca cctgtaatgc gtacctgacc acacagcgta aggcgtggga tgtgctcagc 1020
gatttctgct cggcgatgcg ctgtatgccg gtatggaacg ggcagacgct gacgttcgtg 1080
caggaccgac cgtcggataa gacgtggacc tataaccgca gtaatgtggt gatgccggat 1140
gatggcgcgc cgttccgcta cagcttcagc gccctgaagg accgccataa tgccgttgag 1200
gtgaactgga ttgacccgaa caacggctgg gagacggcga cagagcttgt tgaagatacg 1260
caggccattg cccgttacgg tcgtaatgtt acgaagatgg atgcctttgg ctgtaccagc 1320
cgggggcagg cacaccgcgc cgggctgtgg ctgattaaaa cagaactgct ggaaacgcag 1380
accgtggatt tcagcgtcgg cgcagaaggg cttcgccatg taccgggcga tgttattgaa 1440
atctgcgatg atgactatgc cggtatcagc accggtggtc gtgtgctggc ggtgaacagc 1500
cagacccgga cgctgacgct cgaccgtgaa atcacgctgc catcctccgg taccgcgctg 1560
ataagcctgg ttgacggaag tggcaatccg gtcagcgtgg aggttcagtc cgtcaccgac 1620
ggcgtgaagg taaaagtgag ccgtgttcct gacggtgttg ctgaatacag cgtatgggag 1680
ctgaagctgc cgacgctgcg ccagcgactg ttccgctgcg tgagtatccg tgagaacgac 1740
gacggcacgt atgccatcac cgccgtgcag catgtgccgg aaaaagaggc catcgtggat 1800
aacggggcgc actttgacgg cgaacagagt ggcacggtga atggtgtcac gccgccagcg 1860
gtgcagcacc tgaccgcaga agtcactgca gacagcgggg aatatcaggt gctggcgcga 1920
tgggacacac cgaaggtggt gaagggcgtg agtttcctgc tccgtctgac cgtaacagcg 1980
gacgacggca gtgagcggct ggtcagcacg gcccggacga cggaaaccac ataccgcttc 2040
acgcaactgg cgctggggaa ctacaggctg acagtccggg cggtaaatgc gtgggggcag 2100
cagggcgatc cggcgtcggt atcgttccgg attgccgcac cggcagcacc gtcgaggatt 2160
gagctgacgc cgggctattt tcagataacc gccacgccgc atcttgccgt ttatgacccg 2220
acggtacagt ttgagttctg gttctcggaa aagcagattg cggatatcag acaggttgaa 2280
accagcacgc gttatcttgg tacggcgctg tactggatag ccgccagtat caatatcaaa 2340
ccgggccatg attattactt ttatatccgc agtgtgaaca ccgttggcaa atcggcattc 2400
gtggaggccg tcggtcgggc gagcgatgat gcggaaggtt acctggattt tttcaaaggc 2460
aagataaccg aatcccatct cggcaaggag ctgctggaaa aagtcgagct gacggaggat 2520
aacgccagca gactggagga gttttcgaaa gagtggaagg atgccagtga taagtggaat 2580
gccatgtggg ctgtcaaaat tgagcagacc aaagacggca aacattatgt cgcgggtatt 2640
ggcctcagca tggaggacac ggaggaaggc aaactgagcc agtttctggt tgccgccaat 2700
cgtatcgcat ttattgaccc ggcaaacggg aatgaaacgc cgatgtttgt ggcgcagggc 2760
aaccagatat tcatgaacga cgtgttcctg aagcgcctga cggcccccac cattaccagc 2820
ggcggcaatc ctccggcctt ttccctgaca ccggacggaa agctgaccgc taaaaatgcg 2880
gatatcagtg gcaatgtgaa tgcaaattca gggacgctca acaatgtcac gattaatgaa 2940
aactgtcaga ttaaagggaa actgtcagcc aatcagattg aaggcgatat tgtcaaaacg 3000
gtcagcaagt ctttcccccg cacgaacagt tatgccagtg gcaccatcac ggtaagaatc 3060
agtgatgatc agaaatttga ccggcaggtc atgataccgc cagtgttatt ccgcggtggt 3120
aagcatgaga atttcaacag taataaccaa cagtcatact ggtattcaac ctgccggtta 3180
agagtgaccc gcaatggtca ggagattttt aatcagtcca cgacggatgc tcagggcgta 3240
ttttcctcag ttatagatat gcctgccgga caggggacac tgacactgac attcaccgta 3300
tcttcatcag gagcgaataa ctggacacca acaaccagta tcagcgatct gctggttgtg 3360
gtgatgaaga aatccacagc aggtatcagt atcagc 3396
<210> 25
<211> 1159
<212> PRT
<213> 人工序列
<220>
<223> Z2145
<400> 25
Met Gly Lys Gly Ser Ser Lys Gly His Thr Pro Arg Glu Ala Lys Asp
1 5 10 15
Asn Leu Lys Ser Thr Gln Leu Leu Ser Val Ile Asp Ala Ile Ser Glu
20 25 30
Gly Pro Ile Glu Gly Pro Val Asp Gly Leu Lys Ser Val Leu Leu Asn
35 40 45
Ser Thr Pro Val Leu Asp Thr Glu Gly Asn Thr Asn Ile Ser Gly Val
50 55 60
Thr Val Val Phe Arg Ala Gly Glu Gln Glu Gln Thr Pro Pro Glu Gly
65 70 75 80
Phe Glu Ser Ser Gly Ser Glu Thr Val Leu Gly Thr Glu Val Lys Tyr
85 90 95
Asp Thr Pro Ile Thr Arg Thr Ile Thr Ser Ala Asn Ile Asp Arg Leu
100 105 110
Arg Phe Thr Phe Gly Val Gln Ala Leu Val Glu Thr Thr Ser Lys Gly
115 120 125
Asp Arg Asn Pro Ser Glu Val Arg Leu Leu Val Gln Ile Gln Arg Asn
130 135 140
Gly Gly Trp Val Thr Glu Lys Asp Ile Thr Ile Lys Gly Lys Thr Thr
145 150 155 160
Ser Gln Tyr Leu Ala Ser Val Val Met Gly Asn Leu Pro Pro Arg Pro
165 170 175
Phe Asn Ile Arg Met Arg Arg Met Thr Pro Asp Ser Thr Thr Asp Gln
180 185 190
Leu Gln Asn Lys Thr Leu Trp Ser Ser Tyr Thr Glu Ile Ile Asp Val
195 200 205
Lys Gln Cys Tyr Pro Asn Thr Ala Leu Val Gly Val Gln Val Asp Ser
210 215 220
Glu Gln Phe Gly Ser Gln Gln Val Ser Arg Asn Tyr His Leu Arg Gly
225 230 235 240
Arg Ile Leu Gln Val Pro Ser Asn Tyr Asn Pro Gln Thr Arg Gln Tyr
245 250 255
Ser Gly Ile Trp Asp Gly Thr Phe Lys Pro Ala Tyr Ser Asn Asn Met
260 265 270
Ala Trp Cys Leu Trp Asp Met Leu Thr His Pro Arg Tyr Gly Met Gly
275 280 285
Lys Arg Leu Gly Ala Ala Asp Val Asp Lys Trp Ala Leu Tyr Val Ile
290 295 300
Gly Gln Tyr Cys Asp Gln Ser Val Pro Asp Gly Phe Gly Gly Thr Glu
305 310 315 320
Pro Arg Ile Thr Cys Asn Ala Tyr Leu Thr Thr Gln Arg Lys Ala Trp
325 330 335
Asp Val Leu Ser Asp Phe Cys Ser Ala Met Arg Cys Met Pro Val Trp
340 345 350
Asn Gly Gln Thr Leu Thr Phe Val Gln Asp Arg Pro Ser Asp Lys Thr
355 360 365
Trp Thr Tyr Asn Arg Ser Asn Val Val Met Pro Asp Asp Gly Ala Pro
370 375 380
Phe Arg Tyr Ser Phe Ser Ala Leu Lys Asp Arg His Asn Ala Val Glu
385 390 395 400
Val Asn Trp Ile Asp Pro Asn Asn Gly Trp Glu Thr Ala Thr Glu Leu
405 410 415
Val Glu Asp Thr Gln Ala Ile Ala Arg Tyr Gly Arg Asn Val Thr Lys
420 425 430
Met Asp Ala Phe Gly Cys Thr Ser Arg Gly Gln Ala His Arg Ala Gly
435 440 445
Leu Trp Leu Ile Lys Thr Glu Leu Leu Glu Thr Gln Thr Val Asp Phe
450 455 460
Ser Val Gly Ala Glu Gly Leu Arg His Val Pro Gly Asp Val Ile Glu
465 470 475 480
Ile Cys Asp Asp Asp Tyr Ala Gly Ile Ser Thr Gly Gly Arg Val Leu
485 490 495
Ala Val Asn Ser Gln Thr Arg Thr Leu Thr Leu Asp Arg Glu Ile Thr
500 505 510
Leu Pro Ser Ser Gly Thr Ala Leu Ile Ser Leu Val Asp Gly Ser Gly
515 520 525
Asn Pro Val Ser Val Glu Val Gln Ser Val Thr Asp Gly Val Lys Val
530 535 540
Lys Val Ser Arg Val Pro Asp Gly Val Ala Glu Tyr Ser Val Trp Glu
545 550 555 560
Leu Lys Leu Pro Thr Leu Arg Gln Arg Leu Phe Arg Cys Val Ser Ile
565 570 575
Arg Glu Asn Asp Asp Gly Thr Tyr Ala Ile Thr Ala Val Gln His Val
580 585 590
Pro Glu Lys Glu Ala Ile Val Asp Asn Gly Ala His Phe Asp Gly Glu
595 600 605
Gln Ser Gly Thr Val Asn Gly Val Thr Pro Pro Ala Val Gln His Leu
610 615 620
Thr Ala Glu Val Thr Ala Asp Ser Gly Glu Tyr Gln Val Leu Ala Arg
625 630 635 640
Trp Asp Thr Pro Lys Val Val Lys Gly Val Ser Phe Leu Leu Arg Leu
645 650 655
Thr Val Thr Ala Asp Asp Gly Ser Glu Arg Leu Val Ser Thr Ala Arg
660 665 670
Thr Thr Glu Thr Thr Tyr Arg Phe Thr Gln Leu Ala Leu Gly Asn Tyr
675 680 685
Arg Leu Thr Val Arg Ala Val Asn Ala Trp Gly Gln Gln Gly Asp Pro
690 695 700
Ala Ser Val Ser Phe Arg Ile Ala Ala Pro Ala Ala Pro Ser Arg Ile
705 710 715 720
Glu Leu Thr Pro Gly Tyr Phe Gln Ile Thr Ala Thr Pro His Leu Ala
725 730 735
Val Tyr Asp Pro Thr Val Gln Phe Glu Phe Trp Phe Ser Glu Lys Gln
740 745 750
Ile Ala Asp Ile Arg Gln Val Glu Thr Ser Thr Arg Tyr Leu Gly Thr
755 760 765
Ala Leu Tyr Trp Ile Ala Ala Ser Ile Asn Ile Lys Pro Gly His Asp
770 775 780
Tyr Tyr Phe Tyr Ile Arg Ser Val Asn Thr Val Gly Lys Ser Ala Phe
785 790 795 800
Val Glu Ala Val Gly Arg Ala Ser Asp Asp Ala Glu Gly Tyr Leu Asp
805 810 815
Phe Phe Lys Gly Glu Ile Gly Lys Thr His Leu Ala Gln Glu Leu Trp
820 825 830
Thr Gln Ile Asp Asn Gly Gln Leu Ala Pro Asp Leu Ala Glu Ile Arg
835 840 845
Thr Ser Ile Thr Asp Val Ser Asn Glu Ile Thr Gln Thr Val Asn Lys
850 855 860
Lys Leu Glu Asp Gln Ser Ala Ala Ile Gln Gln Ile Gln Lys Val Gln
865 870 875 880
Val Asp Thr Asn Asn Asn Leu Asn Ser Met Trp Ala Val Lys Leu Gln
885 890 895
Gln Met Gln Asp Gly Arg Leu Tyr Ile Ala Gly Ile Gly Ala Gly Ile
900 905 910
Glu Asn Thr Ser Asp Gly Met Gln Ser Gln Val Leu Leu Ala Ala Asp
915 920 925
Arg Ile Ala Met Ile Asn Pro Ala Asn Gly Asn Thr Lys Pro Met Phe
930 935 940
Val Gly Gln Gly Asp Gln Ile Phe Met Asn Glu Val Phe Leu Lys Tyr
945 950 955 960
Leu Thr Ala Pro Thr Ile Thr Ser Gly Gly Asn Pro Pro Ala Phe Ser
965 970 975
Leu Thr Ser Asp Gly Lys Leu Thr Ala Lys Asn Ala Asp Ile Ser Gly
980 985 990
Ser Val Asn Ala Asn Ser Gly Thr Leu Asn Asn Val Thr Ile Asn Glu
995 1000 1005
Asn Cys Arg Val Leu Gly Lys Leu Ser Ala Asn Gln Ile Glu Gly
1010 1015 1020
Asp Leu Val Lys Thr Val Gly Lys Ala Phe Pro Arg Asp Ser Arg
1025 1030 1035
Ala Pro Glu Arg Trp Pro Ser Gly Thr Ile Thr Val Arg Val Tyr
1040 1045 1050
Asp Asp Gln Pro Phe Asp Arg Gln Ile Val Ile Pro Ala Val Ala
1055 1060 1065
Phe Ser Gly Ala Lys His Glu Arg Glu His Thr Asp Ile Tyr Ser
1070 1075 1080
Ser Cys Arg Leu Ile Val Arg Lys Asn Gly Ala Glu Ile Tyr Asn
1085 1090 1095
Arg Thr Ala Leu Asp Asn Thr Leu Ile Tyr Ser Gly Val Ile Asp
1100 1105 1110
Met Pro Ala Gly His Gly His Met Thr Leu Glu Phe Ser Val Ser
1115 1120 1125
Ala Trp Leu Val Asn Asn Trp Tyr Pro Thr Ala Ser Ile Ser Asp
1130 1135 1140
Leu Leu Val Val Val Met Lys Lys Ala Thr Ala Gly Ile Ser Ile
1145 1150 1155
Ser
<210> 26
<211> 3477
<212> DNA
<213> 人工序列
<220>
<223> Z2145
<400> 26
atgggtaaag gaagcagtaa ggggcatacc ccgcgcgaag cgaaggacaa cctgaagtcc 60
acgcagttgc tgagtgtgat cgatgccatc agcgaagggc cgattgaagg tccggtggat 120
ggcttaaaaa gcgtgctgct gaacagtacg ccggtgctgg acactgaggg gaataccaac 180
atatccggtg tcacggtggt gttccgggct ggtgagcagg agcagactcc gccggaggga 240
tttgaatcct ccggctccga gacggtgctg ggtacggaag tgaaatatga cacgccgatc 300
acccgcacca ttacgtctgc aaacatcgac cgtctgcgct ttaccttcgg tgtacaggca 360
ctggtggaaa ccacctcaaa gggtgacagg aatccgtcgg aagtccgcct gctggttcag 420
atacaacgta acggtggctg ggtgacggaa aaagacatca ccattaaggg caaaaccacc 480
tcgcagtatc tggcctcggt ggtgatgggt aacctgccgc cgcgcccgtt taatatccgg 540
atgcgcagga tgacgccgga cagcaccaca gaccagctgc agaacaaaac gctctggtcg 600
tcatacactg aaatcatcga tgtgaaacag tgctacccga acacggcact ggtcggcgtg 660
caggtggact cggagcagtt cggcagccag caggtgagcc gtaattatca tctgcgcggg 720
cgtattctgc aggtgccgtc gaactataac ccgcagacgc ggcaatacag cggtatctgg 780
gacggaacgt ttaaaccggc atacagcaac aacatggcct ggtgtctgtg ggatatgctg 840
acccatccgc gctacggcat ggggaaacgt cttggtgcgg cggatgtgga taaatgggcg 900
ctgtatgtca tcggccagta ctgcgaccag tcagtgccgg acggctttgg cggcacggag 960
ccgcgcatca cctgtaatgc gtacctgacc acacagcgta aggcgtggga tgtgctcagc 1020
gatttctgct cggcgatgcg ctgtatgccg gtatggaacg ggcagacgct gacgttcgtg 1080
caggaccgac cgtcggataa gacgtggacc tataaccgca gtaatgtggt gatgccggat 1140
gatggcgcgc cgttccgcta cagcttcagc gccctgaagg accgccataa tgccgttgag 1200
gtgaactgga ttgacccgaa caacggctgg gagacggcga cagagcttgt tgaagatacg 1260
caggccattg cccgttacgg tcgtaatgtt acgaagatgg atgcctttgg ctgtaccagc 1320
cgggggcagg cacaccgcgc cgggctgtgg ctgattaaaa cagaactgct ggaaacgcag 1380
accgtggatt tcagcgtcgg cgcagaaggg cttcgccatg taccgggcga tgttattgaa 1440
atctgcgatg atgactatgc cggtatcagc accggtggtc gtgtgctggc ggtgaacagc 1500
cagacccgga cgctgacgct cgaccgtgaa atcacgctgc catcctccgg taccgcgctg 1560
ataagcctgg ttgacggaag tggcaatccg gtcagcgtgg aggttcagtc cgtcaccgac 1620
ggcgtgaagg taaaagtgag ccgtgttcct gacggtgttg ctgaatacag cgtatgggag 1680
ctgaagctgc cgacgctgcg ccagcgactg ttccgctgcg tgagtatccg tgagaacgac 1740
gacggcacgt atgccatcac cgccgtgcag catgtgccgg aaaaagaggc catcgtggat 1800
aacggggcgc actttgacgg cgaacagagt ggcacggtga atggtgtcac gccgccagcg 1860
gtgcagcacc tgaccgcaga agtcactgca gacagcgggg aatatcaggt gctggcgcga 1920
tgggacacac cgaaggtggt gaagggcgtg agtttcctgc tccgtctgac cgtaacagcg 1980
gacgacggca gtgagcggct ggtcagcacg gcccggacga cggaaaccac ataccgcttc 2040
acgcaactgg cgctggggaa ctacaggctg acagtccggg cggtaaatgc gtgggggcag 2100
cagggcgatc cggcgtcggt atcgttccgg attgccgcac cggcagcacc gtcgaggatt 2160
gagctgacgc cgggctattt tcagataacc gccacgccgc atcttgccgt ttatgacccg 2220
acggtacagt ttgagttctg gttctcggaa aagcagattg cggatatcag acaggttgaa 2280
accagcacgc gttatcttgg tacggcgctg tactggatag ccgccagtat caatatcaaa 2340
ccgggccatg attattactt ttatatccgc agtgtgaaca ccgttggcaa atcggcattc 2400
gtggaggccg tcggtcgggc gagcgatgat gcggaaggtt acctggattt tttcaaaggc 2460
gagataggga aaacccatct ggctcaggag ttgtggactc agattgataa cggtcagctt 2520
gcgcctgacc tggcggaaat cagaacgtcc atcacggatg tcagtaatga aatcacgcag 2580
accgtcaata agaaactgga agaccagagt gcagcgatcc agcagataca gaaggttcag 2640
gttgatacaa ataataacct gaacagcatg tgggcagtga agctgcagca gatgcaggac 2700
ggacgccttt atattgcggg tatcggtgcc ggtattgaga acacctctga cggcatgcag 2760
agtcaggtgc tgctggcggc agacaggatt gcgatgatta atcctgcgaa tggcaacaca 2820
aagccgatgt ttgttggtca gggcgatcag atattcatga atgaagtgtt cctgaaatat 2880
ctgacggctc ccaccattac cagtggcggc aatcctccgg cattttccct gacatcagac 2940
ggaaagctga ccgctaaaaa tgcggatatc agtggcagtg tgaatgcgaa ctccgggacg 3000
ctcaacaacg tcacgattaa cgagaactgt cgggttctgg gaaaactgtc cgcgaaccag 3060
attgaaggcg atctcgttaa aacagtgggc aaagctttcc cccgggactc ccgtgcaccg 3120
gaacggtggc catcagggac cattaccgtc agggtttatg acgatcagcc gtttgaccgg 3180
cagattgtta ttccggcggt ggcattcagc ggcgctaaac atgagagaga gcatactgat 3240
atttactcct catgccgtct gatagtgcgg aaaaacggtg ctgaaattta taaccgtacc 3300
gcgctggata atacgctgat ttacagtggc gttattgata tgcctgccgg tcacggtcac 3360
atgacgctgg agttttcggt gtcagcatgg ctggtgaata actggtatcc cacagcaagt 3420
atcagcgatt tgctggttgt ggtgatgaag aaagccaccg caggcatcag tatcagc 3477
<210> 27
<211> 1131
<212> PRT
<213> 人工序列
<220>
<223> 1A2
<400> 27
Met Gly Lys Gly Ser Ser Lys Gly His Thr Pro Arg Glu Ala Lys Asp
1 5 10 15
Asn Leu Lys Ser Thr Gln Leu Leu Ser Val Ile Asp Ala Ile Ser Glu
20 25 30
Gly Pro Ile Glu Gly Pro Val Asp Gly Leu Lys Ser Val Leu Leu Asn
35 40 45
Ser Thr Pro Val Leu Asp Thr Glu Gly Asn Thr Asn Ile Ser Gly Val
50 55 60
Thr Val Val Phe Arg Ala Gly Glu Gln Glu Gln Thr Pro Pro Glu Gly
65 70 75 80
Phe Glu Ser Ser Gly Ser Glu Thr Val Leu Gly Thr Glu Val Lys Tyr
85 90 95
Asp Thr Pro Ile Thr Arg Thr Ile Thr Ser Ala Asn Ile Asp Arg Leu
100 105 110
Arg Phe Thr Phe Gly Val Gln Ala Leu Val Glu Thr Thr Ser Lys Gly
115 120 125
Asp Arg Asn Pro Ser Glu Val Arg Leu Leu Val Gln Ile Gln Arg Asn
130 135 140
Gly Gly Trp Val Thr Glu Lys Asp Ile Thr Ile Lys Gly Lys Thr Thr
145 150 155 160
Ser Gln Tyr Leu Ala Ser Val Val Met Gly Asn Leu Pro Pro Arg Pro
165 170 175
Phe Asn Ile Arg Met Arg Arg Met Thr Pro Asp Ser Thr Thr Asp Gln
180 185 190
Leu Gln Asn Lys Thr Leu Trp Ser Ser Tyr Thr Glu Ile Ile Asp Val
195 200 205
Lys Gln Cys Tyr Pro Asn Thr Ala Leu Val Gly Val Gln Val Asp Ser
210 215 220
Glu Gln Phe Gly Ser Gln Gln Val Ser Arg Asn Tyr His Leu Arg Gly
225 230 235 240
Arg Ile Leu Gln Val Pro Ser Asn Tyr Asn Pro Gln Thr Arg Gln Tyr
245 250 255
Ser Gly Ile Trp Asp Gly Thr Phe Lys Pro Ala Tyr Ser Asn Asn Met
260 265 270
Ala Trp Cys Leu Trp Asp Met Leu Thr His Pro Arg Tyr Gly Met Gly
275 280 285
Lys Arg Leu Gly Ala Ala Asp Val Asp Lys Trp Ala Leu Tyr Val Ile
290 295 300
Gly Gln Tyr Cys Asp Gln Ser Val Pro Asp Gly Phe Gly Gly Thr Glu
305 310 315 320
Pro Arg Ile Thr Cys Asn Ala Tyr Leu Thr Thr Gln Arg Lys Ala Trp
325 330 335
Asp Val Leu Ser Asp Phe Cys Ser Ala Met Arg Cys Met Pro Val Trp
340 345 350
Asn Gly Gln Thr Leu Thr Phe Val Gln Asp Arg Pro Ser Asp Lys Thr
355 360 365
Trp Thr Tyr Asn Arg Ser Asn Val Val Met Pro Asp Asp Gly Ala Pro
370 375 380
Phe Arg Tyr Ser Phe Ser Ala Leu Lys Asp Arg His Asn Ala Val Glu
385 390 395 400
Val Asn Trp Ile Asp Pro Asn Asn Gly Trp Glu Thr Ala Thr Glu Leu
405 410 415
Val Glu Asp Thr Gln Ala Ile Ala Arg Tyr Gly Arg Asn Val Thr Lys
420 425 430
Met Asp Ala Phe Gly Cys Thr Ser Arg Gly Gln Ala His Arg Ala Gly
435 440 445
Leu Trp Leu Ile Lys Thr Glu Leu Leu Glu Thr Gln Thr Val Asp Phe
450 455 460
Ser Val Gly Ala Glu Gly Leu Arg His Val Pro Gly Asp Val Ile Glu
465 470 475 480
Ile Cys Asp Asp Asp Tyr Ala Gly Ile Ser Thr Gly Gly Arg Val Leu
485 490 495
Ala Val Asn Ser Gln Thr Arg Thr Leu Thr Leu Asp Arg Glu Ile Thr
500 505 510
Leu Pro Ser Ser Gly Thr Ala Leu Ile Ser Leu Val Asp Gly Ser Gly
515 520 525
Asn Pro Val Ser Val Glu Val Gln Ser Val Thr Asp Gly Val Lys Val
530 535 540
Lys Val Ser Arg Val Pro Asp Gly Val Ala Glu Tyr Ser Val Trp Glu
545 550 555 560
Leu Lys Leu Pro Thr Leu Arg Gln Arg Leu Phe Arg Cys Val Ser Ile
565 570 575
Arg Glu Asn Asp Asp Gly Thr Tyr Ala Ile Thr Ala Val Gln His Val
580 585 590
Pro Glu Lys Glu Ala Ile Val Asp Asn Gly Ala His Phe Asp Gly Glu
595 600 605
Gln Ser Gly Thr Val Asn Gly Val Thr Pro Pro Ala Val Gln His Leu
610 615 620
Thr Ala Glu Val Thr Ala Asp Ser Gly Glu Tyr Gln Val Leu Ala Arg
625 630 635 640
Trp Asp Thr Pro Lys Val Val Lys Gly Val Ser Phe Leu Leu Arg Leu
645 650 655
Thr Val Thr Ala Asp Asp Gly Ser Glu Arg Leu Val Ser Thr Ala Arg
660 665 670
Thr Thr Glu Thr Thr Tyr Arg Phe Thr Gln Leu Ala Leu Gly Asn Tyr
675 680 685
Arg Leu Thr Val Arg Ala Val Asn Ala Trp Gly Gln Gln Gly Asp Pro
690 695 700
Ala Ser Val Ser Phe Arg Ile Ala Ala Pro Ala Ala Pro Ser Arg Ile
705 710 715 720
Glu Leu Thr Pro Gly Tyr Phe Gln Ile Thr Ala Thr Pro His Leu Ala
725 730 735
Val Tyr Asp Pro Thr Val Gln Phe Glu Phe Trp Phe Ser Glu Lys Gln
740 745 750
Ile Ala Asp Ile Arg Gln Val Glu Thr Ser Thr Arg Tyr Leu Gly Thr
755 760 765
Ala Leu Tyr Trp Ile Ala Ala Ser Ile Asn Ile Lys Pro Gly His Asp
770 775 780
Tyr Tyr Phe Tyr Ile Arg Ser Val Asn Thr Val Gly Lys Ser Ala Phe
785 790 795 800
Val Glu Ala Val Gly Arg Ala Ser Asp Asp Ala Glu Gly Tyr Leu Asp
805 810 815
Phe Phe Lys Gly Lys Ile Thr Glu Ser His Leu Gly Lys Glu Leu Leu
820 825 830
Glu Lys Val Glu Leu Thr Glu Asp Asn Ala Ser Arg Leu Glu Glu Phe
835 840 845
Ser Lys Glu Trp Lys Asp Ala Ser Asp Lys Trp Asn Ala Met Trp Ala
850 855 860
Val Lys Ile Glu Gln Thr Lys Asp Gly Lys His Tyr Val Ala Gly Ile
865 870 875 880
Gly Leu Ser Met Glu Asp Thr Glu Glu Gly Lys Leu Ser Gln Phe Leu
885 890 895
Val Ala Ala Asn Arg Ile Ala Phe Ile Asp Pro Ala Asn Gly Asn Glu
900 905 910
Thr Pro Met Phe Val Ala Gln Gly Asn Gln Ile Phe Met Asn Asp Val
915 920 925
Phe Leu Lys Arg Leu Thr Ala Pro Thr Ile Thr Ser Gly Gly Asn Pro
930 935 940
Pro Ala Phe Ser Leu Thr Pro Asp Gly Lys Leu Thr Ala Lys Asn Ala
945 950 955 960
Asp Ile Ser Gly Asn Val Asn Ala Asn Ser Gly Thr Leu Asn Asn Val
965 970 975
Thr Ile Asn Glu Asn Cys Arg Val Leu Gly Lys Leu Ser Ala Asn Gln
980 985 990
Ile Glu Gly Asp Leu Val Lys Thr Val Gly Lys Ala Phe Pro Arg Asp
995 1000 1005
Ser Arg Ala Pro Glu Arg Trp Pro Ser Gly Thr Ile Thr Val Arg
1010 1015 1020
Val Tyr Asp Asp Gln Pro Phe Asp Arg Gln Ile Val Ile Pro Ala
1025 1030 1035
Val Ala Phe Ser Gly Ala Lys His Glu Lys Glu His Thr Asp Ile
1040 1045 1050
Tyr Ser Ser Cys Arg Leu Ile Val Arg Lys Asn Gly Ala Glu Ile
1055 1060 1065
Tyr Asn Arg Thr Ala Leu Asp Asn Thr Leu Ile Tyr Ser Gly Val
1070 1075 1080
Ile Asp Met Pro Ala Gly His Gly His Met Thr Leu Glu Phe Ser
1085 1090 1095
Val Ser Ala Trp Leu Val Asn Asn Trp Tyr Pro Thr Ala Ser Ile
1100 1105 1110
Ser Asp Leu Leu Val Val Val Met Lys Lys Ala Thr Ala Gly Ile
1115 1120 1125
Thr Ile Ser
1130
<210> 28
<211> 3393
<212> DNA
<213> 人工序列
<220>
<223> 1A2
<400> 28
atgggtaaag gaagcagtaa ggggcatacc ccgcgcgaag cgaaggacaa cctgaagtcc 60
acgcagttgc tgagtgtgat cgatgccatc agcgaagggc cgattgaagg tccggtggat 120
ggcttaaaaa gcgtgctgct gaacagtacg ccggtgctgg acactgaggg gaataccaac 180
atatccggtg tcacggtggt gttccgggct ggtgagcagg agcagactcc gccggaggga 240
tttgaatcct ccggctccga gacggtgctg ggtacggaag tgaaatatga cacgccgatc 300
acccgcacca ttacgtctgc aaacatcgac cgtctgcgct ttaccttcgg tgtacaggca 360
ctggtggaaa ccacctcaaa gggtgacagg aatccgtcgg aagtccgcct gctggttcag 420
atacaacgta acggtggctg ggtgacggaa aaagacatca ccattaaggg caaaaccacc 480
tcgcagtatc tggcctcggt ggtgatgggt aacctgccgc cgcgcccgtt taatatccgg 540
atgcgcagga tgacgccgga cagcaccaca gaccagctgc agaacaaaac gctctggtcg 600
tcatacactg aaatcatcga tgtgaaacag tgctacccga acacggcact ggtcggcgtg 660
caggtggact cggagcagtt cggcagccag caggtgagcc gtaattatca tctgcgcggg 720
cgtattctgc aggtgccgtc gaactataac ccgcagacgc ggcaatacag cggtatctgg 780
gacggaacgt ttaaaccggc atacagcaac aacatggcct ggtgtctgtg ggatatgctg 840
acccatccgc gctacggcat ggggaaacgt cttggtgcgg cggatgtgga taaatgggcg 900
ctgtatgtca tcggccagta ctgcgaccag tcagtgccgg acggctttgg cggcacggag 960
ccgcgcatca cctgtaatgc gtacctgacc acacagcgta aggcgtggga tgtgctcagc 1020
gatttctgct cggcgatgcg ctgtatgccg gtatggaacg ggcagacgct gacgttcgtg 1080
caggaccgac cgtcggataa gacgtggacc tataaccgca gtaatgtggt gatgccggat 1140
gatggcgcgc cgttccgcta cagcttcagc gccctgaagg accgccataa tgccgttgag 1200
gtgaactgga ttgacccgaa caacggctgg gagacggcga cagagcttgt tgaagatacg 1260
caggccattg cccgttacgg tcgtaatgtt acgaagatgg atgcctttgg ctgtaccagc 1320
cgggggcagg cacaccgcgc cgggctgtgg ctgattaaaa cagaactgct ggaaacgcag 1380
accgtggatt tcagcgtcgg cgcagaaggg cttcgccatg taccgggcga tgttattgaa 1440
atctgcgatg atgactatgc cggtatcagc accggtggtc gtgtgctggc ggtgaacagc 1500
cagacccgga cgctgacgct cgaccgtgaa atcacgctgc catcctccgg taccgcgctg 1560
ataagcctgg ttgacggaag tggcaatccg gtcagcgtgg aggttcagtc cgtcaccgac 1620
ggcgtgaagg taaaagtgag ccgtgttcct gacggtgttg ctgaatacag cgtatgggag 1680
ctgaagctgc cgacgctgcg ccagcgactg ttccgctgcg tgagtatccg tgagaacgac 1740
gacggcacgt atgccatcac cgccgtgcag catgtgccgg aaaaagaggc catcgtggat 1800
aacggggcgc actttgacgg cgaacagagt ggcacggtga atggtgtcac gccgccagcg 1860
gtgcagcacc tgaccgcaga agtcactgca gacagcgggg aatatcaggt gctggcgcga 1920
tgggacacac cgaaggtggt gaagggcgtg agtttcctgc tccgtctgac cgtaacagcg 1980
gacgacggca gtgagcggct ggtcagcacg gcccggacga cggaaaccac ataccgcttc 2040
acgcaactgg cgctggggaa ctacaggctg acagtccggg cggtaaatgc gtgggggcag 2100
cagggcgatc cggcgtcggt atcgttccgg attgccgcac cggcagcacc gtcgaggatt 2160
gagctgacgc cgggctattt tcagataacc gccacgccgc atcttgccgt ttatgacccg 2220
acggtacagt ttgagttctg gttctcggaa aagcagattg cggatatcag acaggttgaa 2280
accagcacgc gttatcttgg tacggcgctg tactggatag ccgccagtat caatatcaaa 2340
ccgggccatg attattactt ttatatccgc agtgtgaaca ccgttggcaa atcggcattc 2400
gtggaggccg tcggtcgggc gagcgatgat gcggaaggtt acctggattt tttcaaaggc 2460
aagataaccg aatcccatct cggcaaggag ctgctggaaa aagtcgagct gacggaggat 2520
aacgccagca gactggagga gttttcgaaa gagtggaagg atgccagtga taagtggaat 2580
gccatgtggg ctgtcaaaat tgagcagacc aaagacggca aacattatgt cgcgggtatt 2640
ggcctcagca tggaggacac ggaggaaggc aaactgagcc agtttctggt tgccgccaat 2700
cgtatcgcat ttattgaccc ggcaaacggg aatgaaacgc cgatgtttgt ggcgcagggc 2760
aaccagatat tcatgaacga cgtgttcctg aagcgcctga cggcccccac cattaccagc 2820
ggcggcaatc ctccggcctt ttccctgaca ccggacggaa agctgaccgc taaaaatgcg 2880
gatatcagcg gtaacgtgaa tgcgaactcc gggacgctca acaacgtcac gattaacgag 2940
aactgtcggg ttctgggaaa attgtccgcg aaccagattg aaggcgatct cgttaaaaca 3000
gtgggcaaag ctttcccccg ggactcccgt gcaccggagc ggtggccatc aggaaccatt 3060
accgtcaggg tttatgacga tcagccgttt gaccggcaga ttgttattcc ggcggtggca 3120
ttcagcggcg ctaaacatga gaaagagcat actgatattt actcctcatg ccgtctgata 3180
gtgcggaaaa acggtgctga aatttataac cgtaccgcgc tggataatac gctgatttac 3240
agtggcgtta ttgatatgcc tgccggtcac ggtcacatga cactggagtt ttcggtgtca 3300
gcatggctgg taaataactg gtatcccaca gcaagtatca gcgatttgct ggttgtggtg 3360
atgaagaaag ccactgcagg catcacgatt agc 3393
<210> 29
<211> 1132
<212> PRT
<213> 人工序列
<220>
<223> A8
<400> 29
Met Gly Lys Gly Ser Ser Lys Gly His Thr Pro Arg Glu Ala Lys Asp
1 5 10 15
Asn Leu Lys Ser Thr Gln Leu Leu Ser Val Ile Asp Ala Ile Ser Glu
20 25 30
Gly Pro Ile Glu Gly Pro Val Asp Gly Leu Lys Ser Val Leu Leu Asn
35 40 45
Ser Thr Pro Val Leu Asp Thr Glu Gly Asn Thr Asn Ile Ser Gly Val
50 55 60
Thr Val Val Phe Arg Ala Gly Glu Gln Glu Gln Thr Pro Pro Glu Gly
65 70 75 80
Phe Glu Ser Ser Gly Ser Glu Thr Val Leu Gly Thr Glu Val Lys Tyr
85 90 95
Asp Thr Pro Ile Thr Arg Thr Ile Thr Ser Ala Asn Ile Asp Arg Leu
100 105 110
Arg Phe Thr Phe Gly Val Gln Ala Leu Val Glu Thr Thr Ser Lys Gly
115 120 125
Asp Arg Asn Pro Ser Glu Val Arg Leu Leu Val Gln Ile Gln Arg Asn
130 135 140
Gly Gly Trp Val Thr Glu Lys Asp Ile Thr Ile Lys Gly Lys Thr Thr
145 150 155 160
Ser Gln Tyr Leu Ala Ser Val Val Met Gly Asn Leu Pro Pro Arg Pro
165 170 175
Phe Asn Ile Arg Met Arg Arg Met Thr Pro Asp Ser Thr Thr Asp Gln
180 185 190
Leu Gln Asn Lys Thr Leu Trp Ser Ser Tyr Thr Glu Ile Ile Asp Val
195 200 205
Lys Gln Cys Tyr Pro Asn Thr Ala Leu Val Gly Val Gln Val Asp Ser
210 215 220
Glu Gln Phe Gly Ser Gln Gln Val Ser Arg Asn Tyr His Leu Arg Gly
225 230 235 240
Arg Ile Leu Gln Val Pro Ser Asn Tyr Asn Pro Gln Thr Arg Gln Tyr
245 250 255
Ser Gly Ile Trp Asp Gly Thr Phe Lys Pro Ala Tyr Ser Asn Asn Met
260 265 270
Ala Trp Cys Leu Trp Asp Met Leu Thr His Pro Arg Tyr Gly Met Gly
275 280 285
Lys Arg Leu Gly Ala Ala Asp Val Asp Lys Trp Ala Leu Tyr Val Ile
290 295 300
Gly Gln Tyr Cys Asp Gln Ser Val Pro Asp Gly Phe Gly Gly Thr Glu
305 310 315 320
Pro Arg Ile Thr Cys Asn Ala Tyr Leu Thr Thr Gln Arg Lys Ala Trp
325 330 335
Asp Val Leu Ser Asp Phe Cys Ser Ala Met Arg Cys Met Pro Val Trp
340 345 350
Asn Gly Gln Thr Leu Thr Phe Val Gln Asp Arg Pro Ser Asp Lys Thr
355 360 365
Trp Thr Tyr Asn Arg Ser Asn Val Val Met Pro Asp Asp Gly Ala Pro
370 375 380
Phe Arg Tyr Ser Phe Ser Ala Leu Lys Asp Arg His Asn Ala Val Glu
385 390 395 400
Val Asn Trp Ile Asp Pro Asn Asn Gly Trp Glu Thr Ala Thr Glu Leu
405 410 415
Val Glu Asp Thr Gln Ala Ile Ala Arg Tyr Gly Arg Asn Val Thr Lys
420 425 430
Met Asp Ala Phe Gly Cys Thr Ser Arg Gly Gln Ala His Arg Ala Gly
435 440 445
Leu Trp Leu Ile Lys Thr Glu Leu Leu Glu Thr Gln Thr Val Asp Phe
450 455 460
Ser Val Gly Ala Glu Gly Leu Arg His Val Pro Gly Asp Val Ile Glu
465 470 475 480
Ile Cys Asp Asp Asp Tyr Ala Gly Ile Ser Thr Gly Gly Arg Val Leu
485 490 495
Ala Val Asn Ser Gln Thr Arg Thr Leu Thr Leu Asp Arg Glu Ile Thr
500 505 510
Leu Pro Ser Ser Gly Thr Ala Leu Ile Ser Leu Val Asp Gly Ser Gly
515 520 525
Asn Pro Val Ser Val Glu Val Gln Ser Val Thr Asp Gly Val Lys Val
530 535 540
Lys Val Ser Arg Val Pro Asp Gly Val Ala Glu Tyr Ser Val Trp Glu
545 550 555 560
Leu Lys Leu Pro Thr Leu Arg Gln Arg Leu Phe Arg Cys Val Ser Ile
565 570 575
Arg Glu Asn Asp Asp Gly Thr Tyr Ala Ile Thr Ala Val Gln His Val
580 585 590
Pro Glu Lys Glu Ala Ile Val Asp Asn Gly Ala His Phe Asp Gly Glu
595 600 605
Gln Ser Gly Thr Val Asn Gly Val Thr Pro Pro Ala Val Gln His Leu
610 615 620
Thr Ala Glu Val Thr Ala Asp Ser Gly Glu Tyr Gln Val Leu Ala Arg
625 630 635 640
Trp Asp Thr Pro Lys Val Val Lys Gly Val Ser Phe Leu Leu Arg Leu
645 650 655
Thr Val Thr Ala Asp Asp Gly Ser Glu Arg Leu Val Ser Thr Ala Arg
660 665 670
Thr Thr Glu Thr Thr Tyr Arg Phe Thr Gln Leu Ala Leu Gly Asn Tyr
675 680 685
Arg Leu Thr Val Arg Ala Val Asn Ala Trp Gly Gln Gln Gly Asp Pro
690 695 700
Ala Ser Val Ser Phe Arg Ile Ala Ala Pro Ala Ala Pro Ser Arg Ile
705 710 715 720
Glu Leu Thr Pro Gly Tyr Phe Gln Ile Thr Ala Thr Pro His Leu Ala
725 730 735
Val Tyr Asp Pro Thr Val Gln Phe Glu Phe Trp Phe Ser Glu Lys Gln
740 745 750
Ile Ala Asp Ile Arg Gln Val Glu Thr Ser Thr Arg Tyr Leu Gly Thr
755 760 765
Ala Leu Tyr Trp Ile Ala Ala Ser Ile Asn Ile Lys Pro Gly His Asp
770 775 780
Tyr Tyr Phe Tyr Ile Arg Ser Val Asn Thr Val Gly Lys Ser Ala Phe
785 790 795 800
Val Glu Ala Val Gly Arg Ala Ser Asp Asp Ala Glu Gly Tyr Leu Asp
805 810 815
Phe Phe Lys Gly Lys Ile Thr Glu Ser His Leu Gly Lys Glu Leu Leu
820 825 830
Glu Lys Val Glu Leu Thr Glu Asp Asn Ala Ser Arg Leu Glu Glu Phe
835 840 845
Ser Lys Glu Trp Lys Asp Ala Ser Asp Lys Trp Asn Ala Met Trp Ala
850 855 860
Val Lys Ile Glu Gln Thr Lys Asp Gly Lys His Tyr Val Ala Gly Ile
865 870 875 880
Gly Leu Ser Met Glu Asp Thr Glu Glu Gly Lys Leu Ser Gln Phe Leu
885 890 895
Val Ala Ala Asn Arg Ile Ala Phe Ile Asp Pro Ala Asn Gly Asn Glu
900 905 910
Thr Pro Met Phe Val Ala Gln Gly Asn Gln Ile Phe Met Asn Asp Val
915 920 925
Phe Leu Lys Arg Leu Thr Ala Pro Thr Ile Thr Ser Gly Gly Asn Pro
930 935 940
Pro Ala Phe Ser Leu Thr Pro Asp Gly Lys Leu Thr Ala Lys Asn Ala
945 950 955 960
Asp Ile Ser Gly Ser Val Asn Ala Asn Ser Gly Thr Leu Asn Asn Val
965 970 975
Thr Ile Asn Glu Asn Cys Gln Ile Lys Gly Lys Leu Ser Ala Asn Gln
980 985 990
Ile Glu Gly Asp Ile Val Lys Thr Val Ser Lys Ser Phe Pro Arg Thr
995 1000 1005
Asn Ser Tyr Ala Ser Gly Thr Ile Thr Val Arg Ile Ser Asp Asp
1010 1015 1020
Gln Lys Phe Asp Arg Gln Val Met Ile Pro Pro Val Leu Phe Arg
1025 1030 1035
Gly Gly Lys His Glu Asn Phe Asn Ser Asn Asn Gln Gln Ser Tyr
1040 1045 1050
Trp Tyr Ser Thr Cys Arg Leu Arg Val Thr Arg Asn Gly Gln Glu
1055 1060 1065
Ile Phe Asn Gln Ser Thr Thr Asp Ala Gln Gly Val Phe Ser Ser
1070 1075 1080
Val Ile Asp Met Pro Ala Gly Gln Gly Thr Leu Thr Leu Thr Phe
1085 1090 1095
Thr Val Ser Ser Ser Gly Ala Asn Asn Trp Thr Pro Thr Thr Ser
1100 1105 1110
Ile Ser Asp Leu Leu Val Val Val Met Lys Lys Ser Thr Ala Gly
1115 1120 1125
Ile Ser Ile Ser
1130
<210> 30
<211> 2032
<212> DNA
<213> 人工序列
<220>
<223> A8
<400> 30
atgggtaaag gaagcagtaa ggggcatacc ccgcgcgaag cgaaggacaa cctgaagtcc 60
acgcagttgc tgagtgtgat cgatgccatc agcgaagggc cgattgaagg tccggtggat 120
ggcttaaaaa gcgtgctgct gaacagtacg ccggtgctgg acactgaggg gaataccaac 180
atatccggtg tcacggtggt gttccgggct ggtgagcagg agcagactcc gccggaggga 240
tttgaatcct ccggctccga gacggtgctg ggtacggaag tgaaatatga cacgccgatc 300
acccgcacca ttacgtctgc aaacatcgac cgtctgcgct ttaccttcgg tgtacaggca 360
ctggtggaaa ccacctcaaa gggtgacagg aatccgtcgg aagtccgcct gctggttcag 420
atacaacgta acggtggctg ggtgacggaa aaagacatca ccattaaggg caaaaccacc 480
tcgcagtatc tggcctcggt ggtgatgggt aacctgccgc cgcgcccgtt taatatccgg 540
atgcgcagga tgacgccgga cagcaccaca gaccagctgc agaacaaaac gctctggtcg 600
tcatacactg aaatcatcga tgtgaaacag tgctacccga acacggcact ggtcggcgtg 660
caggtggact cggagcagtt cggcagccag caggtgagcc gtaattatca tctgcgcggg 720
cgtattctgc aggtgccgtc gaactataac ccgcagacgc ggcaatacag cggtatctgg 780
gacggaacgt ttaaaccggc atacagcaac aacatggcct ggtgtctgtg ggatatgctg 840
acccatccgc gctacggcat ggggaaacgt cttggtgcgg cggatgtgga taaatgggcg 900
ctgtatgtca tcggccagta ctgcgaccag tcagtgccgg acggctttgg cggcacggag 960
ccgcgcatca cctgtaatgc gtacctgacc acacagcgta aggcgtggga tgtgctcagc 1020
gatttctgct cggcgatgcg ctgtatgccg gtatggaacg ggcagacgct gacgttcgtg 1080
caggaccgac cgtcggataa gacgtggacc tataaccgca gtaatgtggt gatgccggat 1140
gatggcgcgc cgttccgcta cagcttcagc gccctgaagg accgccataa tgccgttgag 1200
gtgaactgga ttgacccgaa caacggctgg gagacggcga cagagcttgt tgaagatacg 1260
caggccattg cccgttacgg tcgtaatgtt acgaagatgg atgcctttgg ctgtaccagc 1320
cgggggcagg cacaccgcgc cgggctgtgg ctgattaaaa cagaactgct ggaaacgcag 1380
accgtggatt tcagcgtcgg cgcagaaggg cttcgccatg taccgggcga tgttattgaa 1440
atctgcgatg atgactatgc cggtatcagc accggtggtc gtgtgctggc ggtgaacagc 1500
cagacccgga cgctgacgct cgaccgtgaa atcacgctgc catcctccgg taccgcgctg 1560
ataagcctgg ttgacggaag tggcaatccg gtcagcgtgg aggttcagtc cgtcaccgac 1620
ggcgtgaagg taaaagtgag ccgtgttcct gacggtgttg ctgaatacag cgtatgggag 1680
ctgaagctgc cgacgctgcg ccagcgactg ttccgctgcg tgagtatccg tgagaacgac 1740
gacggcacgt atgccatcac cgccgtgcag catgtgccgg aaaaagaggc catcgtggat 1800
aacggggcgc actttgacgg cgaacagagt ggcacggtga atggtgtcac gccgccagcg 1860
gtgcagcacc tgaccgcaga agtcactgca gacagcgggg aatatcaggt gctggcgcga 1920
tgggacacac cgaaggtggt gaagggcgtg agtttcctgc tccgtctgac cgtaacagcg 1980
gacgacggca gtgagcggct ggtcagcacg gcccggacga cggaaaccac at 2032
<210> 31
<211> 859
<212> PRT
<213> 人工序列
<220>
<223> gpH-IAI
<400> 31
Met Ala Glu Pro Val Gly Asp Leu Val Val Asp Leu Ser Leu Asp Ala
1 5 10 15
Ala Arg Phe Asp Glu Gln Met Ala Arg Val Arg Arg His Phe Ser Gly
20 25 30
Thr Glu Ser Asp Ala Lys Lys Thr Ala Ala Val Val Glu Gln Ser Leu
35 40 45
Ser Arg Gln Ala Leu Ala Ala Gln Lys Ala Gly Ile Ser Val Gly Gln
50 55 60
Tyr Lys Ala Ala Met Arg Met Leu Pro Ala Gln Phe Thr Asp Val Ala
65 70 75 80
Thr Gln Leu Ala Gly Gly Gln Ser Pro Trp Leu Ile Leu Leu Gln Gln
85 90 95
Gly Gly Gln Val Lys Asp Ser Phe Gly Gly Met Ile Pro Met Phe Arg
100 105 110
Gly Leu Ala Gly Ala Ile Thr Leu Pro Met Val Gly Ala Thr Ser Leu
115 120 125
Ala Val Ala Thr Gly Ala Leu Ala Tyr Ala Trp Tyr Gln Gly Asn Ser
130 135 140
Thr Leu Ser Asp Phe Asn Lys Thr Leu Val Leu Ser Gly Asn Gln Ala
145 150 155 160
Gly Leu Thr Ala Asp Arg Met Leu Val Leu Ser Arg Ala Gly Gln Ala
165 170 175
Ala Gly Leu Thr Phe Asn Gln Thr Ser Glu Ser Leu Thr Ala Leu Val
180 185 190
Asn Ala Gly Val Arg Gly Gly Glu Gln Phe Glu Ala Ile Ser Gln Ser
195 200 205
Val Ala Arg Phe Ser Ser Ala Ser Gly Val Glu Val Asp Lys Val Ala
210 215 220
Glu Ala Phe Gly Lys Leu Thr Thr Asp Pro Thr Ser Gly Leu Thr Ala
225 230 235 240
Met Ala Arg Gln Phe His Asn Val Thr Ala Glu Gln Ile Ala Tyr Val
245 250 255
Ala Gln Leu Gln Arg Ser Gly Asp Glu Ala Gly Ala Leu Gln Ala Ala
260 265 270
Asn Glu Ala Ala Thr Lys Gly Phe Asp Asp Gln Thr Arg Arg Leu Lys
275 280 285
Glu Asn Met Gly Thr Leu Glu Thr Trp Ala Asp Arg Thr Ala Arg Ala
290 295 300
Phe Lys Ser Met Trp Asp Ser Val Leu Asp Ile Gly Arg Pro Asp Thr
305 310 315 320
Ala Gln Gly Met Leu Glu Lys Ala Glu Lys Ala Phe Asp Glu Ala Asp
325 330 335
Lys Lys Trp Gln Trp Tyr Gln Ser Arg Ser His Arg Arg Gly Lys Thr
340 345 350
Ser Ala Phe Leu Ala Asn Leu Arg Gly Ala Trp Glu Asp Arg Ala Asn
355 360 365
Ala Gln Leu Gly Leu Ser Ala Ala Thr Leu Gln Ala Asp Leu Glu Lys
370 375 380
Ala Arg Glu Met Ala Ala Lys Asp Trp Ala Glu Ser Glu Ala Ser Arg
385 390 395 400
Leu Lys Tyr Thr Glu Glu Ala Gln Lys Ala Tyr Glu Arg Leu Gln Thr
405 410 415
Pro Leu Glu Lys Tyr Thr Ala Arg Gln Glu Glu Leu Asn Lys Ala Leu
420 425 430
Lys Asp Gly Lys Ile Leu Gln Ala Asp Tyr Asn Thr Leu Met Ala Ala
435 440 445
Ala Lys Lys Asp Tyr Glu Ala Thr Leu Lys Lys Pro Lys Gln Ser Ser
450 455 460
Val Lys Val Ser Ala Gly Asp Arg Gln Glu Asp Ser Ala His Ala Ala
465 470 475 480
Leu Leu Thr Leu Gln Ala Glu Leu Arg Thr Leu Glu Lys His Ala Gly
485 490 495
Ala Asn Glu Lys Ile Ser Gln Gln Arg Arg Asp Leu Trp Lys Ala Glu
500 505 510
Ser Gln Phe Ala Val Leu Glu Glu Ala Ala Gln Arg Arg Gln Leu Ser
515 520 525
Ala Gln Glu Lys Ser Leu Leu Ala His Lys Asp Glu Thr Leu Glu Tyr
530 535 540
Lys Arg Gln Leu Ala Ala Leu Gly Asp Lys Val Thr Tyr Gln Glu Arg
545 550 555 560
Leu Asn Ala Leu Ala Gln Gln Ala Asp Lys Phe Ala Gln Gln Gln Arg
565 570 575
Ala Lys Arg Ala Ala Ile Asp Ala Lys Ser Arg Gly Leu Thr Asp Arg
580 585 590
Gln Ala Glu Arg Glu Ala Thr Glu Gln Arg Leu Lys Glu Gln Tyr Gly
595 600 605
Asp Asn Pro Leu Ala Leu Asn Asn Val Met Ser Glu Gln Lys Lys Thr
610 615 620
Trp Ala Ala Glu Asp Gln Leu Arg Gly Asn Trp Met Ala Gly Leu Lys
625 630 635 640
Ser Gly Trp Ser Glu Trp Glu Glu Ser Ala Thr Asp Ser Met Ser Gln
645 650 655
Val Lys Ser Ala Ala Thr Gln Thr Phe Asp Gly Ile Ala Gln Asn Met
660 665 670
Ala Ala Met Leu Thr Gly Ser Glu Gln Asn Trp Arg Ser Phe Thr Arg
675 680 685
Ser Val Leu Ser Met Met Thr Glu Ile Leu Leu Lys Gln Ala Met Val
690 695 700
Gly Ile Val Gly Ser Ile Gly Ser Ala Ile Gly Gly Ala Val Gly Gly
705 710 715 720
Gly Ala Ser Ala Ser Gly Gly Thr Ala Ile Gln Ala Ala Ala Ala Lys
725 730 735
Phe His Phe Ala Thr Gly Gly Phe Thr Gly Thr Gly Gly Lys Tyr Glu
740 745 750
Pro Ala Gly Ile Val His Arg Gly Glu Phe Val Phe Thr Lys Glu Ala
755 760 765
Thr Ser Arg Ile Gly Val Gly Asn Leu Tyr Arg Leu Met Arg Gly Tyr
770 775 780
Ala Thr Gly Gly Tyr Val Gly Thr Pro Gly Ser Met Ala Asp Ser Arg
785 790 795 800
Ser Gln Ala Ser Gly Thr Phe Glu Gln Asn Asn His Val Val Ile Asn
805 810 815
Asn Asp Gly Thr Asn Gly Gln Ile Gly Pro Ala Ala Leu Lys Ala Val
820 825 830
Tyr Asp Met Ala Arg Lys Gly Ala Arg Asp Glu Ile Gln Thr Gln Met
835 840 845
Arg Asp Gly Gly Leu Phe Ser Gly Gly Gly Arg
850 855
<210> 32
<211> 1154
<212> PRT
<213> 人工序列
<220>
<223> λ-K5
<400> 32
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Val Val Met Asp Glu Thr Asn Arg Lys Ala Pro Leu Asp Ser Pro
385 390 395 400
Ala Leu Thr Gly Thr Pro Thr Ala Pro Thr Ala Leu Arg Gly Thr Asn
405 410 415
Asn Thr Gln Ile Ala Asn Thr Ala Phe Val Leu Ala Ala Ile Ala Asp
420 425 430
Val Ile Asp Ala Ser Pro Asp Ala Leu Asn Thr Leu Asn Glu Leu Ala
435 440 445
Ala Ala Leu Gly Asn Asp Pro Asp Phe Ala Thr Thr Met Thr Asn Ala
450 455 460
Leu Ala Gly Lys Gln Pro Lys Asn Ala Thr Leu Thr Ala Leu Ala Gly
465 470 475 480
Leu Ser Thr Ala Lys Asn Lys Leu Pro Tyr Phe Ala Glu Asn Asp Ala
485 490 495
Ala Ser Leu Thr Glu Leu Thr Gln Val Gly Arg Asp Ile Leu Ala Lys
500 505 510
Asn Ser Val Ala Asp Val Leu Glu Tyr Leu Gly Ala Gly Glu Asn Ser
515 520 525
Pro Lys Thr Glu Gly Ile Leu His Lys Gly Gln Ser Leu Tyr Glu Tyr
530 535 540
Leu Asp Ala Arg Val Leu Thr Ser Lys Pro Phe Gly Ala Ala Gly Asp
545 550 555 560
Ala Thr Thr Asp Asp Thr Glu Val Ile Ala Ala Ser Leu Asn Ser Gln
565 570 575
Lys Ala Val Thr Ile Ser Asp Gly Val Phe Ser Ser Ser Gly Ile Asn
580 585 590
Ser Asn Tyr Cys Asn Leu Asp Gly Arg Gly Ser Gly Val Leu Ser His
595 600 605
Arg Ser Ser Thr Gly Asn Tyr Leu Val Phe Asn Asn Pro Arg Thr Gly
610 615 620
Arg Leu Ser Asn Ile Thr Val Glu Ser Asn Lys Ala Thr Asp Thr Thr
625 630 635 640
Gln Gly Gln Gln Val Ser Leu Ala Gly Gly Ser Asp Val Thr Val Ser
645 650 655
Asp Val Asn Phe Ser Asn Val Lys Gly Thr Gly Phe Ser Leu Ile Ala
660 665 670
Tyr Pro Asn Asp Ala Pro Pro Asp Gly Leu Met Ile Lys Gly Ile Arg
675 680 685
Gly Ser Tyr Ser Gly Tyr Ala Thr Asn Lys Ala Ala Gly Cys Val Leu
690 695 700
Ala Asp Ser Ser Val Asn Ser Leu Ile Asp Asn Val Ile Ala Lys Asn
705 710 715 720
Tyr Pro Gln Phe Gly Ala Val Glu Leu Lys Gly Thr Ala Ser Tyr Asn
725 730 735
Ile Val Ser Asn Val Ile Gly Ala Asp Cys Gln His Val Thr Tyr Asn
740 745 750
Gly Thr Glu Gly Pro Ile Ala Pro Ser Asn Asn Leu Ile Lys Gly Val
755 760 765
Met Ala Asn Asn Pro Lys Tyr Ala Ala Val Val Ala Gly Lys Gly Ser
770 775 780
Thr Asn Leu Ile Ser Asp Val Leu Val Asp Tyr Ser Thr Ser Asp Ala
785 790 795 800
Arg Gln Ala His Gly Val Thr Val Glu Gly Ser Asp Asn Val Ile Asn
805 810 815
Asn Val Leu Met Ser Gly Cys Asp Gly Thr Asn Ser Leu Gly Gln Arg
820 825 830
Gln Thr Ala Thr Ile Ala Arg Phe Ile Gly Thr Ala Asn Asn Asn Tyr
835 840 845
Ala Ser Val Phe Pro Ser Tyr Ser Ala Thr Gly Val Ile Thr Phe Glu
850 855 860
Ser Gly Ser Thr Arg Asn Phe Val Glu Val Lys His Pro Gly Arg Arg
865 870 875 880
Asn Asp Leu Leu Ser Ser Ala Ser Thr Ile Asp Gly Ala Ala Thr Ile
885 890 895
Asp Gly Thr Ser Asn Ser Asn Val Val His Ala Pro Ala Leu Gly Gln
900 905 910
Tyr Ile Gly Ser Met Ser Gly Arg Phe Glu Trp Arg Ile Lys Ser Met
915 920 925
Ser Leu Pro Ser Gly Val Leu Thr Ser Ala Asp Lys Tyr Arg Met Leu
930 935 940
Gly Asp Gly Ala Val Ser Leu Ala Val Gly Gly Gly Thr Ser Ser Gln
945 950 955 960
Val Arg Leu Phe Thr Ser Asp Gly Thr Ser Arg Thr Val Ser Leu Thr
965 970 975
Asn Gly Asn Val Arg Leu Ser Thr Ser Ser Thr Gly Tyr Leu Gln Leu
980 985 990
Gly Ala Asp Ala Met Thr Pro Asp Ser Thr Gly Thr Tyr Ala Leu Gly
995 1000 1005
Ser Ala Ser Arg Ala Trp Ser Gly Gly Phe Thr Gln Ala Ala Phe
1010 1015 1020
Thr Val Thr Ser Asp Ala Arg Cys Lys Thr Glu Pro Leu Thr Ile
1025 1030 1035
Ser Asp Ala Leu Leu Asp Ala Trp Ser Glu Val Asp Phe Val Gln
1040 1045 1050
Phe Gln Tyr Leu Asp Arg Val Glu Glu Lys Gly Ala Asp Ser Ala
1055 1060 1065
Arg Trp His Phe Gly Ile Ile Ala Gln Arg Ala Lys Glu Ala Phe
1070 1075 1080
Glu Arg His Gly Ile Asp Ala His Arg Tyr Gly Phe Leu Cys Phe
1085 1090 1095
Asp Ser Trp Asp Asp Val Tyr Glu Glu Asp Ala Asn Gly Ser Arg
1100 1105 1110
Lys Leu Ile Thr Pro Ala Gly Ser Arg Tyr Gly Ile Arg Tyr Glu
1115 1120 1125
Glu Val Leu Ile Leu Glu Ala Ala Leu Met Arg Arg Thr Ile Lys
1130 1135 1140
Arg Met Gln Glu Ala Leu Ala Ala Leu Pro Lys
1145 1150
<210> 33
<211> 11615
<212> DNA
<213> 人工序列
<220>
<223> 有效载荷p1392质粒
<400> 33
gtttgcaata agggacaagt tacgagtgta gacacgcaga attatccagc ctttagtctt 60
taggaaggca aagctattgt acgcggtagc cgtcgtagca atttaccaac tgtagaatta 120
ttggacacac gtaacaaggg cttacagttg aagtttaata aggtcacacg caaaaccgct 180
aaggaataat cgcaccgtta gcgaaagaat atttcagagc ggttagtaaa ggttgagtaa 240
agtgagattc caaagtgagc ctttataaaa agtaaagagc tataataaaa ccgtcgatcg 300
gaaaacaatc gcctgaaatc tcaagcacgt tgccctttct aacgtcgcta aggtttcgta 360
aacccgtttg attaggaaga agaataagta acccgattag gtttgagatc gcgggttatc 420
ggtttggatt aaaagtggat accagcggag tcaacgccga cgcaaacgta cagtgatcca 480
atcctgttcc acggtcaagc acaatcagct agcaagatct tggaatagag tcgttgcacc 540
gctttgattt acatgctctc cattgcacaa cattccggaa ggactggctt ctctgccatg 600
atcggataat gaaaaacatc agtatgccct gtcatttttc tttgggtgtc ctcaaataat 660
tgccctcacg ttatcgtatg tgacgcgctc atctatgctc gaagtattcc ttgttctccc 720
atcttttaat agaaagtctt taatgaacgt gtcgttacgc agtgtatgaa ctcttgtttt 780
atagggcaga ctttggcgtg gcctaagtgt gttcgataag aaggcaagga caactagctg 840
acgcgctgta atacggatat tatggcacgg ttgatacaaa cgctgatatc ctgatttgct 900
aatgtgccca acactttagt tgagtgccac gttccgacta caagttgctt caagagggga 960
atttggattt ggcaatagcc ccccgtttct acctcaagag gcgacgagta ttaaccgcgc 1020
cagctttcgg cacaagggcc aaagaagatt ccaatttctt attcccgaat aacctccgaa 1080
tccctgcggg aaaatcaccg accgaatagc ctagaagcaa gggggaacag ataggtataa 1140
ttagcttaag agagtaccag ccgtgacaac accgtagtaa ccacaaactt acgctggggc 1200
ttctttggcg gatttttaca gatactaaca aggtgatttg aagtacctta gttgaggatt 1260
taaacgcgct atccggtagt ctacaaattg ggaaataccg ttcaaagagg gctagaatta 1320
cttaaaagcc ttcacaccgc ctgcgctata cgcgcccact ctcccgttta tccgtccaag 1380
cggaagcagg gcgaacttcc gctaagatat tcttacgtgt aacgtagcta agtatcccaa 1440
atagctggcg tacgcgttga acaccgccta gaggatcggg agtcgccgga cgagcgtgtt 1500
attggggact tacgccagcg tagactacaa cgcgcccaga ttaaccctgc acgtattgcc 1560
ttgaataacg tactaatctc tccggctctc gacaatctat cgagcgactc gattatcaac 1620
gggtgtcttg cagttctaat ctcttgcccc cgcccgtaat agcctccaag tgattcaaga 1680
tagtaaaggg caagagctta ttcggcgttg aaggatagcg gactttcggt caaccacaat 1740
tccccactcg acaaaaccag ccgtgcgaag aactctgaaa gtacaagcaa cccaagaggg 1800
ctgagcctaa actcagctaa ttcctaagtg agctaaagac tcgaagtgac agctattaat 1860
aaatagagcg ggaacgtcga acggtcgtga aagtaatagt acaacgggta ttaacttact 1920
gaggatattg cttgaagctg taccgtttta ttgggtgaac gaataagatc cagcaattca 1980
gccaaagaag ctaccaattt ttagtttaag agtgtcacgt ctgacctcgc gggtggatag 2040
ccgaacgtag agcttacgag ccagcggaaa cagtagccgc aggataagta aggggagtaa 2100
gtgatcgaac gaatcagaag tgacaatata cttaggctgg atctcgtccc gtgaatccca 2160
accctcacca actacgagat aagaggtaag ccagaaatcg gcatggtggc gaccaacgac 2220
tgttcccccc ctgtaactaa tcgttccgtc aaaacctgac ttacttcaag gccaattcca 2280
agcgcaaaca ataccgtcct agttcttcgg ttaagtttcc gaagtaggag tgagcctacc 2340
tccgtttgcg tcttgttacc actgacccag ctatttactt tgtattgcct gcaatcgaat 2400
ttctgaactc tcagatagtg gggataacgg gaaagttcct atatttgcga actaacttag 2460
ccgtccacct cgaagctacc tactcacacc caccccgcgc ggggtaaata aggcactaat 2520
cccagcttag agcttgcgta gcacttagcc acaagttaat taacagttgt ctggtagttt 2580
ggcggtatta gcgagatcct agaagcaagg cagagttagt tctaacctaa agccacaaat 2640
aagacaggtt gccaaagccc gccggaaatt aaatcttgct cagttcggta acggagtttc 2700
cctcccgcgt acttaattcc caataagaaa cgcgcccaag tcctatcagg caaaattcag 2760
ccccttcccg tgttagaacg agggtaaaaa tacaagccga ttgaacaagg gttgggggct 2820
tcaaatcgtc gtttacccca ctttacaacg gagggtaagt agttcaccct atagtacgaa 2880
gcagaactat ttcgaggggc gtgcaataat cgaatcttct gcggttgact taacacgcta 2940
gggacgtgcc ctcgattcag tcgcaggtac tcctactcag actgcctcac acccagctag 3000
tcactgagcg ataaaattga cccgccctct aaggtagcga gtacgtccca aagggctccg 3060
gacagggcta tataggagag tttgatctcg ccccgacaac tgcaaccctc aactccctta 3120
gataatattg ttagccgaag ttgcacgacc cgccgtccac ggactgctct tagggtgtgg 3180
ctccttaatc tgacaacgtg caacccctat cgagggcgat tgtttctgcg aaaggtgttg 3240
tcctaatagt cgcgacattt ggcccttgta ggtgtgaaac cacttagctt cgcgccgtag 3300
tcctaaaggc ccacctattg actttgtttc gggtagcact aggaatctta acaatttgaa 3360
tttggacgtg gaacgcgtac accttgatct tcgaataatt ctagggattt ggaagtcctc 3420
tacgttgaca cacctacaat gctccaagta aatatacgaa taacgcgggc ctcgcggagc 3480
cgttccgaat cgtcacgtgt tcgtttactg ttaattggtg gcaaataagc aatatcgtag 3540
tccgtcaggc ccagccctgt tatccacggc gttatttgtc aaattgcgta gaactggatt 3600
gactgcctga caatacctaa ttatcggtac gaagtccccg aatctgtccg gctatttcac 3660
taatactttc caaacgcccc gtatccaaga agaacgaatt tatccacgct cccgtctttg 3720
ggacgaatac cgctacaagt ggacagagga tcggtacggg cctctaataa atccaacact 3780
ctacgccctc ttcaagagct agaagaacag ggtgcagttg gaaagggaat tatttcgtaa 3840
ggcgagccaa taccgtaatt aattcggaag agttaacacg attggaagta ggaatagttt 3900
ctaaccacgg ttactaatcc taataacgga acgctgtctg atagattagt gtcagcgctc 3960
actaccaaag aaaaataaaa agacgctgaa aagcgtcttt ttatttttcg gtccagtgta 4020
actcaggcaa aagcacgtaa tattcgtact caccaaacga aactcatccg gcgcatcgcg 4080
cttcttcctc cgtaagcgtc acccccatta cttaaagagt gcatgtgcat attttgttat 4140
caataaaaaa ggccgcgatt tgcggcctta ttgttcgtct tgccggatta gatagctacc 4200
ggtgctttaa tacccggatg cggatcatag ccttcgattt cgaagtcctc aaaacgataa 4260
tcgaagatgc tttccggttt gcgtttgata atcagtttcg ggagcgggcg tggctcacgg 4320
cttaattgta aatgcgtctg atccatgtga tttgagtaca ggtgagtatc cccaccagtc 4380
caaacaaagt caccaacttc cagatcacac tgctgtgcca tcatatgaac taataaggcg 4440
taggaggcaa tgttaaacgg taagcccaga aacacgtcgc aagaacgctg gtacagttgg 4500
cacgataact taccatccgc aacatagaat tgaaagaagg catgacacgg tgctaaagcc 4560
attttgtcta attcccccac gttccatgcg gacacgataa tccggcgaga gtccggatca 4620
tttttcagtt ggttaagaac ggtagtgatc tgatcaatat gccgaccatc cggcgtaggc 4680
catgcacgcc attgcttacc atacactggc cctaagtcac cgttttcatc tgcccactca 4740
tcccagatgg taacgttatt ctcgtgcagg tacgcaatgt tcgtatcgcc ttgcagaaac 4800
cataataact cgtgaataat agaacggagg tggcaacgct tggtagtgac cagcgggaaa 4860
ccgtcttgca ggttgaaacg catctgatga ccaaagatag acagcgtacc agtgccagta 4920
cgatcattct tctgagtgcc ttcgtccagc actttttgca tcagttccag atactgtttc 4980
attttagctt ccttagcttg cgaaatctcg ataactcaaa aaatagtagt gatcttattt 5040
cattatggtg aaagttgtct tacgtgcaac attttcgcaa aaagttggcg ctttatcaac 5100
actgtccgaa tgacaaatgg ttacaattat tgaacaccct tcggggtgtt tttttgtttc 5160
tggtttcccg aggccgaact tttgttgcaa tggctgtcta ccctgtctac ctgagtaaag 5220
aaaaatacat ttaattcagt atattaactt gggtagacag ccttttttta ctgtctacct 5280
tctgtctacc ctctctacct gattttacct gaatcagaca gggaggtaga cacggggtag 5340
acagtggata aaagcactct accccactga aagcagtgcc attactggca tggttgccag 5400
taaggttgat aaggtagaca aggggaggga caactcaaaa ctttttaaac gagggggtaa 5460
aacgcagatc aaaacgatct caagaagatc atcttattaa tcagataaaa tatttctaga 5520
tttcagtgca atttatctct tcaaatgtag caccggcgcg ccgtgaccaa ttattgaagg 5580
ccgctaacgc ggcctttttt tgtttctggt ttcccgaata gagcgacttc tccccaaaaa 5640
gcctcgcttt cagcacctgt cgtttccttt cttttcagag ggtattttaa ataaaaacat 5700
taagttatga cgaagaagaa cggaaacgcc ttaaaccgga aaattttcat aaatagcgaa 5760
aacccgcgag gtcgccgccc cgtaacctgt cggatcaccg gaaagaacct gtaaagtgat 5820
aatgattatc atctacatat cacaacgtgc gtaaagggta agtatgaagg tcgtgtactc 5880
catcgctacc aaattccaga aaacagacgc tttcgagcgt cttttttcgt tttggtcacg 5940
acgtacggtg gaagattcgt taccaattga cagctagctc agtcctaggt atatacatac 6000
atgcttgttt gtttgtaaac tactgttttc attaaagagg agaaaggaag ccatgtccat 6060
ctatcaggag tttgttaaca agtattccct gtctaaaacc ctgcgttttg aactgatccc 6120
gcagggcaaa actttggaaa acattaaagc gcgtggcctg attctggatg acgaaaaacg 6180
tgcaaaggat tacaagaaag ctaaacagat catcgacaaa tatcaccagt tctttatcga 6240
agaaattctg tcctcggtgt gcatcagtga ggatctgtta cagaattatt ctgatgtata 6300
ctttaaactt aaaaagtccg atgacgataa tctgcaaaaa gatttcaagt cagccaaaga 6360
taccatcaag aaacagatct cagaatatat taaagatagc gaaaagttca aaaacctgtt 6420
taaccaaaac ctcattgatg ctaagaaagg ccaagaatct gacctgatct tatggctgaa 6480
acagagcaaa gataacggca ttgaactgtt caaagctaat agcgacatca ccgatattga 6540
tgaagcgctc gaaatcatca agtctttcaa aggctggacg acgtatttca aaggttttca 6600
tgaaaaccgt aagaatgtat attcgagcaa cgatattccg acctctatta tttatcgtat 6660
cgtggacgac aacctgccga agtttctgga aaacaaagcg aaatatgaat ctctgaaaga 6720
caaagcaccg gaagctatta actatgaaca gatcaagaaa gatctggcgg aagaactgac 6780
cttcgacatc gactataaaa cctccgaagt taaccagcgt gttttctcac tggacgaggt 6840
tttcgaaatc gctaatttca acaattacct gaatcaatct ggcatcacca aattcaacac 6900
cattattggt ggcaaatttg ttaacggcga aaacaccaag cgtaagggca tcaacgaata 6960
cattaacctc tatagccaac aaatcaacga caaaaccctg aaaaagtata aaatgtccgt 7020
tctgtttaaa cagattttat cggacaccga atctaaatcc ttcgtaattg ataaactgga 7080
agatgatagc gacgttgtca ccacgatgca gagcttttat gagcagattg cggcgttcaa 7140
aaccgtcgaa gagaaatcta ttaaagaaac tctgtccctg ctctttgacg acctcaaagc 7200
gcagaaacta gatctgtcta agatttactt taaaaacgac aaatctctga ccgatctcag 7260
tcaacaagtt ttcgatgact atagcgtgat cggcacggca gttttggaat acatcaccca 7320
acaaatcgcg ccgaaaaatc tggacaaccc gtccaagaag gaacaggaac tgattgcaaa 7380
gaaaacagaa aaagctaaat acctgagctt agaaactatc aaactggcac ttgaggaatt 7440
taataaacat cgtgatattg ataaacagtg tcgttttgag gaaattctgg cgaactttgc 7500
ggcaatcccg atgatcttcg acgaaattgc tcaaaacaaa gacaatctgg cgcagatctc 7560
tatcaagtac cagaatcagg gtaagaaaga tctgcttcaa gcatctgcgg aggacgatgt 7620
caaagcaatt aaagacttat tagatcagac gaataactta ttacacaagc tcaaaatctt 7680
ccacatcagc cagagcgagg acaaggcgaa cattctggat aaagatgaac acttctatct 7740
ggtgttcgaa gaatgttact tcgaactggc aaacatcgta cctctctaca ataaaatccg 7800
caactacatc acgcagaagc cttacagtga cgagaaattc aaactgaact tcgaaaacag 7860
cacgctggcg aacggctggg ataagaacaa agagccggac aacaccgcaa tcctgttcat 7920
caaagacgac aaatactatc tgggcgtaat gaacaagaag aacaacaaga tcttcgacga 7980
taaagcgatc aaagaaaaca agggtgaagg ctataagaaa atcgtgtaca agctcctgcc 8040
gggtgcgaac aaaatgttac cgaaagtgtt cttttccgcg aaaagcatca aattctacaa 8100
cccgtctgag gatattctgc gcatccgcaa tcatagcacg cacactaaaa acggtagccc 8160
gcagaaaggg tatgaaaaat tcgaatttaa tatagaggac tgccgtaaat tcatcgactt 8220
ctataaacag agcatttcca aacatccgga atggaaagac ttcggcttcc gtttctctga 8280
cactcagcgc tataatagca tcgacgagtt ctaccgcgaa gtggagaatc agggctataa 8340
actgaccttc gagaacatta gtgagtcgta catcgactcc gttgtgaatc agggtaaact 8400
gtacctgttt cagatctata ataaagactt tagcgcgtac agcaaaggcc gcccgaatct 8460
gcacaccctt tactggaaag cattatttga cgaacgtaac ctgcaagatg tggtgtataa 8520
actgaacggt gaggcggaac ttttctaccg taaacagagt atcccgaaga aaatcacgca 8580
tccggcaaaa gaagctattg ccaacaaaaa caaagacaac ccgaagaaag aaagtgtatt 8640
cgaatatgac ctgatcaaag ataaacgttt caccgaagat aagttctttt tccactgtcc 8700
gattaccatc aacttcaaat ctagcggtgc gaacaagttc aacgatgaaa ttaacttatt 8760
actgaaagag aaagctaatg acgtacacat cttatctatt gatcgcggtg aacgtcattt 8820
agcatactat acactggtag acggtaaagg taatattatt aaacaggata ctttcaatat 8880
tatcggtaat gaccgtatga aaaccaacta tcacgataag ctggcggcga tcgaaaaaga 8940
tcgtgattct gcgcgtaaag attggaagaa aattaacaat atcaaagaaa tgaaagaagg 9000
ctatctgagc caagtggtgc acgagatcgc aaaactggtg attgaatata acgctatcgt 9060
ggttttcgaa gatctgaact ttggttttaa acgtggtcgc ttcaaagtag aaaaacaggt 9120
gtaccaaaaa ctggaaaaaa tgctgattga aaaactgaac tatctggttt ttaaagacaa 9180
cgaatttgac aaaacgggtg gcgtactccg tgcctatcag cttaccgctc cgttcgaaac 9240
gtttaagaaa atgggtaaac aaacggggat tatctattat gtgccagccg gtttcacctc 9300
caagatttgt ccagttacgg gcttcgttaa ccagctttac ccgaaatacg agagcgttag 9360
caaatctcaa gaatttttca gcaaattcga caagatctgc tataatctgg ataaaggcta 9420
tttcgagttc agctttgatt acaaaaactt cggcgataaa gcggctaaag gtaagtggac 9480
tattgctagc tttggtagcc gtctgattaa ctttcgcaac tccgacaaaa accataattg 9540
ggacacgcgt gaagtgtatc cgaccaaaga actggaaaaa ttactgaaag actattccat 9600
cgaatatggt catggggagt gcattaaagc ggcgatttgc ggtgaatccg ataagaaatt 9660
tttcgccaaa ctgaccagcg tgcttaacac cattctccaa atgcgtaatt ctaaaacggg 9720
tacggagctt gactacctga tttctccggt agccgacgtt aacggcaact tcttcgattc 9780
tcgtcaagca ccgaaaaata tgccacaaga cgcggatgcc aacggtgcat accatatcgg 9840
ccttaaaggc ttaatgttat taggccgtat caagaataat caggagggca agaaattaaa 9900
tctggttatc aaaaacgaag aatacttcga gttcgttcag aatcgtaaca attaatgtat 9960
gcttaagcag atcggtaata aagacgaaca ataagacgct gaaaagcgtc ttttttcgtt 10020
ttggtcctgt tccggcgcga tagtgtgaac atgctataga cttctggtgc tacccgactg 10080
acaattaatc atccggctcg tataatgcta gcaatttcta ctgttgtaga tcattccgga 10140
acgttccagc gctgcaattt ctactgttgt agatctgatt tttcacatgt tacctttcaa 10200
tttctactgt tgtagatccg aaaacgtaaa gcttcagctg taatttctac tgttgtagat 10260
atcatatctg gcgttaatgg agtttcgtga cgaacaataa gtcctcccta acggggggca 10320
atttttattg ataacaaaag taacttcgag cttgtctacc tcctagctcg taaattgcac 10380
gctgatagtc tcccaattgc gaaggaccaa aacgaaaaaa caccctttcg ggtgtctttt 10440
ctggaatttg gtacgcagta ctaggtatcg tgtaagtagc gaaggcccgt acgcgagata 10500
aactgctagg caaccgcgac tctacgactg gtgctcgatt taatttcgct gacgtaaaga 10560
aattatcggc agtgcgtcaa ctgccgtatc tttatcttaa ttaggtagtt ggacaagccc 10620
ttgaaagaaa tagcaagagc ctgcctctct attgaagtca cggcgaaagt cgggtagaaa 10680
tcaaagaaag cagaaattaa atcggagtaa tactaagttg ggataactcc gtaactgact 10740
acgcctttct ctagacttta cttgaccaga tacactgtct ttgacacgtt gaaggattag 10800
agcaatcaaa tccaagactg gctaagcacg aagcaactct tgagtgttaa aaagttactt 10860
cctgtattcg ggacgagggt actagaagat tgcagggact ccgacgttaa gtaaattaca 10920
aagtaataag tatcgttcag gatcacgtta ccgcaataag aagcgagaat aatataattt 10980
ccgaagtgct taccccagta gtgactattc ctataaccct tctgagtgtc cggaggcgga 11040
aatttgccac gaaagagaaa gtatttcccc gacaataata aaggggcgct cctcagcttt 11100
tccacttggt tgggtaagct aggcaactct gaaaggagtt tcggcgaagt gaagccgaca 11160
cctttgaatt gttttagggg cgttattcga gggcaatcgg agctaacttc aagactactt 11220
ctttgttgaa tactaaatag tgcaaaggtc gtgtttcctc aaggatactc cgctaacaat 11280
ataggattcc aatcagattc agcactggcg gtacgggtgt tgcggtgagg cgttcgggtt 11340
tacggctcga agctagcacg gtaggaagcc tgacaatcac caagcaaaag ggccgtcgaa 11400
ggcccacaag atacgaaagc tctcgaagcc ttatccttga ccgatccacc tatttaggca 11460
gttacgcaca aaagctaccc aataatccgt gacaggcaca atatcacgga acaaaaccga 11520
aaactctcgt acacggttag gttttcgcta ggaagaataa acctctatct tgattataag 11580
aaggctcccc aagcaccccc aaaaccgaaa tagcg 11615
<210> 34
<211> 63
<212> PRT
<213> 人工序列
<220>
<223> 来自埃希氏菌属噬菌体ZG49的STF蛋白的螺旋束1和接头
<400> 34
Gly Asp Ala Ala Leu Arg Ser Gln Ile Ser Asn Pro Glu Gly Ala Ile
1 5 10 15
Leu Tyr Pro Glu Leu Gln Met Ala Arg Trp Arg Asp Glu Gly Asp Val
20 25 30
Arg Gly Trp Gly Ala Lys Gly Asp Gly Val Thr Asp Ser Thr Glu Asn
35 40 45
Ile Ala Ala Ser Leu Asn Ser Gln Lys Ala Val Val Ala Ser Glu
50 55 60
<210> 35
<211> 189
<212> DNA
<213> 人工序列
<220>
<223> 重新编码的来自埃希氏菌属噬菌体ZG49的STF蛋白的螺旋束1和接头
<400> 35
ggtgacgcag cactgcgctc tcaaatcagc aacccagaag gcgcgattct gtacccggaa 60
ctgcagatgg cgcgctggcg tgatgaaggc gacgttcgtg gttggggtgc caaaggtgat 120
ggtgtaaccg actccactga aaacatcgca gcatccttga actctcagaa agcagttgtt 180
gccagcgaa 189
<210> 36
<211> 62
<212> PRT
<213> 人工序列
<220>
<223> 来自埃希氏菌属噬菌体ZG49的STF蛋白的螺旋束2和接头
<400> 36
Asp Ala Ala Leu Arg Ser Gln Ile Ser Asn Pro Glu Gly Ala Ile Leu
1 5 10 15
Tyr Pro Glu Leu Gln Met Ala Arg Trp Arg Asp Glu Gly Asp Val Arg
20 25 30
Gly Trp Gly Ala Lys Gly Asp Gly Val Thr Asp Ser Thr Glu Asn Ile
35 40 45
Ala Ala Ser Leu Asn Ser Gln Lys Ala Val Val Ala Ser Glu
50 55 60
<210> 37
<211> 186
<212> DNA
<213> 人工序列
<220>
<223> 重新编码的来自埃希氏菌属噬菌体ZG49的STF蛋白的螺旋束2和接头
<400> 37
gacgcagcac tgcgctctca aatcagcaac ccagaaggcg cgattctgta cccggaactg 60
cagatggcgc gctggcgtga tgaaggcgac gttcgtggtt ggggtgccaa aggtgatggt 120
gtaaccgact ccactgaaaa catcgcagca tccttgaact ctcagaaagc agttgttgcc 180
agcgaa 186
<210> 38
<211> 1162
<212> PRT
<213> 人工序列
<220>
<223> K5 9.0
<400> 38
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Val Val Met Asp Glu Thr Asn Arg Lys Ala Pro Leu Asp Ser Pro
385 390 395 400
Ala Leu Thr Gly Thr Pro Thr Ala Pro Thr Ala Leu Arg Gly Thr Asn
405 410 415
Asn Thr Gln Ile Ala Asn Thr Ala Phe Val Leu Ala Ala Ile Ala Asp
420 425 430
Val Ile Asp Ala Ser Pro Asp Ala Leu Asn Thr Leu Asn Glu Leu Ala
435 440 445
Ala Ala Leu Gly Asn Asp Pro Asp Phe Ala Thr Thr Met Thr Asn Ala
450 455 460
Leu Ala Gly Lys Gln Pro Lys Asn Ala Thr Leu Thr Ala Leu Ala Gly
465 470 475 480
Leu Ser Thr Ala Lys Asn Lys Leu Pro Tyr Phe Ala Glu Asn Asp Ala
485 490 495
Ala Ser Leu Thr Glu Leu Thr Gln Val Gly Arg Asp Ile Leu Ala Lys
500 505 510
Asn Ser Val Ala Asp Val Leu Glu Tyr Leu Gly Ala Gly Glu Asn Ser
515 520 525
Gly Asp Ala Ala Leu Arg Ser Gln Ile Ser Asn Pro Glu Gly Ala Ile
530 535 540
Leu Tyr Pro Glu Leu Gln Met Ala Arg Trp Arg Asp Glu Gly Asp Val
545 550 555 560
Arg Gly Trp Gly Ala Lys Gly Asp Gly Val Thr Asp Ser Thr Glu Asn
565 570 575
Ile Ala Ala Ser Leu Asn Ser Gln Lys Ala Val Val Ala Ser Glu Gly
580 585 590
Val Phe Ser Ser Ser Gly Ile Asn Ser Asn Tyr Cys Asn Leu Asp Gly
595 600 605
Arg Gly Ser Gly Val Leu Ser His Arg Ser Ser Thr Gly Asn Tyr Leu
610 615 620
Val Phe Asn Asn Pro Arg Thr Gly Arg Leu Ser Asn Ile Thr Val Glu
625 630 635 640
Ser Asn Lys Ala Thr Asp Thr Thr Gln Gly Gln Gln Val Ser Leu Ala
645 650 655
Gly Gly Ser Asp Val Thr Val Ser Asp Val Asn Phe Ser Asn Val Lys
660 665 670
Gly Thr Gly Phe Ser Leu Ile Ala Tyr Pro Asn Asp Ala Pro Pro Asp
675 680 685
Gly Leu Met Ile Lys Gly Ile Arg Gly Ser Tyr Ser Gly Tyr Ala Thr
690 695 700
Asn Lys Ala Ala Gly Cys Val Leu Ala Asp Ser Ser Val Asn Ser Leu
705 710 715 720
Ile Asp Asn Val Ile Ala Lys Asn Tyr Pro Gln Phe Gly Ala Val Glu
725 730 735
Leu Lys Gly Thr Ala Ser Tyr Asn Ile Val Ser Asn Val Ile Gly Ala
740 745 750
Asp Cys Gln His Val Thr Tyr Asn Gly Thr Glu Gly Pro Ile Ala Pro
755 760 765
Ser Asn Asn Leu Ile Lys Gly Val Met Ala Asn Asn Pro Lys Tyr Ala
770 775 780
Ala Val Val Ala Gly Lys Gly Ser Thr Asn Leu Ile Ser Asp Val Leu
785 790 795 800
Val Asp Tyr Ser Thr Ser Asp Ala Arg Gln Ala His Gly Val Thr Val
805 810 815
Glu Gly Ser Asp Asn Val Ile Asn Asn Val Leu Met Ser Gly Cys Asp
820 825 830
Gly Thr Asn Ser Leu Gly Gln Arg Gln Thr Ala Thr Ile Ala Arg Phe
835 840 845
Ile Gly Thr Ala Asn Asn Asn Tyr Ala Ser Val Phe Pro Ser Tyr Ser
850 855 860
Ala Thr Gly Val Ile Thr Phe Glu Ser Gly Ser Thr Arg Asn Phe Val
865 870 875 880
Glu Val Lys His Pro Gly Arg Arg Asn Asp Leu Leu Ser Ser Ala Ser
885 890 895
Thr Ile Asp Gly Ala Ala Thr Ile Asp Gly Thr Ser Asn Ser Asn Val
900 905 910
Val His Ala Pro Ala Leu Gly Gln Tyr Ile Gly Ser Met Ser Gly Arg
915 920 925
Phe Glu Trp Arg Ile Lys Ser Met Ser Leu Pro Ser Gly Val Leu Thr
930 935 940
Ser Ala Asp Lys Tyr Arg Met Leu Gly Asp Gly Ala Val Ser Leu Ala
945 950 955 960
Val Gly Gly Gly Thr Ser Ser Gln Val Arg Leu Phe Thr Ser Asp Gly
965 970 975
Thr Ser Arg Thr Val Ser Leu Thr Asn Gly Asn Val Arg Leu Ser Thr
980 985 990
Ser Ser Thr Gly Tyr Leu Gln Leu Gly Ala Asp Ala Met Thr Pro Asp
995 1000 1005
Ser Thr Gly Thr Tyr Ala Leu Gly Ser Ala Ser Arg Ala Trp Ser
1010 1015 1020
Gly Gly Phe Thr Gln Ala Ala Phe Thr Val Thr Ser Asp Ala Arg
1025 1030 1035
Cys Lys Thr Glu Pro Leu Thr Ile Ser Asp Ala Leu Leu Asp Ala
1040 1045 1050
Trp Ser Glu Val Asp Phe Val Gln Phe Gln Tyr Leu Asp Arg Val
1055 1060 1065
Glu Glu Lys Gly Ala Asp Ser Ala Arg Trp His Phe Gly Ile Ile
1070 1075 1080
Ala Gln Arg Ala Lys Glu Ala Phe Glu Arg His Gly Ile Asp Ala
1085 1090 1095
His Arg Tyr Gly Phe Leu Cys Phe Asp Ser Trp Asp Asp Val Tyr
1100 1105 1110
Glu Glu Asp Ala Asn Gly Ser Arg Lys Leu Ile Thr Pro Ala Gly
1115 1120 1125
Ser Arg Tyr Gly Ile Arg Tyr Glu Glu Val Leu Ile Leu Glu Ala
1130 1135 1140
Ala Leu Met Arg Arg Thr Ile Lys Arg Met Gln Glu Ala Leu Ala
1145 1150 1155
Ala Leu Pro Lys
1160
<210> 39
<211> 3486
<212> DNA
<213> 人工序列
<220>
<223> K5 9.0
<400> 39
atggcagtaa agatttcagg agtcctgaaa gacggcacag gaaaaccggt acagaactgc 60
accattcagc tgaaagccag acgtaacagc accacggtgg tggtgaacac ggtgggctca 120
gagaatccgg atgaagccgg gcgttacagc atggatgtgg agtacggtca gtacagtgtc 180
atcctgcagg ttgacggttt tccaccatcg cacgccggga ccatcaccgt gtatgaagat 240
tcacaaccgg ggacgctgaa tgattttctc tgtgccatga cggaggatga tgcccggccg 300
gaggtgctgc gtcgtcttga actgatggtg gaagaggtgg cgcgtaacgc gtccgtggtg 360
gcacagagta cggcagacgc gaagaaatca gccggcgatg ccagtgcatc agctgctcag 420
gtcgcggccc ttgtgactga tgcaactgac tcagcacgcg ccgccagcac gtccgccgga 480
caggctgcat cgtcagctca ggaagcgtcc tccggcgcag aagcggcatc agcaaaggcc 540
actgaagcgg aaaaaagtgc cgcagccgca gagtcctcaa aaaacgcggc ggccaccagt 600
gccggtgcgg cgaaaacgtc agaaacgaat gctgcagcgt cacaacaatc agccgccacg 660
tctgcctcca ccgcggccac gaaagcgtca gaggccgcca cttcagcacg agatgcggtg 720
gcctcaaaag aggcagcaaa atcatcagaa acgaacgcat catcaagtgc cggtcgtgca 780
gcttcctcgg caacggcggc agaaaattct gccagggcgg caaaaacgtc cgagacgaat 840
gccaggtcat ctgaaacagc agcggaacgg agcgcctctg ccgcggcaga cgcaaaaaca 900
gcggcggcgg ggagtgcgtc aacggcatcc acgaaggcga cagaggctgc gggaagtgcg 960
gtatcagcat cgcagagcaa aagtgcggca gaagcggcgg caatacgtgc aaaaaattcg 1020
gcaaaacgtg cagaagatat agcttcagct gtcgcgcttg aggatgcgga cacaacgaga 1080
aaggggatag tgcagctcag cagtgcaacc aacagcacgt ctgaaacgct tgctgcaacg 1140
ccaaaggcgg ttaaggtggt aatggatgag actaatcgta aggcacctct ggacagtccg 1200
gcactgaccg gaacgccaac agcaccaacc gcgctcaggg gaacaaacaa tacccagatt 1260
gcgaacaccg cttttgtact ggccgcgatt gcagatgtta tcgacgcgtc acctgacgca 1320
ctgaatacgc tgaatgaact ggccgcagcg ctcgggaatg atccagattt tgctaccacc 1380
atgactaacg cgcttgcggg taaacaaccg aagaatgcga cactgacggc gctggcaggg 1440
ctttccacgg cgaaaaataa attaccgtat tttgcggaaa atgatgccgc cagcctgact 1500
gaactgactc aggttggcag ggatattctg gcaaaaaatt ccgttgcaga tgttcttgaa 1560
taccttgggg ccggtgagaa ttcgggtgac gcagcactgc gctctcaaat cagcaaccca 1620
gaaggcgcga ttctgtaccc ggaactgcag atggcgcgct ggcgtgatga aggcgacgtt 1680
cgtggttggg gtgccaaagg tgatggtgta accgactcca ctgaaaacat cgcagcatcc 1740
ttgaactctc agaaagcagt tgttgccagc gaaggcgttt tcagttcttc tggcatcaac 1800
tccaactact gtaacctgga tggtcgcgga tccggtgtgc tcagccaccg tagctctact 1860
ggtaattacc tggtgtttaa caatccgcgt actggtcgtc tgagcaatat cactgttgaa 1920
tctaacaaag cgaccgatac cactcagggc caacaggtgt ccctggcagg tggcagtgac 1980
gtgaccgtgt cagatgtcaa cttctccaac gtgaaaggca ctggttttag cctgattgcc 2040
tacccaaacg atgctccgcc ggatggcctg atgatcaaag gcattcgcgg atcttacagc 2100
ggttacgcga ccaacaaagc agctggttgc gtcctggcgg atagctccgt taacagcctg 2160
atcgacaatg tgatcgctaa gaattacccg caattcggtg ctgttgaatt aaagggcact 2220
gcaagctaca acattgtatc gaacgttatc ggtgcggatt gtcagcacgt gacttacaac 2280
ggcactgagg gaccgatcgc tcctagtaac aatctgatca agggcgttat ggcgaacaac 2340
ccgaaatacg cggcagttgt ggcgggtaaa ggctcgacga atctgatctc tgatgtactg 2400
gtagactatt ctaccagcga tgctcgtcag gcgcatggtg ttaccgtcga aggatctgat 2460
aacgtgatta acaacgtact gatgtccggt tgcgacggaa ctaattccct gggtcagcgt 2520
caaaccgcaa ctatcgcgcg tttcatcggt actgcaaata acaactatgc tagcgtgttc 2580
ccatcctatt ctgccactgg tgtgatcacg tttgagtctg gcagtacccg taacttcgtc 2640
gaggttaagc atccgggccg tcgcaacgat cttctgtcat cggcaagcac gattgacggc 2700
gctgcgacca tcgacgggac ttctaactct aacgtagtac acgcgcctgc tctgggccaa 2760
tacattggct ccatgagtgg tcgctttgaa tggcgtatta agtcaatgag cctgccgtcc 2820
ggcgtactca ctagcgcgga taaataccgt atgctgggtg acggtgctgt tagccttgct 2880
gttggcggag gaactagcag tcaggtgcgc ttgttcacct cagacggtac ttctcgcact 2940
gtttctctga ccaatggtaa cgtgcgcctg agcacgtcct ctactggcta tttacagctg 3000
ggtgcagacg caatgactcc ggactccact ggtacttacg cgttaggctc cgcatctcgt 3060
gcttggagtg gcggattcac tcaggcagca ttcaccgtta cttctgacgc acgttgcaaa 3120
actgagcctt taaccatctc tgacgcttta ctggatgctt ggagtgaagt ggactttgtc 3180
cagttccagt atctggatcg tgttgaagag aaaggtgctg actccgcgcg ttggcatttc 3240
ggaatcatcg cccagcgtgc taaagaggca ttcgaacgtc acggcatcga tgcgcatcgt 3300
tacggtttct tatgctttga ctcttgggac gatgtgtacg aagaggatgc aaatggatct 3360
cgcaaactga tcactccggc gggtagtcgc tatggtattc gctatgagga agttctgatc 3420
ctcgaagcag cgctgatgcg tcgcacgatc aagcgcatgc aggaagcact ggctgcgtta 3480
ccgaag 3486
<210> 40
<211> 1161
<212> PRT
<213> 人工序列
<220>
<223> K5 9.1
<400> 40
Met Ala Val Lys Ile Ser Gly Val Leu Lys Asp Gly Thr Gly Lys Pro
1 5 10 15
Val Gln Asn Cys Thr Ile Gln Leu Lys Ala Arg Arg Asn Ser Thr Thr
20 25 30
Val Val Val Asn Thr Val Gly Ser Glu Asn Pro Asp Glu Ala Gly Arg
35 40 45
Tyr Ser Met Asp Val Glu Tyr Gly Gln Tyr Ser Val Ile Leu Gln Val
50 55 60
Asp Gly Phe Pro Pro Ser His Ala Gly Thr Ile Thr Val Tyr Glu Asp
65 70 75 80
Ser Gln Pro Gly Thr Leu Asn Asp Phe Leu Cys Ala Met Thr Glu Asp
85 90 95
Asp Ala Arg Pro Glu Val Leu Arg Arg Leu Glu Leu Met Val Glu Glu
100 105 110
Val Ala Arg Asn Ala Ser Val Val Ala Gln Ser Thr Ala Asp Ala Lys
115 120 125
Lys Ser Ala Gly Asp Ala Ser Ala Ser Ala Ala Gln Val Ala Ala Leu
130 135 140
Val Thr Asp Ala Thr Asp Ser Ala Arg Ala Ala Ser Thr Ser Ala Gly
145 150 155 160
Gln Ala Ala Ser Ser Ala Gln Glu Ala Ser Ser Gly Ala Glu Ala Ala
165 170 175
Ser Ala Lys Ala Thr Glu Ala Glu Lys Ser Ala Ala Ala Ala Glu Ser
180 185 190
Ser Lys Asn Ala Ala Ala Thr Ser Ala Gly Ala Ala Lys Thr Ser Glu
195 200 205
Thr Asn Ala Ala Ala Ser Gln Gln Ser Ala Ala Thr Ser Ala Ser Thr
210 215 220
Ala Ala Thr Lys Ala Ser Glu Ala Ala Thr Ser Ala Arg Asp Ala Val
225 230 235 240
Ala Ser Lys Glu Ala Ala Lys Ser Ser Glu Thr Asn Ala Ser Ser Ser
245 250 255
Ala Gly Arg Ala Ala Ser Ser Ala Thr Ala Ala Glu Asn Ser Ala Arg
260 265 270
Ala Ala Lys Thr Ser Glu Thr Asn Ala Arg Ser Ser Glu Thr Ala Ala
275 280 285
Glu Arg Ser Ala Ser Ala Ala Ala Asp Ala Lys Thr Ala Ala Ala Gly
290 295 300
Ser Ala Ser Thr Ala Ser Thr Lys Ala Thr Glu Ala Ala Gly Ser Ala
305 310 315 320
Val Ser Ala Ser Gln Ser Lys Ser Ala Ala Glu Ala Ala Ala Ile Arg
325 330 335
Ala Lys Asn Ser Ala Lys Arg Ala Glu Asp Ile Ala Ser Ala Val Ala
340 345 350
Leu Glu Asp Ala Asp Thr Thr Arg Lys Gly Ile Val Gln Leu Ser Ser
355 360 365
Ala Thr Asn Ser Thr Ser Glu Thr Leu Ala Ala Thr Pro Lys Ala Val
370 375 380
Lys Val Val Met Asp Glu Thr Asn Arg Lys Ala Pro Leu Asp Ser Pro
385 390 395 400
Ala Leu Thr Gly Thr Pro Thr Ala Pro Thr Ala Leu Arg Gly Thr Asn
405 410 415
Asn Thr Gln Ile Ala Asn Thr Ala Phe Val Leu Ala Ala Ile Ala Asp
420 425 430
Val Ile Asp Ala Ser Pro Asp Ala Leu Asn Thr Leu Asn Glu Leu Ala
435 440 445
Ala Ala Leu Gly Asn Asp Pro Asp Phe Ala Thr Thr Met Thr Asn Ala
450 455 460
Leu Ala Gly Lys Gln Pro Lys Asn Ala Thr Leu Thr Ala Leu Ala Gly
465 470 475 480
Leu Ser Thr Ala Lys Asn Lys Leu Pro Tyr Phe Ala Glu Asn Asp Ala
485 490 495
Ala Ser Leu Thr Glu Leu Thr Gln Val Gly Arg Asp Ile Leu Ala Lys
500 505 510
Asn Ser Val Ala Asp Val Leu Glu Tyr Leu Gly Ala Gly Glu Asn Ser
515 520 525
Asp Ala Ala Leu Arg Ser Gln Ile Ser Asn Pro Glu Gly Ala Ile Leu
530 535 540
Tyr Pro Glu Leu Gln Met Ala Arg Trp Arg Asp Glu Gly Asp Val Arg
545 550 555 560
Gly Trp Gly Ala Lys Gly Asp Gly Val Thr Asp Ser Thr Glu Asn Ile
565 570 575
Ala Ala Ser Leu Asn Ser Gln Lys Ala Val Val Ala Ser Glu Gly Val
580 585 590
Phe Ser Ser Ser Gly Ile Asn Ser Asn Tyr Cys Asn Leu Asp Gly Arg
595 600 605
Gly Ser Gly Val Leu Ser His Arg Ser Ser Thr Gly Asn Tyr Leu Val
610 615 620
Phe Asn Asn Pro Arg Thr Gly Arg Leu Ser Asn Ile Thr Val Glu Ser
625 630 635 640
Asn Lys Ala Thr Asp Thr Thr Gln Gly Gln Gln Val Ser Leu Ala Gly
645 650 655
Gly Ser Asp Val Thr Val Ser Asp Val Asn Phe Ser Asn Val Lys Gly
660 665 670
Thr Gly Phe Ser Leu Ile Ala Tyr Pro Asn Asp Ala Pro Pro Asp Gly
675 680 685
Leu Met Ile Lys Gly Ile Arg Gly Ser Tyr Ser Gly Tyr Ala Thr Asn
690 695 700
Lys Ala Ala Gly Cys Val Leu Ala Asp Ser Ser Val Asn Ser Leu Ile
705 710 715 720
Asp Asn Val Ile Ala Lys Asn Tyr Pro Gln Phe Gly Ala Val Glu Leu
725 730 735
Lys Gly Thr Ala Ser Tyr Asn Ile Val Ser Asn Val Ile Gly Ala Asp
740 745 750
Cys Gln His Val Thr Tyr Asn Gly Thr Glu Gly Pro Ile Ala Pro Ser
755 760 765
Asn Asn Leu Ile Lys Gly Val Met Ala Asn Asn Pro Lys Tyr Ala Ala
770 775 780
Val Val Ala Gly Lys Gly Ser Thr Asn Leu Ile Ser Asp Val Leu Val
785 790 795 800
Asp Tyr Ser Thr Ser Asp Ala Arg Gln Ala His Gly Val Thr Val Glu
805 810 815
Gly Ser Asp Asn Val Ile Asn Asn Val Leu Met Ser Gly Cys Asp Gly
820 825 830
Thr Asn Ser Leu Gly Gln Arg Gln Thr Ala Thr Ile Ala Arg Phe Ile
835 840 845
Gly Thr Ala Asn Asn Asn Tyr Ala Ser Val Phe Pro Ser Tyr Ser Ala
850 855 860
Thr Gly Val Ile Thr Phe Glu Ser Gly Ser Thr Arg Asn Phe Val Glu
865 870 875 880
Val Lys His Pro Gly Arg Arg Asn Asp Leu Leu Ser Ser Ala Ser Thr
885 890 895
Ile Asp Gly Ala Ala Thr Ile Asp Gly Thr Ser Asn Ser Asn Val Val
900 905 910
His Ala Pro Ala Leu Gly Gln Tyr Ile Gly Ser Met Ser Gly Arg Phe
915 920 925
Glu Trp Arg Ile Lys Ser Met Ser Leu Pro Ser Gly Val Leu Thr Ser
930 935 940
Ala Asp Lys Tyr Arg Met Leu Gly Asp Gly Ala Val Ser Leu Ala Val
945 950 955 960
Gly Gly Gly Thr Ser Ser Gln Val Arg Leu Phe Thr Ser Asp Gly Thr
965 970 975
Ser Arg Thr Val Ser Leu Thr Asn Gly Asn Val Arg Leu Ser Thr Ser
980 985 990
Ser Thr Gly Tyr Leu Gln Leu Gly Ala Asp Ala Met Thr Pro Asp Ser
995 1000 1005
Thr Gly Thr Tyr Ala Leu Gly Ser Ala Ser Arg Ala Trp Ser Gly
1010 1015 1020
Gly Phe Thr Gln Ala Ala Phe Thr Val Thr Ser Asp Ala Arg Cys
1025 1030 1035
Lys Thr Glu Pro Leu Thr Ile Ser Asp Ala Leu Leu Asp Ala Trp
1040 1045 1050
Ser Glu Val Asp Phe Val Gln Phe Gln Tyr Leu Asp Arg Val Glu
1055 1060 1065
Glu Lys Gly Ala Asp Ser Ala Arg Trp His Phe Gly Ile Ile Ala
1070 1075 1080
Gln Arg Ala Lys Glu Ala Phe Glu Arg His Gly Ile Asp Ala His
1085 1090 1095
Arg Tyr Gly Phe Leu Cys Phe Asp Ser Trp Asp Asp Val Tyr Glu
1100 1105 1110
Glu Asp Ala Asn Gly Ser Arg Lys Leu Ile Thr Pro Ala Gly Ser
1115 1120 1125
Arg Tyr Gly Ile Arg Tyr Glu Glu Val Leu Ile Leu Glu Ala Ala
1130 1135 1140
Leu Met Arg Arg Thr Ile Lys Arg Met Gln Glu Ala Leu Ala Ala
1145 1150 1155
Leu Pro Lys
1160
<210> 41
<211> 3483
<212> DNA
<213> 人工序列
<220>
<223> K5 9.1
<400> 41
atggcagtaa agatttcagg agtcctgaaa gacggcacag gaaaaccggt acagaactgc 60
accattcagc tgaaagccag acgtaacagc accacggtgg tggtgaacac ggtgggctca 120
gagaatccgg atgaagccgg gcgttacagc atggatgtgg agtacggtca gtacagtgtc 180
atcctgcagg ttgacggttt tccaccatcg cacgccggga ccatcaccgt gtatgaagat 240
tcacaaccgg ggacgctgaa tgattttctc tgtgccatga cggaggatga tgcccggccg 300
gaggtgctgc gtcgtcttga actgatggtg gaagaggtgg cgcgtaacgc gtccgtggtg 360
gcacagagta cggcagacgc gaagaaatca gccggcgatg ccagtgcatc agctgctcag 420
gtcgcggccc ttgtgactga tgcaactgac tcagcacgcg ccgccagcac gtccgccgga 480
caggctgcat cgtcagctca ggaagcgtcc tccggcgcag aagcggcatc agcaaaggcc 540
actgaagcgg aaaaaagtgc cgcagccgca gagtcctcaa aaaacgcggc ggccaccagt 600
gccggtgcgg cgaaaacgtc agaaacgaat gctgcagcgt cacaacaatc agccgccacg 660
tctgcctcca ccgcggccac gaaagcgtca gaggccgcca cttcagcacg agatgcggtg 720
gcctcaaaag aggcagcaaa atcatcagaa acgaacgcat catcaagtgc cggtcgtgca 780
gcttcctcgg caacggcggc agaaaattct gccagggcgg caaaaacgtc cgagacgaat 840
gccaggtcat ctgaaacagc agcggaacgg agcgcctctg ccgcggcaga cgcaaaaaca 900
gcggcggcgg ggagtgcgtc aacggcatcc acgaaggcga cagaggctgc gggaagtgcg 960
gtatcagcat cgcagagcaa aagtgcggca gaagcggcgg caatacgtgc aaaaaattcg 1020
gcaaaacgtg cagaagatat agcttcagct gtcgcgcttg aggatgcgga cacaacgaga 1080
aaggggatag tgcagctcag cagtgcaacc aacagcacgt ctgaaacgct tgctgcaacg 1140
ccaaaggcgg ttaaggtggt aatggatgag actaatcgta aggcacctct ggacagtccg 1200
gcactgaccg gaacgccaac agcaccaacc gcgctcaggg gaacaaacaa tacccagatt 1260
gcgaacaccg cttttgtact ggccgcgatt gcagatgtta tcgacgcgtc acctgacgca 1320
ctgaatacgc tgaatgaact ggccgcagcg ctcgggaatg atccagattt tgctaccacc 1380
atgactaacg cgcttgcggg taaacaaccg aagaatgcga cactgacggc gctggcaggg 1440
ctttccacgg cgaaaaataa attaccgtat tttgcggaaa atgatgccgc cagcctgact 1500
gaactgactc aggttggcag ggatattctg gcaaaaaatt ccgttgcaga tgttcttgaa 1560
taccttgggg ccggtgagaa ttcggacgca gcactgcgct ctcaaatcag caacccagaa 1620
ggcgcgattc tgtacccgga actgcagatg gcgcgctggc gtgatgaagg cgacgttcgt 1680
ggttggggtg ccaaaggtga tggtgtaacc gactccactg aaaacatcgc agcatccttg 1740
aactctcaga aagcagttgt tgccagcgaa ggcgttttca gttcttctgg catcaactcc 1800
aactactgta acctggatgg tcgcggatcc ggtgtgctca gccaccgtag ctctactggt 1860
aattacctgg tgtttaacaa tccgcgtact ggtcgtctga gcaatatcac tgttgaatct 1920
aacaaagcga ccgataccac tcagggccaa caggtgtccc tggcaggtgg cagtgacgtg 1980
accgtgtcag atgtcaactt ctccaacgtg aaaggcactg gttttagcct gattgcctac 2040
ccaaacgatg ctccgccgga tggcctgatg atcaaaggca ttcgcggatc ttacagcggt 2100
tacgcgacca acaaagcagc tggttgcgtc ctggcggata gctccgttaa cagcctgatc 2160
gacaatgtga tcgctaagaa ttacccgcaa ttcggtgctg ttgaattaaa gggcactgca 2220
agctacaaca ttgtatcgaa cgttatcggt gcggattgtc agcacgtgac ttacaacggc 2280
actgagggac cgatcgctcc tagtaacaat ctgatcaagg gcgttatggc gaacaacccg 2340
aaatacgcgg cagttgtggc gggtaaaggc tcgacgaatc tgatctctga tgtactggta 2400
gactattcta ccagcgatgc tcgtcaggcg catggtgtta ccgtcgaagg atctgataac 2460
gtgattaaca acgtactgat gtccggttgc gacggaacta attccctggg tcagcgtcaa 2520
accgcaacta tcgcgcgttt catcggtact gcaaataaca actatgctag cgtgttccca 2580
tcctattctg ccactggtgt gatcacgttt gagtctggca gtacccgtaa cttcgtcgag 2640
gttaagcatc cgggccgtcg caacgatctt ctgtcatcgg caagcacgat tgacggcgct 2700
gcgaccatcg acgggacttc taactctaac gtagtacacg cgcctgctct gggccaatac 2760
attggctcca tgagtggtcg ctttgaatgg cgtattaagt caatgagcct gccgtccggc 2820
gtactcacta gcgcggataa ataccgtatg ctgggtgacg gtgctgttag ccttgctgtt 2880
ggcggaggaa ctagcagtca ggtgcgcttg ttcacctcag acggtacttc tcgcactgtt 2940
tctctgacca atggtaacgt gcgcctgagc acgtcctcta ctggctattt acagctgggt 3000
gcagacgcaa tgactccgga ctccactggt acttacgcgt taggctccgc atctcgtgct 3060
tggagtggcg gattcactca ggcagcattc accgttactt ctgacgcacg ttgcaaaact 3120
gagcctttaa ccatctctga cgctttactg gatgcttgga gtgaagtgga ctttgtccag 3180
ttccagtatc tggatcgtgt tgaagagaaa ggtgctgact ccgcgcgttg gcatttcgga 3240
atcatcgccc agcgtgctaa agaggcattc gaacgtcacg gcatcgatgc gcatcgttac 3300
ggtttcttat gctttgactc ttgggacgat gtgtacgaag aggatgcaaa tggatctcgc 3360
aaactgatca ctccggcggg tagtcgctat ggtattcgct atgaggaagt tctgatcctc 3420
gaagcagcgc tgatgcgtcg cacgatcaag cgcatgcagg aagcactggc tgcgttaccg 3480
aag 3483
<210> 42
<211> 11609
<212> DNA
<213> 人工序列
<220>
<223> 有效载荷p1900质粒
<400> 42
tcccgcgtac ttaattccca ataagaaacg cgcccaagtc ctatcaggca aaattcagcc 60
ccttcccgtg ttagaacgag ggtaaaaata caagccgatt gaacaagggt tgggggcttc 120
aaatcgtcgt ttaccccact ttacaacgga gggtaagtag ttcaccctat agtacgaagc 180
agaactattt cgaggggcgt gcaataatcg aatcttctgc ggttgactta acacgctagg 240
gacgtgccct cgattcagtc gcaggtactc ctactcagac tgcctcacac ccagctagtc 300
actgagcgat aaaattgacc cgccctctaa ggtagcgagt acgtcccaaa gggctccgga 360
cagggctata taggagagtt tgatctcgcc ccgacaactg caaccctcaa ctcccttaga 420
taatattgtt agccgaagtt gcacgacccg ccgtccacgg actgctctta gggtgtggct 480
ccttaatctg acaacgtgca acccctatcg agggcgattg tttctgcgaa aggtgttgtc 540
ctaatagtcg cgacatttgg cccttgtagg tgtgaaacca cttagcttcg cgccgtagtc 600
ctaaaggccc acctattgac tttgtttcgg gtagcactag gaatcttaac aatttgaatt 660
tggacgtgga acgcgtacac cttgatcttc gaataattct agggatttgg aagtcctcta 720
cgttgacaca cctacaatgc tccaagtaaa tatacgaata acgcgggcct cgcggagccg 780
ttccgaatcg tcacgtgttc gtttactgtt aattggtggc aaataagcaa tatcgtagtc 840
cgtcaggccc agccctgtta tccacggcgt tatttgtcaa attgcgtaga actggattga 900
ctgcctgaca atacctaatt atcggtacga agtccccgaa tctgtccggc tatttcacta 960
atactttcca aacgccccgt atccaagaag aacgaattta tccacgctcc cgtctttggg 1020
acgaataccg ctacaagtgg acagaggatc ggtacgggcc tctaataaat ccaacactct 1080
acgccctctt caagagctag aagaacaggg tgcagttgga aagggaatta tttcgtaagg 1140
cgagccaata ccgtaattaa ttcggaagag ttaacacgat tggaagtagg aatagtttct 1200
aaccacggtt actaatccta ataacggaac gctgtctgat agattagtgt cagcgctcac 1260
taccaaagaa aaataaaaag acgctgaaaa gcgtcttttt atttttcggt ccagtgtaac 1320
tcaggcaaaa gcacgtaata ttcgtactca ccaaacgaaa ctcatccggc gcatcgcgct 1380
tcttcctccg taagcgtcac ccccattact taaagagtgc atgtgcatat tttgttatca 1440
ataaaaaagg ccgcgatttg cggccttatt gttcgtcttg ccggattaga tagctaccgg 1500
tgctttaata cccggatgcg gatcatagcc ttcgatttcg aagtcctcaa aacgataatc 1560
gaagatgctt tccggtttgc gtttgataat cagtttcggg agcgggcgtg gctcacggct 1620
taattgtaaa tgcgtctgat ccatgtgatt tgagtacagg tgagtatccc caccagtcca 1680
aacaaagtca ccaacttcca gatcacactg ctgtgccatc atatgaacta ataaggcgta 1740
ggaggcaatg ttaaacggta agcccagaaa cacgtcgcaa gaacgctggt acagttggca 1800
cgataactta ccatccgcaa catagaattg aaagaaggca tgacacggtg ctaaagccat 1860
tttgtctaat tcccccacgt tccatgcgga cacgataatc cggcgagagt ccggatcatt 1920
tttcagttgg ttaagaacgg tagtgatctg atcaatatgc cgaccatccg gcgtaggcca 1980
tgcacgccat tgcttaccat acactggccc taagtcaccg ttttcatctg cccactcatc 2040
ccagatggta acgttattct cgtgcaggta cgcaatgttc gtatcgcctt gcagaaacca 2100
taataactcg tgaataatag aacggaggtg gcaacgcttg gtagtgacca gcgggaaacc 2160
gtcttgcagg ttgaaacgca tctgatgacc aaagatagac agcgtaccag tgccagtacg 2220
atcattcttc tgagtgcctt cgtccagcac tttttgcatc agttccagat actgtttcat 2280
tttagcttcc ttagcttgcg aaatctcgat aactcaaaaa atagtagtga tcttatttca 2340
ttatggtgaa agttgtctta cgtgcaacat tttcgcaaaa agttggcgct ttatcaacac 2400
tgtccgaatg acaaatggtt acaattattg aacacccttc ggggtgtttt tttgtttctg 2460
gtttcccgag gccgaacttt tgttgcaatg gctgtctacc ctgtctacct gagtaaagaa 2520
aaatacattt aattcagtat attaacttgg gtagacagcc tttttttact gtctaccttc 2580
tgtctaccct ctctacctga ttttacctga atcagacagg gaggtagaca cggggtagac 2640
agtggataaa agcactctac cccactgaaa gcagtgccat tactggcatg gttgccagta 2700
aggttgataa ggtagacaag gggagggaca actcaaaact ttttaaacga gggggtaaaa 2760
cgcagatcaa aacgatctca agaagatcat cttattaatc agataaaata tttctagatt 2820
tcagtgcaat ttatctcttc aaatgtagca ccggcgcgcc gtgaccaatt attgaaggcc 2880
gctaacgcgg cctttttttg tttctggttt cccgaataga gcgacttctc cccaaaaagc 2940
ctcgctttca gcacctgtcg tttcctttct tttcagaggg tattttaaat aaaaacatta 3000
agttatgacg aagaagaacg gaaacgcctt aaaccggaaa attttcataa atagcgaaaa 3060
cccgcgaggt cgccgccccg taacctgtcg gatcaccgga aagaacctgt aaagtgataa 3120
tgattatcat ctacatatca caacgtgcgt aaagggtaag tatgaaggtc gtgtactcca 3180
tcgctaccaa attccagaaa acagacgctt tcgagcgtct tttttcgttt tggtcacgac 3240
gtacggtgga agattcgtta ccaattgaca gctagctcag tcctaggtat atacatacat 3300
gcttgtttgt ttgtaaacta ctgttttcat taaagaggag aaaggaagcc atgaccaaaa 3360
cgtttgatag cgagtttttt aacctgtaca gcctgcaaaa aaccgtgcgc tttgaattaa 3420
aaccagtggg cgaaaccgcg agctttgtgg aagattttaa aaacgaaggc ctgaaacgtg 3480
tggttagcga agatgaacgc cgtgcggtgg attatcagaa agtgaaagaa attattgatg 3540
attatcatcg cgattttatt gaagaaagtc tgaactattt tccggaacag gtgagcaaag 3600
atgcgctgga acaggcgttt catctgtatc agaaattaaa ggccgcgaaa gttgaagaaa 3660
gagaaaaagc gctgaaagaa tgggaagcac tgcaaaaaaa actgcgtgaa aaagtggtga 3720
aatgctttag cgatagcaat aaagcgcgtt tctcccgcat tgataaaaag gaactgatta 3780
aagaagatct gattaactgg ctggtcgcgc agaatcgcga agatgatatc ccgaccgtgg 3840
aaacctttaa caactttacc acgtatttta cgggcttcca tgaaaaccgt aaaaacattt 3900
atagcaaaga tgatcatgcg accgcgatta gctttcgcct gattcatgaa aacctgccga 3960
aattttttga taacgtgatt agctttaaca aactgaaaga aggttttccg gaactgaaat 4020
ttgataaagt gaaagaagat ttagaggtgg attatgatct gaaacatgcg tttgagattg 4080
aatattttgt taactttgtg acccaggcgg gcatagatca gtataactat ctgttaggcg 4140
gtaaaaccct ggaagatggc accaaaaagc agggcatgaa tgaacagatt aacctgttta 4200
aacagcaaca aacgcgcgat aaagcgcgtc agattccgaa actgatcccg ctgtttaaac 4260
agattttaag cgaaaggacc gaaagtcaga gctttattcc gaaacagttt gaaagcgatc 4320
aggaattgtt tgatagcttg cagaaattac ataacaactg ccaggataaa tttaccgtgt 4380
tgcaacaagc gattctgggc ctggcggagg cggatctgaa aaaagtgttt attaaaacct 4440
ctgatctgaa cgcgctgtct aacaccattt ttggcaatta tagcgtgttt agcgatgcgc 4500
tgaatctgta taaagaaagt ctgaaaacca aaaaagcgca ggaagcgttt gaaaaactgc 4560
cagcgcatag cattcatgat ctgattcagt atctggaaca gtttaactcc agcttggatg 4620
cggaaaaaca gcaaagcacc gataccgtgc tgaactattt tatcaaaacg gatgaactgt 4680
attctcgctt tattaaaagc accagcgaag cctttaccca ggtgcaaccg ttgtttgaac 4740
tggaagcgct gtccagcaaa cgtcgcccgc cggaaagcga agatgagggc gcgaaaggcc 4800
aggaaggctt cgaacaaatc aaacgtatta aagcgtatct ggataccctg atggaagcgg 4860
tgcactttgc gaaaccgctg tatctggtga aaggtcgtaa aatgatcgaa ggcctcgata 4920
aagatcagag cttttacgaa gcgtttgaaa tggcgtatca ggaattagaa agcttaatca 4980
ttccgatcta taacaaagcg cgtagctatt tgtcgcgcaa accgtttaaa gcggataaat 5040
ttaaaattaa ctttgataac aacaccctgt taagcggttg ggacgcgaac aaagaaaccg 5100
ccaacgcgtc cattctgttt aaaaaagatg gcctgtatta tctgggtatt atgccgaagg 5160
gtaaaacctt tctctttgat tattttgtgt cgagcgaaga tagcgaaaaa ctgaaacagc 5220
gtcgccagaa aaccgccgaa gaagcgctgg cgcaggatgg cgaaagctat tttgaaaaaa 5280
ttcgttataa actgttaccg ggcgcgagca aaatgttacc gaaagtgttt tttagcaaca 5340
aaaacattgg cttttataac ccgagcgacg atattctgcg catccgcaac accgccagcc 5400
ataccaaaaa cggcaccccg cagaaaggcc atagcaaagt ggaatttaac ctgaacgatt 5460
gccataagat gattgatttt tttaaatcca gcattcagaa acatccggaa tggggatctt 5520
ttggctttac ctttagcgat accagcgatt ttgaagatat gagcgcgttt tatcgcgaag 5580
tggaaaatca gggttacgtg attagctttg ataaaatcaa agaaacctat atccagagtc 5640
aggtggaaca gggtaatctg tatctgtttc agatttataa caaagatttt agcccgtata 5700
gcaaaggcaa accaaacctg cacaccctgt attggaaagc gttatttgaa gaagccaacc 5760
tgaataacgt ggtggcgaaa ctgaacggtg aagcggaaat cttttttcgt cgtcatagca 5820
ttaaagcgag cgataaagtg gtgcatccgg caaaccaggc gattgataac aaaaatccgc 5880
ataccgaaaa aacgcagagc acctttgaat atgatctggt gaaagataaa cgctataccc 5940
aagataaatt tttttttcac gtgccgatca gcctcaactt taaagcgcag ggcgtgagca 6000
aatttaacga taaagtgaac ggcttcctga aaggcaaccc ggatgtcaac attattggta 6060
ttgatcgggg cgagcgccat ctgctttatt ttaccgtggt gaatcagaaa ggtgaaattc 6120
tcgttcagga aagcttaaac accctgatga gcgataaagg ccatgtgaac gattatcagc 6180
aaaaactgga taaaaaagaa caggagcgtg atgcggcacg taaatcttgg accacggtgg 6240
aaaacattaa agaattgaaa gaaggctatt taagccatgt ggtgcataaa ctggcgcacc 6300
tgatcattaa atataacgcg attgtgtgcc tggaggacct gaattttggc tttaaacgcg 6360
gtcgctttaa agtggaaaaa caggtttatc agaaatttga aaaagcgctg attgataaac 6420
tgaactatct ggtgtttaaa gaaaaagaat taggtgaagt ggggcattat ctgaccgcgt 6480
atcaactgac cgcgccgttc gaaagcttta aaaaactggg taaacagtct ggcattctgt 6540
tttacgtccc ggcggattat acctccaaaa tcgatccgac cacgggcttc gttaactttc 6600
tggatctgcg ctatcagagc gtggaaaaag cgaaacagct tctgtccgat tttaacgcga 6660
ttcgttttaa cagcgtgcag aactattttg aatttgaaat tgattataaa aaactgaccc 6720
cgaaacgtaa agtcggcacc caaagtaaat gggttatttg cacctatggc gatgtgcgct 6780
atcagaatcg tcgcaatcag aaaggtcatt gggaaaccga agaagtgaac gtgaccgaaa 6840
agctgaaagc gttatttgcg agcgatagca aaacgaccac ggttatcgat tatgccaacg 6900
acgacaacct gattgatgtg attttagaac aggataaagc gagctttttt aaagaattat 6960
tgtggttact gaaactgacc atgaccctgc gccatagcaa aattaaaagc gaagatgatt 7020
ttattctgtc cccggtgaaa aatgaacagg gtgaatttta tgatagccgt aaagcgggcg 7080
aagtttggcc taaagatgcg gatgccaacg gcgcgtatca tatcgcgctg aaaggccttt 7140
ggaatttaca gcaaattaac cagtgggaaa aaggtaaaac cctgaattta gcgatcaaaa 7200
accaggattg gtttagcttt atccaggaaa aaccgtatca ggaatgatga aagcttatgc 7260
agatcggtaa taaagacgaa caataagacg ctgaaaagcg tcttttttcg ttttggtcct 7320
gttccggcgc gatagtgtga acatgctata gacttctggt gctacccgac tgacaattaa 7380
tcatccggct cgtataatgc tagcaatttc tactgttgta gatcattccg gaacgttcca 7440
gcgctgcaat ttctactgtt gtagatctga tttttcacat gttacctttc aatttctact 7500
gttgtagatc cgaaaacgta aagcttcagc tgtaatttct actgttgtag atatcatatc 7560
tggcgttaat ggagtttcgt gacgaacaat aagtcctccc taacgggggg caatttttat 7620
tgataacaaa agtaacttcg agcttgtcta cctcctagct cgtaaattgc acgctgatag 7680
tctcccaatt gcgaaggacc aaaacgaaaa aacacccttt cgggtgtctt ttctggaatt 7740
tggtacgcag tactaggtat cgtgtaagta gcgaaggccc gtacgcgaga taaactgcta 7800
ggcaaccgcg actctacgac tggtgctcga tttaatttcg ctgacgtaaa gaaattatcg 7860
gcagtgcgtc aactgccgta tctttatctt aattaggtag ttggacaagc ccttgaaaga 7920
aatagcaaga gcctgcctct ctattgaagt cacggcgaaa gtcgggtaga aatcaaagaa 7980
agcagaaatt aaatcggagt aatactaagt tgggataact ccgtaactga ctacgccttt 8040
ctctagactt tacttgacca gatacactgt ctttgacacg ttgaaggatt agagcaatca 8100
aatccaagac tggctaagca cgaagcaact cttgagtgtt aaaaagttac ttcctgtatt 8160
cgggacgagg gtactagaag attgcaggga ctccgacgtt aagtaaatta caaagtaata 8220
agtatcgttc aggatcacgt taccgcaata agaagcgaga ataatataat ttccgaagtg 8280
cttaccccag tagtgactat tcctataacc cttctgagtg tccggaggcg gaaatttgcc 8340
acgaaagaga aagtatttcc ccgacaataa taaaggggcg ctcctcagct tttccacttg 8400
gttgggtaag ctaggcaact ctgaaaggag tttcggcgaa gtgaagccga cacctttgaa 8460
ttgttttagg ggcgttattc gagggcaatc ggagctaact tcaagactac ttctttgttg 8520
aatactaaat agtgcaaagg tcgtgtttcc tcaaggatac tccgctaaca atataggatt 8580
ccaatcagat tcagcactgg cggtacgggt gttgcggtga ggcgttcggg tttacggctc 8640
gaagctagca cggtaggaag cctgacaatc accaagcaaa agggccgtcg aaggcccaca 8700
agatacgaaa gctctcgaag ccttatcctt gaccgatcca cctatttagg cagttacgca 8760
caaaagctac ccaataatcc gtgacaggca caatatcacg gaacaaaacc gaaaactctc 8820
gtacacggtt aggttttcgc taggaagaat aaacctctat cttgattata agaaggctcc 8880
ccaagcaccc ccaaaaccga aatagcggtt tgcaataagg gacaagttac gagtgtagac 8940
acgcagaatt atccagcctt tagtctttag gaaggcaaag ctattgtacg cggtagccgt 9000
cgtagcaatt taccaactgt agaattattg gacacacgta acaagggctt acagttgaag 9060
tttaataagg tcacacgcaa aaccgctaag gaataatcgc accgttagcg aaagaatatt 9120
tcagagcggt tagtaaaggt tgagtaaagt gagattccaa agtgagcctt tataaaaagt 9180
aaagagctat aataaaaccg tcgatcggaa aacaatcgcc tgaaatctca agcacgttgc 9240
cctttctaac gtcgctaagg tttcgtaaac ccgtttgatt aggaagaaga ataagtaacc 9300
cgattaggtt tgagatcgcg ggttatcggt ttggattaaa agtggatacc agcggagtca 9360
acgccgacgc aaacgtacag tgatccaatc ctgttccacg gtcaagcaca atcagctagc 9420
aagatcttgg aatagagtcg ttgcaccgct ttgatttaca tgctctccat tgcacaacat 9480
tccggaagga ctggcttctc tgccatgatc ggataatgaa aaacatcagt atgccctgtc 9540
atttttcttt gggtgtcctc aaataattgc cctcacgtta tcgtatgtga cgcgctcatc 9600
tatgctcgaa gtattccttg ttctcccatc ttttaataga aagtctttaa tgaacgtgtc 9660
gttacgcagt gtatgaactc ttgttttata gggcagactt tggcgtggcc taagtgtgtt 9720
cgataagaag gcaaggacaa ctagctgacg cgctgtaata cggatattat ggcacggttg 9780
atacaaacgc tgatatcctg atttgctaat gtgcccaaca ctttagttga gtgccacgtt 9840
ccgactacaa gttgcttcaa gaggggaatt tggatttggc aatagccccc cgtttctacc 9900
tcaagaggcg acgagtatta accgcgccag ctttcggcac aagggccaaa gaagattcca 9960
atttcttatt cccgaataac ctccgaatcc ctgcgggaaa atcaccgacc gaatagccta 10020
gaagcaaggg ggaacagata ggtataatta gcttaagaga gtaccagccg tgacaacacc 10080
gtagtaacca caaacttacg ctggggcttc tttggcggat ttttacagat actaacaagg 10140
tgatttgaag taccttagtt gaggatttaa acgcgctatc cggtagtcta caaattggga 10200
aataccgttc aaagagggct agaattactt aaaagccttc acaccgcctg cgctatacgc 10260
gcccactctc ccgtttatcc gtccaagcgg aagcagggcg aacttccgct aagatattct 10320
tacgtgtaac gtagctaagt atcccaaata gctggcgtac gcgttgaaca ccgcctagag 10380
gatcgggagt cgccggacga gcgtgttatt ggggacttac gccagcgtag actacaacgc 10440
gcccagatta accctgcacg tattgccttg aataacgtac taatctctcc ggctctcgac 10500
aatctatcga gcgactcgat tatcaacggg tgtcttgcag ttctaatctc ttgcccccgc 10560
ccgtaatagc ctccaagtga ttcaagatag taaagggcaa gagcttattc ggcgttgaag 10620
gatagcggac tttcggtcaa ccacaattcc ccactcgaca aaaccagccg tgcgaagaac 10680
tctgaaagta caagcaaccc aagagggctg agcctaaact cagctaattc ctaagtgagc 10740
taaagactcg aagtgacagc tattaataaa tagagcggga acgtcgaacg gtcgtgaaag 10800
taatagtaca acgggtatta acttactgag gatattgctt gaagctgtac cgttttattg 10860
ggtgaacgaa taagatccag caattcagcc aaagaagcta ccaattttta gtttaagagt 10920
gtcacgtctg acctcgcggg tggatagccg aacgtagagc ttacgagcca gcggaaacag 10980
tagccgcagg ataagtaagg ggagtaagtg atcgaacgaa tcagaagtga caatatactt 11040
aggctggatc tcgtcccgtg aatcccaacc ctcaccaact acgagataag aggtaagcca 11100
gaaatcggca tggtggcgac caacgactgt tccccccctg taactaatcg ttccgtcaaa 11160
acctgactta cttcaaggcc aattccaagc gcaaacaata ccgtcctagt tcttcggtta 11220
agtttccgaa gtaggagtga gcctacctcc gtttgcgtct tgttaccact gacccagcta 11280
tttactttgt attgcctgca atcgaatttc tgaactctca gatagtgggg ataacgggaa 11340
agttcctata tttgcgaact aacttagccg tccacctcga agctacctac tcacacccac 11400
cccgcgcggg gtaaataagg cactaatccc agcttagagc ttgcgtagca cttagccaca 11460
agttaattaa cagttgtctg gtagtttggc ggtattagcg agatcctaga agcaaggcag 11520
agttagttct aacctaaagc cacaaataag acaggttgcc aaagcccgcc ggaaattaaa 11580
tcttgctcag ttcggtaacg gagtttccc 11609
<210> 43
<211> 686
<212> PRT
<213> 细菌噬菌体ZG49
<400> 43
Met Ser Thr Ile Thr Gln Phe Pro Ser Gly Asn Thr Gln Tyr Arg Ile
1 5 10 15
Glu Phe Asp Tyr Leu Ala Arg Thr Phe Val Val Val Thr Leu Val Asn
20 25 30
Ser Ser Asn Pro Thr Leu Asn Arg Val Leu Glu Val Gly Arg Asp Tyr
35 40 45
Arg Phe Leu Asn Pro Thr Met Ile Glu Met Leu Val Asp Gln Ser Gly
50 55 60
Phe Asp Ile Val Arg Ile His Arg Gln Thr Gly Thr Asp Leu Val Val
65 70 75 80
Asp Phe Arg Asn Gly Ser Val Leu Thr Ala Ser Asp Leu Thr Asn Ser
85 90 95
Glu Leu Gln Ala Ile His Ile Ala Glu Glu Gly Arg Asp Gln Thr Val
100 105 110
Asp Leu Ala Lys Glu Tyr Ala Asp Ala Ala Gly Ser Ser Ala Gly Asn
115 120 125
Ala Lys Asp Ser Glu Asp Glu Ala Arg Arg Ile Ala Ala Ser Ile Arg
130 135 140
Glu Ala Gly Leu Ile Gly Tyr Ile Thr Arg Arg Ser Phe Glu Lys Gly
145 150 155 160
Tyr Asn Val Thr Thr Trp Ser Glu Val Leu Leu Trp Glu Glu Asp Gly
165 170 175
Asp Tyr Tyr Arg Trp Asp Gly Thr Leu Pro Lys Asn Val Pro Ala Gly
180 185 190
Ser Thr Pro Glu Thr Ser Gly Gly Ile Gly Leu Gly Ala Trp Val Ser
195 200 205
Val Gly Asp Ala Ala Leu Arg Ser Gln Ile Ser Asn Pro Glu Gly Ala
210 215 220
Ile Leu Tyr Pro Glu Leu Gln Met Ala Arg Trp Arg Asp Glu Gly Asp
225 230 235 240
Val Arg Gly Trp Gly Ala Lys Gly Asp Gly Val Thr Asp Ser Thr Glu
245 250 255
Asn Ile Ala Ala Ser Leu Asn Ser Gln Lys Ala Val Val Ala Ser Glu
260 265 270
Gly Val Phe Ser Ser Ser Gly Ile Asn Ser Asn Tyr Cys Asn Leu Asp
275 280 285
Gly Arg Gly Ser Gly Val Leu Ser His Arg Ser Ser Thr Gly Asn Tyr
290 295 300
Leu Val Phe Asn Asn Leu Arg Ser Gly Arg Leu Ser Asn Ile Thr Val
305 310 315 320
Glu Ser Asn Lys Ala Thr Asp Thr Thr Gln Gly Gln Gln Val Ser Leu
325 330 335
Ala Gly Gly Ser Asp Val Thr Ile Ser Asp Val Asn Phe Ser Asn Val
340 345 350
Lys Gly Ala Gly Phe Ser Leu Ile Thr Tyr Pro Asn Asp Ala Pro Ser
355 360 365
Asp Gly Leu Met Ile Lys Gly Ile Arg Gly Ser Tyr Ser Gly Tyr Ala
370 375 380
Thr Asn Lys Ala Ala Gly Cys Ile Leu Ala Asp Ser Ser Val Asn Ser
385 390 395 400
Leu Ile Asn Asn Val Ile Ala Lys Asn Tyr Pro Gln Phe Gly Ala Val
405 410 415
Glu Leu Lys Gly Thr Ala Ser Tyr Asn Ile Val Ser Asn Val Ile Gly
420 425 430
Ala Asp Cys Gln His Val Thr Tyr Asn Gly Thr Glu Gly Ser Ile Ala
435 440 445
Pro Ser Asn Asn Leu Ile Asn Gly Val Val Ala Asn Asn Pro Lys Tyr
450 455 460
Ala Ala Val Val Ala Gly Lys Gly Ser Thr Asn Leu Ile Ser Asp Val
465 470 475 480
Leu Val Asp Phe Ser Thr Ser Asp Ala Arg Gln Ala His Gly Val Thr
485 490 495
Val Glu Gly Ser Asp Asn Val Ile Asn Asn Val Leu Met Ser Gly Cys
500 505 510
Asp Gly Thr Asn Ser Leu Gly Gln Ala Gln Thr Ala Thr Ile Ala Arg
515 520 525
Phe Ile Asp Thr Ala Asn Asn Asn Tyr Ala Ser Val Phe Pro Ser Tyr
530 535 540
Ser Ala Thr Gly Val Ile Thr Phe Glu Ser Gly Ser Thr Arg Asn Phe
545 550 555 560
Val Glu Val Lys His Pro Gly Arg Arg Asn Asp Leu Leu Ser Ala Thr
565 570 575
Gly Thr Ile Glu Gly Lys Val Thr Ile Asp Gly Thr Ser Asn Ser Asn
580 585 590
Val Val His Ala Pro Ala Leu Gly Gln Tyr Ile Gly Ser Met Ser Gly
595 600 605
Arg Phe Glu Trp Arg Ile Lys Ser Met Ser Leu Pro Ser Gly Val Leu
610 615 620
Thr Ser Ala Asp Lys Tyr Arg Met Leu Gly Asp Gly Ala Val Ser Leu
625 630 635 640
Ala Val Gly Gly Gly Thr Ser Ser Gln Val Arg Leu Phe Thr Ser Asp
645 650 655
Gly Thr Tyr Arg Thr Val Ser Leu Thr Asn Gly Asn Val Arg Leu Pro
660 665 670
Thr Ser Ser Thr Gly Tyr Leu Gln Leu Gly Ser Ser Ser Leu
675 680 685
<210> 44
<211> 2061
<212> DNA
<213> 细菌噬菌体ZG49
<400> 44
atgtccacga ttacacaatt cccttcagga aacactcagt acaggattga gttcgactac 60
ctagccagaa cgtttgttgt tgttacgctg gtgaatagct ctaaccctac cctgaaccgt 120
gtactggaag ttggtcgaga ttaccgattc cttaacccaa cgatgattga gatgttggtt 180
gaccaatcag gtttcgacat cgttcgtatt caccgtcaga ctggaactga cttagtggta 240
gacttcagga atggctcagt gttgacagct agtgacctga ccaattcaga gcttcaggct 300
atccatattg cagaagaagg tcgagaccaa acggttgact tagcgaagga atatgccgat 360
gctgctggta gctctgctgg caacgctaag gatagcgagg acgaagcacg ccgaatcgct 420
gcgagtatca gggaagctgg tctaattggc tatattaccc gtcgctcctt cgagaaaggc 480
tacaacgtta caacatggag cgaggtcctg ctatgggaag aggatggtga ttattaccgc 540
tgggatggta cgcttccaaa gaacgttcct gctggttcaa ctcctgaaac ttccggtggg 600
attggattag gtgcgtgggt tagtgttggt gatgctgctt taagaagtca gatttcaaac 660
ccggaagggg caatactcta cccggaattg cagatggcaa gatggcgtga tgagggtgat 720
gttcgaggct ggggtgctaa aggggatggt gtaacagata gtacggagaa tatagctgct 780
tcactaaatt ctcaaaaagc tgtcgtagca tcagaaggtg tattctctag ttctggtatt 840
aatagtaatt actgtaactt agacggtaga ggcagtggtg tactaagtca ccgttcaagt 900
acaggtaact acttagtatt taacaatcta cgctcaggtc gcttaagtaa tattacggta 960
gaaagtaata aggcgaccga taccactcaa gggcagcagg tatctcttgc tggtggcagt 1020
gatgttacta taagtgatgt taatttctca aacgttaagg gcgctggttt cagtttaatc 1080
acatacccta atgatgcacc ctctgatggg cttatgatta aaggcattcg aggtagctac 1140
tccggctatg ctactaataa ggcggctgga tgcatacttg ctgattcctc agttaactcc 1200
ctcataaata acgtcattgc taagaactac cctcagttcg gggctgtaga actgaaaggt 1260
acagccagtt ataacatagt cagcaatgtt ataggggcag actgccagca tgtaacttac 1320
aacggtacag aagggtcaat agctccctct aacaacctta tcaatggggt agtggctaat 1380
aatcctaaat atgcagcggt tgttgcaggc aaaggtagta ccaacttaat ctccgatgtg 1440
cttgtagatt tctcaacctc tgatgctagg caggctcatg gtgttacagt agaaggttct 1500
gataacgtca taaataatgt gcttatgtca gggtgtgatg gtactaactc tttagggcaa 1560
gctcagactg ctacaattgc gcgctttata gatacggcta ataacaacta tgcgtctgta 1620
tttcctagct acagtgctac aggtgttatt actttcgaat caggttctac ccgtaacttc 1680
gtagaggtaa agcatccggg aaggagaaac gaccttctca gtgctactgg tactattgaa 1740
ggtaaagtta ctattgacgg cactagtaat agcaacgtag tgcacgctcc tgcattagga 1800
cagtacatag gcagtatgtc cggtaggttc gaatggcgga ttaagtccat gtcacttccg 1860
tcaggcgttc ttacctcggc tgataagtac agaatgcttg gggatggtgc tgtgtcatta 1920
gctgtaggtg ggggtacttc ttctcaagtt cgcctattta cttctgatgg tacttatcgg 1980
acagtatcac tcaccaacgg taacgtgcgt cttcctacca gtagcacagg ttatttgcag 2040
ttaggttcta gctccctcta a 2061
<210> 45
<211> 12299
<212> DNA
<213> 人工序列
<220>
<223> p775
<400> 45
actgtcggaa tgacaaatgg ttccaattat tgaacaccct tcggggtgtt tttttgtttc 60
tggtttcccg aggccggcct gcgctagcgg agtgtatact ggcttactat gttggcactg 120
atgagggtgt aagtgaagtg cttcatgtgg caggagaaaa aaggctgcat cggtgcgtca 180
gcagaatatg tgatacagga tatattccgc ttcctcgctc actgactcgc tacgctcggt 240
cgttcgactg tggcgagcgg aaatggctta cgaacggggc ggagatttcc tggaagatgc 300
caggaagata cttaacaggg aagtgagagg gtcgcggcaa agccgttttt ccataggctc 360
cgcccccctg acaagcatca cgaaatctga cgctcaaatc agtggtggcg aaacctgaca 420
ggactataaa gataccaggc gtttccccct ggcggctccc tcgtgcgctc tcctgttcct 480
gcctttcggt ttgccggtgt cattcctctg ttacggccga gtttgtctca ttccacgcct 540
gacactcagt tccgggtagg cagttcgctc caagctggac tgtatgcacg aaccccccgt 600
tcagtccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggaaagaca 660
tgcaaaagca ccactggcag cagccactgg taattgattt agaggagtta gtcttgaagt 720
catgcgccgg ataaggctaa actgaaagga caagttttgg cgactgcgct cctccaagcc 780
agttacctcg gttcaaagag ttggtagctc agagaacctt cgaaaaaccg ccctgcaagg 840
cggttttttc gttttcagag caagagatta cgcgcagacc aaaacgatct caagaagatc 900
atcttattaa tcagataaaa tatttctaga tttcagtgca atttatctct tcaaatgtag 960
caccggcgcg ccgtgaccaa ttattgaagg ccgctaacgc ggcctttttt tgtttctggt 1020
atcccgaatg gagcgacttc tccccaaaaa gcctcgcttt cagcacctgt cgtttccttt 1080
cttttcagag ggtattttaa ataaaaacat taagttatga cgaagaagaa cggaaacgcc 1140
ttaaaccgga aaattttcat aaatagcgaa aacccgcgag gtcgccgccc cgtaacctgt 1200
cggatcaccg gaaaggaccc gtaaagtgat aatgattatc atctacatat cacaacgtgc 1260
gtaaagggta agtatgaagg tcgtgtactc catcgctacc aaattccaga aaacagacgc 1320
tttcgagcgt cttttttcgt tttggtcacg acgtacggtg gaagattcgt taccaattga 1380
cagctagctc agtcctaggt atatacatac atgcttgttt gtttgtaaac tactgttttc 1440
attaaagagg agaaaggaag ccatgtccat ctatcaggag tttgttaaca agtattccct 1500
gtctaaaacc ctgcgttttg aactgatccc gcagggcaaa actttggaaa acattaaagc 1560
gcgtggcctg attctggatg acgaaaaacg tgcaaaggat tacaagaaag ctaaacagat 1620
catcgacaaa tatcaccagt tctttatcga agaaattctg tcgtcggtgt gcatcagtga 1680
ggatctgtta cagaattatt ctgatgtata ctttaaactt aaaaagtccg atgacgataa 1740
tctgcaaaaa gatttcaagt cagccaaaga taccatcaag aaacagatct cagaatatat 1800
taaagatagc gaaaagttca aaaacctgtt taaccaaaac ctcattgatg ctaagaaagg 1860
ccaagaatct gacctgatct tatggctgaa acagagcaaa gataacggca ttgaactgtt 1920
caaagctaat agcgacatca ccgatattga tgaagcgctc gaaatcatca agtctttcaa 1980
aggctggacg acgtatttca aaggttttca tgaaaaccgt aagaatgtat attcgagcaa 2040
cgatattccg acctctatta tttatcgtat cgtggacgac aacctgccga agtttctgga 2100
aaacaaagcg aaatatgaat ctctgaaaga caaagcaccg gaagctatta actatgaaca 2160
gatcaagaaa gatctggcgg aagaactgac cttcgacatc gactataaaa cctccgaagt 2220
taaccagcgt gttttctcac tggacgaggt tttcgaaatc gctaatttca acaattacct 2280
gaatcaatct ggcatcacca aattcaacac cattattggt ggcaaatttg ttaacggcga 2340
aaacaccaag cgtaagggca tcaacgaata cattaacctg tatagccaac aaatcaacga 2400
caaaaccctg aaaaagtata aaatgtccgt tctgtttaaa cagattttat cggacaccga 2460
atctaaatcc ttcgtaattg ataaactgga agatgatagc gacgttgtca ccacgatgca 2520
gagcttttat gagcagattg cggcgttcaa aaccgtggaa gagaaatcta ttaaagaaac 2580
tctgtccctg ctctttgacg acctcaaagc gcagaaacta gatctgtcta agatttactt 2640
taaaaacgac aaatctctga ccgatctcag tcaacaagtt ttcgatgact atagcgtgat 2700
cggcacggca gttttggaat acatcaccca acaaatcgcg ccgaaaaatc tggacaaccc 2760
gtccaagaag gaacaggaac tgattgcaaa gaaaacagaa aaagctaaat acctgagctt 2820
agaaactatc aaactggcac ttgaggaatt taataaacat cgtgatattg ataaacagtg 2880
tcgttttgag gaaattctgg cgaactttgc ggcaatcccg atgatcttcg acgaaattgc 2940
tcaaaacaaa gacaatctgg cgcagatctc tatcaagtac cagaatcagg gtaagaaaga 3000
tctgcttcaa gcatctgcgg aggacgatgt gaaagcaatt aaagacttat tagatcagac 3060
gaataactta ttacacaagc tcaaaatctt ccacatcagc cagagcgagg acaaggcgaa 3120
cattctggat aaagatgaac acttctatct ggtgttcgaa gaatgttact tcgaactggc 3180
aaacatcgtc cctctctaca ataaaatccg caactacatc acgcagaagc cttactctga 3240
cgagaaattc aaactgaact tcgaaaacag cacgctggcg aacggctggg ataagaacaa 3300
agagccggac aacaccgcaa tcctgttcat caaagacgac aaatactatc tgggcgtaat 3360
gaacaagaag aacaacaaga tcttcgacga taaagcgatc aaagaaaaca agggtgaagg 3420
ctataagaaa atcgtgtaca agctcctgcc gggtgcgaat aaaatgttac cgaaagtgtt 3480
cttttccgcg aaaagcatca aattctacaa cccgtctgag gatattctgc gcatccgcaa 3540
tcatagcacg cacactaaaa acggtagccc gcagaaaggg tatgaaaaat tcgaatttaa 3600
tatagaggac tgccgtaagt tcatcgactt ctataaacag agcatttcca aacatccgga 3660
atggaaagac ttcggcttcc gtttctctga cactcagcgc tataatagca tcgacgagtt 3720
ctaccgcgaa gtggagaatc agggctataa actgaccttc gagaacatta gtgagtcgta 3780
catcgactcc gttgtgaatc agggtaaact gtacctgttt cagatctata ataaagactt 3840
tagcgcgtac agcaaaggcc gtccgaatct gcacaccctt tactggaaag cattatttga 3900
cgaacgtaac ctgcaagatg tggtgtataa actgaacggt gaggcggaac ttttctaccg 3960
taaacagagt atcccgaaga aaatcacgca tccggcaaaa gaagctattg ccaacaaaaa 4020
caaagacaac ccgaagaaag aatcagtatt cgaatatgac ctgatcaaag ataaacgttt 4080
caccgaagat aagttctttt tccactgtcc gattaccatc aacttcaaat ctagcggtgc 4140
gaacaagttc aacgatgaaa ttaacttatt actgaaagag aaagctaatg acgtacacat 4200
cttatctatt gatcgcggtg aacgtcattt agcatactat acactggtag atggtaaagg 4260
taatattatt aaacaggata ctttcaatat tatcggtaat gaccgtatga aaaccaacta 4320
tcacgataag ctggcggcga tcgaaaaaga tcgtgattct gcgcgtaaag attggaagaa 4380
aattaacaat atcaaagaaa tgaaagaagg ctatctgagc caagtggtgc acgagatcgc 4440
aaaactggtg attgaatata acgctatcgt ggttttcgaa gatctgaact ttggttttaa 4500
acgtggtcgc ttcaaagtag aaaaacaggt gtaccaaaaa ctggaaaaaa tgctgattga 4560
aaaactgaac tatctggttt ttaaagacaa cgaatttgac aaaacgggtg gcgtactccg 4620
tgcctatcag ctgaccgctc cgttcgaaac gttcaagaaa atgggtaaac aaacggggat 4680
tatctattat gtgccagctg gtttcacctc caagatttgt ccagttacgg gcttcgttaa 4740
ccagctgtac ccgaaatacg agagcgttag caaatctcaa gaatttttca gcaaattcga 4800
caagatctgc tataatctgg ataaaggcta tttcgagttc agcttcgatt acaaaaactt 4860
cggcgataaa gcggctaaag gtaagtggac tattgctagc tttggtagcc gtctgattaa 4920
ctttcgcaac tccgacaaaa accataattg ggacacgcgt gaagtgtatc cgaccaaaga 4980
actggaaaaa ttactgaaag actattccat cgaatatggt catggggagt gcattaaagc 5040
ggcgatttgc ggtgaatccg ataagaaatt tttcgccaaa ctgaccagcg tgcttaacac 5100
cattctgcaa atgcgtaatt ctaaaacggg tacggagctg gactacctga tttctccggt 5160
agccgacgtt aacggcaact tcttcgattc tcgtcaagca ccgaaaaata tgccacaaga 5220
cgcggatgcc aacggtgcat accatatcgg cttaaaaggc ttaatgttat taggccgtat 5280
caagaataat caggagggca agaaattaaa tctggttatc aaaaacgaag aatacttcga 5340
gttcgttcag aatcgtaaca attaatgtat gcttaagcag ctcggtacca aagacgaaca 5400
ataagacgct gaaaagcgtc ttttttcgtt ttggtcctgt tgcggcgcga tagtgtgaac 5460
atgctataga cttctggtgc tacccgactg acaattaatc atccggctcg tataatgcta 5520
gcaatttcta ctgttgtaga tgccagatca ccgcgatatc gttggtcgag acgaacaata 5580
aggcctccct aacggggggc cttttttatt gataacaaaa gtaacttcga gcttgtctac 5640
ctcctagcac cattattgca attaataaac aactaacgga caattctacc taacagtttt 5700
catatatgac gagcagttaa gtgatgagta aaggtgagga attatttact ggtgttgttc 5760
cgatcttagt tgaactggac ggcgatgtta acggtcataa attcagtgtt cgtggtgaag 5820
gtgaaggtga tgcaaccaac ggtaagctga ccctgaaatt catctgcact actggaaaat 5880
taccagtacc gtggcctact ctggtgacta ccctgaccta tggtgttcag tgtttttctc 5940
gttaccctga ccacatgaag caacatgatt tcttcaaatc tgcaatgccg gaaggttatg 6000
tacaggagcg caccatttct ttcaaagacg atggcacgta taaaacccgt gcagaggtta 6060
aatttgaagg tgacactctg gtgaatcgta ttgaactgaa aggcattgat ttcaaagagg 6120
acggcaatat tttaggccac aaactggaat ataacttcaa ctcccataac gtttacatca 6180
ccgcagacaa acagaagaac ggtatcaaag ctaacttcaa aattcgccat aacgttgaag 6240
atggtagcgt acagctggcg gatcattacc aacagaacac tccgattgga gatgctcctg 6300
ttttactgcc ggataaccac tacctgtcca cccagtctaa actgtcgaag gatccgaacg 6360
aaaagcgcga ccacatggtg ttattagagt tcgttaccgc tagtggtatc acgcacggta 6420
tggatgaact ctacaaataa gacgaacaat aaggggagcg ggaaaccgct cccctttttt 6480
attgataaca aaagtaaatt gcacgctgat agtctcccaa ttgcgaagga ccaaaacgaa 6540
aaaacaccct ttcgggtgtc ttttctggaa tttggtaccg agtactaggt atcgtgtaag 6600
tagcgaaggc ccgtacgcga gataaactgc taggcaaccg cgactctacg actggtgctc 6660
gatttaattt cgctgacgta aagaaattat cggcagtgcg tcaactgccg tatctttatc 6720
ttaattaggt agttggacaa gcccttgaaa gaaatagcaa gagcctgcct ctctattgaa 6780
gtcacggcga aagtcgggta gaaatcaaag aaagcagaaa ttaaatcgga gtaacactaa 6840
ggtgggataa ctccgtaact gactacgcct ttctctagac tttacttgac cagatacact 6900
gtctttgaca cgttgaagga ttagagcaat caaatccaag actggctaag cacgaagcaa 6960
ctcttgagtg ttaaaaagtt atctcctgta ttcgggaagc gggtactaga agattgcagg 7020
gactccgacg ttaagtaaat tacaaagtaa taagtatcgt tcaggatcac gttaccgcaa 7080
taagaagcga gaataatata atttccgaag tgcttacccc agtagtgact attcctataa 7140
cccttctgag tgtccggagg cggaaatttg ccacgaaaga gaaagtattt ccccgacaat 7200
aataaagggg cgctcctcag cttttccact tggttgggta agctaggcaa ctctgaaagg 7260
agtttcggcg aattgaagcc gacagctttg aattgtttta ggggcgttat tcgagggcaa 7320
tcggagctaa cttcaagact acttctttgt tgaatactaa atagtgcaaa ggtcgtgttt 7380
cctcaaggat actccgctaa caatatagga ttccaatcag attcagcact ggcggtacgg 7440
gtgttgcggt gaggcgttcg ggtttacggc tcgaagctag cacggtagga agcctgacaa 7500
tcaccaagca aaagggccgt cgaaggccca caagatacga aagctctcga agccttatcc 7560
ttgaccgatc cacctattta ggcagttacg cacaaaagct acccaataat ccgtgacagg 7620
cacaatatca cggaacaaaa ccgaaaactc tcgtacacgg ttaggttttc gctaggaaga 7680
ataaacctct atcttgatta taagaaggct ccccaagcac ccccaaaacc gaaatagcgg 7740
tttgcaataa gggacaagtt acgagtgtag acacgcagaa ttatccagcc tttagtcttt 7800
aggaaggcaa agctattgta cgcggtagcc gtcgtagcaa tttaccaact gtagaattat 7860
tggacacacg taggaagggc ttacagttga agtttaataa ggtcacacgc aaaaccgcta 7920
aggaataatc gcaccgttag cgaaagaata tttcagagcg gttagtaaag gttgagtaaa 7980
gtgagattcc aaagtgagcc tttataaaaa gtaaagagct ataataaaac cgtcgagcag 8040
aaaacaatcg cctgaaatct caagcacgtt gccctttcta acgtcgctaa ggtttcgtaa 8100
acccgtttga ttaggaagaa gaataagtaa cccgattagg tttgagatcg cgggttatcg 8160
gtttggatta aaagtggata ccagcggagt caacgccgac gcaaacgtac agtgatccaa 8220
tcctgttgca cggtcaagca caatcagctc gcaagatctt ggaatagtgt gcccaacagt 8280
ttagttgagg gccacgttcc gactacaagt tgcttcaaga ggggaatttg gatttggcaa 8340
tagccccccg tttctacctc aagaggcgac gagtattaac cgcgccagct gtcggcacaa 8400
gggccaaaga agattccaat ttcttattcc cgaataacct ccgaatccct gcgggaaaat 8460
caccgaccga atagcctaga agcaaggggg aacagatagg tataattagc ttaagagagt 8520
accagccgtg acaacagcgt agtaaccaca aacttacgct ggggcttctt tggcggattt 8580
ttacagatac taacaaggtg atttgaagta ccttagttga ggatttaaac gcgctatccg 8640
gtaatctcca aattgggaaa taccgttcaa agagggctag aattacttaa aagccttcac 8700
accgcctgcg ctatacgcgc ccactctccc gtttatccgt ccaagcggaa gcagggcgat 8760
cctccgctaa gatattctta cgtgtaacgt agctaagtat cccaaatagc tggcgtacgc 8820
gttgaacacc gcctagagga tcgtgactcg ccggacgagc gtgttattgg ggacttacgc 8880
cagcgtagac tacaacgcgc ccagattaac cctgcacgta ttgccttgaa taacgtacta 8940
atctctccgg ctctcgacaa tctatcgagc gactcgatta tcaacgggtg tcttgcagtt 9000
ctaatctctt gcccccgccc gtaatagcct ccaagagatt gaagatagta aagggcaaga 9060
gctgattcgg cgttgaagga tagcggactt tcggtcaacc acaattcccc actcgacaaa 9120
accagccgtg cgaataactc tgaaagtaca agcaacccaa gagggctgag cctaaactca 9180
gctaattcct aagtgagcta aagactcgaa gtgacagctc ttaataaata gagcgggaac 9240
gtcgaacggt cgtgaaagta atagtacaac gggtattaac ttactgagga tattgcttga 9300
agctgtaccg ttttattggg tgaacgaata agatccagca attcagccaa agaagctacc 9360
aatttttagt ttaagagtgt cacgtctgac ctcgcgggta gattgccgaa cgtagagctt 9420
acgagccagc ggaaacagta gccgcaggat aagtaagggg agtaagtgat cgaacgaatc 9480
agaagtgaca atatacttag gctggatctc gtcccgtgaa tcccaaccct caccaactac 9540
gagataagag gtaagccaaa aatcgacttg gtggcgacca acgactgttc cccccctgta 9600
actaatcgtt ccgtcaaaac ctgacttact tcaaggccaa ttccaagcgc aaacaatacc 9660
gtcctagttc ttcggttaag tttccgaagt aggagtgagc ctacctccgt ttgcgtcttg 9720
ttaccactga cccagctatt tactttgtat tgcctgcaat cgaatttctg aactctcaga 9780
tagtggggat aacgggaaag ttcctatatt tgcgaactaa cttagccgtc cacctcgaag 9840
ctacctactc acacccaccc cgcgcggggt aaataaggca ctaatcccag ctgagagctg 9900
gcgtagcact tagccacaag ttaattaaca gttgtctggt agtttggcgg tattaggaag 9960
atcctagaag caaggcagag ttagttctaa cctaaagcca caaataagac aggttgccaa 10020
agcccgccgg aaattaaatc ttgctcagtt cggtaacgga gtttccctcc cgcgtactta 10080
attcccaata agaaacgcgc ccaagtccta tcaggcaaaa ttcagcccct tcccgtgtta 10140
gaacgagggt aaaaatacaa gccgattgaa caagggttgg gggcttcaaa tcgtcgttta 10200
ccccacttta caacggagat taagtagttc accctatagt acgaagcaga actatttcga 10260
ggggcgtgca ataatcgaat cttctgcggt tgacttaaca cgctagggac gtgccctcga 10320
ttcaatcgaa ggtactccta ctcagactgc ctcacaccca gctagtcact gagcgataaa 10380
attgacccgc cctctaggga agcgagtacg tcccaaaggg ctccggacag ggctatatag 10440
gagagtttga tctcgccccg acaactgcaa ccctcaactc ccttagataa tattgttagc 10500
cgaagttgca cgacccgccg tccacggact gctcttaggg tgtggctcct taatctgaca 10560
acgtgcaacc cctatcgaag tcgattgttt ctgcgaaagg tgttgtccta atagtcccga 10620
aatttggccc ttgtaggtgt gaaaccactt agcttcgcgc cgtagtccta aaggcccacc 10680
tattgacttt gtttcgggta gcactaggaa tcttaacaat ttgaatttgg acgtggaacg 10740
cgtacacctt aatctccgaa taattctagg gatttggaag tcctctacgt tgacacacct 10800
acactgctcg aagtaaatat acgaataacg cgggcctcgc ggagccgttc cgaatcgtca 10860
cgtgttcgtt tactgttaat tggtggcaaa taagcaatat cgtagtccgt caggcccagc 10920
cctgttatcc acggcgttat ttgtcaaatt gcgtagaact ggattgactg cctgacaata 10980
cctaattatc ggtacgaagt ccccgaatct gtcgggctat ttcactaata ctttccaaac 11040
gccccgtatc caagaagaac gaatttatcc acgctcccgt ctttgggacg aataccgcta 11100
caagtggaca gaggatcggt acgggcctct aataaatcca acactctacg ccctcttcaa 11160
gagctagaag aacagggtgc agttggaaag ggaattattt cgtaaggcga gccaataccg 11220
taattaattc ggaagagtta acacgattgg aagtaggaat agtttctaac cacggttact 11280
aatcctaata acggaacgct gtctgataga ttagtgtcag cgctcggtac caaagaaaaa 11340
taaaaagacg ctgaaaagcg tctttttatt tttcggtcca gtgtaactca ggcaaaagca 11400
cgtaatattc gtactttctt cctccgtaag cgtcacccac attccttaaa gagtgcatgt 11460
gcatattttg ttatcaataa aaaaggccgc gatttgcggc cttattgttc gtcttgccgg 11520
attacgcccc gccctgccac tcatcgcagt attgttgtaa ttcattaagc attctgccga 11580
catggaagcc atcacaaacg gcatgatgaa cttggatcgc cagtggcatt aacaccttgt 11640
cgccttgcgt ataatatttt cccatagtga aaacgggggc gaagaagttg tccatatttg 11700
ctacgtttaa atcaaaactg gtgaaactca cccacggatt ggcactgacg aaaaacatat 11760
tttcgataaa ccctttaggg aaatatgcta agttttcacc gtaacacgcc acatcttgac 11820
tatatatgtg tagaaactgc cggaaatcgt cgtggtattc tgaccagagc gatgaaaacg 11880
tttcagtttg ctcatggaaa acggtgtaac aagggtgaac actatcccat atcaccagct 11940
caccgtcttt cattgccata cgaaactccg gatgtgcatt catcaggcgg gcaagaatgt 12000
gaataaaggc cggataaaac ttgtgcttat ttttctttac ggtttttaaa aaggccgtaa 12060
tatccagctg aacggtttgg ttataggtgc actgagcaac tgactggaat gcctcaaaat 12120
gttctttacg atgccattga cttatatcaa ctgtagtata tccagtgatt tttttctcca 12180
ttttagcttc cttagcttgc gaaatctcga taactcaaaa aatagtagtg atcttatttc 12240
attatggtga aagttgtctt acgtgcaaca ttttcgcaaa aagttggcgc tttatcaac 12299
<210> 46
<211> 282
<212> DNA
<213> 人工序列
<220>
<223> 来自大肠埃希氏菌菌株CFT073的PICI的引发酶ori
<400> 46
tttgttgcaa tggctgtcta ccctgtctac ctgagtaaag aaaaatacat ttaattcagt 60
acattaactt gggtagacag ccttttttta ctgtctacct actatctacc ctctctacct 120
gattttacct gaatcagaca gggaggtaga tacggggtag atagtggata aaagcactct 180
accccactga aagccgcgcc attactggca tggtggccag taaggtagat aaggtagaca 240
aggggaggca caactcaaaa ctttttaaac gagggggtaa aa 282
<210> 47
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 限制性位点
<220>
<221> 杂项_特征
<222> (5)..(5)
<223> n为a、c、g或t
<220>
<221> 杂项_特征
<222> (6)..(6)
<223> n为a、c、g或t
<220>
<221> 杂项_特征
<222> (7)..(7)
<223> n为a、c、g或t
<220>
<221> 杂项_特征
<222> (8)..(8)
<223> n为a、c、g或t
<220>
<221> 杂项_特征
<222> (9)..(9)
<223> n为a、c、g或t
<220>
<221> 杂项_特征
<222> (10)..(10)
<223> n为a、c、g或t
<400> 47
twcannnnnn tgg 13
<210> 48
<211> 282
<212> DNA
<213> 人工序列
<220>
<223> 引发酶ori deltaGAAABCC
<400> 48
tttgttgcaa tggctgtcta ccctgtctac ctgagtaaag aaaaatacat ttaattcagt 60
acattaactt gggtagacag ccttttttta ctgtctacct actatctacc ctctctacct 120
gattttacct gaatcagaca gggaggtaga tacggggtag atagtggata aaagcactct 180
accccactga aagcagcgcc attactggca tggtggccag taaggtagat aaggtagaca 240
aggggaggca caactcaaaa ctttttaaac gagggggtaa aa 282
<210> 49
<211> 282
<212> DNA
<213> 人工序列
<220>
<223> 没有限制性位点的引发酶ori
<400> 49
tttgttgcaa tggctgtcta ccctgtctac ctgagtaaag aaaaatacat ttaattcagt 60
atattaactt gggtagacag ccttttttta ctgtctacct tctgtctacc ctctctacct 120
gattttacct gaatcagaca gggaggtaga cacggggtag acagtggata aaagcactct 180
accccactga aagcagtgcc attactggca tggttgccag taaggttgat aaggtagaca 240
aggggaggga caactcaaaa ctttttaaac gagggggtaa aa 282
<210> 50
<211> 584
<212> PRT
<213> 人工序列
<220>
<223> PICI引发酶-解旋酶
<400> 50
Met Lys Leu Ala Pro Asn Val Lys Gln Gln Ser Arg Gly Ile Lys His
1 5 10 15
Lys Glu Thr Glu Val Ile Ile Phe Ala Gly Ser Asp Ala Trp Ser His
20 25 30
Ala Lys Gln Trp Gln Glu His Asp Ala Arg Met Ala Gly Asp Asn Glu
35 40 45
Pro Pro Val Trp Leu Gly Glu Gln Gln Leu Ser Glu Leu Asp Lys Leu
50 55 60
Gln Ile Val Pro Glu Gly Arg Lys Ser Val Arg Ile Phe Arg Ala Gly
65 70 75 80
Tyr Leu Ala Pro Val Met Ile Lys Ala Ile Gly Gln Lys Leu Ala Ala
85 90 95
Ala Gly Val Gln Asp Ala Asn Phe Tyr Pro Asp Gly Met His Gly Gln
100 105 110
Lys Val Glu Asn Trp Arg Glu Tyr Leu Ala Arg Glu Arg Gln Asn Leu
115 120 125
Ser Asp Gly Leu Val Ile Glu Leu Pro Val Lys Gln Lys Ala Gln Leu
130 135 140
Ser Gln Met Ala Asp Ser Glu Arg Ala Gln Leu Leu Ala Asp Arg Phe
145 150 155 160
Asp Gly Val Cys Val His Pro Glu Ser Glu Ile Val His Val Trp Cys
165 170 175
Gly Gly Val Trp Cys Pro Val Ser Thr Met Glu Leu Ser Arg Glu Met
180 185 190
Val Ala Ile Tyr Ser Glu His Arg Ala Thr Phe Ser Lys Arg Val Ile
195 200 205
Asn Asn Ala Val Glu Ala Leu Lys Val Ile Ala Glu Pro Met Gly Glu
210 215 220
Pro Ser Gly Asp Leu Leu Pro Phe Ala Asn Gly Ala Leu Asp Leu Lys
225 230 235 240
Thr Gly Glu Phe Ser Pro His Thr Pro Glu Asn Trp Ile Thr Thr His
245 250 255
Asn Gly Ile Glu Tyr Thr Pro Pro Ala Pro Gly Glu Asn Ile Arg Asp
260 265 270
Asn Ala Pro Asn Phe His Lys Trp Leu Glu His Ala Ala Gly Lys Asp
275 280 285
Pro Arg Lys Met Met Arg Ile Cys Ala Ala Leu Tyr Met Ile Met Ala
290 295 300
Asn Arg Tyr Asp Trp Gln Met Phe Ile Glu Ala Thr Gly Asp Gly Gly
305 310 315 320
Ser Gly Lys Ser Thr Phe Thr His Ile Ala Ser Leu Leu Ala Gly Lys
325 330 335
Gln Asn Thr Val Ser Ala Glu Met Thr Ser Leu Asp Asp Ala Gly Gly
340 345 350
Arg Ala Gln Val Val Gly Ser Arg Leu Ile Val Leu Ala Asp Gln Pro
355 360 365
Lys Tyr Thr Gly Glu Gly Thr Gly Ile Lys Lys Ile Thr Gly Gly Asp
370 375 380
Pro Val Glu Ile Asn Pro Lys Tyr Glu Lys Arg Phe Thr Ala Val Ile
385 390 395 400
Arg Ala Val Val Leu Ala Thr Asn Asn Asn Pro Met Ile Phe Thr Glu
405 410 415
Arg Ala Gly Gly Val Ala Arg Arg Arg Val Ile Phe Arg Phe Asp Asn
420 425 430
Ile Val Ser Glu Ala Glu Lys Asp Arg Glu Leu Pro Glu Lys Ile Ala
435 440 445
Ala Glu Ile Pro Val Ile Ile Arg Arg Leu Leu Ala Asn Phe Ala Asp
450 455 460
Pro Glu Lys Ala Arg Ala Leu Leu Ile Glu Gln Arg Asp Gly Asp Glu
465 470 475 480
Ala Leu Ala Ile Lys Gln Gln Thr Asp Pro Val Ile Glu Phe Cys Gln
485 490 495
Phe Leu Asn Phe Leu Glu Glu Ala Arg Gly Leu Met Met Gly Gly Gly
500 505 510
Gly Asp Ser Val Lys Tyr Thr Thr Arg Asn Ser Leu Tyr Arg Val Tyr
515 520 525
Leu Ala Phe Met Ala Tyr Ala Gly Arg Ser Lys Pro Leu Asn Val Asn
530 535 540
Asp Phe Gly Lys Ala Met Lys Pro Ala Ala Lys Val Tyr Gly His Glu
545 550 555 560
Tyr Ile Thr Arg Lys Val Lys Gly Val Thr Gln Thr Asn Ala Ile Thr
565 570 575
Thr Asp Asp Cys Asp Ala Phe Leu
580
<210> 51
<211> 1752
<212> DNA
<213> 人工序列
<220>
<223> PICI引发酶-解旋酶
<400> 51
atgaaactgg caccgaacgt aaaacagcag tcacgcggca taaaacacaa agaaacagaa 60
gtcattattt ttgcgggtag tgatgcctgg tcacacgcaa aacaatggca ggaacatgac 120
gcgcgtatgg ccggagataa tgagcctcct gtgtggcttg gggagcagca gttatccgaa 180
ctggataagc tgcaaattgt gccggaaggc agaaaatccg tgcgcatatt cagggccgga 240
tatcttgcgc cagtaatgat aaaggcgatt ggtcagaagc tggcggcggc aggcgtacag 300
gatgcaaatt tttaccctga tggtatgcac ggtcagaagg tggagaactg gcgcgaatat 360
ctggcccgtg agcgccagaa tctttctgat ggtctggtca ttgagcttcc ggtaaagcaa 420
aaggcgcaac tttcgcagat ggcggacagt gagcgcgcgc agctgcttgc cgatcgcttt 480
gatggcgttt gcgtacatcc tgaaagtgaa atcgttcacg tatggtgcgg cggggtatgg 540
tgtccggtca gcacaatgga gctgagccgc gaaatggtgg cgatctattc agagcacagg 600
gccactttca gcaagcgcgt aatcaataac gccgtggaag cgttaaaagt tattgccgaa 660
ccaatgggcg agccgtccgg cgatttgctg ccgttcgcca atggtgcgct tgacctgaaa 720
acgggggaat tttccccgca cacgccggag aactggatca ccacgcacaa cggcattgag 780
tacacgccac cagcacccgg ggagaacatc cgcgataacg cgccaaactt tcataaatgg 840
cttgagcacg cagccggaaa agacccgcgc aagatgatgc gtatatgtgc cgcgctgtac 900
atgattatgg cgaaccggta cgactggcag atgtttattg aggccaccgg agacggcggg 960
agcggtaaaa gtacattcac acacatagcc agccttctgg cagggaaaca aaacacggta 1020
agcgctgaaa tgacatcgct tgatgatgct ggtgggcgtg cgcaggttgt cgggagtcgt 1080
cttatcgtcc tggcagacca gccgaaatat acaggcgaag gaacgggcat caagaaaatc 1140
acgggcggcg accccgtgga aattaacccg aaatatgaaa agcgttttac ggcggtaatc 1200
agggcggtgg tgctggcaac caataacaat ccgatgatat tcaccgaacg ggccggaggt 1260
gtggcacgtc gtcgggtgat attccggttc gataacatcg taagcgaggc agaaaaagac 1320
agggagctac cggaaaagat cgcggctgaa atccctgtca ttatccgccg cttgctggcg 1380
aactttgccg accctgaaaa ggcacgggct ttactcattg aacagcgtga cggtgatgaa 1440
gcactggcaa taaagcaaca gacggatccg gttattgagt tttgccagtt cctgaatttt 1500
ctggaggaag cacgcggcct gatgatgggc ggcggtggcg attcagtgaa gtacacgacc 1560
agaaacagcc tttaccgcgt ctatctggcg tttatggcgt acgcaggcag gagcaaaccg 1620
ctaaacgtaa atgactttgg caaggctatg aagccagccg cgaaagttta cggacatgaa 1680
tatattacgc ggaaagttaa aggagtaacg cagactaacg caataacaac agacgattgc 1740
gacgcgtttt ta 1752

Claims (57)

1.抵抗蛋白水解消化的嵌合受体结合蛋白(RBP),其中所述RBP包含衍生自细菌噬菌体的受体结合蛋白的一部分,其通过由1-70个氨基酸组成的设计的接头区与衍生自不同细菌噬菌体的受体结合蛋白的一部分融合,其中所述接头区被设计为抵抗蛋白水解消化。
2.根据权利要求1的嵌合RBP,其中所述设计的接头区由1-30个氨基酸组成。
3.根据权利要求1或2的嵌合RBP,其中所述嵌合RBP抵抗胰酶的蛋白水解消化,并且所述接头区被设计为抵抗胰酶的蛋白水解消化。
4.根据权利要求1-3中任何一项的嵌合RBP,其中所述RBP为侧尾丝(STF)蛋白、L形丝、长尾丝或尾刺尖。
5.根据权利要求4的嵌合RBP,其中所述嵌合RBP包含衍生自λ形细菌噬菌体的STF蛋白一部分,其通过由1-70个氨基酸或1-30个氨基酸组成的设计的接头区与衍生自不同细菌噬菌体的RBP蛋白的一部分融合。
6.根据权利要求4或5的嵌合RBP,其中所述嵌合RBP包含衍生自λ形细菌噬菌体的STF蛋白的N-末端区,其通过由1-70个氨基酸或1-30个氨基酸组成的设计的接头区与衍生自不同细菌噬菌体的RBP蛋白的C-末端区融合,其中所述N-末端区和C-末端区在与选自氨基酸SAGDAS(SEQ ID NO:1)、ADAKKS(SEQ ID NO:2)、MDETNR(SEQ ID NO:3)、SASAAA(SEQ ID NO:4)和GAGENS(SEQ ID NO:5)的位点具有至少80%同一性的被称为插入位点的N-末端STF区的位点内融合。
7.根据权利要求6的嵌合RBP,其中所述插入位点与序列GAGENS(SEQ ID NO:5)具有至少80%同一性。
8.根据权利要求6或7的嵌合RBP,其中所述设计的接头区处于所述插入位点的C-末端处。
9.根据权利要求6-8中任何一项的嵌合RBP,其中所述设计的接头区为所述嵌合RBP的N-末端区或C-末端区的一部分。
10.根据权利要求9的嵌合RBP,其中所述对应于可能被胰蛋白酶和/或糜蛋白酶靶向的野生型结构域序列的氨基酸的设计的接头区的至少一个氨基酸与所述野生型结构域序列相比较为突变的。
11.根据权利要求10的嵌合RBP,其中所述设计的接头区为所述嵌合RBP的C-末端区的一部分并且所述至少一个氨基酸位于所述插入位点后的15个氨基酸内。
12.根据权利要求10或11的嵌合RBP,其中所述氨基酸选自赖氨酸(K)、精氨酸(R)、苯丙氨酸(F)、色氨酸(W)、酪氨酸(Y)、亮氨酸(L)和甲硫氨酸(M)。
13.根据权利要求9的嵌合RBP,其中所述N-末端区或所述C-末端区包含所述接头区的序列,所述序列与其所衍生自的RBP的N-末端区或C-末端区中的相应序列相同,并且与区别仅为不存在所述接头区的嵌合RBP相比较,所述序列恢复所述嵌合RBP对蛋白水解消化的抗性。
14.根据权利要求6-8中任何一项的嵌合RBP,其中所述设计改造的接头区包含并非衍生自所述嵌合RBP的N-末端区和C-末端区所衍生自的RBP之一的异源性氨基酸序列或者由其组成。
15.根据权利要求13或14的嵌合RBP,其中所述设计的接头区包含螺旋或螺旋束。
16.根据权利要求13-15中任何一项的嵌合RBP,其中所述设计的接头区可由10到至多20个氨基酸组成。
17.根据权利要求13-16中任何一项的嵌合RBP,其中所述设计的接头区包含氨基酸序列GSATDVMIQL(SEQ ID NO:6)或GSATDVMIQLA(SEQ ID NO:7)或者由其组成。
18.根据权利要求13-15中任何一项的嵌合RBP,其中所述设计的接头区由50-65个氨基酸组成。
19.根据权利要求18的嵌合RBP,其中所述设计的接头区包含SEQ ID NO:34或SEQ IDNO:36或者由其组成。
20.根据权利要求17或19的嵌合RBP,其中所述序列直接位于所述插入位点之后。
21.根据权利要求6-20中任何一项的嵌合RBP,其中衍生自所述λ形细菌噬菌体的所述STF蛋白的N-末端区对应于序列SEQ ID NO:8的λSTF蛋白的氨基酸1-528。
22.根据权利要求6-21中任何一项的嵌合RBP,其中衍生自所述不同细菌噬菌体的所述STF蛋白的C-末端区对应于序列SEQ ID NO:16的STF蛋白的氨基酸208-875或对应于序列SEQ ID NO:16的STF蛋白的氨基酸218-875。
23.根据权利要求22的嵌合RBP,其中所述嵌合RBP包含序列SEQ ID NO:9、SEQ ID NO:10或SEQ ID NO:11或者由其组成。
24.根据权利要求6-21中任何一项的嵌合RBP,其中衍生自所述不同细菌噬菌体的所述STF蛋白的C-末端区对应于序列SEQ ID NO:12的STF蛋白的氨基酸28-632或序列SEQ IDNO:12的STF蛋白的氨基酸62-632。
25.根据权利要求24的嵌合RBP,其中所述嵌合RBP包含序列SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:38或SEQ ID NO:40或者由其组成。
26.编码根据权利要求1-25中任何一项的嵌合RBP的核酸。
27.包含编码根据权利要求26的嵌合RBP的核酸的载体。
28.用于将感兴趣的DNA有效载荷体内递送到靶标细菌细胞中的λ形细菌递送媒介物,其中所述λ形递送媒介物包含根据权利要求1-25中任何一项的嵌合RBP。
29.根据权利要求28的λ形递送媒介物,其中所述嵌合RBP为如权利要求4-25的任何一项中定义的嵌合STF蛋白。
30.根据权利要求29的λ形递送媒介物,其中所述嵌合STF蛋白为功能性STF蛋白。
31.根据权利要求30的λ形递送媒介物,其进一步包含功能性λ形细菌噬菌体gpJ蛋白和/或功能性λ形细菌噬菌体gpH蛋白。
32.根据权利要求29-31中任何一项的细菌递送媒介物,其中所述嵌合STF蛋白具有酶活性,比如解聚酶活性,并且所述感兴趣的细菌细胞群包含包封的细菌。
33.根据权利要求29-32中任何一项的细菌递送媒介物,所述细菌递送媒介物包含序列SEQ ID NO:11的嵌合STF和序列SEQ ID NO:27的嵌合gpJ变体。
34.根据权利要求31-32中任何一项的细菌递送媒介物,其中将嵌合STF蛋白、gpJ蛋白和/或gpH蛋白中的一种或多种进行设计改造以提高将所述DNA有效载荷转移到靶标细菌细胞群中的效率。
35.根据权利要求28-34中任何一项的细菌递送媒介物,其中所述细菌细胞群选自大肠杆菌细菌、肺炎克雷伯氏菌和感兴趣的其他物种。
36.根据权利要求28-35中任何一项的细菌递送媒介物,其中所述细菌递送媒介物包含所述感兴趣的DNA有效载荷。
37.根据权利要求28-36中任何一项的细菌递送媒介物,其中所述DNA有效载荷包含选自以下的感兴趣的核酸:Cas核酸酶基因,Cas9核酸酶基因,引导RNA,CRISPR基因座,毒素基因,表达酶比如核酸酶或激酶、TALEN、ZFN、大范围核酸酶、重组酶、细菌受体、膜蛋白、结构蛋白、分泌蛋白的基因,表达对抗生素或一般药物的抗性的基因,表达毒性蛋白或毒性因子的基因和表达毒力蛋白或毒力因子的基因,或任何其组合。
38.根据权利要求37的细菌递送媒介物,其中所述核酸酶靶向宿主细菌细胞染色体或宿主细菌细胞质粒的切割。
39.根据权利要求38的细菌递送媒介物,其中所述切割发生在抗生素抗性基因中。
40.根据权利要求28-39中任何一项的细菌递送媒介物,其中所述有效载荷包含核酸序列SEQ ID NO:33或核酸序列SEQ ID NO:42或者由其组成。
41.根据权利要求37的细菌递送媒介物,其中所述感兴趣的核酸编码治疗性蛋白。
42.根据权利要求37的细菌递送媒介物,其中所述感兴趣的核酸编码反义核酸分子。
43.药用或兽药用组合物,其包含根据权利要求28-42中任何一项的细菌递送媒介物和药学上可接受的载剂。
44.根据权利要求43的药用或兽药用组合物,其中所述组合物用于口服给予。
45.用于将感兴趣的DNA有效载荷体内递送到受试者中的方法,其包括给予所述受试者权利要求43或44的药用或兽药用组合物。
46.用于治疗由细菌引起的疾病或障碍的方法,其包括给予患有需要治疗的疾病或障碍的受试者权利要求43或44的药用或兽药用组合物。
47.根据权利要求46的方法,其中所述疾病或障碍为涉及所述人类微生物组细菌的细菌感染、代谢障碍或病理学。
48.根据权利要求46或47的方法,其中所述组合物口服给予。
49.根据权利要求43或44的药用或兽药用组合物,其用于在用于治疗由细菌引起的疾病或障碍的方法中的用途。
50.根据权利要求49的用于其用途的药用或兽药用组合物,其中所述疾病或障碍为涉及所述人类微生物组细菌的细菌感染、代谢障碍或病理学。
51.根据权利要求49或50的用于其用途的药用或兽药用组合物,其中所述组合物口服给予。
52.用于减少细菌群体中毒力和/或抗生素抗性细菌的量的方法,其包括使所述细菌群体与权利要求28-42中任何一项的细菌递送媒介物接触。
53.根据权利要求28-42中任何一项的细菌递送媒介物,其用于在用于减少细菌群体中毒力和/或抗生素抗性细菌的量的方法中的用途。
54.表达根据权利要求1-25中任何一项的嵌合RBP的生产细胞系。
55.根据权利要求54的生产细胞系,其包含根据权利要求26的核酸和/或根据权利要求27的载体。
56.根据权利要求54或55的生产细胞系,其产生根据权利要求28-42中任何一项的细菌递送媒介物。
57.根据权利要求54-56中任何一项的生产细胞系,其包含为λ原噬菌体的辅助噬菌体,其中(i)所述编码野生型STF蛋白的核酸序列已被编码包含序列SEQ ID NO:11或者由其组成的嵌合RBP的核酸序列替代,(ii)所述编码野生型gpJ蛋白的核酸序列已被编码包含序列SEQ ID NO:27或者由其组成的嵌合gpJ变体的核酸序列替代,和(iii)Cos位点已经被去除,和其中任选地(iv)所述辅助原噬菌体含有防止自发性细胞裂解的突变,比如Sam7突变,和(v)所述辅助原噬菌体含有主cI阻遏物的热敏形式,比如cI857形式。
CN202180094939.7A 2020-12-30 2021-12-29 抵抗蛋白水解降解的嵌合受体结合蛋白 Pending CN116940676A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US63/132090 2020-12-30
EPPCT/EP2020/088043 2020-12-30
US63/132190 2020-12-30
US17/138084 2020-12-30
US202163137989P 2021-01-15 2021-01-15
US63/137989 2021-01-15
PCT/EP2021/087775 WO2022144382A1 (en) 2020-12-30 2021-12-29 Chimeric receptor binding proteins resistant to proteolytic degradation

Publications (1)

Publication Number Publication Date
CN116940676A true CN116940676A (zh) 2023-10-24

Family

ID=88381174

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202180094939.7A Pending CN116940676A (zh) 2020-12-30 2021-12-29 抵抗蛋白水解降解的嵌合受体结合蛋白
CN202180094940.XA Pending CN116940677A (zh) 2020-12-30 2021-12-29 通过以最小传播递送dna有效载荷对宿主的微生物组调节

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202180094940.XA Pending CN116940677A (zh) 2020-12-30 2021-12-29 通过以最小传播递送dna有效载荷对宿主的微生物组调节

Country Status (1)

Country Link
CN (2) CN116940676A (zh)

Also Published As

Publication number Publication date
CN116940677A (zh) 2023-10-24

Similar Documents

Publication Publication Date Title
US11534467B2 (en) Modulation of microbiota function by gene therapy of the microbiome to prevent, treat or cure microbiome-associated diseases or disorders
US11512116B2 (en) Chimeric receptor binding proteins for use in bacterial delivery vehicles
US11746352B2 (en) Microbiome modulation of a host by delivery of DNA payloads with minimized spread
US11208437B2 (en) Branched receptor binding multi-subunit protein complexes for use in bacterial delivery vehicles
WO2020128108A1 (en) Branched receptor binding multi-subunit protein complexes for use in bacterial delivery vehicles
KR20220024603A (ko) 트레이서 핵산 서열을 포함하는 박테리아 전달 비히클
EP4084817A1 (en) Bacterial delivery vehicles for in vivo delivery of a dna payload
US20210196828A1 (en) Bacterial delivery vehicles for in vivo delivery of a dna payload
US11584781B2 (en) Chimeric receptor binding proteins resistant to proteolytic degradation
US20220064223A1 (en) Branched receptor binding multi-subunit protein complexes for use in bacterial delivery vehicles
CN116940676A (zh) 抵抗蛋白水解降解的嵌合受体结合蛋白
WO2022003209A1 (en) Method of containment of nucleic acid vectors introduced in a microbiome population
US20230134572A1 (en) Chimeric receptor binding proteins resistant to proteolytic degradation
KR20230128506A (ko) 단백질분해 소화에 내성인 키메라 수용체 결합 단백질
US20240102026A1 (en) Microbiome modulation of a host by delivery of dna payloads with minimized spread
WO2022144382A1 (en) Chimeric receptor binding proteins resistant to proteolytic degradation
CN117616118A (zh) 生产细菌细胞及其在生产方法中的用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication