CN113215115A - 用于体外病毒基因组工程的组合物和方法 - Google Patents

用于体外病毒基因组工程的组合物和方法 Download PDF

Info

Publication number
CN113215115A
CN113215115A CN202110495059.2A CN202110495059A CN113215115A CN 113215115 A CN113215115 A CN 113215115A CN 202110495059 A CN202110495059 A CN 202110495059A CN 113215115 A CN113215115 A CN 113215115A
Authority
CN
China
Prior art keywords
viral
nucleic acid
bacteriophage
seq
genome
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110495059.2A
Other languages
English (en)
Inventor
K·C·凯蒂
E·M·巴尔布
C·G·迪皮特里洛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
C3j Treatment Co
C3J Therapeutics Inc
Original Assignee
C3j Treatment Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by C3j Treatment Co filed Critical C3j Treatment Co
Publication of CN113215115A publication Critical patent/CN113215115A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16111Cytomegalovirus, e.g. human herpesvirus 5
    • C12N2710/16121Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/10011Details dsDNA Bacteriophages
    • C12N2795/10211Podoviridae
    • C12N2795/10221Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/10011Details dsDNA Bacteriophages
    • C12N2795/10211Podoviridae
    • C12N2795/10222New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/10011Details dsDNA Bacteriophages
    • C12N2795/10311Siphoviridae
    • C12N2795/10321Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/10011Details dsDNA Bacteriophages
    • C12N2795/10311Siphoviridae
    • C12N2795/10322New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/14011Details ssDNA Bacteriophages
    • C12N2795/14111Inoviridae
    • C12N2795/14121Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/14011Details ssDNA Bacteriophages
    • C12N2795/14111Inoviridae
    • C12N2795/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)

Abstract

本公开涉及用于体外病毒基因组工程的组合物和方法。本公开涉及核酸的体外工程的方法。本公开还涉及病毒基因组的体外工程和通过病毒基因组的体外基因组工程对病毒性质进行的改良。具体地,本公开涉及使用RNA引导的Cas9的体外病毒基因组消化,通过将DNA或RNA片段插入消化的病毒基因组中并用所述重组基因组转化宿主细胞来进行的重组基因组的组装。该方法还涉及用于核酸的差错校正的体外工程。

Description

用于体外病毒基因组工程的组合物和方法
本申请是分案申请,原申请的申请日为2015年12月15日,申请号为201580076597.0,发明名称为“用于体外病毒基因组工程的组合物和方法”。
相关申请的交叉引用
本申请根据USC§119(e)要求2014年12月16日提交的美国临时专利申请第62/092,707号,2015年1月12日提交的美国临时专利申请第62/102,362号,以及2015年10月16日提交的美国临时专利申请第62/242,811号,所述美国临时专利申请的每一个的全部内容通过引用并入本文。
序列表
本申请包含对已作为序列表文本文件“SGI1840_3WO_Sequence_Listing_ST25.txt”(文件大小千字节(139kb),创建于2015年12月15日,其依据37C.F.R.1.52(e)(iii)(5)通过引用整体并入本文)与本申请同时提交的核酸序列的引用。
技术领域
本公开总体上涉及基因组的快速工程,更具体地涉及在体外工程化病毒基因组。
背景技术
病毒被用于许多科学应用,尤其是用于预防剂、治疗剂和诊断剂的开发。为了这些目的,往往将病毒进行遗传工程。体内工程需要易控的宿主生物体,并且往往需要数周至数月的时间才能产生经修饰的病毒和病毒载体(Levin和Bull,Nat Rev Microbiol.,2004年2月;2(2):166-73,通过引用并入本文)。另外,在细胞中存在与许多病毒基因组的操作内在地相关的毒性问题。迄今为止,开发用于大型病毒基因组的体外遗传工程的方法的努力受到独特的限制性内切酶靶序列的可用性以及获得的进行基因组消化和随后的重组组装的低效率限制。此外,许多遗传工程的努力被错误预测的病毒基因组末端阻碍。例如,公共可得的PB1-样病毒基因组不正确地将末端序列置于基因组的中间,这是使用当前测序和计算机基因组组装法经常发生的错误(Ceyssens等,Environ Mibrobiol.2009年11月;11(11):2874-83)。
仍然需要病毒基因组的快速遗传工程,尤其是对于感染非遗传上易控的宿主的病毒。本公开利用体外Cas9介导的消化和组装来位点特异性地工程化整个病毒基因组。该方法极大增加了可对病毒基因组进行基因修饰的精确度、简便性和速度。另外,该技术克服了在天然和异源宿主细胞内操作常常有毒的强毒病毒基因组的良好确立的困难。利用所公开的体外工程法还还得能够鉴定正确的病毒基因组末端,这有助于通过本公开的随后的工程。
体外差错校正是用于在克隆或组装技术之后生成所需序列的无价技术。标准差错校正方法是基于PCR的,其具有两个固有的问题:1)PCR可在核酸中引入额外的不想要的突变;2)PCR,在本说明书,在其变得越来越易出错之前,具有约5kb的大小限制(Quick Changesite-directed mutagenesis kit manual,New England Biolabs,USA)。因此,由于PCR生成额外的突变或不能扩增完整模板,因此不能可靠地对大于5kb的质粒进行标准的基于PCR的差错校正法。
发明内容
在本公开的各个方面中,存在用于使用RNA引导的核酸酶在体外工程化核酸序列的组合物和方法。在一个方面,本公开涉及通过病毒核酸序列的体外遗传工程对特定病毒性质的改良和改良的病毒组合物或颗粒。在另一个方面,本公开涉及使用RNA引导的内切核酸酶(例如,Cas9)体外消化病毒核酸序列,随后通过将DNA或RNA片段插入已消化的病毒核酸中来组装重组核酸序列。
在一些实施方案中,本公开提供了包含工程化的病毒核酸的工程化的病毒,所述工程化的病毒核酸在引入宿主细胞时,相较于通过将非工程化的病毒核酸引入宿主细胞而产生的病毒颗粒,能够产生具有两种或更多种改良的病毒性质的非天然存在的病毒颗粒。
在一些方面,所产生的病毒颗粒具有至少3种改良的病毒性质。
在一些方面,每种改良的病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。
在一些方面,所述工程化的病毒核酸是工程化的病毒基因组。
在一些方面,所述工程化的病毒基因组是工程化的噬菌体基因组。在一些方面,改良的病毒性质中的至少一种是宿主范围。
在一些方面,每种改良的病毒性质是工程化的病毒核酸中的至少一个修饰的结果。
在一些方面,至少一种改良的病毒性质是工程化的病毒核酸中的至少两个修饰的结果。
在一些方面,所述工程化的病毒核酸中的至少一个修饰是单个工程化步骤的结果。
在一些方面,所述工程化的病毒核酸中的至少一个修饰是迭代工程化步骤的结果。
在一些方面,至少一个修饰在与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:50或SEQ ID NO:25具有至少85%同一性的核酸序列内。
在一些方面,至少一个修饰在编码与SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:5、SEQ ID NO:48或SEQ ID NO:49具有至少85%同一性的氨基酸序列的核酸序列内。
在一些方面,所述工程化的病毒基因组包含与LUZ19基因组具有至少85%同一性的病毒基因组的全部或部分。在一些方面,所述工程化的病毒基因组还包含异源gp18基因的全部或部分。在一些方面,所述异源gp18基因与SEQ ID NO:26具有至少85%同一性。在一些方面,所述异源gp18基因编码与SEQ ID NO:38具有至少85%同一性的氨基酸序列。
在一些方面,所述工程化的病毒基因组包含与LUZ19基因组具有至少85%同一性的病毒基因组的全部或部分。在一些方面,所述工程化的病毒基因组还包含工程化的gp34基因的全部或部分。在一些方面,所述工程化的gp34基因编码在对应于SEQ ID NO:5的氨基酸位置55的位置处包含突变的氨基酸序列。
在一些方面,工程化的病毒基因组包含与LUZ19基因组具有至少85%同一性的病毒基因组的全部或部分。在一些方面,所述工程化的病毒基因组还在与选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3和SEQ ID NO:50组成的组的序列具有至少85%同一性的一个或多个序列中包含修饰。在一些方面,所述工程化的病毒基因组还在以下序列中的每一个中包含修饰:与SEQ ID NO:1具有至少85%同一性的序列、与SEQ ID NO:2具有至少85%同一性的序列、与SEQ ID NO:3具有至少85%同一性的序列以及与SEQ ID NO:50具有至少85%同一性的序列。在一些方面,所述修饰包括对应于SEQ ID NO:1的核酸位置50的位置处的G至A的替换、对应于SEQ ID NO:50的核酸位置160的位置处的G至T的替换、对应于SEQ IDNO:2的核酸位置245的位置处的A至G的替换、对应于SEQ ID NO:2的核酸位置247-248的位置处的AT至TC的替换以及对应于SEQ ID NO:3的核酸位置757的位置处的A至G的替换。
在一些方面,所述工程化的病毒基因组包含与LUZ19基因组具有至少85%同一性的病毒基因组的全部或部分。在一些方面,所述工程化的病毒基因组还在编码与选自由SEQID NO:34、SEQ ID NO:35、SEQ ID NO:36和SEQ ID NO:48组成的组的序列具有至少85%同一性的氨基酸序列的一个或多个核酸序列中包含修饰。在一些方面,所述工程化的病毒基因组在编码以下氨基酸序列中的每一个的核酸序列中包含修饰:与SEQ ID NO:34具有至少85%同一性的氨基酸序列、与SEQ ID NO:35具有至少85%同一性的氨基酸序列,与SEQ IDNO:36具有至少85%同一性的氨基酸序列和与SEQ ID NO:48具有至少85%同一性的氨基酸序列。在一些方面,所述修饰包括对应于SEQ ID NO:34的氨基酸位置17的位置处的C至Y的替换、对应于SEQ ID NO:48的氨基酸位置36的位置处的D至Y的替换、对应于SEQ ID NO:35的氨基酸位置82的位置处的D至G的替换、对应于SEQ ID NO:35的氨基酸位置83的位置处的I至S的替换,以及对应于SEQ ID NO:36的氨基酸位置253的位置处的N至D的替换。
在一些方面,所述工程化的病毒基因组包含与LUZ19基因组具有至少85%同一性的病毒基因组的全部或部分。在一些方面,所述工程化的病毒基因组还在与SEQ ID NO:25具有至少85%同一性的序列内包含修饰。在一些方面,所述修饰是将异源核酸分子插入与SEQ ID NO:25具有至少85%同一性的序列中,或者用异源核酸分子置换包含在与SEQ IDNO:25具有至少85%同一性的序列内的序列。在一些方面,所述异源核酸分子包含与选自由SEQ ID NO:6、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19和SEQ ID NO:20组成的组的序列具有至少85%同一性的异源核酸序列。
在一些方面,所述工程化的病毒基因组包含与LUZ19基因组具有至少85%同一性的病毒基因组的全部或部分。在一些方面,所述工程化的病毒基因组还在编码与SEQ IDNO:49具有至少85%同一性的氨基酸序列的核酸序列内包含修饰。在一些方面,所述修饰是将异源核酸分子插入编码与SEQ ID NO:49具有至少85%同一性的氨基酸序列的核酸序列中,或者用异源核酸分子替换包含在编码与SEQ ID NO:49具有至少85%同一性的氨基酸序列的核酸序列内的核酸序列。在一些方面,所述异源核酸分子包含编码与选自由SEQ IDNO:37、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:44、SEQ IDNO:45、SEQ ID NO:46和SEQ ID NO:47组成的组的序列具有至少85%同一性的氨基酸序列的异源核酸序列。
在一些方面,所述工程化的病毒核酸包含可操作地连接至启动子的异源核酸序列,所述启动子含有包含在SEQ ID NO:21或其部分内的核酸序列。
在一些方面,所述工程化的病毒核酸包含可操作地连接至终止子的异源核酸序列,所述终止子包含SEQ ID NO:22或其部分的核酸序列。
在一些实施方案中,本公开提供了用于生成具有两种或更多种所需病毒性质的工程化的目标病毒的方法,其包括:(a)提供第一病毒基因组;和(b)通过将第一病毒基因组的至少一个片段与至少一种修复核酸分子组合以生成工程化的第二病毒基因组来生成工程化的病毒基因组,所述第二病毒基因组相较于所述第一病毒基因组包含至少一个修饰;其中,所述第二病毒基因组在引入宿主细胞中时能够产生具有两种或更多种改良的病毒性质的病毒颗粒。
在一些方面,所述方法还包括(c)在一次或多次迭代中重复步骤(a)-(b)。
在一些方面,每种改良的病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。
在一些方面,可互换使用一种或多种改良的性质和一种或多种改良的病毒性质。
在一些方面,在步骤(b)中生成工程化的病毒基因组包括:(1)使用内切核酸酶体外消化第一病毒基因组的区域;和(2)将经消化的第一病毒基因组的至少一个片段与至少一个修复核酸分子组装。
在一些方面,从病毒颗粒分离第一病毒基因组。
在一些方面,从头合成所述第一病毒基因组或所述至少一种修复核酸分子。
在一些方面,从头合成包括组合化学合成的核酸分子、PCR扩增的核酸序列、分离的核酸分子的消化片段或其任何组合。
在一些方面,在体外消化之前扩增所述第一病毒基因组或所述至少一种修复核酸分子。
在一些方面,所述第一病毒基因组为至少3kb、至少10kb、至少18kb、至少25kb或至少30kb。
在一些方面,在体外或体内进行组装。
在一些方面,在对于将片段插入经消化的病毒核酸中以形成包含工程化的病毒基因组的重组核酸是有效的条件下,利用混合物在体外进行组装,所述混合物包含:(a)缺少3'外切核酸酶活性的分离的5'至3'外切核酸酶;(b)具有3'外切核酸酶活性的分离的非链置换DNA聚合酶,或所述DNA聚合酶与缺少3'外切核酸酶活性的第二DNA聚合酶的混合物;(c)分离的连接酶;和(d)dNTP的混合物。
在一些方面,所述内切核酸酶是RNA引导的核酸酶。
在一些方面,所述方法还包括至少一种引导RNA。
在一些方面,所述RNA引导的核酸酶是Cas9或Cas9衍生的酶,并且其中所述至少一种引导RNA包括1)嵌合gRNA或2)crRNA和tracrRNA。
在一些方面,将所述内切核酸酶在组装之前热灭活或去除。
在一些方面,体外消化还包括亚精胺。
在一些方面,所述方法还包括将工程化的病毒基因组转化到宿主细胞中。
在一些方面,所述方法还包括使用用于将工程化的病毒基因组包装到病毒颗粒中的体外包装试剂盒。
在一些实施方案中,本公开提供了通过本文公开的任何方法产生的工程化的病毒。在一些方面,所述工程化的病毒是本文中公开的任何工程化的病毒。
在一些实施方案中,本公开提供了用于工程化病毒核酸分子的试剂盒,其包含:(a)纯化的重组RNA引导的核酸酶;(b)缺少3'外切核酸酶活性的分离的5'至3'外切核酸酶;(c)具有3'外切核酸酶活性的分离的非链置换DNA聚合酶,或所述DNA聚合酶与缺少3'外切核酸酶活性的第二DNA聚合酶的混合物;和(d)分离的热稳定的连接酶。
在一些方面,试剂盒还包含以下的一种或多种:(1)拥挤试剂;(2)dNTP的混合物;和(3)合适的缓冲液。
在一些方面,试剂盒还包括定制设计的引导RNA。
在一些方面,试剂盒还包含定制设计的合成核酸分子,以在组装反应中用作插入的DNA片段。
在一些方面,试剂盒还包含用于转化的感受态宿主细胞。
在一些方面,试剂盒还包含分离的病毒基因组核酸。
在一些实施方案中,本公开提供了体外工程化的病毒核酸系统,其包含:分离的病毒核酸、重组RNA引导的核酸酶、至少一种引导RNA和待插入分离的核酸消化位点的核酸片段。
在一些方面,所述系统使得重组RNA引导的核酸酶和至少一种靶向RNA形成能够消化分离的病毒核酸的复合物。
在一些方面,所述系统还包含亚精胺。
在一些方面,所述系统还包含:缺少3'外切核酸酶活性的分离的5'至3'外切核酸酶;具有3'外切核酸酶活性的分离的非链置换DNA聚合酶,或所述DNA聚合酶与缺少3'外切核酸酶活性的第二DNA聚合酶的混合物;分离的连接酶;和dNTP的混合物,其中所述系统处于对在RNA引导的核酸酶消化位点将核酸片段插入分离的病毒核酸中以形成重组病毒核酸是有效的条件下。
在一些方面,本文所述的系统使得重组病毒核酸与由非工程化的病毒核酸导致的病毒颗粒相比,能够产生具有至少两种改良的病毒性质的非天然存在的病毒颗粒。在一些实例中,改良的一种或多种病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。
在一些方面,在本文所述的系统中,RNA引导的核酸酶是Cas9或Cas9衍生的酶。在一些方面,将RNA引导的核酸酶在组装之前灭活或去除。
在一些实施方案中,本公开提供了工程化核酸序列的方法,所述方法包括:(a)提供核酸;(b)使用RNA引导的核酸酶体外消化核酸区域;和(c)通过将DNA片段插入消化的核酸中来组装重组核酸,其中在对于将片段插入消化的核酸中以形成重组核酸是有效的条件下,利用组分的混合物在单个容器中在体外进行所述组装,所述混合物包含:(i)缺少3'外切核酸酶活性的分离的5'至3'外切核酸酶;(ii)具有3'外切核酸酶活性的分离的非链置换DNA聚合酶,或所述DNA聚合酶与缺少3'外切核酸酶活性的第二DNA聚合酶的混合物;(iii)分离的连接酶;和(iv)dNTP的混合物。
在一些方面,所述RNA引导的核酸酶是Cas9或Cas9衍生的酶。在一些实例中,在组装之前通过暴露于热使RNA引导的核酸酶失活或去除所述核酸酶。
在一些方面,所述方法还包括:(d)将重组核酸转化到宿主细胞中。
在一些方面,本公开提供了工程化核酸的方法,其中所述核酸是从宿主细胞分离的质粒。在一些方面,质粒为至少5kb。在一些方面,质粒为至少6kb。在一些方面,质粒为至少10kb。在一些方面,质粒为至少15kb。在一些方面,质粒为至少20kb。
附图说明
图1A-1F显示了直接工程化病毒基因组的体外方法的示意图。A)利用本领域技术人员已知的方法从纯化的病毒颗粒提取基因组。灰线表示示例性dsDNA病毒基因组。基因组末端的浅灰色线条表示通常在许多病毒基因组中发现的正向末端重复序列。B)然后使用与纯化的靶向RNA(诸如嵌合gRNA、crRNA和tracrRNA或单独的crRNA)偶联的RNA引导的核酸酶(诸如Cas9)在一个或多个位置位点上消化病毒基因组。图示描绘了靶向确定的病毒基因组位置(如由给定的RNA所指定的)的RNA引导的核酸酶。C)使用本领域已知的方法使RNA引导的核酸酶失活,所述方法包括但不限于暴露于热或使用经典的苯酚-氯仿提取去除。D)使用本领域已知的方法获得DNA或RNA插入物,所述方法包括但不限于体外合成、扩增(PCR)或酶介导的从质粒、病毒或细菌基因组DNA(gDNA)的释放。图描绘了具有对应于与侧连RNA引导的核酸酶消化位点的病毒序列的同源区(灰色末端区域)的新生成的插入物(深灰色线)。E)在体外使用本领域已知的方法组装经消化的病毒基因组和纯化的插入物,所述方法包括但不限于Gibson组装、SLIC和/或Golden Gate组装。图示描绘了组装的重组基因组,现在在所需位置具有新的插入序列(深灰色线)。F)使用本领域已知的方法将重组病毒基因组直接转化到宿主细胞中,所述方法包括但不限于电穿孔或化学转化。卡通图显示了在将感染性病毒基因组转化到易感宿主细胞后功能性病毒颗粒的回收。
图2A-2F显示病毒基因组的体外工程。A)直接从病毒颗粒纯化~43kb dsDNALUZ19病毒基因组。B)使用RNA依赖性核酸酶Cas9和体外转录的gRNA在两个独立位置对纯化的病毒基因组进行位点特异性消化,以去除gp7基因片段。C)将PCR用于从病毒ΦKF77扩增gp7基因。D)将体外Gibson组装用于将PCR扩增的ΦKF77 gp7基因片段序列特异性地无缝地整合到经消化的LUZ19基因组中。E)将感染的体外组装的基因组直接转化到宿主细胞中以回收功能性病毒颗粒,通过噬斑形成来证明。F)使用内部和外部引物来PCR验证:病毒在正确的基因组位点含有新的DNA片段。所有测试的病毒克隆对于新的插入ΦKF77 gp7片段(右侧7条泳道)为PCR阳性。
图3A-3B显示了在体外病毒基因组工程后具有改善的病毒性质的病毒的生成。A)描绘天然LUZ19病毒的基因组和含有替换天然LUZ19 gp18序列的LKD16病毒gp18基因的工程化的衍生物的图。黑色箭头表示天然LUZ19开放阅读框架,而灰色箭头表示新整合的LKD16 gp18基因。B)左图,维恩图显示LUZ19和LKD16病毒感染的共享的和独立的宿主细菌。测试了282个铜绿假单胞菌(P.aeruginosa)临床分离株的多样化集合体。右图,维恩图显示含有LKD16 gp18基因的工程化的LUZ19病毒具有扩大的宿主范围,包括先前只被LKD16感染的6个菌株中的3个。
图4A-4C是显示用于鉴定和选择宿主范围扩大和工程化能够感染病毒属的完全宿主范围的广宿主范围病毒所需的遗传元件和点突变的方法的示意图。A)用于鉴定负责宿主范围特异性的突变的方法的示意图。B)描绘生成广宿主范围LUZ19(WHR LUZ19)病毒所需的基因组修饰的意示;星号(*)标识与宿主范围相关的每个点突变的位置。标记gp13 C17Y、gp18 D36Y、gp38 D82G和I83S,以及gp40 N253D描述了与LUZ19宿主扩大相关的基因产物和氨基酸点突变。PA7245、PA7255、PA7410、PA7427、PA7503和PA7686是仅对LKD16和WHR LUZ19易感的铜绿假单胞菌临床分离株;PA7649是仅对ΦKMV和WHR LUZ19敏感的铜绿假单胞菌临床分离物。在给定的突变上方描述在添加给定突变后感染的临床分离株。C)左图,维恩图显示被LUZ19、LKD16和ΦKMV病毒感染的共享和独立的宿主细菌。右图,维恩图显示了含有上述点突变的工程化的WHR LUZ19病毒能够感染所有67个对病毒ΦKMV属易感的菌株。
图5A-5E显示LUZ19 Gp34蛋白的突变提高了裂解活性。A)LUZ19 Gp34蛋白是病毒尾管复合物的成员(见嵌入图像)。B)用于表达野生型LUZ19 Gp34或Gp34Δ亮氨酸55(L55Δ)突变的两个相关噬菌体(噬菌体*)的软琼脂噬斑测定。在两天的时期中获取图像,图像表明表达Gp34 L55Δ突变的噬菌体具有增加的裂解区。C)结晶紫生物膜测定外推生物膜生物质为包含结晶紫的量度。与野生型LUZ19相比,表达Gp34 L55Δ的LUZ19*噬菌体更能够破坏铜绿假单胞菌生物膜(进行8小时)。将庆大霉素以最小抑制浓度(MIC)的10倍用于完全去除生物膜。D)显示gp34突变相较于野生型LUZ19基因组的位置的图示。E)显示LUZ19与表达Gp34 L55Δ的LUZ19之间的吸收和裂解量的差异的表。
图6A-6F是显示具有对两种独立性质的改良的病毒的迭代工程的示意图。A)LUZ19LKD16gp18病毒gDNA的示意图,其中用LKD16同源物替换野生型LUZ19 gp18基因。以黑色表示野生型LUZ19基因组序列;以灰色表示来自LKD16的gp18。B)实验室和MDR临床分离株对纯化的亲本(LKD16和LUZ19)和LUZ19LKD16gp18工程化的病毒的易感性,证明了宿主范围的整合。C)LUZ19*LKD16gp18病毒gDNA的示意图,其中Gp34的位置55处编码的亮氨酸被删除,并且LUZ19gp18被来自病毒LKD16的gp18替换。以黑色表示野生型LUZ19基因组序列;以灰色表示来自LKD16的gp18;灰色星号表示gp34ΔLeu55。D)实验室和MDR临床分离物对纯化的亲本(LKD16、LUZ19和含有来自病毒LKD16的gp18的LUZ19LKD16gp18)和工程化的病毒(含有GP34的位置55处编码的亮氨酸的缺失的LUZ19*和LUZ19*LKD16gp18)的易感性,证明了UZ19LKD16gp18和LUZ19*LKD16gp18病毒宿主范围的整合。E)野生型和工程化的噬菌体针对附着至角质形成细胞单层的细菌的裂解活性的评估。附着至细胞的PA01K和PA7245细菌的数量报告为用角质形成细胞单层孵育的总细菌的百分比。数据显示LUZ19*和LUZ19*LKD16gp18病毒的提高的裂解活性。F)相较于亲代病毒由工程化的噬菌体产生的改良的PAO1K和PA7245的8小时早期生物膜破裂。将庆大霉素以10倍的最小抑制浓度用于完全去除生物膜。显示的数据表示以一式三份重复进行的3个单独的实验。条块表示平均值±SEM;*P<0.01;**P<0.001;***P<0.0001。
图7A-7F是显示对具有两种独立性质的改良的病毒进行迭代工程化的第二实例的示意图。A)经工程化以从改良的gp49基因座表达各种遗传编码的有效载荷的LUZ19的示意图。用含有侧接主要衣壳(gp32)启动子和终止子(Pgp32和Tgp32)的目的基因(GOI)的盒替换gp49基因。生物膜分散性GOI使用:EPS解聚酶(Pp15gp44-来自恶臭假单胞菌(Pseudomonaspudita)
Figure BDA0003053899790000131
的尾部突起gp44;NTUgp34-来自肺炎克雷伯菌(Klebsiella pneumoniae)噬菌体NTUH-K2044-K1-1(NTU)的尾部突起gp34;LKA1gp49-来自铜绿假单胞菌噬菌体LKA1的尾部突起gp49)、来自表皮葡萄球菌(Staphylococcus epidermidis)(PSMa)和金黄色葡萄球菌(Staphylococcus aureus)(PSMa3和PSMb2)的表面活性剂酚溶性调控蛋白(phenolsoluble modulins)和来自伴放线菌聚集菌(Aggregatibacter actinomycetemcomitans)的DspB表面活性素。B)生物膜分散测定显示针对用100个噬菌体处理3小时的24小时的铜绿假单胞菌PAO1K生物膜的工程化的LUZ19噬菌体活性。以10倍的最小抑制浓度(MIC)使用庆大霉素。C)进一步经工程化以从经修饰的gp49基因座表达GOI的先前工程化的WHR LUZ19噬菌体的示意图。D)生物膜分散测定显示经进一步修饰以表达具有针对用100个噬菌体处理3小时的24小时的铜绿假单胞菌PAO1K生物膜的活性的酶和表面活性素的工程化的WHRLUZ19。工程化的有效载荷:EPS解聚酶Pp15gp44和SePSMa。以10倍的MIC使用庆大霉素。E)实验室和临床分离物对纯化的亲本(LKD16和LUZ19)和LUZ19衍生物的易感性,证实了在进一步工程化以表达生物膜分散部分后宿主范围的整合和维持。F)维恩图显示在添加生物膜分散有效载荷Pp15gp44和SePSMa后WHR LUZ19宿主范围的保持。
图8A-8C是显示当与抗生素的亚抑制浓度组合时能够阻止宿主细胞获得病毒抗性的病毒的产生的示意图。A)经工程化以从MS2或PRR1噬菌体表达溶素的野生型LUZ19的图示。B)和C)时间杀灭测定显示铜绿假单胞菌PAO1K对亚抑制浓度(Cb-1/5x MIC)的由表达ssRNA噬菌体的溶素的LUZ19产生的羧苄青霉素的敏化。这些数据表明,与亚抑制抗生素浓度组合的表达非天然溶素的工程化的噬菌体可防止细菌迅速获得对单一病毒的抗性。
图9A-9D是显示能够阻止宿主细胞获得病毒抗性的第二病毒的产生的示意图。A)经工程化以从经修饰的gp49基因座表达细菌素蛋白PyoS5的野生型LUZ19的示意图。B)时间杀灭测定显示,XDRPA菌株PA7416的生长最初被野生型LUZ19抑制,然而,细菌迅速逃避病毒,从而导致细菌再生长。每孔添加约1x 107cfu。在0小时时添加高MOI=10pfu/cfu和低MOI=.01pfu/cfu的指定的病毒或媒介物。C)时间杀灭测定显示,编码PyoS5的LUZ19能够相对于野生型病毒抑制XDRPA菌株PA7416的生长和再生长。每孔添加约1x 107cfu。在0小时时添加高MOI=10pfu/cfu和低MOI=.01pfu/cfu的指定的病毒或媒介物。D)在野生型LUZ19或LUZ19+pyoS5存在的情况下在24小时后PA7416生长的比较。图表描绘了低MOI实验的数据。
图10是整合靶向病毒基因组编辑与噬菌体表型筛选以产生在两个或更多个特征上具有改良的经遗传修饰的噬菌体的系统的示意图。所述系统依赖于对具有所需表型性状的突变型或天然病毒的迭代轮次的筛选和测序,以及在单个或多个工程步骤中将那些性状整合到一个或多个病毒底盘(viral chassis)中。该方法提供了快速鉴定特定噬菌体表型性状背后的遗传元件,将多个独立的突变基因或等位基因整合到单个噬菌体基因组中,以及产生组合两种或更多种改良的性状的工程化的病毒的直接和合理的方法。
图11A-11G显示大肠杆菌(E.coli)噬菌体M13基因组的体外工程。A)大肠杆菌温和噬菌体M13mp18和M13paprika的示意图。B)在利用RNA引导的内切核酸酶Cas9的独立反应中使用gRNA 1和2体外消化的环状M13基因组DNA的凝胶电泳。凝胶下的图分别描绘了未消化和双重消化的M13基因组的环状和线性特征。这些数据表明,两种gRNA均在正确的位置上准确且完全地消化了M13 dsDNA。C)在相同反应中使用gRNA和RNA引导的内切核酸酶Cas9(双重消化)体外消化的环状M13基因组DNA的凝胶电泳。凝胶下的图分别描绘了未消化和双重消化的M13基因组的环状和线性特征。D)显示PCR产生的插入物含有paprika荧光报道分子的凝胶电泳。E)将体外消化的和组装的工程化的M13paprikagDNA转化到大肠杆菌细胞中以回收功能性病毒颗粒。病毒噬斑是暗淡的和遮掩的,因为M13是不裂解宿主细胞,从而导致噬斑形成不良的温和噬菌体。未消化的M13gDNA用作阳性对照。用Cas9消化的,但在插入物不存在(无插入物)的情况下组装的M13 gDNA证明了消化的完整性和本底的低水平。F)M13paprika工程化的噬斑PCR验证。正向和反向引物被设计在插入物同源区的外部。非工程化的M13gDNA产生0.9kb的产物,并用作PCR反应的阴性对照。G)噬斑形成过程中亲本和工程化的M13paprika的荧光(底部)和明视野(顶部)图像。
图12A-12E显示第二大肠杆菌噬菌体基因组的体外工程。A)大肠杆菌噬菌体λΔcII的示意图。线性噬菌体基因组大小为48.5kb。B)在利用RNA引导的内切核酸酶的独立反应中使用gRNA 1和2体外消化的λ基因组DNA的凝胶电泳。凝胶下方的图描绘了线性未消化的产物和预期的消化产物。这些数据表明,gRNA在正确的位置上准确且完全地消化λdsDNA。C)在相同反应中使用gRNA和RNA引导的内切核酸酶体外双重消化的λ基因组DNA的凝胶电泳。凝胶下方的图描绘了线性消化的产物和预期的双重消化产物。D)示意图描述噬菌体λ包装缓冲液用于体外包装野生型和重组噬菌体基因组的用途。按照制造商的方案体外包装Cas9双消化和组装的噬菌体λ基因组,并将其铺在大肠杆菌上以回收新工程化的λΔcII噬菌体。E)λΔcII基因的PCR验证。正向引物位于工程化的区域外部。缺失阳性克隆具有300bp的预期大小。
图13A-13D显示来自人巨细胞病毒病毒(HCMV)的序列的体外工程。A)235kb全长HCMV病毒基因组的示意图。顶部雪茄形基因组代表全长基因组,而黑色部分表示操纵区域。小的白色部分表示使用本文所述的体外工程方法添加的235bp插入物。B)使用两种gRNA和RNA引导的内切核酸酶Cas9体外双重消化的含有HCMV基因组的17.8kb区域的质粒的凝胶电泳。凝胶下方的图描绘了环状未消化的产物和线性双重消化产物。这些数据表明,两种gRNA均在正确的位置上准确且完全地消化HCMV dsDNA序列。C)显示含有新的RL13插入序列的PCR产生的插入物的凝胶电泳。D)经修饰的HCMV序列的PCR验证。正向引物位于工程化区域的外部。插入阳性克隆具有500bp的预期大小。
图14A-14F显示噬菌体末端的快速鉴定。A)从纯化的病毒颗粒分离基因组DNA。B)gDNA(MiSeq或PacBio)的下一代测序和高质量DNA的自动合并读取到更长的组装物中以重建原始序列。以浅灰色表示DTR-正向终端重复。自动组装软件将终末重复基因组的DTR错误地放置在病毒序列的内部区域。通过预测序列的靶向Cas9消化来证实基因组物理末端。C)基于双重覆盖测序区域的鉴定和匹配紧密相关的末端重复基因组的BLAST搜索的物理基因组末端的计算机预测。通过预测的物理末端的Cas9内切核酸酶切割来确认物理末端。D)在Cas9失活后,对对应于基因组物理末端的DNA片段进行纯化和测序。E)基于物理末端测序的准确基因组组装。F)使用在通过计算机基因组重排预测的特定位置处的Cas9靶向消化对LBL3和14-1噬菌体(末端重复基因组)进行基因组物理末端作图的实例。浅灰色箭头指向经纯化和测序的DNA片段。
图15A-15C是嵌合sgRNA设计和合成策略的示意图。A)显示侧接目标基因(GOI)的NGG PAM基序(加以下划线的深灰色序列)和sgRNA靶位点(浅灰色序列)的位置的图示。黑色序列表示剩余的病毒基因组序列。B)用作用于sgRNA的体外转录的模板的寡核苷酸的设计。构成T7启动子、sgRNA靶向序列和保守嵌合sgRNA区域的序列分别以加下划线的深灰色、浅灰色和黑色文本表示。C)体外转录的嵌合sgRNA的图。浅灰色和黑色序列分别表示构成每一个功能性sgRNA的靶向和保守嵌合区。所有N表示用于改变每个sgRNA的靶特异性的可变序列。
具体实施方式
本公开提供了用于体外工程化的组合物和方法,并且还涉及病毒性质的改良。本公开还提供了用于核酸的体外工程方法。
在描述本发明的组合物和方法之前,应当理解,本公开不限于所描述的特定组合物、方法和实验条件,因为此类组合物、方法和条件可变化。还应当理解,本文中使用的术语仅用于描述特定实施方案的目的,并不旨在限制,因为本公开的范围将仅在所附权利要求中予以限制。
除非另有定义,否则本文中使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常理解的含义相同的含义。虽然,与本文中描述的那些方法和材料相似或等同的任何方法和材料可用于本公开的实施或测试,但现在描述优选方法和材料。下面所示的定义是为了理解本公开内容,但绝对不应被认为取代对本领域普通技术人员所持的术语的理解。
如本说明书和所附权利要求中所用,除非上下文另有明确规定,否则单数形式“一个/种(a)”、“一个/种(an)”和“该(the)”包括多个所指物。因此,例如,对“所述方法”的引用包括一个或多个本文所述的类型的方法和/或步骤,这对在阅读本公开等后的本领域技术人员来说将是显而易见的。
如本文中所用,当提及任何数值时,术语“约”或“大致”旨在意指加上或减去所述值的正或负10%的值。例如,“约50℃”(或“大致50℃”)包括从45℃至55℃的温度范围(包括45℃和55℃)。类似地,“约100mM”(或“大致100mM”)包括从90mM至110mM的浓度范围(包括90mM和110mM)。或者,“约”或“大致”可意指在所述值的5%内,或在一些情况下在所述值的2.5%内,或者“约”可意指四舍五入至最接近的有效数字。申请内提供的所有范围都包括该范围的上端和下端的值。
如本文中所用,术语“细胞”、“细胞培养物”、“细胞系”、“重组宿主细胞”、“受体细胞”和“宿主细胞”包括原代受试者细胞及其任何后代,而不与考虑到转移次数。应当理解,并非所有后代与亲本细胞完全相同(由于有意或无意的突变或环境差异);然而,此类改变的后代被包括在这些术语中,只要后代保持与原始转化的细胞相同的功能。
如本文中所用,术语“组装(assembly)”或“组装(assemble)”是指DNA或RNA分子的联接。
如本文中所用,术语“修复核酸分子”是指能够与一个或多个DNA片段或消化的或切割的DNA质粒或DNA核酸分子组装以生成连续核酸序列分子或封闭的质粒DNA的核酸分子。
术语“从头合成”、“从头组装”、“化学合成”和“DNA合成”是指无需预先存在的前体模板来产生核酸序列的方法。
在“体外”进行的本发明的那些方法中,所有蛋白质组分都是分离的和/或基本纯化的。不在活细胞中进行体外组装反应,或不用粗制细胞提取物进行所述反应;在无细胞环境中进行反应。
“功能性RNA分子”是可与一种或多种蛋白质或核酸分子相互作用,以进行或参与影响除产生除所述功能性RNA的基因外的基因或基因产物的表达或活性的结构、催化或调节功能的RNA分子。功能性RNA可以是例如转运RNA(tRNA)、核糖体RNA(rRNA)、反义RNA(asRNA)、微RNA(miRNA)、短发夹RNA(shRNA)、小干扰RNA(siRNA)、CRISPR系统的引导RNA(gRNA)、crispr RNA(crRNA)或反式激活RNA(tracrRNA)、小核仁RNA(snoRNA)、piwi相互作用RNA (piRNA)或核酶。
术语“基因”被广泛地用于指编码多肽或表达的RNA的核酸分子(通常是DNA,但任选的RNA)的任何区段。因此,基因包括编码表达的RNA的序列(其可包括多肽编码序列或例如功能性RNA,诸如核糖体RNA、tRNA、反义RNA、微RNA、短发夹RNA、gRNA、crRNA、tracrRNA、核酶等)。基因还可包含对于其表达是所需的或影响其表达的调控序列,以及以其天然状态与蛋白质或编码RNA的序列缔合的序列,诸如,例如内含子序列,5'或3'非翻译序列等。在一些实例中,基因可以仅指DNA或RNA分子的蛋白质编码部分,其可以包含或可以不包含内含子。基因的长度优选大于50个核苷酸,更优选长度大于100个核苷酸,并且基因的长度可为例如50个核苷酸至500,000个核苷酸,诸如长度为100个核苷酸至100,000个核苷酸,或长度为约200个核苷酸至50,000个核苷酸,或长度为约200个核苷酸至约20,000个核苷酸。基因可获自各种来源,包括从目标来源克隆或从已知或预测的序列信息合成。
术语“核酸”或“核酸分子”是指DNA或RNA(例如,mRNA)的区段,并且还包括具有经修饰的骨架(例如,肽核酸、锁核酸)或经修饰的或非天然存在的核碱基的核酸。核酸分子可以是双链的或单链的;包含基因或其部分的单链核酸可以是编码(有义)链或非编码(反义)链。
如本文中所用,术语“编码序列”或“编码区”是指可被转录以产生功能性RNA或RNA转录物(所述RNA转录物,当被置于适当的表达控制序列下并在适当的细胞机器或酶存在时,可被翻译成多肽)的核酸序列的区域。术语“非编码序列”或“非编码区”是指不被转录并翻译成氨基酸(例如,内含子、非翻译区等)或不被转录或不形成成熟的功能性RNA序列的至少部分的核酸序列的区域。
如本文中所用,术语“蛋白质”或“多肽”旨在包括单个“多肽”以及多个“多肽”,并且是指由通过酰胺键(也是称为肽键)线性连接的单体(氨基酸)组成的分子。术语“多肽”是指两个或更多个氨基酸的任何一条或多条链,并不指特定长度的产物。因此,在“多肽”的定义中包括肽、二肽、三肽、寡肽、“蛋白质”、“氨基酸链”或用于指两个或更多个氨基酸的一条链或多条链的任何其它术语,术语“多肽”可用来替代这些术语中的任何术语或与所述术语互换使用。
核酸分子可“衍生自”指定的来源,其包括核酸区段从指定来源的分离(完整或部分地)。核酸分子还可通过例如从指定的多核苷酸源直接克隆、PCR扩增或人工合成来从所指定的来源衍生,或基于与所指定的多核苷酸源相关的序列。衍生自特定来源或物种的基因或核酸分子还包括相对于所述来源核酸分子具有序列修饰的基因或核酸分子。例如,衍生自来源(例如,特定参考基因)的基因或核酸分子相对于所述来源基因或核酸分子包含非有意或有意引入的一个或多个突变,并且如果有意地引入一个或多个突变(包括取代、缺失或插入),则可通过细胞或核酸的随机或靶向突变(通过扩增或其它分子生物学技术,或通过化学合成或其任何组合)引入序列改变。衍生自编码功能性RNA或多肽的参考基因或核酸分子的基因或核酸分子可编码与所述参考或来源功能性RNA或多肽或与其功能性片段具有至少75%、至少80%、至少85%、至少90%或至少95%序列同一性的功能性RNA或多肽。例如,衍生自编码功能性RNA或多肽的参考基因或核酸分子的基因或核酸分子可编码与所述参考或来源功能性RNA或多肽或与其功能性片段具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的功能性RNA或多肽。
如本文中所用,将“分离的”核酸或蛋白质从其中天然存在所述核酸或蛋白质的其天然环境或背景中取出。例如,将分离的蛋白质或核酸分子从在其天然或自然环境中与其相关的细胞或生物体中取出。在一些情况下,分离的核酸或蛋白质可被部分或基本上纯化,但是不需要特定的纯化水平用于分离。因此,例如,分离的核酸分子可以是已从其被天然地整合到其中的染色体、基因组或附加体中切除的核酸序列。
“纯化的”核酸分子或核苷酸序列或蛋白质或多肽序列基本上不含细胞材料和细胞组分。例如,纯化的核酸分子或蛋白质可以不含除缓冲液或溶剂之外的化学物质。“基本上不含”并不旨在意指除新型核酸分子以外的其它组分是不可检测的。
术语“天然存在的”和“野生型”是指在自然界中发现的形式。例如,天然存在的或野生型核酸分子、核苷酸序列或蛋白质可以存在于天然来源中并从天然来源中分离出来,并且不通过人操作来有意地修饰。
如本文中所用,“表达”包括基因至少以RNA产生的水平进行的表达,“表达产物”包括所得产物,例如多肽或功能性RNA(例如,核糖体RNA、tRNA、反义RNA、微RNA、shRNA、核酶等)。术语“增加的表达”包括促进增加的mRNA产生和/或增加的多肽表达的基因表达的改变。“增加的产量”,当指由基因表达、蛋白质周转率、蛋白质活化状态等导致的蛋白质的丰度或活性蛋白质的丰度时,包括相较于多肽的天然产量或酶促活性,多肽表达的量的增加、多肽的酶促活性的水平的升高或两者的组合。
“外源核酸分子”或“外源基因”是指已被引入(“转化”)至细胞或病毒中的核酸分子或基因。转化的生物体可被称为重组细胞或病毒,可向其中引入另外的外源基因。如果用核酸分子转化的细胞或病毒的后代已经遗传了外源核酸分子,则其也被称为“转化的”或“重组的”。相对于正在转化的生物体,外源基因可来自不同的物种(因而是“异源的”),或者来自相同的物种(因而是“同源的”))。“内源性”核酸分子、基因或蛋白质是天然核酸分子、基因或蛋白质,因为其存在于生物体内或由其天然产生。
另外,如本文中所用,术语“外源的”在基因或蛋白质上下文中是指不衍生自宿主生物体物种的基因或蛋白质。
如本文中所用,术语“转基因”是指外源基因,即通过人干预引入微生物或祖先的基因。
如本文中所用,基因或蛋白质的术语“直向同源物”是指其在另一物种中的功能等同物。
通常在基因或物种名称后面的括号中提供的基因和蛋白质登录号,是可在由美国国立卫生研究院维护的国家生物技术信息中心(NCBI)网站(ncbi.nlm.nih.gov)上公开获得的序列记录的唯一标识符。“GenInfo标识符”(GI)序列标识号对核苷酸或氨基酸序列是特定的。如果序列以任何方式改变,则分配新的GI号码。序列修订历史工具可用于跟踪出现在特定GenBank记录中的序列的各种GI号、版本号和更新日期。基于登录号和GI号搜索和获得核酸或基因序列或蛋白质序列在例如细胞生物学、生物化学、分子生物学和分子遗传学的领域中是众所周知的。
如本文中所用,关于核酸或多肽序列的术语“百分比同一性”或“同源性”被定义为在比对序列以获得最大百分比同一性和引入缺口(必要时)以达到最大百分比同源性后,候选序列中与已知多肽相同的核苷酸或氨基酸残基的百分比。N-末端或C-末端插入或缺失不应被解释为影响同源性,并且少于约30个、小于约20个或小于约10个氨基酸残基的至多肽序列中的内部缺失和/或插入不应被解释为影响同源性。核苷酸或氨基酸序列水平上的同源性或同一性可使用由被定制用于序列相似性搜索的程序blastp、blastn、blastx、tblastn和tblastx(Altschul(1997),Nucleic Acids Res.25,3389-3402,和Karlin(1990),Proc.Natl.Acad.Sci.USA 87,2264-2268)所使用的算法,通过BLAST(基本局部比对检索工具)分析来测定。BLAST程序所使用的方法是首先考虑查询序列与数据库序列之间的相似区段(具有和不具有缺口),然后评估所鉴定的所有匹配的统计显著性,最后只总结满足预先选择的显著性阈值的那些匹配。关于序列数据库的相似性搜索中的基本问题的讨论,参见Altschul(1994),Nature Genetics 6,119-129。用于直方图、描述、比对、期望(即,用于报告针对数据库序列的匹配的统计显著性阈值)、截止值、矩阵和过滤器(低复杂度)的搜索参数可采用默认设置。Blastp、blastx、tblastn和tblastx所使用的默认评分矩阵是BLOSUM62矩阵(Henikoff(1992),Proc.Natl.Acad.Sci.USA 89,10915-10919),其被推荐用于长度超过85的查询序列(核苷酸碱基或氨基酸)。
对于设计用于比较核苷酸序列的blastn,评分矩阵由M(即,一对匹配残基的奖分)对N的比率(即,错配残基的罚分)来设定,其中M和N的默认值分别为+5和-4。可如下调整4个blastn参数:Q=10(缺口产生罚分);R=10(缺口延伸罚分);wink=1(沿着查询序列在每个winkth位置产生词命中);且gapw=16(设定窗口宽度,其中产生含缺口比对)。用于氨基酸序列的比较的同等的Blastp参数设置为:Q=9;R=2;wink=1和gapw=32。可在GCG软件包10.0版中获得的序列间最佳拟合比较可使用DNA参数为GAP=50(缺口产生罚分)和LEN=3(缺口延伸罚分),而蛋白质比较中的同等设置为GAP=8和LEN=2。
因此,当提及本公开的多肽或核酸序列时,包括与全长多肽或核酸序列,或与包含完整蛋白质的至少100个、至少125个、至少150个或更多个氨基酸残基的连续序列的其片段具有至少40%、至少45%、至少50%、至少55%、至少70%、至少65%、至少70%、至少75%、至少80%或至少85%,例如至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或约100%序列同一性的序列同一性;此类序列的变体,例如,其中至少一个氨基酸残基已被插入含有插入和取代的公开序列的N和/或C末端,和/或其内。设想的变体可另外或可选地包括通过例如同源重组或定点或PCR诱变而包含预定突变的那些变体,以及其它物种的相应多肽或核酸,包括但不限于本文所述的那些,等位基因或含有插入和取代的多肽或核酸家族的其它天然存在的变体;和/或衍生物,其中所述多肽已通过取代、化学、酶促或其它合适的方式利用除天然存在的氨基酸外的部分进行了共价修饰,所述部分含有插入和取代(例如,可检测部分诸如酶)。
术语“天然的”在本文中用于指当它们天然存在于宿主、生物体或病毒中时的核酸序列或氨基酸序列。术语“非天然的”在本文中用于指不天然存在于宿主、生物体或病毒中的核酸序列或氨基酸序列。已从细胞或病毒中取出,经历实验室操作,和被引入或再引入宿主细胞或病毒中的核酸序列或氨基酸序列被认为是“非天然的”。引入宿主细胞或病毒的合成或部分合成的基因是“非天然的”。非天然基因还包括可操作地连接至已被重组至宿主基因组中的一个或多个异源调控序列的对于病毒是内源的基因。
“重组”或“工程化的”核酸分子是通过人操作而改变的核酸分子。作为非限制性实例,重组核酸分子包括以下任何核酸分子:1)已在体外例如使用化学或酶促技术(例如,通过使用化学核酸合成,或通过使用用于核酸分子的复制、聚合、消化(核酸外切的或核酸内切的)、连接、逆转录、转录、碱基修饰(包括,例如,甲基化)、整合或重组(包括同源和位点特异性重组)的酶部分或完全合成或修饰的核酸分子);2)包括在自然界中并非联接的联接的核苷酸序列的核酸分子,3)已使用分子克隆技术进行工程化,使得其相对于天然存在的核酸分子序列缺少一个或多个核苷酸的核酸分子,和/或4)已使用分子克隆技术进行操作,使得其相对于天然存在的核酸序列具有一个或多个序列变化或重排的核酸分子。作为非限制性实例,cDNA是重组DNA分子,对于已通过体外聚合酶反应产生的,或已将接头附接至其的,或已被整合到载体诸如克隆性载体或表达载体中的任何核酸分子亦如此。
如本文中所用,术语“重组蛋白质”是指通过基因工程产生的蛋白质。
当应用于生物体或病毒时,术语重组、工程化的或遗传工程化的是指已通过将异源或外源(例如,非天然的)重组核酸序列引入生物体或病毒而对其进行了操作的生物体或病毒,包括但不限于基因敲除、靶向突变和基因替换、启动子替换、缺失或插入或核酸分子例如转基因、合成基因、启动子或其它序列至生物体或病毒中的转移。重组或遗传工程化的生物体或病毒也可以是其中已引入了用于基因“敲除”的构建体的生物体或病毒。此类构建体包括但不限于一种或多种引导RNA、RNAi、微RNA、shRNA、siRNA、反义和核酶构建体。还包括其基因组已被Cas核酸酶、大范围核酸酶或锌指核酸酶的活性改变的生物体或病毒。外源或重组核酸分子可被整合到重组/遗传工程化的病毒或生物体的基因组中,或在其它情况下不被整合到重组/遗传工程化的病毒或生物体的基因组中。如本文中所用,“重组病毒”或“重组宿主细胞”包括本公开的重组病毒的后代或衍生物。因为某些修饰可由于突变或环境影响而存在于连续世代中,所以此类后代或衍生物实际上可能与亲本细胞不完全相同,但仍包括在本文所用术语的范围内。
如本文中所用,术语“工程化步骤”是指本文公开的或本领域已知的任何工程化方法的执行。例如,“工程化步骤”可以是一轮目标工程化方法,诸如,例如单轮本文中公开的外工程化方法、单次PCR介导的诱变或将两片DNA连在一起的单次连接反应。同样,“迭代工程化步骤”是指连续两次或更多次执行工程化方法。
当用于指多核苷酸、基因、核酸、多肽或酶时,术语“异源的”是指不从宿主物种来源的多核苷酸、基因、核酸、多肽或酶。例如,如本文中所用,“异源基因”或“异源核酸序列”是指来自与其所被引入的宿主生物或病毒的物种不同的物种的基因或核酸序列。当提及基因调控序列或用于操纵基因序列表达的辅助核酸序列(例如5'非翻译区、3'非翻译区、polyA添加序列、内含子序列、剪接位点、核糖体结合位点、内部核糖体进入序列、基因组同源区、重组位点等)或编码蛋白质结构域或蛋白质定位序列的核酸序列时,“异源的”意指调控或辅助序列或编码蛋白质结构域或定位序列的序列来自与在基因组、染色体或附加体中与调控或辅助核酸序列或编码蛋白质结构域或定位序列的核酸序列并置的基因不同的来源。因此,与其在其天然状态(例如,在非遗传工程化的生物体或病毒的基因组中)不与其可操作地连接的基因可操作地连接的启动子在本文中被称为“异源启动子”,即使所述启动子可来源于与其所连接至的基因相同的物种(或在一些情况下,相同的生物体或病毒)。类似地,当提及工程化的蛋白质的蛋白质定位序列或蛋白质结构域时,“异源的”意指所述定位序列或蛋白质结构域来源于与通过基因工程将其整合到其中的蛋白质不同的蛋白质。
“调控序列”、“调控元件”或“调控元件序列”是指位于编码序列上游(5')、内部或下游(3')的核苷酸序列。编码序列的转录和/或由编码序列的转录产生的RNA分子的翻译通常受调控序列的存在或不存在影响。这些调控元件序列可包含启动子、顺式元件、增强子、终止子或内含子。调控元件可从特定多核苷酸序列的非翻译区(UTR)分离或鉴定。本文所述的任何调控元件可存在于嵌合或杂交调控表达元件中。本文所述的任何调控元件可以存在于本发明的重组构建体中。
术语“启动子”、“启动子区”或“启动子序列”是指能够结合RNA聚合酶以引发基因按5'至3'(“下游”)方向转录的核酸序列。当RNA聚合酶与启动子的结合是所述基因转录的近因时,基因“处于启动子的控制之下”或“受启动子调控”。启动子或启动子区通常为RNA聚合酶和适当的转录启动所必需的其它因子提供识别位点。启动子可从基因的基因组组拷贝的5'非翻译区(5'UTR)分离。或者,可通过改变已知DNA元件来合成产生或设计启动子。还考虑了将一个启动子的序列与另一个启动子的序列组合的嵌合启动子。启动子可通过它们基于例如代谢、环境或发育条件的表达模式来定义。启动子可用作用于调节可操作地连接的可转录的多核苷酸分子(例如,编码序列)的表达的调控元件。除了被RNA聚合酶(和优选其它转录因子)识别的序列以外,启动子还可包含影响可操作地连接的基因的转录的调控元件,诸如顺式元件或增强子结构域。“病毒启动子”是启动位于病毒基因组内的一个或多个基因的转录的天然或非天然启动子。
如本文中所用,术语“组成型”启动子是指在大多数环境和发育条件下具有活性的启动子。无论外部环境诸如光和培养基组成如何,组成型启动子都是具有活性的。在一些实例中,组成型启动子在营养物存在和不存在的情况下是有活性的。例如,组成型启动子可以是在氮耗尽的条件下以及在其中氮不是限制(氮充足条件)的条件下具有活性的(介导与其可操作地连接的基因的转录)的启动子。相反地,“诱导型”启动子是响应于特定环境条件(诸如营养物或调节剂的存在或不存在、光的存在等)的启动子。
如本文中所用,术语“可操作地连接的”表示这样的构型,这样的构型中,将控制序列相对于多核苷酸序列的编码序列置于适当的位置,以使得所述控制序列指导或调控多肽和/或功能性RNA的编码序列的表达。因此,如果启动子可介导核酸序列的转录,则启动子与核酸序列可操作地连接。当被引入宿主细胞时,表达盒可在合适的条件下导致编码的RNA或多肽的转录和/或翻译。不被翻译或不能被翻译的反义或有义构建体不被该定义排除。在转基因的表达和内源基因的抑制(例如,通过反义或RNAi)的情况下,普通技术人员将认识到插入的多核苷酸序列不必相同,但可以仅与它所源自的基因的序列基本上相同的。如本文所解释的,这些基本上相同的变体通过参考特定的核酸序列而被具体涵盖。
如本文中所用,术语“选择标记”或“选择标记基因”包括赋予细胞表型的任何基因,在所述细胞中所述基因被表达以有利于选择用本发明的核酸构建体转染或转化的细胞。该术语还可用于指实现所述表型的基因产物。选择标记的非限制性实例包括:1)赋予抗生素抗性的基因诸如阿米卡星(aphA6)、氨苄青霉素(ampR)、杀稻瘟菌素(bls、bsr、bsd)、博来霉素或腐草霉素(ZEOCINTM)(ble)、氯霉素(cat)、依米丁(RBS14p或cry 1-1)、红霉素(ermE)、G418(GENETICINTM)(neo)、庆大霉素(aac3或aacC4)、潮霉素B(aphIV、hph、hpt)、卡那霉素(nptII)、甲氨蝶呤(DHFR mtxR)、青霉素和其它β-内酰胺酶(多种β-内酰胺酶)、链霉素或壮观霉素(aadA、spec/strep)和四环素(tetA、tetM、tetQ)基因;2)赋予对除草剂的抗性的基因,所述除草剂是诸如氨基三唑、杀草强、andrimid、芳氧基苯氧基丙酸酯、莠去津、联吡啶鎓、溴苯腈、环己二酮肟、茅草枯、麦草畏、氯甲草(diclfop)、二氯苯基二甲基脲(DCMU)、difunone、二酮腈、敌草隆、氟草酮、草铵膦、草甘膦、卤代羟苄腈、吡氟氯禾灵(haloxyfop)、4-羟基吡啶、咪唑啉酮、异噁氟草(isoxasflutole)、异噁唑、异噁唑烷酮、miroamide B、对-硝基二苯基醚、达草灭、噁二唑、间-苯氧基苯甲酰胺、N-苯基酰亚胺、唑啉草酯(pinoxadin)、原卟啉原(protoporphyrionogen)氧化酶抑制剂、哒嗪酮、吡唑啉酯、磺酰脲、1,2,4-三唑嘧啶、三酮或尿素;乙酰辅酶A羧化酶(ACCase);乙酰羟酸合酶(ahas);乙酰乳酸合酶(als、csr1-1、csr1-2、imr1、imr2)、氨基糖苷磷酸转移酶(apt)、邻氨基苯甲酸合酶、溴苯腈腈水解酶(bxn)、细胞色素P450-NADH-细胞色素P450氧化还原酶、茅草枯脱卤素酶(dehal)、二氢蝶酸合酶(sul)、I类5-烯醇丙酮酸莽草酸-3-磷酸合酶(EPSPS)、II类EPSPS(aroA)、非I/II类EPSPS、谷胱甘肽还原酶、草甘膦乙酰转移酶(gat)、草甘膦氧化还原酶(gox)、羟基苯基丙酮酸脱氢酶、羟基苯基丙酮酸双加氧酶(hppd)、异戊二烯基焦磷酸酯异构酶、番茄红素环化酶、膦丝菌素乙酰基转移酶(pat、bar)、八氢番茄红素去饱和酶(crtI)、异戊二烯基转移酶、原卟啉氧化酶、psbA光系统II多肽(psbA)和SMM酯酶(SulE)、超氧化物歧化酶(sod);3)可用于营养缺陷型菌株或赋予其它代谢作用的基因,诸如arg7、his3、hisD、hisG、lysA、manA、metE、nit 1、trpB、ura3、xylA、二氢叶酸还原酶基因、甘露糖-6-磷酸异构酶基因、硝酸还原酶基因或鸟氨酸脱羧酶基因;阴性选择因子诸如胸苷激酶;或毒素抗性因子诸如2-脱氧葡萄糖抗性基因。
“报道基因”是编码可检测的或具有产生可检测产物的活性的蛋白质的基因。报道基因可编码产生可检测信号的视觉标记物或酶,诸如cat、lacZ、uidA、xylE、碱性磷酸酶基因、α-淀粉酶基因、α-半乳糖苷酶基因、β-葡糖苷酸酶基因、β-内酰胺酶基因、辣根过氧化物酶基因、荧光素/荧光素酶基因、R-基因座基因、酪氨酸酶基因或编码荧光蛋白的基因,所述荧光蛋白包括但不限于蓝色、青色、绿色、红色、paprika或黄色荧光蛋白、可光转换的、可光开关的或光学高亮标识的荧光蛋白或其变体的任一种,包括但不限于密码子优化的、快速折叠的、单体的、具有增加的稳定性的和具有增强的荧光的变体。
本文中所用,术语“RNA引导的核酸酶”或“RNA引导的内切核酸酶”是指被一种或多种引导性RNA引导至切割靶位点的核酸切割酶。RNA引导的核酸酶的非限制性实例包括Cas9、Cpf1、C2c1、C2c2和C2c3。
如本文中所用,术语“终止子”或“终止子序列”或“转录终止子”是指引起RNA聚合酶停止转录的遗传序列的调控区。
如本文中所用,术语“引入宿主细胞”和“转化”是指通过使用一种或多种物理、化学或生物学方法将一个或多个外源核酸序列或多核苷酸引入宿主细胞或生物体。物理和化学转化方法(即,“转染”)包括(以非限制性实例的方式)电穿孔、微粒轰击、化学诱导的感受态和脂质体递送。转化的生物学方法(即,“转导”)包括使用病毒或微生物(例如,土壤杆菌属(Agrobacterium))转移DNA。
如本文中所用,“设计”基因组是指确定最终目标基因组的所需核酸序列。所述设计可通过基础知识、文献来源、实验数据或其任何组合来告知。
如本文中所用,当指核酸分子、蛋白质、病毒颗粒或其组合时,“重组”或“工程化的”意指通过人操作生成的非天然存在的核酸分子、蛋白质、病毒颗粒或其组合。作为非限制性实例,重组或工程化的核酸分子可包括以下的任何核酸分子:1)已在体外例如使用化学或酶促技术(例如,通过使用化学核酸合成,或通过使用用于核酸分子的复制、聚合、消化(外切核酸的或内切核酸的)、连接、逆转录、转录、碱基修饰(包括,例如,甲基化)、整合或重组(包括同源和位点特异性重组)的酶部分或完全合成或修饰的核酸分子);2)包括在自然界中并非联接的联接的核苷酸序列的核酸分子,3)已使用分子克隆技术进行工程化,使得其相对于天然存在的核酸分子序列缺少一个或多个核苷酸的核酸分子,和/或4)已使用分子克隆技术进行操作,使得其相对于天然存在的核酸序列具有一个或多个序列变化或重排的核酸分子。作为非限制性实例,cDNA是重组DNA分子,对于已通过体外聚合酶反应产生的,或已将接头附接至其的,或已被整合到载体诸如克隆性载体或表达载体中的任何核酸分子亦如此。重组或工程化的RNA或蛋白质是分别从重组或工程化的核酸分子转录或翻译的RNA或蛋白质。重组或工程化的病毒颗粒或病毒是从工程化病毒序列或病毒基因组产生的病毒颗粒或病毒。
术语“病毒基因组”是指包含在病毒颗粒中的一种或多种DNA或RNA分子中的完整遗传互补序列,包括基因和非编码序列。术语“工程化的病毒基因组”是指非天然存在的病毒基因组,其是人操作的结果,并且能够在被引入相容的宿主细胞中时产生非天然存在的病毒颗粒。
术语“病毒核酸”是指包含衍生自病毒基因组的序列的核酸。“病毒核酸”可包含整个病毒基因组或病毒基因组的部分。病毒核酸可编码包含病毒蛋白质的氨基酸序列。在一些情况下,由给定的病毒开放阅读框架编码的完整的、成熟的蛋白质或多肽序列可以不被定义或表征。本文提供的由病毒核酸序列编码的氨基酸序列(其可包括适合于突变(诸如改变、缺失或替换)或异源序列的插入的位点)在本文中可被公开为编码氨基酸序列,编码氨基酸序列可包含病毒多肽或蛋白质的全部或部分。
术语“病毒颗粒”和“病毒体”是指当不在感染的细胞内部或不在感染细胞的过程中时病毒存在的独立形式。这些病毒颗粒(病毒体)由被称为衣壳的蛋白质外壳包围的DNA或RNA基因组组成。一些病毒体还可在衣壳蛋白质外壳内或外部具有额外的脂质包膜。术语“病毒颗粒”、“病毒体”和“病毒”可以互换使用。
如本文中所用,术语“病毒性质”是指病毒复制或生命周期的任何方面或由病毒复制或生命周期产生的方面。如本文中所用,“病毒性质”通常是指可通过人干预来改变或工程化以实现期望结果的性质。病毒性质的非限制性实例包括宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。在一些方面,改良的性质或改良的多种性质和改良的病毒性质或改良的多种病毒性质可互换使用。
术语“细菌噬菌体”和“噬菌体”可互换使用,并且是指感染细菌的病毒。
CRISPR系统
CRISPR(成簇规律间隔短回文重复)是含有短的碱基序列重复的DNA基因座。每个重复之后是来自先前对可移动遗传元件的暴露的“间隔子DNA”的短区段。在约40%的已测序的细菌基因组和90%的已测序的古细菌中发现了CRISPR。CRISPR通常与编码与CRISPR功能相关的蛋白质的CRISPR相关(cas)基因相关。CRISPR-Cas系统是原核生物免疫系统,其赋予对外来遗传元件诸如质粒和噬菌体的抗性,并提供获得性免疫的形式。CRISPR间隔区编码小的crRNA,该序列特异性引导Cas内切核酸酶至靶向序列,并在真核生物中以类似于RNAi的方式切割这些外源遗传元件。
II型CRISPR-Cas系统已在许多物种被用于基因编辑和基因调控。这些系统特别有用,因为它们仅需要单个Cas内切核酸酶(Cas9)和靶向crRNA。在天然系统中,内切核酸酶Cas9需要两个独立转录的RNA用于活性,然而,这两种RNA也可共价连接以形成单个嵌合gRNA。通过将Cas9蛋白和适当的gRNA递送至细胞中,可在任何所需的位置处切割生物体的基因组。CRISPR-Cas系统构成了RNA引导的防御系统,其针对病毒、质粒和其它可移动遗传元件进行保护。该个防御途径具有3个步骤。首先,将入侵核酸的拷贝整合到CRISPR阵列中。然后,将CRISPR阵列转录成大的CRISPR转录物,随后加工成成熟的crRNA。然后将crRNA并入效应子复合物中,其中所述crRNA将复合体引导至入侵核酸,Cas蛋白降解该核酸。如上所述,天然II型CRISPR-Cas系统需要反式激活crRNA(tracrRNA)和前-crRNA以使得能够Cas9活化。该tracrRNA与前crRNA互补和与其碱基配对,从而形成RNA双链体。所述RNA双链体被RNA酶III(一种RNA特异性核糖核酸酶)切割以形成crRNA/tracrRNA杂交体。该杂交体用作Cas9内切核酸酶的引导者,所述Cas9内切核酸酶切割侵入性核酸,从而在侵入性DNA中生成双链断裂以保护宿主细胞。Cas9介导的切割严格依赖于原型间隔区邻近基序(PAM)在靶核酸中的存在。对Cas9进行编程以在由引导RNA界定的特异性位点切割的能力已导致其被采用作用于基因组工程化和基因调控的通用平台。已在2014年3月6日发布的美国专利申请公开第2014/0068797号、2014年6月19日发布的2014/0170753以及2014/0273037以及2014/0273226(其两者均于2014年9月18日公布)中描述了该基因组工程方法,所有所述的美国专利申请公开均通过引用并入。
已描述了可用于基因组工程的其它可编程CRISPR-Cas系统,包括Cpf1、C2c1、C2c2和C2c3系统。该Cpfl1系统是V型CRISPR系统,并通过单靶向引导RNA介导粘性DNA切割(Zetsche等,Cell(2015)163,1-13)(通过引用并入)。C2c1和C2c3均为V型CRISPR系统,而C2c2被认为是VI型CRISPR系统(Shmakov等,Molecular Cell(2015)60,1-13)(通过引用并入)。
DNA组装
存在本领域已知的用于在遗传工程中组装DNA的各种方法。使用两步基于热循环仪的方法来组装生殖支原体(M.genitalium)基因组的部分,如Gibson,D.G.等,“Completechemical synthesis,assembly,and cloning of a Mycoplasma genitalium genome.”Science(2008)319:1215-1220(通过引用并入)和PCT公开WO2009/103027(通过引用并入)中描述的。另一种方法由Li,M.Z.等,Nature Meth.(2007)4:251-256(通过引用并入)描述。在PCT公开WO2006/021944(通过引用并入)中公开了使用T7 5'外切核酸酶和单链DNA结合蛋白的单步组装法。用于组装化化合物以用于高通量筛选的组合技术目前已被良好确立。另外,其中对编码序列随机分段和再退火的基因改组技术已经实践了多年。例如,在Meyer,M.等“Combinatorial Recombination of Gene Fragments to Construct a Library ofChimeras”Current Protocolsin Protein Science(2006)26.2.1-26.2.17;McKee,A.E.等,JBEI摘要中描述了产生嵌合基因片段的文库的方案。已建立了用于将各种组分组装成完整或最小基因组的技术。例如,2007年11月15日公布的美国专利公开2000/0264688(通过引用并入)描述了用于通过生成和组装包含基因组的部分的盒构建合成基因组的方法。在2007年1月4日公布的美国专利公开第2007/004041号(通过引用并入)中描述了用于组装核酸的逐步分层方法。
另外,分别在2010年2月11日和2012年3月1日公布的美国专利申请公开第2010/0035768号和第2012/0053087号(两者均通过引用并入)中描述了用于组装DNA的单容器法。该方法被称为吉布森组装法,并且允许多个DNA片段的成功组装,而不管片段长度或末端相容性。在等温条件下在单管中使用三种酶活性(5'外切核酸酶生成长悬突,聚合酶填充退火的单链区域的间隙,以及DNA连接酶封闭退火和填充间隙的切口)进行吉布森组装反应。该方法已被广泛采用,是世界范围内合成生物学项目的主要工作骨干。通过应用该方法,从600个重叠的60聚集体组装了16.3kb的小鼠线粒体基因组。与在酵母中的体内组装组合,吉布森组装用于合成1.1Mbp蕈状支原体(Mycoplasma mycoides)基因组。将合成的基因组移植到山羊支原体(M.capricolum)受体细胞,产生新的自我复制的蕈状支原体细胞。5'外切核酸酶活性往回咀嚼(chew back)5'末端序列并暴露出互补序列以用于退火。然后,聚合酶活性填充退火区域上的间隙。然后DNA连接酶封闭切口并将DNA片段共价地连接在一起。毗邻片段的重叠序列比在Golden Gate组装中使用的重叠序列长得多,因此导致更高百分比的正确组装。
病毒
病毒是仅在活宿主细胞内复制的超微观和代谢惰性的感染因子。病毒可感染所有类型的生命形式,包括动物、植物、真菌、藻类、细菌和古细菌。当不在感染细胞内或感染细胞的过程中时,病毒以独立颗粒的形式存在。这些病毒颗粒(病毒体)由被称为衣壳的蛋白质外壳包围的DNA或RNA基因组成。一些病毒体还可在衣壳蛋白质外壳内或外部具有额外的脂质包膜。
存在两个病毒复制周期,然而,在原核生物与真核生物病毒领域之间术语是不同的。潜伏或溶源性病毒将病毒遗传物质整合到宿主细胞的基因组中或形成附加型复制子。当宿主细胞复制时,病毒遗传物质也被复制并继续与宿主基因组分离,直至病毒的产生开始。病毒产生和细胞死亡的开始是裂解或毒性周期的标志物。在裂解周期期间,病毒基因组与宿主基因组分开复制,并劫持细胞的复制和翻译机器,以产生更多的病毒。一旦有足够的病毒累积,专门的病毒蛋白会溶解宿主细胞壁和/或膜。宿主细胞因高内部渗透压而爆裂(称为裂解的过程)。这将子代病毒释放至其中它们可感染其它细胞并重复该过程的环境中。毒性病毒是不进入潜伏或溶源性状态,而是仅通过劫持宿主细胞机制进行复制(与进入潜伏状态的温和病毒相反)的病毒。
病毒突变研究
如本文中所用,病毒突变研究是指快速进化、适应和/或随机或定向诱变研究,并且所述术语可以互换使用。整合和/或适应研究包括针对特定性状或在特定条件下选择病毒。这些方法因病毒复制中固有的天然高突变率而对于病毒是特别有用的,所述高突变率导致大量的病毒多样性。例如,可在高温条件下使株进化,以观察在这些条件下促进存活和繁殖的分子变化。作为非限制性实例,可使用病毒或噬菌体实验进化或适应来选择在以下方面具有变化的变体:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节或靶向宿主基因组消化或编辑。病毒进化或适应性实验的非限制性实例包括共感染、协同进化或共转化实验。共感染是指多于一种病毒同时感染相同宿主,这通常导致两种或多种病毒之间的基因交换。协同进化是指其中两种或更多种病毒或细菌噬菌体之间的重组在在受纳或非受纳宿主内发生的研究,所述重组导致具有不同病毒性质(诸如,例如,更广的宿主范围)的新病毒或细菌噬菌体的组装。共转化是指当将两种裸露的基因组一起转化到受纳或非受纳菌株中时。这些进化或适应研究中的任何一种可在受纳(易感的)或非受纳(抗性)宿主中进行。这些类型的实验通常包括将病毒在一种或多种其它选择的病毒不存在或存在的情况下在所选定的宿主中传代多次。病毒将获得导致多种变体的突变。在整个传代过程中,某些变体将会基于传代和选择条件而被富集。
诱变可通过任何方法,例如插入诱变、化学诱变、利用γ或紫外线辐射的照射或PCR介导的诱变。用于生成基因组序列的突变体或变体的方法是公知的。例如,γ照射、UV照射和利用许多可能的化学诱变剂(例如,5-溴脱氧尿苷、甲基磺酸乙酯(EMS)、甲基磺酸甲酯(MMS)、硫酸二乙酯(DES)、亚硝基胍(NTG)、ICR化合物等)的任一种的处理或利用引起染色体断裂的化合物诸如烯二炔类抗生素(例如,博来霉素、阿霉素、新制癌菌素)的处理是已被用于藻类、真菌和壶菌类(chytrids)诱变的方法(参见,例如,美国专利8,232,090;美国专利申请20120088831;美国专利申请20100285557;美国专利申请20120258498)。本领域已知的许多化学诱变剂包括但不限于嵌入剂、烷化剂、脱氨剂、碱基类似物。作为非限制性实例,嵌入剂包括吖啶衍生物或菲啶衍生物,诸如溴化乙锭(也称为2,7-二氨基-10-乙基-6-苯基菲啶鎓溴化物或3,8-二氨基-5-乙基-6-苯基菲啶鎓溴化物)。烷化剂的非限制性实例包括亚硝基胍衍生物(例如,N-甲基-N'-硝基-亚硝基胍)、甲磺酸乙酯(EMS)、乙磺酸乙酯、硫酸二乙酯(DES)、甲磺酸甲酯(MMS)、亚硝酸或HNO2以及氮芥或ICR化合物。可用作诱变剂的碱基类似物的非限制性实例包括化合物5-溴-尿嘧啶(也称为脱氧核苷5-溴脱氧尿苷)、5-溴脱氧尿苷和2-氨基嘌呤。基于PCR的诱变方法在本领域中是公知的,并且通常包括在整个PCR扩增中增加差错率的反应条件和/或DNA聚合酶。
诱变可以另外地或可选地包括将外源核酸分子直接引入病毒基因组或宿主细胞中,以便随后重新组合至目标病毒基因组中。例如,引入宿主细胞的外源核酸分子可通过随机或靶向整合而整合到病毒遗传基因座中,从而影响外源DNA插入其中的基因或靠近插入基因组中的外源DNA的基因的表达(例如,美国专利7,019,122;美国专利8,216,844)。通常,引入的核酸分子包括用于选择已经整合了外源核酸分子构建体的转化体的选择标记基因。在一些实施方案中,外源核酸分子可包括可转座元件或其组分,诸如,例如可被转座酶识别的反向重复序列和/或编码转座酶的基因,或外源核酸分子可以至少部分地基于病毒,诸如整合病毒。
对于随机插入诱变,构建体优选包括选择标记,其可用于选择具有整合的构建体的转化体,并且任选地还可用作分离标志物和分子标记,以用于分离和鉴定被整合的选择标记基因中断的基因。选择标志物不限于抗生素抗性基因,而且还包括可为病毒提供生长有利方面的任何基因(两种基因具有已建立的和假设的功能)。或者,可靶向特定的遗传基因座。用于基因破坏的构建体可包括例如侧接来自目标遗传基因座的序列(例如,编码调控元件的基因的至少部分,和任选地,围绕所述基因的另外的基因组序列)的选择标记基因。此类侧翼序列可包含例如至少50个核苷酸、至少100个核苷酸、至少500个核苷酸或基因组序列的至少1千碱基。
病毒变体的集合可以由上述任何方法、本领域公知的其它方法或其任何组合生成。然后可筛选变体的集合的所需表型。可将具有所需表型的分离的病毒进行额外轮的突变研究。可额外地或可选地对展现所需性质或表型的分离的病毒进行测序,以鉴定负责所需性质或表型的遗传突变。这些鉴定的遗传损伤可通过概括干净的参考背景中的突变并测试所需性质或表型来确认。
病毒有效载荷
裂解酶
“裂解酶”包括任何细菌细胞壁裂解酶,其在合适的条件下和在相关时间期间杀死一种或多种细菌。裂解酶的实例包括但不限于各种细胞壁酰胺酶。裂解酶可以是细菌噬菌体裂解酶,其是指从细菌噬菌体提取或分离的裂解酶或具有维持裂解酶功能性的相似蛋白质结构的合成的裂解酶。
裂解酶能够特异性切割存在于细菌细胞的肽聚糖中的键,以破坏细菌细胞壁。目前还推测,细菌细胞壁肽聚糖在大多数细菌中是高度保守的,只有少数键的切割可破坏细菌细胞壁。切割这些键的裂解酶的实例是胞壁质酶、氨基葡糖苷酶、内肽酶或N-乙酰基-胞壁酰基-L-丙氨酸酰胺酶。Fischetti等(1974)报道了C1链球菌属噬菌体溶素酶是酰胺酶。Garcia等(1987,1990)报道了来自Cp-1噬菌体的肺炎链球菌(S.pneumoniae)的Cpl溶素是溶菌酶。Caldentey和Bamford(1992)报道,来自假单胞菌属噬菌体Φ6的裂解酶是内肽酶,分裂由内消旋二氨基庚二酸和D-丙氨酸形成的肽桥。大肠杆菌噬菌体T1和T6裂解酶是酰胺酶,来自利斯特菌属(Listeria)噬菌体(ply)的裂解酶也是酰胺酶(Loessner等,1996)。还存在本领域已知的能够切割细菌细胞壁的其它裂解酶。
由细菌噬菌体遗传编码的裂解酶包括能够杀死宿主细菌的多肽,例如通过具有至少一些针对宿主细菌的细胞壁降解或细胞壁合成抑制活性。多肽可具有包含天然裂解酶和其变体的序列。多肽可从各种来源分离,诸如来自细菌噬菌体(“噬菌体”),或通过重组或合成方法制备。例如,多肽在羧基末端侧包含胆碱结合部分,并且特征可能在于能够在氨基末端侧切割细胞壁肽聚糖的酶活性(诸如作用于肽聚糖中的酰胺键的酰氨酶活性)。已经描述了包括多种酶活性例如两个酶结构域的酶,诸如PlyGBS溶素。另外,还描述了仅含有催化结构域并且没有细胞壁结合结构域的其它裂解酶。
群体淬灭多肽
自诱导剂是由参与群体感应的细菌产生和使用的小的化学信号分子。群体感应使细菌能够通过自诱导剂的存在来彼此感应,并调节多种群体级别的行为。此类行为包括共生、毒力、运动、抗生素产生和生物膜形成。自诱导剂根据物种具有许多不同的化学形式,但在许多情况下它们具有的作用相似,这使得遗传工程化的细菌噬菌体能够利用类似的自诱导剂影响多种细菌。一般地,革兰阴性细菌使用AHL作为自诱导剂,革兰阳性细菌使用经加工的寡肽进行通信,而自诱导剂2(AI-2)对于革兰阴性和革兰阳性细菌是通用的。
由革兰阴性细菌的不同物种产生的AHL在酰基侧链的长度和组成方面可变化,所述侧链通常含有4-20个碳原子。AHL能够通过被动运输和主动运输机制扩散进出细胞。用于感测AHL的受体包括许多转录调控因子诸如LuxR,其用作能够激活调控细菌群体行为的多种基因表达的DNA结合转录因子。
自诱导剂可被群体淬灭多肽抑制。群体淬灭多肽可修饰或降解自诱导剂,使其活性降低或失活。某些群体淬灭多肽是使自诱导剂失活(例如,通过修饰或降解)的酶,诸如本文所述的AiiA内酯酶,其从具有广范围底物特异性的AHL的酰基部分切割内酯环,以使来自各种细菌的AHL失活(Wang等2004)J.Biol.Chem.279(14):136.45-51)。
本文公开的体外工程方法可用于生成经工程化以编码例如衍生自铜绿假单胞菌的群体淬灭多肽的合成细菌噬菌体。群体淬灭多肽可表达为释放至噬菌体和/或细菌的周围区域中的游离蛋白质,例如在噬菌体感染和宿主细菌裂解时。同样可能的是,还可使用本领域已知的方法从细菌宿主细胞中表达并活跃地分泌群体淬灭多肽。类似地,可通过翻译将群体淬灭多肽与细菌噬菌体蛋白(例如衣壳、尾部或颈部蛋白质)融合。
尾丝
在一些实施方案中,本公开涉及通过工程化重组细菌噬菌体来调整细菌噬菌体宿范围。在一些实施方案中,调整病毒宿主区包括工程化病毒以具有异源的、天然的、非天然的尾丝及其任何组合。细菌噬菌体的宿主细胞特异性可受病毒颗粒尾丝影响。通过改变(例如,交换和/或突变)宿主细菌噬菌体的尾丝或尾丝的部分,可改变(例如,扩大)宿主范围。
尾丝蛋白通常含有抗原决定簇和宿主范围决定簇。异源尾丝可由从一种类型的细菌噬菌体的基因组分离的或基于所述基因组合成的一组基因组片段编码。尾丝基因片段的组可包含从几种细菌噬菌体的基因组分离的或基于其生成的基因组片段的亚组。例如,尾丝的保守区可由从底盘细菌噬菌体的基因组分离的基因组片段编码,而宿主范围决定簇区域可由从不同类型的细菌噬菌体的基因组分离的基因组片段编码。
抗-微生物肽
本公开设想了(作为非限制性实例)经工程化以表达抗微生物肽(其任选地由宿主细胞分泌)的细菌噬菌体。例如,工程化的细菌噬菌体可表达抗微生物剂,诸如抗微生物肽(AMP)或抗微生物多肽,包括但不限于天然存在的肽,以防止宿主细菌对噬菌体的抗性的发展和/或扩大,并且允许在细菌感染(诸如包含多于一种不同的细菌物种的细菌感染)中更快更有效地杀死细菌。
因它们的扩增和捕食者-宿主机制,细菌噬菌体提供有吸引力的抗微生物剂以用于消除细菌感染,例如通过在宿主细菌中繁殖,然后随着裂解发生以释放繁殖的细菌噬菌体(其随后通过相同的机制感染和杀死周围的细菌),然后杀死细菌。细菌噬菌体在消除细菌感染中的实际用途受到显著局限性的限制,诸如(i)非常狭窄的种内和种间细菌宿主范围,和(ii)细菌宿主群体针对噬菌体的抗性的快速发展。因此,在许多科学领域似乎是常见的,但理论上的结果在现实生活状态中难以实现。因此,虽然细菌噬菌体似乎在理论上用作抗微生物剂,但实际上它们具有受限制的抗微生物性质,并且由于宿主对细菌噬菌体的抗性的快速发展,因此它们用于消除细菌感染的用途难以实现。因此,噬菌体在宿主细菌的长期消除方面一直是无效的。
因此,本公开设想了抗微生物剂工程化的噬菌体,其中将细菌噬菌体进行修饰或工程化以表达任选地被宿主怕抗微生物肽(AMP)。至少一种抗微生物剂工程化的噬菌体或不同的所述工程化的噬菌体的任何组合可以单独或以任何组合用于消除或杀死细菌感染。在一些实施方案中,抗微生物剂工程化的细菌噬菌体可以与另外的试剂(诸如其它抗微生物剂工程化的细菌噬菌体、纯化的抗微生物肽或小分子抗生素)一起使用。抗微生物肽工程化的细菌噬菌体(或AMP-工程化的细菌噬菌体)可编码本领域普通技术人员已知的任何抗微生物剂。
在本发明的方面的一些实施方案中,抗微生物剂工程化的细菌噬菌体可表达和分泌作为核酸的抗微生物剂,例如通过“基因沉默”本领域普通技术人员已知的公知的细菌基因来起作用的抗微生物剂。基于核酸的抗微生物剂包括例如但不限于RNA干扰-诱导(RNAi)分子,例如但不限于siRNA、dsRNA、stRNA、shRNA、miRNA及其修饰形式,其中RNA干扰分子基因沉默表达的并且对于细菌的活力(即存活)重要的基因的表达。基于核酸的抗微生物剂可以是反义寡核酸或核酸类似物,例如但不限于DNA、RNA、肽核酸(PNA)、假-互补PNA(pc-PNA)或锁定核酸(LNA)等。或者,基于核酸的抗微生物剂可以是DNA或RNA,以及核酸类似物,例如PNA、pcPNA和LNA。核酸可以是单链或双链的,并且可选自包含编码目标蛋白质的核酸、寡核苷酸、PNA等的组。此类核酸抑制剂包括例如但不限于编码为转录阻遏物的蛋白质的核酸序列,或反义分子或核酶,或小的抑制性核酸序列诸如RNAi、shRNAi、siRNA、微RNAi(miRNA)、反义寡核苷酸等。
抗微生物肽可另外地或可选地是抗菌酶。示例性抗菌活性可包括但不限于裂解酶、酰基酶、氨基肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤代过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶、RNA酶、DNA酶、溶葡萄球菌素或孔形成肽。
抗微生物肽或抗微生物多肽可通过结合带负电荷的微生物膜,并通过形成水通道破坏膜,使脂质双层自身反折或妨碍膜形成胶束来直接破坏细菌膜。除了它们的直接杀菌作用以外,任何微生物肽和多肽还可激活TLR信号传导和额外的免疫应答,用作白细胞化学趋化剂,通过侵入吞噬细胞增加杀菌调理作用,清除细菌生长所需的重要营养物和抑制细菌蛋白酶,或其任何组合。
生物表面活性剂
细菌生物膜形成可导致局部感染以及难以治疗,并且有时致命的全身性感染,诸如菌血症(细菌存在于血液)和细菌性脓毒症(由细菌或其产物通过血流扩散引起的多器官衰竭)。包含生物膜基质的细胞外物质可用作屏障,保护存在于生物膜内的细菌,并将所述细菌与正常的免疫防御机制(诸如抗体和吞噬细胞)以及抗菌药物(包括抗菌酶和抗生素)分离。生物膜还有助于存在于生物膜中的细菌生长和增殖。
本公开提供了生成工程化的病毒的方法和工程化的病毒的组合物,所述工程化的病毒表达用于促进去除或松散沉积在表面上的生物膜的另外试剂。例如,组合物可包括生物表面活性剂。示例性生物表面活性剂包括但不限于糖脂、脂肽、缩肽、磷脂、取代的脂肪酸、脂多糖、乳糖素(surlactin)、表面活性素、visconsin和鼠李糖脂。
病毒工程
由于缺少广泛适用和可靶向的体外工程方法,因此遗传工程化病毒颗粒的方法费力且冗长。目前的体内方法可能需要几周或数月以产生修饰的病毒和病毒载体(Levin和Bull,Nat Rev Microbiol.,2004年2月;2(2):166-73,通过引用并入本文)。另外,存在与在细胞中操作病毒基因组固有地相关的毒性。在本公开之前,开发用于病毒的精确体外遗传工程的广泛适用性方法的努力在很大程度上不成功。本文中描述了在体外完全快速地工程化病毒基因组的广泛适用性方法。
本文公开的体外遗传工程系统和方法具有优于病毒遗传工程的现有方法有几个有利方面:1)其允许在体外完全进行毒性基因/产物的简单操作;2)其是快速的,即相较于用于体内方法的数周或数月,可在一天内进行;3)其允许在大多数病毒基因组中保留基因组修饰;4)其不需要宿主重组途径;5)其比以前的方法更直接,更不容易出错;6)其适用于多个病毒,无需更改方案。
本公开提供了用于RNA引导的核酸酶介导的消化和体外组装以位点特异性地工程化整个基因组的方法。本公开显著提高了病毒基因组可被遗传修饰的精确度、简便性和速度。另外,该技术克服了在宿主细胞内操作常常有毒的毒性病毒基因组的充分确定的困难。该完全体外方法还消除了对遗传上可跟踪的宿主菌株用于工程的要求,一种防止对古菌、原核生物和真核生物的许多重要且吸引人的病毒的操纵的要求。该方法没有扩增被操纵的病毒基因组,因此允许保留大多数病毒基因组修饰诸如甲基化。众所周知,基因组修饰可对病毒的适应性具有深远的影响,因此这些基因组修饰的保留提供了优于其它工程技术的显著有利方面。另外,该技术不同于与体内RNA引导的核酸酶基因组相关的其它方法,因为它不关注RNA引导的核酸酶,诸如Cas9和用于真核生物基因组编辑的gRNA的用途,而是与体外完全克服已知的病毒工程问题相关。
在一些方面,本文提供的新颖方法可包括例如使用如本文所公开的RNA引导的核酸酶和组装进行的病毒核酸或病毒基因组的修饰,并将工程化的病毒核酸或工程化的病毒基因组直接引入将产生包含工程化的病毒核酸或工程化的病毒基因组的工程化的病毒颗粒或工程化的病毒的宿主。例如,在一些方面,所述方法包括工程化病毒核酸或病毒基因组,而无需将工程化的病毒核酸或工程化的病毒基因组引入克隆性宿主,为了例如通过在载体中的复制扩增工程化的病毒核酸或工程病毒基因组的目的。例如,在一些方法中,在将工程化的病毒核酸或工程化的病毒核酸基因组引入将产生工程化的病毒颗粒或工程化的病毒的宿主细胞之前,不将工程化的病毒核酸或工程化的病毒核酸基因组引入酵母、大肠杆菌或其它已知的克隆性宿主诸如但不限于芽孢杆菌属(Bacillus)或弧菌属(Vibrio)物种。
本文提供的新颖方法允许对病毒基因组中的2、3、4、5或更多个位点进行靶向工程化。可在体外完全进行所述方法,从而允许产生在多个位点被改变的病毒基因组,这是使用常规工程方法不能实现的成就。本文提供了包含相对于非工程化的病毒核酸或非工程化的病毒基因组具有2、3、4、5或更多个修饰的工程化的病毒核酸和/或工程化的病毒基因组的工程化的病毒。两个或更多个修饰可以是插入、缺失、替换或其任何组合。两种或更多种修饰可导致1种、2种或更多种改良的病毒性质,诸如本文公开的任何性质。可完全通过本文公开的体外工程方法产生工程化的病毒。本文公开的体外工程方法导致与经典或随机诱变相对的靶向修饰。与通过经典或随机诱变产生的修改不同,可方便地在任何表型测定之前使用标准分子遗传实验室方法诸如PCR和/或测序常规地筛选靶向修饰。
本文还公开了用于生成具有改良的病毒性质的合成病毒的系统(例如,参见图10)。所述系统包括鉴定负责赋予所需性质的核酸序列,然后将那些序列变化整合到所选择的病毒基因组中以生成具有改良的病毒性质的病毒颗粒。可通过基础科学知识、文献检索、经验测试、突变研究或其任何组合来鉴定能够赋予所需病毒性质的核酸序列。突变研究可包括进化研究、适应研究、诱变研究和/或本领域公知的其它实验方法。诱变研究可以包括紫外线(UV)、化学和/或插入诱变。插入突变可包括转座子和/或选择标记插入诱变。用于鉴定目标核酸序列的突变实验可使用将作为体外工程起点的病毒或病毒基因组来进行。另外或可选地,可将相关或异源病毒或病毒基因组而非所选择的病毒或病毒基因组用于突变研究,以鉴定重组核酸序列,以掺入最初选择的病毒或病毒基因组中,以赋予所选择的病毒额外性质。
所需性质可包括宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑、本领域技术人员容易知道的其它期望的性质,或其任何组合中的一种或多种。可使用本文公开的体外工程方法将赋予所需性质的经鉴定的核酸序列整合到所选择的病毒基因组中,以通过一轮或多轮迭代工程将一个或多个变化整合到单个病毒基因组中并进行测试直至所需组的一种或多种改良的病毒性质已被确认。最终的目标病毒基因组可以是天然衍生的和合成的核酸分子的组合,或者可使用本文所述的方法和/或本领域已知的方法完全从头完全。生成具有改良的病毒性质的病毒或病毒颗粒可包括将工程化的目标病毒基因组引入相容性细胞,其中基因组被激活从而生成病毒颗粒或病毒。为了制备用于整合到所选择的病毒基因组的经鉴定赋予所需性质的核酸分子,可从通过消化、PCR扩增、合成、本领域公知的其它方法或其任何组合从其鉴定目标序列的病毒基因组分离或扩增目标序列。合成的核酸序列可化学合成或从化学合成的重叠寡核苷酸组装。另外或可选地,待被整合到所选择的病毒基因组中以赋予所需表型的核酸分子可以是天然衍生的与合成的核酸序列的组合。取决于待整合到所选择的病毒基因组中的核酸分子的设计,所得的工程化的病毒基因组可具有添加、删除、被可选序列替换的核酸序列或其任何组合,以赋予所需的病毒性质。设计核酸分子以除去、删除、替换序列或其任何组合的方式来改变序列的方法是本领域技术人员所公知的。通过本文所述的系统和方法生成的工程化的病毒基因组可用于生成具有改良的病毒性质的病毒或病毒颗粒。生成具有改良的病毒性质的病毒或病毒颗粒可包括将工程化的病毒基因组引入相容性细胞,其中所述基因组被激活从而产生病毒颗粒或病毒。将工程化的基因组引入细胞可通过电穿孔、转化、缀合、细胞与预先包装的病毒基因组的接触等,或本领域公知的其它方法来进行。
本公开另外涉及使用RNA引导的内切核酸酶体外工程化核酸的方法的发现。本公开还涉及通过病毒核酸的体外遗传工程改良病毒性质。具体地,本公开涉及使用内切核酸酶(诸如RNA引导的内切核酸酶,例如Cas9)体外消化病毒序列,随后通过将DNA或RNA片段插入已消化的病毒基因组中来组装重组核酸。
在一些方面,本公开提供了工程化病毒核酸的体外方法,包括分离病毒核酸;使用RNA引导的核酸酶体外消化病毒核酸的区域;以及通过将DNA或RNA片段插入消化的病毒核酸中来组装重组核酸。在一些实例中,体外消化是RNA引导的酶促消化。在一些实例中,由RNA引导的核酸酶进行酶消化。在一些实例中,RNA引导的核酸酶是Cas9、Cas9衍生的酶、Cas9相关酶或任何纯化的可编程的RNA引导的核酸酶。在一些实例中,消化还包括靶向RNA。在一些实例中,消化还包括亚精胺。在一些实例中,靶向RNA是gRNA、crRNA和/或tracrRNA。在一些实例中,在消化后,通过标准方法(例如暴露于热)灭活RNA引导的核酸酶,和/或通过标准方法(诸如,例如苯酚-氯仿提取)除去所述酶。在一些实例中,通过将包含蛋白质的溶液暴露于热(诸如,例如至少80℃)来实现热灭活。
任何可编程的RNA引导的核酸酶可用于本文中的方法和组合物,例如Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4,Cpf1、C2c1、C2c2、C2c3或其同源物,或其修饰形式。任何可编程的CRISPR系统可用于本文的方法和组合,包括I型、II型、III型、IV型、V型、VI型或其任何组合。RNAi引导的核酸酶可以是Cas9蛋白,例如作为非限制性实例的酿脓葡萄球菌(Staphylococcuspyogenes)、嗜热链球菌(S.thermophilus)、肺炎链球菌(S.pneumonia)、金黄色葡萄球菌(S.aureus)、脑膜炎奈瑟球菌(Neisseria meningitidis)的Cas9蛋白。还考虑了在美国专利申请公开第US 2014/0068797号(通过引用整体并入本文)中作为SEQ ID NO:1-256和795-1346提供的cas9蛋白,和可组合来自多于一种Cas9蛋白的结构域的嵌合Cas9蛋白,以及已鉴定的Cas9蛋白的变体和突变体。除了Cas9以外,本领域技术人员还将容易地认识到,任何已知的功能等同物将是充足的替代实例。
病毒颗粒可以是古细菌、原核或真核特异性病毒。例如,病毒可以是可感染铜绿假单胞菌、大肠杆菌或者智人的病毒。在一些实例中,病毒可以是感染不动杆菌属(Acinetobacter)、梭菌属(Clostridium)、肠杆菌属(Enterobacter)、肠球菌属(Enterococcus)、埃希氏杆菌属(Escherichia)、克雷伯杆菌属(Klebsiella)、分枝杆菌属(Mycobacterium)、奈瑟球菌属(Neisseria)、假单胞菌属(Pseudomonas)、沙门菌属(Salmonella)、葡萄球菌属(Staphylococcus)或链球菌属(Streptococcus)中的病原体物种的病毒。在一些实例中,病毒可以感染古菌属物种,诸如酸菌属(Acidianus)、气火菌属(Aeropyrum)、盐盒菌属(Haloarcula)、富盐菌属(Haloferax)、盐红菌属(Halorulbum)、甲烷杆菌属(Methanobacterium)、热棒菌属(Pyrobaculum)、焦球菌属(Pyrococcus)、憎叶菌属(Stygiolobus)、硫化叶菌属(Sulfolobus)或热变形菌属(Thermoproteus)。在一些实例中,病毒可感染真核宿主诸如人、哺乳动物、动物、植物、藻类或真菌的真核宿主。病毒核酸可以是DNA或RNA。在一些实例中,病毒核酸由整个病毒基因组、病毒基因组的部分或单个或多个病毒基因组成。在一些实例中,在工程化之前,将病毒基因组的部分亚克隆至质粒中。
病毒核酸可在体外被与靶向RNA偶联的RNA引导的核酸酶诸如Cas9单消化或双重(或更多重)消化,以除去一个或多个核苷酸、单个基因、多个基因或任何大小的基因组区域或打开DNA以用于插入新序列。除了Cas9以外,本领域技术人员应理解,任何可编程的RNA引导的核酸酶或其它可靶向的DNA切割机制都足够并且在功能上是等效的。多重消化可以同时进行;然而,已发现依序的RNA引导的Cas9消化可提高效率。另外,可将亚精胺添加至反应混合物中以增加Cas9与DNA的解离,从而允许Cas9以更大的可用度用于酶促活性。通过Cas9切割除去的病毒序列不会重组回基因组中,因为Cas9是钝切割酶,并且片段不含有与插入位点的同源性。另外,Cas9的热灭活允许从消化直接移入组装反应,从而简化了方案。
如本文中所用,术语“靶向RNA”或“引导RNA”是指CRISPR RNA(crRNA)、反式激活性crRNA(tracrRNA)、整合crRNA和tracrRNA的工程化的嵌合引导RNA(gRNA)或与选择的CRISPR系统相容的单一gRNA。从CRISPR基因座转录CRISPR RNA(crRNA),并将其整合到效应子复合物中并引导复合体入侵核酸序列,从而导致RNA引导的核酸酶介导的核酸消化。TracrRNA与前crRNA互补并与其碱基配对,形成Cas9介导的切割所需的RNA双链体。杂交gRNA是连接靶向crRNA与tracrRNA,从而允许使用单个RNA进行Cas9介导的消化的嵌合RNA。Cas9介导的消化可用体外转录的crRNA-tracrRNA混合物或嵌合gRNA进行。
DNA或RNA插入物可通过本领域已知的任何方式,具体地通过体外合成、化学合成、从头合成、从头组装、扩增(PCR)、酶介导的从质粒、病毒、古细菌的释放或其任何组合获得。在一个方面,DNA或RNA插入物通过寡核苷酸的组装或利用含有针对整合位点的重叠序列的引物的PCR来生成。DNA或RNA插入物可以是天然衍生的和合成的核酸的组合,或可以是完全天然的或合成衍生的。
DNA或RNA插入物和消化的病毒核酸的组装可使用本领域已知的任何方法(诸如体外克隆反应或先前讨论的任何方法)进行。在一个方面,使用吉布森组装法将DNA或RNA插入物组装至消化的病毒基因组中。在一个方面,使用宿主细胞重组机制在体内进行将DNA或RNA插入物组装至消化的病毒基因组中。DNA或RNA插入物的组装可导致核酸序列的添加、缺失、替换或其任何组合。设计DNA或RNA序列以使得组装至消化的病毒核酸中的方法导致目标核酸的添加、缺失、替换或其任何组合是本领域公知的。
在一些方面,本公开提供了工程化病毒序列的体外方法,其包括分离病毒核酸;使用RNA引导的核酸酶体外消化病毒核酸的区域;以及通过将DNA或RNA片段插入消化的病毒核酸来组装重组核酸。在一些实例中,在对于将片段插入消化的病毒核酸以形成重组核酸是有效的条件下,利用组分的混合物在单个容器中在体外进行所述组装,所述混合物包含(a)缺少3'外切核酸酶活性的分离的非热稳定的5'至3'外切核酸酶,(b)拥挤剂,(c)具有3'外切核酸酶活性的分离的热稳定的非链置换DNA聚合酶,或所述DNA聚合酶与缺少3'外切核酸酶活性的第二DNA聚合酶的混合物,(d)分离的热稳定的连接酶,(e)dNTP的混合物和(f)合适的缓冲液。在一些方面,外切核酸酶是T5外切核酸酶,并且接触是在等温条件下,和/或拥挤剂是PEG,和/或非链置换DNA聚合酶是PhusionTM DNA聚合酶或
Figure BDA0003053899790000491
DNA聚合酶,和/或连接酶是Taq连接酶。在一些实例中,体外组装通过一步或等温吉布森组装进行。在一些实例中,体外组装通过两步吉布森组装进行。在一些实例中,可使用连接酶通过平头连接体外组装消化的核酸和DNA或RNA片段。
在一些方面,本公开提供了包括组装步骤的工程化病毒序列的体外方法。在一些实例中,使用宿主细胞重组机器在相容性宿主细胞中在体内进行组装。尽管重组核酸可使用本文所公开的纯化的酶在体外完全组装,但也可使用易感宿主菌株内的天然或工程化的重组途径来完成该过程。在一些情况下,相容性宿主细胞可以是酿酒酵母(S.cerevisiae)、大肠杆菌、铜绿假单胞菌、枯草芽孢杆菌(B.subtilis)、需钠弧菌(V.natrigens)或本领域可获得的其它生物体。纯化的和体外消化的病毒基因组与具有末端同源区的插入修复片段一起的转化对于一些宿主细胞在体内组装重组病毒基因组是足够的。插入修复片段可通过本领域已知的标准技术合成或扩增,或者可存在于在所选择的宿主细胞内稳定复制的质粒内。由于宿主细胞具有同源和非同源DNA修复途径,将充足量的插入物和消化的基因组共递送至宿主细胞中的挑战以及大多数宿主同源重组途径的较低效率,因此该方法可能具有比体外组装低的效率。由于单独的消化的基因组不会形成功能性病毒颗粒和没有宿主介导的重组的后续噬斑,因此可通过针对给定的插入物的PCR筛选转化和铺板后获得的噬斑,以确认所需工程化的病毒核酸的正确组装。
在一些方面,本公开提供了工程化包含RNA引导的核酸酶的病毒序列的体外方法。在一些实例中,RNA引导的核酸酶是II型Cas9。在一些实例中,RNA引导的核酸酶是Ca9或Cas9衍生的酶。在一些实例中,RNA引导的核酸酶是分离的重组Cas9或Cas9衍生的酶。在一些实例中,存在至少一种靶向RNA。在一些实例中,存在两种靶向RNA。在一些实例中,靶向RNA是嵌合引导RNA(gRNA)或一组crRNA和tracrRNA。在一些实例中,体外消化反应使用两种gRNA。在一些实例中,体外消化反应使用两组crRNA和tracrRNA,以便例如同时靶两个序列。
在一些方面,本公开提供了包括体外消化步骤的工程化病毒序列的体外方法。在一些实例中,在消化后,通过标准方法(诸如暴露于热诸如至少80℃)灭活RNA引导的核酸酶。在一些实例中,在消化后,通过苯酚-氯仿提取除去RNA引导的核酸酶。在一些实例中,在消化后,RNA引导的核酸酶通过本领域公知的其它提取方法除去。
在一些方面,本公开内容提供了工程化病毒序列的体外方法,所述方法导致工程化的病毒核酸。在一些实例中,随后将工程化的病毒核酸转化到宿主细胞中。在一些实例中,宿主细胞是大肠杆菌、铜绿假单胞菌、酿酒酵母、需钠弧菌、枯草芽孢杆菌或本领域公知的其它生物体。在一些实例中,通过热休克、电穿孔、基因枪、微粒轰击、缀合、转导、脂转染或本领域公知的其它已建立的方法进行转化。在一些实例中,将工程化的病毒核酸转化到宿主细胞中,然后在复制后再次分离。在一些实例中,分离的工程化的病毒核酸用作起始病毒核酸,以用于另外一轮的体外工程,这一过程在本文中被称为迭代体外工程。在一些实例中,存在一轮迭代体外工程。在其它实例中,存在至少一轮迭代体外工程。在其它实例中,存在两轮或更多轮的迭代体外工程。
在一些方面,本公开提供了工程化病毒序列的体外方法,所述方法导致工程化的病毒核酸。在一些实例中,使用可以商购获得的体内包装试剂盒将工程化的病毒核酸包装到病毒颗粒中。在一些实例中,体外包装试剂盒是Maxplax λ包装提取物。
在一些方面,本公开提供了工程化病毒序列的体外方法,所述方法导致重组工程化的病毒核酸。在一些实例中,工程化的病毒核酸相较于参考和/或非工程化的病毒改良或改变病毒的性质。在一些实例中,改良的或改变的病毒性质是诸如宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节、靶向宿主基因组消化或编辑或其任何组合的性质。在一些实例中,性质的改良可以是性质的增加、减少或改变。例如,改良的病毒性质可以是扩大或减少的宿主范围、改变的病毒裂解周期、增加的或减少的对宿主细胞的吸附、增加或减少的对宿主细胞的附着、增加或减少的注射、增加或减少或改变的复制和组装、增加或减少的裂解、增加或减少的裂解量、增加或减少或改变的免疫逃避、增加或减少或改变的免疫刺激,增加或减少或改变的免疫失活、增加或减少或改变的生物膜分散、增加或减少或改变的细菌噬菌体抗性、增加或减少或改变的细菌抗生素敏化、增加或减少或改变的毒力因子的调节、增加或减少或改变的靶向宿主基因组消化或编辑,或其任何组合。
在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如增加的宿主范围。宿主范围是病毒能够感染的细胞类型、菌株或宿主物种的数量。宿主范围的增加是病毒相较于参考和/或非工程化的病毒扩大病毒能够感染的不同细胞类型、菌株或物种的绝对数量。在一些实例中,增加的宿主范围是病毒能够感染的细菌物种中的细菌菌株或变体的数量的增加。宿主范围的增加可以是至少一种或多于一种菌株、细胞类型或物种的增加。可以例如通过本领域公知的标准噬斑测定来测定宿主范围。
在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如病毒裂解周期。病毒裂解周期是病毒复制的两个周期之一,另一个是溶菌周期。裂解周期导致感染的细胞和感染的细胞膜的破坏。裂解周期包括6个步骤,所述步骤各自可单独地设计。病毒裂解周期中的6个步骤是吸附、附着、注射、复制和组装、裂解和裂解量。
在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如吸附。吸附是病毒与宿主细胞接触的行为。病毒吸附被表征为病毒对于给定的宿主细胞的亲和力,并且可通过标准吸附测定诸如由Hyman和Abedon(Methods inMolecular Biology,2009)概述的那些测定法来测定。另外或可选地,病毒吸附可通过在生物化学中被广泛用于分析受体-配体相互作用的其它标准亲和力测定法来测定。
在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如附着。病毒附着是当病毒强烈地附着于宿主细胞时。病毒附着是病毒与宿主细胞受体之间的不可逆相互作用。
在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如注射。注射是指病毒基因组注射,并且是当病毒将其遗传物质插入宿主细胞时。可以例如通过测量钾离子流出来测量病毒基因组注射(Cady等,J.Bacteriol 2012年11月;194(21):5728-38;Leavitt等,PLoS ONE,2013 8(8):e70936.,所述两篇文献均通过引用整体并入本文)。
在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如复制和组装。病毒复制和组装是指宿主细胞构建新的病毒。在病毒基因组注射后,宿主细胞机器被劫持,并且病毒基因被转录,病毒蛋白质被翻译,且病毒颗粒是包含复制的病毒基因组的组装体。病毒复制和组装最终将导致宿主细胞裂解,因此,可通过标准噬斑测定或双琼脂斑块测定来测定复制和组装,从而监测病毒生长速率。病毒复制速率可通过在标准噬斑测定、一步曲线中测量裂解量或通过本领域中公知的其它标准病毒适合度测定来测定。
在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如裂解。裂解是指宿主细胞裂解。在复制和组装新的病毒颗粒后,产生从内部分解宿主细胞壁和/或细胞膜并允许流体进入的酶,其最终导致宿主细胞裂解。增加或抑制病毒的毒力复制的能力可以增加或减少给定的病毒通过裂解杀死宿主细胞所花费的时间。可通过分析感染与宿主细胞裂解之间的时间(通过用标准噬斑测定法或双琼脂噬斑测定法监测病毒生长速率)来测定病毒毒力。另外或可选地,可通过测定后菌落形成单位(CFU)、噬斑测定后噬斑形成单位(PFU)的数目或直径,从生物膜测定法或本领域公知的其它标准测定法来测定相较于参考和/或非工程化的病毒的工程化的病毒的增加的细菌裂解。
在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如裂解量。裂解量是指感染的细胞产生的病毒数量。裂解量可通过标准裂解量测定法,诸如由Ellis和Delbriick(J GenPhysiol.1939年1月20日;22(3):365-384,通过引用并入本文)和Delbriick(Delbriick,J.Gen.Physiol,1940,23;643,通过引用并入本文)概述的那些测定法来测定。
在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如免疫逃避。免疫逃避是病毒逃避被先天或适应性免疫系统清除的能力。可通过观察中和抗体产生的水平或速度来测定免疫逃逸。另外或者可选地,可通过分析动物中给定的病毒的半衰期或驻留时间来测量免疫逃避。
在一些方面,本公开提供了用于工程化病毒核酸的方法,所述导致改良的病毒性质,诸如,例如免疫刺激。免疫刺激是病毒诱导通常与野生型或非工程化的病毒不相关的免疫反应的能力。这可以通过使用标准ELISA试剂盒、流式细胞术、组织学或本领域技术人员公知的其它常用免疫学测定法分析在病毒存在的情况下产生的免疫因子来测定。
在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如免疫失活。免疫失活是病毒降低通常与野生型或非工程化的病毒相关的免疫反应的能力。这可通过使用标准ELISA试剂盒、流式细胞术、组织学或本领域技术人员已知的其它常用免疫学测定法分析在病毒存在的情况下产生的免疫因子来测定。
在一些方面,本公开提供了用于工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如生物膜分散。生物膜分散是降解、松动或增加生物膜的渗透性的能力。可导致生物膜分散的活性包括但不限于胞外多糖(EPS)降解、群体感应分子的调节以及生物膜或细菌感染部位内的细胞外DNA或RNA的降解。“胞外多糖降解”是指病毒产生能够使由微生物分泌至其环境中以形成生物膜的结构完整性的高分子量化合物降解或解离的蛋白质或酶的能力。EPS降解活性可包括但不限于表面活性剂、糖苷酶和蛋白酶。可使用本领域技术人员已知的标准生物化学测定法来测量它们的活性。群体感应分子的调节也可导致生物膜分散。已知群体感应分子是许多人类病原菌中高度保守的毒力调节剂。已鉴定了具有能够降解群体感应分子的酶促活性的蛋白质,并且通过各种微生物报道基因测定法、生物化学报道基因测定法或通过使用TLC分析裂解产物(Rajesh和Rai,MicrobiologicalResearch,2014年7月-8月,第169卷,第7-8期,第561-569页,通过引用并入本文)来测量它们活性。生物膜或细菌感染部位内的细胞外DNA或RNA的降解还可导致生物膜分散。病毒编码的DNA酶或RNA酶活性可通过本领域技术人员已知的商购可得的试剂盒(诸如,作为非限制性实例,可获自Jena Bioscience或Thermofisher的那些试剂盒)来测量。还可通过定量处理后存在的生物膜并将其与对照条件相比较来评估生物膜的阻挡、渗透、破坏或分散。生物测量是本领域公知的,并且作为非限制性实例包括用染料诸如结晶紫对生物膜进行染色,并在分光光度计上定量吸光度。
在一些实例中,本公开提供了工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如细菌噬菌体抗性。噬菌体或细菌噬菌体是可互换使用的术语,并且是指感染细菌的病毒。细菌噬菌体抗性是指抗细菌噬菌体的细菌从用特定病毒处理或暴露于特定病毒的群体中的出现。这可通过细菌内的随机突变发生,或因为群体内的某些细菌不能被病毒感染而发生。当这些抗性细菌扩增时,新的群体对其最初所暴露的病毒或细菌噬菌体具有抗性。评估细菌抗性的非限制性实例是在病毒处理后跟踪细菌生长的速率,因为抗性细菌的数量直接影响群体再生长的速度。可通过至少3种方法工程化细菌噬菌体以防止细菌获得病毒抗性,所述方法包括1)抑制已知的病毒抗性系统,2)编码第二毒素,和/或3)通过增强裂解能力来增强毒力。作为一个实例,细菌噬菌体可以通过表达已知或合成的抑制性蛋白来逃避或抑制已知的病毒抗性系统。这些抑制性蛋白的活性可通过经典双层噬斑滴定法和/或铺板效率的分析来监测。病毒抗性系统可包括但不限于CRISPR-Cas和限制性修饰系统。病毒抗性的预防还可通过第二毒素的表达诸如杀菌有效载荷来实现。这些第二毒素的活性与给定的病毒的天然裂解活性无关,并且可通过生长/杀伤曲线分析来测量。另外或可选地,可使用通常用于表征蛋白质毒素和本领域技术人员公知的已建立的生物化学和/或表型测定法来纯化和表征遗传编码的毒性蛋白质。
在一些实例中,本公开内容提供了工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如细菌抗生素敏化。“细菌抗生素敏化”是指病毒表达遗传编码的有效载荷以使感染的或相邻的细胞对抗微生物剂更敏感的能力。有效载荷可在病毒或细菌噬菌体上遗传编码,然后在宿主细胞内表达。表达的有效载荷可任选地由宿主细胞分泌或在宿主细胞裂解时释放。抗生素敏化活性可通过使用例如公知的棋盘微量稀释测定法的协同测试来观察。
在一些实例中,本公开提供了工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如毒力因子的调节。“毒力因子的调节”是指病毒遗传编码能够调节已知毒力因子的表达或活性的蛋白质或化合物。毒力因子调节剂的非限制性实例是转录因子、抗体和免疫蛋白。可以例如在动物模型、生物化学测试或报道基因测定中观察毒力因子和毒力因子调节剂的表达或活性。
在一些实例中,本公开提供了工程化病毒核酸的方法,所述方法导致改良的病毒性质,诸如,例如靶向宿主基因组消化或编辑。“靶向宿主基因组消化或编辑”是指病毒遗传编码能够在给定的遗传基因座上进行靶向基因组消化,以及任选地通过例如修复DNA分子的插入进行编辑的序列特异性核酸酶的能力。靶向消化活性可以通过测序、活菌计数、新序列整合的确认和/或本领域技术人员已知的其它标准技术来观察。
在一些方面,本公开提供了包括体外消化步骤的工程化病毒核酸的体外方法。在一些实例中,分离消化的病毒核酸并对其进行测序,而不用于体外或体内组装反应。在一些实例中,来自病毒核酸片段的测序结果用于确定病毒基因组末端。在一些实例中,经校正的病毒基因组序列用于进一步计划和设计体外工程方法和步骤。
在一些方面,本公开提供了包括病毒核酸分离的工程化病毒序列的体外方法。在一些实例中,病毒核酸是完整的病毒基因组。在一些实例中,从病毒颗粒中分离完整的病毒基因组。在一些实例中,病毒核酸是病毒基因组的子部分。在一些实例中,病毒核酸是包含在质粒中的病毒基因组的子部分。在一些实例中,从宿主细胞分离包含病毒基因组子部分的质粒。在一些实例中,已将病毒基因组子部分克隆到质粒中,转化到宿主细胞中,并在体外工程化之前进行分离。在一些实例中,从头合成病毒核酸。从头合成可包括使用本领域已知的标准方法在体外或体内合成寡核苷酸并组装它们。在一些实例中,在消化之前扩增(诸如,例如PCR扩增)病毒核酸。
在一些方面,本公开提供了用于工程化病毒序列的试剂盒,其包含(a)缺少3'外切核酸酶活性的分离的非热稳定的5'至3'外切核酸酶,(b)拥挤剂,(c)具有3'外切核酸酶活性的分离的热稳定的非链置换DNA聚合酶,或所述DNA聚合酶与缺少3'外切核酸酶活性的第二DNA聚合酶的混合物,(d)分离的热稳定的连接酶,(e)dNTP的混合物,(f)合适的缓冲液,和(g)纯化的重组RNA引导的核酸酶。在一些实例中,RNA引导的核酸酶是Cas9或Cas9衍生的酶。在一些实例中,试剂盒还包含定制设计的靶向RNA。在一些实例中,靶向RNA是嵌合gRNA或crRNA和tracrRNA。在一些实例中,试剂盒还包含定制设计的合成核酸分子,以在组装反应中用作插入的DNA片段。在一些实例中,试剂盒还包含感受态宿主细胞。在一些实例中,该试剂盒还包含分离的病毒核酸。
在一些方面,本公开提供了用于体外工程化病毒核酸的系统,其包含分离的病毒核酸、重组RNA引导的核酸酶、至少一种靶向RNA以及将在消化位点处组装成分离的病毒核酸的DNA或RNA片段。在一些实例中,分离的病毒核酸是从病毒颗粒分离的完整基因组。在一些实例中,分离的病毒核酸是被亚克隆到质粒中并从宿主细胞分离的病毒基因组子部分。在一些实例中,RNA引导的核酸酶是Cas9或Cas9衍生的酶。在一些实例中,靶向RNA是crRNA和tracrRNA。在一些实例中,靶向RNA是嵌合引导RNA(gRNA)。在一些实例中,存在两种靶向RNA或gRNA。在一些实例中,存在两组crRNA和tracrRNA。
在一些方面,本公开提供了体外工程化的病毒核酸系统,其包含:分离的病毒核酸、重组RNA引导的核酸酶、至少一种靶向RNA和待插入分离的核酸消化位点的核酸片段。在一些实例中,所述系统使得重组RNA引导的核酸酶和至少一种靶向RNA形成能够消化分离的病毒核酸的复合物。在一些实例中,所述系统还包含亚精胺。在一些实例中,所述系统还包含:缺少3'外切核酸酶活性的分离的非热稳定的5'至3'外切核酸酶;拥挤剂;具有3'外切核酸酶活性的分离的热稳定的非链置换DNA聚合酶或所述DNA聚合酶与缺少3'外切核酸酶活性的第二DNA聚合酶的混合物;分离的热稳定的连接酶;dNTP的混合物;以及合适的缓冲液,其中所述系统处于对于将核酸片段在RNA引导的核酸酶消化的位点上插入分离的病毒核酸中以形成重组病毒核酸是有效的条件下。
在一些方面,本文所述的系统使得重组病毒核酸相较于参考和/或非工程化的病毒核酸能够产生具有至少一种改良的病毒性质的非天然存在的病毒颗粒。在一些实例中,改良的病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。
在一些方面,在本文所述的系统中,RNA引导的核酸酶是Cas9或Cas9衍生的酶。在一些实例中,在消化后将RNA引导的核酸酶灭活或去除。
本文公开的方法可用于多种其它病毒基因组和病毒载体构建体,用于通过直接编辑RNA基因组或DNA模板(其随后将被体外转录入成病毒RNA)来修饰RNA基因组,用于工程化并直接修饰原核和真核病毒,以及用于直接修饰用于噬菌体展示、噬菌体疗法、病毒诊断或疫苗开发/生产的病毒基因组。
在一些方面,本公开提供了通过本文所述的任何方法生成的重组病毒核酸。在一些实例中,相较于非工程化的病毒核酸,重组病毒核酸能够产生具有至少一种改良的病毒性质的非天然存在的病毒颗粒。在一些实例中,改良的病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。
在一些方面,本公开提供了工程化的病毒组合物,所述组合物包含相较于非工程化的病毒核酸能够产生具有至少一种改良的病毒性质的非天然存在的病毒颗粒的重组核酸物。在一些实例中,改良的病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。在一些实例中,根据本公开的工程化的病毒核酸通过本文所述方法中的任何步骤生成。
所述方法可用于改变核苷酸、基因或整个基因组区域。例如,如下面实施例中所述,已显示所述方法将LKD16 gp18基因替换至LUZ19中,从而导致改良的病毒宿主范围。另外,所述方法可用于在病毒管状复合物中插入单个突变以改善病毒复制。所述方法还可用于将以下物质工程化至细菌噬菌体中,以提高细菌噬菌体在细菌噬菌体疗法或相关用途中的活性:抗微生物肽;脓菌素;EPS解聚酶;CRISPR/Cas抑制蛋白;来自细菌噬菌体的尾丝;报道基因(即Lux、GFP);群体淬灭基因;核酸酶;TALEN核酸酶;I型、II型、III型、IV型、V型和VI型CRISPR系统蛋白(即Cas9);CRISPR RNA、转录因子和人免疫调节因子。这些元件可以可操作地连接至天然或异源调控元件,诸如天然启动子、异源启动子、诱导型启动子或其任何组合。
在一些实施方案中,本公开提供了包含工程化的病毒核酸的工程化的病毒,所述病毒核酸在引入宿主细胞时,相较于非工程化的病毒核酸,能够产生具有两种或更多种改良的病毒性质的非天然存在的病毒颗粒。在一些方面,所产生的病毒颗粒具有至少三种改良的病毒性质。在一些方面,每种改良的病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。
在一些实施方案中,本公开提供了包含工程化的病毒核酸的工程化的病毒。在一些方面,工程化的病毒核酸是工程化的病毒基因组。在一些方面,工程化的病毒基因组是工程化的细菌噬菌体基因组。在工程化的细菌噬菌体的一些方面,至少一种改良的病毒性质是宿主范围。
在一些实施方案中,本公开提供了具有两种或更多种改良的病毒性质的工程化的病毒,其包含工程化的病毒核酸。在一些方面,每种改良的病毒性质是工程化的病毒核酸中的至少一个修饰的结果。在一些方面,至少一种改良的病毒性质是工程化的病毒核酸中的至少两个修饰的结果。在一些方面,包含在工程化的病毒核酸中的修饰是单个工程步骤的结果。在一些方面,包含在工程化的病毒核酸中的修饰是迭代工程步骤的结果。
在一些实施方案中,本公开提供了具有两种或更多种改良的病毒性质的工程化的病毒,其包含工程化的病毒核酸。
在一些方面,所述修饰中的至少一个在核酸序列中,所述核酸序列与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:50或SEQ ID NO:25内的序列具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性。
在一些方面,所述修饰中的至少一个在编码氨基酸序列的核酸序列中,所述氨基酸序列与SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:5、SEQ ID NO:48或SEQID NO:49具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性。
在一些方面,工程化的病毒基因组包含与LUZ19基因组具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的病毒基因组的全部或部分。在一些方面,工程化的病毒基因组还包含异源gp18基因的全部或部分。在一些方面,异源gp18基因与SEQ ID NO:26具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性。在一些方面,异源gp18基因编码与SEQ ID NO:38具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列。
在一些方面,工程病的毒基因组包含与LUZ19基因组具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的病毒基因组的全部或部分。在一些方面,工程化的病毒基因组还包含工程化的gp34基因的全部或部分。在一些方面,工程化的gp34基因编码在对应于SEQ ID NO:5的氨基酸位置55的位置处包含突变的氨基酸序列。在一些方面,异源gp34基因与SEQ ID NO:4具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性。
在一些方面,工程化的病毒基因组包含与LUZ19基因组具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的病毒基因组的全部或部分。在一些方面,工程化的病毒基因组还在一个或多个序列中包含修饰,所述序列与选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3和SEQ ID NO:50组成的组的序列具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性。
在一些方面,工程化的病毒基因组还在以下序列的每个序列中包含修饰:与SEQID NO:1具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列,与SEQ ID NO:2具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列,与SEQ ID NO:3具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列,与SEQ ID NO:50具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列。在一些方面,修饰包括对应于SEQ ID NO:1的核酸位置50的位置处的G至A的替换,对应于SEQ ID NO:50的核酸位置160的位置处的G至T的替换,对应于SEQ ID NO:2的核酸位置245的位置处的A至G的替换,对应于SEQ ID NO:2的核酸位置247-248的位置处的AT至TC的替换,以及对应于SEQ ID NO:3的核酸位置757的位置处的A至G的替换。
在一些方面,工程化的病毒基因组包含与LUZ19基因组具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的病毒基因组的全部或部分。在一些方面,工程化的病毒基因组还在编码氨基酸序列的一个或多个核酸序列中包含修饰,所述氨基酸序列与选自由SEQ ID NO:34、SEQ IDNO:35、SEQ ID NO:36和SEQ ID NO:48组成的组的序列具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性。
在一些方面,工程化的病毒基因组在编码以下氨基酸序列中的每一个的核酸序列中包含修饰:与SEQ ID NO:34具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列,与SEQ IDNO:35具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列,与SEQ ID NO:36具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列,和与SEQ ID NO:48具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列。在一些方面,所述修饰包括对应于SEQ ID NO:34的氨基酸位置17的位置处的C至Y的替换,对应于SEQ ID NO:48的氨基酸位置36的位置处的D至Y的替换,对应于SEQ ID NO:35的氨基酸位置82的位置处的D至G的替换,对应于SEQ ID NO:35的氨基酸位置83的位置处的I至S的替换,以及对应于SEQ ID NO:36的氨基酸位置253的位置处的N至D的替换。
在一些方面,工程化的病毒基因组包含与LUZ19基因组具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的病毒基因组的全部或部分。在一些方面,工程化的病毒基因组还在与SEQ ID NO:25具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列中包含修饰。在一些方面,所述修饰是将异源核酸分子插入与SEQ ID NO:25具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列,或者用异源核酸分子替换包含在与SEQ ID NO:25具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列中的序列。在一些方面,异源核酸分子包含异源核酸序列,所述序列与选自由SEQ ID NO:6、SEQ ID NO:12、SEQID NO:13、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19和SEQ ID NO:20组成的组的序列具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性。
在一些方面,工程化的病毒基因组包含与LUZ19基因组具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的病毒基因组的全部或部分。在一些方面,工程化的病毒基因组还在编码氨基酸序列的核酸序列中包含修饰,所述氨基酸序列与SEQ ID NO:49具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性。在一些方面,所述修饰是将异源核酸分子插入编码氨基酸序列的核酸序列,所述氨基酸序列与SEQ ID NO:49具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性,或用异源核酸分子替换编码氨基酸序列的核酸序列中的核酸序列,所述氨基酸序列与SEQ ID NO:49具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性。在一些方面,所述异源核酸分子包含编码与选自由SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46和SEQ ID NO:47组成的组的序列具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列的异源核酸序列。
在一些方面,工程化的病毒核酸包含可操作地连接至启动子的异源核酸序列,所述启动子含有包含在SEQ ID NO:21或其部分内的核酸序列。
在一些方面,工程化的病毒核酸包含可操作地连接至终止子的异源核酸序列,所述终止子含有包含在SEQ ID NO:22或其部分内的核酸序列。
在一些实施方案中,本公开提供了用于生成具有两种或更多种所需病毒性质的工程化的目标病毒的方法,其包括:(a)提供第一病毒基因组;和(b)通过将第一病毒基因组的至少一个片段与至少一个修复核酸分子组合来工程化第二病毒基因组,使得所得的第二病毒基因组相较于第一病毒基因组包含至少一个修饰,并且其中,在被引入宿主细胞时,所述第二病毒基因组能够产生具有两种或更多种改良的病毒性质的病毒颗粒。在一些方面,本文公开的方法还包括(c)在一次或多次迭代中重复步骤(a)-(b)。在一些方面,每种改良的病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。
在一些实施方案中,本公开提供了用于生成具有两种或更多种如本文所述的所需病毒性质的工程化的目标病毒的方法。在一些方面,在步骤(b)中工程化第二病毒基因组还包括:(1)使用内切核酸酶体外消化第一病毒基因组的区域;和(2)将消化的第一病毒基因组的至少一个片段与至少一种修复核酸分子组装。在一些方面,从病毒颗粒分离所述第一病毒基因组。在一些方面,从头合成第一病毒基因组或至少一种修复核酸分子。在一些方面,从头合成包括组合化学合成的核酸分子、PCR扩增的核酸序列、分离的核酸分子的消化片段或其任何组合。在一些方面,在体外消化之前扩增第一病毒基因组或至少一种修复核酸分子。
在一些实施方案中,本公开提供了用于生成具有两种或更多种如本文所述的期望的病毒性质的工程化的目标病毒的方法。在一些方面,第一病毒基因组为至少18kb。在一些方面,第一病毒基因组为至少2kb至至少4Mb。在一些方面,第一病毒基因组为至少18kb至至少4Mb。在一些方面,第一病毒基因组为至少5kb、至少10kb、至少15kb、至少18kb、至少20kb、至少25kb、至少30kb、至少35kb、至少40kb、至少45kb、至少50kb、至少55kb、至少60kb、至少65kb、至少70kb、至少75kb、至少80kb、至少85kb、至少90kb、至少100kb、至少125kb、至少150kb、至少175kb、至少200kb、至少250kb、至少300kb、至少400kb、至少500kb、至少600kb、至少700kb、至少800kb、至少900kb、至少1Mb、至少1.5Mb、至少2Mb、至少2.5Mb、至少3Mb或至少3.5Mb。
在一些实施方案中,本公开提供了用于生成具有两种或更多种如本文所述的所需病毒性质的工程化的目标病毒的方法。在一些方面,在体外或体内进行组装。在一些方面,在对于将片段插入消化的病毒核酸中以形成包含工程化的病毒基因组的重组核酸是有效的条件下,利用混合物在体外进行组装,所述混合物包含:(a)缺少3'外切核酸酶活性的分离的非热稳定的5'至3'外切核酸酶;(b)拥挤剂;(c)具有3'外切核酸酶活性的分离的热稳定的非链置换DNA聚合酶,或所述DNA聚合酶与缺少3'外切核酸酶活性的第二DNA聚合酶的混合物;(d)分离的热稳定的连接酶;(e)dNTP的混合物;和(f)合适的缓冲液。
在一些实施方案中,本公开提供了用于生成具有两种或更多种如本文所述的所需病毒性质的工程化的目标病毒的方法。在一些方面,在体外或体内进行组装。在一些方面,在宿主细胞中在体内进行组装。
在一些实施方案中,本公开提供了用于生成具有两种或更多种如本文所述的所需病毒性质的工程化的目标病毒的方法。在一些方面,所述内切核酸酶是RNA引导的核酸酶。在一些方面,所述方法还包括一种或多种引导RNA。在一些方面,RNA引导的核酸酶是Cas9或Cas9衍生的酶。在一些方面,所述引导RNA包括1)嵌合gRNA或2)crRNA和tracrRNA。
在一些实施方案中,本公开提供了用于生成具有两种或更多种如本文所述的所需病毒性质的工程化的目标病毒的方法。在一些方面,所述内切核酸酶被热灭活或去除。在一些方面,体外消化还包括亚精胺。
在一些实施方案中,本公开提供了用于生成具有两种或更多种如本文所述的所需病毒性质的工程化的目标病毒的方法。在一些方面,所述方法还包括将工程化的病毒基因组转化到宿主细胞中。在一些方面,所述方法还包括使用用于将工程化的病毒基因组包装到病毒颗粒中的体外包装试剂盒。
在一些实施方案中,本公开提供了通过本文公开的任何方法生成的工程化的病毒。
在一些实施方案中,本公开提供了通过本文公开的任何工程方法生成的本文公开的工程化的病毒中的任一种的组合物。
在一些实施方案中,本公开提供了用于工程化病毒核酸分子的试剂盒,其包含:纯化的重组RNA引导的核酸酶;缺少3'外切核酸酶活性的分离的非热稳定的5'至3'外切核酸酶;拥挤剂;具有3'外切核酸酶活性的分离的热稳定的非链置换DNA聚合酶,或所述DNA聚合酶与缺少3'外切核酸酶活性的第二DNA聚合酶的混合物;分离的热稳定的连接酶;dNTP的混合物;以及合适的缓冲液。在一些方面,所述试剂盒还包含定制设计的引导RNA。在一些情况下,所述试剂盒还包含定制设计的合成核酸分子以在组装反应中用作插入的DNA片段。在一些方面,所述试剂盒还包含用于转化的感受态宿主细胞。在一些方面,所述试剂盒还包含分离的病毒基因组核酸。
在一些方面,本公开提供了体外工程化的病毒核酸系统,其包含:分离的病毒核酸、重组RNA引导的核酸酶、至少一种靶向RNA和待插入所述分离的核酸消化位点的核酸片段。在一些实例中,所述系统使得重组RNA引导的核酸酶和至少一种靶向RNA形成能够消化所述分离的病毒核酸的复合物。在一些实例中,所述系统还包含亚精胺。在一些实例中,所述系统还包含:缺少3'外切核酸酶活性的分离的非热稳定的5'至3'外切核酸酶;拥挤剂;具有3'外切核酸酶活性的分离的热稳定的非链置换DNA聚合酶或所述DNA聚合酶与缺少3'外切核酸酶活性的第二DNA聚合酶的混合物;分离的热稳定的连接酶;dNTP的混合物;以及合适的缓冲液,其中所述系统处于对于将核酸片段在RNA引导的核酸酶消化的位点上插入所述分离的病毒核酸中以形成重组病毒核酸是有效的条件下。
在一些方面,本文所述的系统使得重组病毒核酸相较于非工程化的病毒核酸能够产生具有至少一种改良的病毒性质的非天然存在的病毒颗粒。在一些实例中,改良的病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。
在一些方面,在本文所述的系统中,RNA引导的核酸酶是Cas9或Cas9衍生的酶。在一些实例中,在消化后将RNA引导的核酸酶灭活或去除。
在一些方面,本文所述的方法用作校正分离的核酸中的序列的差错校正方法。标准差错校正方法是基于PCR的,其具有两个固有的问题:1)PCR可向核酸中引入额外的不想要的突变;和2)在上下文中PCR具有约5kb的大小限制。因此,作为PCR生成的突变或不能扩增的结果,不能可靠地对大于5kb的质粒进行基于PCR的标准差错校正方法。本文所述的体外工程化核酸序列的方法避免了对PCR扩增的需要,其消除了大小限制并消除了PCR生成的突变的可能性。
在一些方面,本公开提供了工程化核酸序列的体外方法,所述方法包括分离核酸;使用RNA引导的核酸酶体外消化所述核酸的区域;以及通过将DNA或RNA片段插入消化的核酸中来组装重组核酸。在一个方面,体外消化是RNA引导的酶促消化。另一方面,酶促消化使用Cas9或Cas9衍生的酶来进行。在另外的方面,消化还包括靶向RNA。在另一个方面,消化还包括亚精胺。在特定方面,靶向RNA是gRNA、crRNA和/或tracrRNA。在另一个方面,在消化后,通过标准方法诸如暴露于热(例如,诸如至少80℃)灭活RNA引导的核酸酶。另外或可选地,通过标准方法(诸如,例如苯酚-氯仿提取)除去RNA引导的核酸酶。
在一些方面,本公开提供了工程化核酸序列的体外方法,所述方法包括分离核酸;使用RNA引导的核酸酶体外消化所述核酸的区域;以及通过将DNA或RNA片段插入消化的核酸中来组装重组核酸。在一些实例中,在对于将片段插入消化的病毒核酸中以形成重组核酸是有效的条件下,利用组分的混合物在单个容器中在体外进行组装,所述混合物包含:(a)缺少3'外切核酸酶活性的分离的非热稳定的5'至3'外切核酸酶,(b)拥挤剂,(c)具有3'外切核酸酶活性的分离的热稳定的非链置换DNA聚合酶,或所述DNA聚合酶与缺少3'外切核酸酶活性的第二DNA聚合酶的混合物,(d)分离的热稳定的连接酶,(e)dNTP的混合物,和(f)合适的缓冲液。在一些方面,外切核酸酶是T5外切核酸酶,并且接触处于等温条件下,和/或拥挤剂是PEG,和/或非链置换DNA聚合酶是PhusionTM DNA聚合酶或
Figure BDA0003053899790000691
DNA聚合酶,和/或连接酶是Taq连接酶。在一些实例中,通过一步或等温吉布森组装进行体外组装。在一些实例中,通过两步吉布森组装进行体外组装。
在一些方面,本公开提供了工程化核酸序列的体外方法,所述方法包含RNA引导的核酸酶。在一些实例中,RNA引导的核酸酶是II型Cas9。在一些实例中,RNA引导的核酸酶是Cas9或Cas9衍生的酶。在一些实例中,RNA引导的核酸酶是分离的重组Cas9或Cas9衍生的酶。在一些实例中,存在至少一种分离的靶向RNA。在一些实例中,存在两种靶向RNA。在一些实例中,靶向RNA是嵌合指导RNA(gRNA)或一组crRNA和tracrRNA。在一些实例中,体外消化反应使用两种gRNA。在一些实例中,体外消化反应使用两组crRNA和tracrRNA。
在一些方面,本公开提供了工程化核酸序列的体外方法,所述方法包括体外消化步骤。在一些实例中,在消化后,通过标准方法诸如暴露于热(例如,诸如至少80℃)灭活RNA引导的核酸酶。在一些实例中,在消化后,通过苯酚-氯仿提取除去RNA引导的核酸酶。在一些实例中,在消化后,通过本领域公知的其它提取方法除去RNA引导的核酸酶。
在一些方面,本公开提供了工程化核酸序列的体外方法,所述方法产生工程化的核酸。在一些实例中,然后将工程化的核酸转化到宿主细胞中。在一些实例中,宿主细胞是大肠杆菌、铜绿假单胞菌、酿酒酵母、需钠弧菌、枯草芽孢杆菌或本领域公知的其它微生物。在一些实例中,通过热休克、电穿孔、基因枪、微粒轰击、缀合、转导、脂转染或本领域公知的其它已建立的方法进行转化。
在一些方面,本公开提供了工程化核酸序列的体外方法,所述方法包括分离的核酸。在一些实例中,核酸是从宿主细胞分离的完整基因组。在一些实例中,宿主细胞是大肠杆菌、酿酒酵母、枯草芽孢杆菌、需钠弧菌、铜绿假单胞菌或其它公知的微生物。在一些实例中,核酸是质粒。在一些实例中,从宿主细胞分离质粒。在一些实例中,已将目标核酸克隆到质粒中,转化到宿主细胞中,并且在体外工程之前通过本文所述的方法分离。
在一些方面,本公开提供了工程化核酸序列的体外方法,所述方法包括分离核酸。在一些实例中,分离的核酸是基因组或质粒。在一些实例中,分离的基因组或质粒为至少6kb、至少7kb、至少8kb、至少9kb、至少10kb、至少12kb、至少15kb、至少20kb、至少25kb或至少28kb。在一些实例中,分离的基因组或质粒为6kb至1MB。在一些实例中,分离的基因组或质粒为6kb至10kb、8kb至15kb、12kb至20kb、15kb至22kb、20kb至25kb、22kb至28kb、25kb至30kb、25kb至50kb或40kb至100kb。
另外或可选地,对于任何上述公开的实施方案,本公开包括以下实施方案:
实施方案1是包含工程化的病毒核酸的工程化的病毒,所述工程化的病毒核酸在引入宿主细胞时,相较于通过将非工程化的病毒核酸引入宿主细胞而产生的病毒颗粒,能够产生具有两种或更多种,或任选地三种或更多种改良的病毒性质的非天然存在的病毒颗粒。
实施方案2是实施方案1的工程化的病毒,其中每种改良的病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。
实施方案3是实施方案1或2的工程化的病毒,其中所述病毒核酸是以下病毒核酸中的一种或多种:病毒基因组、病毒基因组片段、细菌噬菌体基因组、细菌噬菌体基因组片段、裂解性细菌噬菌体基因组、裂解性细菌噬菌体基因组片段或其任何组合。
实施方案4是实施方案1-3中任一项的工程化的病毒,其中所述工程化的病毒核酸是细菌噬菌体基因组,并且任选地,其中所述改良的病毒性质中的至少一种是宿主范围。
实施方案5是实施方案1-4中任一项的工程化的病毒,其中满足以下方面中的至少一个:1)每种改良的病毒性质是工程化的病毒核酸中的至少一个修饰的结果,2)至少一种改良的病毒性质是工程化的病毒核酸中的至少两个修饰的结果,3)包含在工程化的病毒核酸中的修饰是单个工程步骤的结果,4)包含在工程化的病毒核酸中的修饰是迭代工程步骤的结果,或5)其任何组合。
实施方案6是实施方案1-5中任一项的工程化的病毒,其中至少一个修饰在以下序列中:
1)与包含在SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:50或SEQ ID NO:25内的序列具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的核酸序列,或
2)编码氨基酸序列的核酸序列,所述氨基酸序列与SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:5、SEQ ID NO:48或SEQ ID NO:49具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性,或
3)其任何组合。
实施方案7是实施方案1-6中任一项的工程化的病毒,其中所述工程化的病毒核酸包含工程化的病毒基因组,所述工程化的病毒基因组包含与LUZ19基因组具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的病毒基因组的全部或部分。
实施方案8是实施方案1-7中任一项的工程化的病毒,其中所述工程化的病毒基因组还包含以下序列的至少一种:
1)异源gp18基因的全部或部分,以及任选地,其中所述异源gp18基因与SEQ IDNO:26具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性;
2)异源gp18基因的全部或部分,以及任选地,其中所述异源gp18基因编码与SEQID NO:38具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列;
3)工程化的gp34基因的全部或部分,以及任选地,其中所述异源gp34基因编码氨基酸序列,所述氨基酸序列在对应于SEQ ID NO:5的氨基酸位置55的位置处包含突变,或任选地其中所述异源gp34基因与SEQ ID NO:4具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性;
4)一个或多个序列中的修饰,所述序列与选自由SEQ ID NO:1、SEQ ID NO:2、SEQID NO:3和SEQ ID NO:50组成的组的序列具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性,
并且任选地以下序列中的每一个中的修饰:与SEQ ID NO:1具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列,与SEQ ID NO:2具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列,与SEQ IDNO:3具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列,以及与SEQ ID NO:50具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列,
并且任选地,其中所述修饰包括对应于SEQ ID NO:1的核酸位置50的位置处的G至A的替换、对应于SEQ ID NO:50的核酸位置160的位置处的G至T的替换、对应于SEQ ID NO:2的核酸位置245的位置处的A至G的替换、对应于SEQ ID NO:2的核酸位置247-248的位置处的AT至TC的替换和对应于SEQ ID NO:3的核酸位置757的位置处的A至G的替换;
5)一个或多个编码氨基酸序列的核酸序列中的修饰,所述氨基酸序列与选自由SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36和SEQ ID NO:48组成的组的序列具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性,
并且任选地编码以下氨基酸序列中的每一个的核酸序列中的修饰:与SEQ ID NO:34具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列,与SEQ ID NO:35具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列,与SEQ ID NO:36具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列,与SEQ ID NO:48具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列,
并且任选地,其中所述修饰包括对应于SEQ ID NO:34的氨基酸位置17的位置处的C至Y的替换,对应于SEQ ID NO:48的氨基酸位置36的位置处的D至Y的替换,对应于SEQ IDNO:35的氨基酸位置82的位置处的D至G的替换,对应于SEQ ID NO:35的氨基酸位置83的位置处的I至S的替换,以及对应于SEQ ID NO:36的氨基酸位置253的位置处的N至D的替换;
6)与SEQ ID NO:25具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列中的修饰,
并且任选地,其中所述修饰是将异源核酸分子插入与SEQ ID NO:25具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列中,或用异源核酸分子替换包含在与SEQ ID NO:25具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的序列中的序列,
并且任选地,其中所述异源核酸分子包含异源核酸序列,所述异源核酸序列与选自由SEQ ID NO:6、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:17、SEQ ID NO:18、SEQ ID NO:19和SEQ ID NO:20组成的组的序列具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性;
7)编码氨基酸序列的核酸序列中的修饰,所述氨基酸序列与SEQ ID NO:49具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性,
并且任选地其中所述修饰是将异源核酸分子插入编码氨基酸序列的核酸序列中,所述氨基酸序列与SEQ ID NO:49具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性,或用异源核酸分子替换包含在编码氨基酸序列的核酸序列中的核酸序列,所述氨基酸序列与SEQ ID NO:49具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性,
并且任选地其中所述异源核酸分子包含编码与选自由SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ IDNO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46和SEQ ID NO:47组成的组的序列具有至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、100%或完全的同一性的氨基酸序列的异源核酸序列,
8)其任何组合。
实施方案9是实施方案1-8中任一项的工程化的病毒,其中所述工程化的病毒核酸包含可操作地连接至以下序列的异源核酸序列:1)含有包含在SEQ ID NO:21或其部分内的核酸序列的启动子,2)含有包含在SEQ ID NO:22或其部分内的核酸序列的终止子,或3)其任何组合。
实施方案10是用于生成具有两种或更多种所需病毒性质的工程化的目标病毒的方法,其包括:(a)提供第一病毒基因组;和(b)通过将第一病毒基因组的至少一个片段与至少一个修复核酸分子组合以生成第二病毒基因组来生成工程化的病毒基因组,所述第二病毒基因组相较于所述第一病毒基因组包含至少一个修饰;其中,所述第二病毒基因组在被引入宿主细胞时能够产生具有两种或更多种改良的病毒性质的病毒颗粒,以及(c)在一次或多次迭代中重复步骤(a)-(b)。
实施方案11是实施方案10的方法,其中每种改良的病毒性质选自由以下组成的组:宿主范围、病毒裂解周期、吸附、附着、注射、复制和组装、裂解、裂解量、免疫逃避、免疫刺激、免疫失活、生物膜分散、细菌噬菌体抗性、细菌抗生素敏化、毒力因子的调节和靶向宿主基因组消化或编辑。
实施方案12是实施方案10或11的方法,其中在步骤(b)中生成工程化的病毒基因组包括:(1)使用内切核酸酶体外消化第一病毒基因组的区域;和(2)将消化的第一病毒基因组的至少一个片段与至少一个修复核酸分子组装。
实施方案13是实施方案10-12中任一项的方法,其中满足以下要素中的至少一个:1)从病毒颗粒分离第一病毒基因组,2)从头合成第一病毒和/或至少一种修复核酸分子并且任选地,其中从头合成包括组合化学合成的核酸分子、PCR扩增的核酸序列、分离的核酸分子的消化的片段或其任何组合,3)在体外消化之前扩增第一病毒基因组和/或至少一种修复核酸酸分子,或4)其任何组合。
实施方案14是实施方案10-13中任一项的方法,其中所述第一病毒基因组是以下的至少一种:
1)至少3kb、至少10kb、至少18kb、至少25kb或至少30kb;
2)至少18kb;
3)至少2kb至至少4Mb;
4)至少18kb至至少4Mb;或
5)至少5kb、至少10kb、至少15kb、至少18kb、至少20kb、至少25kb、至少30kb、至少35kb、至少40kb、至少45kb、至少50kb、至少55kb、至少60kb、至少65kb、至少70kb、至少75kb、至少80kb、至少85kb、至少90kb、至少100kb、至少125kb、至少150kb、至少175kb、至少200kb、至少250kb、至少300kb、至少400kb、至少500kb、至少600kb、至少700kb、至少800kb、至少900kb、至少1Mb、至少1.5Mb、至少2Mb、至少2.5Mb、至少3Mb或至少3.5Mb。
实施方案15是实施方案10-14中任一项的方法,其中体外进行所述组装,并且任选地其中在对于将片段插入消化的病毒核酸中以形成包含所述工程化的病毒基因组的重组核酸是有效的条件下,利用混合物在体外进行所述组装,所述混合物包含:(a)缺少3'外切核酸酶活性的分离的5'至3'外切核酸酶,其任选地是非热稳定的;(b)任选的拥挤剂;(c)具有3'外切核酸酶活性的分离的非链置换DNA聚合酶,其任选地是热稳定的,或所述DNA聚合酶与缺少3'外切核酸酶活性的第二DNA聚合酶的混合物;(d)任选地为热稳定的分离的连接酶;(e)dNTP的混合物;和(f)任选合适的缓冲液。
实施方案16是实施方案10-14中任一项的方法,其中体内进行所述组装,并且任选地其中在宿主细胞中进行体内组装。
实施方案17是实施方案10-16中任一项的方法,其中满足以下要素中的至少一个:1)内切核酸酶是RNA引导的核酸酶,2)所述方法还包括至少一种引导RNA,3)所述RNA引导的核酸酶是Cas9或Cas9衍生的酶,并且其中所述至少一个引导RNA包括(a)嵌合gRNA或(b)crRNA和tracrRNA,4)在组装之前将所述内切核酸酶热灭活或去除;5)体外消化还包括亚精胺,6)所述方法还包括将工程化的病毒基因组转化到宿主细胞中,7)所述方法还包括使用用于将式程化的病毒基因组包装到病毒颗粒中的体外包装试剂盒,或8)其任何组合。
实施方案18是通过实施方案10-17中任一项的方法生成的工程化的病毒,并且任选地,其中所述工程化的病毒是来自实施方案1-9的任一项的工程化的病毒。
实施方案19是用于工程化核酸分子的试剂盒,所述核酸分子任选地是病毒核酸分子,所述试剂盒包含:(a)纯化的重组RNA引导的核酸酶;(b)缺少3'外切核酸酶活性的分离的5'至3'外切核酸酶,其任选地是非热稳定的;(c)具有3'外切核酸酶活性的分离的非链置换DNA聚合酶,其任选地是热稳定的,或所述DNA聚合酶与缺少3'外切核酸酶活性的第二DNA聚合酶的混合物;(d)分离的连接酶,其任选地是热稳定的;并且任选地还包含以下任何一种:1)拥挤剂,2)dNTP的混合物,3)合适的缓冲液,4)定制设计的引导RNA,5)定制设计的合成核酸分子,以在组装反应中用作插入的DNA片段,6)用于转化的感受态宿主细胞,7)分离的病毒基因组核酸,或8)其任何组合。
实施方案20是工程化核酸序列的方法,其包括:(a)提供核酸;(b)使用RNA引导的核酸酶体外消化所述核酸的区域;和(c)通过将DNA片段插入消化的核酸中组装重组核酸,其中在对于将片段插入消化的核酸中以形成重组核酸是有效的条件下,利用组分的混合物在单个容器中在体外进行所述组装,所述混合物包含:(i)缺少3'外切核酸酶活性的分离的5'至3'外切核核酸酶,其任选地是非热稳定的;(ii)具有3'外切核酸酶活性的分离的非链置换DNA聚合酶,其任选地是热稳定的,或所述DNA聚合酶与缺乏3'外切核酸酶活性的第二DNA聚合酶的混合物;(iii)分离的连接酶,其任选地是热稳定的;(iv)dNTP的混合物,并且任选地其中所述体外组装混合物还包含(v)拥挤剂,或(vi)合适的缓冲液。
实施方案21是实施方案20的方法,其中满足以下要素中的至少一个:1)所述RNA引导的核酸酶是Cas9或Cas9衍生的酶,2)在组装之前将所述RNA引导的核酸酶热灭活或去除,3)所述方法还包括将重组核酸转化到宿主中细胞中,4)所述核酸是从宿主细胞分离的质粒,并且任选地其中所述质粒为至少6kb、至少10kb、至少15kb或至少20kb,或5)其任何组合。
在以下实施例中进一步举例说明了本公开的所有方面。然而,实施例不限制由所附权利要求限定的本公开的范围。本文给出的一般方法的论述旨在仅用于说明目的。在审阅本公开内容之后,其它替代方法和实施方案对于本领域的技术人员来说将是显而易见的,并且将被包括在本申请的精神和范围内。
实施例
实施例I
体外病毒基因组基工程
例如使用Norgen Biotek噬菌体DNA分离试剂盒或本领域已知的任何其它方法,从病毒颗粒分离43kb dsDNA LUZ19病毒基因组(登录号NC_010326.1)(图2A)。使用RNA引导的核酸酶Cas9和体外转录的gRNA在两个独立位置进行位点特异性消化。未消化的43kb基因组DNA比最大的DNA梯带(10kb)迁移明显更少。线性基因组的消化产生三个尺寸的片段:~39kb、~4.3kb和~200bp。过量使用靶向gRNA并阻碍200bp片段(图2B)。使用具有5'尾(其与紧接LUZ19消化位点的上游和下游的区域具有100bp同源性)的引物从ΦKF77PCR扩增gp7的片段(图2C)。使用吉布森组装法将PCR扩增的ΦKF77gp7片段(SEQ ID NO:8)无缝整合到消化的LUZ19基因组中以替换天然gp7区域(SEQ ID NO:23)(图2D)。几乎未观察到本底,因为Cas9切割导致缺少体外吉布森组装所需的同源性的平端双链断裂。将体外编辑的基因组直接转化到宿主细胞中以产生功能性病毒颗粒(图2E)。利用在工程区域内部和外部的引物,使用PCR验证了ΦKF77基因片段至回收病毒中的整合。未编辑的LUZ19 gDNA用作阴性对照,而所有实验病毒包含新的ΦKF77基因片段(最后7个泳道)。
这些数据呈现实施体外病毒工程以编辑铜绿假单胞菌裂解性噬菌体基因组的实例。由于在异源细菌宿主诸如大肠杆菌中的毒性作用,缺少适于毒性病毒的选择标记以及在LUZ19基因组内缺少独特的标准限制性内切酶位点,因此不能通过标准方法工程化噬菌体诸如LUZ19。因此,这些数据证明了本文所述的体外工程方法是如何使得能够直接和快速地工程化其它非遗传易控的病毒基因组。
对于至铜绿假单胞菌中的转化,如Irani和Rowe((Irani,V.R.&Rowe,J.J.BioTechniques1997,22,54-56)中所述制备化学感受态铜绿假单胞菌细胞。基本上,将3ml铜绿假单胞菌细胞的起子培养物稀释在400ml新鲜LB中。除非另外提及,否则将培养物在37℃振荡(220rpm)下生长至OD600=0.6。将细胞在冰上冷冻10分钟,转移到500ml离心瓶中,并在冷冻离心机(4℃)中以5,000g沉淀20分钟。将细菌沉淀用100ml冰冷的150mM MgCl2洗涤,然后分入两个50ml锥形管中,并在冷冻离心机(4℃)中以5,000g沉淀。将细胞用30ml150mM MgCl2再次洗涤一次,然后离心,并悬浮于15ml冷的150mM MgCl2中。将细胞悬浮液在冰上孵育1小时,然后在4℃下离心并重新悬浮于4ml冷的150mM MgCl2中。将200μl等分样品置于单个1.5ml微量离心管中,并保持在冰上达2天。将纯化的DNA添加至细胞的每个等分试样中,短暂涡旋,并在冰上孵育1小时。将细胞在50℃下热休克3分钟,然后直接放置回冰上5分钟,然后铺板。将每个转化添加4ml的50℃的LB顶层琼脂中,并铺板在预温热的LB板上。将板倒置并在37℃ON下孵育以允许噬斑形成。
实施例II
具有扩大的宿主范围的工程化的病毒
使用双琼脂噬斑测定法筛选大型临床文库(282个铜绿假单胞菌分离株)对噬菌体LUZ19和LKD16的易感性。66个菌株能够被两种病毒中的至少一种感染,其中18个和6个菌株分别被LUZ19和LKD16唯一地感染。因此,LUZ19被选为用于测试负责宿主范围扩大的LKD16遗传元件的底盘。两种病毒之间的比较基因组学表明LKD16基因产物18(gp18)与LUZ19gp18同源物具有不同的序列,表明其可能负责宿主范围的决定。如上所述从LUZ19病毒颗粒分离病毒基因组。使用RNA-依赖性核酸酶和体外转录的gRNA进行位点特异性消化以切除LUZ19 gp18基因。用LUZ19同源末端PCR扩增来自LKD16的gp18以用于整合。使用吉布森组装法将PCR扩增的LKD16 gp18(SEQ ID NO:7)无缝地整合到消化的LUZ19基因组中,以替换天然gp18序列(SEQ ID NO:50)。将体外工程化的基因组直接转化到宿主细胞中以产生功能性病毒颗粒。具有LKD16基因gpl8的工程化LUZ19病毒能够感染通常被LUZ19噬菌体感染的所有菌株以及先前仅被LKD16感染的3个菌株,从而证明宿主范围扩大(图3B和6B)。这表明gpl8是负责差异性LKD16宿主范围的遗传元件,以及具有该基因的工程化的LUZ19病毒更好地能够在更多宿主菌株中复制。
这些数据表明对其它非遗传易控的病毒基因组实施本文所公开的体外工程方法,这导致扩大的宿主范围的改良的病毒性质。当开发杀死细菌的病毒时,合理工程化具有扩大的宿主范围的细菌噬菌体的能力是具有重要价值的性质。
实施例III
具有病毒属的宿主范围的工程化的病毒
将LUZ19和/或LUZ19衍生物用作用于进化或共感染实验的起始材料,以鉴定用于将ΦKMV病毒属的宿主范围压缩成单个代表性病毒的靶标。在受纳(PAO1K)或非受纳(抗性)宿主(PA7410或PA7649)中进行共转化或共感染实验(图4A)。分别在LKD16或ΦKMV存在的情况下进行共感染和共转化。针对指定细菌菌株使用双琼脂噬斑平板测定法测试宿主范围。在目标菌株中筛选扩大的宿主范围后,将进化的噬菌体可选地通过受纳和选择性菌株(仅被LUZ19-PA7632感染的菌株)传代3-5次。在PAO1K中扩增出进化的噬菌体,纯化gDNA并对其进行测序。将LUZ19与能够感染先前仅对LKD16或ΦKMV敏感的菌株的进化的LUZ19之间的比较基因组学用于鉴定负责宿主范围扩大的点突变(图4B)。
使用双琼脂噬斑测定法筛选大型临床文库(282个铜绿假单胞菌分离株)对ΦKMV病毒属的易感性。3种噬菌体(LUZ19、LKD16和ΦKMV)显示不同的宿主范围,并能够感染67个菌株,其中LUZ19感染大多数临床分离株(图4C)。6个临床分离株(PA7245、PA7255、PA7427、PA7503、PA7686和PA7410)仅对LKD16易感,1个临床分离株仅对ΦKMV(PA7649)易感。因此,LUZ19被选为进化/共感染/共转化实验的底盘,以获得能够感染所有对ΦKMV属敏感的临床分离株的变体。比较基因组学揭示了几个点突变是LUZ19感染仅对LKD16或ΦKMV易感的菌株所必需的:(i)gp13 C17Y(SEQ ID NO:1的位置50)是PA7427的感染所必需的;(ii)gp18D36Y(SEQ ID NO:50的位置106)是PA7245、PA7503和PA7686的感染所需要的;gp38D82G和I83S(分别为SEQ ID NO:2的位置245和247-248)使得能够感染PA7410和PA7649;(iv)gp40N253D(SEQ ID NO:3的位置757)允许感染PA7255(图4B)。使用本文所述的体外工程法将上述突变迭代工程化至LUZ19底盘中导致能够感染对ΦKMV属噬菌体易感的所有临床分离株的广范围宿主范围LUZ19(WHR LUZ19)(图4C)。
这些数据提供了通过以下步骤使用本文公开的体外工程方法将病毒属的宿主范围压缩成单个病毒基因组的实例:首先在进化实验后鉴定负责宿主范围差异的遗传突变、筛选、测序、比较基因组学和其任何组合。
实施例IV
改良的病毒复制增强早期生物膜破坏
在另一个实例中,病毒进化和比较基因组学表明,由于增加的裂解量,在尾部管蛋白B(Gp34)内具有L55Δ突变的LUZ19进化的噬菌体以更大的速率复制(图5B)。为了验证Gp34 L55Δ突变具有改良的病毒性质,从病毒颗粒分离出LUZ19病毒基因组。使用RNA-依赖性核酸酶和体外转录的gRNA进行位点特异性消化以除去gp34基因(SEQ ID NO:4)。从LUZ19进化的噬菌体PCR扩增在氨基酸位置55处含有亮氨酸密码子的缺失(Gp34 L55Δ,SEQ IDNO:4的位置163-165)的gp34 L55Δ基因。使用吉布森组装法将PCR扩增的gp34L55Δ基因无缝地整合到经消化的LUZ19基因组中。将体外转化的基因组直接转化到宿主细胞中以产生功能性病毒颗粒。具有Gp34 L55Δ的工程化LUZ19病毒能够扩散和裂解细菌。使用双琼脂噬斑测定法显示具有gp34 L55Δ突变(噬菌体*)的LUZ19噬菌体具有比野生型LUZ19更大的清除区域。拍摄照片并在两天的时间内测量清除区域(图5B)。裂解宽度的扩大区域表明具有Gp34 L55Δ突变的病毒更好地能够扩散和裂解细菌。结晶紫生物膜测定将生物膜积累测量为结晶紫掺入的量度(图5C)。相较于具有野生型gp34基因的病毒,用具有gp34 L55Δ突变的病毒处理的样品具有生物膜的显着减少。显示相较于野生型LUZ19基因组的gp34突变的位置(星号)的图示(图5D)。本领域已知的标准测定法用于测量野生型和gp34 L55Δ突变体的病毒吸附、潜伏期和裂解量。这些数据表明,具有gp34 L55Δ突变的病毒具有极大增加的裂解量(图5E)。
这些数据提供了使用本文公开的体外工程方法产生具有增加的细菌裂解、裂解量、复制和早期生物膜破坏的改良的病毒性质的病毒的实例。
实施例V
具有早期生物膜破坏和扩大的宿主范围的迭代工程化的病毒
从病毒颗粒分离在实施例II中产生的宿主范围扩大的LUZ19LKD16gp18重组病毒基因组。使用RNA依赖性核酸酶和体外转录的gRNA进行位点特异性消化以去除gp34(SEQ ID NO:4)。然后将实施例IV中表征的裂解活性增加的gp34ΔLeu55突变(SEQ ID NO:4的位置163-165)进行PCR扩增,并使用吉布森组装将其组装至消化的LUZ19LKD16gp18病毒基因组中。将迭代地体外工程化的基因组直接转化到宿主细胞中以产生功能性病毒颗粒,即具有LKD16基因gp18和gp34ΔLeu55突变(LUZ19*LKD16gp18)的工程化的LUZ19病毒。
使用双琼脂噬斑、生物膜和体外人角质形成细胞附着测定法分析LUZ19*LKD16gp18病毒的改良的病毒性质。图6D显示LUZ19*LKD16gp18具有改良的宿主范围。比较LUZ19*LKD16gp18与天然LUZ19的破坏预先形成的MDR铜绿假单胞菌生物膜的能力。具体地,将LUZ19*LKD16gp18和野生型LUZ19与铜绿假单胞菌生物膜一起孵育并使用结晶紫测定破坏。图6E显示与野生型LUZ19相比,LUZ19*LKD16gp18具有增强的破坏预先形成的MDR铜绿假单胞菌生物膜的能力。分析LUZ19*LKD16gp18病毒针对附着至人角质形成细胞的细菌的噬菌体治疗的功效。具体地,将铜绿假单胞菌附着至单层HaCaT细胞。然后将细胞与LUZ19*LKD16gp18或野生型LUZ19一起孵育。结果表明,LUZ19*LKD16gp18噬菌体更好地能够杀死附着至人角质形成细胞的多药耐药性(MDR)铜绿假单胞菌(参见图6F)。
这些数据提供了本文所述的体外工程方法如何用于系统以迭代工程化具有多种独立改良的病毒性质(诸如扩大的宿主范围和增加的裂解量)的细菌噬菌体的实例。重要的是,这些工程步骤将不能使用标准方法直接进行或根本不能进行。另外,这些数据表明,本文公开的体外工程方法依序用于迭代轮的工程,一种用于合成生物学应用的重要性质。
实施例VI
迭代工程化具有生物膜分散有效载荷和覆盖全病毒属的扩大的宿主范围的病毒
通过使用本文所公开的体外工程方法替换gp49(SEQ ID NO:25),将胞外多糖(EPS)解聚酶或苯酚可溶性调控蛋白(PSM))克隆到LUZ19中,以测定它们分散成熟生物膜的能力(图7)。为了工程化LUZ19和WHR LUZ19以表达细胞外基质解聚酶或表面活性剂多肽,通过使用RNA依赖性核酸酶(在该情况下为Cas9)和体外转录的gRNA消化,随后使用吉布森组装用侧接主要衣壳启动子Pgp32(SEQ ID NO:21)和终止子Tgp32(SEQ ID NO:22)的目标基因(GOI)进行替换来去除LUZ19或WHR LUZ19的gp49(SEQ ID NO:25)(图7A和7C)。在野生型LUZ19的情况下,GOI是EPS解聚酶(Pp15gp44-来自恶臭假单胞菌Φ15的尾部突起Gp44(SEQID NO:NO:14);NTUgp34-来自肺炎克雷伯菌噬菌体NTU的尾部突起gp34(SEQ ID NO:NO:13);LKA1gp49-来自绿脓假单胞菌噬菌体LKA1的尾部突起gp49(SEQ ID NO:12))、来自表皮葡萄球菌(PSMa,SEQ ID NO:18)和金黄色葡萄球菌(PSMa3(SEQ ID NO:16)和PSMb2(SEQ IDNO:17))的表面活性剂酚可溶性调控蛋白和来自伴放线菌聚集菌的DspB表面活性素(SEQID NO:15)(图7B)。在WHR LUZ19的情况下,GOI是EPS解聚酶Pp15gp44(SEQ ID NO:14)和表面活化素SePSMa(SEQ ID NO:18)(图7D)。在其合适的宿主细胞内扩增工程化的噬菌体,分离所述噬菌体并通过测序验证。
针对在MBEC装置中生长的24小时生物膜,使用每孔100个噬菌体测试工程化的噬菌体分散成熟生物膜的能力,进行3小时。简言之,在补充有硫酸镁(1mM)、葡萄糖(0.2%)和酪蛋白氨基酸(0.5%)的M63基本培养基中稀释(1:100)铜绿假单胞菌的过夜培养物,然后将其添加至无菌微量滴定板(150μl/孔)。将带销子的盖子插入微量滴定板。在37℃孵育24小时后,将带销子的盖移至含有160μl含有100个噬菌体/孔的完全MG63的微量滴定板。在37℃孵育3小时后,将带销子的盖子在水中洗涤3次,干燥后用200μl 0.5%结晶紫染色。随后,用水漂洗板以除去未结合的结晶紫并干燥。将染料溶解在200μl 30%乙酸中,并在OD=550nm下测量吸光度。
将DspB(针对大肠杆菌生物膜为表面活性的)用作阴性对照,因为其不具有针对铜绿假单胞菌的活性。两种有效载荷(Pp15gp44和SePSMa)显示明显的抗生物膜活性(图7B)。值得注意的是,PSM(为在革兰阳性细菌中具有已知的抗生物膜活性的表面活性素)先前从未显示出分散铜绿假单胞菌生物膜。将这些有效载荷工程化至WHR LUZ19中,以确定具有广泛宿主范围的噬菌体是否可被进一步工程化来展现生物膜分散活性。结果表明,编码Pp15gp44或SePSMa的WHR LUZ19维持其生物膜分散活性(图7D)和感染所有对Φ-KMV病毒属易感的临床分离株的能力(图7E,7F)。
这些数据提供了本文所述的体外工程方法可如何用于系统以迭代工程化具有多种独立改良的病毒性质(诸如生物膜分散和宿主范围的非限制性性质)的细菌噬菌体。
实施例VII
表达抗生素敏化有效载荷的工程化的病毒
使用本文公开的体外工程方法,将LUZ19工程化以表达来自ssRNA病毒PRR1和MS2的溶素。将来自PRR1(SEQ ID NO:20)或MS2(SEQ ID NO:19)ssRNA噬菌体的溶素工程化至侧接主要衣壳启动子Pgp32(SEQ ID NO:21)和终止子Tgp32(SEQ ID NO:22)的LUZ19gp49基因座(SEQ ID NO:25)中,以测定其抑制噬菌体抗性的细菌出现的能力(图8A)。这些溶素通过结合并激活对细胞壁合成是非常重要的酶来抑制新的细胞壁形成,并推测细菌对其它抗微生物剂,尤其是细胞壁靶向抗生素诸如羧苄青霉素敏化。
如上所述使用本文公开的体外工程方法制备构建体。工程化的噬菌体在其适当的宿主细胞内扩增,分离所述噬菌体,并通过测序验证。在标准时间杀灭测定中测试了工程化的噬菌体在1/5x MIC的羧苄青霉素存在的情况下抑制抗噬菌体处理的细菌出现的能力(图8B,8C)。结果表明,与亚抑制浓度(1/5x MIC)的羧苄青霉素组合的表达ssRNA噬菌体的溶素的工程化的LUZ19预防了噬菌体处理后的细菌再生长。
这些数据提供了使用本文公开的体外工程方法生成具有改良的病毒性质(具体地在该情况下为预防细菌中的噬菌体抗性发展)的病毒的实例。
实施例VIII
表达物种特异性抗微生物蛋白有效载荷的工程化的病毒
使用本文公开的体外工程方法,将LUZ19工程化以表达铜绿假单胞菌来源的抗微生物蛋白PyoS5。细菌素PyoS5是由铜绿假单胞菌的一个菌株产生的阻碍竞争性铜绿假单胞菌菌株生长的物种特异性抗微生物蛋白。将铜绿假单胞菌菌株PA01 gDNA用作模板来PCR扩增pyoS5(SEQ ID NO:6),然后将其克隆到侧接主要衣壳启动子Pgp32(SEQ ID NO:21)和终止子Tgp32(SEQ ID NO:22)的LUZ19 gp49基因座(SEQ ID NO:25)(图9A)。PyoS5结合广泛分散的绿脓杆菌螯铁蛋白受体FptA,然后经历构象变化以在铜绿假单胞菌膜中产生孔。
如上所述使用本文公开的体外工程方法产生LUZ19+pyoS5。在易感宿主PA01中扩增工程化的噬菌体,将所述噬菌体分离,并通过测序验证。选择细菌菌株PA7416以用于分析,因为已知实验室菌株PA01对PyoS5具有抗性,然而,计算机分析表明,MDR铜绿假单胞菌菌株PA7416对噬菌体LUZ19易感并且编码PyoS5受体FptA。
在标准时间杀灭测定中测试了工程化的噬菌体抑制抗噬菌体处理的PA7416细菌出现的能力。结果表明,野生型LUZ19最初始抑制PA7416生长,8-12小时后细菌迅速变得具有抗性并且再生长发生(图9B)。然而,工程化的LUZ19+pyoS5在噬菌体处理后抑制PA7416细菌再生长超过24小时(图9C,9D)。
这些数据提供了使用本文公开的体外工程方法来生成具有改良的病毒性质(具体地在该情况下为防细菌中的噬菌体抗性发展)的病毒的实例。
实施例IX
用于迭代工程化细菌噬菌体以产生抗微生物产物的系统
使用本文公开的体外工程方法,可对细菌噬菌体基因组进行快速工程化而无需对宿主菌株进行广泛的遗传操作。将本领域技术人员公知的病毒突变研究和选择技术与全基因组测序、比较基因组学和所述公开的体外工程方法结合创建了用于开发新型和改良的抗微生物剂的新的和改良的系统。所述系统基于在单个病毒底盘中迭代地改良1种、2种或多于2种不同的性质以产生基于病毒的抗微生物剂。公开了改良不同的病毒性质的LUZ19基因组的连续纯化和编辑(图6、7和10),然而,该技术可被扩展至多个其它铜绿假单胞菌细菌噬菌体或感染细菌的任何其它菌株或物种的其它细菌噬菌体。此外,该技术可用于改良感染相同细菌物种的多个个别细菌噬菌体的性质,以产生预防或治疗细菌感染、污染或改变微生物群的更优的细菌噬菌体混合物。
这些数据显示可如何依序进行与基因组测序、比较基因组学和病毒突变/选择研究结合的体外工程以完成逐步改良或工程化的变化,以合并改良的目标病毒性质(图10)。
实施例X
方法
使用商购可得的体外转录试剂盒诸如MEGAshortscript T7试剂盒(ThermoFisher)合成并纯化引导RNA(gRNA)。使用本领域公知的方法设计引导RNA(图15)。
将体外转录的gRNA稀释至500ng/μL的工作原液。
无纯化的RNA引导的核酸酶诸如Cas9的组装反应。通过表达包含编码His-标记的Cas9的基因序列(SEQ ID NO:27)的质粒并将所述序列通过公知的镍-亲和纯化方法纯化来获得纯化的Cas9(SEQ ID NO:31)。任选地,首先使用在基因组的最内部切割的gRNA用于迭代消化。
全反应混合物:
Figure BDA0003053899790000891
Figure BDA0003053899790000901
*全反应混合物可在单个步骤中用于一次切割多个位点(共消化),然而,这可导致病毒gDNA的低效率切割。在冰上组装共消化反应,然后添加至Cas9,并在37℃下孵育30分钟。还可以进行改良的2步骤(或更多)反应,从而允许更完全的消化(下面概述的)。
**10x Cas9缓冲液含有-200mM HEPES pH 7.4、1.5M KCl、5mM DTT和1mM EDTApH8。
组装反应步骤1并在室温下孵育5分钟。
步骤1反应混合物:
Figure BDA0003053899790000902
Figure BDA0003053899790000911
在冰上孵育10分钟。
在37℃下孵育2分钟。
加入4μl Cas9酶(0.45mg/ml)。在37℃下孵育30分钟。
步骤2反应,加入第二gRNA和另外的Cas9酶。
步骤2反应混合物:
Figure BDA0003053899790000912
在37℃孵育步骤2反应物30分钟。可添加其它步骤用于在超过2个的位置上消化基因组。
通过在80℃下孵育10分钟使Cas9酶失活。使用苯酚-氯仿提取(在吉布森组装中增加片段组装效率)或本领域公知的其它灭活、失活或纯化方法的任选的纯化。
在琼脂糖凝胶上运行5μL样品以验证正确的切割。
对于使用吉布森组装的体外组装,根据NEB Gibson组装方案使用适当浓度的消化物和体外生成的插入DNA。
体外组装后,任选地转化到宿主细胞中以扩增工程化的基因组、基因组部分或回收工程化的病毒。
实施例XI
大肠杆菌噬菌体M13的工程化
使用本文公开的体外工程方法,将感染大肠杆菌的病毒工程化以表达荧光报道基因paprika(SEQ ID NO:5)。图11A显示用于将paprika荧光蛋白基因整合到大肠杆菌M13噬菌体基因组中的体外工程方法的示意图。该工程方法被设计来生成表达荧光报道基因的溶源性噬菌体,其可构成改良的病毒性质,因为类似的病毒已被用作诊断剂。从病毒颗粒分离M13病毒基因组(登录号X02513)。由于实验设计包括使用两种gRNA,因此首先在单独的体外Cas9消化反应中证实每种单独的gRNA的功能(图11B)。知道每种gRNA是有功能的,因此使用RNA依赖性核酸酶和体外转录的gRNA进行位点特异性消化(图11C)。使用引物对荧光报道基因paprika(SEQ ID NO:29)进行PCR扩增(图11D),所述引物添加有侧接LacZa基因序列同源的5'和3'序列,其使用RNA依赖性核酸酶消化(例如,Cas9)从M13基因组释放。将吉布森组装法用于将PCR扩增的paprika基因无缝地整合到消化的M13基因组中,替换LacZa基因(SEQID NO:28)。将工程化的基因组直接转化到宿主大肠杆菌细胞中以产生编码paprika基因的功能性病毒颗粒。通过它们在大肠杆菌中形成噬斑的能力评估工程化的噬菌体(图11E)。从噬斑分离出病毒DNA并进行PCR扩增,以确认插入的paprika基因的存在(图11F)。通过荧光成像确认重组paprika蛋白的存在和功能(图11G)。
这些数据证明了本文所述的体外工程方法将报道基因工程化至大肠杆菌噬菌体基因组中的成功用途。证明所公开的方法可扩展至另一病毒属,包括感染另一细菌属的那些病毒。
实施例XII
大肠杆菌噬菌体λ的工程化
使用本文公开的体外工程方法,编辑感染大肠杆菌的第二病毒。图12A显示从分离的λ噬菌体基因组(登录号NC_001416.1)删除cll基因(SEQ ID NO:30)的体外工程方法的示意图。该工程方法被设计来生成组成型裂解性病毒,这可构成改良的病毒性质。从病毒颗粒中分离出λ病毒基因组。由于实验设计包括使用两种gRNA,因此首先在单独的体外Cas9消化反应中确认了每种单独的gRNA的功能(图12B)。已知每种gRNA是有功能的,因此使用RNA依赖性核酸酶和两种体外转录的gRNA进行位点特异性消化(图12C)。将两个合成的单链DNA分子在体外退火以生成双链DNA修复模板(SEQ ID NO:9),所述双链DNA修复模板包含与分离的λ病毒基因组中的Cas9靶向切割位点侧翼序列同源的5'和3'序列。使用吉布森组装法将PCR扩增的修复模板无缝地整合到消化的λ基因组中。然后按照制造商的方法使用来自EpiCentre的Maxplaxλ包装提取试剂盒体外包装工程化的基因组(图12D)。体外包装后,使用制造商建议的大肠杆菌宿主细胞从双琼脂噬斑测定中回收工程化的λ基因组。基于工程化的噬菌体在大肠杆菌中形成噬斑的能力,确定它们是有功能的。从形成的噬斑分离病毒DNA,并进行PCR扩增以确认不存在cll基因(图12E)。
这些数据证明了本文所述的体外工程方法从大肠杆菌噬菌体基因组除去不想要的基因的成功用途。这些数据还提供了体外包装工程化的病毒基因组的实例,其提高病毒回收效率并且提供替代方法以直接转化到宿主细胞中。另外,这些数据提供了利用退火的体外合成的寡核苷酸作为用于工程的插入物的实例。此外,这些数据提供了利用该方法工程化噬菌体基因组以产生改良的病毒性质(即组成型裂解表型)的另一个实例。最后,这些数据表明可使用所述的体外工程方法来工程化感染大肠杆菌的第二病毒属。
实施例XIII
人CMV的差错校正
使用本文公开的体外工程方法,编辑部分人病毒。图13A显示用于差错校正的体外工程方法的示意图。~230kb HCMV病毒基因组的18kb子部分包含在大肠杆菌复制质粒中。HCMV基因组的该子部分(SEQ ID NO:10)含有病毒基因组的起始点,并含有突变体RL13等位基因(SEQ ID NO:33)含有病毒基因组的起始部分并具有突变型RL13等位基因(SEQ ID NO:33)。HCMV片段和大肠杆菌质粒一起的大小约为28kb,超过了大多数当前的差错校正技术的规格。对于差错校正,从大肠杆菌分离28kb质粒,并使用RNA依赖性核酸酶和两种体外转录的gRNA进行位点特异性消化(图13B)。Cas9介导的消化切除紧接突变位点的上游和下游的RL13基因的区域。合成RL13基因的校正区域(SEQ ID NO:32),并用与每个RNA指定的Cas9消化位点相邻的区域同源的另外的5'和3'侧翼序列进行PCR扩增(图13C)。使用吉布森组装法将合成的修复模板无缝地整合到消化的质粒中。然后将包含在质粒内的含有HCMV片段(SEQID NO:11)的经校正的RL13转化到大肠杆菌细胞中并在含抗菌素的培养基上回收。通过PCR筛选大肠杆菌菌落,以确认存在校正的RL13基因,所述RL13基因与包含差错的RL13基因相比含有另外的序列,从而允许其与含有差错的RL13基因区别(图13D)。然后使用标准技术在大肠杆菌中扩增差错校正的基因组片段,以待以后用于下游应用。
这些数据证明了本文所述的体外工程方法工程化来自人特异性病毒基因组的基因,并另外提供了用于在体外组装反应中使用合成的DNA作为修复模板的方法的成功用途。这些数据还证明了该体外工程方法用于对于标准差错校正技术来说太大的DNA或质粒的差错校正的用途。标准差错校正技术具有约5kb的大小限制,并且是基于PCR的,其固有地可产生更多不想要的差错。本文所示的体外工程方法不依赖于整个或甚至大部分质粒或病毒基因组的PCR扩增,因此适用于大小超过5kb的序列的差错校正应用。
实施例XIV
末端冗余的病毒末端的快速鉴定
本文公开的体外消化方法还可适于鉴定末端冗余病毒基因组的确切末端。图14显示了用于确定LBL3和14-1噬菌体基因组的末端的体外消化方法的示意图。从病毒颗粒纯化LBL3和14-1(登录号NC_011703.1)噬菌体基因组DNA(图14A)。使用MiSeq或PacBio平台进行下一代测序,然后将高质量DNA读数自动合并到较长的组装体中以重建原始序列(图14B)。通常,自动化组装软件将病毒或细菌噬菌体基因组错误地组装至环状重叠群中,并将末端重复基因组的DTR置于病毒序列的内部区域。基于双重覆盖测序区域的鉴定和与紧密相关的末端重复基因组匹配的BLAST搜索结果进行物理基因组末端的计算机预测(图14C)。这些预测的末端通过Cas9内切核酸酶切割来确认。在Cas9失活后,对对应于基因组物理末端的DNA片段进行纯化和测序(图14D)。这些测序结果导致基于真实物理末端序列的准确基因组组装(图14E)。
与噬菌体基因组测序相关的最大技术挑战之一是由于其重复性质而导致的对基因组物理末端的准确定位。这些区段可跨越循环排列的基因组(例如大多数分枝杆菌属(Mycobacterium)和痤疮丙酸杆菌(Propionibacterium acnes)噬菌体)中的4-14bp至终末重复基因组中的数百个碱基对(例如,铜绿假单胞菌的ΦKMV-样、PB1-样和N4-样噬菌体属)和甚至至数千个碱基对(例如大肠杆菌T5和DTR)。目前,通过深度序列分析(以鉴定双重覆盖DNA片段)、引物步行(Sanger测序)、主要DNA切口的鉴定和限制性内切核酸酶分析的组合来进行重复末端(或DTR-正向末端重复)的定位。然而,这些方法中的每一种在使用中往往受到限制或不确定:(i)难以确定的NGS数据中的双重测序覆盖边界;(ii)通过DTR多联体提供不确定结果的引物步行阅读;(iii)接近噬菌体末端的限制性位点的低发生率或由于DNA修饰诸如甲基化而导致的限制性位点的阻断。在特定位置处对噬菌体DNA使用靶向Cas9切割消除了对不可靠或繁琐的分析或程序的需要,并极大简化了噬菌体基因组物理末端的鉴定。该方法有可能准确地定位已经测序的噬菌体基因组的末端(如通过LBL3和14-1DTR的定位所例证的)以及快速鉴定新鉴定的病毒的DTR。
在本文公开的体外工程方法中使用靶向Cas9消化来定位末端重复噬菌体基因组的物理末端代表优于当前方法的显著有利方面,因为它不依赖于测序覆盖的微妙变化,并且可独立于多联体形成而进行。另外,与许多限制内切酶相比,Cas9活性对DNA修饰不太敏感。
这些数据显示了RNA引导的体外Cas9切割使得能够鉴定真实噬菌体基因组序列排列的成功应用。该信息可用于设计工程化这些噬菌体的下游体外工程方法,这是先前由于缺乏真实基因组边界而不可能实现的成就。
实施例XV
利用体内组装的工程方法
本公开提供了使用RNA引导的核酸酶位点特异性消化纯化的病毒核酸,并通过将DNA或RNA片段插入消化的病毒核酸中来组装工程化的核酸的体外方法。尽管重组核酸可使用本文公开的纯化酶在体外完全组装,但也可利用易感宿主菌株内的天然或工程化的重组途径来实现该过程。纯化的和体外消化的病毒基因组连同具有末端同源区的插入片段修复片段的转化对于一些宿主细胞在体内组装重组病毒基因组是足够的。插入修复片段可通过本领域已知的标准技术合成或扩增,或可位于在所选宿主细胞内稳定复制的质粒内。由于宿主细胞具有同源和非同源DNA修复途径,将足够量的插入物和消化的基因组共递送至宿主细胞中的挑战以及大多数宿主同源重组途径的较低效率,因此该方法可能具有比体外组装低的效率。由于在无宿主介导的重组的情况下消化的基因组单独不会形成功能性病毒颗粒和随后的噬斑,所以可通过针对给定的插入物的PCR筛选在转化和铺板后获得的噬斑,以确认所需工程化的病毒核酸的正确组装。
实施例XVI
本文公开的工程化的病毒
表1概括了通过本文公开的体外工程方法生成的工程化的病毒。表2概括了本文公开的工程化的病毒以及相应的实例和图。表3列出了本文公开的野生型病毒及其完整基因组序列的登录号。表4列出了本文公开的一些野生型核酸序列和相应的氨基酸序列。
表1.本文公开的工程化的病毒
Figure BDA0003053899790000971
Figure BDA0003053899790000981
Figure BDA0003053899790000991
Figure BDA0003053899790001001
PM-点突变,替换(Replace)-替换(replacement),缺失(Delete)-缺失(deletion),插入(Insert)-插入(insertion)
表2.本文中公开的工程化的病毒
Figure BDA0003053899790001002
Figure BDA0003053899790001011
POC-概念验证
表3.本文中公开的野生型病毒
野生型病毒名称 基因组序列
铜绿假单胞菌噬菌体LUZ19 登录号NC 010326.1
大肠杆菌噬菌体λcll857SAM7 登录号NC 001416.1
大肠杆菌噬菌体M13 登录号X02513
铜绿假单胞菌噬菌体14-1 登录号NC_011703.1
表4.本文中公开的野生型序列
Figure BDA0003053899790001012
Figure BDA0003053899790001021
从先前的描述中,本领域技术人员可以容易地确定本公开的基本特征,并且在不脱离本发明的精神和范围的情况下,可对本公开进行改变和修改以使其适应各种使用和条件以及最大程度地利用本公开。前述具体实施方案将被解释为仅仅是说明性的,而不是以任何方式限制本公开的范围。上文和附图中引用的所有申请、专利和出版物(包括参考手册)的全部公开内容通过引用整体并入本文。
序列表
SEQ ID NO:1
DNA
属/种-Phikmv样病毒LUZ19
描述性标题-野生型LUZ19 gpl3
Figure BDA0003053899790001022
SEQ ID NO:2
DNA
属/种-Phikmv样病毒LUZ19
描述性标题-野生型LUZ19 gp38
Figure BDA0003053899790001031
SEQ ID NO:3
DNA
属/种-Phikmv样病毒LUZ19
描述性标题-野生型LUZ19 gp40
Figure BDA0003053899790001032
SEQ ID NO:4
DNA
属/种-Phikmv样病毒LUZ19
描述性标题-野生型LUZ19 gp34
Figure BDA0003053899790001041
SEQ ID NO:5
蛋白质
属/种-Phikmv样病毒LUZ19
描述性标题-野生型LUZ19 Gp34蛋白
Figure BDA0003053899790001042
SEQ ID NO:6
DNA
属/种-铜绿假单胞菌
描述性标题-PyoS5序列
Figure BDA0003053899790001051
SEQ ID NO:7
DNA
属/种-Phikmv样病毒LKD16
描述性标题-添加的LKD16 gpl8序列
Figure BDA0003053899790001052
SEQ ID NO:8
DNA
属/种-Phikmv样病毒phi-KF77
描述性标题-添加的ΦKF77 gp7序列
Figure BDA0003053899790001061
SEQ ID NO:9
DNA
属/种-λ样λ
描述性标题-大肠杆菌噬菌体λcII
Figure BDA0003053899790001062
SEQ ID NO:10
DNA
属/种-巨细胞病毒HCMV
描述性标题-编辑前HCMV片段
Figure BDA0003053899790001063
Figure BDA0003053899790001071
Figure BDA0003053899790001081
Figure BDA0003053899790001091
Figure BDA0003053899790001101
SEQ ID NO:11
DNA
属/种-巨细胞病毒HCMV
描述性标题-编辑后HCMV
Figure BDA0003053899790001111
Figure BDA0003053899790001121
Figure BDA0003053899790001131
Figure BDA0003053899790001141
SEQ ID NO:12
DNA
属/种-Phikmv样病毒LKA1
描述性标题-LKA1 gp49序列
Figure BDA0003053899790001151
SEQ ID NO:13
DNA
属/种-Phikmv样病毒NTUH-K2044-K1-1
描述性标题-NTUH-K2044-K1-1 gp34
Figure BDA0003053899790001161
SEQ ID NO:14
DNA
属/种-T7-样Pp15
描述性标题-添加的Pp15 gp44序列
Figure BDA0003053899790001171
SEQ ID NO:15
DNA
属/种-伴放线菌聚集菌
描述性标题-添加的dspB序列
Figure BDA0003053899790001172
SEQ ID NO:16
DNA
属/种-金黄色葡萄球菌
描述性标题-添加的SaPSMa3序列
Figure BDA0003053899790001181
SEQ ID NO:17
DNA
属/种-金黄色葡萄球菌
描述性标题-添加的SaPAMb2序列
Figure BDA0003053899790001182
SEQ ID NO:18
DNA
属/种-表皮葡萄球菌
描述性标题-添加的SePSMa序列
Figure BDA0003053899790001183
SEQ ID NO:19
DNA
属/种-轻小病毒MS2
描述性标题-添加的MS2 L序列
Figure BDA0003053899790001184
SEQ ID NO:20
DNA
属/种-轻小病毒PRR1
描述性标题-添加的PRR1 L序列
Figure BDA0003053899790001191
SEQ ID NO:21
DNA
属/种-Phikmv样病毒LUZ19
描述性标题-LUZ19 gp32启动子(P32)
Figure BDA0003053899790001192
SEQ ID NO:22
DNA
属/种-Phikmv样病毒LUZ19
描述性标题-LUZ19 gp32终止子(T32)
Figure BDA0003053899790001193
SEQ ID NO:23
DNA
属/种-Phikmv样病毒LUZ19
描述性标题-野生型LUZ19 gp7区
Figure BDA0003053899790001201
SEQ ID NO:24
DNA
属/种-Phikmv样病毒LUZ19
描述性标题-野生型LUZ19 gp18区
Figure BDA0003053899790001202
SEQ ID NO:25
DNA
属/种-Phikmv样病毒LUZ19
描述性标题-野生型LUZ19 gp49和gp48-gp49基因间区域
Figure BDA0003053899790001203
SEQ ID NO:26
DNA
属/种-Phikmv样病毒LKD16
描述性标题-野生型LKD16 gp18基因
Figure BDA0003053899790001204
SEQ ID NO:27
DNA
合成(人工的/未知的)
描述性标题-编码NLS-FLAG-CAS9-His的基因
Figure BDA0003053899790001211
Figure BDA0003053899790001221
SEQ ID NO:28
DNA
属/种-丝状病毒(Inovirus)M13MP18
描述性标题-被替代的野生型M13MP18区
Figure BDA0003053899790001222
SEQ ID NO:29
DNA
未知的/人工的-可从DNA2.0商购获得的
描述性标题-Paprika序列
Figure BDA0003053899790001231
SEQ ID NO:30
DNA
属/种-λ样λ
描述性标题-野生型大肠杆菌噬菌体λcII序列
Figure BDA0003053899790001232
SEQ ID NO:31
蛋白质
合成(人工的/未知的)
描述性标题-从SEQ ID NO:27翻译的NLS-FLAG-CAS9-His蛋白质
Figure BDA0003053899790001241
SEQ ID NO:32
DNA
属/种-巨细胞病毒HCMV
描述性标题-编辑后HCMV RL13片段
Figure BDA0003053899790001242
SEQ ID NO:33
DNA
属/种-巨细胞病毒HCMV
描述性标题-编辑前HCMV RL13片段
Figure BDA0003053899790001251
SEQ ID NO:34
蛋白质
属/种-Phikmv样病毒LUZ19
描述性标题-野生型LUZ19 Gp13蛋白质序列
Figure BDA0003053899790001252
SEQ ID NO:35
蛋白质
属/种-Phikmv样病毒LUZ19
描述性标题-野生型LUZ19 Gp38蛋白质序列
Figure BDA0003053899790001253
SEQ ID NO:36
蛋白质
属/种-Phikmv样病毒LUZ19
描述性标题-野生型LUZ19 Gp40蛋白质序列
Figure BDA0003053899790001261
SEQ ID NO:37
蛋白质
属/种-铜绿假单胞菌
描述性标题-PyoS5蛋白质序列
Figure BDA0003053899790001262
SEQ ID NO:38
蛋白质
属/种-Phikmv样病毒LKD16
描述性标题-LKD16 Gp18蛋白质序列
Figure BDA0003053899790001263
SEQ ID NO:39
蛋白质
属/种-Phikmv样病毒LKA1
描述性标题-LKA1 Gp49蛋白质序列
Figure BDA0003053899790001271
SEQ ID NO:40
蛋白质
属/种-Phikmv样病毒NTUH-K2044-K1-1
描述性标题-NTUH-K2044-K1-1 Gp34蛋白质序列
Figure BDA0003053899790001272
SEQ ID NO:41
蛋白质
属/种-T7-样Pp15
描述性标题-Pp15 Gp44蛋白质序列
Figure BDA0003053899790001273
SEQ ID NO:42
蛋白质
属/种-伴放线菌聚集菌
描述性标题-DspB蛋白质序列
Figure BDA0003053899790001281
SEQ ID NO:43
蛋白质
属/种-金黄色葡萄球菌
描述性标题-SaPSMa3蛋白质序列
Figure BDA0003053899790001282
SEQ ID NO:44
蛋白质
属/种-金黄色葡萄球菌
描述性标题-SaPAMb2蛋白质序列
Figure BDA0003053899790001283
SEQ ID NO:45
蛋白质
属/种-表皮葡萄球菌
描述性标题-SePSMa蛋白质序列
Figure BDA0003053899790001291
SEQ ID NO:46
蛋白质
属/种-轻小病毒MS2
描述性标题-MS2 L蛋白质序列
Figure BDA0003053899790001292
SEQ ID NO:47
蛋白质
属/种-轻小病毒PRR1
描述性标题-PRR1 L蛋白质序列
Figure BDA0003053899790001293
SEQ ID NO:48
蛋白质
属/种-Phikmv样病毒LUZ19
描述性标题-LUZ19 Gp18蛋白质序列
Figure BDA0003053899790001294
SEQ ID NO:49
蛋白质
属/种-Phikmv样病毒LUZ19
描述性标题-LUZ19 Gp49蛋白质序列
Figure BDA0003053899790001301
SEQ ID NO:50
DNA
属/种-Phikmv样病毒LUZ19
描述性标题-LUZ19 gp18基因序列
Figure BDA0003053899790001302
SEQ ID NO:51
DNA
属/种-Phikmv样病毒LUZ19
描述性标题-LUZ19 Gp49蛋白质序列
Figure BDA0003053899790001303
序列表
<110> C3J治疗公司
<120> 用于体外病毒基因组工程的组合物和方法
<130> SGI1840-3WO
<150> US 62/092,707
<151> 2014-12-16
<150> US 62/102,362
<151> 2015-01-15
<150> US 62/242,811
<151> 2015-10-16
<160> 51
<170> PatentIn 3.5版
<210> 1
<211> 288
<212> DNA
<213> Phikmv样病毒LUZ19
<220>
<221> misc_feature
<223> 野生型LUZ19 gp13
<400> 1
gtgctggccc tcggtgcctt cgacctgtcc ggcctgatgg taggttcctg cctcgtagta 60
ggtggtgagc tgaaggccct gtgcgttgat gaccggcaca gcaggcaggg tatcggcgct 120
gagctggtac gggccgctga gctggctggt gccgagtatc tgacctgctt cgagttcctg 180
gagccgttct acgccgactt gggctggagc accacccacc gcgaggcgaa ctggacagca 240
ggagagccgg acgtgctgca catgagggca cccggtcatg acgtatga 288
<210> 2
<211> 756
<212> DNA
<213> Phikmv样病毒LUZ19
<220>
<221> misc_feature
<223> 野生型LUZ19 gp38
<400> 2
gtggctcggt tcaagaatcc cgagaccatc cacgttgcag atggggtcga ggctgtcttc 60
agtctcgact tcccgttcct gcggcgtgag gacgtattcg tccaggtcga taagatactc 120
gtcaccgact atacgtgggt agacgacacc aacatccaat tggccgtggt gccgaagaag 180
gaccaagagg tccgcatctt ccgcgacacg cccgcccagg tcccggacac acagttcagc 240
caggacatcc cgttcctgcc tcgatacatc gacgcgaaca acaagcagct cctgtacgct 300
gtgcaggaag gcatcaacac cgcgaacctc gctctcgatg gcgtactcga cgcgatccgt 360
atcgccgagg aggctcgtcg cctggcgcag gaagcactcg acgccgccaa tgaggcgctt 420
cgccgtgccc tgggcttcgc tgagattcgc accgtgaccg aggactcgga catcgatccg 480
agctggcgcg gttactggaa ccgttgcatc accgccgata aacctctgac cctgaccatg 540
cagatggaag acccggatgc accgtgggtc gagttcagcg aggttcactt cgagcaggcc 600
ggtgtgcgtg acctaaacat cgtagccggt cctggcgtta ccatcaaccg tttgcagaac 660
accaccatgc agctctacgg cgagaatggc gtgtgtactc tcaagcggct gggcgctaac 720
cactggatcg tgttcggggc catggaggac gaataa 756
<210> 3
<211> 906
<212> DNA
<213> Phikmv样病毒LUZ19
<220>
<221> misc_feature
<223> 野生型LUZ19 gp40
<400> 3
atgtttaaga ccgaagtaaa gggacgttac accctgattc gccgcaaggc ggacggcact 60
ccggtggaga ctctggagtt cgacaacatc attacgaatg cgggcctgga ttggatcgcc 120
gctatggata ccgacctcat gggcgaaccc gtagcggtca gcacttctac agccgatccc 180
aacccgagcg cacccgccat cccggaggtt gtgcaacgca cgtccgcatc tgcccctggt 240
ggaggtacta cgtcgggcct ggatggcgag tggctgttct ggcggaggcg ttggagattc 300
ccgcagggca ccctagctgg tcaagtcctg gccaccgtgg gcctcatctg caactcggat 360
cgtcgcttcg agagtaacac gggtgagctg atcccgaagg ataccccgct gtcgtacact 420
cgcatcaagg acgccgccgg gcagcctact actctggtgg tggccgctga cgagattctg 480
gatgtccagt acgagttccg cagccggccc gtaggaacgg ctgaggccaa gttcgtgatc 540
tccggcgtgg aacgcacctt ccggctgatc ccaaagcctt ttgcgaaccg tgctaatctc 600
tccggggaac gctacatctt ctacaacacc aacccctaca tcaacggcaa ggacgcctcc 660
ggcggcaatg tccgagacgg tcagtggcag aagaaatatc ccaagtacgt gcgcggctcc 720
tacaaggcgc agatcacgct gctggcccag gtccagaacg gcaatatggc tggcggcatc 780
accggcaccg aggaactcca gatttacaat ggacgtaact atgtgctcga tatcaacccg 840
cctgttgtga agaacaatac ccaggagttc accgtgaccc tggagtttac ggtggcgagg 900
gcataa 906
<210> 4
<211> 2481
<212> DNA
<213> Phikmv样病毒LUZ19
<220>
<221> misc_feature
<223> 野生型LUZ19 gp34
<400> 4
atgagctaca agcaatccgc gtatcccaat ctgctgatgg gtgtgagcca gcaggtgccc 60
ttcgagcgcc tgccgggcca gctcagcgag cagatcaaca tggtatccga tcccgtgtca 120
ggacttcggc ggcgcagcgg tatcgagctg atggcccacc tgctgcatac cgaccagccc 180
tggccgaggc cgttcctcta ccacacgaac ctcggtggcc gcagcattgc gatgctggtg 240
gcgcagcacc gtggcgagct gtacctgttc gacgagcggg acggtcgcct gctgatgggt 300
cagcccctgg tgcatgacta cctcaaggcc aacgattaca ggcagctacg ggccgccacg 360
gtggccgatg acctgttcat cgccaacctg agtgtaaagc ccgaggccga ccgcaccgac 420
atcaagggcg tagaccccaa caaggccggc tggctgtaca tcaaggcagg ccagtattcg 480
aaggcattct ccatgaccat caaggtcaag gacaacgcca ccggcaccac ctacagccac 540
acggccacct acgtgacgcc ggacaacgcc agcacgaacc ccaacctcgc tgaggcgcca 600
ttccaaacga gcgtaggcta catcgcgtgg cagctctacg gcaagttctt cggtgcgccg 660
gagtacactc tgcccaactc gacgaagaag tacccgaagg tagacccgga cgccaacgcg 720
gcaaccatag ccggttacct caaccaacgg ggcgtgcagg acgggtacat cgcgttccgt 780
ggcgacgccg atatccacgt tgaagtgtcc acggacatgg gcaacaacta cggcatagcc 840
tccggcggta tgagcctcaa cgccacggca gacctgccgg ccttactgcc gggcgcgggt 900
gctcctggcg tgggtgtgca gttcatggac ggcgctgtca tggccaccgg ctccaccaag 960
gccccggtat acttcgagtg ggattccgct aaccgccgct gggcagagcg ggccgcctac 1020
ggcaccgatt gggtcctgaa gaagatgcca ctggccctgc gctgggatga ggctaccgac 1080
acctacagct tgaacgagct ggagtatgat cgacgtggct ccggcgacga ggatacgaac 1140
cccacgttca acttcgtcac ccgaggcatc accggcatga cgaccttcca gggtcgcctc 1200
gtcctcctgt cgcaggagta cgtctgcatg tcggccagta acaatccaca ccgctggttc 1260
aagaagtcgg cagccgcgct gaacgacgat gatcctatcg agatcgcagc ccaggggagc 1320
ctgactgaac cgtacgagca cgcggtcacc ttcaacaagg acttgatcgt cttcgccaag 1380
aagtatcagg ccgtggtccc cggtggcggc attgtaactc cccggacggc ggttatcagc 1440
atcaccacgc agtacgacct cgataccagg gcggcacctg ccgtgactgg ccgcagtgtg 1500
tacttcgctg cggagcgtgc cctgggtttc atgggcctgc atgagatggc cccgtctccg 1560
tccacggaca gccactacgt cgccgaagac gttaccagcc acatcccgag ctacatgccg 1620
gggcctgctg agtacatcca ggcggcggcc tccagcggct acctggtgtt cggcaccagc 1680
acggcggacg agatgatctg ccaccagtac ctctggcagg gcaacgagaa agtgcagaac 1740
gcgtttcatc gctggacgtt gcggcatcag atcatcggcg cctacttcac tggtgacaac 1800
ctgatggttc tgattcagaa gggccaggag atcgccctgg gacggatgca cctgaacagc 1860
ctgccagccc gtgagggtct gcaataccct aaatacgact actggcggcg tatcgaggcg 1920
accgtcgatg gtgagctgga actgaccaag cagcattggg acctgatcaa ggatgcctct 1980
gccgtgtacc agctacagcc tgtggccggc gcctacatgg agcgtaccca tctcggcgtg 2040
aagcgcgaga cgaatacgaa ggtgttcctc gacgtgcccg aggccgtggt cggggcggtg 2100
tatgtggtcg gctgcgagtt ctggtcgaag gtggagttca ctccgccggt tctccgggac 2160
cacaatggcc tgcccatgac ctcgacccgt gcagtgcttc atcggtacaa cgtaaacttc 2220
ggctggaccg gcgagttcct gtggcgcatc agcgacacgg ctcgacccaa ccagccgtgg 2280
tacgacacga cgcccctccg gttgttcagc cggcaactca atgccgggga gcctctggtg 2340
gatagcgctg tggtgccgct gccggcacgg gtcgatatgg ccacgtccaa gttcgagctg 2400
agctgtcaca gtccgtacga catgaacgtt cgggctgtcg agtacaactt caagtccaac 2460
caaacctaca ggagggtgtg a 2481
<210> 5
<211> 826
<212> PRT
<213> Phikmv样病毒LUZ19
<220>
<221> misc_feature
<223> 野生型LUZ19 Gp34蛋白
<400> 5
Met Ser Tyr Lys Gln Ser Ala Tyr Pro Asn Leu Leu Met Gly Val Ser
1 5 10 15
Gln Gln Val Pro Phe Glu Arg Leu Pro Gly Gln Leu Ser Glu Gln Ile
20 25 30
Asn Met Val Ser Asp Pro Val Ser Gly Leu Arg Arg Arg Ser Gly Ile
35 40 45
Glu Leu Met Ala His Leu Leu His Thr Asp Gln Pro Trp Pro Arg Pro
50 55 60
Phe Leu Tyr His Thr Asn Leu Gly Gly Arg Ser Ile Ala Met Leu Val
65 70 75 80
Ala Gln His Arg Gly Glu Leu Tyr Leu Phe Asp Glu Arg Asp Gly Arg
85 90 95
Leu Leu Met Gly Gln Pro Leu Val His Asp Tyr Leu Lys Ala Asn Asp
100 105 110
Tyr Arg Gln Leu Arg Ala Ala Thr Val Ala Asp Asp Leu Phe Ile Ala
115 120 125
Asn Leu Ser Val Lys Pro Glu Ala Asp Arg Thr Asp Ile Lys Gly Val
130 135 140
Asp Pro Asn Lys Ala Gly Trp Leu Tyr Ile Lys Ala Gly Gln Tyr Ser
145 150 155 160
Lys Ala Phe Ser Met Thr Ile Lys Val Lys Asp Asn Ala Thr Gly Thr
165 170 175
Thr Tyr Ser His Thr Ala Thr Tyr Val Thr Pro Asp Asn Ala Ser Thr
180 185 190
Asn Pro Asn Leu Ala Glu Ala Pro Phe Gln Thr Ser Val Gly Tyr Ile
195 200 205
Ala Trp Gln Leu Tyr Gly Lys Phe Phe Gly Ala Pro Glu Tyr Thr Leu
210 215 220
Pro Asn Ser Thr Lys Lys Tyr Pro Lys Val Asp Pro Asp Ala Asn Ala
225 230 235 240
Ala Thr Ile Ala Gly Tyr Leu Asn Gln Arg Gly Val Gln Asp Gly Tyr
245 250 255
Ile Ala Phe Arg Gly Asp Ala Asp Ile His Val Glu Val Ser Thr Asp
260 265 270
Met Gly Asn Asn Tyr Gly Ile Ala Ser Gly Gly Met Ser Leu Asn Ala
275 280 285
Thr Ala Asp Leu Pro Ala Leu Leu Pro Gly Ala Gly Ala Pro Gly Val
290 295 300
Gly Val Gln Phe Met Asp Gly Ala Val Met Ala Thr Gly Ser Thr Lys
305 310 315 320
Ala Pro Val Tyr Phe Glu Trp Asp Ser Ala Asn Arg Arg Trp Ala Glu
325 330 335
Arg Ala Ala Tyr Gly Thr Asp Trp Val Leu Lys Lys Met Pro Leu Ala
340 345 350
Leu Arg Trp Asp Glu Ala Thr Asp Thr Tyr Ser Leu Asn Glu Leu Glu
355 360 365
Tyr Asp Arg Arg Gly Ser Gly Asp Glu Asp Thr Asn Pro Thr Phe Asn
370 375 380
Phe Val Thr Arg Gly Ile Thr Gly Met Thr Thr Phe Gln Gly Arg Leu
385 390 395 400
Val Leu Leu Ser Gln Glu Tyr Val Cys Met Ser Ala Ser Asn Asn Pro
405 410 415
His Arg Trp Phe Lys Lys Ser Ala Ala Ala Leu Asn Asp Asp Asp Pro
420 425 430
Ile Glu Ile Ala Ala Gln Gly Ser Leu Thr Glu Pro Tyr Glu His Ala
435 440 445
Val Thr Phe Asn Lys Asp Leu Ile Val Phe Ala Lys Lys Tyr Gln Ala
450 455 460
Val Val Pro Gly Gly Gly Ile Val Thr Pro Arg Thr Ala Val Ile Ser
465 470 475 480
Ile Thr Thr Gln Tyr Asp Leu Asp Thr Arg Ala Ala Pro Ala Val Thr
485 490 495
Gly Arg Ser Val Tyr Phe Ala Ala Glu Arg Ala Leu Gly Phe Met Gly
500 505 510
Leu His Glu Met Ala Pro Ser Pro Ser Thr Asp Ser His Tyr Val Ala
515 520 525
Glu Asp Val Thr Ser His Ile Pro Ser Tyr Met Pro Gly Pro Ala Glu
530 535 540
Tyr Ile Gln Ala Ala Ala Ser Ser Gly Tyr Leu Val Phe Gly Thr Ser
545 550 555 560
Thr Ala Asp Glu Met Ile Cys His Gln Tyr Leu Trp Gln Gly Asn Glu
565 570 575
Lys Val Gln Asn Ala Phe His Arg Trp Thr Leu Arg His Gln Ile Ile
580 585 590
Gly Ala Tyr Phe Thr Gly Asp Asn Leu Met Val Leu Ile Gln Lys Gly
595 600 605
Gln Glu Ile Ala Leu Gly Arg Met His Leu Asn Ser Leu Pro Ala Arg
610 615 620
Glu Gly Leu Gln Tyr Pro Lys Tyr Asp Tyr Trp Arg Arg Ile Glu Ala
625 630 635 640
Thr Val Asp Gly Glu Leu Glu Leu Thr Lys Gln His Trp Asp Leu Ile
645 650 655
Lys Asp Ala Ser Ala Val Tyr Gln Leu Gln Pro Val Ala Gly Ala Tyr
660 665 670
Met Glu Arg Thr His Leu Gly Val Lys Arg Glu Thr Asn Thr Lys Val
675 680 685
Phe Leu Asp Val Pro Glu Ala Val Val Gly Ala Val Tyr Val Val Gly
690 695 700
Cys Glu Phe Trp Ser Lys Val Glu Phe Thr Pro Pro Val Leu Arg Asp
705 710 715 720
His Asn Gly Leu Pro Met Thr Ser Thr Arg Ala Val Leu His Arg Tyr
725 730 735
Asn Val Asn Phe Gly Trp Thr Gly Glu Phe Leu Trp Arg Ile Ser Asp
740 745 750
Thr Ala Arg Pro Asn Gln Pro Trp Tyr Asp Thr Thr Pro Leu Arg Leu
755 760 765
Phe Ser Arg Gln Leu Asn Ala Gly Glu Pro Leu Val Asp Ser Ala Val
770 775 780
Val Pro Leu Pro Ala Arg Val Asp Met Ala Thr Ser Lys Phe Glu Leu
785 790 795 800
Ser Cys His Ser Pro Tyr Asp Met Asn Val Arg Ala Val Glu Tyr Asn
805 810 815
Phe Lys Ser Asn Gln Thr Tyr Arg Arg Val
820 825
<210> 6
<211> 1497
<212> DNA
<213> 铜绿假单胞菌
<400> 6
atgtccaatg acaacgaagt acctggttcc atggttattg tcgcacaagg tccagacgat 60
caatacgcat acgaggttcc ccctatcgat agcgcggccg ttgccgggaa tatgtttggc 120
gacttaattc aaagagaaat atatctacag aaaaacattt attatccagt ccgatctatt 180
tttgaacaag gaacaaaaga aaagaaggag atcaacaaga aagtatctga tcaagtcgat 240
ggcttgctaa agcagatcac tcaaggaaaa agggaggcca caaggcaaga gcgagtcgat 300
gtcatgtcgg cagtcctgca caagatggaa tctgatcttg aaggatacaa aaagaccttt 360
accaaaggcc cattcattga ctacgaaaag cagtcaagcc tctccatcta tgaggcctgg 420
gtcaagatct gggagaagaa ctcttgggaa gaaagaaaga agtacccttt tcagcagctt 480
gttagagatg aactggagcg ggcggttgcc tactacaaac aagattcact ctctgaagcg 540
gtaaaagtgc taagacagga gctcaacaag caaaaagcgc taaaggaaaa agaggacctc 600
tctcaactgg agcgggacta cagaacccga aaggcgaatc tcgagatgaa agtacaatcc 660
gagcttgatc aagcgggaag tgctttgcct ccattggtca gtccaacgcc agagcaatgg 720
cttgaacgtg ccacaagact ggttacgcaa gcaattgctg ataaaaagca gctgcagacc 780
acaaacaata ctcttatcaa gaattcccca acccctctag aaaagcagaa agccatctac 840
aatggtgagc tacttgtgga tgagatagcc agtctacagg cccgcttagt taagctgaac 900
gccgaaacga cacgacgcag gacagaagca gaacgcaagg cggccgagga acaagcgttg 960
caagatgcta ttaaatttac tgccgacttt tataaggaag taactgagaa atttggcgca 1020
cgaacatcgg agatggcgcg ccaactggcc gaaggcgcca gggggaaaaa tatcaggagt 1080
tcggcggaag caatcaagtc gtttgaaaag cacaaggatg cgttaaataa aaaacttagc 1140
cttaaagata ggcaagccat tgccaaagcc tttgattctc tagacaagca gatgatggcg 1200
aagagccttg agaaatttag caaaggcttt ggagttgtag gcaaagctat tgacgccgcc 1260
agcctgtacc aagagttcaa gatatctacg gaaaccgggg actggaaacc attctttgta 1320
aaaattgaaa cactagctgc tggtgcggcc gccagttggc ttgtgggtat tgcatttgcc 1380
acggcaacag ccactcctat aggcattctg gggttcgcac tggtaatggc agttaccggg 1440
gcgatgattg acgaagacct tctagaaaaa gcaaacaatc ttgtaatatc catttaa 1497
<210> 7
<211> 345
<212> DNA
<213> Phikmv样病毒LKD16
<400> 7
gagtaccaac tgaacacgag cgcaccctgc gctgcctgct ccaagacatc cacgggccgc 60
tgaatctgct gttcccaggt atccgggtga aggtggagga ggcgtgcctc ggatacttgg 120
gctacaggga gcggggctat tgggagctgc gcctccaggt ggactacgac cacccgaagc 180
ttgggcacct ccgctacagt caggccgtgc cggagtacgt gctgatcaac gaccgcgaca 240
gcatcatcaa gtacctgatg gaagcagtcc ctcggcaggt actagagggc atgctcaata 300
aggcccagga attcgtaacc aagaactggt attccctatg acgac 345
<210> 8
<211> 204
<212> DNA
<213> Phikmv样病毒phi-KF77
<220>
<221> misc_feature
<223> 添加的Phi KF77 gp7序列
<400> 8
tacaaggtgg tgacgcctag ctcggcagag ggcgccgttg tgctggcgac caagcagacg 60
cctgccctcg ctcaggcagt catcgtactg cacagcatga accccgcgca gtacgcggtg 120
ggcacggcca tactaaacac agactggcgg tgccgccgcc tgggtgccgg cgagtacatc 180
aagctcgttc aaggggaggc cgac 204
<210> 9
<211> 60
<212> DNA
<213> λ样λ
<220>
<221> misc_feature
<223> 大肠杆菌噬菌体
<400> 9
atggttcgtg caaacaaacg caacgaggct cgttctgaac aaatccagat ggagttctga 60
<210> 10
<211> 17757
<212> DNA
<213> 巨细胞病毒HCMV
<220>
<221> misc_feature
<223> 编辑前HCMV片段
<400> 10
acgacggcca gtgaattgta atacgactca ctatagggcg aattcgagct cggtacccga 60
ttaccctgtt atccctacca ttccgggccg tgtgctgggt ccccgagggg cgggggggtg 120
tttttagcgg gggggtgaaa tttggagtct tggagccgcg tgtgctgtgg aggacggtga 180
cggtggtaag agtgtgctgc ggtgcggttg ggacggcggc ggcgaataaa agcggcgtgc 240
ggcgcgcacg gcgaaaagca gacgcgcgtc tgtgttgtgt gtctttgacc gcggcggaac 300
acacgcggaa aagcgagtcc caggggacac acgacgagcg agtcccaggg ggggacgacg 360
acggccaggg acgcggaaac gacgcggaaa agaggaagtc cccaggggga cgggcggaaa 420
agaggaagcg cctaggggac cgcgggggca ggaacagacg aagtacgccg caacccgcgt 480
cgaggacaca cgcagaagcg gccgcccagg ggaggggggg ggggggactc gcgggccccg 540
gggcacactt gttgttccct ccggccgccg acacgcaccc cgaagccgcg cacaccgccg 600
acacacccct gacacacccg cgacacaccc gccacacgcc cgacacacgc ccgcgacaca 660
cccgaccgac acaccctgac acaccccgcc aacacaccca gccgcacccg ccccgccaac 720
acacccccga cacacccgac acacgcccgc gacacacccg gcacacaccc acccacccag 780
ccgcgccccc gacacacccc gaacggcgcc ggtgcgggac agggctcacg gaggtttgcg 840
ggccgtgagc acgcctccct ttgtacacac taccggtgcg tggcgtccca cgctatttgt 900
tcgcgagacc ggactaaggg aggtttgcgg tgcgtcagcg cggggcggcg tttgcggcgt 960
gtttcgacca gcgctttgtg cgcgctgcct gtgcgtgtcg tcccatggtc tttgtcagcg 1020
gcacggcgct ggggacgggg tttcaccgcg ctgagggatc tttctgcggg tgtgagggac 1080
ggagcttttt tcgcacgctg ggcaccgggc tgggggacgg ggggtgtgcg ggacggcggt 1140
ggggccgggg cgttgcgggt acggggatta cgctgggaac ggggactcgc ggacccgggc 1200
tgagggacgg gggtggcggg ggtgtttgcg gcgaggacgg gggccttttg cggcggggac 1260
ggggactcac cctcgcctat ttaacctcca cccacttcaa cacacacatg ccgcacaatc 1320
atgccagcca cagacacaaa cagcacccac accacgccgc ttcacccaga gtaccaacac 1380
acgttaccct tacaccacag caacacacaa ccgcctatcc aaacctcgga caaacacgcc 1440
aacgaagaac accgcacgca gatggagctc gacgccgcgg attacgctgc ttgcgcgcag 1500
gcccgccaac acctctacgc tcaaacacaa ccccaactac acgcataccc caacgccaac 1560
cctcaggaaa gcgctcattt ttccacagaa aatcaacatc aactcacgca tctacttcac 1620
aacattggcg aaggcgcagc gctcggctac cccgtccccc gcgcggaaat ccgccgcggc 1680
ggtggcgact gggccgacag cgcgagcgac ttcgacgccg actgctggtg catgtgggga 1740
cgcttcggaa ccatgggccg ccaacctatc gtgaccttac tgttggcgcg ccaacgcgac 1800
ggcctcgctg actggaacgt cgtacgctgc cgcggcacag gctttcgcgc acacgattcc 1860
gaggacggcg tctctgtctg gcgtcagcac ttggtttttt tactcggagg ccacggccgc 1920
cgtgtacagt tagaacgtcc atccgcggga gaagcccaag ctcgaggcct attgccacgc 1980
atccggatca cccccatctc cacatctcca cgcccaaaac caccccagcc caccatatcc 2040
accgcatcgc acccacatgc tacgactcgc ccacatcaca cgctctttcc tatcccttct 2100
acaccctcag ccacggttca caatccccga aactacgccg tccaacttca cgccgaaacg 2160
acccgcacat ggcgctgggc acgacgcggt gaacgtggcg cgtggatgcc ggccgagaca 2220
tttacatgtc ccaaggataa acgtccctgg tagacggggt agggggatct accagcccag 2280
ggatcgcgta tttcgccgcc acgctgcttc accgatatcc aataaaccca tcccctcgcc 2340
acgacgtctc cgcgtatctt tgtagcctca ggaatccgtc cccacgtcca tccatcccga 2400
gcactccaca cgctataaca gaccacggac acggcaaatg catgcaaact tctcatttat 2460
tgtgtctact actctgtgtt gctacaggga gtgaaggggg tgaaggcaaa gaaaaaaaaa 2520
aggaacaaaa taatagatta gcagaaggaa taatccgtgc gaccgagctt gtgcttcttt 2580
tcttataagg aggcaaatat actagggaaa acttaagaat aggaagaaac cgaggtttgg 2640
gagaaaagct gagataaaat agcgcatttt ccatacagag gttgttgttt ttgtggatcc 2700
taagaggttt caagtgcgaa tctcaaagtt ctcacgagaa tattgtcttc aagaatcgac 2760
aactgtggtc caagattttt ttttggtctt tttaggttct gcgagggaca tcacgatgga 2820
tcgttgcgat gaagtcacgc gtacgcctct ggtgtggcgc ggtgtcgtga caggagagtg 2880
tgttttcagt gcagagctgt cttgattcct atatccgagt atctgttttc tcgtaaggac 2940
ggtaatcttc tttggtgtaa gtacatctaa aagctgcaaa ctatatttta agggctgtct 3000
ctaggtgtac tttgatgctg gagtttttcg ctgtgttgat gtgaataaat ctactactac 3060
tattatatgc agaaagagtg attatgccga gacaagattg cattggctga actgtttcaa 3120
aaacgcctac actctactta tccgtaaacc taaggtaata ctatgtgtaa gttgtttttt 3180
tttctttttg tagtaaaatg gtgatacgtg caattaaaac tgtattccat gtttccatcc 3240
tttcatttca actttaaagg cggctttgag agcgaagaag tgcgaggata aaaatggatg 3300
actccttcgt gtccagggag tcgactactg caacgctgat tgattaaaag atggtctccg 3360
atgatgatgt tgttattgat cgaatcatgg tgcagaacgg cgacggagag gagcgtgtcc 3420
gccgccggga aggtggtctc tttctctttt cttttttcaa gaaatcttcc atgtgtttat 3480
cgtagtgatc gaaatcgact gatctcgggt tctttttgtt ggtttctttt cggttaatca 3540
tgtattgttt tcttttttta cagaaagata cttttttcat gagcaattcc tcgcccggcg 3600
ccggcatgcc gaggtggggc cactgcgatc agcggcatgc cgacgccgac ccggggatct 3660
tggattcacc gttttctctc ttctctctct acatacagac cgggtggcag gagcggtaag 3720
gaatcatcgt cgtctttcat tcttcgatga ttatggtaat actaaatctt atctaggagc 3780
atatacatct aagattggag tactagtagt cgtttgtggt ttctattttt tttatattta 3840
tctatgacag tttttctgtt tttcgttttg ataataatat aataaaaact catggacgtg 3900
aaatctggct tggttgtggt gatttcattc tcattattgt tgttttcttt ccgtcttgcg 3960
gatgaagatg ttgcgatgcg gttgttgttg gtgttgctat acaccgagag agatgatctt 4020
tttgttcttc tggttcattt cctatgattg tttggctgct gaccgacgcg tcaggatgtg 4080
cagggcatgc ggggaatcag gaccggacac gggataattt catctaccta tacggagatc 4140
gcggtcctcg ccatgaggat cgcgacaggc gcgtcgaggg ggcaggaaca cccttgcgga 4200
ttgacattct tggtggtgtt tcgttgttgt cggtagttgt tgttgacgat gaggataaat 4260
aaaaatgacc ttgtttttgt tctgttttct cttgttggga atcgtcgact ttgaattctt 4320
cgagttatcg gaaagctgag gtacccaaat gtctgtagct tttttctttt taccctcttg 4380
tttatcatct gcgattcgtg gtaggtagga gagggaaatg ataatccgag attaaggaaa 4440
ggagaagata aaaaataaaa aaaaaataat aaaacagaag ccgaccggcc gccgacccgt 4500
tccccaggac cagcctacga ggaatggata acgcggtggc gacggcagcg gtggtggcgc 4560
tgggggtggc ggcagtggta ctgctgatgg tagtcgggac ggaggagagg cgatgcatac 4620
atacacgcgt gcatgctgca tgggtggatg gtacggccgg gagacgcgga agagaaactc 4680
acataaaaag gtgacaaaaa gagcggttga aaaaagaaaa cgagattcga ccagacagaa 4740
gagaaggacc ggggcttggc gacccttcca cgactgctgt tgtcatctcg gctcccccgt 4800
cttctcccgg ccacgggcgg ctaagtcacc gccgttctcc ccatccgtcc gagcgccgac 4860
cgaccagccg gccgattcgc ccgccggggc ttctggagaa cgccggggca gcagcgatct 4920
ggggaagccg ctaaacccct gcgtttttat atggtagctc tgccgagcgc gggctgacgc 4980
gttgagtaag cggaaagacg tgtgtgacga aaaggggtcc catggtattt cacgtgacga 5040
tgaggagatg cggtttggag cacatacggt ttagaaaaag ggagttgtcg tgacaagggc 5100
tgagggacct ctgtctccat gtgtgtataa aaagcaaggc acgttcataa tgtaaaaaag 5160
aacacgttgt aaacaagcta ttgctgtatc attcggctga ctatgcttca ttcggactga 5220
ttttcttttc ctaacggcgt aacttaaagt gattaacgta tgatatttgt tccccagagt 5280
tatactatag tcatcatcct aaaattcaga tataaatgaa cacatgtcgt atgggattat 5340
taagaaaccg aaactctcca cagttcacca tcttcttcgt cattcaaccg atgacccact 5400
ccgtacaacg aatcagtctg ctgtgtcaca ctgcaaacta ctagcgacgt atgcaaacaa 5460
cttgaaacac gggctgttgt attgacgacc gttgtaccat tactagtcac attgcataga 5520
gaccatccac cgtcatccca tctttcccac ccgatggaaa accgtcttct atcatcaact 5580
atggtaagat ttcgaccctg cgaggtattc agtttcccca tatccataac ctggatttta 5640
tcattaaacc ccaatattaa acactttttt agtacccccc cacccaccaa aaaatgtgac 5700
tggaccggtt cctagcagct ctgggagcca tgttcaggtt gaaccacagc tacagcgaaa 5760
ccgagtccag tgaccggtaa ccacgtccag cccctgcgta tgtaccagtc caagcacgtc 5820
cggtcattgt tctacacagg aaatctaact aggtcaacgc aattttattc caccgttacg 5880
cagaatacta acaaacaaac acacaaattt aacgaattac acgtagttta ttacatgaaa 5940
actgtaagaa caccaattca ctaagcgata caacatttag ctgacttcca agtgccacac 6000
atcaccactg tattcatcca tgttttcacc gaaccaacga gacagatcga agaagccaga 6060
atctcccgac tttaaattac ataaatccaa cgtattatga ccacagctcg acacacaaat 6120
agttgcgtta ctattcacag tagcattacc tatacccgta acgttgcaca accactgatc 6180
accattgtta ccaaaaacgg ttttccactt agttgtcaac ggatctttcc catgcgtaat 6240
ggtcaaatta ctaccagtcg tcgcttttag ctcattacga gtattatccg catccacata 6300
tatcaacgtc atagctaggc acgctataag tacccccccc ccacaatgga atgttgccaa 6360
accggttctt tcccgttata gccatagcgt tcccaggcaa aagcaaacgc caaacctaat 6420
gcagtgaaaa gcgcttgcag ccagaaccag cttatgtacc agccacaatc acatccggtt 6480
attgtttcca caggaaatcc taccaggcaa agccccgctt gttttgttcc tgaccatctt 6540
gtttagcaat tcgtaaactg tcagcctagc gacgtccgtt tagatcaaaa gtcacgtata 6600
tagcgacgct gtttccaccc gtttccccgt cccgccgttt ccgaacaacc cacccgggtt 6660
cagacaaccg accaccaaca gaaatataca cacagaccac cgggagttca gttaaagatt 6720
tcatcaggtt tattttggct gctgctagtc ttttgcttct tagaaaaaaa atacccatat 6780
agagaaataa tgatagtttg acaacacata tggcagggat ttcttcttca tcaataagat 6840
atgcaattcc cccagggaga gactttcaac aattgaattt acaaaaacaa aattacatca 6900
ggagaaagag aggatacatt aataaatata ttatatctgg tgtatatact gaatgctgct 6960
ggttcataag gtaacgatgc tacttttttt aattccaaga tggtttttct ttgttagtct 7020
tttgttgact tgctggttcc taaaagttcg caaaaacgat tgtgtgaaga ttatgacgtt 7080
ggttgactag ttcatgagat tctgctgtac gtgtgatggt tattcgctgg ttcgttctaa 7140
gatgagtatc gtactgtgtc tgcgatggtc gtctcttact ggcattctct cggctgcctc 7200
ttgttttcat gattgaaaag gaaaaaagga ctccgagggc gcggtcatct tttacttttc 7260
ggttttctcg ttggcgggtc agaggtagtc agatcatgag actgtcgtgg tcgatgaaac 7320
tgtgtctgct caagtgacgt ccatttcttg tacggagaaa aaagtcatcg ggataaataa 7380
ggctatacaa ggcgttgtca agcgtgcggc tctaaacaaa ttaagcgata caaaattaca 7440
gtgatacgaa taataaatta ccccctcccc ctgtggtccc cccgaggcga gagccaccca 7500
tcgtgtactc tcgcaccacc cacgaccaca gggggagacg ggacgaagag acgacgcaga 7560
gcgccatctc ctcctggagg ccggcggcgt taactgctac agctgcggcg gcgacgacag 7620
ctgcgatttg tcggccgaca tgccgatggt atgggcggcg gcggcggtgg ccgcggcagc 7680
ggggaggaga ggagagagaa gaggagcggg gcgtccgaag gcgaggatgg catggtctcg 7740
ccggagcgcc cggcttttat ggaacactcg cgtccggttg ggtatcaccc acaggaagat 7800
gaatcacaac ttccaaacca tcttgagacc cgagtaacgg tttacaggtc gcacgccagt 7860
ctcagctaaa aacagcggac agtcccacgc tgtttctgtt gtggctctct ccagtttcct 7920
catcgccgtc ttggtctccg tcatcatcgg aagaatacca cccgctctca tgcggcagtc 7980
gatcagcctc gatgaacgag acgcggcgac gcctttctac ggccgactgg ttgtggtggt 8040
gaaagaagag caccagcaat cccaggagga gcaacaagcc ctcacatgtc caggaggtcg 8100
gggagagggc ctgtcggaga tgaccgtgag gcatcacgta cggcagctga ggagaaacgg 8160
agaagaaagg aaaattaccg tcaggggccg gggttcttat tagagaaaca gcacgtaggt 8220
caggatccag atgctaatgg caatcatgat gacgatgatc atgcaggcca agacgcggcg 8280
caccaatgca gaatccaata gccgccgtgc ctccggttgg tggccggcgg catctagaga 8340
catgatttgg gggggggacc ggcggcgcaa aaagacaggg agatggacag tgccacggtg 8400
ttttgttatg attaggacat ggggaccgga agccgagaca gagtactaca gggtgttgaa 8460
gggtaacgtg agggagatca tgtcatgggc gggctgaaga ccgtgcgggg aggatcgacg 8520
tgtgcggtgc ttgtggaaca cggtgtttta atatgtatcc gcgtgtaatg cacgcggtgt 8580
gctttttagc actcggcttg ataagctacg tgaccgtctg cgctgaaacc atggtcgcca 8640
ccaactgtct cgtgaaaaca gaaaataccc acctagcatg taagtgcaat ccgaatagta 8700
catctaccaa tggcagcaag tgccacgcga tgtgcaaatg ccgggtcaca gaacccatta 8760
ccatgctagg cgcatactcg gcctggggcg cgggctcgtt cgtggccacg ctgatagtcc 8820
tgctggtggt cttcttcgta atttacgcgc gcgaggagga gaaaaacaac acgggcaccg 8880
aggtagatca atgtctggcc tatcggagcc tgacacgcaa aaagctggaa caacacgcgg 8940
ctaaaaagca gaacatctac gaacggattc cataccgacc ctccagacag aaagataact 9000
ccccgttgat cgaaccgacg ggcacagacg acgaagagga cgaggacgac gacgtttaac 9060
gaggaagacg agaacgtgtt ttgcaccatg cagacctaca gcaactccct cacgcttgtc 9120
atagtcacgt cgctgttttt attcacagct cagggaagtt tatcgaatgc cgtcgaacca 9180
atcaaaaaac ccctaaagct cgccaactac cgcgccactt gcgaaaaccg tacacgcacg 9240
ctggttacca ggcttaacac tagccatcac agcgtagtct ggcaacgtta tgatatctac 9300
agcagataca tgcgtcgtat gccgccactt tgcatcatta cagacgccta taaagaaacc 9360
acgcgtcagg gtggcgcaac tttcacgtgc acgcgccaaa atctcacgct gtacaatctt 9420
acggttaaag atacgggagt ctaccttcta caggatcagt ataccggcga tgtcgaagct 9480
ttctacctca tcatccaccc acgcagcttc tgccgagcct tggaaacgcg tcgatgcttt 9540
tatccgggac caggcagagt cggtgtggtc acggattccc aagaggcaga ccgagcaatt 9600
atctcggatt taaaacgcca gtggtccggc ctctcactcc attgcgcctg ggtttcggga 9660
ctgatgatct ttgttggcgc actggtcatc tgctttctgc gatcgcaacg aatcggagaa 9720
caggacgttg aacatctgcg gacggacctg gatacggaac ctttgttgtt gacggtggac 9780
gggaatttgg aataaaagat gcgtaacacc tgtcgaagat gcgataactt tacatacagg 9840
caaacagtgt atacaattat agtattttgt atgttgcata aagttacatg caacagtact 9900
gctaacagta ctgcatccat tacgctatcc aacactgcct ctaccacttt tgtaaccaac 9960
atatattcaa ctccgaataa caacacatca acgacgccac acacatctgt cacctcacaa 10020
gcgtcaacca ttggcaacat caccaacgtt acctccgact tgagtacttt cacaaccgta 10080
tattctacat tcaatacatc atttgccaat atatctaata cggctgtcac tacagaattg 10140
atttcaacaa ataccaacac tatctcatct tttaccaacg taacagcaaa cgctacatca 10200
tcttataaca caacaatcac cgtaactgtc acgtcagatg aaacttcgca caacgtatcc 10260
actaataatg cacttataag cacaccatgg cctacaaatt gcagcgccac aacatacacc 10320
acgtacaacc ttactaactc ttccaacgct tgtcacacag agacaacaat catacgtttc 10380
aaggaaacca atacaacagg aatagaaggg agtaatgtca ccataaaggg taattctacg 10440
tgggactgtc tttcagtcgc ctggatacga cattacaata gatccacaca cggacatcat 10500
ctaggttatc gtaagaacgc acatacccaa tcttggtatt ggctacgcat ccttacctct 10560
cacactgtat gtcattctca acatgaaaga ccttcactgt accatgactt atgtcgttcg 10620
tgcaacaaca cagaattaca tctgtacgat ctaaatatca ccaattccgg caggtacagc 10680
agacgttgtt ttaaagaaaa ttacttcaca ggacatcacg aagatgaaaa tttctaccta 10740
ttagtaacac caaaaaatca tactgaagct attaatgcta ctttcgtttg ccctagatac 10800
aacaccgata tcgaaaatga agatagagag aaaggaagtc aacatactaa caatacacat 10860
caccacaaac gtaatctcta tcatagctcg caaagaagcc gcaccgtatg gaccatcgtg 10920
ttggtttgta tggcctgcat agttctgttt tttgcacgac gagcctttaa caaaaagtat 10980
catatgttac aagacaccgt cagtgaatca gaattcattg ttcgatatca cccagaacat 11040
gaagattgag ctacgtttcc gggcagacat cttatgaagc tgaacaataa actaaaacat 11100
tctgtaagac tcagcgttca aaggaatatt aatgcccatt gagcgaaaac taatattgca 11160
atggactggc gatttacggt tacgtggacc gttacttgtg atggtttcaa ttatacagtc 11220
cataaaagat gcgatcgcag ttacgaggta atcaacgtaa caggatacgt tggtagcaac 11280
ataactctaa aaaaatgcaa tcagactgag aaatggcaca atgtagactg gattcattat 11340
gagtacccca cgcataaaat gtgcgaatta ggcaactatc accaaaccac accacggcac 11400
gacatatgtt ttgactgcaa cgacacctcc ctaactatct acaacttaac cacaaaaaac 11460
gctggaaaat ataccaggcg tcaccgtgat aacggtcaag aagaaaatta ctacgtaacg 11520
gtgttaattg gagacacaac gttattcact cttggcacat gccctgtaag atataaagaa 11580
tctacgaaca ctgaaaacac cattggaagt agcatcatag aaaccattga gaaagctaac 11640
attcccctgg gaattcatgc tgtatgggca ggcgtagtgg tatcagtggc gcttatagcg 11700
ttgtacatgg gtagccatcg cattcccaaa aagccgcatt acaccaaact tcccaaatat 11760
gatccagatg aattttggac taaggcttaa catgctgatc aataaacttt ttttaaccaa 11820
taacatgtct ccgttttttt ttgttaacaa cctatgatat aaagcgttat attcagtcgt 11880
tactaaacaa aaaaacatgg gcatgcaatg caacactaaa ttgttattgc cagtcgcact 11940
aataccggtt gcaatcatcc taattggtac tctagtgccg atacttttac atgaacaaaa 12000
aaaggcgttt tactggcgac tttttctgca aagtcaacat gtagaagcac ccattacagt 12060
aacgcaggga gacacagtct acctagacgc tagcaataat ccctgtaatt attccagctt 12120
ttggtaccac ggtaattgcg aactttgtgg atggaacgga tatctacgca atgttacaca 12180
ttactacaca aacacatcgt gttccccgca attcatctgc ataaacgaaa ctaaaggtct 12240
gcagttatat aatgtaacat taaacgattc aggcgcttat actgaacacg tttacgaatg 12300
tgacctttcg tgtaacatta ctactaataa cgaatatgaa atactcaatt attttgataa 12360
ctgtaactac accataaata gcaccaagca tattatcacc gtggtgtctt cacgtcattc 12420
taaacaaaca aattcccacg tatccactca cgctggttgg gcagtcgccg tggtgacggt 12480
aattatgatc tacgttctga tccactttaa cgtcccggca actctgagac acaaactacg 12540
aactagaaac aacgtaaatc gcatagcgtg attataaagt atcgacgcta atttctccaa 12600
gataaaattt gattactccg tgcagttctc aaaaactgta aggccccgct tttccactcc 12660
gtcatgaagg atcgcaatag aatactgcta tgtatcatct ttatttgcat tatgtgcctc 12720
atttgtattt actttaaacg tcgttgtgtt tttactccgt ctccagacaa agcagatctg 12780
cgagtggaat ttccctcgtt acccccgtgt attggcatac agtgcgctgc atgagaacac 12840
gcgtgacaca tagcgtaccc ctggacggta cagtttatga taacgtaatt cagggaaagt 12900
atacattcat accaacatgt tatcacataa cacacagatt ttctgcgtgt tttataaaag 12960
agcgtctcga agcagcttga gccacactac ggtccagatg acgagcgtaa ttaaaaatat 13020
gccgcgcagt attcgaaagc cgtactgagc gtgcgaggcg ggtagggtgc cgaacgacgg 13080
atatgcgtcg ttgtcatctt cgactataag gatcgcgacc gagtcttcgg ccatggtaaa 13140
cgtcaccctg tgtggctggt atgtagcgta tccggtttgg aattgttctg ctccagctcg 13200
ggggatagtg aggaattctc aagggatacg ggacccaatg actggataag agaagggttt 13260
ttccccgtaa gatgatcctc gtatcacatg aggtctggat atgtataaat gaagagtgaa 13320
ataggcacag ggaatcagat gccagcctcg tgatgcagcc gctggttctc tcggcgaaga 13380
aactgtcgtc tttgctgact tgcaaataca tcccgcctta agcgatgagt ctataaagca 13440
ccgttgcccg agtacggtaa aagtgacccg gattgtagaa cgtccttttt ttttgttttt 13500
gcatcgttta tcgtcactac tagtgcaata ttttgattgt aaggctgaaa gagtatcgtt 13560
atgatgctta gaacgtggag attattacag atggtactgc ttgccgcgta ctgttattat 13620
gtttttgcga cttgttcaat cagcacgacg actgctcctg tggaatggaa gtctcccgac 13680
cgtcagattc ccaagaatat tacctgcgct aattactcag ggaccgtcaa cggcaacgtt 13740
acatttcgag gtcttcagaa caaaacggaa gactttttgt actggttgtt aggatggggt 13800
cataagtcca tttgttcgtt cttcccgaaa ctccagggta actatgacga acaacattac 13860
agatatgaag tagcgaacct gacgtataac tgcacctata accgcttgac gttgctgaat 13920
ctgacgacgg aaaacagcgg aaagtactat ttcaaaaggg aagatgcgaa tttcaccttc 13980
tattactctt gttacaactt gaccgtgtcc taaagatcgc acgtgaagtt tcacagagcc 14040
gcgtggctgt agctattgtg tttacgttgc ttttgaaatg ttaagcgtcc ctacggcgct 14100
aacatgtttc taggctactc tgactgtgta gatcccggcc ttgctgtgta tcgtgtatct 14160
agatcacgct taaagctcat gttgtctttt gtgtggttgg tcggtttgcg tttctatgat 14220
tgtgccgcgt tcgagtcctg ctgttacgac atcaccgagg cggagagtaa caaggctata 14280
tcaagggacg aagcagcatt cacctccagc gtgagcaccc gtacaccgtc cctggcgatc 14340
gcgcctcctc ctgaccgatc gatgctgttg tcgcgagagg aagaactcgt tccgtggagt 14400
cgtctcatca tcactaagca gttctacgga ggcctgattt tccacaccac ctgggtcacc 14460
ggcttcgtcc tgctaggact cttgacgctt ttcgccagcc tgtttcgcgt accgcaatcc 14520
atctgtcgtt tctgcataga ccgtctccgg gacatcgccc gtcctctgaa ataccgctat 14580
caacgtcttg tcgctaccgt gtagctagtt agccagctgt gtgtagtgtt ttgcttttgc 14640
atatttgttt tcagtcagag agtctgaaac ggggtgggag ggacttttgc gggtagtgca 14700
tgctaagatg aacgggtggg ctggggtgtg cttgataact cactgtttga atacgcgctc 14760
acgcacatat gtagcactca acatgttagc ttttgcccgc acgccccggg gcgtgccgag 14820
ctgccttttt aataaagtct gggtttccag atacgcgctg gttctgattt tgatggtttg 14880
tgcctctgaa agctctacga gctgggccgt gacatccaat ggactgccta actgtagcac 14940
ggtaactaga acagcgggtc aagacgctga attgcacggt ccggcaccgt taagctgtaa 15000
tgtgacccag tggggacgtt acgagaatgg aagcacaccc gtgttatggt gcactttacg 15060
gggatcaagc atgcgagtct cattaggaca ccgtgtagcg tttggctgtt cttggaaaac 15120
attttttatt tataacgttt ctgaaagtag cggtggcact tactatcaaa aaggttacaa 15180
ctgcaccgac aaacatataa cactatcttg tttcaactta acggtggttc ctcgagcggt 15240
tcaaagcaca accaccgtaa tgacacccac gctggttaca aactccacat tcagtgtgtc 15300
acttgttccg ttgagactga cgacaaattc cagcgcgttt ggacacgcta tttatcaacg 15360
acaacagcgt gttgaaaacg ggacgttatc caagaacata actaacttgg cattcaccta 15420
tggcagctgg ggcgttgcga tgctgctgtt tgccgccgtg atggtgctcg ttgatttggg 15480
tttgcctcaa tcggcttggc gacgctggcg aagccacgtg gacgatgaag aacgtggttt 15540
gttaatgtag gaaataaaag gcagtttgag catgactgtt tccaaaccgt aacgtggtaa 15600
ataaatcatg gcttccgacg tgggttctca tcctctgacg gttacacgat ttcgctgcag 15660
agtgcattat gtgtacaata aactgttgat tttaactttg tttgcccccg tgattctgga 15720
atccgtcatc tacgtgtccg ggccacaggg agggaacgtt accctggtat ccaacttcac 15780
ttcaaacatc agcgcacggt ggttccgctg ggacggcaac gatagccatc tcatttgctt 15840
ttacaaacgt ggagagggtc tttctacgcc ctatgtgggt ttaagcctaa gttgtgcggc 15900
taaccaaatc accatcttca acctcacgtt gaacgactcc ggtcgttacg gagcagaagg 15960
ttttacgaga agcggcgaaa atgaaacgtt cctgtggtat aatttgaccg tgaaacccaa 16020
acctttggaa actactccag ctagtaacgt aacaaccatc gtcacgacga catcgacgat 16080
gatcgacgcg aaaagtaacg ttacagggaa cgccagttta gcaccacaat tacgtgccgt 16140
cgctggattc tccaatcaga cgcctttgga aaacaacacg cacctggcct tggtaggtgt 16200
tgttgtgttt ttagttctga tagttgtttg cattatgggg tggtggaaat tgttgtgtgg 16260
taaaccagag ttatagtaat gtgcttttta tcagggagaa ggttttgtgc caacaatgac 16320
tagcccggga ctatctgcgt cagaaaatta tgacggaaat tatgaattca cggaaaccgc 16380
caatacaacg cgtacaaata gaagtgactg gacaacgtta gaaaccagtg cattgctatt 16440
gaaaaacacg gagactgcag tgaacctcag caacgcgact acggtcatcc cacaacctgt 16500
agaatacccg gctggggaag tacaatatca aagaacggca acgcattatt cttggatgct 16560
aatcattgtc atcattctca tcatttttat tatcatctgt ctacgagcac ctcgaaaaat 16620
ctaccatcac tggaaagaca gtaaacagta cggacaagtg tttatgacag acacggaact 16680
gtgacagtga tgtctaagcg tttgcaggta tttccatgga taacaatttt attttacaca 16740
tcaaaatccc agtattggaa ctatatggca ataccatgta cccctacagt tggatacggc 16800
agtcataata ttagcttgca tccgcttaat aactcattat ttcaagacga tgtttttgaa 16860
tggtacatag acaaaccaat ggttacaagt tatgtcttta tcaaagtaat gaacgcacaa 16920
aatccaatct agactctcca aatattgtgt ggcaatgcac agataatcgt acactaattc 16980
tcatgaactt aaccacaaca tacagtagaa actattattt tcaatccttt aaatatctcg 17040
gacgaggagt accaaaaccg aataacttgt gttataacgt tagtgtacac tttacccacc 17100
aaacacattg ccatacaact acatcatccc tgtatccacc tacatctgta cacgattcat 17160
tagaaatatc acagtcattc acctcaacca acttcacaca taccgcggtc cactacgcca 17220
ccggtaacgt tgaagcacaa cacgacacta ccactccaca tacaatgtgg atcatacccc 17280
tagttatcgt tataacaatc atcgttttaa cttgtttcaa attcccccag aaagcttgga 17340
ataaattcac acaatacaga tacagcggta tgctcgccgc cgcttaaaga atcaacgcca 17400
aggaaaccaa aacgtaaaaa gaatagatat gtacgtttat ttttcagctc actgtttgaa 17460
taccgtaaac ataatgacgt acatatacgt ggttatacaa caggtgtttg tgttatgcgg 17520
cgactgatta accatatcgt gaaccatgat cttttccgat ggtccgtcgt gaccgcaatg 17580
atattttaca gatattccga aacctgtatg gaggtcactg tcagagtagg tgatccagtt 17640
accctcggta gtggacatgg ttatcatcca ggtagggata acagggtaat gatcctctag 17700
agtcgacctg caggcatgca agcttgagta ttctatagtc tcacctaaat agcttgg 17757
<210> 11
<211> 18036
<212> DNA
<213> 巨细胞病毒HCMV
<220>
<221> misc_feature
<223> 编辑后HCMV片段
<400> 11
acgacggcca gtgaattgta atacgactca ctatagggcg aattcgagct cggtacccga 60
ttaccctgtt atccctacca ttccgggccg tgtgctgggt ccccgagggg cgggggggtg 120
tttttagcgg gggggtgaaa tttggagtct tggagccgcg tgtgctgtgg aggacggtga 180
cggtggtaag agtgtgctgc ggtgcggttg ggacggcggc ggcgaataaa agcggcgtgc 240
ggcgcgcacg gcgaaaagca gacgcgcgtc tgtgttgtgt gtctttgacc gcggcggaac 300
acacgcggaa aagcgagtcc caggggacac acgacgagcg agtcccaggg ggggacgacg 360
acggccaggg acgcggaaac gacgcggaaa agaggaagtc cccaggggga cgggcggaaa 420
agaggaagcg cctaggggac cgcgggggca ggaacagacg aagtacgccg caacccgcgt 480
cgaggacaca cgcagaagcg gccgcccagg ggaggggggg ggggggactc gcgggccccg 540
gggcacactt gttgttccct ccggccgccg acacgcaccc cgaagccgcg cacaccgccg 600
acacacccct gacacacccg cgacacaccc gccacacgcc cgacacacgc ccgcgacaca 660
cccgaccgac acaccctgac acaccccgcc aacacaccca gccgcacccg ccccgccaac 720
acacccccga cacacccgac acacgcccgc gacacacccg gcacacaccc acccacccag 780
ccgcgccccc gacacacccc gaacggcgcc ggtgcgggac agggctcacg gaggtttgcg 840
ggccgtgagc acgcctccct ttgtacacac taccggtgcg tggcgtccca cgctatttgt 900
tcgcgagacc ggactaaggg aggtttgcgg tgcgtcagcg cggggcggcg tttgcggcgt 960
gtttcgacca gcgctttgtg cgcgctgcct gtgcgtgtcg tcccatggtc tttgtcagcg 1020
gcacggcgct ggggacgggg tttcaccgcg ctgagggatc tttctgcggg tgtgagggac 1080
ggagcttttt tcgcacgctg ggcaccgggc tgggggacgg ggggtgtgcg ggacggcggt 1140
ggggccgggg cgttgcgggt acggggatta cgctgggaac ggggactcgc ggacccgggc 1200
tgagggacgg gggtggcggg ggtgtttgcg gcgaggacgg gggccttttg cggcggggac 1260
ggggactcac cctcgcctat ttaacctcca cccacttcaa cacacacatg ccgcacaatc 1320
atgccagcca cagacacaaa cagcacccac accacgccgc ttcacccaga gtaccaacac 1380
acgttaccct tacaccacag caacacacaa ccgcctatcc aaacctcgga caaacacgcc 1440
aacgaagaac accgcacgca gatggagctc gacgccgcgg attacgctgc ttgcgcgcag 1500
gcccgccaac acctctacgc tcaaacacaa ccccaactac acgcataccc caacgccaac 1560
cctcaggaaa gcgctcattt ttccacagaa aatcaacatc aactcacgca tctacttcac 1620
aacattggcg aaggcgcagc gctcggctac cccgtccccc gcgcggaaat ccgccgcggc 1680
ggtggcgact gggccgacag cgcgagcgac ttcgacgccg actgctggtg catgtgggga 1740
cgcttcggaa ccatgggccg ccaacctatc gtgaccttac tgttggcgcg ccaacgcgac 1800
ggcctcgctg actggaacgt cgtacgctgc cgcggcacag gctttcgcgc acacgattcc 1860
gaggacggcg tctctgtctg gcgtcagcac ttggtttttt tactcggagg ccacggccgc 1920
cgtgtacagt tagaacgtcc atccgcggga gaagcccaag ctcgaggcct attgccacgc 1980
atccggatca cccccatctc cacatctcca cgcccaaaac caccccagcc caccatatcc 2040
accgcatcgc acccacatgc tacgactcgc ccacatcaca cgctctttcc tatcccttct 2100
acaccctcag ccacggttca caatccccga aactacgccg tccaacttca cgccgaaacg 2160
acccgcacat ggcgctgggc acgacgcggt gaacgtggcg cgtggatgcc ggccgagaca 2220
tttacatgtc ccaaggataa acgtccctgg tagacggggt agggggatct accagcccag 2280
ggatcgcgta tttcgccgcc acgctgcttc accgatatcc aataaaccca tcccctcgcc 2340
acgacgtctc cgcgtatctt tgtagcctca ggaatccgtc cccacgtcca tccatcccga 2400
gcactccaca cgctataaca gaccacggac acggcaaatg catgcaaact tctcatttat 2460
tgtgtctact actctgtgtt gctacaggga gtgaaggggg tgaaggcaaa gaaaaaaaaa 2520
aggaacaaaa taatagatta gcagaaggaa taatccgtgc gaccgagctt gtgcttcttt 2580
tcttataagg aggcaaatat actagggaaa acttaagaat aggaagaaac cgaggtttgg 2640
gagaaaagct gagataaaat agcgcatttt ccatacagag gttgttgttt ttgtggatcc 2700
taagaggttt caagtgcgaa tctcaaagtt ctcacgagaa tattgtcttc aagaatcgac 2760
aactgtggtc caagattttt ttttggtctt tttaggttct gcgagggaca tcacgatgga 2820
tcgttgcgat gaagtcacgc gtacgcctct ggtgtggcgc ggtgtcgtga caggagagtg 2880
tgttttcagt gcagagctgt cttgattcct atatccgagt atctgttttc tcgtaaggac 2940
ggtaatcttc tttggtgtaa gtacatctaa aagctgcaaa ctatatttta agggctgtct 3000
ctaggtgtac tttgatgctg gagtttttcg ctgtgttgat gtgaataaat ctactactac 3060
tattatatgc agaaagagtg attatgccga gacaagattg cattggctga actgtttcaa 3120
aaacgcctac actctactta tccgtaaacc taaggtaata ctatgtgtaa gttgtttttt 3180
tttctttttg tagtaaaatg gtgatacgtg caattaaaac tgtattccat gtttccatcc 3240
tttcatttca actttaaagg cggctttgag agcgaagaag tgcgaggata aaaatggatg 3300
actccttcgt gtccagggag tcgactactg caacgctgat tgattaaaag atggtctccg 3360
atgatgatgt tgttattgat cgaatcatgg tgcagaacgg cgacggagag gagcgtgtcc 3420
gccgccggga aggtggtctc tttctctttt cttttttcaa gaaatcttcc atgtgtttat 3480
cgtagtgatc gaaatcgact gatctcgggt tctttttgtt ggtttctttt cggttaatca 3540
tgtattgttt tcttttttta cagaaagata cttttttcat gagcaattcc tcgcccggcg 3600
ccggcatgcc gaggtggggc cactgcgatc agcggcatgc cgacgccgac ccggggatct 3660
tggattcacc gttttctctc ttctctctct acatacagac cgggtggcag gagcggtaag 3720
gaatcatcgt cgtctttcat tcttcgatga ttatggtaat actaaatctt atctaggagc 3780
atatacatct aagattggag tactagtagt cgtttgtggt ttctattttt tttatattta 3840
tctatgacag tttttctgtt tttcgttttg ataataatat aataaaaact catggacgtg 3900
aaatctggct tggttgtggt gatttcattc tcattattgt tgttttcttt ccgtcttgcg 3960
gatgaagatg ttgcgatgcg gttgttgttg gtgttgctat acaccgagag agatgatctt 4020
tttgttcttc tggttcattt cctatgattg tttggctgct gaccgacgcg tcaggatgtg 4080
cagggcatgc ggggaatcag gaccggacac gggataattt catctaccta tacggagatc 4140
gcggtcctcg ccatgaggat cgcgacaggc gcgtcgaggg ggcaggaaca cccttgcgga 4200
ttgacattct tggtggtgtt tcgttgttgt cggtagttgt tgttgacgat gaggataaat 4260
aaaaatgacc ttgtttttgt tctgttttct cttgttggga atcgtcgact ttgaattctt 4320
cgagttatcg gaaagctgag gtacccaaat gtctgtagct tttttctttt taccctcttg 4380
tttatcatct gcgattcgtg gtaggtagga gagggaaatg ataatccgag attaaggaaa 4440
ggagaagata aaaaataaaa aaaaaataat aaaacagaag ccgaccggcc gccgacccgt 4500
tccccaggac cagcctacga ggaatggata acgcggtggc gacggcagcg gtggtggcgc 4560
tgggggtggc ggcagtggta ctgctgatgg tagtcgggac ggaggagagg cgatgcatac 4620
atacacgcgt gcatgctgca tgggtggatg gtacggccgg gagacgcgga agagaaactc 4680
acataaaaag gtgacaaaaa gagcggttga aaaaagaaaa cgagattcga ccagacagaa 4740
gagaaggacc ggggcttggc gacccttcca cgactgctgt tgtcatctcg gctcccccgt 4800
cttctcccgg ccacgggcgg ctaagtcacc gccgttctcc ccatccgtcc gagcgccgac 4860
cgaccagccg gccgattcgc ccgccggggc ttctggagaa cgccggggca gcagcgatct 4920
ggggaagccg ctaaacccct gcgtttttat atggtagctc tgccgagcgc gggctgacgc 4980
gttgagtaag cggaaagacg tgtgtgacga aaaggggtcc catggtattt cacgtgacga 5040
tgaggagatg cggtttggag cacatacggt ttagaaaaag ggagttgtcg tgacaagggc 5100
tgagggacct ctgtctccat gtgtgtataa aaagcaaggc acgttcataa tgtaaaaaag 5160
aacacgttgt aaacaagcta ttgctgtatc attcggctga ctatgcttca ttcggactga 5220
ttttcttttc ctaacggcgt aacttaaagt gattaacgta tgatatttgt tccccagagt 5280
tatactatag tcatcatcct aaaattcaga tataaatgaa cacatgtcgt atgggattat 5340
taagaaaccg aaactctcca cagttcacca tcttcttcgt cattcaaccg atgacccact 5400
ccgtacaacg aatcagtctg ctgtgtcaca ctgcaaacta ctagcgacgt atgcaaacaa 5460
cttgaaacac gggctgttgt attgacgacc gttgtaccat tactagtcac attgcataga 5520
gaccatccac cgtcatccca tctttcccac ccgatggaaa accgtcttct atcatcaact 5580
atggtaagat ttcgaccctg cgaggtattc agtttcccca tatccataac ctggatttta 5640
tcattaaacc ccaatattaa acactttttt agtacccccc cacccaccaa aaaatgtgac 5700
tggaccggtt cctagcagct ctgggagcca tgttcaggtt gaaccacagc tacagcgaaa 5760
ccgagtccag tgaccggtaa ccacgtccag cccctgcgta tgtaccagtc caagcacgtc 5820
cggtcattgt tctacacagg aaatctaact aggtcaacgc aattttattc caccgttacg 5880
cagaatacta acaaacaaac acacaaattt aacgaattac acgtagttta ttacatgaaa 5940
actgtaagaa caccaattca ctaagcgata caacatttag ctgacttcca agtgccacac 6000
atcaccactg tattcatcca tgttttcacc gaaccaacga gacagatcga agaagccaga 6060
atctcccgac tttaaattac ataaatccaa cgtattatga ccacagctcg acacacaaat 6120
agttgcgtta ctattcacag tagcattacc tatacccgta acgttgcaca accactgatc 6180
accattgtta ccaaaaacgg ttttccactt agttgtcaac ggatctttcc catgcgtaat 6240
ggtcaaatta ctaccagtcg tcgcttttag ctcattacga gtattatccg catccacata 6300
tatcaacgtc atagctaggc acgctataag tacccccccc ccacaatgga atgttgccaa 6360
accggttctt tcccgttata gccatagcgt tcccaggcaa aagcaaacgc caaacctaat 6420
gcagtgaaaa gcgcttgcag ccagaaccag cttatgtacc agccacaatc acatccggtt 6480
attgtttcca caggaaatcc taccaggcaa agccccgctt gttttgttcc tgaccatctt 6540
gtttagcaat tcgtaaactg tcagcctagc gacgtccgtt tagatcaaaa gtcacgtata 6600
tagcgacgct gtttccaccc gtttccccgt cccgccgttt ccgaacaacc cacccgggtt 6660
cagacaaccg accaccaaca gaaatataca cacagaccac cgggagttca gttaaagatt 6720
tcatcaggtt tattttggct gctgctagtc ttttgcttct tagaaaaaaa atacccatat 6780
agagaaataa tgatagtttg acaacacata tggcagggat ttcttcttca tcaataagat 6840
atgcaattcc cccagggaga gactttcaac aattgaattt acaaaaacaa aattacatca 6900
ggagaaagag aggatacatt aataaatata ttatatctgg tgtatatact gaatgctgct 6960
ggttcataag gtaacgatgc tacttttttt aattccaaga tggtttttct ttgttagtct 7020
tttgttgact tgctggttcc taaaagttcg caaaaacgat tgtgtgaaga ttatgacgtt 7080
ggttgactag ttcatgagat tctgctgtac gtgtgatggt tattcgctgg ttcgttctaa 7140
gatgagtatc gtactgtgtc tgcgatggtc gtctcttact ggcattctct cggctgcctc 7200
ttgttttcat gattgaaaag gaaaaaagga ctccgagggc gcggtcatct tttacttttc 7260
ggttttctcg ttggcgggtc agaggtagtc agatcatgag actgtcgtgg tcgatgaaac 7320
tgtgtctgct caagtgacgt ccatttcttg tacggagaaa aaagtcatcg ggataaataa 7380
ggctatacaa ggcgttgtca agcgtgcggc tctaaacaaa ttaagcgata caaaattaca 7440
gtgatacgaa taataaatta ccccctcccc ctgtggtccc cccgaggcga gagccaccca 7500
tcgtgtactc tcgcaccacc cacgaccaca gggggagacg ggacgaagag acgacgcaga 7560
gcgccatctc ctcctggagg ccggcggcgt taactgctac agctgcggcg gcgacgacag 7620
ctgcgatttg tcggccgaca tgccgatggt atgggcggcg gcggcggtgg ccgcggcagc 7680
ggggaggaga ggagagagaa gaggagcggg gcgtccgaag gcgaggatgg catggtctcg 7740
ccggagcgcc cggcttttat ggaacactcg cgtccggttg ggtatcaccc acaggaagat 7800
gaatcacaac ttccaaacca tcttgagacc cgagtaacgg tttacaggtc gcacgccagt 7860
ctcagctaaa aacagcggac agtcccacgc tgtttctgtt gtggctctct ccagtttcct 7920
catcgccgtc ttggtctccg tcatcatcgg aagaatacca cccgctctca tgcggcagtc 7980
gatcagcctc gatgaacgag acgcggcgac gcctttctac ggccgactgg ttgtggtggt 8040
gaaagaagag caccagcaat cccaggagga gcaacaagcc ctcacatgtc caggaggtcg 8100
gggagagggc ctgtcggaga tgaccgtgag gcatcacgta cggcagctga ggagaaacgg 8160
agaagaaagg aaaattaccg tcaggggccg gggttcttat tagagaaaca gcacgtaggt 8220
caggatccag atgctaatgg caatcatgat gacgatgatc atgcaggcca agacgcggcg 8280
caccaatgca gaatccaata gccgccgtgc ctccggttgg tggccggcgg catctagaga 8340
catgatttgg gggggggacc ggcggcgcaa aaagacaggg agatggacag tgccacggtg 8400
ttttgttatg attaggacat ggggaccgga agccgagaca gagtactaca gggtgttgaa 8460
gggtaacgtg agggagatca tgtcatgggc gggctgaaga ccgtgcgggg aggatcgacg 8520
tgtgcggtgc ttgtggaaca cggtgtttta atatgtatcc gcgtgtaatg cacgcggtgt 8580
gctttttagc actcggcttg ataagctacg tgaccgtctg cgctgaaacc atggtcgcca 8640
ccaactgtct cgtgaaaaca gaaaataccc acctagcatg taagtgcaat ccgaatagta 8700
catctaccaa tggcagcaag tgccacgcga tgtgcaaatg ccgggtcaca gaacccatta 8760
ccatgctagg cgcatactcg gcctggggcg cgggctcgtt cgtggccacg ctgatagtcc 8820
tgctggtggt cttcttcgta atttacgcgc gcgaggagga gaaaaacaac acgggcaccg 8880
aggtagatca atgtctggcc tatcggagcc tgacacgcaa aaagctggaa caacacgcgg 8940
ctaaaaagca gaacatctac gaacggattc cataccgacc ctccagacag aaagataact 9000
ccccgttgat cgaaccgacg ggcacagacg acgaagagga cgaggacgac gacgtttaac 9060
gaggaagacg agaacgtgtt ttgcaccatg cagacctaca gcaactccct cacgcttgtc 9120
atagtcacgt cgctgttttt attcacagct cagggaagtt tatcgaatgc cgtcgaacca 9180
atcaaaaaac ccctaaagct cgccaactac cgcgccactt gcgaaaaccg tacacgcacg 9240
ctggttacca ggcttaacac tagccatcac agcgtagtct ggcaacgtta tgatatctac 9300
agcagataca tgcgtcgtat gccgccactt tgcatcatta cagacgccta taaagaaacc 9360
acgcgtcagg gtggcgcaac tttcacgtgc acgcgccaaa atctcacgct gtacaatctt 9420
acggttaaag atacgggagt ctaccttcta caggatcagt ataccggcga tgtcgaagct 9480
ttctacctca tcatccaccc acgcagcttc tgccgagcct tggaaacgcg tcgatgcttt 9540
tatccgggac caggcagagt cggtgtggtc acggattccc aagaggcaga ccgagcaatt 9600
atctcggatt taaaacgcca gtggtccggc ctctcactcc attgcgcctg ggtttcggga 9660
ctgatgatct ttgttggcgc actggtcatc tgctttctgc gatcgcaacg aatcggagaa 9720
caggacgttg aacatctgcg gacggacctg gatacggaac ctttgttgtt gacggtggac 9780
gggaatttgg aataaaagat gcgtaacacc tgtcgaagat gcgataactt tacatacagg 9840
caaacagtgt atacaattat agtattttgt atgttgcata aagttacatg caacagtact 9900
gctaacagta ctgcatccat tacgctatcc aacactgcct ctaccacttt tgtaaccaac 9960
atatattcaa ctccgaataa caacacatca acgacgccac acacatctgt cacctcacaa 10020
gcgtcaacca ttggcaacat caccaacgtt acctccgact tgagtacttt cacaaccgta 10080
tattctacat tcaatacatc atttgccaat atatctaata cggctgtcac tacagaattg 10140
atttcaacaa ataccaacac tatctcatct tttaccaacg taacagcaaa cgctacatca 10200
tcttataaca caacaatcac cgtaactgtc acgtcagatg aaacttcgca caacgtatcc 10260
actaataatg cacttataag cacaccatgg cctacaaatt gcagcgccac aacatacacc 10320
acgtacaacc ttactaactc ttccaacgct tgtcacacag agacaacaat catacgtttc 10380
aaggaaacca atacaacagg aatagaaggg agtaatgtca ccataaaggg taattctacg 10440
tgggactgtc tttcagtcgc ctggatacga cattacaata gatccacaca cggacatcat 10500
ctaggttatc gtaagaacgc acatacccaa tcttggtatt ggctacgcat ccttacctct 10560
cacactgtat gtcattctca acatgaaaga ccttcactgt accatgactt atgtcgttcg 10620
tgcaacaaca cagaattaca tctgtacgat ctaaatatca ccaattccgg caggtacagc 10680
agacgttgtt ttaaagaaaa ttacttcaca ggacatcacg aagatgaaaa tttctaccta 10740
ttagtaacac caaaaaatca tactgaagct attaatgcta ctttcgtttg ccctagatac 10800
aacaccgata tcgaaaatga agatagagag aaaggaagtc aacatactaa caatacacat 10860
caccacaaac gtaatctcta tcatagctcg caaagaagcc gcaccgtatg gaccatcgtg 10920
ttggtttgta tggcctgcat agttctgttt tttgcacgac gagcctttaa caaaaagtat 10980
catatgttac aagacaccgt cagtgaatca gaattcattg ttcgatatca cccagaacat 11040
gaagattgag ctacgtttcc gggcagacat cttatgaagc tgaacaataa actaaaacat 11100
tctgtaagac tcagcgttca aaggaatatt aatgcccatt gagcgaaaac taatattgca 11160
atggactggc gatttacggt tacgtggacg atactaatgt ccgcgttgtc agaaagctgc 11220
aatcaaacct gttcttgtca atgtccctgt agtactaccg ttaactattc aactagtact 11280
gagacagcca catcaacata cagtacaaca gttatcagca ataaaagcac ttcagaatct 11340
ataaattgct ctactgcaac tacaccagca aacaccgttt ctacaaaacc gtcggaaaca 11400
accacacaga tatccacaac gacgaacaca aacgttgaga ctaccacatg taccaacacc 11460
accacgaccg ttacttgtga tggtttcaat tatacagtcc ataaaagatg cgatcgcagt 11520
tacgaggtaa tcaacgtaac aggatacgtt ggtagcaaca taactctaaa aaaatgcaat 11580
cagactgaga aatggcacaa tgtagactgg attcattatg agtaccccac gcataaaatg 11640
tgcgaattag gcaactatca ccaaaccaca ccacggcacg acatatgttt tgactgcaac 11700
gacacctccc taactatcta caacttaacc acaaaaaacg ctggaaaata taccaggcgt 11760
caccgtgata acggtcaaga agaaaattac tacgtaacgg tgttaattgg agacacaacg 11820
ttattcactc ttggcacatg ccctgtaaga tataaagaat ctacgaacac tgaaaacacc 11880
attggaagta gcatcataga aaccattgag aaagctaaca ttcccctggg aattcatgct 11940
gtatgggcag gcgtagtggt atcagtggcg cttatagcgt tgtacatggg tagccatcgc 12000
attcccaaaa agccgcatta caccaaactt cccaaatatg atccagatga attttggact 12060
aaggcttaac atgctgatca ataaactttt tttaaccaat aacatgtctc cgtttttttt 12120
tgttaacaac ctatgatata aagcgttata ttcagtcgtt actaaacaaa aaaacatggg 12180
catgcaatgc aacactaaat tgttattgcc agtcgcacta ataccggttg caatcatcct 12240
aattggtact ctagtgccga tacttttaca tgaacaaaaa aaggcgtttt actggcgact 12300
ttttctgcaa agtcaacatg tagaagcacc cattacagta acgcagggag acacagtcta 12360
cctagacgct agcaataatc cctgtaatta ttccagcttt tggtaccacg gtaattgcga 12420
actttgtgga tggaacggat atctacgcaa tgttacacat tactacacaa acacatcgtg 12480
ttccccgcaa ttcatctgca taaacgaaac taaaggtctg cagttatata atgtaacatt 12540
aaacgattca ggcgcttata ctgaacacgt ttacgaatgt gacctttcgt gtaacattac 12600
tactaataac gaatatgaaa tactcaatta ttttgataac tgtaactaca ccataaatag 12660
caccaagcat attatcaccg tggtgtcttc acgtcattct aaacaaacaa attcccacgt 12720
atccactcac gctggttggg cagtcgccgt ggtgacggta attatgatct acgttctgat 12780
ccactttaac gtcccggcaa ctctgagaca caaactacga actagaaaca acgtaaatcg 12840
catagcgtga ttataaagta tcgacgctaa tttctccaag ataaaatttg attactccgt 12900
gcagttctca aaaactgtaa ggccccgctt ttccactccg tcatgaagga tcgcaataga 12960
atactgctat gtatcatctt tatttgcatt atgtgcctca tttgtattta ctttaaacgt 13020
cgttgtgttt ttactccgtc tccagacaaa gcagatctgc gagtggaatt tccctcgtta 13080
cccccgtgta ttggcataca gtgcgctgca tgagaacacg cgtgacacat agcgtacccc 13140
tggacggtac agtttatgat aacgtaattc agggaaagta tacattcata ccaacatgtt 13200
atcacataac acacagattt tctgcgtgtt ttataaaaga gcgtctcgaa gcagcttgag 13260
ccacactacg gtccagatga cgagcgtaat taaaaatatg ccgcgcagta ttcgaaagcc 13320
gtactgagcg tgcgaggcgg gtagggtgcc gaacgacgga tatgcgtcgt tgtcatcttc 13380
gactataagg atcgcgaccg agtcttcggc catggtaaac gtcaccctgt gtggctggta 13440
tgtagcgtat ccggtttgga attgttctgc tccagctcgg gggatagtga ggaattctca 13500
agggatacgg gacccaatga ctggataaga gaagggtttt tccccgtaag atgatcctcg 13560
tatcacatga ggtctggata tgtataaatg aagagtgaaa taggcacagg gaatcagatg 13620
ccagcctcgt gatgcagccg ctggttctct cggcgaagaa actgtcgtct ttgctgactt 13680
gcaaatacat cccgccttaa gcgatgagtc tataaagcac cgttgcccga gtacggtaaa 13740
agtgacccgg attgtagaac gtcctttttt tttgtttttg catcgtttat cgtcactact 13800
agtgcaatat tttgattgta aggctgaaag agtatcgtta tgatgcttag aacgtggaga 13860
ttattacaga tggtactgct tgccgcgtac tgttattatg tttttgcgac ttgttcaatc 13920
agcacgacga ctgctcctgt ggaatggaag tctcccgacc gtcagattcc caagaatatt 13980
acctgcgcta attactcagg gaccgtcaac ggcaacgtta catttcgagg tcttcagaac 14040
aaaacggaag actttttgta ctggttgtta ggatggggtc ataagtccat ttgttcgttc 14100
ttcccgaaac tccagggtaa ctatgacgaa caacattaca gatatgaagt agcgaacctg 14160
acgtataact gcacctataa ccgcttgacg ttgctgaatc tgacgacgga aaacagcgga 14220
aagtactatt tcaaaaggga agatgcgaat ttcaccttct attactcttg ttacaacttg 14280
accgtgtcct aaagatcgca cgtgaagttt cacagagccg cgtggctgta gctattgtgt 14340
ttacgttgct tttgaaatgt taagcgtccc tacggcgcta acatgtttct aggctactct 14400
gactgtgtag atcccggcct tgctgtgtat cgtgtatcta gatcacgctt aaagctcatg 14460
ttgtcttttg tgtggttggt cggtttgcgt ttctatgatt gtgccgcgtt cgagtcctgc 14520
tgttacgaca tcaccgaggc ggagagtaac aaggctatat caagggacga agcagcattc 14580
acctccagcg tgagcacccg tacaccgtcc ctggcgatcg cgcctcctcc tgaccgatcg 14640
atgctgttgt cgcgagagga agaactcgtt ccgtggagtc gtctcatcat cactaagcag 14700
ttctacggag gcctgatttt ccacaccacc tgggtcaccg gcttcgtcct gctaggactc 14760
ttgacgcttt tcgccagcct gtttcgcgta ccgcaatcca tctgtcgttt ctgcatagac 14820
cgtctccggg acatcgcccg tcctctgaaa taccgctatc aacgtcttgt cgctaccgtg 14880
tagctagtta gccagctgtg tgtagtgttt tgcttttgca tatttgtttt cagtcagaga 14940
gtctgaaacg gggtgggagg gacttttgcg ggtagtgcat gctaagatga acgggtgggc 15000
tggggtgtgc ttgataactc actgtttgaa tacgcgctca cgcacatatg tagcactcaa 15060
catgttagct tttgcccgca cgccccgggg cgtgccgagc tgccttttta ataaagtctg 15120
ggtttccaga tacgcgctgg ttctgatttt gatggtttgt gcctctgaaa gctctacgag 15180
ctgggccgtg acatccaatg gactgcctaa ctgtagcacg gtaactagaa cagcgggtca 15240
agacgctgaa ttgcacggtc cggcaccgtt aagctgtaat gtgacccagt ggggacgtta 15300
cgagaatgga agcacacccg tgttatggtg cactttacgg ggatcaagca tgcgagtctc 15360
attaggacac cgtgtagcgt ttggctgttc ttggaaaaca ttttttattt ataacgtttc 15420
tgaaagtagc ggtggcactt actatcaaaa aggttacaac tgcaccgaca aacatataac 15480
actatcttgt ttcaacttaa cggtggttcc tcgagcggtt caaagcacaa ccaccgtaat 15540
gacacccacg ctggttacaa actccacatt cagtgtgtca cttgttccgt tgagactgac 15600
gacaaattcc agcgcgtttg gacacgctat ttatcaacga caacagcgtg ttgaaaacgg 15660
gacgttatcc aagaacataa ctaacttggc attcacctat ggcagctggg gcgttgcgat 15720
gctgctgttt gccgccgtga tggtgctcgt tgatttgggt ttgcctcaat cggcttggcg 15780
acgctggcga agccacgtgg acgatgaaga acgtggtttg ttaatgtagg aaataaaagg 15840
cagtttgagc atgactgttt ccaaaccgta acgtggtaaa taaatcatgg cttccgacgt 15900
gggttctcat cctctgacgg ttacacgatt tcgctgcaga gtgcattatg tgtacaataa 15960
actgttgatt ttaactttgt ttgcccccgt gattctggaa tccgtcatct acgtgtccgg 16020
gccacaggga gggaacgtta ccctggtatc caacttcact tcaaacatca gcgcacggtg 16080
gttccgctgg gacggcaacg atagccatct catttgcttt tacaaacgtg gagagggtct 16140
ttctacgccc tatgtgggtt taagcctaag ttgtgcggct aaccaaatca ccatcttcaa 16200
cctcacgttg aacgactccg gtcgttacgg agcagaaggt tttacgagaa gcggcgaaaa 16260
tgaaacgttc ctgtggtata atttgaccgt gaaacccaaa cctttggaaa ctactccagc 16320
tagtaacgta acaaccatcg tcacgacgac atcgacgatg atcgacgcga aaagtaacgt 16380
tacagggaac gccagtttag caccacaatt acgtgccgtc gctggattct ccaatcagac 16440
gcctttggaa aacaacacgc acctggcctt ggtaggtgtt gttgtgtttt tagttctgat 16500
agttgtttgc attatggggt ggtggaaatt gttgtgtggt aaaccagagt tatagtaatg 16560
tgctttttat cagggagaag gttttgtgcc aacaatgact agcccgggac tatctgcgtc 16620
agaaaattat gacggaaatt atgaattcac ggaaaccgcc aatacaacgc gtacaaatag 16680
aagtgactgg acaacgttag aaaccagtgc attgctattg aaaaacacgg agactgcagt 16740
gaacctcagc aacgcgacta cggtcatccc acaacctgta gaatacccgg ctggggaagt 16800
acaatatcaa agaacggcaa cgcattattc ttggatgcta atcattgtca tcattctcat 16860
catttttatt atcatctgtc tacgagcacc tcgaaaaatc taccatcact ggaaagacag 16920
taaacagtac ggacaagtgt ttatgacaga cacggaactg tgacagtgat gtctaagcgt 16980
ttgcaggtat ttccatggat aacaatttta ttttacacat caaaatccca gtattggaac 17040
tatatggcaa taccatgtac ccctacagtt ggatacggca gtcataatat tagcttgcat 17100
ccgcttaata actcattatt tcaagacgat gtttttgaat ggtacataga caaaccaatg 17160
gttacaagtt atgtctttat caaagtaatg aacgcacaaa atccaatcta gactctccaa 17220
atattgtgtg gcaatgcaca gataatcgta cactaattct catgaactta accacaacat 17280
acagtagaaa ctattatttt caatccttta aatatctcgg acgaggagta ccaaaaccga 17340
ataacttgtg ttataacgtt agtgtacact ttacccacca aacacattgc catacaacta 17400
catcatccct gtatccacct acatctgtac acgattcatt agaaatatca cagtcattca 17460
cctcaaccaa cttcacacat accgcggtcc actacgccac cggtaacgtt gaagcacaac 17520
acgacactac cactccacat acaatgtgga tcatacccct agttatcgtt ataacaatca 17580
tcgttttaac ttgtttcaaa ttcccccaga aagcttggaa taaattcaca caatacagat 17640
acagcggtat gctcgccgcc gcttaaagaa tcaacgccaa ggaaaccaaa acgtaaaaag 17700
aatagatatg tacgtttatt tttcagctca ctgtttgaat accgtaaaca taatgacgta 17760
catatacgtg gttatacaac aggtgtttgt gttatgcggc gactgattaa ccatatcgtg 17820
aaccatgatc ttttccgatg gtccgtcgtg accgcaatga tattttacag atattccgaa 17880
acctgtatgg aggtcactgt cagagtaggt gatccagtta ccctcggtag tggacatggt 17940
tatcatccag gtagggataa cagggtaatg atcctctaga gtcgacctgc aggcatgcaa 18000
gcttgagtat tctatagtct cacctaaata gcttgg 18036
<210> 12
<211> 2310
<212> DNA
<213> LKA1 gp49序列
<400> 12
atggcgcaaa cacccagtac atgggccgac tacgtaggcg acggcgtaga ggatacgttc 60
caagtcacat tcccgtacca gaagcagcaa gaggtgtttg tgactgtggg cggcgatccg 120
gcagctttca cattcatctc ggcaggttgg attcaactgg cagcggtccc ggtaaatggg 180
gccgcaatcc gtgtacggcg cagcactgag gcattcgagc ctcggcacga gttcgccaac 240
ggcgtgccat tactgccgcg attcatagac gagaataata cccagttctt gtacactgta 300
caagaggcag tgaatgagac acatggcatt gcttccgaag cgctgagtgt cgcagaggag 360
gccagaggca ttgcgcaggc ggcatcggat aaagtggatg ctgccaccat tgactccgca 420
caccagttgc gtctagacct cgccgacccg gcgaaggggc ctgggctgct aggctacgac 480
cgagacgtaa gttatccggt cgggtcggtc ggtcaaagcc tacagtttct ggaaatgggt 540
cgggtcacac cagcgcaatt tggcgccgtt ggtgatggcg ccagccaccc cctctctgag 600
cgatacgcaa ctctagcgga agctcagact gtctatccgc atgcagtcgc actctccgac 660
gaaatagact gggccgcatt gcaagctgcc gtggattcag gggcacctgt acacataccg 720
tctggggact atcagataaa tagggggatt agcagtacgg gctctctaca gattgcgggt 780
gatggcgcta catctattat acgcccgact gctgcgttca ctggtacatc ggtcctcagt 840
tgtgtgggga gcttagttgc cttgccgaat atatcctccg tgtcggctgg gtccctaacc 900
attgactttg ccagcacccc taatcttgta gcgggggatg tattcatcat ctacaacccg 960
actgatagca gcttctcggg atttcggacg agctatcgcg caggagagtt ctgtgaggtc 1020
agggcggttt ctgggaacac cgtgacaatc cgttccgcac tctatgccgc atacgacggg 1080
gctactgttg ctatttacaa agtagtctct ggtgtagttg atatagctag catccaaatc 1140
gttggcggga cagtcccaat gaatggactg ttagtggagg ctgtcgtttc accgcgcgtc 1200
gatgacgtga cggtcaccct tgcaaacaac gccggtgtgt attttgcccg ctgctatgac 1260
gctaagatca caaacagtaa tatatcgaac atcggcgacg gtggcgatga ctatggaatc 1320
atctttggga actgtcacga cggtggggca gacaactgta aagtctacgc taggcgacat 1380
gccatcgcca cgggcggcga tgcagaagta ggctgcgttc cggtccgtaa tgtgcgtatg 1440
cgtaactgca cacttaggaa tgatattacc tctggtacac actgcgcaga cttccacggt 1500
aacgccgagg attgcagcta cgaaaactgc acaatctacg gtggtgcaac ttggcagggg 1560
aaggatatca gctacagaca ctgtacaatc actaacgcgt cgggtggttg gattgttata 1620
tccgctgaga ttcttggtgg tacattcctt ctcgaccaat gcacattgta cacaaccggc 1680
gatccgcagc ctggtaaccg tggggttata gatgtaggtg ggaactccgc agtcctcact 1740
acaaatacaa cgcaaccctg taacttcctt atacaaggcg gcagtctgcg agcgcccagc 1800
ttaagtacgt ctagttacct actgcgcgca cgtcttgagg gtagtacagt tccagtaaac 1860
atacagtaca gcggacaggc tattgatgta ggctctctgg gcaaggtact acaactcgat 1920
attacctcgg gcagtacctc tcctgagtat ttgatcgtgg agaatttagc ggggttgcca 1980
tctggcatca cgctggcgtc tgctgctggt ggtttcgcaa gtgccccgat gcgtatgcct 2040
gtgctgggtg gtagggttca agtaactacg gcaaccaacg cgagtagcgt tactgctcca 2100
gtaacgttca ggtacattta tcctaaggcc ccaaccgtcc aggtcacaaa gacggacagg 2160
agctacgccg gtaacagggt cggcgttgct atcgccaatc cgacctctgc gtctggggcg 2220
acgttgggtc tgttcacgga cgacgggaca aactttagct cagccgttac taaccagttg 2280
aactggcagg caggtattta tgaggtgtaa 2310
<210> 13
<211> 1956
<212> DNA
<213> Phikmv样病毒NTUH-K2044-K1-1
<220>
<221> misc_feature
<223> NTUH-K2044-K1-1 gp34
<400> 13
atggccctga tccggctcgt ggcgcccgag cgcgtgttca gcgacctggc cagcatggtc 60
gcctatccga acttccaggt gcaggacaag atcaccctgc tgggctcggc cggcggcgac 120
ttcaccttca ccaccaccgc gtcggtggtg gacaacggca ccgtgttcgc cgtgcccggc 180
ggctatctcc tgcggaagtt cgtcggcccg gcgtatagct cgtggttcag caactggacc 240
gggatcgtca cgttcatgag cgcgccgaac cggcacctgg tggtggacac cgtgctgcag 300
gccacgagcg tgctgaacat caagagcaac agcacgctgg aattcacgga cacgggccgc 360
atcctgcccg acgccgccgt ggcccgccag gtgctgaaca tcaccggctc cgcgccctcg 420
gtgttcgtgc ccctcgccgc cgacgccgcc gcggggtcga aggtgatcac cgtggccgcc 480
ggcgcgctgt ccgcggtgaa aggcacctac ctctatctgc gctccaacaa gctgtgcgac 540
ggcgggccga acacctatgg cgtcaagatc agccaaatcc gtaaggtggt cggcgtgagc 600
accagcgggg gcgtgacgtc catccgcctc gacaaagccc tgcactataa ctactacctc 660
tcggatgccg ccgaagtggg catcccgacc atggtggaga acgtcaccct ggtgagcccg 720
tacatcaacg agttcggcta cgacgacctg aaccgcttct tcaccagcgg catctccgcg 780
aacttcgcgg ccgacctgca catccaggac ggcgtcatca tcggcaacaa gcgtccgggc 840
gcctccgaca tcgagggccg cagcgccatc aagttcaaca actgcgtgga tagcaccgtg 900
aagggcacct gcttctataa tatcggctgg tacggcgtgg aggtcctcgg ctgctcggag 960
gacaccgagg tgcacgacat ccacgccatg gacgtgcgcc atgccatctc cctgaactgg 1020
caaagcaccg ccgacggcga taagtggggc gaaccgatcg agttcctggg cgtgaactgt 1080
gaggcgtaca gcaccaccca ggccggcttc gacacccacg acatcgggaa gcgtgtcaaa 1140
ttcgtccgct gcgtgtccta cgacagcgcg gatgacggct tccaggcccg caccaacggc 1200
gtggagtacc tcaactgccg cgcctaccgc gccgccatgg acggcttcgc ctcgaacacg 1260
ggcgtcgcct tcccgatcta ccgcgaatgc ctggcctacg acaacgtgcg cagcgggttc 1320
aactgcagct acggcggcgg gtatgtgtac gactgcgagg cgcacggcag ccagaacggc 1380
gtccgcatca acggcggccg ggtcaaaggc gggcgctaca cccgcaactc gtcgagccac 1440
atcttcgtga cgaaagatgt ggcggaaacc gcccaaacca gcctcgagat cgacggcgtc 1500
tccatgcggt acgacggcac cggccgcgcc gtgtacttcc acggcaccgt gggcatcgat 1560
ccgacgctcg tgagcatgtc caacaacgac atgaccggcc acggcctgtt ctgggccctg 1620
ctgtccggct ataccgtgca gccgaccccg ccgcgcatgt cgcgcaacct gctcgacgat 1680
accggcatcc gcggcgtcgc gaccctggtc gcgggcgaag cgaccgtcaa tgcccgcgtc 1740
cgcgggaact tcggcagcgt ggccaacagc ttcaagtggg tgtcggaggt gaagctgacg 1800
cgcctcacgt tcccgtcgtc ggccggcgcc ctcacggtca ccagcgtcgc ccaaaaccag 1860
gacgtgccga cccccaaccc ggacctgaac agcttcgtca tccgcagcag caacgccgcc 1920
gacgtgtccc aagtcgcctg ggaggtctac ctgtga 1956
<210> 14
<211> 2184
<212> DNA
<213> T7-样Pp15
<220>
<221> misc_feature
<223> 添加的Pp15 gp44序列
<400> 14
atggcacgaa ctatcgtcca gaacgcccta acaggcggac aacaggactt cgaggtacct 60
ttcgactaca tcttgcagcg cttcgttaag cttaccctga tcggtgacgg taaccgacaa 120
gagctggtcc tcggtaccga cttccggttc atcggtcctc gcaccgttcg cactaacgtc 180
ttctggggac cagcgcaggg gtatacctcc atcgagatcc gacgagttac cagcgcttct 240
gatcgtcgcg tagagttctc ggacgggtcc atcctgaccg caggtgatct gaacatcgcc 300
cagcttcagg ccatccacat tgccgaagaa gcgcgagact ctgccactga gaacctgagc 360
ccagatgctg atggcaacta cgatgcacgt ggtgcgcgca tttacaacct cggtgacgct 420
gttcagccga aggatgcggt caaccggtac actcttgacc tcgctatcgc agccgctctg 480
gccatgaata ccggcaaccc gaacaacgcc cagaacatct cgtacacccc taacgggcct 540
ggtcagtcga tccgaagtgt tgaaggccgt ctgcgggatg ctgtgttcgt ctcggactac 600
atgaccactc cacgtgatgg agttaccagt aaccagcagg acctcgaaaa ggcactcgct 660
gcggcgaacg ctaaaggtgc cgacctattc tggcctgacg acatcccgtt cttctccacg 720
tccccgctgg cactgatcca cgcggtctac catgttggac gtggtgtcat caacgcgaac 780
ggtacgctgt tctacgtgaa cccgaagaac ggccaacaca acaggctaca cgtgtctccc 840
gggggcaccg gggatggtct ggcagctggc cgcccactgg ggaccatctg gagtgcactc 900
gcggccctta acatgcgagc cccactgacc acgcgctggt ccttggagat gaccgctggc 960
gcctataatg aagccgttac acttccgaac tacctgacca gctgtaacga ctacttggcg 1020
tttaactggc cgaacaccgg tcaggaacgt atggagccca ctgcgtaccc atcagctctc 1080
gacggcacag gccagaccgg cctcacaggt ttccacactg gcatcggcaa ccgcattacc 1140
atcaacaacg tgtgcatgtc caactggtac gacactgcgc tgactcctac ccaacaggtg 1200
cgaagagcgt tcgttgtagg tgcgtattcg actgcctacg tggtcaactg cgcgttcatt 1260
tacaacggca tcgcgagcgt gtctgtgctg cccggtggca ctgctatcgt aaccggtggc 1320
atcgtcgatg gtgggcggtt cggcctcgac aacactggcg gtcgcctgtc cctgacggca 1380
accaagagca attatacgca ggtccggaac tgcctcgaat atggactgta ctcgaagcat 1440
gacgcatcga ccgtaatgga caacaccgag ttccgcaact gcggtaatca ccctgcggct 1500
gttgcgtatg gtgctgcaat cttcgcgtac aagttcaact gttctgttga cactcgtggg 1560
gtcaagttct acggcaacaa catcgcccag cactgccgtg gcggtatcac ctcggacaat 1620
ccgggcgatc cggacatcta cggtaccggc gcagatgcta ataagcgtct attcctgtgc 1680
accggtggtg gctctgacga catccagttc tacgaagctc ggcgcgtcat ggacatcacg 1740
aagcgcactg gtggcggctc aactactgcc agcgtatcgt cgctgctact ggctgccgtt 1800
gcgtctgtcc gtaagggcta ctttgcgcac aacgatcagg tgatccggat gaccctgatg 1860
ttccgcgcta caggctcggc tggcatcttc acgccgacct tgcgcacacc tctggggact 1920
atccctctgg gtagcttcag ggtcgcatcg ggacagtacg gcgagatcaa gttgaccatt 1980
cgacctactc tgacatctga tggtctcata gtcgggttct cctgcatcaa cgccgtgcag 2040
aatcttgggt cctctgttgg tcaaatcatc gtcagcggca ccgtagacct ccgcaccgtc 2100
gaccagctgg tcgagatgtg gggctattcg gaagctggtg gcaccgcttc gtacattcaa 2160
ggcctgatcg agctggtcgg gtga 2184
<210> 15
<211> 1089
<212> DNA
<213> 伴放线菌聚集菌
<220>
<221> misc_feature
<223> 添加的dspB序列
<400> 15
atgaactgtt gcgtcaaggg caattccatc tacccccaga agacctccac caagcagacc 60
ggcctgatgc tcgatatcgc ccggcatttc tacagccccg aggtgatcaa gagcttcatc 120
gatacgatca gcctgagcgg cggcaacttc ctccacctgc acttctcgga ccatgaaaac 180
tatgccatcg agtcgcacct gctcaaccag cgggcggaga acgccgtcca ggggaaggat 240
ggcatctaca tcaatccgta caccgggaaa ccgttcctga gctaccgcca gctggacgac 300
atcaaggcct acgccaaggc caagggcatc gaactgatcc cggagctgga cagcccgaac 360
catatgacgg ccatcttcaa actggtccag aaggaccgcg gcgtcaagta cctgcagggg 420
ctgaaatccc gccaggtgga cgacgagatc gacatcacca acgccgatag catcaccttc 480
atgcagagcc tgatgagcga ggtcatcgat atcttcggcg acacgagcca gcacttccac 540
atcggcggcg acgaattcgg ctactccgtc gagagcaacc acgagttcat cacctacgcc 600
aacaagctgt cgtacttcct ggagaagaag gggctcaaga cccgcatgtg gaacgacggc 660
ctcatcaaga acaccttcga gcagatcaat cccaacatcg aaatcacgta ctggtcgtac 720
gacggcgaca cccaggataa gaacgaagcg gccgagcgcc gcgacatgcg cgtgagcctg 780
ccggagctgc tggcgaaggg cttcaccgtg ctgaactaca acagctacta cctctacatc 840
gtgccgaagg cgagcccgac gttctcgcag gacgccgcct tcgccgccaa agacgtgatc 900
aagaactggg atctgggcgt ctgggatggc cggaacacca agaaccgcgt gcagaacacc 960
catgagatcg ccggggcggc gctgtcgatc tggggcgagg atgcgaaggc gctcaaggac 1020
gagacgatcc agaagaacac caaaagcctg ctcgaggccg tcatccacaa gaccaacggc 1080
gacgagtga 1089
<210> 16
<211> 69
<212> DNA
<213> 金黄色葡萄球菌
<220>
<221> misc_feature
<223> 添加的SaPSMa3序列
<400> 16
atggagttcg tggcgaagct cttcaagttc ttcaaggacc tgctcgggaa gttcctgggg 60
aataactga 69
<210> 17
<211> 135
<212> DNA
<213> 金黄色葡萄球菌
<220>
<221> misc_feature
<223> 添加的SaPAMb2序列
<400> 17
atgaccggcc tggccgaggc gatcgcgaat accgtccagg cggcccagca gcacgacagc 60
gtcaagctgg gcacctcgat cgtggacatc gtcgccaacg gcgtgggcct gctgggcaaa 120
ctcttcggct tctga 135
<210> 18
<211> 69
<212> DNA
<213> 表皮葡萄球菌
<220>
<221> misc_feature
<223> 添加的SePSMa序列
<400> 18
atggcggacg tcatcgccaa gatcgtcgag atcgtgaagg gcctgatcga ccagttcacc 60
cagaagtga 69
<210> 19
<211> 228
<212> DNA
<213> 轻小病毒MS2
<220>
<221> misc_feature
<223> 添加的MS2 L序列
<400> 19
atggagaccc ggttcccgca gcagtcccag caaaccccgg ccagcaccaa ccgccgccgc 60
cccttcaagc acgaggacta cccgtgccgc cggcagcagc gcagctccac cctgtacgtg 120
ctgatcttcc tggcgatctt cctgagcaag ttcaccaacc agctgctgct gtccctgctg 180
gaggcggtca tccggaccgt caccaccctg cagcagctgc tgacctga 228
<210> 20
<211> 165
<212> DNA
<213> 轻小病毒PRR1
<220>
<221> misc_feature
<223> 添加的PRR1 L序列
<400> 20
atgtgcaagg tgtctactaa ggtagactct aaactgactg agtcagttgg acaactcacc 60
ataaggagct acctatggct acggaatatc ctagcattag caggacttct tttcgtaatc 120
cttcttgcga ccaatcattt atccatcgct atctacagtc cgtaa 165
<210> 21
<211> 52
<212> DNA
<213> Phikmv样病毒LUZ19
<220>
<221> misc_feature
<223> LUZ19 gp32启动子(P32)
<400> 21
cgaccctgcc ctactccggc cttaaaccca catccaaaag agagagaatc gc 52
<210> 22
<211> 96
<212> DNA
<213> Phikmv样病毒LUZ19
<220>
<221> misc_feature
<223> LUZ19 gp32终止子(T32)
<400> 22
tgccacgaaa ccccgcactt cggtgtgggg tttcttcaaa gcctaacgac ccgcgcagat 60
tccctgcgtg ggtttttgcg ctttaggaga aaccct 96
<210> 23
<211> 204
<212> DNA
<213> Phikmv样病毒LUZ19
<220>
<221> misc_feature
<223> 野生型LUZ19 gp7区域
<400> 23
tacaaggtgg tggcacccag ctcggcggaa ggtatcattg tgctggcgac caagcagacg 60
ccggcgctag cccaagcagc cgtcgtactg cacagcatga accctgcgca gtatcccgca 120
ggttcggcta tcctcaacac ggcctggaag tgccgccgcc tgggagtggg cgagtacgtc 180
aagctcgtcc aaggggagga ggac 204
<210> 24
<211> 321
<212> DNA
<213> Phikmv样病毒LUZ19
<220>
<221> misc_feature
<223> 野生型LUZ19 gp18区域
<400> 24
gaatgccaac cgaagaagaa cgcatgatcc gctgtttact ggcggatatc cacgagccac 60
tggacctgct gttccccggc ctccgtacca aggcccatat ggacccgcaa gcagaggaac 120
tgtcgattcg aattgactac gaccatgcga agctgggccg tatgggattc tgccacgcgg 180
tatccctata tcaactgtcc atatatggcc gcgaggggat ggtccgctac ctgatgcagg 240
agattccccg ccgcgtgctg gaaggtctgc tggtcaaggc gcagcagtac agccaaagca 300
actggtacag caaatgacga c 321
<210> 25
<211> 225
<212> DNA
<213> Phikmv样病毒LKD16
<220>
<221> misc_feature
<223> 野生型LUZ19 gp49和gp48-gp49基因间区域
<400> 25
ggggacacca tgagcaaagc caaactacga gtcatcgccg acaccccgga gctggagtca 60
gtgctaaaag cattgctgac cgccacctac gctatcgagg acctgctcaa cgaggccgtg 120
gctagcaagg tgctaaactc ccgcctgggc tggtccgcag tcggcgagta tgtcgaactg 180
ttcaaccgca cgcaatcccg cgtggccggg ttgattcccg agtag 225
<210> 26
<211> 345
<212> DNA
<213> Phikmv样病毒LKD16
<220>
<221> misc_feature
<223> 野生型LKD16 gp18基因
<400> 26
gtgcgagtac caactgaaca cgagcgcacc ctgcgctgcc tgctccaaga catccacggg 60
ccgctgaatc tgctgttccc aggtatccgg gtgaaggtgg aggaggcgtg cctcggatac 120
ttgggctaca gggagcgggg ctattgggag ctgcgcctcc aggtggacta cgaccacccg 180
aagcttgggc acctccgcta cagtcaggcc gtgccggagt acgtgctgat caacgaccgc 240
gacagcatca tcaagtacct gatggaagca gtccctcggc aggtactaga gggcatgctc 300
aataaggccc aggaattcgt aaccaagaac tggtattccc tatga 345
<210> 27
<211> 4269
<212> DNA
<213> 人工序列
<220>
<223> 编码NLS-FLAG-CAS9-His的基因
<400> 27
atgcccaaga aaaagcggaa ggtcggcgac tacaaggatg acgatgacaa gttggagcct 60
ggagagaagc cctacaaatg ccctgagtgc ggaaagagct tcagccaatc tggagccttg 120
acccggcatc aacgaacgca tacacgagac aagaagtact ccatcgggct ggacatcggg 180
acgaactccg tgggatgggc cgtgatcaca gacgaataca aggtgccttc caagaagttc 240
aaggtgctgg ggaacacgga cagacactcc atcaagaaga acctcatcgg ggccttgctc 300
ttcgactccg gagaaaccgc cgaagcaacg cgattgaaaa gaaccgccag aagacgatac 360
acacgacgga agaaccgcat ctgctacctc caggagatct tcagcaacga gatggccaag 420
gtggacgact cgttctttca tcgcctggag gagagcttcc tggtggagga agacaagaaa 480
catgagcgcc acccgatctt cgggaacatc gtggacgaag tggcctacca cgagaaatac 540
cccacgatct accacttgcg caagaaactc gtggactcca cggacaaagc ggacttgcgg 600
ttgatctact tggccttggc ccacatgatc aaatttcggg gccacttcct gatcgagggc 660
gacttgaatc ccgacaattc cgacgtggac aagctcttca tccagctggt gcagacctac 720
aaccagctct tcgaggagaa ccccatcaat gcctccggag tggacgccaa agccatcttg 780
tccgcccgat tgtccaaatc cagacgcttg gagaacttga tcgcacaact tcctggcgag 840
aagaagaacg gcctcttcgg caacttgatc gcgctgtcgc tgggattgac gcctaacttc 900
aagtccaact tcgacttggc cgaggacgcc aagttgcaac tgtccaagga cacctacgac 960
gacgacctcg acaacctgct ggcccaaatt ggcgaccaat acgcggactt gtttttggcg 1020
gccaagaact tgagcgacgc catcttgttg agcgacatct tgcgcgtgaa tacggagatc 1080
accaaagccc ctttgtccgc ctctatgatc aagcggtacg acgagcacca ccaagacttg 1140
accctgttga aagccctcgt gcggcaacaa ttgcccgaga agtacaagga gatcttcttc 1200
gaccagtcca agaacgggta cgccggctac atcgacggag gagcctccca agaagagttc 1260
tacaagttca tcaagcccat cctggagaag atggacggca ccgaggagtt gctcgtgaag 1320
ctgaaccgcg aagacttgtt gcgaaaacag cggacgttcg acaatggcag catcccccac 1380
caaatccatt tgggagagtt gcacgccatc ttgcgacggc aagaggactt ctacccgttc 1440
ctgaaggaca accgcgagaa aatcgagaag atcctgacgt tcagaatccc ctactacgtg 1500
ggacccttgg cccgaggcaa ttcccggttt gcatggatga cgcgcaaaag cgaagagacg 1560
atcaccccct ggaacttcga agaagtggtc gacaaaggag catccgcaca gagcttcatc 1620
gagcgaatga cgaacttcga caagaacctg cccaacgaga aggtgttgcc caagcattcg 1680
ctgctgtacg agtacttcac ggtgtacaac gagctgacca aggtgaagta cgtgaccgag 1740
ggcatgcgca aacccgcgtt cctgtcggga gagcaaaaga aggccattgt ggacctgctg 1800
ttcaagacca accggaaggt gaccgtgaaa cagctgaaag aggactactt caagaagatc 1860
gagtgcttcg actccgtgga gatctccggc gtggaggacc gattcaatgc ctccttggga 1920
acctaccatg acctcctgaa gatcatcaag gacaaggact tcctggacaa cgaggagaac 1980
gaggacatcc tggaggacat cgtgctgacc ctgaccctgt tcgaggaccg agagatgatc 2040
gaggaacggt tgaaaacgta cgcccacttg ttcgacgaca aggtgatgaa gcagctgaaa 2100
cgccgccgct acaccggatg gggacgattg agccgcaaac tgattaatgg aattcgcgac 2160
aagcaatccg gaaagaccat cctggacttc ctgaagtccg acgggttcgc caaccgcaac 2220
ttcatgcagc tcatccacga cgactccttg accttcaagg aggacatcca gaaggcccaa 2280
gtgtccggac aaggagactc cttgcacgag cacatcgcca atttggccgg atcccccgca 2340
atcaaaaaag gcatcttgca aaccgtgaaa gtggtcgacg aactggtgaa ggtgatggga 2400
cggcacaagc ccgagaacat cgtgatcgaa atggcccgcg agaaccaaac cacccaaaaa 2460
ggacagaaga actcccgaga gcgcatgaag cggatcgaag agggcatcaa ggagttgggc 2520
tcccagatcc tgaaggagca tcccgtggag aatacccaat tgcaaaacga gaagctctac 2580
ctctactacc tccagaacgg gcgggacatg tacgtcgacc aagagctgga catcaaccgc 2640
ctctccgact acgatgtgga tcatattgtg ccccagagct tcctcaagga cgacagcatc 2700
gacaacaagg tcctgacgcg cagcgacaag aaccggggca agtctgacaa tgtgccttcc 2760
gaagaagtcg tgaagaagat gaagaactac tggcggcagc tgctcaacgc caagctcatc 2820
acccaacgga agttcgacaa cctgaccaag gccgagagag gaggattgtc cgagttggac 2880
aaagccggct tcattaaacg ccaactcgtg gagacccgcc agatcacgaa gcacgtggcc 2940
caaatcttgg actcccggat gaacacgaaa tacgacgaga atgacaagct gatccgcgag 3000
gtgaaggtga tcacgctgaa gtccaagctg gtgagcgact tccggaagga cttccagttc 3060
tacaaggtgc gggagatcaa caactaccat cacgcccatg acgcctacct gaacgccgtg 3120
gtcggaaccg ccctgatcaa gaaatacccc aagctggagt ccgaattcgt gtacggagat 3180
tacaaggtct acgacgtgcg gaagatgatc gcgaagtccg agcaggagat cggcaaagcc 3240
accgccaagt acttctttta ctccaacatc atgaacttct tcaagaccga gatcacgctc 3300
gccaacggcg agatccgcaa gcgccccctg atcgagacca acggcgagac gggagagatt 3360
gtgtgggaca aaggaagaga ttttgccaca gtgcgcaagg tgctgtccat gcctcaggtg 3420
aacatcgtga agaagaccga ggtgcaaaca ggagggtttt ccaaagagtc cattttgcct 3480
aagaggaatt ccgacaagct catcgcccgc aagaaggact gggaccccaa gaagtacggg 3540
ggcttcgact cccccacggt ggcctactcc gtgttggtgg tggccaaagt ggagaaaggg 3600
aagagcaaga agctgaaatc cgtgaaggag ttgctcggaa tcacgatcat ggaacgatcg 3660
tcgttcgaga aaaaccccat cgacttcctc gaagccaaag ggtacaaaga ggtgaagaag 3720
gacctgatca tcaagctgcc caagtactcc ctgttcgagc tggagaacgg ccgcaagcgg 3780
atgctggcct ccgccgggga actgcagaaa gggaacgaat tggccttgcc ctccaaatac 3840
gtgaacttcc tctacttggc ctcccattac gaaaagctca aaggatcccc tgaggacaat 3900
gagcagaagc aactcttcgt ggaacaacac aagcactacc tggacgagat catcgagcag 3960
atcagcgagt tctccaagcg cgtgatcctc gccgacgcca acctggacaa ggtgctctcc 4020
gcctacaaca agcaccgcga caagcctatc cgcgagcaag ccgagaatat cattcacctg 4080
tttaccctga cgaatttggg agcccctgcc gcctttaaat actttgacac caccatcgac 4140
cgcaaaagat acacctccac caaggaagtc ttggacgcca ccctcatcca ccagtccatc 4200
acgggcctct acgagacgcg catcgacctc tcccaattgg gcggcgacca tcatcaccac 4260
caccactaa 4269
<210> 28
<211> 507
<212> DNA
<213> 丝状病毒M13MP18
<220>
<221> misc_feature
<223> 替换的野生型M13MP18区域
<400> 28
atgaccatga ttacgaattc gagctcggta cccggggatc ctctagagtc gacctgcagg 60
catgcaagct tggcactggc cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt 120
acccaactta atcgccttgc agcacatccc cctttcgcca gctggcgtaa tagcgaagag 180
gcccgcaccg atcgcccttc ccaacagttg cgcagcctga atggcgaatg gcgctttgcc 240
tggtttccgg caccagaagc ggtgccggaa agctggctgg agtgcgatct tcctgaggcc 300
gatacggtcg tcgtcccctc aaactggcag atgcacggtt acgatgcgcc catctacacc 360
aacgtaacct atcccattac ggtcaatccg ccgtttgttc ccacggagaa tccgacgggt 420
tgttactcgc tcacatttaa tgttgatgaa agctggctac aggaaggcca gacgcgaatt 480
atttttgatg gcgttcctat tggttaa 507
<210> 29
<211> 792
<212> DNA
<213> 人工序列
<220>
<223> 未知的
<220>
<221> misc_feature
<223> Paprika序列
<220>
<221> misc_feature
<223> 从DNA2.0商购可得的
<400> 29
atggtgtcaa agggagaaga actgatcaaa gagaatatga ggatgaaact ctacatggaa 60
ggaactgtga acaaccacca tttcaagtgc acgagcgagg gtgaagggaa accttacgaa 120
ggtacccaga ccatgcggat taaggtcgtc gaaggaggac cactcccctt cgcattcgac 180
atcctggcca cttccttcat gtacgggtcg cgcactttca tcaagtaccc aaaagggatc 240
cccgacttct tcaagcagtc ctttccggag ggattcactt gggaacgcgt cactagatac 300
gaggatggcg gagtggtcac cgtgatgcaa gacacctctt tggaagatgg atgcctggtg 360
taccacgtgc aagtcagagg agtgaacttt ccgagcaatg ggccggtgat gcagaagaaa 420
accaagggct gggaaccgaa caccgaaatg ctgtatccag cagacggagg cttggagggc 480
cggtccgaca tggctctgaa gcttgttgga ggaggacatc tgtcctgctc gttcgtgacg 540
acctaccgga gcaagaagcc ggcgaaaaac cttaagatgc cggggatcca cgcggtggat 600
catcgcctgg aaaggctcga ggagtcagac aacgagatgt ttgtcgtgca acgcgagcac 660
gccgtggccc gctactgtga tctcccttca aagctgggcc acaagctgaa ttccggcctc 720
cggtcgagag cccaggcttc gaattcagcc gtggacggaa ctgcgggccc tggttcgacc 780
ggaagccgat ga 792
<210> 30
<211> 294
<212> DNA
<213> λ样λ
<220>
<221> misc_feature
<223> 野生型大肠杆菌噬菌体
<400> 30
atggttcgtg caaacaaacg caacgaggct ctacgaatcg agagtgcgtt gcttaacaaa 60
atcgcaatgc ttggaactga gaagacagcg gaagctgtgg gcgttgataa gtcgcagatc 120
agcaggtgga agagggactg gattccaaag ttctcaatgc tgcttgctgt tcttgaatgg 180
ggggtcgttg acgacgacat ggctcgattg gcgcgacaag ttgctgcgat tctcaccaat 240
aaaaaacgcc cggcggcaac cgagcgttct gaacaaatcc agatggagtt ctga 294
<210> 31
<211> 1422
<212> PRT
<213> 人工序列
<220>
<223> 未知的
<220>
<221> misc_feature
<223> 从SEQ ID NO:27翻译的NLS-FLAG-CAS9-His蛋白
<400> 31
Met Pro Lys Lys Lys Arg Lys Val Gly Asp Tyr Lys Asp Asp Asp Asp
1 5 10 15
Lys Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
20 25 30
Ser Phe Ser Gln Ser Gly Ala Leu Thr Arg His Gln Arg Thr His Thr
35 40 45
Arg Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
50 55 60
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
65 70 75 80
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
85 90 95
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
100 105 110
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
115 120 125
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
130 135 140
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
145 150 155 160
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
165 170 175
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
180 185 190
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
195 200 205
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
210 215 220
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
225 230 235 240
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
245 250 255
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
260 265 270
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
275 280 285
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
290 295 300
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
305 310 315 320
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
325 330 335
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
340 345 350
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
355 360 365
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
370 375 380
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
385 390 395 400
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
405 410 415
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
420 425 430
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
435 440 445
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
450 455 460
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
465 470 475 480
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
485 490 495
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
500 505 510
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
515 520 525
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
530 535 540
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
545 550 555 560
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
565 570 575
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
580 585 590
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
595 600 605
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
610 615 620
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
625 630 635 640
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
645 650 655
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
660 665 670
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
675 680 685
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
690 695 700
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
705 710 715 720
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
725 730 735
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
740 745 750
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
755 760 765
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
770 775 780
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
785 790 795 800
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
805 810 815
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
820 825 830
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
835 840 845
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
850 855 860
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
865 870 875 880
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
885 890 895
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
900 905 910
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
915 920 925
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
930 935 940
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
945 950 955 960
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
965 970 975
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
980 985 990
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
995 1000 1005
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1010 1015 1020
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1025 1030 1035
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1040 1045 1050
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1055 1060 1065
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1070 1075 1080
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1085 1090 1095
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1100 1105 1110
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1115 1120 1125
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1130 1135 1140
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1145 1150 1155
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1160 1165 1170
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1175 1180 1185
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1190 1195 1200
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1205 1210 1215
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1220 1225 1230
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1235 1240 1245
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1250 1255 1260
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1265 1270 1275
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1280 1285 1290
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1295 1300 1305
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1310 1315 1320
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1325 1330 1335
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1340 1345 1350
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1355 1360 1365
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1370 1375 1380
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1385 1390 1395
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1400 1405 1410
Gly Gly Asp His His His His His His
1415 1420
<210> 32
<211> 909
<212> DNA
<213> 巨细胞病毒HCMV
<220>
<221> misc_feature
<223> 编辑后HCMV RL13片段
<400> 32
atggactggc gatttacggt tacgtggacg atactaatgt ccgcgttgtc agaaagctgc 60
aatcaaacct gttcttgtca atgtccctgt agtactaccg ttaactattc aactagtact 120
gagacagcca catcaacata cagtacaaca gttatcagca ataaaagcac ttcagaatct 180
ataaattgct ctactgcaac tacaccagca aacaccgttt ctacaaaacc gtcggaaaca 240
accacacaga tatccacaac gacgaacaca aacgttgaga ctaccacatg taccaacacc 300
accacgaccg ttacttgtga tggtttcaat tatacagtcc ataaaagatg cgatcgcagt 360
tacgaggtaa tcaacgtaac aggatacgtt ggtagcaaca taactctaaa aaaatgcaat 420
cagactgaga aatggcacaa tgtagactgg attcattatg agtaccccac gcataaaatg 480
tgcgaattag gcaactatca ccaaaccaca ccacggcacg acatatgttt tgactgcaac 540
gacacctccc taactatcta caacttaacc acaaaaaacg ctggaaaata taccaggcgt 600
caccgtgata acggtcaaga agaaaattac tacgtaacgg tgttaattgg agacacaacg 660
ttattcactc ttggcacatg ccctgtaaga tataaagaat ctacgaacac tgaaaacacc 720
attggaagta gcatcataga aaccattgag aaagctaaca ttcccctggg aattcatgct 780
gtatgggcag gcgtagtggt atcagtggcg cttatagcgt tgtacatggg tagccatcgc 840
attcccaaaa agccgcatta caccaaactt cccaaatatg atccagatga attttggact 900
aaggcttaa 909
<210> 33
<211> 630
<212> DNA
<213> 巨细胞病毒HCMV
<220>
<221> misc_feature
<223> 编辑前HCMV RL13片段
<400> 33
atggactggc gatttacggt tacgtggacc gttacttgtg atggtttcaa ttatacagtc 60
cataaaagat gcgatcgcag ttacgaggta atcaacgtaa caggatacgt tggtagcaac 120
ataactctaa aaaaatgcaa tcagactgag aaatggcaca atgtagactg gattcattat 180
gagtacccca cgcataaaat gtgcgaatta ggcaactatc accaaaccac accacggcac 240
gacatatgtt ttgactgcaa cgacacctcc ctaactatct acaacttaac cacaaaaaac 300
gctggaaaat ataccaggcg tcaccgtgat aacggtcaag aagaaaatta ctacgtaacg 360
gtgttaattg gagacacaac gttattcact cttggcacat gccctgtaag atataaagaa 420
tctacgaaca ctgaaaacac cattggaagt agcatcatag aaaccattga gaaagctaac 480
attcccctgg gaattcatgc tgtatgggca ggcgtagtgg tatcagtggc gcttatagcg 540
ttgtacatgg gtagccatcg cattcccaaa aagccgcatt acaccaaact tcccaaatat 600
gatccagatg aattttggac taaggcttaa 630
<210> 34
<211> 95
<212> PRT
<213> Phikmv样病毒LUZ19
<220>
<221> misc_feature
<223> 野生型LUZ19 Gp13蛋白质序列
<400> 34
Met Leu Ala Leu Gly Ala Phe Asp Leu Ser Gly Leu Met Val Gly Ser
1 5 10 15
Cys Leu Val Val Gly Gly Glu Leu Lys Ala Leu Cys Val Asp Asp Arg
20 25 30
His Ser Arg Gln Gly Ile Gly Ala Glu Leu Val Arg Ala Ala Glu Leu
35 40 45
Ala Gly Ala Glu Tyr Leu Thr Cys Phe Glu Phe Leu Glu Pro Phe Tyr
50 55 60
Ala Asp Leu Gly Trp Ser Thr Thr His Arg Glu Ala Asn Trp Thr Ala
65 70 75 80
Gly Glu Pro Asp Val Leu His Met Arg Ala Pro Gly His Asp Val
85 90 95
<210> 35
<211> 251
<212> PRT
<213> Phikmv样病毒LUZ19
<220>
<221> misc_feature
<223> 野生型LUZ19 Gp38蛋白质序列
<400> 35
Met Ala Arg Phe Lys Asn Pro Glu Thr Ile His Val Ala Asp Gly Val
1 5 10 15
Glu Ala Val Phe Ser Leu Asp Phe Pro Phe Leu Arg Arg Glu Asp Val
20 25 30
Phe Val Gln Val Asp Lys Ile Leu Val Thr Asp Tyr Thr Trp Val Asp
35 40 45
Asp Thr Asn Ile Gln Leu Ala Val Val Pro Lys Lys Asp Gln Glu Val
50 55 60
Arg Ile Phe Arg Asp Thr Pro Ala Gln Val Pro Asp Thr Gln Phe Ser
65 70 75 80
Gln Asp Ile Pro Phe Leu Pro Arg Tyr Ile Asp Ala Asn Asn Lys Gln
85 90 95
Leu Leu Tyr Ala Val Gln Glu Gly Ile Asn Thr Ala Asn Leu Ala Leu
100 105 110
Asp Gly Val Leu Asp Ala Ile Arg Ile Ala Glu Glu Ala Arg Arg Leu
115 120 125
Ala Gln Glu Ala Leu Asp Ala Ala Asn Glu Ala Leu Arg Arg Ala Leu
130 135 140
Gly Phe Ala Glu Ile Arg Thr Val Thr Glu Asp Ser Asp Ile Asp Pro
145 150 155 160
Ser Trp Arg Gly Tyr Trp Asn Arg Cys Ile Thr Ala Asp Lys Pro Leu
165 170 175
Thr Leu Thr Met Gln Met Glu Asp Pro Asp Ala Pro Trp Val Glu Phe
180 185 190
Ser Glu Val His Phe Glu Gln Ala Gly Val Arg Asp Leu Asn Ile Val
195 200 205
Ala Gly Pro Gly Val Thr Ile Asn Arg Leu Gln Asn Thr Thr Met Gln
210 215 220
Leu Tyr Gly Glu Asn Gly Val Cys Thr Leu Lys Arg Leu Gly Ala Asn
225 230 235 240
His Trp Ile Val Phe Gly Ala Met Glu Asp Glu
245 250
<210> 36
<211> 301
<212> PRT
<213> Phikmv样病毒LUZ19
<220>
<221> misc_feature
<223> 野生型LUZ19 Gp40蛋白质序列
<400> 36
Met Phe Lys Thr Glu Val Lys Gly Arg Tyr Thr Leu Ile Arg Arg Lys
1 5 10 15
Ala Asp Gly Thr Pro Val Glu Thr Leu Glu Phe Asp Asn Ile Ile Thr
20 25 30
Asn Ala Gly Leu Asp Trp Ile Ala Ala Met Asp Thr Asp Leu Met Gly
35 40 45
Glu Pro Val Ala Val Ser Thr Ser Thr Ala Asp Pro Asn Pro Ser Ala
50 55 60
Pro Ala Ile Pro Glu Val Val Gln Arg Thr Ser Ala Ser Ala Pro Gly
65 70 75 80
Gly Gly Thr Thr Ser Gly Leu Asp Gly Glu Trp Leu Phe Trp Arg Arg
85 90 95
Arg Trp Arg Phe Pro Gln Gly Thr Leu Ala Gly Gln Val Leu Ala Thr
100 105 110
Val Gly Leu Ile Cys Asn Ser Asp Arg Arg Phe Glu Ser Asn Thr Gly
115 120 125
Glu Leu Ile Pro Lys Asp Thr Pro Leu Ser Tyr Thr Arg Ile Lys Asp
130 135 140
Ala Ala Gly Gln Pro Thr Thr Leu Val Val Ala Ala Asp Glu Ile Leu
145 150 155 160
Asp Val Gln Tyr Glu Phe Arg Ser Arg Pro Val Gly Thr Ala Glu Ala
165 170 175
Lys Phe Val Ile Ser Gly Val Glu Arg Thr Phe Arg Leu Ile Pro Lys
180 185 190
Pro Phe Ala Asn Arg Ala Asn Leu Ser Gly Glu Arg Tyr Ile Phe Tyr
195 200 205
Asn Thr Asn Pro Tyr Ile Asn Gly Lys Asp Ala Ser Gly Gly Asn Val
210 215 220
Arg Asp Gly Gln Trp Gln Lys Lys Tyr Pro Lys Tyr Val Arg Gly Ser
225 230 235 240
Tyr Lys Ala Gln Ile Thr Leu Leu Ala Gln Val Gln Asn Gly Asn Met
245 250 255
Ala Gly Gly Ile Thr Gly Thr Glu Glu Leu Gln Ile Tyr Asn Gly Arg
260 265 270
Asn Tyr Val Leu Asp Ile Asn Pro Pro Val Val Lys Asn Asn Thr Gln
275 280 285
Glu Phe Thr Val Thr Leu Glu Phe Thr Val Ala Arg Ala
290 295 300
<210> 37
<211> 498
<212> PRT
<213> 铜绿假单胞菌
<220>
<221> misc_feature
<223> PyoS5蛋白质序列
<400> 37
Met Ser Asn Asp Asn Glu Val Pro Gly Ser Met Val Ile Val Ala Gln
1 5 10 15
Gly Pro Asp Asp Gln Tyr Ala Tyr Glu Val Pro Pro Ile Asp Ser Ala
20 25 30
Ala Val Ala Gly Asn Met Phe Gly Asp Leu Ile Gln Arg Glu Ile Tyr
35 40 45
Leu Gln Lys Asn Ile Tyr Tyr Pro Val Arg Ser Ile Phe Glu Gln Gly
50 55 60
Thr Lys Glu Lys Lys Glu Ile Asn Lys Lys Val Ser Asp Gln Val Asp
65 70 75 80
Gly Leu Leu Lys Gln Ile Thr Gln Gly Lys Arg Glu Ala Thr Arg Gln
85 90 95
Glu Arg Val Asp Val Met Ser Ala Val Leu His Lys Met Glu Ser Asp
100 105 110
Leu Glu Gly Tyr Lys Lys Thr Phe Thr Lys Gly Pro Phe Ile Asp Tyr
115 120 125
Glu Lys Gln Ser Ser Leu Ser Ile Tyr Glu Ala Trp Val Lys Ile Trp
130 135 140
Glu Lys Asn Ser Trp Glu Glu Arg Lys Lys Tyr Pro Phe Gln Gln Leu
145 150 155 160
Val Arg Asp Glu Leu Glu Arg Ala Val Ala Tyr Tyr Lys Gln Asp Ser
165 170 175
Leu Ser Glu Ala Val Lys Val Leu Arg Gln Glu Leu Asn Lys Gln Lys
180 185 190
Ala Leu Lys Glu Lys Glu Asp Leu Ser Gln Leu Glu Arg Asp Tyr Arg
195 200 205
Thr Arg Lys Ala Asn Leu Glu Met Lys Val Gln Ser Glu Leu Asp Gln
210 215 220
Ala Gly Ser Ala Leu Pro Pro Leu Val Ser Pro Thr Pro Glu Gln Trp
225 230 235 240
Leu Glu Arg Ala Thr Arg Leu Val Thr Gln Ala Ile Ala Asp Lys Lys
245 250 255
Gln Leu Gln Thr Thr Asn Asn Thr Leu Ile Lys Asn Ser Pro Thr Pro
260 265 270
Leu Glu Lys Gln Lys Ala Ile Tyr Asn Gly Glu Leu Leu Val Asp Glu
275 280 285
Ile Ala Ser Leu Gln Ala Arg Leu Val Lys Leu Asn Ala Glu Thr Thr
290 295 300
Arg Arg Arg Thr Glu Ala Glu Arg Lys Ala Ala Glu Glu Gln Ala Leu
305 310 315 320
Gln Asp Ala Ile Lys Phe Thr Ala Asp Phe Tyr Lys Glu Val Thr Glu
325 330 335
Lys Phe Gly Ala Arg Thr Ser Glu Met Ala Arg Gln Leu Ala Glu Gly
340 345 350
Ala Arg Gly Lys Asn Ile Arg Ser Ser Ala Glu Ala Ile Lys Ser Phe
355 360 365
Glu Lys His Lys Asp Ala Leu Asn Lys Lys Leu Ser Leu Lys Asp Arg
370 375 380
Gln Ala Ile Ala Lys Ala Phe Asp Ser Leu Asp Lys Gln Met Met Ala
385 390 395 400
Lys Ser Leu Glu Lys Phe Ser Lys Gly Phe Gly Val Val Gly Lys Ala
405 410 415
Ile Asp Ala Ala Ser Leu Tyr Gln Glu Phe Lys Ile Ser Thr Glu Thr
420 425 430
Gly Asp Trp Lys Pro Phe Phe Val Lys Ile Glu Thr Leu Ala Ala Gly
435 440 445
Ala Ala Ala Ser Trp Leu Val Gly Ile Ala Phe Ala Thr Ala Thr Ala
450 455 460
Thr Pro Ile Gly Ile Leu Gly Phe Ala Leu Val Met Ala Val Thr Gly
465 470 475 480
Ala Met Ile Asp Glu Asp Leu Leu Glu Lys Ala Asn Asn Leu Val Ile
485 490 495
Ser Ile
<210> 38
<211> 114
<212> PRT
<213> Phikmv样病毒LKD16
<220>
<221> misc_feature
<223> LKD16 Gp18蛋白质序列
<400> 38
Met Arg Val Pro Thr Glu His Glu Arg Thr Leu Arg Cys Leu Leu Gln
1 5 10 15
Asp Ile His Gly Pro Leu Asn Leu Leu Phe Pro Gly Ile Arg Val Lys
20 25 30
Val Glu Glu Ala Cys Leu Gly Tyr Leu Gly Tyr Arg Glu Arg Gly Tyr
35 40 45
Trp Glu Leu Arg Leu Gln Val Asp Tyr Asp His Pro Lys Leu Gly His
50 55 60
Leu Arg Tyr Ser Gln Ala Val Pro Glu Tyr Val Leu Ile Asn Asp Arg
65 70 75 80
Asp Ser Ile Ile Lys Tyr Leu Met Glu Ala Val Pro Arg Gln Val Leu
85 90 95
Glu Gly Met Leu Asn Lys Ala Gln Glu Phe Val Thr Lys Asn Trp Tyr
100 105 110
Ser Leu
<210> 39
<211> 769
<212> PRT
<213> Phikmv样病毒LKA1
<220>
<221> misc_feature
<223> LKA1 Gp49蛋白质序列
<400> 39
Met Ala Gln Thr Pro Ser Thr Trp Ala Asp Tyr Val Gly Asp Gly Val
1 5 10 15
Glu Asp Thr Phe Gln Val Thr Phe Pro Tyr Gln Lys Gln Gln Glu Val
20 25 30
Phe Val Thr Val Gly Gly Asp Pro Ala Ala Phe Thr Phe Ile Ser Ala
35 40 45
Gly Trp Ile Gln Leu Ala Ala Val Pro Val Asn Gly Ala Ala Ile Arg
50 55 60
Val Arg Arg Ser Thr Glu Ala Phe Glu Pro Arg His Glu Phe Ala Asn
65 70 75 80
Gly Val Pro Leu Leu Pro Arg Phe Ile Asp Glu Asn Asn Thr Gln Phe
85 90 95
Leu Tyr Thr Val Gln Glu Ala Val Asn Glu Thr His Gly Ile Ala Ser
100 105 110
Glu Ala Leu Ser Val Ala Glu Glu Ala Arg Gly Ile Ala Gln Ala Ala
115 120 125
Ser Asp Lys Val Asp Ala Ala Thr Ile Asp Ser Ala His Gln Leu Arg
130 135 140
Leu Asp Leu Ala Asp Pro Ala Lys Gly Pro Gly Leu Leu Gly Tyr Asp
145 150 155 160
Arg Asp Val Ser Tyr Pro Val Gly Ser Val Gly Gln Ser Leu Gln Phe
165 170 175
Leu Glu Met Gly Arg Val Thr Pro Ala Gln Phe Gly Ala Val Gly Asp
180 185 190
Gly Ala Ser His Pro Leu Ser Glu Arg Tyr Ala Thr Leu Ala Glu Ala
195 200 205
Gln Thr Val Tyr Pro His Ala Val Ala Leu Ser Asp Glu Ile Asp Trp
210 215 220
Ala Ala Leu Gln Ala Ala Val Asp Ser Gly Ala Pro Val His Ile Pro
225 230 235 240
Ser Gly Asp Tyr Gln Ile Asn Arg Gly Ile Ser Ser Thr Gly Ser Leu
245 250 255
Gln Ile Ala Gly Asp Gly Ala Thr Ser Ile Ile Arg Pro Thr Ala Ala
260 265 270
Phe Thr Gly Thr Ser Val Leu Ser Cys Val Gly Ser Leu Val Ala Leu
275 280 285
Pro Asn Ile Ser Ser Val Ser Ala Gly Ser Leu Thr Ile Asp Phe Ala
290 295 300
Ser Thr Pro Asn Leu Val Ala Gly Asp Val Phe Ile Ile Tyr Asn Pro
305 310 315 320
Thr Asp Ser Ser Phe Ser Gly Phe Arg Thr Ser Tyr Arg Ala Gly Glu
325 330 335
Phe Cys Glu Val Arg Ala Val Ser Gly Asn Thr Val Thr Ile Arg Ser
340 345 350
Ala Leu Tyr Ala Ala Tyr Asp Gly Ala Thr Val Ala Ile Tyr Lys Val
355 360 365
Val Ser Gly Val Val Asp Ile Ala Ser Ile Gln Ile Val Gly Gly Thr
370 375 380
Val Pro Met Asn Gly Leu Leu Val Glu Ala Val Val Ser Pro Arg Val
385 390 395 400
Asp Asp Val Thr Val Thr Leu Ala Asn Asn Ala Gly Val Tyr Phe Ala
405 410 415
Arg Cys Tyr Asp Ala Lys Ile Thr Asn Ser Asn Ile Ser Asn Ile Gly
420 425 430
Asp Gly Gly Asp Asp Tyr Gly Ile Ile Phe Gly Asn Cys His Asp Gly
435 440 445
Gly Ala Asp Asn Cys Lys Val Tyr Ala Arg Arg His Ala Ile Ala Thr
450 455 460
Gly Gly Asp Ala Glu Val Gly Cys Val Pro Val Arg Asn Val Arg Met
465 470 475 480
Arg Asn Cys Thr Leu Arg Asn Asp Ile Thr Ser Gly Thr His Cys Ala
485 490 495
Asp Phe His Gly Asn Ala Glu Asp Cys Ser Tyr Glu Asn Cys Thr Ile
500 505 510
Tyr Gly Gly Ala Thr Trp Gln Gly Lys Asp Ile Ser Tyr Arg His Cys
515 520 525
Thr Ile Thr Asn Ala Ser Gly Gly Trp Ile Val Ile Ser Ala Glu Ile
530 535 540
Leu Gly Gly Thr Phe Leu Leu Asp Gln Cys Thr Leu Tyr Thr Thr Gly
545 550 555 560
Asp Pro Gln Pro Gly Asn Arg Gly Val Ile Asp Val Gly Gly Asn Ser
565 570 575
Ala Val Leu Thr Thr Asn Thr Thr Gln Pro Cys Asn Phe Leu Ile Gln
580 585 590
Gly Gly Ser Leu Arg Ala Pro Ser Leu Ser Thr Ser Ser Tyr Leu Leu
595 600 605
Arg Ala Arg Leu Glu Gly Ser Thr Val Pro Val Asn Ile Gln Tyr Ser
610 615 620
Gly Gln Ala Ile Asp Val Gly Ser Leu Gly Lys Val Leu Gln Leu Asp
625 630 635 640
Ile Thr Ser Gly Ser Thr Ser Pro Glu Tyr Leu Ile Val Glu Asn Leu
645 650 655
Ala Gly Leu Pro Ser Gly Ile Thr Leu Ala Ser Ala Ala Gly Gly Phe
660 665 670
Ala Ser Ala Pro Met Arg Met Pro Val Leu Gly Gly Arg Val Gln Val
675 680 685
Thr Thr Ala Thr Asn Ala Ser Ser Val Thr Ala Pro Val Thr Phe Arg
690 695 700
Tyr Ile Tyr Pro Lys Ala Pro Thr Val Gln Val Thr Lys Thr Asp Arg
705 710 715 720
Ser Tyr Ala Gly Asn Arg Val Gly Val Ala Ile Ala Asn Pro Thr Ser
725 730 735
Ala Ser Gly Ala Thr Leu Gly Leu Phe Thr Asp Asp Gly Thr Asn Phe
740 745 750
Ser Ser Ala Val Thr Asn Gln Leu Asn Trp Gln Ala Gly Ile Tyr Glu
755 760 765
Val
<210> 40
<211> 651
<212> PRT
<213> Phikmv样病毒NTUH-K2044-K1-1
<220>
<221> misc_feature
<223> NTUH-K2044-K1-1 Gp34蛋白质序列
<400> 40
Met Ala Leu Ile Arg Leu Val Ala Pro Glu Arg Val Phe Ser Asp Leu
1 5 10 15
Ala Ser Met Val Ala Tyr Pro Asn Phe Gln Val Gln Asp Lys Ile Thr
20 25 30
Leu Leu Gly Ser Ala Gly Gly Asp Phe Thr Phe Thr Thr Thr Ala Ser
35 40 45
Val Val Asp Asn Gly Thr Val Phe Ala Val Pro Gly Gly Tyr Leu Leu
50 55 60
Arg Lys Phe Val Gly Pro Ala Tyr Ser Ser Trp Phe Ser Asn Trp Thr
65 70 75 80
Gly Ile Val Thr Phe Met Ser Ala Pro Asn Arg His Leu Val Val Asp
85 90 95
Thr Val Leu Gln Ala Thr Ser Val Leu Asn Ile Lys Ser Asn Ser Thr
100 105 110
Leu Glu Phe Thr Asp Thr Gly Arg Ile Leu Pro Asp Ala Ala Val Ala
115 120 125
Arg Gln Val Leu Asn Ile Thr Gly Ser Ala Pro Ser Val Phe Val Pro
130 135 140
Leu Ala Ala Asp Ala Ala Ala Gly Ser Lys Val Ile Thr Val Ala Ala
145 150 155 160
Gly Ala Leu Ser Ala Val Lys Gly Thr Tyr Leu Tyr Leu Arg Ser Asn
165 170 175
Lys Leu Cys Asp Gly Gly Pro Asn Thr Tyr Gly Val Lys Ile Ser Gln
180 185 190
Ile Arg Lys Val Val Gly Val Ser Thr Ser Gly Gly Val Thr Ser Ile
195 200 205
Arg Leu Asp Lys Ala Leu His Tyr Asn Tyr Tyr Leu Ser Asp Ala Ala
210 215 220
Glu Val Gly Ile Pro Thr Met Val Glu Asn Val Thr Leu Val Ser Pro
225 230 235 240
Tyr Ile Asn Glu Phe Gly Tyr Asp Asp Leu Asn Arg Phe Phe Thr Ser
245 250 255
Gly Ile Ser Ala Asn Phe Ala Ala Asp Leu His Ile Gln Asp Gly Val
260 265 270
Ile Ile Gly Asn Lys Arg Pro Gly Ala Ser Asp Ile Glu Gly Arg Ser
275 280 285
Ala Ile Lys Phe Asn Asn Cys Val Asp Ser Thr Val Lys Gly Thr Cys
290 295 300
Phe Tyr Asn Ile Gly Trp Tyr Gly Val Glu Val Leu Gly Cys Ser Glu
305 310 315 320
Asp Thr Glu Val His Asp Ile His Ala Met Asp Val Arg His Ala Ile
325 330 335
Ser Leu Asn Trp Gln Ser Thr Ala Asp Gly Asp Lys Trp Gly Glu Pro
340 345 350
Ile Glu Phe Leu Gly Val Asn Cys Glu Ala Tyr Ser Thr Thr Gln Ala
355 360 365
Gly Phe Asp Thr His Asp Ile Gly Lys Arg Val Lys Phe Val Arg Cys
370 375 380
Val Ser Tyr Asp Ser Ala Asp Asp Gly Phe Gln Ala Arg Thr Asn Gly
385 390 395 400
Val Glu Tyr Leu Asn Cys Arg Ala Tyr Arg Ala Ala Met Asp Gly Phe
405 410 415
Ala Ser Asn Thr Gly Val Ala Phe Pro Ile Tyr Arg Glu Cys Leu Ala
420 425 430
Tyr Asp Asn Val Arg Ser Gly Phe Asn Cys Ser Tyr Gly Gly Gly Tyr
435 440 445
Val Tyr Asp Cys Glu Ala His Gly Ser Gln Asn Gly Val Arg Ile Asn
450 455 460
Gly Gly Arg Val Lys Gly Gly Arg Tyr Thr Arg Asn Ser Ser Ser His
465 470 475 480
Ile Phe Val Thr Lys Asp Val Ala Glu Thr Ala Gln Thr Ser Leu Glu
485 490 495
Ile Asp Gly Val Ser Met Arg Tyr Asp Gly Thr Gly Arg Ala Val Tyr
500 505 510
Phe His Gly Thr Val Gly Ile Asp Pro Thr Leu Val Ser Met Ser Asn
515 520 525
Asn Asp Met Thr Gly His Gly Leu Phe Trp Ala Leu Leu Ser Gly Tyr
530 535 540
Thr Val Gln Pro Thr Pro Pro Arg Met Ser Arg Asn Leu Leu Asp Asp
545 550 555 560
Thr Gly Ile Arg Gly Val Ala Thr Leu Val Ala Gly Glu Ala Thr Val
565 570 575
Asn Ala Arg Val Arg Gly Asn Phe Gly Ser Val Ala Asn Ser Phe Lys
580 585 590
Trp Val Ser Glu Val Lys Leu Thr Arg Leu Thr Phe Pro Ser Ser Ala
595 600 605
Gly Ala Leu Thr Val Thr Ser Val Ala Gln Asn Gln Asp Val Pro Thr
610 615 620
Pro Asn Pro Asp Leu Asn Ser Phe Val Ile Arg Ser Ser Asn Ala Ala
625 630 635 640
Asp Val Ser Gln Val Ala Trp Glu Val Tyr Leu
645 650
<210> 41
<211> 727
<212> PRT
<213> T7-样Pp15
<220>
<221> misc_feature
<223> Pp15 Gp44蛋白质序列
<400> 41
Met Ala Arg Thr Ile Val Gln Asn Ala Leu Thr Gly Gly Gln Gln Asp
1 5 10 15
Phe Glu Val Pro Phe Asp Tyr Ile Leu Gln Arg Phe Val Lys Leu Thr
20 25 30
Leu Ile Gly Asp Gly Asn Arg Gln Glu Leu Val Leu Gly Thr Asp Phe
35 40 45
Arg Phe Ile Gly Pro Arg Thr Val Arg Thr Asn Val Phe Trp Gly Pro
50 55 60
Ala Gln Gly Tyr Thr Ser Ile Glu Ile Arg Arg Val Thr Ser Ala Ser
65 70 75 80
Asp Arg Arg Val Glu Phe Ser Asp Gly Ser Ile Leu Thr Ala Gly Asp
85 90 95
Leu Asn Ile Ala Gln Leu Gln Ala Ile His Ile Ala Glu Glu Ala Arg
100 105 110
Asp Ser Ala Thr Glu Asn Leu Ser Pro Asp Ala Asp Gly Asn Tyr Asp
115 120 125
Ala Arg Gly Ala Arg Ile Tyr Asn Leu Gly Asp Ala Val Gln Pro Lys
130 135 140
Asp Ala Val Asn Arg Tyr Thr Leu Asp Leu Ala Ile Ala Ala Ala Leu
145 150 155 160
Ala Met Asn Thr Gly Asn Pro Asn Asn Ala Gln Asn Ile Ser Tyr Thr
165 170 175
Pro Asn Gly Pro Gly Gln Ser Ile Arg Ser Val Glu Gly Arg Leu Arg
180 185 190
Asp Ala Val Phe Val Ser Asp Tyr Met Thr Thr Pro Arg Asp Gly Val
195 200 205
Thr Ser Asn Gln Gln Asp Leu Glu Lys Ala Leu Ala Ala Ala Asn Ala
210 215 220
Lys Gly Ala Asp Leu Phe Trp Pro Asp Asp Ile Pro Phe Phe Ser Thr
225 230 235 240
Ser Pro Leu Ala Leu Ile His Ala Val Tyr His Val Gly Arg Gly Val
245 250 255
Ile Asn Ala Asn Gly Thr Leu Phe Tyr Val Asn Pro Lys Asn Gly Gln
260 265 270
His Asn Arg Leu His Val Ser Pro Gly Gly Thr Gly Asp Gly Leu Ala
275 280 285
Ala Gly Arg Pro Leu Gly Thr Ile Trp Ser Ala Leu Ala Ala Leu Asn
290 295 300
Met Arg Ala Pro Leu Thr Thr Arg Trp Ser Leu Glu Met Thr Ala Gly
305 310 315 320
Ala Tyr Asn Glu Ala Val Thr Leu Pro Asn Tyr Leu Thr Ser Cys Asn
325 330 335
Asp Tyr Leu Ala Phe Asn Trp Pro Asn Thr Gly Gln Glu Arg Met Glu
340 345 350
Pro Thr Ala Tyr Pro Ser Ala Leu Asp Gly Thr Gly Gln Thr Gly Leu
355 360 365
Thr Gly Phe His Thr Gly Ile Gly Asn Arg Ile Thr Ile Asn Asn Val
370 375 380
Cys Met Ser Asn Trp Tyr Asp Thr Ala Leu Thr Pro Thr Gln Gln Val
385 390 395 400
Arg Arg Ala Phe Val Val Gly Ala Tyr Ser Thr Ala Tyr Val Val Asn
405 410 415
Cys Ala Phe Ile Tyr Asn Gly Ile Ala Ser Val Ser Val Leu Pro Gly
420 425 430
Gly Thr Ala Ile Val Thr Gly Gly Ile Val Asp Gly Gly Arg Phe Gly
435 440 445
Leu Asp Asn Thr Gly Gly Arg Leu Ser Leu Thr Ala Thr Lys Ser Asn
450 455 460
Tyr Thr Gln Val Arg Asn Cys Leu Glu Tyr Gly Leu Tyr Ser Lys His
465 470 475 480
Asp Ala Ser Thr Val Met Asp Asn Thr Glu Phe Arg Asn Cys Gly Asn
485 490 495
His Pro Ala Ala Val Ala Tyr Gly Ala Ala Ile Phe Ala Tyr Lys Phe
500 505 510
Asn Cys Ser Val Asp Thr Arg Gly Val Lys Phe Tyr Gly Asn Asn Ile
515 520 525
Ala Gln His Cys Arg Gly Gly Ile Thr Ser Asp Asn Pro Gly Asp Pro
530 535 540
Asp Ile Tyr Gly Thr Gly Ala Asp Ala Asn Lys Arg Leu Phe Leu Cys
545 550 555 560
Thr Gly Gly Gly Ser Asp Asp Ile Gln Phe Tyr Glu Ala Arg Arg Val
565 570 575
Met Asp Ile Thr Lys Arg Thr Gly Gly Gly Ser Thr Thr Ala Ser Val
580 585 590
Ser Ser Leu Leu Leu Ala Ala Val Ala Ser Val Arg Lys Gly Tyr Phe
595 600 605
Ala His Asn Asp Gln Val Ile Arg Met Thr Leu Met Phe Arg Ala Thr
610 615 620
Gly Ser Ala Gly Ile Phe Thr Pro Thr Leu Arg Thr Pro Leu Gly Thr
625 630 635 640
Ile Pro Leu Gly Ser Phe Arg Val Ala Ser Gly Gln Tyr Gly Glu Ile
645 650 655
Lys Leu Thr Ile Arg Pro Thr Leu Thr Ser Asp Gly Leu Ile Val Gly
660 665 670
Phe Ser Cys Ile Asn Ala Val Gln Asn Leu Gly Ser Ser Val Gly Gln
675 680 685
Ile Ile Val Ser Gly Thr Val Asp Leu Arg Thr Val Asp Gln Leu Val
690 695 700
Glu Met Trp Gly Tyr Ser Glu Ala Gly Gly Thr Ala Ser Tyr Ile Gln
705 710 715 720
Gly Leu Ile Glu Leu Val Gly
725
<210> 42
<211> 362
<212> PRT
<213> 伴放线菌聚集菌
<220>
<221> misc_feature
<223> DspB蛋白质序列
<400> 42
Met Asn Cys Cys Val Lys Gly Asn Ser Ile Tyr Pro Gln Lys Thr Ser
1 5 10 15
Thr Lys Gln Thr Gly Leu Met Leu Asp Ile Ala Arg His Phe Tyr Ser
20 25 30
Pro Glu Val Ile Lys Ser Phe Ile Asp Thr Ile Ser Leu Ser Gly Gly
35 40 45
Asn Phe Leu His Leu His Phe Ser Asp His Glu Asn Tyr Ala Ile Glu
50 55 60
Ser His Leu Leu Asn Gln Arg Ala Glu Asn Ala Val Gln Gly Lys Asp
65 70 75 80
Gly Ile Tyr Ile Asn Pro Tyr Thr Gly Lys Pro Phe Leu Ser Tyr Arg
85 90 95
Gln Leu Asp Asp Ile Lys Ala Tyr Ala Lys Ala Lys Gly Ile Glu Leu
100 105 110
Ile Pro Glu Leu Asp Ser Pro Asn His Met Thr Ala Ile Phe Lys Leu
115 120 125
Val Gln Lys Asp Arg Gly Val Lys Tyr Leu Gln Gly Leu Lys Ser Arg
130 135 140
Gln Val Asp Asp Glu Ile Asp Ile Thr Asn Ala Asp Ser Ile Thr Phe
145 150 155 160
Met Gln Ser Leu Met Ser Glu Val Ile Asp Ile Phe Gly Asp Thr Ser
165 170 175
Gln His Phe His Ile Gly Gly Asp Glu Phe Gly Tyr Ser Val Glu Ser
180 185 190
Asn His Glu Phe Ile Thr Tyr Ala Asn Lys Leu Ser Tyr Phe Leu Glu
195 200 205
Lys Lys Gly Leu Lys Thr Arg Met Trp Asn Asp Gly Leu Ile Lys Asn
210 215 220
Thr Phe Glu Gln Ile Asn Pro Asn Ile Glu Ile Thr Tyr Trp Ser Tyr
225 230 235 240
Asp Gly Asp Thr Gln Asp Lys Asn Glu Ala Ala Glu Arg Arg Asp Met
245 250 255
Arg Val Ser Leu Pro Glu Leu Leu Ala Lys Gly Phe Thr Val Leu Asn
260 265 270
Tyr Asn Ser Tyr Tyr Leu Tyr Ile Val Pro Lys Ala Ser Pro Thr Phe
275 280 285
Ser Gln Asp Ala Ala Phe Ala Ala Lys Asp Val Ile Lys Asn Trp Asp
290 295 300
Leu Gly Val Trp Asp Gly Arg Asn Thr Lys Asn Arg Val Gln Asn Thr
305 310 315 320
His Glu Ile Ala Gly Ala Ala Leu Ser Ile Trp Gly Glu Asp Ala Lys
325 330 335
Ala Leu Lys Asp Glu Thr Ile Gln Lys Asn Thr Lys Ser Leu Leu Glu
340 345 350
Ala Val Ile His Lys Thr Asn Gly Asp Glu
355 360
<210> 43
<211> 22
<212> PRT
<213> 金黄色葡萄球菌
<220>
<221> misc_feature
<223> SaPSMa3蛋白质序列
<400> 43
Met Glu Phe Val Ala Lys Leu Phe Lys Phe Phe Lys Asp Leu Leu Gly
1 5 10 15
Lys Phe Leu Gly Asn Asn
20
<210> 44
<211> 44
<212> PRT
<213> 金黄色葡萄球菌
<220>
<221> misc_feature
<223> SaPAMb2蛋白质序列
<400> 44
Met Thr Gly Leu Ala Glu Ala Ile Ala Asn Thr Val Gln Ala Ala Gln
1 5 10 15
Gln His Asp Ser Val Lys Leu Gly Thr Ser Ile Val Asp Ile Val Ala
20 25 30
Asn Gly Val Gly Leu Leu Gly Lys Leu Phe Gly Phe
35 40
<210> 45
<211> 22
<212> PRT
<213> 表皮葡萄球菌
<220>
<221> misc_feature
<223> SePSMa蛋白质序列
<400> 45
Met Ala Asp Val Ile Ala Lys Ile Val Glu Ile Val Lys Gly Leu Ile
1 5 10 15
Asp Gln Phe Thr Gln Lys
20
<210> 46
<211> 75
<212> PRT
<213> 轻小病毒MS2
<220>
<221> misc_feature
<223> MS2 L蛋白质序列
<400> 46
Met Glu Thr Arg Phe Pro Gln Gln Ser Gln Gln Thr Pro Ala Ser Thr
1 5 10 15
Asn Arg Arg Arg Pro Phe Lys His Glu Asp Tyr Pro Cys Arg Arg Gln
20 25 30
Gln Arg Ser Ser Thr Leu Tyr Val Leu Ile Phe Leu Ala Ile Phe Leu
35 40 45
Ser Lys Phe Thr Asn Gln Leu Leu Leu Ser Leu Leu Glu Ala Val Ile
50 55 60
Arg Thr Val Thr Thr Leu Gln Gln Leu Leu Thr
65 70 75
<210> 47
<211> 54
<212> PRT
<213> 轻小病毒PRR1
<220>
<221> misc_feature
<223> PRR1 L蛋白质序列
<400> 47
Met Cys Lys Val Ser Thr Lys Val Asp Ser Lys Leu Thr Glu Ser Val
1 5 10 15
Gly Gln Leu Thr Ile Arg Ser Tyr Leu Trp Leu Arg Asn Ile Leu Ala
20 25 30
Leu Ala Gly Leu Leu Phe Val Ile Leu Leu Ala Thr Asn His Leu Ser
35 40 45
Ile Ala Ile Tyr Ser Pro
50
<210> 48
<211> 106
<212> PRT
<213> Phikmv样病毒LUZ19
<220>
<221> misc_feature
<223> LUZ19 Gp18蛋白质序列
<400> 48
Met Arg Met Pro Thr Glu Glu Glu Arg Met Ile Arg Cys Leu Leu Ala
1 5 10 15
Asp Ile His Glu Pro Leu Asp Leu Leu Phe Pro Gly Leu Arg Thr Lys
20 25 30
Ala His Met Asp Pro Gln Ala Glu Glu Leu Ser Ile Arg Ile Asp Tyr
35 40 45
Asp His Ala Lys Leu Gly Arg Met Gly Phe Cys His Ala Val Ser Leu
50 55 60
Tyr Gln Leu Ser Ile Tyr Gly Arg Glu Gly Met Val Arg Tyr Leu Met
65 70 75 80
Gln Glu Ile Pro Arg Arg Val Leu Glu Gly Leu Leu Val Lys Ala Gln
85 90 95
Gln Tyr Ser Gln Ser Asn Trp Tyr Ser Lys
100 105
<210> 49
<211> 71
<212> PRT
<213> Phikmv样病毒LUZ19
<220>
<221> misc_feature
<223> LUZ19 Gp49蛋白质序列
<400> 49
Met Ser Lys Ala Lys Leu Arg Val Ile Ala Asp Thr Pro Glu Leu Glu
1 5 10 15
Ser Val Leu Lys Ala Leu Leu Thr Ala Thr Tyr Ala Ile Glu Asp Leu
20 25 30
Leu Asn Glu Ala Val Ala Ser Lys Val Leu Asn Ser Arg Leu Gly Trp
35 40 45
Ser Ala Val Gly Glu Tyr Val Glu Leu Phe Asn Arg Thr Gln Ser Arg
50 55 60
Val Ala Gly Leu Ile Pro Glu
65 70
<210> 50
<211> 321
<212> DNA
<213> Phikmv样病毒LUZ19
<220>
<221> misc_feature
<223> LUZ19 gp18基因序列
<400> 50
atgagaatgc caaccgaaga agaacgcatg atccgctgtt tactggcgga tatccacgag 60
ccactggacc tgctgttccc cggcctccgt accaaggccc atatggaccc gcaagcagag 120
gaactgtcga ttcgaattga ctacgaccat gcgaagctgg gccgtatggg attctgccac 180
gcggtatccc tatatcaact gtccatatat ggccgcgagg ggatggtccg ctacctgatg 240
caggagattc cccgccgcgt gctggaaggt ctgctggtca aggcgcagca gtacagccaa 300
agcaactggt acagcaaatg a 321
<210> 51
<211> 216
<212> DNA
<213> Phikmv样病毒LUZ19
<220>
<221> misc_feature
<223> LUZ19 Gp49蛋白质序列
<400> 51
atgagcaaag ccaaactacg agtcatcgcc gacaccccgg agctggagtc agtgctaaaa 60
gcattgctga ccgccaccta cgctatcgag gacctgctca acgaggccgt ggctagcaag 120
gtgctaaact cccgcctggg ctggtccgca gtcggcgagt atgtcgaact gttcaaccgc 180
acgcaatccc gcgtggccgg gttgattccc gagtag 216

Claims (27)

1.重组噬菌体,其经工程化以表达两种或更多种有效载荷,其中至少一种有效载荷是胞外多糖(EPS)解聚酶。
2.根据权利要求1所述的重组噬菌体,其中所述有效载荷中的一种是DNA酶或一种或多种表面活性剂酚可溶性调控蛋白。
3.根据权利要求1或2所述的重组噬菌体,其中所述重组噬菌体显示出改良的宿主范围。
4.根据权利要求1至3中任一项所述的重组噬菌体,其中所述两个或更多个有效载荷包括DNA酶。
5.根据权利要求1至3中任一项所述的重组噬菌体,其中所述两种或更多种有效载荷包括酚可溶性调控蛋白。
6.根据权利要求1至3中任一项所述的重组噬菌体,其中所述两种或更多种有效载荷包括DNA酶。
7.根据权利要求1至3中任一项所述的重组噬菌体,其中所述两种或更多种有效载荷包括DNA酶和酚可溶性调控蛋白。
8.根据权利要求1至3中任一项所述的重组噬菌体,其中所述两种或更多种有效载荷包括DNA酶和一种或多种酚可溶性调控蛋白。
9.根据权利要求1至3中任一项所述的重组噬菌体,其中所述酚可溶性调控蛋白选自PSMa、PSMa3和PSMb2。
10.根据权利要求9所述的重组噬菌体,其中所述酚可溶性调控蛋白是PSMa。
11.根据权利要求9所述的重组噬菌体,其中所述酚可溶性调控蛋白是PSMb2。
12.根据权利要求9所述的重组噬菌体,其中所述酚可溶性调控蛋白是PSMa3。
13.根据权利要求1-12中任一项所述的重组噬菌体,其中所述噬菌体是感染铜绿假单胞菌(Pseudomonas aeruginosa)或大肠杆菌(E.coli.)的噬菌体。
14.根据权利要求13所述的重组噬菌体,其中所述噬菌体是ΦKMV噬菌体。
15.根据权利要求14所述的重组噬菌体,其中所述噬菌体包含与LUZ19基因组具有至少85%序列同一性的病毒基因组。
16.根据权利要求15所述的重组噬菌体,其中所述噬菌体包含LUZ19病毒基因组。
17.根据权利要求16所述的重组噬菌体,其中所述噬菌体包括:
i)选自gp13 C17Y、gp18 D36Y、gp38 D82G和I83S、以及gp40 N253D的一个或多个突变,并且显示与LUZ19相比改良的宿主范围;和/或
ii)被来自病毒LKD16的gp18替换的野生型LUZ19 gp18;和/或
iii)gp34的位置55处的赖氨酸缺失(gp34L55Δ突变),并且所述噬菌体显示与野生型LUZ19相比增加的裂解活性。
18.根据权利要求17所述的重组噬菌体,其中所述噬菌体包含选自gp13 C17Y、gp18D36Y、gp38 D82G和I83S、以及gp40 N253D的一个或多个突变,并且显示与LUZ19相比改良的宿主范围。
19.根据权利要求18所述的重组噬菌体,其中所述噬菌体包含gp13 C17Y突变。
20.根据权利要求18所述的重组噬菌体,其中所述噬菌体包含gp18 D36Y突变。
21.根据权利要求18所述的重组噬菌体,其中所述噬菌体包含gp38 D82G突变。
22.根据权利要求18所述的重组噬菌体,其中所述噬菌体包含gp38 I83S突变。
23.根据权利要求18所述的重组噬菌体,其中所述噬菌体包含gp38 I83S突变。
24.根据权利要求18所述的重组噬菌体,其中所述噬菌体包含gp40 N253D突变。
25.根据权利要求18所述的重组噬菌体,其中所述噬菌体包含gp13 C17Y突变、gp18D36Y突变、gp38 D82G和I83S突变、以及gp40 N253D突变。
26.根据权利要求17所述的重组噬菌体,其中所述噬菌体包含被来自病毒LKD16的gp18替换的野生型LUZ19 gp18。
27.根据权利要求17所述的重组噬菌体,其中所述噬菌体具有gp34的位置55处的赖氨酸缺失(gp34 L55Δ突变),并且所述噬菌体显示与野生型LUZ19相比增加的裂解活性。
CN202110495059.2A 2014-12-16 2015-12-15 用于体外病毒基因组工程的组合物和方法 Pending CN113215115A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201462092707P 2014-12-16 2014-12-16
US62/092,707 2014-12-16
US201562102362P 2015-01-12 2015-01-12
US62/102,362 2015-01-12
US201562242811P 2015-10-16 2015-10-16
US62/242,811 2015-10-16
CN201580076597.0A CN107278227B (zh) 2014-12-16 2015-12-15 用于体外病毒基因组工程的组合物和方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201580076597.0A Division CN107278227B (zh) 2014-12-16 2015-12-15 用于体外病毒基因组工程的组合物和方法

Publications (1)

Publication Number Publication Date
CN113215115A true CN113215115A (zh) 2021-08-06

Family

ID=56127485

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202110495059.2A Pending CN113215115A (zh) 2014-12-16 2015-12-15 用于体外病毒基因组工程的组合物和方法
CN201580076597.0A Active CN107278227B (zh) 2014-12-16 2015-12-15 用于体外病毒基因组工程的组合物和方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201580076597.0A Active CN107278227B (zh) 2014-12-16 2015-12-15 用于体外病毒基因组工程的组合物和方法

Country Status (9)

Country Link
US (4) US10221398B2 (zh)
EP (1) EP3234136A4 (zh)
JP (2) JP6842417B2 (zh)
CN (2) CN113215115A (zh)
AU (2) AU2015362618B2 (zh)
CA (1) CA2971205A1 (zh)
EA (1) EA038595B1 (zh)
HK (1) HK1245838A1 (zh)
WO (1) WO2016100389A1 (zh)

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101801521B (zh) 2007-05-14 2015-06-17 纽约州立大学研究基金会 生物膜中细菌细胞内的生理学分散响应诱导
JP6261500B2 (ja) 2011-07-22 2018-01-17 プレジデント アンド フェローズ オブ ハーバード カレッジ ヌクレアーゼ切断特異性の評価および改善
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US11053481B2 (en) 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains
BR112016030145A8 (pt) 2014-06-23 2018-12-11 Regeneron Pharma métodos para a montagem de ao menos dois ácidos nucleicos e de dois ou mais ácidos nucleicos
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
AU2015362618B2 (en) 2014-12-16 2022-01-27 C3J Therapeutics, Inc. Compositions of and methods for in vitro viral genome engineering
US20160362667A1 (en) * 2015-06-10 2016-12-15 Caribou Biosciences, Inc. CRISPR-Cas Compositions and Methods
US10513732B2 (en) * 2015-07-13 2019-12-24 New York University Sequencing methods and kits
WO2017070632A2 (en) 2015-10-23 2017-04-27 President And Fellows Of Harvard College Nucleobase editors and uses thereof
US11433260B2 (en) 2015-12-21 2022-09-06 Gholam A. Peyman Cancer treatment methods using thermotherapy and/or enhanced immunotherapy
US10136820B2 (en) * 2015-12-21 2018-11-27 Gholam A. Peyman Method to visualize very early stage neoplasm or other lesions
WO2017172644A2 (en) * 2016-03-28 2017-10-05 The Charles Stark Draper Laboratory, Inc. Bacteria identification and antibiotic susceptibility profiling device
WO2018027078A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
CA3033327A1 (en) 2016-08-09 2018-02-15 President And Fellows Of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
EP3503915B1 (en) * 2016-08-26 2024-02-21 Telesis Bio Inc. Genetically engineered vibrio natriegens
GB2573062A (en) 2016-10-14 2019-10-23 Harvard College AAV delivery of nucleobase editors
US20210277384A1 (en) * 2016-10-14 2021-09-09 Fred Hutchinson Cancer Research Center Compositions and methods for evading bacterial defense mechanisms
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
WO2018148410A1 (en) 2017-02-09 2018-08-16 The Charles Stark Draper Laboratory Inc. Bacteriophage recombination followed by blockage of nonrecombinant bacteriophage replication
US20190070232A1 (en) 2017-03-06 2019-03-07 Massachusetts Institute Of Technology Methods of cloning prophages and producing lytic phage particles
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
WO2018165629A1 (en) 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
KR20190130613A (ko) 2017-03-23 2019-11-22 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵산 프로그램가능한 dna 결합 단백질을 포함하는 핵염기 편집제
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
WO2018222891A1 (en) * 2017-06-01 2018-12-06 The Charles Stark Draper Laboratory Inc. Phage engineering: protection by circularized intermediate
CN111801345A (zh) 2017-07-28 2020-10-20 哈佛大学的校长及成员们 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物
US10174295B1 (en) * 2017-08-01 2019-01-08 The Charles Stark Draper Laboratory, Inc. Composition of matter: engineering of Escherichia coli phage K1E
US11891630B2 (en) 2017-08-08 2024-02-06 The Charles Stark Draper Laboratory, Inc. Bacteriophage engineering via semi-synthesis
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
WO2019079347A1 (en) 2017-10-16 2019-04-25 The Broad Institute, Inc. USES OF BASIC EDITORS ADENOSINE
JP6923862B2 (ja) * 2018-05-22 2021-08-25 学校法人自治医科大学 抗菌ファージ、治療用組成物、殺菌剤、食品、細菌判別キット、治療用組成物製造方法、細菌除去方法、細菌判別方法、及び動物治療方法
US11541105B2 (en) 2018-06-01 2023-01-03 The Research Foundation For The State University Of New York Compositions and methods for disrupting biofilm formation and maintenance
US20220010284A1 (en) * 2018-11-01 2022-01-13 The Trustees Of Princeton University System for protein inactivation and recombinant phages for targeted bacterial killing, infection, biodetection, and as a means of protein extraction
KR20210100119A (ko) * 2018-11-27 2021-08-13 엘리고 바이오사이언스 박테리아 전달 비히클에서 사용을 위한 키메라 수용체 결합 단백질
JP2022514700A (ja) * 2018-12-21 2022-02-14 エリゴ・バイオサイエンス 細菌送達ビヒクルにおける使用のための分岐型受容体結合多サブユニットタンパク質複合体
KR20210143230A (ko) 2019-03-19 2021-11-26 더 브로드 인스티튜트, 인코퍼레이티드 뉴클레오티드 서열을 편집하기 위한 방법 및 조성물
KR102487901B1 (ko) 2019-04-04 2023-01-12 리제너론 파마슈티칼스 인코포레이티드 표적화된 변형의 표적화 벡터로의 무흔적 도입을 위한 방법
CN116096873A (zh) 2020-05-08 2023-05-09 布罗德研究所股份有限公司 同时编辑靶标双链核苷酸序列的两条链的方法和组合物
CN114540389A (zh) * 2020-11-26 2022-05-27 深圳华大生命科学研究院 一种制备基因工程病毒的方法及其应用
CN112778399A (zh) * 2021-01-21 2021-05-11 南开大学 一类源自毒性淀粉样纤维纳米抗菌肽的制备及性质表征方法
WO2022251644A1 (en) 2021-05-28 2022-12-01 Lyell Immunopharma, Inc. Nr4a3-deficient immune cells and uses thereof
WO2022256437A1 (en) 2021-06-02 2022-12-08 Lyell Immunopharma, Inc. Nr4a3-deficient immune cells and uses thereof
CN113755451B (zh) * 2021-09-03 2023-06-06 广西大学 一株大肠杆菌噬菌体gn6及其应用
EP4248987A1 (en) * 2022-03-21 2023-09-27 Nomad Bioscience GmbH Chimeric bacteriocins and method for the control of pseudomonas
WO2023225665A1 (en) 2022-05-19 2023-11-23 Lyell Immunopharma, Inc. Polynucleotides targeting nr4a3 and uses thereof
WO2024064958A1 (en) 2022-09-23 2024-03-28 Lyell Immunopharma, Inc. Methods for culturing nr4a-deficient cells
WO2024064952A1 (en) 2022-09-23 2024-03-28 Lyell Immunopharma, Inc. Methods for culturing nr4a-deficient cells overexpressing c-jun
WO2024077174A1 (en) 2022-10-05 2024-04-11 Lyell Immunopharma, Inc. Methods for culturing nr4a-deficient cells

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006137847A2 (en) * 2004-09-13 2006-12-28 Trustees Of Boston University Engineered enzymatically active bacteriophages and methods of uses thereof

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5877279A (en) * 1994-10-13 1999-03-02 Nanoframes, Llc Materials for the production of nanometer structures and use thereof
EP1030861A4 (en) 1997-10-31 2001-09-05 Maxygen Inc MODIFICATION OF VIRAL TROPISM AND THE DIVERSITY OF HOST SPECIES BY RECOMBINATION OF THE VIRAL GENOME
GB9803351D0 (en) * 1998-02-17 1998-04-15 Oxford Biomedica Ltd Anti-viral vectors
GB9809414D0 (en) 1998-05-02 1998-07-01 Scottish Crop Research Inst Method
US7019122B1 (en) 1998-10-30 2006-03-28 Janssen Pharmaceutica N.V. Unusual retrotransposon from the yeast Candida albicans
EP1305038B1 (en) * 2000-07-25 2005-10-05 THE GOVERNMENT OF THE UNITED STATES OF AMERICA, as represented by THE SECRETARY, DEPARTMENT OF HEALTH AND HUMAN SERVICES Bacteriophage having multiple host range
WO2006021944A1 (en) 2004-08-12 2006-03-02 Leanway Automatic Areanas Ltd. Enhanced database structure configuration
AU2005316476A1 (en) * 2004-12-15 2006-06-22 University Of Florida Research Foundation, Inc. Chimeric vectors
WO2007005053A1 (en) 2005-06-30 2007-01-11 Codon Devices, Inc. Hierarchical assembly methods for genome engineering
ATE474909T1 (de) 2005-12-29 2010-08-15 Abl Biotechnologies Ltd Neuer schizochytrium-limacinum-stamm, der sich für die produktion von lipiden und extrazellulären polysacchariden eignet, sowie verfahren hierfür
US8216844B2 (en) 2006-08-29 2012-07-10 Danisco Us Inc. Compositions and methods for improved protein production
WO2008141757A1 (en) 2007-05-23 2008-11-27 Cognis Ip Management Gmbh Efficient astaxanthin production strains derived from haematococcus pluvialis
GB0715416D0 (en) 2007-08-07 2007-09-19 Phico Therapeutics Ltd Modified bacteriophage
CA2711841A1 (en) * 2008-01-10 2009-09-03 Trustees Of Boston University Engineered bacteriophages as adjuvants for antimicrobial agents and compositions and methods of use thereof
WO2009103027A2 (en) 2008-02-15 2009-08-20 Synthetic Genomics, Inc. Methods for in vitro joining and combinatorial assembly of nucleic acid molecules
US8207363B2 (en) 2009-03-19 2012-06-26 Martek Biosciences Corporation Thraustochytrids, fatty acid compositions, and methods of making and uses thereof
CN101928670B (zh) 2009-09-24 2012-02-22 上海天伟生物制药有限公司 一种抗生素的高产菌株及其制备方法和用途
US8524220B1 (en) 2010-02-09 2013-09-03 David Gordon Bermudes Protease inhibitor: protease sensitivity expression system composition and methods improving the therapeutic activity and specificity of proteins delivered by bacteria
CA2811472C (en) 2010-09-17 2019-08-27 Tecnifar-Industria Tecnica Farmaceutica, S.A. Antibacterial phage, phage peptides and methods of use thereof
WO2013116771A1 (en) 2012-02-01 2013-08-08 Synthetic Genomics, Inc. Materials and methods for the synthesis of error-minimized nucleic acid molecules
JP6343605B2 (ja) 2012-05-25 2018-06-13 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア Rna依存性標的dna修飾およびrna依存性転写調節のための方法および組成物
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
US9617522B2 (en) * 2013-09-05 2017-04-11 Massachusetts Institute Of Technology Tuning bacteriophage host range
AU2015362618B2 (en) 2014-12-16 2022-01-27 C3J Therapeutics, Inc. Compositions of and methods for in vitro viral genome engineering

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006137847A2 (en) * 2004-09-13 2006-12-28 Trustees Of Boston University Engineered enzymatically active bacteriophages and methods of uses thereof

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
J. AZEREDO等: ""The Use of Phages for the Removal of Infectious Biofilms"", 《CURRENT PHARMACEUTICAL BIOTECHNOLOGY》, pages 261 - 266 *
SYLWIA PARASION等: ""Bacteriophages as an Alternative Strategy for Fighting Biofilm Development"", 《POLISH JOURNAL OF MICROBIOLOGY》, pages 137 - 145 *

Also Published As

Publication number Publication date
US10837004B2 (en) 2020-11-17
US20210087538A1 (en) 2021-03-25
WO2016100389A1 (en) 2016-06-23
CN107278227A (zh) 2017-10-20
US20160186147A1 (en) 2016-06-30
US10711253B2 (en) 2020-07-14
US11913032B2 (en) 2024-02-27
AU2022202713A1 (en) 2022-05-19
CN107278227B (zh) 2021-05-28
CA2971205A1 (en) 2016-06-23
US20190211312A1 (en) 2019-07-11
AU2015362618A1 (en) 2017-07-13
EP3234136A1 (en) 2017-10-25
US20190322988A1 (en) 2019-10-24
JP2021074024A (ja) 2021-05-20
JP6842417B2 (ja) 2021-03-17
JP7133671B2 (ja) 2022-09-08
HK1245838A1 (zh) 2018-08-31
JP2017537643A (ja) 2017-12-21
EA201791343A1 (ru) 2018-03-30
AU2015362618B2 (en) 2022-01-27
US10221398B2 (en) 2019-03-05
EP3234136A4 (en) 2018-10-10
EA038595B1 (ru) 2021-09-21

Similar Documents

Publication Publication Date Title
CN107278227B (zh) 用于体外病毒基因组工程的组合物和方法
AU2021200010B2 (en) Novel CRISPR enzymes and systems
KR102523543B1 (ko) 열안정성 cas9 뉴클레아제
KR102647766B1 (ko) 클래스 ii, 타입 v crispr 시스템
KR20190116407A (ko) 고-충실도 Cas9 변이체 및 그의 적용
EP3778899A1 (en) Rna-directed dna cleavage and gene editing by cas9 enzyme from neisseria meningitidis
KR20210149686A (ko) 유전자 편집에 유용한 폴리펩티드 및 사용 방법
CN109312386A (zh) 使用中靶靶标和脱靶靶标的多重靶标系统筛选靶特异性核酸酶的方法及其用途
CN114945665A (zh) 用于增强地衣芽孢杆菌中蛋白产生的组合物和方法
KR20210060541A (ko) 개선된 고처리량 조합 유전적 변형 시스템 및 최적화된 Cas9 효소 변이체
Bari et al. CRISPR–Cas10 assisted editing of virulent staphylococcal phages
TW202309291A (zh) 用於室內空氣修復之組合物及方法
KR20240017367A (ko) 클래스 ii, v형 crispr 시스템
CA2413612A1 (fr) Vecteurs d&#39;expression comprenant un fragment modifie de l&#39;operon tryptophane
WO2019152941A1 (en) Engineered gut microbes for reduction of reactivation of detoxified drugs
WO2024083135A1 (en) Iscb polypeptides and uses thereof
US20220008556A1 (en) Dna vector for targeted gene therapy
WO2002008431A1 (en) Compositions and methods for use thereof in modifying the genomes of microorganisms

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40057002

Country of ref document: HK