CN117529558A - 用于腺相关病毒产生的稳定产生系统 - Google Patents

用于腺相关病毒产生的稳定产生系统 Download PDF

Info

Publication number
CN117529558A
CN117529558A CN202280044018.4A CN202280044018A CN117529558A CN 117529558 A CN117529558 A CN 117529558A CN 202280044018 A CN202280044018 A CN 202280044018A CN 117529558 A CN117529558 A CN 117529558A
Authority
CN
China
Prior art keywords
nucleic acid
acid sequence
engineered cell
seq
sequence encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280044018.4A
Other languages
English (en)
Inventor
M·T·利奥纳德
J·J·甘
C·S·斯塔奇
A·A·K·尼尔森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asimov Inc
Original Assignee
Asimov Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asimov Inc filed Critical Asimov Inc
Publication of CN117529558A publication Critical patent/CN117529558A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0684Cells of the urinary tract or kidneys
    • C12N5/0686Kidney cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y601/00Ligases forming carbon-oxygen bonds (6.1)
    • C12Y601/01Ligases forming aminoacyl-tRNA and related compounds (6.1.1)
    • C12Y601/01026Pyrrolysine-tRNAPyl ligase (6.1.1.26)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14151Methods of production or purification of viral material
    • C12N2750/14152Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Urology & Nephrology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Toxicology (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

本文公开了用于AAV产生的细胞基因工程化细胞。所述基因工程化细胞包含用于AAV产生所需基因表达的时序控制的分子系统。本文还公开了使用基因工程化细胞用于AAV产生的方法。

Description

用于腺相关病毒产生的稳定产生系统
领域
本文描述的是腺相关病毒(AAV)产生系统。本文还描述了包含AAV产生系统的工程化细胞和试剂盒,以及使用所述工程化细胞和试剂盒用于AAV产生的方法。
相关申请
本申请根据35U.S.C.§119,要求2021年4月21日提交的美国临时申请序列号63/177760的权益,其整体内容通过引用并入本文。
通过EFS-Web以文本文件提交的序列表的引用
本申请包含序列表,其已经通过EFS-Web以ASCII格式提交,并在此通过引用以其整体并入。所述ASCII副本创建于2022年4月21日,命名为A121070007WO00-SEQ-ARM,并且大小为347,698字节。
背景
AAV是有前景的用于细胞和基因疗法的基因递送模式。AAV可被修饰以携带治疗性基因载荷至受试者内的细胞。AAV的产生通常需要将含有病毒载体产生所需基因的质粒瞬时转染到细胞培养物中。然而,瞬时转染有几个缺点。必须获得大量的DNA和转染试剂用于转染过程,这是昂贵的。此外,差的转染效率可导致最小数量的“转染的”细胞,并且增加与转染步骤和病毒产生相关的变异。
概要
如本文描述的AAV产生系统引入AAV产生所需基因产物的诱导控制,所述基因产物包括细胞抑制剂或细胞毒性基因产物。所述诱导控制可在基因组水平上介导(即,基因组修饰的诱导控制)或在翻译水平上介导(即,改变的翻译的诱导控制)。所描述的AAV产生系统中的每一个都可使用随机整合、靶向整合或转座子介导的整合来整合到基因组中。
在一些实施方式中,本申请公开了用于AAV产生的工程化细胞,其包含一个或多个稳定整合的核酸分子,所述核酸分子共同包含编码以下每一个的核酸序列:非规范tRNA合成酶;对应非规范tRNA合成酶的非规范tRNA;NC-Rep78;和NC-Rep52;其每一个都可操作地连接至启动子;其中,编码NC-Rep78的核酸序列和编码NC-Rep52的核酸序列各自包含是提前终止密码子和对应非规范tRNA的氨基酸密码子两者的密码子。在一些实施方式中,工程化细胞包含一个或多个稳定整合的核酸分子,所述稳定整合的核酸分子包含第一稳定整合的核酸分子,所述第一稳定整合的核酸分子包含编码非规范tRNA合成酶的核酸序列。在一些实施方式中,工程化细胞包含非规范tRNA合成酶,所述非规范tRNA合成酶是吡咯赖氨酰基(Pyrrolysyl)-tRNA合成酶(pylRS)。在一些实施方式中,工程化细胞包含含有SEQ IDNO:20和21中任一个的氨基酸序列的pylRS。在一些实施方式中,工程化细胞包含含有SEQID NO:21的氨基酸序列的PylRS。
在一些实施方式中,包含第一稳定整合的核酸分子的工程化细胞进一步包含可操作地连接至启动子的选择标记。
在一些实施方式中,包含一个或多个稳定整合的核酸分子的工程化细胞包含含有编码非规范tRNA的核酸序列的第二稳定整合的核酸分子。在一些实施方式中,工程化细胞包含使H-Lys(Boc)-OH带电的非规范tRNA。在一些实施方式中,包含在工程化细胞内的非规范tRNA是PylT U25C。在一些实施方式中,工程化细胞包含含有SEQ ID NO:22的核酸序列的PylT U25C。在一些实施方式中,包含第二稳定整合的核酸分子的工程化细胞包含四个核酸序列,所述四个核酸序列各自包含编码PylT U25C的核酸序列并且各自可操作地连接至启动子。在一些实施方式中,包含第二稳定整合的核酸分子的工程化细胞进一步包含可操作地连接至启动子的选择标记。
在一些实施方式中,包含一个或多个稳定整合的核酸分子的工程化细胞包含第三稳定整合的核酸分子,所述第三稳定整合的核酸分子包含编码NC-Rep78和NC-Rep52的核酸序列。在一些实施方式中,NC-Rep78包含在位置17处的提前终止密码子;NC-Rep52包含在位置233处的提前终止密码子;或其组合。在一些实施方式中,工程化细胞包含pylRS非规范tRNA合成酶和PylT U25C非规范tRNA。在一些实施方式中,工程化细胞包含编码NC-Rep78的核酸序列和编码NC-Rep52的核酸序列,其编码为单个转录物。在一些实施方式中,单个转录物包含编码SEQ ID NO:26-27中任一个的氨基酸序列的核酸序列。在一些实施方式中,包含第三稳定整合的核酸分子的工程化细胞进一步包含:编码NC-Rep40的核酸序列;编码NC-Rep68的核酸序列;或两者。
在一些实施方式中,工程化细胞是HEK293细胞、HeLa细胞、BHK细胞或SB9细胞。
在一些实施方式中,本申请公开了包含如上所述的工程化细胞中任一种的试剂盒。在一些实施方式中,试剂盒进一步包含多核苷酸,所述多核苷酸从5’至3’包含:(i)5’反向末端重复的核酸序列;(ii)多克隆位点;和(iii)3’反向末端重复的核酸序列。在一些实施方式中,包含在试剂盒内的多核苷酸是质粒或载体。
在一些实施方式中,本申请公开了用于AAV产生的方法,所述方法包括将如上所述的工程化细胞中的任一种与非规范氨基酸接触。在一些实施方式中,非规范氨基酸是H-Lys(Boc)-OH。
在一些方面中,本申请公开了工程化细胞,所述工程化细胞包含一个或多个稳定整合的核酸分子,所述核酸分子共同包含编码以下每一个的核酸序列:Rep52、DA-Rep52、Rep40或DA-Rep40;Rep78、DA-Rep78、Rep68或DA-Rep68;E2A或DA-E2A;E4ORF6或DA-E4ORF6;VARNA或DA-VARNA;VP1或DA-VP1;VP2或DA-VP2;VP3或DA-VP3;AAP;以及L4 100K或DA-L4100K,和碱基编辑器,每个核酸分子可操作地连接至启动子;其中细胞包含DA-Rep52、DA-Rep40、DA-Rep78、DA-Rep68、DA-E2A、DA-E4ORF6、DA-VP1、DA-VP2、DA-V3和DA-L4 100K中至少一个的核酸序列;其中DA-Rep52、DA-Rep40、DA-Rep78、DA-Rep68、DA-E2A、DA-E4ORF6、DA-VP1、DA-VP2、DA-V3和DA-L4 100K的核酸序列各自包含修饰密码子。
在一些实施方式中,修饰密码子编码错义密码子,并且其中修饰密码子中胞嘧啶或腺嘌呤的脱氨作用将编码的氨基酸转化为另一种氨基酸。
在一些实施方式中,修饰密码子编码提前终止密码子,并且其中修饰密码子中腺嘌呤的脱氨作用将修饰密码子转化为色氨酸密码子、谷氨酰胺密码子或精氨酸。
在一些实施方式中,修饰密码子编码提前终止密码子,并且其中修饰密码子中胞嘧啶的脱氨作用将编码的氨基酸转化为脯氨酸。
在一些实施方式中,工程化细胞包含一个或多个稳定整合的核酸分子,其各自包含编码一个或多个CTCF绝缘子的核酸序列。
在一些实施方式中,包含一个或多个稳定整合的核酸分子的工程化细胞包含第一稳定整合的核酸分子,所述第一稳定整合的核酸分子包含编码DA-E2A的核酸序列、编码DA-E4ORF6的核酸序列和编码VARNA的核酸序列。在一些实施方式中,第一稳定整合的核酸分子进一步包含编码L4100K或DA-L4 100K的核酸序列。在一些实施方式中,第一稳定整合的核酸分子进一步包含可操作地连接至启动子的选择标记。
在一些实施方式中,第一稳定整合的核酸分子包含DA-E2A的核酸序列,所述DA-E2A的核酸序列包含导致一个或多个提前终止密码子的至腺嘌呤或胞嘧啶的一个或多个突变。在一些实施方式中,编码DA-E2A的核酸序列包含SEQ ID NO:39或40的氨基酸序列。在一些实施方式中,DA-E2A(SEQ ID NO:39或40)的位置181和/或324对应导致提前终止密码子的至腺嘌呤的突变。
在一些实施方式中,第一稳定整合的核酸分子包含DA-E4ORF6的核酸序列,所述核酸序列包含导致一个或多个提前终止密码子的至腺嘌呤的一个或多个突变。在一些实施方式中,编码DA-E4ORF6的核酸序列包含SEQ ID NO:41或42的氨基酸序列。在一些实施方式中,DA-E4ORF6(SEQ ID NO:41或42)的位置77和/或192对应包含导致提前终止密码子的腺嘌呤的修饰密码子。
在一些实施方式中,一个或多个稳定整合的核酸分子包含第二稳定整合的核酸分子,所述第二稳定整合的核酸分子包含编码DA-Rep52或DA-Rep40的核酸序列、编码DA-Rep78或DA-Rep68的核酸序列、编码VP1或DA-VP1的核酸序列、编码VP2或DA-VP2的核酸序列以及编码VP3或DA-VP3的核酸序列。在一些实施方式中,第二整合的核酸分子进一步包含可操作地连接至启动子的选择标记。
在一些实施方式中,第二稳定整合的核酸分子包含编码DA-Rep52或DA-Rep40的核酸序列。在一些实施方式中,编码DA-Rep52的核酸序列包含SEQ ID NO:43或47的氨基酸序列。在一些实施方式中,编码DA-Rep40的核酸序列包含SEQ ID NO:44或48的氨基酸序列。在一些实施方式中,第二稳定整合的核酸分子包含编码DA-Rep78或DA-Rep68的核酸序列。在一些实施方式中,编码DA-Rep78的核酸序列包含SEQ ID NO:45、49和51中任一个的氨基酸序列。
在一些实施方式中,第二稳定整合的核酸分子包含编码DA-Rep68的核酸序列,所述DA-Rep68包含SEQ ID NO:46、50或52的氨基酸序列。在一些实施方式中,第二稳定整合的核酸分子包含编码Rep52或DA-Rep52;Rep40或DA-Rep40;Rep68或DA-Rep68;以及Rep78或DA-Rep78的氨基酸序列。在一些实施方式中,编码Rep52或DA-Rep52;Rep40或DA-Rep40;Rep68或DA-Rep68;以及Rep78或DA-Rep78的核酸序列包含SEQ ID NO:53-55、113-115中任一个的核酸序列。在一些实施方式中,编码DA-Rep52、DA-Rep40、DA-Rep68和DA-Rep78的核酸序列包含导致一个或多个提前终止密码子至腺嘌呤或胞嘧啶的一个或多个突变。在一些实施方式中,核苷酸序列中的一个腺嘌呤突变在对应DA-Rep78(SEQ ID NO:45、49和51)的氨基酸位置67、262和/或319的位置处。
在一些实施方式中,第二稳定整合的核酸分子进一步包含编码一个或多个sgRNA的核酸序列。在一些实施方式中,一个或多个sgRNA各自包含与含有至腺嘌呤或胞嘧啶的一个或多个突变的核酸序列互补的核酸序列。在一些实施方式中,一个或多个sgRNA各自包含SEQ ID NO:56-81中任一个的核酸序列。在一些实施方式中,一个或多个sgRNA可操作地连接至化学诱导型启动子。在一些实施方式中,可操作地连接至一个或多个sgRNA的化学诱导型启动子选自由pTRE3G;pTREtight;或包含VanR、TtgR、PhlF、CymR或Gal4 UAS操纵子序列中至少一个的启动子组成的组。在一些实施方式中,可操作地连接至一个或多个sgRNA的编码化学诱导型启动子的核酸序列是SEQ ID NO:1和2中的任一个或包含SEQ ID NO:86-91中的任一个。
在一些实施方式中,第二稳定整合的核酸分子包含编码VP1或DA-VP1、VP2或DA-VP2、以及VP3或DA-VP3的核酸序列。在一些实施方式中,编码VP1的核酸序列包含SEQ IDNO:14的氨基酸序列。在一些实施方式中,编码DA-VP1的核酸序列包含SEQ ID NO:99或102的氨基酸序列。在一些实施方式中,编码VP2的核酸序列包含SEQ ID NO:15的氨基酸序列。在一些实施方式中,编码DA-VP2的核酸序列包含SEQ ID NO:100或103的氨基酸序列。在一些实施方式中,编码VP3的核酸序列包含SEQ ID NO:16的氨基酸序列。在一些实施方式中,编码DA-VP3的核酸序列包含SEQ ID NO:101或104的氨基酸序列。
在一些实施方式中,第二稳定整合的核酸分子包含编码AAP的核酸序列。在一些实施方式中,编码AAP的核酸序列包含SEQ ID NO:17的氨基酸序列。
在一些实施方式中,包含一个或多个稳定整合的核酸分子的工程化细胞包含第三稳定整合的核酸分子,所述第三稳定整合的核酸分子包含编码转录激活子的核酸序列和编码碱基编辑器的核酸序列,所述编码转录激活子的核酸序列当在小分子诱导物的存在下表达时,结合至工程化细胞的化学诱导型启动子。在一些实施方式中,第三稳定整合的核酸分子进一步包含可操作地连接至启动子的选择标记。
在一些实施方式中,包含碱基编辑器的第三稳定整合的核酸分子包含腺嘌呤碱基编辑器(ABE)或胞嘧啶碱基编辑器(CBE)。在一些实施方式中,CBE是Cas9 CBE或Cas13 CBE。在一些实施方式中,ABE是Cas9ABE或Cas13 ABE。在一些实施方式中,Cas9 ABE由包含SEQID NO:82或83的氨基酸序列编码。在一些实施方式中,Cas13 ABE由包含SEQ ID NO:84或85的氨基酸序列编码。在一些实施方式中,编码ABE的核酸序列可操作地连接至第三化学诱导型启动子。在一些实施方式中,ABE可操作地连接至第三化学诱导型启动子,所述第三化学诱导型启动子选自由pTRE3G;pTREtight;或包含VanR、TtgR、PhlF或CymR或Gal4 UAS操纵子序列中至少一个的启动子组成的组。在一些实施方式中,编码第三化学诱导型启动子的核酸序列是SEQ ID NO:1和2中的任一个或包含SEQ ID NO:86-91中的任一个。在一些实施方式中,工程化细胞包含转录激活子,所述转录激活子选自由TetOn-3G、TetOn-V16、TetOff-Advanced、VanR-VP16、TtgR-VP16、PhlF-VP16、以及cumate cTA和rcTA组成的组。在一些实施方式中,转录激活子由小分子诱导物激活,所述小分子诱导物选自由多西环素、香草酸盐、根皮素、雷帕霉素、脱落酸、赤霉酸乙酰氧基甲酯和cumate组成的组。在一些实施方式中,转录激活子是TetOn3G,并且小分子诱导物是多西环素。
在一些实施方式中,工程化细胞是HEK293细胞或HeLa细胞。
在一些方面中,本申请公开了包含如本文描述的工程化细胞的试剂盒。在一些实施方式中,试剂盒进一步包含多核苷酸,所述多核苷酸从5’到3’包含:(i)5’反向末端重复的核酸序列;(ii)多克隆位点;和(iii)3’反向末端重复的核酸序列。在一些实施方式中,包含在试剂盒内的多核苷酸是质粒或载体。
在一些方面中,本申请公开了用于AAV产生的方法,所述方法包括将如上所述的工程化细胞与结合至化学诱导型启动子的小分子诱导物接触。在一些实施方式中,小分子诱导物选自由多西环素、香草酸盐、根皮素、雷帕霉素、脱落酸、赤霉酸乙酰氧基甲酯和cumate组成的组。
附图简述
图1为ncAA AAV质粒的质粒示意图。古细菌马氏甲烷八叠球菌(Methanosarcinamazei)正交tRNA合成酶(“pylRS”)使用hEF1a组成型表达。同源性tRNA(“PylT”)在多拷贝环境中使用U6 RNA聚合酶III启动子表达,因为ncAA并入的效率与ncAA tRNA丰度有关。除了D233X和E17XTAG终止密码子突变外,仅RepAAV2 Rep78+52构建体包含破坏Rep68/40剪接位点的点突变。AAV2 Rep52/40-IRES-Rep78/68构建体含有消除/最小化p19 AAV2启动子的活性的点突变,并含有D233X和E17X。AAV WT Rep构建体编码Rep78/68/52/40,并且包含D233X和E17X TAG终止密码子突变。利用这些ncAA质粒在Cap和Helper基因表达构建体的背景下进行瞬时测试,可用于表征ncAA诱导的AAV产生。
图2是瞬时转染质粒的质粒示意图。通过突变Rep、Cap、E2A、L4100K和/或E4 ORF6编码序列中的色氨酸(W)、谷氨酰胺(Q)或精氨酸(R)密码子,可产生提前终止密码子。在转染期间,组成型表达的ABE和单引导RNA修复这些终止密码子以产生AAV。在不存在ABE或单引导RNA的情况下,无AAV产生。
图3是质粒稳定整合的质粒示意图。转座子IR/DR、CTCF绝缘子和抗生素抗性选择盒在AAV载荷、突变Rep/Cap和突变辅助基因的侧翼。Rep、E2A和E4 ORF6中可引入一个或多个提前终止密码子。ABE由可诱导的TRE启动子表达,rtTA(TetOn)基因融合至同一质粒上的抗生素抗性基因。
图4描绘了Rep、Cap、E2A、E4 ORF6和L4 100K的单个提前终止突变体,含或不含ABE8.17-m来恢复病毒滴度。在不存在ABE的情况下,所有测试的Rep和Cap突变体都能将AAV滴度降低到与阴性对照(“无编辑器”)相当的水平。突变体Rep78 W319*和Rep78 Q262*能够用ABE8.17-m恢复至与“野生型”AAV(“ABE8.17-m[V106W]”)相当的滴度。然而,在不存在ABE的情况下,仅仅E2A、E4 ORF6或L4 100K的单个突变不足以完全降低AAV滴度。
图5显示了各种pHelper突变与突变Rep W319*或“野生型”pRepCap质粒的组合,并与或不与ABE8.17-m共转染。用惰性质粒替代pHelper质粒作为阴性对照。在不存在ABE的所有三重突变(“RepW319*,ABE-”)均显示AAV滴度与阴性对照水平相当的降低。当只观察在不存在ABE的情况下双重pHelper突变(“wtRep,ABE-”)时,AAV滴度降低,但没有完全消除。共转染ABE(“wtRep,ABE+”和“RepW319*,ABE+”)将滴度恢复到接近“野生型”AAV(第一“wtpHelper”和“wtRep,ABE+”柱)的水平,对于每个测试的突变组合在2倍之内。
图6显示各种稳定的AAV质粒与或不与多西环素共转染的组合。不与ABE质粒的共转染作为阴性对照。当使用可诱导的引导RNA时,所得AAV滴度与在不存在多西环素的情况下的阴性对照水平相当,并且与在存在多西环素的情况下的野生型AAV滴度水平相当,两者均在4倍之内。然而,当使用组成型引导RNA时,在存在和不存在多西环素的情况下,所得AAV滴度均与野生型对照水平相当,在2倍之内,表明在瞬时测试的质粒组合中缺乏诱导性。
某些实施方式的详细描述
AAV是有前景的用于细胞和基因疗法的基因递送模式。AAV的产生通常需要将质粒瞬时转染到细胞培养物中。然而,与经由瞬时转染的传统产生相比,将产生治疗性AAV所需的基因稳定整合到基因组中具有几个优势。由于细胞在其自身细胞分裂期间扩增病毒基因,因此不再需要获得大量的DNA和转染试剂用于转染过程,从而降低了成本。此外,由于DNA已经在细胞核内,由于“未转染的”细胞的极小数量,并且与转染步骤相关的变异减少,病毒滴度可能更高以及更一致。更简单的产生过程还节省科学家的时间。
然而,腺相关病毒(AAV)载体产生所需的几个基因已被其他人证明具有细胞抑制性或细胞毒性,即Rep、E2A和E4。在广泛使用的HEK293细胞系中,由于腺病毒E1基因在HEK293细胞中的天然表达上调了这些毒性基因的表达,这些蛋白质的细胞毒性和细胞抑制性阻碍了稳定的AAV产生细胞系的发展。用这些基因稳定转染的细胞无法在选择步骤中存活或具有沉默的表达,导致无法产生相关数量的AAV。
I.腺相关病毒产生系统
在一些方面中,本公开涉及腺相关病毒(AAV)产生系统。在一些实施方式中,AAV产生系统允许对AAV产生所需的基因产物进行诱导控制,所述基因产物包含对细胞具有细胞毒性或细胞抑制性的产物。所述诱导控制可以在基因组水平上介导(即,基因组修饰的诱导控制)或在翻译水平上介导(即,改变的翻译的诱导控制)。
如本文描述的,AAV产生系统包含一个或多个多核酸,所述一个或多个多核酸共同包含:(a)AAV产生组分和(b)活性控制组分。如本文所用,术语“AAV产生组分”是指一个或多个多核酸,所述一个或多个多核酸共同编码在重组宿主细胞中AAV产生所需的基因产物,其中至少一个AAV产生所需基因被修饰为包含降低AAV产生所需基因的活性的突变。在一些实施方式中,突变导致提前终止密码子。
在一些实施方式中,AAV产生组分包含一个或多个多核苷酸,所述一个或多个多核苷酸共同编码在重组宿主细胞中生成AAV载体所需的基因产物。示例性AAV基因产物包含Rep52、Rep40、Rep78、Rep68、E2A、E4Orf6、VARNA、CAP(VP1、VP2、VP3)和AAP。Rep基因产物(包含Rep52、Rep40、Rep78和Rep68)参与AAV基因组复制。在AAV复制期间,E2A基因产物参与辅助DNA合成进行性(processivity)。E4Orf6基因产物支持AAV复制。VARNA基因产物在调节翻译中起作用。CAP基因产物(包含VP1、VP2、VP3)编码病毒衣壳蛋白。AAP基因产物在衣壳组装中起作用。在一些实施方式中,AAV组分包含一个或多个多核苷酸,所述一个或多个多核苷酸共同编码基因产物:Rep52或Rep40;Rep78或Rep68;EA2;E4Orf6;VARNA;VP1;VP2;VP3;和AAP。在一些实施方式中,AAV组分包含一个或多个多核苷酸,所述一个或多个多核苷酸共同编码基因产物:Rep52、Rep40、Rep78、Rep68、E2A、E4Orf6、VARNA、VP1、VP2、VP3和AAP。
在一些实施方式中,AAV产生组分包含异源多核酸,所述异源多核酸包含编码AAV产生所需基因产物的核酸序列(例如,对细胞具有细胞毒性或细胞抑制性的产物,诸如Rep、E2A和/或E4),其中基因产物被修饰为包含降低AAV产生所需基因活性的突变。在一些实施方式中,突变导致提前终止密码子。
在一些实施方式中,包含编码AAV产生所需基因产物的核酸序列的异源多核酸包含至少1个突变(例如,至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9或至少10个突变)。在一些实施方式中,包含编码AAV产生所需基因产物的核酸序列的异源多核酸包含1、2、3、4、5、6、7、8、9或10个突变。在一些实施方式中,包含编码AAV产生所需基因产物的核酸序列的异源多核酸包含1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、2-3、2-4、2-5、2-6、2-7、2-8、2-9、2-10、3-4、3-5、3-6、3-7、3-8、3-9、3-10、4-5、4-6、4-7、4-8、4-9、4-10、5-6、5-7、5-8、5-9、5-10、6-7、6-8、6-9或6-10个突变。在一些实施方式中,包含编码AAV产生所需基因产物的核酸序列的异源多核酸内的任何密码子都可被突变。
在一些实施方式中,包含编码AAV产生所需基因产物的核酸序列的异源多核酸包含至少1个提前终止密码子(例如,至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9或至少10个提前终止密码子)。在一些实施方式中,包含编码AAV产生所需基因产物的核酸序列的异源多核酸包含1、2、3、4、5、6、7、8、9或10个提前终止密码子。在一些实施方式中,包含编码AAV产生所需基因产物的核酸序列的异源多核酸包含1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、2-3、2-4、2-5、2-6、2-7、2-8、2-9、2-10、3-4、3-5、3-6、3-7、3-8、3-9、3-10、4-5、4-6、4-7、4-8、4-9、4-10、5-6、5-7、5-8、5-9、5-10、6-7、6-8、6-9或6-10个提前终止密码子。在一些实施方式中,包含编码AAV产生所需基因产物的核酸序列的异源多核酸内的任何密码子都可被修饰为提前终止密码子。
如本文所用,术语“提前终止密码子”是指通过突变编码序列中的一个或多个核酸残基使给定密码子的序列变为TAG、TAA或TGA,从而添加到基因编码序列中的终止密码子。
在一些实施方式中,AAV产生组分(即,AAV组分的基因产物)在单个多核酸上编码。在其他实施方式中,多个多核酸共同包含AAV组分(即,AAV组分的至少两个基因产物在不同的多核酸上编码)。例如,AAV组分可包含至少2、至少3、至少4或至少5个多核酸。在一些实施方式中,AAV组分包含2、3、4或5个多核酸。
如本文所用,术语“活性控制组分”是指共同编码诱导AAV产生所需基因产生所需的基因产物的一个或多个多核酸,所述基因产物包含降低基因产物活性的一个或多个突变。在一些实施方式中,与野生型基因产物相比,一个或多个突变降低AAV产生所需基因产物的活性至少10%(例如,至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%或至少99%)。在一些实施方式中,一个或多个突变降低AAV产生所需基因产物的活性10%-20%、10%-30%、10%、50%、10%-70%、10%-90%、10%-99%、30%-50%、30%-70%、30%-90%、30%-99%、50%-70%、50%-90%、50%-99%、70%-90%或70%-99%。在一些实施方式中,AAV产生所需基因中的一个或多个突变导致基因产物功能的丧失。在一些实施方式中,一个或多个突变降低细胞中的AAV产生至少1倍(例如至少1倍、至少2倍、至少5倍、至少10倍、至少50倍、至少100倍、至少500倍、至少1000倍、至少10000倍)。在一些实施方式中,一个或多个突变降低细胞中的AAV产生1-2、1-5、1-10、1-50、1-100、1-1000、5-10、5-50、5-100、5-1000、10-20、10-50、10-100、10-1000、10-10000、100-1000或100-10000倍。
在一些实施方式中,AAV产生所需基因被突变为包含提前终止密码子。在一些实施方式中,活性控制组分包含一个或多个多核酸,所述一个或多个多核酸共同编码诱导包含提前终止密码子的基因表达所需基因产物。如本文描述的示例性活性控制组分包含非规范tRNA合成酶/tRNA系统和碱基编辑器系统。在一些实施方式中,活性控制组分包含能够校正AAV产生所需基因中的一个或多个突变的碱基编辑器(例如ABE或CBE)。在一些实施方式中,活性控制组分包含能够校正AAV产生所需基因中的1、2、3、4、5、6、7、8、9、10或20个突变的碱基编辑器(例如ABE或CBE)。在一些实施方式中,活性控制组分包含能够编辑提前终止密码子使得其编码规范密码子的碱基编辑器(例如ABE)。在一些实施方式中,活性控制组分包含能够编辑提前终止密码子使得其编码原始野生型规范密码子的碱基编辑器系统。在一些实施方式中,活性控制组分包含与提前终止密码子互补的非规范tRNA反密码子的非规范tRNA合成酶/tRNA系统。在一些实施方式中,非规范tRNA合成酶/tRNA系统使非规范氨基酸带电,使得当非规范氨基酸存在时,在翻译期间所述非规范氨基酸被并入AAV产生所需的蛋白质中。在一些实施方式中,非规范tRNA合成酶/tRNA系统是化学诱导的。
在一些实施方式中,活性控制组分在单个多核酸上编码。在一些实施方式中,多个多核酸共同包含活性控制组分。例如,活性控制组分可包含至少2、至少3、至少4或至少5个多核酸。在一些实施方式中,活性控制组分包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个多核酸。
如本文所用,术语“启动子”是指能够被蛋白质结合以启动来自DNA的RNA转录的核酸序列。启动子可以是组成型启动子(即,允许持续转录的不受调控的启动子)。本领域已知的组成型启动子的实例包括但不限于巨细胞病毒(CMV)启动子、延伸因子1α(EF1α)启动子、猿猴空泡病毒40(SV40)启动子、泛素-C(UBC)启动子、U6启动子和磷酸甘油酸激酶(PGK)启动子。参见,例如Ferreira等人,Tuning gene expression with synthetic upstreamopen reading frames.Proc.Natl.Acad.Sci.U.S.A.2013Jul;110(28):11284-89;公开号:US2014/377861 A1–其整体通过引用并入本文。可替选地,启动子可以是诱导型启动子(即,仅在特定情况下激活转录)。诱导型启动子可以是化学诱导型启动子、温度诱导型启动子或光诱导型启动子。诱导型启动子的实例在本领域是已知的,并且包括但不限于四环素/多西环素诱导型启动子、cumate诱导型启动子、ABA诱导型启动子、CRY2-CIB1诱导型启动子、DAPG诱导型启动子和米非司酮诱导型启动子。参见例如Stanton等人,ACSSynth.Biol.2014Dec 19;3(12):880-91;Liang等人,Sci.Signal.2011Mar 15;4(164):rs2;专利号:US 7,745,592B2;专利号:US 7,935,788 B2–其整体通过引用并入本文。
在一些实施方式中,本文描述的AAV产生系统进一步包含工程化细胞。工程化细胞可包含本文描述的AAV产生系统的任何部分(以及部分的任何组合)。
例如,工程化细胞可包含AAV产生组分的至少一部分。例如,如上所述,AAV产生组分可包含多个多核酸。在此类实施方式中,工程化细胞包含所述多个多核酸中的一个或多个,其每一个可位于染色体外或稳定地整合到工程化细胞的基因组中。在一些实施方式中,工程化细胞包含整个AAV产生组分。
可替选地或另外地,工程化细胞可包含AAV产生系统的活性控制组分。
在一些实施方式中,AAV产生系统包含:(a)包含AAV产生组分的工程化细胞,所述AAV产生组分包含一个或多个异源多核酸,所述一个或多个异源多核酸共同编码AAV产生所需基因,其中至少一个基因包含突变;(b)活性控制组分,能够诱导产生和/或校正至少一个包含突变的基因的突变。在一些实施方式中,突变导致提前终止密码子。
A.着陆点(landing pad)
如本文描述的工程化细胞可进一步包含着陆点。如本文所用,术语“着陆点”是指异源多核酸序列,其促进将“载荷”序列靶向插入细胞的基因组的特定基因座(或多个基因座)。因此,着陆点被整合到细胞的基因组中。固定的整合点对于减少可能由位置表观基因效应或近端调控元件引起的实验之间的可变性是期望的。控制载荷拷贝数的能力对于在不改变任何基因组分的情况下调节载荷的表达水平也是期望的。
在一些实施方式中,着陆点在工程化细胞的基因组中的安全港位点。如本文所用,术语“安全港位点”是指基因组中的位置,其中基因或基因元件可以在不破坏相邻基因的表达或调控的情况下被引入,和/或相邻基因组元件不破坏所引入的基因或基因元件的表达或调控。安全港位点的实例是具有本领域技术的人员已知的,并且包括但不限于AAVS1、ROSA26、COSMIC、H11、CCR5和LiPS-A3S。参见,例如Gaidukov等人,Nucleic AcidsRes.2018May 4;46(8):4072-4086;专利号:US 8,980,579 B2;专利号:US10,017,786B2;专利号:US 9,932,607 B2;公开号:US 2013/280222A;公开号:WO 2017/180669 A1–其整体并入本文。在一些实施方式中,安全港位点是已知位点。在其他实施方式中,安全港位点是先前未公开的位点。参见本文“鉴定高表达基因座的方法及其用途”。在一些实施方式中,如本文描述的工程化细胞包含整合在选自由AAVS1、ROSA26、COSMIC、H11、CCR5和LiPS-A3S组成的组的安全港位点处的着陆点。
在一些实施方式中,工程化细胞源自HEK293细胞。在一些实施方式中,工程化HEK293细胞包含着陆点,所述着陆点整合在选自由AAVS1、ROSA26、CCR5和LiPS-A3S组成的组的安全港位点处。
在一些实施方式中,工程化细胞源自CHO细胞。在一些实施方式中,工程化CHO细胞包含着陆点,所述着陆点整合在选自由ROSA26、COSMIC和H11组成的组的安全港位点处。
如本文描述的每个着陆点包含至少一个重组位点。各种整合酶的重组位点先前已被鉴定。例如,着陆点可包含对应Bxb1整合酶、λ-整合酶、Cre重组酶、Flp重组酶、γ-δ分解酶、Tn3分解酶、整合酶或R4整合酶的重组位点。示例性重组位点序列是本领域已知的(例如,attP、attB、attR、attL、Lox和Frt)。
如本文描述的着陆点可包含一个或多个表达盒。
在一些实施方式中,载荷序列包含编码第一反向末端重复(ITR)、第二ITR和可操作地连接至启动子的基因的核酸分子(如本文描述的)。在一些实施方式中,载荷包含编码5’–ITR-启动子-基因-ITR–3’的核酸分子,其中基因是用于AAV递送的基因。在一些实施方式中,基因是荧光蛋白。在一些实施方式中,基因是绿色荧光蛋白。在一些实施方式中,载荷序列包含多克隆位点。
B.转录激活子
在一些实施方式中,AAV产生系统进一步包含编码转录激活子的核酸序列。在一些实施方式中,转录激活子选自由TetOn-3G、rtTA-V16、TetOff-Advanced、VanR-VP16、TtgR-VP16、PhlF-VP16、以及cumate cTA和rcTA组成的组。在一些实施方式中,转录激活子是选自由rtTA-V1、rtTA-V2、rtTA-V3、rtTA-V4、rtTA-V5、rtTA-V7、rtTA-V8、rtTA-V9、rtTA-V10、rtTA-V11、rtTA-V12、rtTA-V13、rtTA-V14、rtTA-V15、rtTA-V16、rtTA-V17和rtTA-V18组成的组的rtTA/TetOn变体,如Das等人,Curr.Gene Therapy 2016;16(3):156-67(其通过引用以其整体并入)中所述的。在一些实施方式中,编码转录激活子的核酸序列融合至选择标记。在一些实施方式中,转录激活子可操作地连接至启动子。在一些实施方式中,转录激活子可操作地连接至组成型活性启动子。在一些实施方式中,转录激活子可操作地连接至其相应的化学诱导型启动子。在非限制性实例中,TetOn-3G转录激活子可以可操作地连接至TRE启动子。在一些实施方式中,转录激活子可操作地连接至hEF1a启动子。在一些实施方式中,转录激活子当暴露于小分子诱导物时,诱导工程化细胞内相应化学诱导型启动子的表达。在一些实施方式中,小分子诱导物选自由多西环素、香草酸盐、根皮素、雷帕霉素、脱落酸、赤霉酸乙酰氧基甲酯和cumate组成的组。
II.在mRNA翻译期间引入氨基酸替换提前终止密码子的AAV产生系统
用于在mRNA翻译期间引入氨基酸替代提前终止密码子的系统可包含非规范tRNA合成酶、非规范tRNA或其组合。在一些实施方式中,用于引入氨基酸替代提前终止密码子的系统进一步包含非规范氨基酸。
如本文所用,术语“非规范tRNA合成酶”是指在工程化细胞所衍生的细胞中非天然存在的tRNA合成酶。tRNA合成酶是在翻译期间催化氨基酸与同源性tRNA共价附接的酶。
如本文所用,术语“非规范tRNA”是指具有反密码子的tRNA,所述反密码子不被工程化细胞所衍生的细胞的天然存在的tRNA使用。在一些实施方式中,非规范tRNA包含对应工程化细胞的提前终止密码子(TAG、TAA或TGA)的反密码子。在一些实施方式中,非规范tRNA通过相应的非规范tRNA合成酶带电;就特定的tRNA合成酶而言,非规范tRNA可称为偶联tRNA。
在一些实施方式中,活性控制组分包含非规范tRNA合成酶及其偶联非规范tRNA。在一些实施方式中,非规范tRNA合成酶及其偶联非规范tRNA选自由大肠杆菌GlnRS-tRNAGln、大肠杆菌TyrRS&Bst tRNATyr、大肠杆菌TyrRS-tRNATyr、枯草芽孢杆菌TrpRS-tRNATrp、大肠杆菌TrpRS-tRNATrp、大肠杆菌LeuRS-tRNALeu、M.bareri PylRS(b)-tRNAPyl、M.bareri PylRS&四氯乙烯降解菌(D.hafniense)tRNAPyl、大肠杆菌TyrRS&嗜热脂肪地芽孢杆菌tRNATyr组成的组,如Mukai,Takahito等人,Annual review ofmicrobiology 71(2017):557-577(其通过引用以其整体并入)中所述的。在一些实施方式中,非规范tRNA合成酶及其偶联非规范tRNA为M.mazei吡咯赖氨酰基-tRNA合成酶(PylRS)-tRNAPyl,其在mRNA翻译期间并入非规范氨基酸H-Lys(Boc)-OH(一种l-赖氨酸衍生物)。
A.示例性非规范tRNA合成酶
在一些实施方式中,用于在mRNA翻译期间引入氨基酸替代提前终止密码子的系统包含异源多核苷酸,所述异源多核苷酸包含可操作地连接至启动子(如本文描述的组成型或诱导型)的编码非规范tRNA合成酶的核酸序列。本领域已知的示例性非规范tRNA合成酶,包括但不限于大肠杆菌GlnRS、大肠杆菌TyrRS、枯草芽孢杆菌TrpRS、大肠杆菌TrpRS、大肠杆菌LeuRS、M.bareri PylRS、大肠杆菌TyrRS和M.mazei PylRS。在一些实施方式中,活性控制组分包含异源多核酸,所述异源多核酸包含编码选自由大肠杆菌GlnRS、大肠杆菌TyrRS、枯草芽孢杆菌TrpRS、大肠杆菌TrpRS、大肠杆菌LeuRS、M.bareri PylRS、大肠杆菌TyrRS和M.mazei PylRS组成的组的tRNA合成酶的核酸序列。
在一些实施方式中,如本文描述的活性控制组分的非规范tRNA合成酶包含与SEQID NO:20(“M.mazei PylRS”)具有至少80%同一性(例如,至少80%、至少85%、至少90%、至少95%或至少99%同一性)的氨基酸序列。在一些实施方式中,非规范tRNA合成酶包含SEQ ID NO:20的氨基酸序列。在一些实施方式中,非规范tRNA由SEQ ID NO:20的氨基酸序列组成。
在一些实施方式中,非规范tRNA合成酶包含与SEQ ID NO:21(“MmPylRS(Y384F)”)具有至少80%同一性(例如,至少80%、至少85%、至少90%、至少95%或至少99%同一性)的氨基酸序列,其中位置384处的氨基酸为F。在一些实施方式中,非规范tRNA合成酶包含SEQ ID NO:21的氨基酸序列。在一些实施方式中,非规范tRNA合成酶由SEQ ID NO:21的氨基酸序列组成。
在一些实施方式中,用于在mRNA翻译期间引入非规范氨基酸替代提前终止密码子的系统包含一个或多个异源多核苷酸,所述一个或多个异源多核苷酸共同包含编码至少两种非规范tRNA合成酶的核酸序列(如上所述),其每一个可操作地连接至启动子(如本文描述的组成型或诱导型)。例如,在一些实施方式中,活性控制组分包含编码至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9或至少10种tRNA合成酶的核酸序列(如上所述)。在一些实施方式中,活性控制组分包含编码2-3、2-4、2-5、2-6、2-7、2-8、2-9、2-10、3-4、3-5、3-6、3-7、3-8、3-9、3-10、4-5、4-6、4-7、4-8、4-9、4-10、5-6、5-7、5-8、5-9、5-10、6-7、6-8、6-9或6-10种tRNA合成酶的核酸序列(如上所述)。在一些实施方式中,活性控制组分包含编码2、3、4、5、6、7、8、9或10种tRNA合成酶的核酸序列(如上所述)。
如本文描述的活性控制组分可包含编码至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9或至少10种不同tRNA合成酶的核酸序列(如上所述)。在一些实施方式中,活性控制组分包含编码2-3、2-4、2-5、2-6、2-7、2-8、2-9、2-10、3-4、3-5、3-6、3-7、3-8、3-9、3-10、4-5、4-6、4-7、4-8、4-9、4-10、5-6、5-7、5-8、5-9、5-10、6-7、6-8、6-9或6-10种不同tRNA合成酶的核酸序列(如上所述)。在一些实施方式中,活性控制组分包含编码2、3、4、5、6、7、8、9或10种不同tRNA合成酶的核酸序列(如上所述)。
B.示例性非规范tRNA
在一些实施方式中,活性控制组分包含异源多核苷酸,所述异源多核苷酸包含可操作地连接至启动子(本文所述的组成型或诱导型)的编码非规范tRNA的核酸序列。示例性非规范tRNA在本领域是已知的,并且包括但不限于大肠杆菌tRNAGln、大肠杆菌tRNATyr、枯草芽孢杆菌tRNATrp、大肠杆菌tRNATrp、大肠杆菌tRNALeu、M.bareri tRNAPyl、四氯乙烯降解菌tRNAPyl、嗜热脂肪地芽孢杆菌tRNATyr和M.mazei tRNAPyl。在一些实施方式中,活性控制组分包含异源多核酸,所述异源多核酸包含编码选自由大肠杆菌tRNAGln、大肠杆菌tRNATyr、枯草芽孢杆菌tRNATrp、大肠杆菌tRNATrp、大肠杆菌tRNALeu、M.bareri tRNAPyl、四氯乙烯降解菌tRNAPyl、嗜热脂肪地芽孢杆菌tRNATyr和M.mazei tRNAPyl组成的组的tRNA的核酸序列。
在一些实施方式中,如本文描述的活性控制组分的非规范tRNA包含与SEQ ID NO:22(“PylT(U25C)”)具有至少80%同一性(例如,至少80%、至少85%、至少90%、至少95%或至少99%同一性)的核酸序列。在一些实施方式中,非规范tRNA包含SEQ ID NO:22的核酸序列。在一些实施方式中,非规范tRNA由SEQ ID NO:22的核酸序列组成。
在一些实施方式中,用于在mRNA翻译期间引入非规范氨基酸替代提前终止密码子的系统包含一个或多个异源多核苷酸,所述一个或多个异源多核苷酸共同包含编码至少两个非规范tRNA(如上所述)的核酸序列,其每一个可操作地连接至启动子(如本文描述的组成型或诱导型)。例如,在一些实施方式中,活性控制组分包含编码至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9或至少10个tRNA(如上所述)的核酸序列。在一些实施方式中,活性控制组分包含编码2-3、2-4、2-5、2-6、2-7、2-8、2-9、2-10、3-4、3-5、3-6、3-7、3-8、3-9、3-10、4-5、4-6、4-7、4-8、4-9、4-10、5-6、5-7、5-8、5-9、5-10、6-7、6-8、6-9或6-10个tRNA(如上所述)的核酸序列。在一些实施方式中,活性控制组分包含编码2、3、4、5、6、7、8、9或10个tRNA(如上所述)的核酸序列。
如本文描述的活性控制组分可包含编码至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9或至少10个不同tRNA合成酶(如上所述)的核酸序列。在一些实施方式中,活性控制组分包含编码2-3、2-4、2-5、2-6、2-7、2-8、2-9、2-10、3-4、3-5、3-6、3-7、3-8、3-9、3-10、4-5、4-6、4-7、4-8、4-9、4-10、5-6、5-7、5-8、5-9、5-10、6-7、6-8、6-9或6-10种不同tRNA合成酶(如上所述)的核酸序列。在一些实施方式中,活性控制组分包含编码2、3、4、5、6、7、8、9或10种不同tRNA合成酶(如上所述)的核酸序列。
在一些实施方式中,活性控制组分包含非规范tRNA表达盒,所述非规范tRNA表达盒从5’到3’包含:(i)启动子的核酸序列(如本文描述的组成型或诱导型);(ii)编码非规范tRNA(如上所述)的核酸序列;和(iii)终止子序列。在一些实施方式中,非规范tRNA表达盒包含SEQ ID NO:23的核酸序列或具有与SEQ ID NO:23的核酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的核酸序列。在一些实施方式中,活性控制组分包含多个非规范tRNA表达盒。例如,在一些实施方式中,活性控制组分包含至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9或至少10个非规范tRNA表达盒。在一些实施方式中,活性控制组分包含2-3、2-4、2-5、2-6、2-7、2-8、2-9、2-10、3-4、3-5、3-6、3-7、3-8、3-9、3-10、4-5、4-6、4-7、4-8、4-9、4-10、5-6、5-7、5-8、5-9、5-10、6-7、6-8、6-9或6-10个非规范tRNA表达盒。在一些实施方式中,活性控制组分包含2、3、4、5、6、7、8、9或10个非规范tRNA表达盒。
C.具有提前终止密码子的AAV基因产物
在一些实施方式中,AAV产生组分包含异源多核酸,所述异源多核酸包含编码AAV产生所需基因产物的核酸序列,其中基因产物被修饰为包含密码子,所述密码子是提前终止密码子和对应非规范tRNA的氨基酸密码子(如部分IA中描述的)二者。在一些实施方式中,在编码基因产物的核酸序列内耐受替代的氨基酸的密码子被修饰为包含是提前终止密码子和对应非规范tRNA的氨基酸密码子二者的密码子。在一些实施方式中,编码基因产物的核酸序列内的赖氨酸密码子被修饰为包含是提前终止密码子和对应非规范tRNA的氨基酸密码子二者的密码子。在一些实施方式中,编码基因产物的多核酸可在对应耐受替代的氨基酸的密码子的位置处包含一个或多个提前终止密码子(例如1、2、3、4、5、6、7、8、9或10个)。在一些实施方式中,编码基因产物的多核酸可在对应赖氨酸密码子的位置处包含一个或多个提前终止密码子(例如1、2、3、4、5、6、7、8、9或10个)。在一些实施方式中,编码基因产物的多核酸在对应耐受替代的氨基酸的密码子的位置处可包含1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、2-3、2-4、2-5、2-6、2-7、2-8、2-9、2-10、3-4、3-5、3-6、3-7、3-8、3-9、3-10、4-5、4-6、4-7、4-8、4-9、4-10、5-6、5-7、5-8、5-9、5-10、6-7、6-8、6-9或6-10个提前终止密码子。在一些实施方式中,编码基因产物的多核酸在对应赖氨酸密码子的位置处可包含1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、2-3、2-4、2-5、2-6、2-7、2-8、2-9、2-10、3-4、3-5、3-6、3-7、3-8、3-9、3-10、4-5、4-6、4-7、4-8、4-9、4-10、5-6、5-7、5-8、5-9、5-10、6-7、6-8、6-9或6-10个提前终止密码子。
本文使用的修饰语“NC”是指包含密码子的基因,所述密码子是提前终止密码子和对应非规范tRNA的密码子二者。在一些实施方式中,AAV产生组分包含:可操作地连接至启动子(如本文描述的组成型或诱导型)的编码NC-Rep52的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-Rep40的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-Rep78的核酸序列;可操作地连接至启动子(组成型或诱导型)的核酸序列的编码NC-Rep68的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-Rep78+52的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-Rep的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-E2A的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-E4ORF6的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-VP1的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-VP2的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-VP3的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-VP的核酸序列;或其任意组合。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-Rep40的核酸序列。术语“NC-Rep40”是指编码包含与SEQID NO:7的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列,其中核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)和对应非规范tRNA的密码子(如本文描述的),并且其中在对应多肽的mRNA的翻译期间并入非规范氨基酸导致产生功能性Rep40多肽。在一些实施方式中,NC-Rep40包含一个或多个TAG提前终止密码子突变。在一些实施方式中,NC-Rep40在被识别为耐受氨基酸取代的位点(例如,对应如Urabe M等人,J Virol.1999Apr;73(4):2682-93(其通过引用以其整体并入)中所描述的SEQ ID NO:97的E226和D233的位置)处包含一个或多个TAG提前终止密码子突变。在一些实施方式中,AAV产生组分包含如上所述的NC-Rep40。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-Rep68的核酸序列。术语“NC-Rep68”是指编码包含与SEQID NO:9的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列,其中核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)和对应非规范tRNA的密码子(如本文描述的)二者,并且其中在对应多肽的mRNA的翻译期间并入非规范氨基酸导致产生功能性Rep68多肽。在一些实施方式中,NC-Rep68包含一个或多个TAG提前终止密码子突变。在一些实施方式中,NC-Rep68在被识别为耐受氨基酸取代的位点(例如,对应如Urabe M等人,J Virol.1999Apr;73(4):2682-93(其通过引用以其整体并入)中所描述的SEQ ID NO:97的E17、D24、E32、K33、E34、D40、D44、E49、E57、K58、R68、E75、E86、E96、E114、R119、R122、E125、D149、E173、E184、K186、R187、H192、H295、E201、K204、E205、D212、E226和D233的位置)处包含一个或多个TAG提前终止密码子突变。在一些实施方式中,AAV产生组分包含如上所述的NC-Rep68。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-Rep78的核酸序列。术语“NC-Rep78”是指编码包含与SEQID NO:8的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列,其中核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)和对应非规范tRNA的密码子(如本文描述的)二者,并且其中在对应多肽的mRNA的翻译期间并入非规范氨基酸导致产生功能性Rep78多肽。在一些实施方式中,NC-Rep78包含一个或多个TAG提前终止密码子突变。在一些实施方式中,NC-Rep78在被识别为耐受氨基酸取代的位点(例如,对应如Urabe M等人,J Virol.1999Apr;73(4):2682-93,其通过引用以其整体并入)中所描述的SEQ ID NO:97的E17、D24、E32、K33、E34、D40、D44、E49、E57、K58、R68、E75、E86、E96、E114、R119、R122、E125、D149、E173、E184、K186、R187、H192、H295、E201、K204、E205、D212、E226和D233的位置)处包含一个或多个TAG提前终止密码子突变。在一些实施方式中,NC-Rep78核酸序列被修饰为在对应SEQ ID NO:97的D233和/或E17的位置处包含TAG提前终止密码子。在一些实施方式中,NC-Rep78包含与SEQ ID NO:33、35、37和113-115中任一个至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的核酸序列。在一些实施方式中,NC-Rep78包含含有SEQ ID NO:33、35、37和113-115中任一个的核酸序列。在一些实施方式中,NC-Rep78包含由SEQ ID NO:33、35、37和113-115中任一个组成的核酸序列。在一些实施方式中,NC-Rep78核酸序列进一步包含内部核糖体进入位点(IRES)。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-Rep68和NC-Rep78的核酸序列(NC-Rep78/68)。在一些实施方式中,NC-Rep78/68核酸序列被修饰为在对应SEQ ID NO:97的D233和/或E17的位置处包含TAG提前终止密码子。在一些实施方式中,NC-Rep78/68包含与SEQ ID NO:113-115中任一个至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的核酸序列。在一些实施方式中,NC-Rep78/68包含含有SEQ ID NO:113-115中任一个的核酸序列。在一些实施方式中,NC-Rep78/68包含由SEQ ID NO:113-115中任一个组成的核酸序列。在一些实施方式中,NC-Rep78/68核酸序列进一步包含内部核糖体进入位点(IRES)。
如本文所用,术语“内部核糖体进入位点(IRES)”是指编码核糖体结合位点的核酸序列,所述核糖体结合位点允许以帽-独立的方式的蛋白质翻译。示例性IRES包含IRES(SEQID NO:4)和减弱的IRES(SEQ ID NO:5)。本领域技术人员将容易地知晓其他IRES。
在一些实施方式中,NC-Rep78包含与SEQ ID NO:34、36和38中任一个至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的氨基酸序列。在一些实施方式中,NC-Rep78包含含有SEQ ID NO:34、36和38中任一个的氨基酸序列。在一些实施方式中,NC-Rep78包含由SEQ ID NO:34、36和38中任一个组成的氨基酸序列。在一些实施方式中,AAV产生组分包含如上所述的NC-Rep78。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-Rep52的核酸序列。术语“NC-Rep52”是指编码包含与SEQID NO:6的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列,其中核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)和对应非规范tRNA的密码子(如本文描述的)二者,并且其中在对应多肽的mRNA的翻译期间并入非规范氨基酸导致产生功能性Rep52多肽。在一些实施方式中,NC-Rep52核酸序列包含一个或多个TAG提前终止密码子突变。在一些实施方式中,NC-Rep52核酸序列在被识别为耐受氨基酸取代的位点(例如,对应Urabe M等人,J Virol.1999Apr;73(4):2682-93(其通过引用以其整体并入)中所描述的SEQ ID NO:97的E226和D233的位置)处包含一个或多个TAG提前终止密码子突变。在一些实施方式中,NC-Rep52核酸序列被修饰为在对应SEQ ID NO:97的D233和/或E17的位置处包含TAG提前终止密码子。在一些实施方式中,NC-Rep52核酸序列进一步包含内部核糖体进入位点(IRES)。在一些实施方式中,AAV产生组分包含如上所述的NC-Rep52。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-Rep78和NC-Rep52的核酸序列。术语“NC-Rep78+52”是指包含与SEQ ID NO:25至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的核酸序列,其中核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)和对应非规范tRNA的密码子(如本文描述的)二者,并且其中在对应多肽的mRNA的翻译期间并入非规范氨基酸导致产生功能性Rep78和Rep 52多肽。在一些实施方式中,NC-Rep78+52核酸序列包含一个或多个TAG提前终止密码子突变。在一些实施方式中,NC-Rep78+52核酸序列在识别为耐受氨基酸取代的位点处包含一个或多个TAG提前终止密码子突变。在一些实施方式中,NC-Rep78+52核酸序列在对应SEQ ID NO:97的D233和/或E17的位置处包含TAG提前终止密码子。在一些实施方式中,NC-Rep78+52核酸序列包含点突变,所述点突变除了在对应SEQ ID NO:97的D233和/或E17位置处的TAG提前终止密码子外,还会破坏Rep68/40剪接位点。在一些实施方式中,NC-Rep78+52核酸序列包含与SEQ ID NO:26-27中任一个至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性。在一些实施方式中,NC-Rep78+52核酸序列包含SEQ ID NO:26-27中的任一个。在一些实施方式中,NC-Rep78+52核酸序列由SEQ ID NO:26-27中的任一个组成。在一些实施方式中,NC-Rep78+52核酸序列进一步包含IRES。在一些实施方式中,NC-Rep78+52核酸序列中的IRES启动NC-Rep78或NC-Rep52的翻译。在一些实施方式中,进一步包含IRES的NC-Rep78+52核酸序列与SEQ ID NO:31-32中任一个至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)的同一性。在一些实施方式中,NC-Rep78+52包含SEQ ID NO:31-32中任一个的核酸序列。在一些实施方式中,NC-Rep78+52由SEQ ID NO:31-32中任一个的核酸序列组成。在一些实施方式中,AAV产生组分包含如上所述的NC-Rep78+52。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-Rep的核酸序列。Rep基因包含Rep52、Rep40、Rep78和Rep68。术语“NC-Rep”是指包含与SEQ ID NO:24至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的核酸序列,其中核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)和对应非规范tRNA的密码子(如本文描述的)二者,并且其中在对应多肽的mRNA的翻译期间并入非规范氨基酸导致产生功能性NC-Rep多肽。在一些实施方式中,NC-Rep核酸序列包含一个或多个TAG提前终止密码子突变。在一些实施方式中,NC-Rep核酸序列在识别为耐受氨基酸取代的位点处包含一个或多个TAG提前终止密码子突变。在一些实施方式中,NC-Rep核酸序列被修饰为在对应SEQ ID NO:97的D233和/或E17的位置处包含TAG提前终止密码子。在一些实施方式中,NC-Rep包含含有与SEQ ID NO:28-29和113中任一个至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的核酸序列。在一些实施方式中,NC-Rep包含含有SEQ ID NO:28-29和113中任一个的核酸序列。在一些实施方式中,NC-Rep包含由SEQ ID NO:28-29和113中任一个组成的核酸序列。在一些实施方式中,AAV产生组分包含如上所述的NC-Rep。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-E2A的核酸序列。术语“NC-E2A”是指编码包含与SEQ IDNO:10的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列,其中核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)和对应非规范tRNA的密码子(如本文描述的)二者,并且其中在对应多肽的mRNA的翻译期间并入非规范氨基酸导致产生功能性E2A多肽。在一些实施方式中,NC-E2A核酸序列包含一个或多个TAG提前终止密码子突变。在一些实施方式中,NC-E2A核酸序列在识别为耐受氨基酸取代的位点处包含一个或多个TAG提前终止密码子突变。在一些实施方式中,AAV产生组分包含如上所述的NC-E2A。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-E4ORF6的核酸序列。术语“NC-E4ORF6”是指编码包含与SEQ ID NO:11的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列,其中核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)和对应非规范tRNA的密码子(如本文描述的)二者,并且其中在对应多肽的mRNA的翻译期间并入非规范氨基酸导致产生功能性NC-E4ORF6多肽。在一些实施方式中,NC-E4ORF6去除了剪接位点。在一些实施方式中,NC-E4 ORF6核酸序列包含一个或多个TAG提前终止密码子突变。在一些实施方式中,NC-E4 ORF6核酸序列在识别为耐受氨基酸取代的位点处包含一个或多个TAG提前终止密码子突变。在一些实施方式中,AAV产生组分包含如上所述的NC-E4ORF6。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-VP1的核酸序列。术语“NC-VP1”是指编码包含与SEQ IDNO:14的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列,其中核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)和对应非规范tRNA的密码子(如本文描述的)二者,并且其中在对应多肽的mRNA的翻译期间并入非规范氨基酸导致产生功能性NC-VP1多肽。在一些实施方式中,NC-VP1核酸序列包含一个或多个TAG提前终止密码子突变。在一些实施方式中,NC-VP1核酸序列在识别为耐受氨基酸取代的位点处包含一个或多个TAG提前终止密码子突变。在一些实施方式中,AAV产生组分包含如上所述的NC-VP1。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-VP2的核酸序列。术语“NC-VP2”是指编码包含与SEQ IDNO:15的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列,其中核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)和对应非规范tRNA的密码子(如本文描述的)二者,并且其中在对应多肽的mRNA的翻译期间并入非规范氨基酸导致产生功能性NC-VP2多肽。在一些实施方式中,NC-VP2核酸序列包含一个或多个TAG提前终止密码子突变。在一些实施方式中,NC-VP2核酸序列在识别为耐受氨基酸取代的位点处包含一个或多个TAG提前终止密码子突变。在一些实施方式中,AAV产生组分包含如上所述的NC-VP2。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-VP3的核酸序列。术语“NC-VP3”是指编码包含与SEQ IDNO:16的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列,其中核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)和对应非规范tRNA的密码子(如本文描述的)二者,并且其中在对应多肽的mRNA的翻译期间并入非规范氨基酸导致产生功能性NC-VP3多肽。在一些实施方式中,NC-VP3核酸序列包含一个或多个TAG提前终止密码子突变。在一些实施方式中,NC-VP3核酸序列在识别为耐受氨基酸取代的位点处包含一个或多个TAG提前终止密码子突变。在一些实施方式中,AAV产生组分包含如上所述的NC-VP3。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码NC-VP的核酸序列。术语“NC-VP”是指编码包含与SEQ IDNO:14的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列,其中核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)和对应非规范tRNA的密码子(如本文描述的)二者,并且其中在对应多肽的mRNA的翻译期间并入非规范氨基酸导致产生功能性NC-VP多肽。在一些实施方式中,NC-VP核酸序列包含一个或多个TAG提前终止密码子突变。在一些实施方式中,NC-VP核酸序列在识别为耐受氨基酸取代的位点处包含一个或多个TAG提前终止密码子突变。在一些实施方式中,AAV产生组分包含如上所述的NC-VP。
III.在提前终止密码子处包含氨基酸并入系统的工程化细胞的示例性实施方式
在一些方面中,AAV产生系统进一步包含用于AAV产生的工程化细胞。在一些实施方式中,工程化细胞包含一个或多个多核酸,所述一个或多个多核酸共同包含:(a)如上所述的AAV产生组分和(b)活性控制组分,其包含如上所述的非规范tRNA合成酶和偶联非规范tRNA。在一些实施方式中,AAV产生组分和活性控制组分稳定地整合到工程化细胞的基因组中。
如本文所用,术语“稳定地整合”是指已插入生物体(例如,如本文描述的工程化细胞)的基因组中并在细胞分裂后传递给后代的异源核酸序列、核酸分子、构建体、基因或多核苷酸。应当理解,本文描述的任何核酸序列、核酸分子、构建体、基因或多核苷酸都可以稳定地整合。核酸序列、核酸分子、构建体、基因或多核苷酸可通过随机整合、靶向整合或转座子介导的整合来整合到基因组中。
在一些实施方式中,AAV产生系统的每个多核酸包含选择标记。在一些实施方式中,AAV产生系统的每个多核酸包含不同选择标记的核酸序列。
如本文所使用的,术语“选择标记”是指当引入细胞或在细胞中表达时,赋予适合选择的特性的蛋白质。如本文所用,术语“选择盒”是指可操作地连接至启动子(如本文描述的)和终止子的编码选择标记的核酸序列。
选择标记可以是荧光蛋白。荧光蛋白的实例在本领域是已知的(例如,TagBFP、EBFP2、EGFP、EYFP、mKO2或Sirius)。参见例如,专利号:US 5,874,304;专利号:EP 0969284A1;公开号:US2010/167394 A–其整体通过引用并入本文。
可替选地,或另外,选择标记可以是抗生素抗性蛋白。抗生素抗性蛋白的实例是本领域已知的(例如,促进嘌呤霉素、潮霉素、新霉素、吉欧霉素、灭瘟素或脉霉素选择)。参见例如,公开号:WO 1997/15668 A2;公开号:WO 1997/43900 A1–其整体通过引用并入本文。
A.第一稳定整合的核酸分子
在一些实施方式中,工程化细胞包含一个或多个稳定整合的核酸分子。在一些实施方式中,工程化细胞包含第一稳定整合的核酸分子。在一些实施方式中,第一稳定整合的核酸分子包含编码如上所述非规范tRNA合成酶的核酸序列。在一些实施方式中,tRNA合成酶可操作地连接至启动子。在一些实施方式中,第一稳定整合的核酸分子进一步包含编码选择标记的核酸序列。在一些实施方式中,选择标记可操作地连接至启动子。
在一些实施方式中,用于AAV产生的工程化细胞包含SEQ ID NO:21的MmPyrLS WT/Y384F tRNA合成酶。在一些实施方式中,编码MmPyrLS WT/Y384F的核酸序列可操作地连接至启动子。在一些实施方式中,MmPyrLS WT/Y384F可操作地连接至hEF1启动子。
在一些实施方式中,如上所述第一稳定整合的核酸分子具有与如图1所描绘的相同的结构。
B.第二稳定整合的核酸分子
在一些实施方式中,包含一个或多个核酸分子的工程化细胞包含如本文描述的第一稳定整合的分子、以及第二稳定整合的核酸分子。在一些实施方式中,第二稳定整合的核酸分子包含一个或多个编码本申请中描述的任一tRNA中的一个或多个的核酸序列(例如,本申请中描述的任一tRNA中的1、2、3、4、5、6、7、8、9或10个核酸序列)。在一些实施方式中,编码本申请中描述的任一tRNA中的一个或多个中每一个的核酸序列可操作地连接至启动子,如上所述。
在一些实施方式中,第二稳定整合的核酸分子包含可操作地连接至启动子的各自编码PylT(U25C)tRNA的一个或多个核酸序列。在一些实施方式中,第二稳定整合的核酸分子包含编码PylT(U25C)tRNA的四个核酸序列,所述四个核酸序列各自可操作地连接至U6启动子。在一些实施方式中,编码PylT(U25C)tRNA的四个核酸序列各自可操作地连接至U6启动子。
在一些实施方式中,第二稳定整合的核酸分子进一步包含编码选择标记的核酸序列。在一些实施方式中,选择标记可操作地连接至启动子。
在一些实施方式中,如上所述的第二稳定整合的核酸分子具有与如图1所描绘的相同的结构。
C.第三稳定整合的核酸分子
在一些实施方式中,包含一个或多个核酸分子的工程化细胞包含如本文描述的第一稳定整合的分子、如本文描述的第二稳定整合的核酸分子、以及第三稳定整合的核酸分子。
在一些实施方式中,第三稳定整合的核酸分子包含编码如上所述NC-Rep78+52的核酸序列。在一些实施方式中,编码NC-Rep78+52的核酸分子包含还编码在D233位置处的PylT(U25C)tRNA密码子的提前终止密码子。在一些实施方式中,编码NC-Rep78+52的核酸分子包含还编码在E17位置处的PylT(U25C)tRNA密码子的提前终止密码子。在一些实施方式中,编码NC-Rep78+52的核酸分子包含还编码在D233和E17位置处的PylT(U25C)tRNA密码子的提前终止密码子。
在一些实施方式中,第三稳定整合的核酸分子包含编码如上所述NC-Rep的核酸序列。在一些实施方式中,编码NC-Rep的核酸分子包含还编码在D233位置处的PylT(U25C)tRNA密码子的提前终止密码子。在一些实施方式中,编码NC-Rep的核酸分子包含还编码在位置E17处的PylT(U25C)tRNA密码子的提前终止密码子。在一些实施方式中,编码Rep的核酸分子包含还编码在位置D233和E17处的PylT(U25C)tRNA密码子的提前终止密码子。
在一些实施方式中,第三稳定整合的核酸分子进一步包含编码如本文描述的选择标记的核酸序列。在一些实施方式中,选择标记可操作地连接至启动子。
在一些实施方式中,如上所述的第三稳定整合的核酸分子具有与如图1中描绘突变的Rep78+52或突变的Full-Rep中任一个图相同的结构。
D.第四稳定整合的核酸分子
在一些实施方式中,包含一个或多个核酸分子的工程化细胞包含如本文描述的第一稳定整合的分子、如本文描述的第二稳定整合的核酸分子、如本文描述的第三稳定整合的核酸分子、以及第四稳定整合的核酸分子。在一些实施方式中,第四稳定整合的核酸分子包含可操作地连接至如上所述启动子的编码转录激活子的核酸序列。
E.第五稳定整合的核酸分子
在一些实施方式中,包含一个或多个核酸分子的工程化细胞包含如本文描述的第一稳定整合的分子、如本文描述的第二稳定整合的核酸分子、如本文描述的第三稳定整合的核酸分子、如本文描述的第四稳定整合的核酸分子、以及第五稳定整合的核酸分子。在一些实施方式中,第五稳定整合的核酸分子包含可操作地连接至如上所述启动子的编码E2A或NC-E2A和E4ORF6或NC-E4ORF6的核酸序列。
F.第六稳定整合的核酸分子
在一些实施方式中,包含一个或多个核酸分子的工程化细胞包含如本文描述的第一稳定整合的分子、如本文描述的第二稳定整合的核酸分子、如本文描述的第三稳定整合的核酸分子、如本文描述的第四稳定整合的核酸分子、如本文描述的第五稳定整合的核酸分子、以及第六稳定整合的核酸分子。在一些实施方式中,第六稳定整合的核酸分子包含可操作地连接至如上所述启动子的编码VP(CAP)基因的核酸序列。在一些实施方式中,第六稳定整合的核酸分子包含AAV载荷。
IV.使用工程化细胞产生包含非规范tRNA的AAV的方法。
在一些方面中,本公开提供了使用包含一个或多个多核酸的AAV产生系统产生AAV的方法,所述一个或多个多核酸共同包含:(a)AAV产生组分和(b)包含如本文描述的非规范tRNA合成酶/tRNA的活性控制组分。在一些实施方式中,用于AAV产生的方法包括转染或稳定地整合到工程化细胞中,一个或多个多核酸的任意组合共同包含如本文描述的AAV产生组分和活性控制组分。在一些实施方式中,AAV产生的方法进一步包含转染包含用于如上所述AAV递送的载荷(例如治疗性DNA序列)的核酸分子。在一些实施方式中,用在AAV产生的方法的工程化细胞选自用于AAV产生的任一种工程化细胞,所述工程化细胞包含如本文描述的非规范tRNA合成酶/tRNA。在一些实施方式中,方法包括将工程化细胞生长到对于AAV产生最佳的汇合度(confluency)。例如,最佳的汇合度可取决于工程化细胞所衍生自的细胞的类型。本领域技术人员将知道或能够确定对于AAV产生的最佳汇合度。在一些实施方式中,方法包括将工程化细胞与可带电到非规范tRNA上的氨基酸接触。在一些实施方式中,氨基酸是H-Lys(Boc)-OH。在一些实施方式中,方法包括使用如本文描述的小分子诱导物诱导tRNA合成酶和/或偶联tRNA的表达。在一些实施方式中,方法包括使用本领域技术人员所公知的方法收获由培养工程化细胞产生的AAV。
V.包含碱基编辑器的AAV产生系统
在一些方面中,AAV产生系统包含一个或多个多核酸,所述一个或多个多核酸共同包含:(a)AAV产生组分和(b)活性控制组分,其包含能够校正核酸序列中的突变的碱基编辑器。在一些实施方式中,碱基编辑器以规范密码子替代提前终止密码子。
A.碱基编辑器
如本文描述的,术语“碱基编辑器”是指能够将单核苷酸变体(SNV)引入DNA或RNA中的蛋白质或融合蛋白。示例性碱基编辑器包括但不限于胞嘧啶碱基编辑器(CBE):BE1、BE2、HF2-BE2、BE3、HF-BE3、YE1-BE3、EE-BE3、YEE-BE3、VQR-BE3、EQR-BE3、VRER-BE3、SaKKHBE3、FNLS-BE3、RA-BE3、eA3A-HF1-BE3-2xUGI、eA3A-Hypa-BE3-2xUGI、hA3A-BE3、hA3B-BE3、hA3G-BE3、hAID-BE3、SaCas9-BE3、xCas9-BE3、ScCas9-BE3、SniperCas9-BE3、iSpyMac-BE3、Target-AID、Target-AID-NG、BE-PLUS、BE4、BE4-Gam、BE4-Max、AncBE4-Max、SaCas9BE4-Gam、evoBe4max、evoFERNY-BE4max和Cas12a-BE;以及腺嘌呤碱基编辑器(ABE):ABE7.8、ABE9、ABE10、ABE.8.17、xCas9-ABE7.10、VQR-ABE、Sa(KKH)-ABE、ABEmax、ABE7.10max、ABE8e、PE1、PE2、PE3、ABE REPAIRv1和ABE Repairv2,其在Porto,ElizabethM.等人,Nature Reviews Drug Discovery 19.12(2020):839-859;Cox,David BT等人,Science 358.6366(2017):1019-1027;Komor,Alexis C.等人,Science advances 3.8(2017):eaao4774;和Gaudelli,Nicole M.等人,Nature biotechnology 38.7(2020):892-900;以及Kantor A.等人,InteRNAtional JouRNAl of Molecular Sciences 21.17(2020):6240(其中的每一篇通过引用以其整体并入)中进行了详细描述。在非限制性概述中,碱基编辑器是融合蛋白,包含具有催化非活性外切酶结构域的CRISPR Cas蛋白结构域(例如dCas9或dCas13)或CRISPR Cas切口酶蛋白结构域(例如Cas9n)和一个或多个能够修饰DNA的结构域(例如腺嘌呤脱氨酶)。碱基编辑器结合至包含与靶DNA或RNA序列互补的核酸序列的单引导RNA(sgRNA)。碱基编辑器对DNA或RNA的靶向由所使用的Cas蛋白类型决定(Cas9用于DNA以及Cas13用于RNA)。在碱基编辑器的非限制性实例中,腺嘌呤碱基编辑器(ABE)包含Cas9n蛋白、腺嘌呤脱氨酶和包含与靶基因互补的序列的单引导RNA(例如包含提前终止密码子的rep52基因)。sgRNA引导ABE到达靶DNA序列,靶DNA序列由Cas9n结合,Cas9n切割靶链,以及腺嘌呤脱氨酶将靶腺嘌呤核苷酸脱氨基,将其转化为肌苷,肌苷在DNA复制期间被读为鸟嘌呤,导致A-T到G-C DNA修饰。使用碱基编辑器可进行的密码子改变突变的实例如表1和表2中所举例的。在一些实施方式中,锌指核酸酶、转录激活子样效应核酸酶(TALEN)或先导编辑器可用来替代碱基编辑器。
表1:可以ABE进行的可能的密码子突变。
表2:可以CBE进行的可能的密码子突变。
在一些实施方式中,活性控制组分包含编码碱基编辑器的氨基酸序列的核酸序列,所述碱基编辑器选自由Cas9 ABE7.10(SEQ ID NO:82)、Cas9 ABE8.17m(SEQ ID NO:83)、Cas13 ABE REPAIRv1(SEQ ID NO:84)和Cas13 ABE REPAIRv2(SEQ ID NO:85)组成的组。在一些实施方式中,碱基编辑器由包含与SEQ ID NO:82-85中任一个至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽编码,其中碱基编辑器仍能够编辑RNA或DNA。在一些实施方式中,碱基编辑器由包含SEQ ID NO:82-85中任一个的氨基酸序列的多肽编码。在一些实施方式中,碱基编辑器通过由SEQ ID NO:82-85中任一个的氨基酸序列组成的多肽编码。
在一些实施方式中,活性控制组分包含编码碱基编辑器(例如Cas9 ABE7.10、Cas9ABE8.17m、Cas13 ABE REPAIRv1或Cas13 ABE REPAIRv2)的核酸序列,所述核酸序列可操作地连接至启动子(如本文描述的)。在一些实施方式中,启动子是组成型活性启动子。在一些实施方式中,启动子是化学诱导型启动子。在一些实施方式中,碱基编辑器可操作地连接至选自由pTRE3G(SEQ ID NO:1)或pTREtight(SEQ ID NO:2)组成的组的化学诱导型启动子。在一些实施方式中,碱基编辑器可操作地连接至包含VanR(SEQ ID NO:86)、TtgR(SEQ IDNO:86)、PhlF(SEQ ID NO:86)、或CymR(SEQ ID NO:86)、或Gal4 UAS(SEQ ID NO:86)操纵子序列中的至少一个的化学诱导型启动子。
B.AAV产生组分:AAV产生所需基因包含降低AAV基因产物活性的突变
在一些实施方式中,AAV产生组分包含异源多核酸,所述异源多核酸包含编码AAV产生所需基因产物的核酸序列,其中基因产物被修饰为包含一个或多个减少如上所述基因产物功能的突变(例如1、2、3、4、5、6、7、8、9或10个)。在一些实施方式中,编码AAV产生所需基因产物的多核酸可包含1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、2-3、2-4、2-5、2-6、2-7、2-8、2-9、2-10、3-4、3-5、3-6、3-7、3-8、3-9、3-10、4-5、4-6、4-7、4-8、4-9、4-10、5-6、5-7、5-8、5-9、5-10、6-7、6-8、6-9或6-10个减少基因产物功能的突变。
在一些实施方式中,从表1和表2的密码子突变中选择一个或多个突变。在一些实施方式中,一个或多个突变包含密码子突变,所述密码子突变导致与野生型编码的氨基酸相比不同分类的氨基酸被编码。在一些实施方式中,不同分类的氨基酸是带正电的:精氨酸、组氨酸和赖氨酸;以及带负电的:天冬氨酸和谷氨酸;极性的:丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺;非极性的:甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、蛋氨酸、色氨酸、苯丙氨酸或脯氨酸。在一些实施方式中,用于带正电的氨基酸的一个或多个氨基酸密码子被用于带负电、非极性或极性的氨基酸的密码子替代。在一些实施方式中,用于带负电的氨基酸的一个或多个氨基酸密码子被用于带正电、非极性或极性的氨基酸的密码子替代。在一些实施方式中,用于极性氨基酸的一个或多个氨基酸密码子被用于带负电、带正电或极性的氨基酸的密码子替代。在一些实施方式中,用于非极性氨基酸的一个或多个氨基酸密码子被用于带负电、非极性或带正电的氨基酸的密码子替代。
在一些实施方式中,AAV产生组分包含异源多核酸,所述异源多核酸包含编码AAV产生所需基因产物的核酸序列,其中基因产物被修饰为包含提前终止密码子。在一些实施方式中,编码基因产物的多核酸可在对应色氨酸密码子、谷氨酰胺密码子或精氨酸密码子的位置处包含提前终止密码子。在一些实施方式中,编码基因产物的多核酸可在对应色氨酸密码子、谷氨酰胺密码子或精氨酸密码子的位置处包含一个或多个提前终止密码子(例如1、2、3、4、5、6、7、8、9或10个)。在一些实施方式中,编码基因产物的多核酸可在对应色氨酸密码子、谷氨酰胺密码子或精氨酸密码子的位置处包含1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、2-3、2-4、2-5、2-6、2-7、2-8、2-9、2-10、3-4、3-5、3-6、3-7、3-8、3-9、3-10、4-5、4-6、4-7、4-8、4-9、4-10、5-6、5-7、5-8、5-9、5-10、6-7、6-8、6-9或6-10个提前终止密码子。
本文使用的修饰语“DA”是指包含降低基因产物活性的一个或多个突变的基因(例如,提前终止密码子)。在一些实施方式中,通过将有义DNA链上的一个或多个色氨酸和/或精氨酸密码子,或反义DNA链上的一个或多个谷氨酰胺、精氨酸和/或脯氨酸密码子突变为提前终止密码子,插入一个或多个终止密码子突变。在一些实施方式中,AAV产生组分包含:可操作地连接至启动子(如本文描述的组成型或诱导型)的编码DA-Rep52的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码DA-Rep40的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码DA-Rep78的核酸序列;可操作地连接至启动子(组成型或诱导型)的核酸序列的编码DA-Rep68的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码DA-Rep78+52的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码DA-Rep的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码DA-E2A的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码DA-E4ORF6的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的编码DA-VP1的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的编码DA-VP2的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的编码DA-VP3的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的编码DA-VP的核酸序列;可操作地连接至启动子(如本文描述的组成型或诱导型)的编码DA-L4 100K的核酸序列;或其任意组合。
在一些实施方式中,编码DA-E2A、DA-E4ORF6、DA-Rep52、DA-Rep40、DA-Rep78、DA-Rep68、DA-Rep、DA-VP1、DA-VP2、DA-VP3、DA-VP和DA-L4 100K的核酸序列进一步包含一个或多个突变以引入PAM序列。在一些实施方式中,编码DA-E2A、DA-E4ORF6、DA-Rep52、DA-Rep40、DA-Rep78、DA-Rep68、DA-Rep、DA-VP1、DA-VP2、DA-VP3、DA-VP和DA-L4 100K的核酸序列进一步包含一个或多个沉默突变以引入PAM序列。在一些实施方式中,在突变附近引入PAM序列以引入用于DNA碱基编辑器(例如含有ABE或CBE的Cas9)的PAM序列。在一些实施方式中,在靶编辑位点的上游1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸处引入PAM序列。在一些实施方式中,在靶编辑位点的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19和20个核苷酸内引入PAM序列。在一些实施方式中,在靶编辑位点的10-17或13-16个核苷酸内引入PAM序列。在一些实施方式中,进行一个或多个沉默突变以减少碱基编辑器窗口内的脱靶碱基编辑。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码DA-Rep52的核酸序列。在一些实施方式中,编码氨基酸序列的DA-Rep52核酸序列可操作地连接至p19启动子。术语“DA-Rep52”是指包含至少一个降低Rep52活性的突变(如上所述)的编码多肽的核酸序列,所述多肽包含与SEQ ID NO:6的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性。在一些实施方式中,DA-Rep52包含编码含有SEQ ID NO:6的多肽的核酸序列,所述核酸序列被修饰为包含对应SEQ ID NO:97的M225的氨基酸位置的突变。在一些实施方式中,DA-Rep52包含编码含有SEQ ID NO:6的多肽的核酸序列,所述核酸序列被修饰为包含对应SEQ ID NO:97的M225氨基酸位置处的蛋氨酸至甘氨酸的突变。在一些实施方式中,编码DA-Rep52的核酸序列在对应SEQ ID NO:97的氨基酸位置R529的位置处包含突变。在一些实施方式中,编码DA-Rep52的核酸序列在对应SEQ ID NO:97的氨基酸位置R529的位置处包含AgG->CgC突变。在一些实施方式中,DA-Rep52在对应226-227、256-257、259-260、346-347、400-401、409-410和455-456中的一个或多个位置处或在对应226-227、256-257、259-260、346-347、400-401、409-410和455-456中的一个或多个位置之间,包含降低Rep52活性的一个或多个(例如1、2、3、4、5、6、7或多个)错义或提前终止密码子突变。在一些实施方式中,核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)。在一些实施方式中,DA-Rep52包含编码含有SEQ ID NO:6的多肽的核酸序列,所述核酸序列被修饰为在对应SEQ ID NO:97的Q262或W319氨基酸位置处包含提前终止密码子。在一些实施方式中,DA-Rep52包含编码含有SEQ ID NO:6的多肽的核酸序列,所述核酸序列被修饰为在对应SEQ ID NO:97的Q262和W319氨基酸位置处包含提前终止密码子。在一些实施方式中,DA-Rep52包含编码含有与SEQ ID NO:43或47中任一个的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列。在一些实施方式中,DA-Rep52包含编码含有SEQ ID NO:43或47中任一个的氨基酸序列的多肽的核酸序列。在一些实施方式中,DA-Rep52包含编码由SEQ ID NO:43或47中任一个的氨基酸序列组成的多肽的核酸序列。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码DA-Rep40的核酸序列。在一些实施方式中,DA-Rep40核酸序列可操作地连接至p19启动子。术语“DA-Rep40”是指编码包含与SEQ ID NO:7的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列,其包含至少一个降低Rep40活性的突变(如上所述)。在一些实施方式中,DA-Rep40包含编码含有SEQ ID NO:7的多肽的核酸序列,所述核酸序列被修饰为在对应SEQ ID NO:97的M225的氨基酸位置处包含突变。在一些实施方式中,DA-Rep40包含编码含有SEQ IDNO:7的多肽的核酸序列,所述核酸序列被修饰为在对应SEQ ID NO:97的M225的氨基酸位置处包含蛋氨酸至甘氨酸的突变。在一些实施方式中,编码DA-Rep40的核酸序列在对应SEQID NO:97的氨基酸位置R529的位置处包含突变。在一些实施方式中,编码DA-Rep40的核酸序列在对应SEQ ID NO:97的氨基酸位置R529的位置处包含AgG->CgC突变。在一些实施方式中,DA-Rep40在对应226-227、256-257、259-260、346-347、400-401、409-410和455-456中的一个或多个位置处或在对应226-227、256-257、259-260、346-347、400-401、409-410和455-456中的一个或多个位置之间,包含降低Rep40活性的一个或多个(例如1、2、3、4、5、6、7或多个)错义或提前终止密码子突变。在一些实施方式中,核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)。在一些实施方式中,DA-Rep40包含编码含有SEQ ID NO:7的多肽的核酸序列,所述核酸序列被修饰为在对应SEQ ID NO:97的Q262或W319的氨基酸位置处包含提前终止密码子。在一些实施方式中,DA-Rep40包含编码含有SEQ ID NO:7的多肽的核酸序列,所述核酸序列被修饰为在对应SEQ ID NO:97的Q262和W319的氨基酸位置处包含提前终止密码子。在一些实施方式中,DA-Rep40包含编码含有与SEQ ID NO:44或48中任一个至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列。在一些实施方式中,DA-Rep40包含编码含有SEQ ID NO:44或48中任一个的氨基酸序列的多肽的核酸序列。在一些实施方式中,DA-Rep40包含编码含有由SEQ ID NO:44或48中任一个组成的氨基酸序列的多肽的核酸序列。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码DA-Rep78的核酸序列。在一些实施方式中,DA-Rep78核酸序列可操作地连接至p19启动子。术语“DA-Rep78”是指编码含有与SEQ ID NO:8的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列,其包含至少一个降低Rep78活性的突变(如上所述)。在一些实施方式中,编码DA-Rep78的核酸序列在对应SEQ ID NO:97的氨基酸位置R529的位置处包含突变。在一些实施方式中,编码DA-Rep78的核酸序列在对应SEQ ID NO:97的氨基酸位置R529的位置处包含AgG->CgC突变。在一些实施方式中,DA-Rep78在对应56-57、58-59、61-62、73-74、76-77、87-88、113-114、133-134、164-165、217-218、226-227、256-257、259-260、346-347、400-401、409-410和455-456中的一个或多个位置处或在对应56-57、58-59、61-62、73-74、76-77、87-88、113-114、133-134、164-165、217-218、226-227、256-257、259-260、346-347、400-401、409-410和455-456中的一个或多个位置之间,包含降低Rep78活性的一个或多个(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或多个)错义或提前终止密码子突变。在一些实施方式中,核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)。在一些实施方式中,DA-Rep78包含编码含有SEQ ID NO:8的氨基酸序列的多肽的核酸序列,所述核酸序列被修饰为在对应SEQ ID NO:97的Q262或W319的氨基酸位置处包含提前终止密码子。在一些实施方式中,DA-Rep78包含编码含有SEQ ID NO:8的氨基酸序列的多肽的核酸序列,所述核酸序列被修饰为在对应SEQ ID NO:97的Q262和W319的氨基酸位置处包含提前终止密码子。在一些实施方式中,DA-Rep78包含编码含有与SEQ ID NO:45或49中任一个至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列。在一些实施方式中,DA-Rep78包含编码含有SEQ ID NO:45或49的氨基酸序列的多肽的核酸序列。在一些实施方式中,DA-Rep78包含编码含有SEQ ID NO:45或49的氨基酸序列的多肽的核酸序列。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码DA-Rep68的核酸序列。在一些实施方式中,DA-Rep68核酸序列可操作地连接至p19启动子。术语“DA-Rep68”是指编码含有与SEQ ID NO:9的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列,其包含至少一个降低Rep68活性的突变(如上所述)。在一些实施方式中,编码DA-Rep68的核酸序列在对应SEQ ID NO:97的氨基酸位置R529位置处包含突变。在一些实施方式中,编码DA-Rep68的核酸序列在对应SEQ ID NO:97的氨基酸位置R529的位置处包含AgG->CgC突变。在一些实施方式中,DA-Rep68在对应56-57、58-59、61-62、73-74、76-77、87-88、113-114、33-134、164-165、217-218、226-227、256-257、259-260、346-347、400-401、409-410和455-456中的一个或多个位置处或在对应56-57、58-59、61-62、73-74、76-77、87-88、113-114、33-134、164-165、217-218、226-227、256-257、259-260、346-347、400-401、409-410和455-456中的一个或多个位置之间,包含降低Rep68活性的一个或多个(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或多个)错义或提前终止密码子突变。在一些实施方式中,核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)。在一些实施方式中,DA-Rep68包含编码含有SEQ ID NO:9的氨基酸序列的多肽的核酸序列,所述核酸序列被修饰为在对应SEQ ID NO:97的Q262或W319的氨基酸位置处包含提前终止密码子。在一些实施方式中,DA-Rep68包含编码含有SEQ ID NO:9的氨基酸序列的多肽的核酸序列,所述核酸序列被修饰为在对应SEQ ID NO:97的Q262和W319的氨基酸位置处包含提前终止密码子。在一些实施方式中,DA-Rep68包含编码含有与SEQ ID NO:46或50中任一个的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列。在一些实施方式中,DA-Rep68包含编码含有SEQ ID NO:46或50中任一个的氨基酸序列的多肽的核酸序列。在一些实施方式中,DA-Rep68包含编码由SEQ ID NO:46或50的氨基酸序列组成的多肽的核酸序列。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码DA-Rep的核酸序列。在一些实施方式中,DA-Rep核酸序列可操作地连接至p19启动子。术语“DA-Rep”是指包含与SEQ ID NO:24的序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的核酸序列,其包含至少一个降低Rep活性的突变(如上所述)。在一些实施方式中,编码DA-Rep的核酸序列在对应Rep(SEQ ID NO:97)的氨基酸位置R529的位置处包含突变。在一些实施方式中,编码DA-Rep的核酸序列在对应Rep(SEQ ID NO:97)的氨基酸位置R529的位置处包含AgG->CgC突变。在一些实施方式中,DA-Rep被修饰为在对应SEQ ID NO:97的M225的氨基酸位置处包含突变。在一些实施方式中,如Kyostio SR等人,J Virol.1994May;68(5):2947–2957(其通过引用以其整体并入)中描述的,DA-Rep被修饰为在对应SEQ ID NO:97的M225的氨基酸位置处包含蛋氨酸至甘氨酸的突变。在一些实施方式中,DA-Rep被修饰为在对应SEQ ID NO:97的K340的氨基酸位置处包含突变。在一些实施方式中,如Smith RH等人,J Virol.1997Jun;71(6):4461–4471(其通过引用以其整体并入)中描述的,DA-Rep被修饰为在对应SEQ ID NO:97的K340的氨基酸位置处包含赖氨酸到组氨酸的突变。在一些实施方式中,核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)。在一些实施方式中,DA-Rep在对应56-57、58-59、61-62、73-74、76-77、87-88、113-114、133-134、164-165、217-218、226-227、256-257、259-260、346-347、400-401、409-410、和455-456中的一个或多个位置处或在对应56-57、58-59、61-62、73-74、76-77、87-88、113-114、133-134、164-165、217-218、226-227、256-257、259-260、346-347、400-401、409-410、和455-456中的一个或多个位置之间,包含降低Rep活性的一个或多个(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或多个)错义或提前终止密码子突变。Yang Q等人,J Virol.1992Oct;66(10):6058–6069(其通过引用以其整体并入)表明这些位置对插入突变是敏感的。
在一些实施方式中,DA-Rep包含被修饰为在对应SEQ ID NO:97的Q67、Q262或W319的氨基酸位置处包含提前终止密码子的核酸序列。在一些实施方式中,DA-Rep包含被修饰为在对应SEQ ID NO:97的Q67、Q262和W319的氨基酸位置处包含提前终止密码子的核酸序列。在一些实施方式中,DA-Rep包含与SEQ ID NO:53-55中任一个至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的核酸序列。在一些实施方式中,DA-Rep包含含有SEQ ID NO:53-55中任一个的核酸序列。在一些实施方式中,DA-Rep包含由SEQ ID NO:53-55中任一个组成的核酸序列。在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码DA-E2A的核酸序列。在一些实施方式中,DA-E2A核酸序列可操作地连接至E2A启动子。术语“DA-E2A”是指编码含有与SEQ ID NO:10的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列,其包含至少一个降低E2A活性的突变(如上所述)。在一些实施方式中,核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)。在一些实施方式中,DA-E2A包含编码含有SEQ ID NO:10的氨基酸序列的多肽的核酸序列,其被修饰为在氨基酸位置W181或W324处包含提前终止密码子。在一些实施方式中,DA-E2A包含编码含有SEQ ID NO:10的氨基酸序列的多肽的核酸序列,其被修饰为在氨基酸位置W181和W324处包含提前终止密码子。在一些实施方式中,DA-E2A包含编码含有与SEQ ID NO:39-40中任一个至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列。在一些实施方式中,DA-E2A包含编码含有SEQ ID NO:39-40中任一个的氨基酸序列的多肽的核酸序列。在一些实施方式中,DA-E2A包含编码由SEQ ID NO:39-40中任一个的氨基酸序列组成的多肽的核酸序列。在一些实施方式中,DA-E2A包含与SEQ IDNO:105-106中任一个至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的核酸序列。在一些实施方式中,DA-E2A包含SEQ ID NO:105-106中任一个的核酸序列。在一些实施方式中,DA-E2A包含由SEQ ID NO:105-106中任一个组成的核酸序列。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码DA-E4ORF6的核酸序列。在一些实施方式中,DA-E4ORF6核酸序列可操作地连接至E4启动子。术语“DA-E4ORF6”是指编码含有与SEQ ID NO:11的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列,所述核酸序列包含至少一个降低E4ORF6活性的突变(如上所述)。在一些实施方式中,核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)。在一些实施方式中,DA-E4ORF6包含编码含有SEQ ID NO:11的氨基酸序列的多肽的核酸序列,其被修饰为在氨基酸位置W77或W192处包含提前终止密码子。在一些实施方式中,DA-E4ORF6包含编码含有SEQ ID NO:11的氨基酸序列的多肽的核酸序列,其被修饰为在氨基酸位置W77和W192处包含提前终止密码子。在一些实施方式中,DA-E4ORF6包含SEQ ID NO:12的核酸序列,所述核酸序列被修饰为在对应SEQ ID NO:11的W77或W192的氨基酸位置处包含提前终止密码子。在一些实施方式中,DA-E4ORF6包含SEQ ID NO:12的核酸序列,所述核酸序列被修饰为在对应SEQ ID NO:11的W77和W192的氨基酸位置处包含提前终止密码子。在一些实施方式中,DA-E4ORF6包含编码包含与SEQ ID NO:41-42中任一个的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的氨基酸序列的多肽的核酸序列。在一些实施方式中,DA-E4ORF6包含编码含有SEQ IDNO:41-42的氨基酸序列的多肽的核酸序列。在一些实施方式中,DA-E4ORF6包含编码由SEQ ID NO:41-42的氨基酸序列组成的多肽的核酸序列。在一些实施方式中,DA-E4ORF6包含与SEQ ID NO:107-108中任一个至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的核酸序列。在一些实施方式中,DA-E4ORF6包含SEQ ID NO:107-108中任一个的核酸序列。在一些实施方式中,DA-E4ORF6包含由SEQ ID NO:107-108中任一个组成的核酸序列。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码DA-L4 100K的核酸序列。在一些实施方式中,编码氨基酸序列的DA-L4 100K核酸序列可操作地连接至p19启动子。术语“DA-L4 100K”是指编码含有与SEQ ID NO:112的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列,所述核酸序列包含至少一个降低L4 100K活性的突变(如上所述)。在一些实施方式中,核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)。在一些实施方式中,DA-L4 100K包含编码含有SEQ ID NO:112的多肽的核酸序列,所述核酸序列被修饰为在对应SEQ ID NO:97的W435氨基酸位置处包含提前终止密码子。在一些实施方式中,DA-L4 100K包含编码含有与SEQ ID NO:98中任一个的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列。在一些实施方式中,DA-L4 100K包含编码含有SEQ ID NO:98中任一个的氨基酸序列的多肽的核酸序列。在一些实施方式中,DA-L4 100K包含编码由SEQ ID NO:98中任一个的氨基酸序列组成的多肽的核酸序列。
在一些实施方式中,DA-VARNA包含含有与SEQ ID NO:13的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的核酸序列,所述核酸序列进一步包含使VARNA失活的突变。在一些实施方式中,DA-VARNA包含编码含有SEQ IDNO:13的氨基酸序列的多肽的核酸序列,所述核酸序列进一步包含使VARNA失活的突变。在一些实施方式中,DA-VARNA由编码由SEQ ID NO:13的氨基酸序列组成的多肽的核酸序列组成或包括编码由SEQ ID NO:13的氨基酸序列组成的多肽的核酸序列,所述核酸序列进一步包含使VARNA失活的突变。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码DA-VP1的核酸序列。在一些实施方式中,DA-VP1核酸序列可操作地连接至p40启动子。术语“DA-VP1”是指编码含有与SEQ ID NO:14的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列,所述核酸序列包含至少一个降低VP1活性的突变(如上所述)。在一些实施方式中,编码DA-VP1的核酸序列在对应VP1(SEQ ID NO:14)的氨基酸位置P8的位置处包含突变。在一些实施方式中,编码DA-VP1的核酸序列在对应VP1(SEQ ID NO:14)的氨基酸位置P8的位置处包含ccA(P)->ccG(P)突变。在一些实施方式中,核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)。在一些实施方式中,DA-VP1包含编码含有SEQ ID NO:14的氨基酸序列的多肽的核酸序列,所述核酸序列被修饰为在对应SEQ ID NO:14的W304或Q598的氨基酸位置处包含提前终止密码子。在一些实施方式中,DA-VP1包含编码含有SEQ ID NO:14的氨基酸序列的多肽的核酸序列,所述核酸序列被修饰为在氨基酸位置W304或Q598处包含提前终止密码子。在一些实施方式中,DA-VP1包含编码含有与SEQ ID NO:99或102至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列。在一些实施方式中,DA-VP1包含编码含有SEQ ID NO:99或102的氨基酸序列的多肽的核酸序列。在一些实施方式中,DA-VP1包含编码由SEQ ID NO:99或102的氨基酸序列组成的多肽的核酸序列。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码DA-VP2的核酸序列。在一些实施方式中,DA-VP2核酸序列可操作地连接至p40启动子。术语“DA-VP2”是指编码含有与SEQ ID NO:15的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列,所述核酸序列包含至少一个降低VP2活性的突变(如上所述)。在一些实施方式中,核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)。在一些实施方式中,DA-VP2包含编码含有SEQ ID NO:15的氨基酸序列的多肽的核酸序列,所述核酸序列被修饰为在对应SEQ ID NO:14的W304或Q598的氨基酸位置处包含提前终止密码子。在一些实施方式中,DA-VP2包含编码含有SEQ ID NO:15的氨基酸序列的多肽的核酸序列,所述核酸序列被修饰为在氨基酸位置W304或Q598处包含提前终止密码子。在一些实施方式中,DA-VP2包含编码含有与SEQ ID NO:100或103至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列。在一些实施方式中,DA-VP2包含编码含有SEQ IDNO:100或103的氨基酸序列的多肽的核酸序列。在一些实施方式中,DA-VP2包含编码由SEQID NO:100或103的氨基酸序列组成的多肽的核酸序列。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码DA-VP3的核酸序列。在一些实施方式中,DA-VP3核酸序列可操作地连接至p40启动子。术语“DA-VP3”是指编码含有与SEQ ID NO:16的氨基酸序列至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列,所述核酸序列包含至少一个降低VP3活性的突变(如上所述)。在一些实施方式中,编码DA-VP3的核酸序列包含至精氨酸或赖氨酸的一个或多个突变(例如1、2、3、4、5、6、7、8、9、10或多个)。在一些实施方式中,如Ogden等人,Science.2019Nov 29;366(6469):1139–1143(其通过引用以其整体并入)中描述的,编码DA-VP3的核酸序列包含从天冬氨酸、谷氨酸或甘氨酸至精氨酸或赖氨酸的一个或多个突变(例如1、2、3、4、5、6、7、8、9、10或多个)。在一些实施方式中,核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)。在一些实施方式中,DA-VP3包含编码含有SEQ ID NO:16的氨基酸序列的多肽的核酸序列,所述核酸序列被修饰为在对应SEQ ID NO:14的W304或Q598的氨基酸位置处包含提前终止密码子。在一些实施方式中,DA-VP3包含编码含有SEQ ID NO:16的氨基酸序列的多肽的核酸序列,所述核酸序列被修饰为在对应SEQ ID NO:14的W304和Q598的氨基酸位置处包含提前终止密码子。在一些实施方式中,DA-VP3包含编码含有与SEQ ID NO:101或104至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列。在一些实施方式中,DA-VP3包含编码含有SEQ ID NO:101或104的氨基酸序列的多肽的核酸序列。在一些实施方式中,DA-VP3包含编码由SEQ ID NO:101或104的氨基酸序列组成的多肽的核酸序列。
在一些实施方式中,AAV产生组分包含可操作地连接至启动子(如本文描述的组成型或诱导型)的核酸序列的编码DA-VP的核酸序列。在一些实施方式中,DA-VP核酸序列可操作地连接至p40启动子。术语“DA-VP”是指包含与SEQ ID NO:116至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的核酸序列,所述核酸序列包含至少一个降低VP活性的突变(如上所述)。在一些实施方式中,DA-VP包含如Ogden等人,Science.2019Nov 29;366(6469):1139–1143(其通过引用以其整体并入)中描述的一个或多个对VP活性有害的非沉默突变。在一些实施方式中,DA-VP在VP(SEQ ID NO:14)的残基1-200内包含至蛋氨酸的一个或多个(例如1、2、3、4、5、6、7、8、9、10或多个)氨基酸突变。在一些实施方式中,DA-VP在VP(SEQ ID NO:14)的残基1-200内包含一个或多个(例如1、2、3、4、5、6、7、8、9、10或多个)异亮氨酸至蛋氨酸的突变。在一些实施方式中,核酸序列的至少一个密码子是提前终止密码子(例如,TAG、TAA和TGA)。在一些实施方式中,DA-VP包含SEQ IDNO:116的核酸序列,所述核酸序列被修饰为在对应SEQ ID NO:14的W304或Q598的氨基酸位置处包含提前终止密码子。在一些实施方式中,DA-VP包含SEQ ID NO:116的核酸序列,所述核酸序列被修饰为在SEQ ID NO:14的氨基酸位置W304或Q598处包含提前终止密码子。在一些实施方式中,DA-VP包含编码含有与SEQ ID NO:110或111至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的多肽的核酸序列。在一些实施方式中,DA-VP包含编码含有SEQ ID NO:110或111的氨基酸序列的多肽的核酸序列。在一些实施方式中,DA-VP包含编码由SEQ ID NO:110或111的氨基酸序列组成的多肽的核酸序列。
C.碱基编辑器单引导RNA
在一些实施方式中,活性控制组分包含一个或多个单引导RNA。如本文描述的,术语“单引导RNA或sgRNA”是指能够结合碱基编辑器并引导碱基编辑器到靶DNA或RNA序列(例如编码DA-Rep52的DNA或RNA)的RNA序列。单引导RNA包含称为间隔子或前间隔子的核酸序列。在一些实施方式中,间隔子或前间隔子长度为约15至50个碱基对,并且与靶序列(例如DA-Rep52的DNA或RNA)充分互补,以指导碱基编辑器到靶序列。在一些实施方式中,间隔子或前间隔子与靶序列互补,所述靶序列与前间隔子相邻基序(PAM)相邻。在一些实施方式中,一个或多个sgRNA与编码AAV产生所需基因的核酸序列内的突变充分互补,以指导碱基编辑器到突变,用于对所述突变进行碱基编辑以将突变序列恢复为野生型序列。在一些实施方式中,一个或多个sgRNA与编码AAV产生所需基因的核酸序列内的提前终止密码子充分互补,以指导碱基编辑器到提前终止密码子,用于对提前终止密码子进行碱基编辑。在一些实施方式中,编码如本文描述的任何sgRNA的DNA核酸序列可操作地连接至启动子(如本文描述的组成型或诱导型)。在一些实施方式中,编码如本文描述的任何sgRNA的DNA核酸序列可操作地连接至U6启动子。
在一些实施方式中,AAV产生组分包含编码DA-E2A的核酸序列,以及活性控制组分包含编码一个或多个sgRNA中每一个的核酸序列,所述一个或多个sgRNA与编码DA-E2A的核酸序列内的突变充分互补,以指导碱基编辑器到突变,用于对所述突变进行碱基编辑以将突变序列恢复为如上所述的野生型序列。在一些实施方式中,AAV产生组分包含编码DA-E2A的核酸序列,以及活性控制组分包含编码一个或多个sgRNA中每一个的核酸序列,所述一个或多个sgRNA与编码DA-E2A的核酸序列内的提前终止密码子充分互补,以指导碱基编辑器到提前终止密码子,用于将提前终止密码子碱基编辑为如上所述的规范密码子。在一些实施方式中,编码DA-E2A的核酸序列在对应SEQ ID NO:10中氨基酸残基W181的位置处包含提前终止密码子,以及一个单引导RNA在对应SEQ ID NO:10中W181的位置处包含与提前终止密码子充分互补的间隔子,以指导碱基编辑器从而将提前终止密码子编辑为色氨酸密码子。在一些实施方式中,编码DA-E2A的核酸序列在对应SEQ ID NO:10中氨基酸W324的位置处包含提前终止密码子,以及一个单引导RNA在对应SEQ ID NO:10中W324的位置处包含与提前终止密码子充分互补的间隔子,以指导碱基编辑器将提前终止密码子编辑为色氨酸密码子。在一些实施方式中,编码DA-E2A的核酸序列在对应SEQ ID NO:10中氨基酸残基W181和W324的位置处包含提前终止密码子,以及活性控制组分包含第一单引导RNA以及第二单引导RNA,所述第一单引导RNA包含间隔子,所述间隔子与对应SEQ ID NO:10中W181的位置处的提前终止密码子充分互补,以指导碱基编辑器将提前终止密码子编辑为色氨酸密码子,所述第二单引导RNA包含间隔子,所述间隔子与对应SEQ ID NO:10中W324的位置处的提前终止密码子充分互补,以指导碱基编辑器将提前终止密码子编辑为色氨酸密码子。在一些实施方式中,一个或多个单引导RNA各自包含含有与SEQ ID NO:56-57、66-67和74-75中任一个至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的核酸序列。在一些实施方式中,一个或多个单引导RNA各自包含含有SEQ ID NO:56-57、66-67和74-75中任一个的核酸序列。在一些实施方式中,一个或多个单引导RNA各自包含由SEQID NO:56-57、66-67和74-75中任一个组成的间隔子。
在一些实施方式中,AAV产生组分包含编码DA-E4ORF6的核酸序列,并且活性控制组分包含编码一个或多个sgRNA中每一个的核酸序列,所述一个或多个sgRNA与编码DA-E4ORF6的核酸序列内的突变充分互补,以指导碱基编辑器到突变,用于对所述突变进行碱基编辑以将突变序列恢复为如上所述野生型序列。在一些实施方式中,AAV产生组分包含编码DA-E4ORF6的核酸序列,并且活性控制组分包含编码一个或多个单引导RNA中每一个的核酸序列,所述一个或多个单引导RNA与编码DA-E4ORF6的核酸序列内的提前终止密码子充分互补,以指导碱基编辑器到提前终止密码子,用于将提前终止密码子碱基编辑为如上所述的规范密码子。在一些实施方式中,编码DA-E4ORF6的核酸序列在对应SEQ ID NO:11中氨基酸残基W77的位置处包含提前终止密码子,并且一种sgRNA在对应SEQ ID NO:11中氨基酸残基W77的位置处包含与提前终止密码子充分互补的间隔子,以指导碱基编辑器将提前终止密码子编辑为色氨酸密码子。在一些实施方式中,编码DA-E4ORF6的核酸序列在对应SEQ IDNO:11中氨基酸残基W192的位置处包含提前终止密码子,并且一个单引导RNA包含间隔子,所述间隔子与在对应SEQ ID NO:11中氨基酸残基W192的位置处的提前终止密码子充分互补,以指导碱基编辑器将提前终止密码子编辑为色氨酸密码子。在一些实施方式中,编码DA-E4ORF6的核酸序列在对应SEQ ID NO:11中氨基酸残基W77和W192的位置处包含提前终止密码子,并且活性控制组分包含第一单引导RNA以及第二单引导RNA,所述第一单引导RNA包含间隔子,所述间隔子与在对应SEQ ID NO:11中W77的位置处的提前终止密码子充分互补,以指导碱基编辑器将提前终止密码子编辑为色氨酸密码子,所述第二单引导RNA包含间隔子,所述间隔子与在对应SEQ ID NO:11中W192位置处的提前终止密码子充分互补,以指导碱基编辑器将终止密码子编辑为色氨酸密码子。在一些实施方式中,一个或多个单引导RNA各自包含与SEQ ID NO:58-59、68-69和76-77中任一个至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的核酸序列。在一些实施方式中,一个或多个单引导RNA各自包含含有SEQ ID NO:58-59、68-69和76-77中任一个的核酸序列。在一些实施方式中,一个或多个单引导RNA各自包含由SEQ ID NO:58-59、68-69和76-77中任一个组成的间隔子。
在一些实施方式中,AAV产生组分包含编码DA-Rep52或DA-Rep40的核酸序列,并且活性控制组分包含编码一个或多个sgRNA中每一个的核酸序列,所述一个或多个sgRNA与编码DA-Rep52或DA-Rep40的核酸序列内的突变充分互补,以指导碱基编辑器到突变,用于对所述突变进行碱基编辑以将突变序列恢复为如上所述的野生型序列。在一些实施方式中,AAV产生组分包含编码DA-Rep52或DA-Rep40的核酸序列,并且活性控制组分包含编码一个或多个单引导RNA中每一个的核酸序列,所述一个或多个单引导RNA与编码DA-Rep52或DA-Rep40的核酸序列内的提前终止密码子充分互补,以指导碱基编辑器到提前终止密码子,用于将提前终止密码子碱基编辑为如上所述规范密码子。在一些实施方式中,编码DA-Rep52或DA-Rep40的核酸序列在对应SEQ ID NO:97中氨基酸残基Q262的位置处包含提前终止密码子,并且一个单引导RNA包含间隔子,所述间隔子与在对应SEQ ID NO:97中Q262的位置处的提前终止密码子充分互补,以指导碱基编辑器编辑提前终止密码子。在一些实施方式中,编码DA-Rep52或DA-Rep40的核酸序列在对应SEQ ID NO:97中氨基酸残基W319的位置处包含提前终止密码子,并且一个单引导RNA包含间隔子,所述间隔子与在对应SEQ ID NO:97中W319的位置处的提前终止密码子充分互补,以指导碱基编辑器编辑提前终止密码子。在一些实施方式中,编码DA-Rep52或DA-Rep40的核酸序列在对应SEQ ID NO:97中氨基酸残基Q262和W319位置处包含提前终止密码子,并且活性控制组分包含第一单引导RNA以及第二单引导RNA,所述第一单引导RNA包含间隔子,所述间隔子与在对应SEQ ID NO:97中Q262的位置处的提前终止密码子充分互补,以指导碱基编辑器将提前终止密码子编辑为谷氨酰胺密码子,所述第二单引导RNA包含间隔子,所述间隔子与在对应SEQ ID NO:97中W319的位置处的提前终止密码子充分互补,以指导碱基编辑器将提前终止密码子编辑为色氨酸密码子。在一些实施方式中,一个或多个单引导RNA各自包含与SEQ ID NO:64-65、73和81中任一个至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的核酸序列。在一些实施方式中,一个或多个单引导RNA各自包含SEQ ID NO:64-65、73和81中任一个的核酸序列。在一些实施方式中,一个或多个单引导RNA各自包含由SEQ ID NO:64-65、73和81中任一个组成的间隔子。
在一些实施方式中,AAV产生组分包含编码DA-Rep52、DA-Rep40和/或DA-Rep的核酸序列,所述核酸序列被修饰为在对应SEQ ID NO:97的M225(例如M225G)的氨基酸位置处包含突变,并且活性控制组分包含编码sgRNA的核酸序列,所述sgRNA与编码DA-Rep52、DA-Rep40和/或DA-Rep的核酸序列内的突变充分互补,以指导碱基编辑器到突变,用于对所述突变进行碱基编辑,以将突变序列恢复为如上所述的野生型序列。
在一些实施方式中,AAV产生组分包含编码DA-Rep52、DA-Rep40、DA-Rep78、DA-Rep68和/或DA-Rep的核酸序列,所述核酸序列被修饰为在对应SEQ ID NO:97的R529(例如AgG->CgC)的氨基酸位置处包含突变,并且活性控制组分包含编码sgRNA的核酸序列,所述sgRNA与编码DA-Rep52、DA-Rep40、DA-Rep78、DA-Rep68和/或DA-Rep的核酸序列内的突变充分互补,以指导碱基编辑器到突变,用于对所述突变进行碱基编辑,以将突变序列恢复为如上所述野生型序列。
在一些实施方式中,AAV产生组分包含编码DA-Rep78、DA-Rep68和/或DA-Rep的核酸序列,所述核酸序列在对应一个或多个氨基酸位置56-57、58-59、61-62、73-74、76-77、87-88、113-114、33-134、164-165、217-218、226-227、256-257、259-260、346-347、400-401、409-410、和455-456的位置处或介于对应一个或多个氨基酸位置56-57、58-59、61-62、73-74、76-77、87-88、113-114、33-134、164-165、217-218、226-227、256-257、259-260、346-347、400-401、409-410、和455-456的位置之间包含一个或多个(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或多个)错义或提前终止密码子突变,所述突变降低DA-Rep78、DA-Rep68和/或DA-Rep活性,并且活性控制组分包含编码sgRNA的核酸序列,所述sgRNA与编码DA-Rep78、DA-Rep68和/或DA-Rep的核酸序列内的一个或多个突变充分互补,以指导碱基编辑器到所述突变,用于对所述突变进行碱基编辑,以将突变序列恢复为如上所述的野生型序列。
在一些实施方式中,AAV产生组分包含编码DA-Rep52和/或DA-Rep40的核酸序列,所述核酸序列在对应一个或多个氨基酸位置226-227、256-257、259-260、346-347、400-401、409-410和455-456的位置处或介于对应一个或多个氨基酸位置226-227、256-257、259-260、346-347、400-401、409-410和455-456的位置之间包含一个或多个(例如1、2、3、4、5、6、7或多个)错义或提前终止密码子突变,所述突变降低DA-Rep78、DA-Rep68和/或DA-Rep活性,并且活性控制组分包含编码sgRNA的核酸序列,所述sgRNA与编码DA-Rep52和/或DA-Rep40的核酸序列内的一个或多个突变充分互补,以指导碱基编辑器到突变,用于对所述突变进行碱基编辑,以将突变序列恢复为如上所述野生型序列。
在一些实施方式中,AAV产生组分包含编码DA-Rep78、DA-Rep68或DA-Rep的核酸序列,并且活性控制组分包含编码一个或多个sgRNA中每一个的核酸序列,所述一个或多个sgRNA与编码DA-Rep78、DA-Rep68或DA-Rep的核酸序列内的突变充分互补,以指导碱基编辑器到突变,用于对所述突变进行碱基编辑,以将突变序列恢复为如上所述野生型序列。在一些实施方式中,AAV产生组分包含编码DA-Rep78、DA-Rep68或DA-Rep的核酸序列,并且活性控制组分包含编码一个或多个单引导RNA中每一个的核酸序列,所述一个或多个单引导RNA与DA-Rep78、DA-Rep68或DA-Rep内的提前终止密码子充分互补,以指导碱基编辑器到提前终止密码子,用于将提前终止密码子碱基编辑为如上所述规范密码子。在一些实施方式中,编码DA-Rep78、DA-Rep68或DA-Rep的核酸序列在对应SEQ ID NO:97中氨基酸残基W67的位置处包含提前终止密码子,并且一个单引导RNA包含间隔子,所述间隔子与在对应SEQ IDNO:97中W67的位置处的提前终止密码子充分互补,以指导碱基编辑器将所述提前终止密码子编辑为色氨酸密码子。在一些实施方式中,编码DA-Rep78、DA-Rep68或DA-Rep的核酸序列在对应SEQ ID NO:97中氨基酸残基Q262的位置处包含提前终止密码子,并且一个单引导RNA包含间隔子,所述间隔子与在对应SEQ ID NO:97中Q262位置处的提前终止密码子充分互补,以指导碱基编辑器将提前终止密码子编辑为谷氨酰胺密码子。在一些实施方式中,编码DA-Rep78、DA-Rep68或DA-Rep的核酸序列在对应SEQ ID NO:97中氨基酸W319位置处包含提前终止密码子,并且一个单引导RNA包含间隔子,所述间隔子与在对应SEQ ID NO:97中W319的位置处的提前终止密码子充分互补,以指导碱基编辑器将提前终止密码子编辑为色氨酸密码子。在一些实施方式中,编码DA-Rep78、DA-Rep68或DA-Rep的核酸序列在对应SEQID NO:97中氨基酸残基W67、Q262和W319的两个或多个位置处包含提前终止密码子,并且活性控制组分包含两个或多个具有间隔区的单引导RNA,其中间隔区与对应SEQ ID NO:97中氨基酸残基W67、Q262和W319的两个或多个提前终止密码子充分互补,以指导碱基编辑器将提前终止密码子编辑回原始野生型密码子。在一些实施方式中,一个或多个单引导RNA各自包含与SEQ ID NO:63-65、72-73和80-81中任一个至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的核酸序列。在一些实施方式中,一个或多个单引导RNA各自包含SEQ ID NO:63-65、72-73和80-81中任一个的核酸序列。在一些实施方式中,一个或多个单引导RNA各自包含由SEQ ID NO:63-65、72-73和80-81中任一个组成的间隔子。
在一些实施方式中,AAV产生组分包含编码DA-VP1、DA-VP2、DA-VP3和/或DA-VP的核酸序列,并且活性控制组分包含编码一个或多个sgRNA中每一个的核酸序列,所述一个或多个sgRNA与编码DA-VP1、DA-VP2、DA-VP3和/或DA-VP的核酸序列内的突变充分互补,以指导碱基编辑器到突变,用于对所述突变进行碱基编辑,以将突变序列恢复为如上所述的野生型序列。在一些实施方式中,AAV产生组分包含编码DA-VP1、DA-VP2、DA-VP3和/或DA-VP的核酸序列,并且活性控制组分包含编码一个或多个单引导RNA中每一个的核酸序列,所述一个或多个单引导RNA与编码DA-VP1、DA-VP2、DA-VP3和/或DA-VP的核酸序列内的提前终止密码子充分互补,以指导碱基编辑器到提前终止密码子,用于将提前终止密码子碱基编辑为如上所述的规范密码子。在一些实施方式中,AAV产生组分包含编码DA-VP1的核酸序列,所述核酸序列在对应VP1(SEQ ID NO:14)的氨基酸位置P8的位置处包含突变(例如ccA(P)->ccG(P)),并且活性控制组分包含编码单引导RNA的核酸序列,所述单引导RNA与在DA-VP1的位置P8处的突变充分互补,以指导碱基编辑器到所述突变,用于碱基编辑。在一些实施方式中,AAV产生组分包含编码DA-VP的核酸序列,所述DA-VP包含VP(SEQ ID NO:14)残基1-200内的一个或多个(例如1、2、3、4、5、6、7、8、9、10或多个)至蛋氨酸的氨基酸突变(例如异亮氨酸突变为蛋氨酸),并且活性控制组分包含编码一个或多个单引导RNA的核酸序列,所述一个或多个单引导RNA与至蛋氨酸的一个或多个突变充分互补,以指导碱基编辑器到突变,用于碱基编辑。在一些实施方式中,DA-VP包含VP(SEQ ID NO:14)残基1-200内的一个或多个(例如1、2、3、4、5、6、7、8、9、10或多个)异亮氨酸至蛋氨酸的突变。在一些实施方式中,AAV产生组分包含编码DA-VP3的核酸序列,所述DA-VP3包含至精氨酸或赖氨酸的一个或多个突变(例如至精氨酸或赖氨酸的1、2、3、4、5、6、7、8、9、10或更多个突变)(例如从天冬氨酸、谷氨酸或甘氨酸至精氨酸或赖氨酸),并且活性控制组分包含编码一个或多个单引导RNA的核酸序列,所述一个或多个单引导RNA与至精氨酸或赖氨酸的一个或多个突变充分互补,以指导碱基编辑器到一个或多个突变,用于碱基编辑。在一些实施方式中,编码DA-VP1、DA-VP2、DA-VP3和/或DA-VP的核酸序列在对应SEQ ID NO:14中氨基酸残基W304的位置处包含提前终止密码子,并且一个单引导RNA包含间隔子,所述间隔子与在对应SEQ ID NO:14中W304的位置处的提前终止密码子充分互补,以指导碱基编辑器将提前终止密码子编辑为色氨酸密码子。在一些实施方式中,编码DA-VP1的核酸序列在对应SEQ ID NO:14中氨基酸Q598的位置处包含提前终止密码子,并且一个单引导RNA包含间隔子,所述间隔子与在对应SEQ IDNO:14中Q598的位置处的提前终止密码子充分互补,以指导碱基编辑器将提前终止密码子编辑为谷氨酰胺终止密码子。在一些实施方式中,编码DA-VP1的核酸序列在对应SEQ IDNO:14中氨基酸W304和Q598的位置处包含提前终止密码子,并且活性控制组分包含第一单引导RNA以及第二单引导RNA,所述第一单引导RNA包含间隔子,所述间隔子与在对应SEQ IDNO:14中W304的位置处的提前终止密码子充分互补,以指导碱基编辑器将提前终止密码子编辑为色氨酸密码子,第二单引导RNA包含间隔子,所述间隔子与在对应SEQ ID NO:14中Q598的位置处的提前终止密码子充分互补,以指导碱基编辑器将提前终止密码子编辑为谷氨酰胺密码子。在一些实施方式中,一个或多个单引导RNA各自包含与SEQ ID NO:61-62、71和79中任一个至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的核酸序列。在一些实施方式中,一个或多个单引导RNA各自包含SEQ ID NO:61-62、71和79中任一个的核酸序列。在一些实施方式中,一个或多个单引导RNA各自包含由SEQ ID NO:61-62、71和79中任一个组成的间隔子。
在一些实施方式中,AAV产生组分包含编码DA-L4 100K的核酸序列,并且活性控制组分包含编码一个或多个sgRNA中每一个的核酸序列,所述一个或多个sgRNA与编码DA-L4100K的核酸序列内的突变充分互补,以指导碱基编辑器到突变,用于突变的碱基编辑,以将突变序列恢复为如上所述的野生型序列。在一些实施方式中,AAV产生组分包含编码DA-L4100K的核酸序列,并且终止密码子组分包含编码一个或多个单引导RNA中每一个的核酸序列,所述一个或多个单引导RNA与编码DA-L4 100K的核酸序列内的提前终止密码子充分互补,以指导碱基编辑器到提前终止密码子,以将提前终止密码子碱基编辑为如上所述的规范密码子。在一些实施方式中,编码DA-L4 100K的核酸序列在对应SEQ ID NO:112中氨基酸残基435的位置处包含提前终止密码子,并且一个单引导RNA包含间隔子,所述间隔子与在对应SEQ ID NO:112中W435的位置处的提前终止密码子充分互补,以指导碱基编辑器将提前终止密码子编辑为色氨酸密码子。在一些实施方式中,一个或多个单引导RNA各自包含与SEQ ID NO:60、70和78中任一个至少80%(例如,至少80%、至少85%、至少90%、至少95%或至少99%)同一性的核酸序列。在一些实施方式中,一个或多个单引导RNA各自包含SEQID NO:60、70和78中任一个的核酸序列。在一些实施方式中,一个或多个单引导RNA各自包含由SEQ ID NO:60、70和78中任一个组成的间隔子。
VI.包含碱基编辑器的用于AAV产生的工程化细胞的示例性实施方式
在一些方面中,AAV产生系统进一步包含用于AAV产生的工程化细胞。在一些实施方式中,工程化细胞包含一个或多个多核酸,所述一个或多个多核酸共同包含:(a)AAV产生组分和(b)活性控制组分,其包含能够以规范密码子替代早期终止密码子突变的碱基编辑器。
在一些实施方式中,工程化细胞包含编码如本文描述的碱基编辑器(例如ABE或CBE)的核酸序列、编码如本文描述的Rep52、DA-Rep52、Rep40或DA-Rep40中任一个的核酸序列、编码如本文描述的Rep78、DA-Rep78、Rep68或DA-Rep68中任一个的核酸序列、编码如本文描述的E2A或DA-E2A中任一个的核酸序列以及编码如本文描述的E4Orf6或DA-E4Orf6中任一个的核酸序列,进一步包含编码如本文描述的L4 100K或DA-L4 100K;VARNA;VP1或DA-VP1;VP2或DA-VP2;VP3或DA-VP3;以及AAP中每一个的核酸序列,其中工程化细胞包含DA-Rep52,DA-Rep40、DA-Rep78、DA-Rep68、DA-E4Orf6、DA-L4 100K、DA-VP1,DA-VP2和DA-VP3中的至少一个,并且其中细胞包含如本文描述的一个或多个单引导RNA,每个单引导RNA包含与DA-Rep52、DA-Rep40、DA-Rep78、DA-Rep68、DA-E4Orf6、DA-L4 100K、DA-VP1、DA-VP2和DA-VP3中至少一个充分互补的间隔子,以指导碱基编辑器将提前终止密码子编辑为规范密码子(例如原始野生型密码子)。
A.第一稳定整合的核酸分子
在一些实施方式中,用于AAV产生的工程化细胞包含一个或多个稳定整合的核酸分子。在一些实施方式中,包含一个或多个稳定整合的核酸分子的用于AAV产生的工程化细胞包含第一稳定整合的核酸分子。在一些实施方式中,第一稳定整合的核酸分子包含编码如上所述的E2A或DA-E2A;E4Orf6或DA-E4Orf6;L4 100K或DA-L4 100K;以及VARNA或DA-VARNA中每一个的核酸序列。在一些实施方式中,编码E2A或DA-E2A;E4Orf6或DA-E4Orf6;L4100K或DA-L4 100K;以及VARNA或DA-VARNA的核酸序列各自可操作地连接至如本文描述的启动子。
在一些实施方式中,第一稳定整合的核酸分子包含可操作地连接至如本文描述的启动子的选择标记。在一些实施方式中,第一稳定整合的核酸分子进一步包含如本文描述的两个CTCF绝缘子序列。如本文所用,术语“CTCF绝缘子”是指可防止基因组区域之间不必要的串扰的CCCTC-结合因子。在一些实施方式中,第一稳定整合的核酸分子进一步包含两个能够结合至睡美人转座酶的IR/DR序列。
在一些实施方式中,第一稳定整合的核酸分子包含编码DA-E2A的核酸序列。在一些实施方式中,第一稳定整合的核酸分子包含编码DA-E4ORF6的核酸序列。在一些实施方式中,第一稳定整合的核酸分子包含编码DA-E2A和DA-E4 ORF6的核酸序列。在一些实施方式中,第一稳定整合的核酸分子包含编码DA-L4 100K的核酸序列。
在一些实施方式中,第一稳定整合的核酸分子包含SEQ ID NO:39或SEQ ID NO:40、SEQ ID NO:98或112、SEQ ID NO:41或SEQ ID NO:42、以及SEQ ID NO:13。在一些实施方式中,包含SEQ ID NO:39或SEQ ID NO:40、SEQ ID NO:98或112、SEQ ID NO:41或SEQ IDNO:42、以及SEQ ID NO:13的第一稳定整合的核酸分子进一步包含选择盒。在一些实施方式中,第一稳定整合的核酸分子包含SEQ ID NO:39或SEQ ID NO:40、SEQ ID NO:98或112、SEQID NO:41或SEQ ID NO:42、SEQ ID NO:13,并且选择盒进一步包含两个CTCF绝缘子,其中CTCF绝缘子在第一稳定整合的核酸分子的5’和3’端上,并且SEQ ID NO:39或SEQ ID NO:40、SEQ ID NO:98或112、SEQ ID NO:41或SEQ ID NO:42、SEQ ID NO:13和选择盒在两个CTCF绝缘子之间。
在一些实施方式中,如上所述的第一稳定整合的核酸分子具有如图3中所描绘的相同的结构
B.第二整合的核酸分子
在一些实施方式中,包含一个或多个稳定整合的核酸分子的用于AAV产生的工程化细胞包含第一稳定整合的核酸分子和第二稳定整合的核酸分子。在一些实施方式中,第二稳定整合的核酸分子包含编码如本文描述的Rep52、DA-Rep52、Rep40或DA-Rep40;Rep78、DA-Rep78、Rep68或DA-Rep68;VP1或DA-VP1;VP2或DA-VP2;以及VP3或DA-VP3中每一个的核酸序列。在一些实施方式中,编码Rep52、DA-Rep52、Rep40或DA-Rep40;Rep78、DA-Rep78、Rep68或DA-Rep68;VP1或DA-VP1;VP2或DA-VP2;以及VP3或DA-VP3的核酸序列各自可操作地连接至如本文描述的启动子。
在一些实施方式中,第二稳定整合的核酸分子进一步包含一个或多个单引导RNA(例如,单引导RNA阵列),其中一个或多个单引导RNA各自包含如本文描述的间隔区。在一些实施方式中,编码一个或多个单引导RNA的核酸序列各自可操作地连接至如本文描述的启动子。在一些实施方式中,编码一个或多个单引导RNA的核酸序列各自可操作地连接至如本文描述的化学诱导型启动子。
在一些实施方式中,第二稳定整合的核酸分子进一步包含可操作地连接至如本文描述的启动子的选择标记。在一些实施方式中,第二稳定整合的核酸分子进一步包含如上所述的两个CTCF绝缘子序列。在一些实施方式中,第二稳定整合的核酸分子进一步包含如上所述的两个IR/DR序列。
在一些实施方式中,第二稳定整合的核酸分子包含DA-Rep,所述DA-Rep在对应SEQID NO:97中W319的位置处包含提前终止密码子。在一些实施方式中,DA-Rep可操作地连接至启动子。在一些实施方式中,DA-Rep可操作地连接至p19启动子。
在一些实施方式中,一个或多个sgRNA各自包含与DA-Rep W319充分互补的间隔区,以指导碱基编辑器编辑如上所述的提前终止密码子。在一些实施方式中,一个或多个sgRNA另外各自包含间隔区,所述间隔区与在W77和W192位置处的DA-E4 ORF6提前终止密码子充分互补,以指导碱基编辑器将提前终止密码子编辑为色氨酸(W)终止密码子,如上所述。
在一些实施方式中,第二稳定整合的核酸分子包含SEQ ID NO:14-16、54和65或81。在一些实施方式中,包含SEQ ID NO:14-16、54和65或81的第二稳定整合的核酸分子进一步包含SEQ ID NO:56-59。在一些实施方式中,包含SEQ ID NO:14-16、54和65或81的第二稳定整合的核酸分子进一步包含SEQ ID NO:66-69。在一些实施方式中,包含SEQ ID NO:14-16、54和65或81的第二稳定整合的核酸分子进一步包含SEQ ID NO:74-77。在一些实施方式中,包含SEQ ID NO:14-16、54和65或81、SEQ ID NO:56-59或SEQ ID NO:66-69或SEQID NO:74-77的第二稳定整合的核酸分子进一步包含选择盒。在一些实施方式中,包含SEQID NO:14-16、54和65或81、SEQ ID NO:56-59或SEQ ID NO:66-69或SEQ ID NO:74-77和选择盒的第二稳定整合的核酸分子进一步包含两个CTCF绝缘子,其中CTCF绝缘子在第一稳定整合的核酸分子的5’和3’端上,并且SEQ ID NO:14-16、54和65或81、SEQ ID NO:56-59或SEQ ID NO:66-69或SEQ ID NO:74-77和选择盒在两个CTCF绝缘子之间。
在一些实施方式中,如上所述的第二稳定整合的核酸分子具有与图3中所描绘的相同的结构。
C.第三稳定整合的核酸分子
在一些实施方式中,包含一个或多个稳定整合的核酸分子的用于AAV产生的工程化细胞包含如上所述的第一稳定整合的核酸分子、如上所述的第二稳定整合的核酸分子,并且包含第三稳定整合的核酸分子。在一些实施方式中,第三稳定整合的核酸分子包含编码如上所述的碱基编辑器的核酸序列。在一些实施方式中,第三稳定整合的核酸分子进一步包含编码如上所述的转录激活子的核酸序列。在一些实施方式中,第三稳定整合的核酸分子进一步包含可操作地连接至如本文描述的启动子的选择标记。在一些实施方式中,第三稳定整合的核酸分子进一步包含如上所述的两个CTCF绝缘子序列。在一些实施方式中,第三稳定整合的核酸分子进一步包含如上所述的两个IR/DR序列。在一些实施方式中,第三稳定整合的核酸分子进一步包含可操作地连接至如上所述的启动子的转录激活子。
在一些实施方式中,第三稳定整合的核酸分子包含可操作地连接至启动子的编码碱基编辑器的核酸分子(例如Cas9 ABE、Cas9 CBE或编码Cas13 ABE的核酸分子)。在一些实施方式中,启动子是化学诱导型。在一些实施方式中,化学诱导型启动子是TRE。在一些实施方式中,第三稳定整合的核酸分子包含编码TetOn转录激活子的核酸序列。在一些实施方式中,2A序列在TetOn核酸序列和选择标记核酸序列之间编码。
在一些实施方式中,第一稳定整合的核酸分子包含Cas9 ABE7.10(SEQ ID NO:82)、Cas9 ABE8.17m(SEQ ID NO:83)、Cas13 REPAIRv1(SEQ ID NO:84)或Cas13 REPAIRv2(SEQ ID NO:85)。在一些实施方式中,包含Cas9 ABE7.10(SEQ ID NO:82)、Cas9 ABE8.17m(SEQ ID NO:83)、Cas13 REPAIRv1(SEQ ID NO:84)或Cas13 REPAIRv2(SEQ ID NO:85)的第一稳定整合的核酸分子进一步包含TetOn启动子、2A肽和选择标记。在一些实施方式中,包含Cas9 ABE7.10(SEQ ID NO:82)、Cas9 ABE8.17m(SEQ ID NO:83)、Cas13 REPAIRv1(SEQID NO:84)或Cas13 REPAIRv2(SEQ ID NO:85)、TetOn启动子、2A肽和选择标记的第一稳定整合的核酸分子进一步包含两个CTCF绝缘子,其中CTCF绝缘子在第一稳定整合的核酸分子的5’和3’端上,并且Cas9 ABE7.10(SEQ ID NO:82)、Cas9 ABE8.17m(SEQ ID NO:83)、Cas13REPAIRv1(SEQ ID NO:84)或Cas13 REPAIRv2(SEQ ID NO:85)、TetOn启动子、2A肽和选择标记在两个CTCF绝缘子之间。
在一些实施方式中,第三稳定整合的核酸分子包含含有胞嘧啶碱基编辑器(CBE)的碱基编辑器。在一些实施方式中,CBE是Cas9 CBE或Cas13 CBE。在一些实施方式中,编码CBE的核酸序列可操作地连接至第三化学诱导型启动子。在一些实施方式中,CBE可操作地连接至选自由pTRE3G;pTREtight;或包含VanR、TtgR、PhlF或CymR或Gal4 UAS操纵子序列中至少一个的启动子组成的组的第三化学诱导型启动子。
在一些实施方式中,如上所述的第三稳定整合的核酸分子具有与如图3中所描绘的相同的结构。
D.第四稳定整合的核酸分子
在一些实施方式中,包含一个或多个稳定整合的核酸分子的用于AAV产生的工程化细胞包含如上所述的第一稳定整合的核酸分子、如上所述的第二稳定整合的核酸分子、第三稳定整合的核酸分子,并且包含第四稳定整合的核酸分子。在一些实施方式中,第四稳定整合的核酸分子包含编码选择盒和荧光蛋白标记(如本文描述的)(诸如EGFP)中每一个的核酸序列,每个核酸序列可操作地连接至启动子。在一些实施方式中,第四稳定整合的核酸分子进一步包含两个反向末端重复(ITR)序列。在一些实施方式中,第四稳定整合的核酸分子进一步包含含有两个反向末端重复(ITR)序列侧翼和如上所述的基因的载荷。在一些实施方式中,第四稳定整合的核酸分子进一步包含如上所述的两个CTCF绝缘子序列。在一些实施方式中,第三稳定整合的核酸分子进一步包含如上所述的两个IR/DR序列。
在一些实施方式中,如上所述的第四稳定整合的核酸分子具有如图3所描绘的相同的结构。
VII.使用包含碱基编辑器的工程化细胞用于AAV产生的方法
在一些方面中,本公开提供了产生AAV的方法,所述方法使用包含碱基编辑器和/或可操作地连接至如本文描述的化学诱导型启动子的sgRNA的工程化细胞。在一些实施方式中,方法进一步包括使用包含编码用于AAV递送的核酸序列的核酸序列分子的工程化细胞。在一些实施方式中,方法包括将工程化细胞培养到AAV产生的最佳的汇合度。最佳的汇合度将取决于工程化细胞所源自的细胞类型。本领域技术人员将知道或能够确定用于AAV产生的最佳汇合度。在一些实施方式中,方法包括将工程化细胞与能够诱导碱基编辑器或sgRNA表达的小分子诱导物接触。在一些实施方式中,小分子诱导物是多西环素、香草酸盐、根皮素、雷帕霉素、脱落酸、赤霉酸乙酰氧基甲酯或cumate。在一些实施方式中,方法包括使用本领域技术人员所熟知的方法收获由工程化细胞培养产生的AAV。
VIII.工程化细胞
在一些方面中,本公开涉及工程化细胞(例如,用于AAV产生的工程化细胞)。在一些实施方式中,工程化细胞源自已知或现有的细胞系。在一些实施方式中,工程化细胞源自由HEK293细胞、HeLa细胞、BHK细胞和Sf9细胞组成的组。在一些实施方式中,工程化细胞包含编码AAV产生所需基因的核酸序列和用于调节所述基因表达的系统,如本文描述的。在一些实施方式中,工程化细胞包含用于稳定整合一个或多个核酸分子(例如1、2、3、4、5或6个核酸分子)的基因组位点。用于稳定整合核酸分子的这些基因组位点为本领域普通技术人员所熟知。稳定整合的示例性位点包括但不限于AAVS1、ROSA26、CCR5、H11和LiPS-A3S。在一些实施方式中,稳定整合的核酸分子被随机整合到工程化细胞的基因组中。
IX.试剂盒
在一些方面中,本公开涉及包含本文部分I-II和V中描述的AAV产生系统的试剂盒。
在一些实施方式中,试剂盒包含一个或多个多核酸,所述一个或多个多核酸共同包含AAV产生系统。
在一些实施方式中,试剂盒包含部分III、VI和VIII中描述的工程化细胞。
在一些实施方式中,试剂盒包含多核苷酸,所述多核苷酸从5’至3’含有:(i)5’反向末端重复的核酸序列;(ii)多克隆位点;和(iii)3’反向末端重复的核酸序列。在一些实施方式中,多核苷酸是质粒或载体。
转移多核酸的中心核酸可包含多克隆位点的核酸序列。示例性多克隆位点对于具有本领域普通技术的人员是已知的。多克隆位点可用于在宿主细胞中生成病毒载体之前,将载荷分子(或感兴趣的基因)–或编码载荷分子的表达盒-克隆到转移多核酸中。
在一些实施方式中,试剂盒进一步包含与AAV产生系统的化学诱导型启动子对应的小分子诱导物。在一些实施方式中,小分子诱导物是多西环素、香草酸盐、根皮素、雷帕霉素、脱落酸、赤霉酸乙酰氧基甲酯和cumate。在一些实施方式中,试剂盒可进一步包含用于使用细胞的说明书。
在一些实施方式中,试剂盒包含工程化细胞,其中工程化细胞包含部分III或部分VI的稳定整合的核酸分子。
在一些实施方式中,试剂盒包含多核酸,所述多核酸包含可操作地连接至启动子的核酸序列的转录激活子的核酸序列,其中转录激活子当在小分子诱导物的存在下表达时,结合至AAV产生系统的化学诱导型启动子,任选地,其中工程化细胞包含含有转录激活子的核酸序列的多核酸。在一些实施方式中,转录激活子选自由TetOn-3G、TetOn-V16、TetOff-Advanced、VanR-VP16、TtgR-VP16、PhlF-VP16以及cumate cTA和rcTA组成的组。
实施例
实施例1.
非规范氨基酸AAV
方法描述及基因示意图:
使用非规范氨基酸(ncAA)并入在提前终止密码子处提供了对有毒蛋白质的翻译水平控制。将蛋白质表达与非规范氨基酸的存在联系起来,在转录后为蛋白质表达提供诱导控制,这意味着即使在转录物的存在下,靶蛋白的表达也应非常低或不表达。Rep78和Rep52 ncAA终止密码子突变体是通过在先前鉴定为耐受氨基酸变化的位点处引入TAG终止密码子而产生。在该系统中,使用源自古细菌马氏甲烷八叠球菌的正交转移RNA(tRNA)合成酶(pylRS)及其同源性tRNA(tRNApyl)将l-赖氨酸衍生物H-Lys(Boc)-OH并入至Rep蛋白中以诱导AAV产生。
实施例2.
碱基编辑器AAV
方法描述及基因示意图:
HEK293T产生系中细胞毒性基因的E1激活可通过使用提前终止密码子可逆地使这些基因失活来避免。当需要蛋白质表达时,腺嘌呤碱基编辑器(Adenine Base Editor,ABE)可执行靶向的A-至-G点突变,以将提前终止密码子恢复为编码氨基酸。对有义链上色氨酸(W)密码子进行的提前终止突变可通过基于DNA的Cas9 ABE和基于RNA的Cas13 ABE来恢复。在反义链上,基于DNA的Cas9 ABE可将提前终止密码子恢复变成谷氨酰胺(Q)和精氨酸残基。在反义链上,基于DNA的Cas9 CBE可将提前终止密码子恢复变成脯氨酸(P)残基。
据推测,在Rep、E2A和E4中引入提前终止密码子会阻止这些蛋白的表达,从而导致降低的AAV滴度,改善的细胞健康以及因此改善的制造稳定AAV产生细胞的能力。当需要AAV产生时,ABE可在用小分子处理后通过诱导型启动子来表达。例如,四环素反应元件(TRE)可在多西环素和反式四环素转录激活子(rtTA)的存在下诱导ABE的表达。用于ABE的单引导RNA由RNA PolIII启动子(诸如U6)组成型表达。
表3示出了对Rep、Cap、E2A、E4和L4 100K编码序列进行的具体突变,以及用于这些突变修复的引导序列。氨基酸位置编号与所示的CDS相对应。核苷酸位置编号与腺病毒2型(GenBank:J01917.1,NCBI:NC_001405.1)和腺相关病毒2型(GenBank:AF043303.1,NCBI:NC_001401.2)的全基因组相对应,其中侧翼碱基作为背景。另外的沉默突变可在提前终止密码子附近进行,以引入用于Cas9 ABE的PAM序列,或减少ABE编辑窗口内的脱靶碱基编辑。
表3:sgRNA序列
在实验中,对pRepCap和pHelper标准质粒进行提前终止突变(图2)。用这些修饰的质粒进行以瞬时转染的AAV产生,以确定提前终止密码子对AAV滴度的影响。对Rep或Cap进行的单个突变足以降低AAV滴度。以ABE和单引导RNA质粒的共转染,对Rep进行的突变可恢复到AAV的“野生型”水平。单独对E2A、E4ORF6或L4 100K引入单个突变不足以降低AAV滴度,但突变体组合产生更大的影响。当与ABE和引导池共转染时,这些组合也能够恢复到AAV的“野生型”水平。该结果当在稳定质粒系统(图3)的瞬时分析时成立,展示了在多西环素的存在下AAV滴度的诱导性。
初步数据及实验描述:
将贴壁HEK293FT细胞与EGFP-表达转移质粒、pRepCap、pHelper、ABE质粒和单引导RNA质粒共转染(图2)。pRepCap或pHelper的突变变体替代了“野生型”质粒,以测试它们对AAV滴度的影响(图4)。将ABE和相应的引导共转染,以确定ABE是否能恢复病毒滴度。在未检测到ABE和引导的样品中,惰性质粒被共转染以保持转染的DNA的量相同。还制备了仅含有“野生型”AAV2 pRepCap和pHelper质粒的对照样品或不含DNA的阴性对照转染混合物。转染后48小时,在干冰异丙醇浴中通过四次冻融循环收获AAV。通过将10、1和0.5uL病毒原料(stock)添加到在96孔板中铺板的5e4个HEK293FT细胞中进行转导。转导后48小时,收获转导的细胞,并且通过流式细胞术测定EGFP阳性细胞百分比,并用于计算每mL转导单位(TU/mL)。
接下来,将贴壁HEK293FT细胞以pRepCap或pHelper中的提前终止突变体的组合共转染,以测试它们对AAV滴度的组合影响,以及它们用ABE和单引导RNA质粒池恢复的能力(图5)。转染后48小时,在干冰异丙醇浴中通过四次冻融循环收获AAV。将病毒原料系列稀释1-、10-和100-倍,并且将10uL所得病毒原料通过添加到在96孔板中铺板的5e4个HEK293FT细胞中进行转导。转导后48小时,收集转导的细胞,并且通过流式细胞术测定EGFP阳性细胞百分比,并用于计算每mL转导单位(TU/mL)。
为了测试完全稳定系统的可行性,将贴壁HEK293FT细胞以完全稳定系统的组合共转染(图3)(含或不含500nM多西环素),以测试它们在多西环素的存在下诱导AAV的组合能力(图6)。转染后48小时,在干冰异丙醇浴中通过四次冻融循环收获AAV。将10uL和1uL的所得病毒原料通过添加到在96孔板中铺板的5e4个HEK293FT细胞中进行转导。转导后48小时,收获转导的细胞,并且通过流式细胞术测定EGFP阳性细胞百分比,并用于计算每mL转导单位(TU/mL)。
在悬浮细胞中包含可诱导的ABE、组成型引导池、以及突变体Rep、Cap、E2A或E4ORF6的组合的稳定细胞系,将被生成用于可诱导的AAV产生(图3)。
表4:核酸和多肽序列
其他实施方式
本说明书中公开的所有特征可以任何组合进行组合。本说明书中公开的每个特征可被用作相同、等同或类似目的的替代特征所代替。因此,除非另有明确说明,公开的每个特征仅是一系列等同或类似特征的实例。
从以上描述中,本领域技术人员可容易地确定本公开的基本特征,并且在不偏离其精神和范围的情况下,可对本公开进行各种改变和修改以使其适应各种用法和条件。因此,其他实施方式也在权利要求内。
等同形式
虽然本文已经描述和说明了几个发明实施方式,但本领域普通技术人员将容易地设想用于执行如本文描述的功能和/或获得如本文描述的结果和/或一个或多个优点的各种其他手段和/或结构,并且此类变化和/或修改中每一个都被认为在如本文描述的发明实施方式的范围内。更一般地说,本领域技术人员将容易理解,如本文描述的所有参数、尺寸、材料和构型都旨在是示例性,并且实际的参数、尺寸、材料和/或构型将取决于使用本发明的教义的一个或多个特定应用。本领域技术人员使用不超过常规实验将认识到或能够确定如本文描述的具体发明实施方式的许多等同形式。因此,应理解,前述实施方式仅以实例的方式呈现,并且在所附权利要求及其等同形式的范围内,可以以不同于具体描述和所要求保护的方式实施发明实施方式。本公开的发明实施方式涉及如本文描述的每个单独的特征、系统、物品、材料、试剂盒和/或方法。此外,如果此类特征、系统、物品、材料、试剂盒和/或方法不是相互不一致的,两个或多个此类特征、系统、物品、材料、试剂盒和/或方法的任何组合包含在本公开的发明范围内。
本文限定和使用的所有定义应被理解为优先于字典定义、通过引用并入的文件中的定义和/或所定义术语的普通含义。
本文公开的所有参考文献、专利和专利申请通过参考有关每个所引用的主题而并入,其在一些情况下可涵盖整个文件。
本申请在说明书和权利要求书中使用的不定冠词“一/一个/一种(a/an)”,除非明确指出相反,应理解为“至少一个/至少一种(at least one)”。
本文在说明书和权利要求书中使用的短语“和/或”应被理解为如此连接的元素的“其中之一或两者”,即,元素在一些情况下是联合呈现的,并且在其他情况下是分开呈现的。以“和/或”列出的多个元素应以相同的方式解释,即:“一个或多个/一种或多种”如此连接的元素。除了由“和/或”从句具体标识的元素之外,可任选地存在与具体标识的那些元素相关或不相关的其他元素。因此,作为非限制性实例,当与诸如“包含/包括/含有”的开放式语言一起使用时,对“A和/或B”的提及可在一个实施方式中仅指A(任选地包含除B以外的元素);在另一个实施方式中,仅指B(任选地包含除A以外的元素);在又另一个实施方式中,指A和B两者(任选地包含其他元素);等。
如本文在说明书和权利要求书中所使用的,“或”应理解为与如上所述定义的“和/或”具有相同的含义。例如,当分隔列表中的项目时,“或”或“和/或”应被解释为包含,即,包含许多元素或元素列表中至少一个,但也包含多于一个,以及任选地其他未列出的项。只有明确相反指出的术语,诸如“只有一个/只有一种/仅一个/仅一种/仅……一个/仅……一种(only one of)”或“正好一个/正好一种/恰好一个/恰好一种(exactly one of)”,或者当在权利要求书中使用时,“由……组成”将指包含许多元素或元素列表中的正好一个元素。一般而言,本文使用的术语“或”仅当前面有排他性术语,诸如“任一/二者其一(either)”、“一个/一种/其中之一(one of)”、“只有一个/只有一种/仅一个/仅一种/仅……一个/仅……一种(only one of)”或“正好一个/正好一种/恰好一个/恰好一种(exactly oneof)”等时,应被解释为表示排他性替代物(即“一个或另一个,但不是两者都有”)。在权利要求书中使用的“基本上由……组成”,应与专利法领域中使用的通常含义相同。
如本文在说明书和权利要求书中使用的,提及一个或多个元素的列表时,短语“至少一个/至少一种(at least one)”应被理解为是指从元素列表中任一个或多个元素中选择至少一个元素,但不一定包含元素列表中具体列出的每个元素中的至少一个,并且不排除元素列表中元素的任何组合。该定义还允许,除了在短语“至少一个/至少一种(at leastone)”所指的元素列表中具体标识的元素之外,元素可任选地存在,无论与具体标识的那些元素相关还是不相关。因此,作为非限制性实例,在一个实施方式中,“A和B中至少一个”(或等同地“A或B中至少一个”,或等同地“A和/或B中至少一个”)可指至少一个A、任选包含多于一个A,不存在B(并且任选地包含除B以外的元素);在另一个实施方式中,可指至少一个B、任选地包含多于一个B,不存在A(并且任选包含除A以外的元素);在又一个实施方式中,指至少一个A、任选地包含多于一个A,和至少一个B、任选包含多于一个B(并且任选地包含其他元素);等。
还应理解,除非明确相反地指出,在本文所要求保护的包括一个以上步骤或动作的任何方法中,所述方法的步骤或动作的顺序不一定限于所叙述的方法的步骤或动作的顺序。
在权利要求中,以及在以上说明书中,所有过渡性短语,诸如“包含/包括/含有(comprising/including/containing)”、“携带”、“具有/含有(having)”、“涉及”、“持有”、“包含/包括/含有(composed of)”等,应理解为是开放式的,即,意指包括但不限于。只有过渡短语“由……组成”和“基本上由……组成”应分别为封闭或半封闭的过渡短语,如美国专利局专利审查程序手册第2111.03节所述。应理解的是,在本文件中使用开放式过渡短语(例如,包含/包括/含有)描述的实施方式在替代实施方式中也被考虑为“由开放式过渡短语所描述的特征组成”和“基本上由开放式过渡短语所描述的特征组成”。例如,如果本公开描述“包含A和B的组合物”,则本公开还考虑到“由A和B组成的组合物”和“基本上由A和B组成的组合物”的替代实施方式。
序列表
<110> 阿西莫夫公司
<120> 用于腺相关病毒产生的稳定产生系统
<130> A1210.70007WO00
<140> 还未分配
<141> 与此同时
<150> US 63/177,760
<151> 2021-04-21
<160> 128
<170> PatentIn版本3.5
<210> 1
<211> 346
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 1
ctcgagttta ctccctatca gtgatagaga acgtatgtcg agtttactcc ctatcagtga 60
tagagaacga tgtcgagttt actccctatc agtgatagag aacgtatgtc gagtttactc 120
cctatcagtg atagagaacg tatgtcgagt ttactcccta tcagtgatag agaacgtatg 180
tcgagtttat ccctatcagt gatagagaac gtatgtcgag tttactccct atcagtgata 240
gagaacgtat gtcgaggtag gcgtgtacgg tgggaggcct atataagcag agctcgttta 300
gtgaaccgtc agatcgcctg gagaattcga gctcggtacc cgggga 346
<210> 2
<211> 423
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 2
gtttactccc tatcagtgat agagaacgta tgaagagttt actccctatc agtgatagag 60
aacgtatgca gactttactc cctatcagtg atagagaacg tataaggagt ttactcccta 120
tcagtgatag agaacgtatg accagtttac tccctatcag tgatagagaa cgtatctaca 180
gtttactccc tatcagtgat agagaacgta tatccagttt actccctatc agtgatagag 240
aacgtataag ctttaggcgt gtacggtggg cgcctataaa agcagagctc gtttagtgaa 300
ccgtcagatc gcctggagca attccacaac acttttgtct tataccaact ttccgtacca 360
cttcctaccc tcgtaaagtc gacaccgggg cccagatcta tcgatcggcc ggataacgcc 420
acc 423
<210> 3
<211> 496
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 3
gaattctcca ggcgatctga cggttcacta aacgagctct gcttatatag gcctcccacc 60
gtacacgcca cctcgacata ctcgagttta ctccctatca gtgatagaga acgtatgaag 120
agtttactcc ctatcagtga tagagaacgt atgcagactt tactccctat cagtgataga 180
gaacgtataa ggagtttact ccctatcagt gatagagaac gtatgaccag tttactccct 240
atcagtgata gagaacgtat ctacagttta ctccctatca gtgatagaga acgtatatcc 300
agtttactcc ctatcagtga tagagaacgt ataagcttta ggcgtgtacg gtgggcgcct 360
ataaaagcag agctcgttta gtgaaccgtc agatcgcctg gagcaattcc acaacacttt 420
tgtcttatac caactttccg taccacttcc taccctcgta aagtcgacac cggggcccag 480
atctccgcgg ggatcc 496
<210> 4
<211> 578
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 4
cccctctccc tccccccccc ctaacgttac tggccgaagc cgcttggaat aaggccggtg 60
tgcgtttgtc tatatgttat tttccaccat attgccgtct tttggcaatg tgagggcccg 120
gaaacctggc cctgtcttct tgacgagcat tcctaggggt ctttcccctc tcgccaaagg 180
aatgcaaggt ctgttgaatg tcgtgaagga agcagttcct ctggaagctt cttgaagaca 240
aacaacgtct gtagcgaccc tttgcaggca gcggaacccc ccacctggcg acaggtgcct 300
ctgcggccaa aagccacgtg tataagatac acctgcaaag gcggcacaac cccagtgcca 360
cgttgtgagt tggatagttg tggaaagagt caaatggctc tcctcaagcg tattcaacaa 420
ggggctgaag gatgcccaga aggtacccca ttgtatggga tctgatctgg ggcctcggtg 480
cacatgcttt acatgtgttt agtcgaggtt aaaaaaacgt ctaggccccc cgaaccacgg 540
ggacgtggtt ttcctttgaa aaacacgatg ataatatg 578
<210> 5
<211> 571
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 5
cccccccccc taacgttact ggccgaagcc gcttggaata aggccggtgt gcgtttgtct 60
atatgttatt ttccaccata ttgccgtctt ttggcaatgt gagggcccgg aaacctggcc 120
ctgtcttctt gacgagcatt cctaggggtc tttcccctct cgccaaagga atgcaaggtc 180
tgttgaatgt cgtgaaggaa gcagttcctc tggaagcttc ttgaagacaa acaacgtctg 240
tagcgaccct ttgcaggcag cggaaccccc cacctggcga caggtgcctc tgcggccaaa 300
agccacgtgt ataagataca cctgcaaagg cggcacaacc ccagtgccac gttgtgagtt 360
ggatagttgt ggaaagagtc aaatggctct cctcaagcgt attcaacaag gggctgaagg 420
atgcccagaa ggtaccccat tgtatgggat ctgatctggg gcctcggtgc acatgcttta 480
catgtgttta gtcgaggtta aaaaaacgtc taggcccccc gaaccacggg gacgtggttt 540
tcctttgaaa aacacgatga taatagttat c 571
<210> 6
<211> 397
<212> PRT
<213> 未知的
<220>
<223> 腺相关病毒
<400> 6
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
50 55 60
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
85 90 95
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
245 250 255
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
260 265 270
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
275 280 285
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
290 295 300
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
305 310 315 320
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
325 330 335
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
340 345 350
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
355 360 365
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
370 375 380
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
385 390 395
<210> 7
<211> 312
<212> PRT
<213> 未知的
<220>
<223> 腺相关病毒
<400> 7
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
50 55 60
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
85 90 95
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
245 250 255
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
260 265 270
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
275 280 285
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
290 295 300
Arg Leu Ala Arg Gly His Ser Leu
305 310
<210> 8
<211> 621
<212> PRT
<213> 未知的
<220>
<223> 腺相关病毒
<400> 8
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 9
<211> 536
<212> PRT
<213> 未知的
<220>
<223> 腺相关病毒
<400> 9
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Leu Ala Arg Gly His Ser Leu
530 535
<210> 10
<211> 529
<212> PRT
<213> 未知的
<220>
<223> 腺相关病毒
<400> 10
Met Ala Ser Arg Glu Glu Glu Gln Arg Glu Thr Thr Pro Glu Arg Gly
1 5 10 15
Arg Gly Ala Ala Arg Arg Pro Pro Thr Met Glu Asp Val Ser Ser Pro
20 25 30
Ser Pro Ser Pro Pro Pro Pro Arg Ala Pro Pro Lys Lys Arg Leu Arg
35 40 45
Arg Arg Leu Glu Ser Glu Asp Glu Glu Asp Ser Ser Gln Asp Ala Leu
50 55 60
Val Pro Arg Thr Pro Ser Pro Arg Pro Ser Thr Ser Thr Ala Asp Leu
65 70 75 80
Ala Ile Ala Ser Lys Lys Lys Lys Lys Arg Pro Ser Pro Lys Pro Glu
85 90 95
Arg Pro Pro Ser Pro Glu Val Ile Val Asp Ser Glu Glu Glu Arg Glu
100 105 110
Asp Val Ala Leu Gln Met Val Gly Phe Ser Asn Pro Pro Val Leu Ile
115 120 125
Lys His Gly Lys Gly Gly Lys Arg Thr Val Arg Arg Leu Asn Glu Asp
130 135 140
Asp Pro Val Ala Arg Gly Met Arg Thr Gln Glu Glu Lys Glu Glu Ser
145 150 155 160
Ser Glu Ala Glu Ser Glu Ser Thr Val Ile Asn Pro Leu Ser Leu Pro
165 170 175
Ile Val Ser Ala Trp Glu Lys Gly Met Glu Ala Ala Arg Ala Leu Met
180 185 190
Asp Lys Tyr His Val Asp Asn Asp Leu Lys Ala Asn Phe Lys Leu Leu
195 200 205
Pro Asp Gln Val Glu Ala Leu Ala Ala Val Cys Lys Thr Trp Leu Asn
210 215 220
Glu Glu His Arg Gly Leu Gln Leu Thr Phe Thr Ser Asn Lys Thr Phe
225 230 235 240
Val Thr Met Met Gly Arg Phe Leu Gln Ala Tyr Leu Gln Ser Phe Ala
245 250 255
Glu Val Thr Tyr Lys His His Glu Pro Thr Gly Cys Ala Leu Trp Leu
260 265 270
His Arg Cys Ala Glu Ile Glu Gly Glu Leu Lys Cys Leu His Gly Ser
275 280 285
Ile Met Ile Asn Lys Glu His Val Ile Glu Met Asp Val Thr Ser Glu
290 295 300
Asn Gly Gln Arg Ala Leu Lys Glu Gln Ser Ser Lys Ala Lys Ile Val
305 310 315 320
Lys Asn Arg Trp Gly Arg Asn Val Val Gln Ile Ser Asn Thr Asp Ala
325 330 335
Arg Cys Cys Val His Asp Ala Ala Cys Pro Ala Asn Gln Phe Ser Gly
340 345 350
Lys Ser Cys Gly Met Phe Phe Ser Glu Gly Ala Lys Ala Gln Val Ala
355 360 365
Phe Lys Gln Ile Lys Ala Phe Met Gln Ala Leu Tyr Pro Asn Ala Gln
370 375 380
Thr Gly His Gly His Leu Leu Met Pro Leu Arg Cys Glu Cys Asn Ser
385 390 395 400
Lys Pro Gly His Ala Pro Phe Leu Gly Arg Gln Leu Pro Lys Leu Thr
405 410 415
Pro Phe Ala Leu Ser Asn Ala Glu Asp Leu Asp Ala Asp Leu Ile Ser
420 425 430
Asp Lys Ser Val Leu Ala Ser Val His His Pro Ala Leu Ile Val Phe
435 440 445
Gln Cys Cys Asn Pro Val Tyr Arg Asn Ser Arg Ala Gln Gly Gly Gly
450 455 460
Pro Asn Cys Asp Phe Lys Ile Ser Ala Pro Asp Leu Leu Asn Ala Leu
465 470 475 480
Val Met Val Arg Ser Leu Trp Ser Glu Asn Phe Thr Glu Leu Pro Arg
485 490 495
Met Val Val Pro Glu Phe Lys Trp Ser Thr Lys His Gln Tyr Arg Asn
500 505 510
Val Ser Leu Pro Val Ala His Ser Asp Ala Arg Gln Asn Pro Phe Asp
515 520 525
Phe
<210> 11
<211> 294
<212> PRT
<213> 未知的
<220>
<223> 腺相关病毒
<400> 11
Met Thr Thr Ser Gly Val Pro Phe Gly Met Thr Leu Arg Pro Thr Arg
1 5 10 15
Ser Arg Leu Ser Arg Arg Thr Pro Tyr Ser Arg Asp Arg Leu Pro Pro
20 25 30
Phe Glu Thr Glu Thr Arg Ala Thr Ile Leu Glu Asp His Pro Leu Leu
35 40 45
Pro Glu Cys Asn Thr Leu Thr Met His Asn Val Ser Tyr Val Arg Gly
50 55 60
Leu Pro Cys Ser Val Gly Phe Thr Leu Ile Gln Glu Trp Val Val Pro
65 70 75 80
Trp Asp Met Val Leu Thr Arg Glu Glu Leu Val Ile Leu Arg Lys Cys
85 90 95
Met His Val Cys Leu Cys Cys Ala Asn Ile Asp Ile Met Thr Ser Met
100 105 110
Met Ile His Gly Tyr Glu Ser Trp Ala Leu His Cys His Cys Ser Ser
115 120 125
Pro Gly Ser Leu Gln Cys Ile Ala Gly Gly Gln Val Leu Ala Ser Trp
130 135 140
Phe Arg Met Val Val Asp Gly Ala Met Phe Asn Gln Arg Phe Ile Trp
145 150 155 160
Tyr Arg Glu Val Val Asn Tyr Asn Met Pro Lys Glu Val Met Phe Met
165 170 175
Ser Ser Val Phe Met Arg Gly Arg His Leu Ile Tyr Leu Arg Leu Trp
180 185 190
Tyr Asp Gly His Val Gly Ser Val Val Pro Ala Met Ser Phe Gly Tyr
195 200 205
Ser Ala Leu His Cys Gly Ile Leu Asn Asn Ile Val Val Leu Cys Cys
210 215 220
Ser Tyr Cys Ala Asp Leu Ser Glu Ile Arg Val Arg Cys Cys Ala Arg
225 230 235 240
Arg Thr Arg Arg Leu Met Leu Arg Ala Val Arg Ile Ile Ala Glu Glu
245 250 255
Thr Thr Ala Met Leu Tyr Ser Cys Arg Thr Glu Arg Arg Arg Gln Gln
260 265 270
Phe Ile Arg Ala Leu Leu Gln His His Arg Pro Ile Leu Met His Asp
275 280 285
Tyr Asp Ser Thr Pro Met
290
<210> 12
<211> 888
<212> DNA
<213> 未知的
<220>
<223> 腺相关病毒
<400> 12
atgactacgt ccggcgttcc atttggcatg acactacgac caacacgatc tcggttgtct 60
cggcgcactc cgtacagtag ggatcgccta cctccttttg agacagagac ccgcgctacc 120
atactggagg atcatccgct gctgcccgaa tgtaacactt tgacaatgca caatgtttcc 180
tacgtgcgag gtcttccctg cagtgtggga tttacgctga ttcaggaatg ggttgttccc 240
tgggatatgg ttctgacgcg ggaggagctt gtaatcctga ggaagtgtat gcacgtgtgc 300
ctgtgttgtg ccaacattga tatcatgacg agcatgatga tccatggtta cgagtcctgg 360
gctctccact gtcattgttc cagtcccggt tccctgcagt gcatagccgg cgggcaggtt 420
ttggccagct ggtttaggat ggtggtggat ggcgccatgt ttaatcagag gtttatatgg 480
taccgggagg tggtgaatta caacatgcca aaagaggtaa tgtttatgtc cagcgtgttt 540
atgaggggtc gccacttaat ctacctgcgc ttgtggtatg atggccacgt gggttctgtg 600
gtccccgcca tgagctttgg atacagcgcc ttgcactgtg ggattttgaa caatattgtg 660
gtgctgtgct gcagttactg tgctgattta agtgagatca gggtgcgctg ctgtgcccgg 720
aggacaaggc gtctcatgct gcgggcggtg cgaatcatcg ctgaggagac cactgccatg 780
ttgtattcct gcaggacgga gcggcggcgg cagcagttta ttcgcgcgct gctgcagcac 840
caccgcccta tcctgatgca cgattatgac tctaccccca tgtagtaa 888
<210> 13
<211> 738
<212> DNA
<213> 未知的
<220>
<223> 腺相关病毒
<400> 13
cgacgtaatc cgtagatgta cctggacatc caggtgatgc cggcggcggt ggtggaggcg 60
cgcggaaagt cgcggacgcg gttccagatg ttgcgcagcg gcaaaaagtg ctccatggtc 120
gggacgctct ggccggtgag gcgtgcgcag tcgttgacgc tctagaccgt gcaaaaggag 180
agcctgtaag cgggcactct tccgtggtct ggtggataaa ttcgcaaggg tatcatggcg 240
gacgaccggg gttcgaaccc cggatccggc cgtccgccgt gatccatgcg gttaccgccc 300
gcgtgtcgaa cccaggtgtg cgacgtcaga caacggggga gcgctccttt tggcttcctt 360
ccaggcgcgg cggctgctgc gctagctttt ttggccactg gccgcgcgcg gcgtaagcgg 420
ttaggctgga aagcgaaagc attaagtggc tcgctccctg tagccggagg gttattttcc 480
aagggttgag tcgcaggacc cccggttcga gtctcgggcc ggccggactg cggcgaacgg 540
gggtttgcct ccccgtcatg caagaccccg cttgcaaatt cctccggaaa cagggacgag 600
cccctttttt gcttttccca gatgcatccg gtgctgcggc agatgcgccc ccctcctcag 660
cagcggcaag agcaagagca gcggcagaca tgcagggcac cctccccttc tcctaccgcg 720
tcaggagggg caacatcc 738
<210> 14
<211> 735
<212> PRT
<213> 未知的
<220>
<223> 腺相关病毒
<400> 14
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 15
<211> 598
<212> PRT
<213> 未知的
<220>
<223> 腺相关病毒
<400> 15
Thr Ala Pro Gly Lys Lys Arg Pro Val Glu His Ser Pro Val Glu Pro
1 5 10 15
Asp Ser Ser Ser Gly Thr Gly Lys Ala Gly Gln Gln Pro Ala Arg Lys
20 25 30
Arg Leu Asn Phe Gly Gln Thr Gly Asp Ala Asp Ser Val Pro Asp Pro
35 40 45
Gln Pro Leu Gly Gln Pro Pro Ala Ala Pro Ser Gly Leu Gly Thr Asn
50 55 60
Thr Met Ala Thr Gly Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly
65 70 75 80
Ala Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr
85 90 95
Trp Met Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu
100 105 110
Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Gln Ser Gly
115 120 125
Ala Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
130 135 140
Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln
145 150 155 160
Arg Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe
165 170 175
Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr
180 185 190
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
195 200 205
Ser Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys
210 215 220
Leu Pro Pro Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr
225 230 235 240
Leu Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr
245 250 255
Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe
260 265 270
Thr Phe Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala
275 280 285
His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr
290 295 300
Leu Tyr Tyr Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln
305 310 315 320
Ser Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln
325 330 335
Ser Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser
340 345 350
Lys Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala
355 360 365
Thr Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro
370 375 380
Ala Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser
385 390 395 400
Gly Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp
405 410 415
Ile Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn
420 425 430
Pro Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg
435 440 445
Gly Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu
450 455 460
Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile
465 470 475 480
Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu
485 490 495
Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys
500 505 510
Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys
515 520 525
Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu
530 535 540
Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu
545 550 555 560
Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr
565 570 575
Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg
580 585 590
Tyr Leu Thr Arg Asn Leu
595
<210> 16
<211> 533
<212> PRT
<213> 未知的
<220>
<223> 腺相关病毒
<400> 16
Met Ala Thr Gly Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala
1 5 10 15
Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp
20 25 30
Met Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro
35 40 45
Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala
50 55 60
Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe
65 70 75 80
Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg
85 90 95
Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys
100 105 110
Leu Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr Thr
115 120 125
Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser
130 135 140
Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu
145 150 155 160
Pro Pro Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu
165 170 175
Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys
180 185 190
Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr
195 200 205
Phe Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His
210 215 220
Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu
225 230 235 240
Tyr Tyr Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser
245 250 255
Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser
260 265 270
Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys
275 280 285
Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr
290 295 300
Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala
305 310 315 320
Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly
325 330 335
Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile
340 345 350
Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro
355 360 365
Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly
370 375 380
Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro
385 390 395 400
Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
405 410 415
Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met
420 425 430
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn
435 440 445
Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe
450 455 460
Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile
465 470 475 480
Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile
485 490 495
Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val
500 505 510
Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr
515 520 525
Leu Thr Arg Asn Leu
530
<210> 17
<211> 204
<212> PRT
<213> 未知的
<220>
<223> 腺相关病毒
<400> 17
Leu Glu Thr Gln Thr Gln Tyr Leu Thr Pro Ser Leu Ser Asp Ser His
1 5 10 15
Gln Gln Pro Pro Leu Val Trp Glu Leu Ile Arg Trp Leu Gln Ala Val
20 25 30
Ala His Gln Trp Gln Thr Ile Thr Arg Ala Pro Thr Glu Trp Val Ile
35 40 45
Pro Arg Glu Ile Gly Ile Ala Ile Pro His Gly Trp Ala Thr Glu Ser
50 55 60
Ser Pro Pro Ala Pro Glu Pro Gly Pro Cys Pro Pro Thr Thr Thr Thr
65 70 75 80
Ser Thr Asn Lys Phe Pro Ala Asn Gln Glu Pro Arg Thr Thr Ile Thr
85 90 95
Thr Leu Ala Thr Ala Pro Leu Gly Gly Ile Leu Thr Ser Thr Asp Ser
100 105 110
Thr Ala Thr Phe His His Val Thr Gly Lys Asp Ser Ser Thr Thr Thr
115 120 125
Gly Asp Ser Asp Pro Arg Asp Ser Thr Ser Ser Ser Leu Thr Phe Lys
130 135 140
Ser Lys Arg Ser Arg Arg Met Thr Val Arg Arg Arg Leu Pro Ile Thr
145 150 155 160
Leu Pro Ala Arg Phe Arg Cys Leu Leu Thr Arg Ser Thr Ser Ser Arg
165 170 175
Thr Ser Ser Ala Arg Arg Ile Lys Asp Ala Ser Arg Arg Ser Gln Gln
180 185 190
Thr Ser Ser Trp Cys His Ser Met Asp Thr Ser Pro
195 200
<210> 18
<211> 19
<212> PRT
<213> 未知的
<220>
<223> 腺相关病毒
<400> 18
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 19
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 19
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 20
<211> 454
<212> PRT
<213> 马氏甲烷八叠球菌
<400> 20
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 21
<211> 454
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 21
Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp
1 5 10 15
Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser
20 25 30
Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val
35 40 45
Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys
50 55 60
Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn
65 70 75 80
Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys
85 90 95
Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val
100 105 110
Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln
115 120 125
Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu
130 135 140
Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser
145 150 155 160
Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile
165 170 175
Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys
180 185 190
Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile
195 200 205
Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu
210 215 220
Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu
225 230 235 240
Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp
245 250 255
Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr
260 265 270
Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile
275 280 285
Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn
290 295 300
Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile
305 310 315 320
Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys
325 330 335
Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser
340 345 350
Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn
355 360 365
His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Phe
370 375 380
Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala
385 390 395 400
Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro
405 410 415
Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His
420 425 430
Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn
435 440 445
Gly Ile Ser Thr Asn Leu
450
<210> 22
<211> 69
<212> DNA
<213> 马氏甲烷八叠球菌
<400> 22
ggaaacctga tcatgtagat cgaacggact ctaaatccgt tcagccgggt tagattcccg 60
gggtttccg 69
<210> 23
<211> 372
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 23
agtcagtcac tagttgggca ggaagagggc ctatttccca tgattccttc atatttgcat 60
atacgataca aggctgttag agagataatt agaattaatt tgactgtaaa cacaaagata 120
ttagtacaaa atacgtgacg tagaaagtaa taatttcttg ggtagtttgc agttttaaaa 180
ttatgtttta aaatggacta tcatatgctt accgtaactt gaaagtattt cgatttcttg 240
gctttatata tcttgtggaa aggacgaaac accggaaacc tgatcatgta gatcgaacgg 300
actctaaatc cgttcagccg ggttagattc ccggggtttc cggacaagtg cggtttttcc 360
taggagtcag tc 372
<210> 24
<211> 1932
<212> DNA
<213> 未知的
<220>
<223> 腺相关病毒
<400> 24
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
cactctctct ga 1932
<210> 25
<211> 1866
<212> DNA
<213> 未知的
<220>
<223> 腺相关病毒
<400> 25
ctggcgggct tctacgagat cgtgatcaag gtgcccagcg acctggacga gcatctgcct 60
ggcatcagcg acagcttcgt gaattgggtc gccgagaaag agtgggagct gcctcctgac 120
agcgacttgg acctgaacct gattgagcag gcccctctga cagtggccga gaagctgcag 180
agggatttcc tgacagagtg gcggagagtg tctaaggccc ctgaggctct gttcttcgtg 240
cagttcgaga agggcgagag ctacttccac ttacacgtgc tggtcgagac aaccggcgtg 300
aagtctttag tgctgggcag attcctgagc cagatcagag agaagctgat ccagcggatc 360
taccggggca tcgagcccac actgcctaat tggttcgccg tgaccaagac cagaaacggc 420
gctggcggcg gaaacaaggt ggtggacgag tgctacatcc ccaactacct gctgcctaag 480
acacagcccg aactgcagtg ggcctggacc aacttagaac agtacctgag cgcctgcctg 540
aatctgaccg agcggaaaag actggtggcc cagcatctga cccacgtgtc ccagacacaa 600
gagcagaaca aagagaatca gaaccccaac agcgacgccc ctgtgatcag aagcaagacc 660
agcgccagat acatggaact cgttggctgg ctggtggaca agggcatcac aagcgagaag 720
cagtggatcc aagaggacca ggccagctac atcagcttca acgccgcctc caacagcaga 780
tcccagatca aggccgctct ggacaacgcc ggcaagatca tgagcctgac aaagacagcc 840
cctgactacc tcgtgggcca gcagcctgtg gaagatatca gcagcaaccg gatctacaag 900
atcctggaac tgaacggcta cgaccctcag tatgccgcct ctgtgtttct cggctgggct 960
accaagaagt tcggcaagcg gaacaccatc tggctgtttg gccctgccac aaccggcaag 1020
accaatatcg ccgaggctat cgcccacacc gtgccttttt acggctgcgt gaactggacc 1080
aatgagaact tccccttcaa cgactgcgtg gacaagatgg tcatttggtg ggaagagggc 1140
aagatgaccg ccaaagtggt ggaaagcgcc aaggccatcc tcggcggatc taaagttcgc 1200
gtggaccaga agtgcaagtc tagcgcccag atcgacccca cacctgtgat cgtgaccagc 1260
aacaccaaca tgtgcgccgt gatcgacggc aacagcacca cctttgaaca ccagcagcca 1320
ctgcaggacc ggatgttcaa gttcgagctg accagacggc tggaccacga cttcggcaaa 1380
gtgaccaagc aagaagtgaa ggacttcttc cgctgggcca aagatcacgt ggtggaagtg 1440
gaacacgagt tctacgtgaa gaaaggcgga gccaagaaga ggcccgctcc ttccgatgcc 1500
gatatcagcg agcctaagcg cgtgcgggaa tctgtggctc agcctagcac atctgatgcc 1560
gaggccagca tcaactacgc cgacagatac cagaacaagt gcagccggca cgtgggaatg 1620
aatctgatgc tgttcccctg tcggcagtgc gagcggatga accagaacag caacatctgc 1680
ttcacccacg gccagaaaga ctgcctggaa tgcttccccg tgtccgagtc tcagcctgtg 1740
tccgtggtca agaaggccta ccagaagctg tgttacatcc accacatcat gggcaaagtg 1800
cccgatgcct gcaccgcctg cgatctggtt aatgtggacc tggatgactg catcttcgag 1860
cagtga 1866
<210> 26
<211> 1866
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 26
ctggcgggct tctacgagat cgtgatcaag gtgcccagcg acctggacga gcatctgcct 60
ggcatcagcg acagcttcgt gaattgggtc gccgagaaag agtgggagct gcctcctgac 120
agcgacttgg acctgaacct gattgagcag gcccctctga cagtggccga gaagctgcag 180
agggatttcc tgacagagtg gcggagagtg tctaaggccc ctgaggctct gttcttcgtg 240
cagttcgaga agggcgagag ctacttccac ttacacgtgc tggtcgagac aaccggcgtg 300
aagtctttag tgctgggcag attcctgagc cagatcagag agaagctgat ccagcggatc 360
taccggggca tcgagcccac actgcctaat tggttcgccg tgaccaagac cagaaacggc 420
gctggcggcg gaaacaaggt ggtggacgag tgctacatcc ccaactacct gctgcctaag 480
acacagcccg aactgcagtg ggcctggacc aacttagaac agtacctgag cgcctgcctg 540
aatctgaccg agcggaaaag actggtggcc cagcatctga cccacgtgtc ccagacacaa 600
gagcagaaca aagagaatca gaaccccaac agcgacgccc ctgtgatcag aagcaagacc 660
agcgccagat acatggaact cgttggctgg ctggtgtaga agggcatcac aagcgagaag 720
cagtggatcc aagaggacca ggccagctac atcagcttca acgccgcctc caacagcaga 780
tcccagatca aggccgctct ggacaacgcc ggcaagatca tgagcctgac aaagacagcc 840
cctgactacc tcgtgggcca gcagcctgtg gaagatatca gcagcaaccg gatctacaag 900
atcctggaac tgaacggcta cgaccctcag tatgccgcct ctgtgtttct cggctgggct 960
accaagaagt tcggcaagcg gaacaccatc tggctgtttg gccctgccac aaccggcaag 1020
accaatatcg ccgaggctat cgcccacacc gtgccttttt acggctgcgt gaactggacc 1080
aatgagaact tccccttcaa cgactgcgtg gacaagatgg tcatttggtg ggaagagggc 1140
aagatgaccg ccaaagtggt ggaaagcgcc aaggccatcc tcggcggatc taaagttcgc 1200
gtggaccaga agtgcaagtc tagcgcccag atcgacccca cacctgtgat cgtgaccagc 1260
aacaccaaca tgtgcgccgt gatcgacggc aacagcacca cctttgaaca ccagcagcca 1320
ctgcaggacc ggatgttcaa gttcgagctg accagacggc tggaccacga cttcggcaaa 1380
gtgaccaagc aagaagtgaa ggacttcttc cgctgggcca aagatcacgt ggtggaagtg 1440
gaacacgagt tctacgtgaa gaaaggcgga gccaagaaga ggcccgctcc ttccgatgcc 1500
gatatcagcg agcctaagcg cgtgcgggaa tctgtggctc agcctagcac atctgatgcc 1560
gaggccagca tcaactacgc cgacagatac cagaacaagt gcagccggca cgtgggaatg 1620
aatctgatgc tgttcccctg tcggcagtgc gagcggatga accagaacag caacatctgc 1680
ttcacccacg gccagaaaga ctgcctggaa tgcttccccg tgtccgagtc tcagcctgtg 1740
tccgtggtca agaaggccta ccagaagctg tgttacatcc accacatcat gggcaaagtg 1800
cccgatgcct gcaccgcctg cgatctggtt aatgtggacc tggatgactg catcttcgag 1860
cagtga 1866
<210> 27
<211> 1866
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 27
ctggcgggct tctacgagat cgtgatcaag gtgcccagcg acctggacta gcatctgcct 60
ggcatcagcg acagcttcgt gaattgggtc gccgagaaag agtgggagct gcctcctgac 120
agcgacttgg acctgaacct gattgagcag gcccctctga cagtggccga gaagctgcag 180
agggatttcc tgacagagtg gcggagagtg tctaaggccc ctgaggctct gttcttcgtg 240
cagttcgaga agggcgagag ctacttccac ttacacgtgc tggtcgagac aaccggcgtg 300
aagtctttag tgctgggcag attcctgagc cagatcagag agaagctgat ccagcggatc 360
taccggggca tcgagcccac actgcctaat tggttcgccg tgaccaagac cagaaacggc 420
gctggcggcg gaaacaaggt ggtggacgag tgctacatcc ccaactacct gctgcctaag 480
acacagcccg aactgcagtg ggcctggacc aacttagaac agtacctgag cgcctgcctg 540
aatctgaccg agcggaaaag actggtggcc cagcatctga cccacgtgtc ccagacacaa 600
gagcagaaca aagagaatca gaaccccaac agcgacgccc ctgtgatcag aagcaagacc 660
agcgccagat acatggaact cgttggctgg ctggtgtaga agggcatcac aagcgagaag 720
cagtggatcc aagaggacca ggccagctac atcagcttca acgccgcctc caacagcaga 780
tcccagatca aggccgctct ggacaacgcc ggcaagatca tgagcctgac aaagacagcc 840
cctgactacc tcgtgggcca gcagcctgtg gaagatatca gcagcaaccg gatctacaag 900
atcctggaac tgaacggcta cgaccctcag tatgccgcct ctgtgtttct cggctgggct 960
accaagaagt tcggcaagcg gaacaccatc tggctgtttg gccctgccac aaccggcaag 1020
accaatatcg ccgaggctat cgcccacacc gtgccttttt acggctgcgt gaactggacc 1080
aatgagaact tccccttcaa cgactgcgtg gacaagatgg tcatttggtg ggaagagggc 1140
aagatgaccg ccaaagtggt ggaaagcgcc aaggccatcc tcggcggatc taaagttcgc 1200
gtggaccaga agtgcaagtc tagcgcccag atcgacccca cacctgtgat cgtgaccagc 1260
aacaccaaca tgtgcgccgt gatcgacggc aacagcacca cctttgaaca ccagcagcca 1320
ctgcaggacc ggatgttcaa gttcgagctg accagacggc tggaccacga cttcggcaaa 1380
gtgaccaagc aagaagtgaa ggacttcttc cgctgggcca aagatcacgt ggtggaagtg 1440
gaacacgagt tctacgtgaa gaaaggcgga gccaagaaga ggcccgctcc ttccgatgcc 1500
gatatcagcg agcctaagcg cgtgcgggaa tctgtggctc agcctagcac atctgatgcc 1560
gaggccagca tcaactacgc cgacagatac cagaacaagt gcagccggca cgtgggaatg 1620
aatctgatgc tgttcccctg tcggcagtgc gagcggatga accagaacag caacatctgc 1680
ttcacccacg gccagaaaga ctgcctggaa tgcttccccg tgtccgagtc tcagcctgtg 1740
tccgtggtca agaaggccta ccagaagctg tgttacatcc accacatcat gggcaaagtg 1800
cccgatgcct gcaccgcctg cgatctggtt aatgtggacc tggatgactg catcttcgag 1860
cagtga 1866
<210> 28
<211> 1949
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 28
tgatctgcgc agccgccatg ccggggtttt acgagattgt gattaaggtc cccagcgacc 60
ttgacgagca tctgcccggc atttctgaca gctttgtgaa ctgggtggcc gagaaggaat 120
gggagttgcc gccagattct gacatggatc tgaatctgat tgagcaggca cccctgaccg 180
tggccgagaa gctgcagcgc gactttctga cggaatggcg ccgtgtgagt aaggccccgg 240
aggccctttt ctttgtgcaa tttgagaagg gagagagcta cttccacatg cacgtgctcg 300
tggaaaccac cggggtgaaa tccatggttt tgggacgttt cctgagtcag attcgcgaaa 360
aactgattca gagaatttac cgcgggatcg agccgacttt gccaaactgg ttcgcggtca 420
caaagaccag aaatggcgcc ggaggcggga acaaggtggt ggatgagtgc tacatcccca 480
attacttgct ccccaaaacc cagcctgagc tccagtgggc gtggactaat atggaacagt 540
atttaagcgc ctgtttgaat ctcacggagc gtaaacggtt ggtggcgcag catctgacgc 600
acgtgtcgca gacgcaggag cagaacaaag agaatcagaa tcccaattct gatgcgccgg 660
tgatcagatc aaaaacttca gccaggtaca tggagctggt cgggtggctc gtgtagaagg 720
ggattacctc ggagaagcag tggatccagg aggaccaggc ctcatacatc tccttcaatg 780
cggcctccaa ctcgcggtcc caaatcaagg ctgccttgga caatgcggga aagattatga 840
gcctgactaa aaccgccccc gactacctgg tgggccagca gcccgtggag gacatttcca 900
gcaatcggat ttataaaatt ttggaactaa acgggtacga tccccaatat gcggcttccg 960
tctttctggg atgggccacg aaaaagttcg gcaagaggaa caccatctgg ctgtttgggc 1020
ctgcaactac cgggaagacc aacatcgcgg aggccatagc ccacactgtg cccttctacg 1080
ggtgcgtaaa ctggaccaat gagaactttc ccttcaacga ctgtgtcgac aagatggtga 1140
tctggtggga ggaggggaag atgaccgcca aggtcgtgga gtcggccaaa gccattctcg 1200
gaggaagcaa ggtgcgcgtg gaccagaaat gcaagtcctc ggcccagata gacccgactc 1260
ccgtgatcgt cacctccaac accaacatgt gcgccgtgat tgacgggaac tcaacgacct 1320
tcgaacacca gcagccgttg caagaccgga tgttcaaatt tgaactcacc cgccgtctgg 1380
atcatgactt tgggaaggtc accaagcagg aagtcaaaga ctttttccgg tgggcaaagg 1440
atcacgtggt tgaggtggag catgaattct acgtcaaaaa gggtggagcc aagaaaagac 1500
ccgcccccag tgacgcagat ataagtgagc ccaaacgggt gcgcgagtca gttgcgcagc 1560
catcgacgtc agacgcggaa gcttcgatca actacgcaga caggtaccaa aacaaatgtt 1620
ctcgtcacgt gggcatgaat ctgatgctgt ttccctgcag acaatgcgag agaatgaatc 1680
agaattcaaa tatctgcttc actcacggac agaaagactg tttagagtgc tttcccgtgt 1740
cagaatctca acccgtttct gtcgtcaaaa aggcgtatca gaaactgtgc tacattcatc 1800
atatcatggg aaaggtgcca gacgcttgca ctgcctgcga tctggtcaat gtggatttgg 1860
atgactgcat ctttgaacaa taaatgattt aaatcaggta tggctgccga tggttatctt 1920
ccagattggc tcgaggacac tctctctga 1949
<210> 29
<211> 1949
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 29
tgatctgcgc agccgccatg ccggggtttt acgagattgt gattaaggtc cccagcgacc 60
ttgactagca tctgcccggc atttctgaca gctttgtgaa ctgggtggcc gagaaggaat 120
gggagttgcc gccagattct gacatggatc tgaatctgat tgagcaggca cccctgaccg 180
tggccgagaa gctgcagcgc gactttctga cggaatggcg ccgtgtgagt aaggccccgg 240
aggccctttt ctttgtgcaa tttgagaagg gagagagcta cttccacatg cacgtgctcg 300
tggaaaccac cggggtgaaa tccatggttt tgggacgttt cctgagtcag attcgcgaaa 360
aactgattca gagaatttac cgcgggatcg agccgacttt gccaaactgg ttcgcggtca 420
caaagaccag aaatggcgcc ggaggcggga acaaggtggt ggatgagtgc tacatcccca 480
attacttgct ccccaaaacc cagcctgagc tccagtgggc gtggactaat atggaacagt 540
atttaagcgc ctgtttgaat ctcacggagc gtaaacggtt ggtggcgcag catctgacgc 600
acgtgtcgca gacgcaggag cagaacaaag agaatcagaa tcccaattct gatgcgccgg 660
tgatcagatc aaaaacttca gccaggtaca tggagctggt cgggtggctc gtgtagaagg 720
ggattacctc ggagaagcag tggatccagg aggaccaggc ctcatacatc tccttcaatg 780
cggcctccaa ctcgcggtcc caaatcaagg ctgccttgga caatgcggga aagattatga 840
gcctgactaa aaccgccccc gactacctgg tgggccagca gcccgtggag gacatttcca 900
gcaatcggat ttataaaatt ttggaactaa acgggtacga tccccaatat gcggcttccg 960
tctttctggg atgggccacg aaaaagttcg gcaagaggaa caccatctgg ctgtttgggc 1020
ctgcaactac cgggaagacc aacatcgcgg aggccatagc ccacactgtg cccttctacg 1080
ggtgcgtaaa ctggaccaat gagaactttc ccttcaacga ctgtgtcgac aagatggtga 1140
tctggtggga ggaggggaag atgaccgcca aggtcgtgga gtcggccaaa gccattctcg 1200
gaggaagcaa ggtgcgcgtg gaccagaaat gcaagtcctc ggcccagata gacccgactc 1260
ccgtgatcgt cacctccaac accaacatgt gcgccgtgat tgacgggaac tcaacgacct 1320
tcgaacacca gcagccgttg caagaccgga tgttcaaatt tgaactcacc cgccgtctgg 1380
atcatgactt tgggaaggtc accaagcagg aagtcaaaga ctttttccgg tgggcaaagg 1440
atcacgtggt tgaggtggag catgaattct acgtcaaaaa gggtggagcc aagaaaagac 1500
ccgcccccag tgacgcagat ataagtgagc ccaaacgggt gcgcgagtca gttgcgcagc 1560
catcgacgtc agacgcggaa gcttcgatca actacgcaga caggtaccaa aacaaatgtt 1620
ctcgtcacgt gggcatgaat ctgatgctgt ttccctgcag acaatgcgag agaatgaatc 1680
agaattcaaa tatctgcttc actcacggac agaaagactg tttagagtgc tttcccgtgt 1740
cagaatctca acccgtttct gtcgtcaaaa aggcgtatca gaaactgtgc tacattcatc 1800
atatcatggg aaaggtgcca gacgcttgca ctgcctgcga tctggtcaat gtggatttgg 1860
atgactgcat ctttgaacaa taaatgattt aaatcaggta tggctgccga tggttatctt 1920
ccagattggc tcgaggacac tctctctga 1949
<210> 30
<211> 3648
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 30
gccgccacca tggaattagt gggctggttg gtcgataaag gcatcacaag cgaaaaacaa 60
tggattcaag aagatcaagc gagctatatt agttttaacg ccgctagtaa tagcagaagt 120
cagattaaag ccgctctcga taacgccggc aaaatcatgt ctttaaccaa gacagctcct 180
gattatttag tcgggcaaca acctgtcgag gacatcagtt ctaacagaat ctacaagatc 240
ctcgaattga atggctatga ccctcagtac gccgccagtg tgttcttagg ctgggctacc 300
aagaaatttg ggaaacgcaa tacaatttgg ttattcggcc ccgccaccac aggcaaaaca 360
aatattgccg aagctatcgc tcataccgtc cctttctatg gctgtgtgaa ttggacaaac 420
gaaaatttcc cttttaatga ttgcgtggat aaaatggtca tttggtggga agaaggcaaa 480
atgacagcta aagtggtcga aagcgctaag gctatcttgg gcggctctaa agtcagagtc 540
gatcaaaagt gtaaaagtag cgctcaaatc gatcccaccc ctgtcattgt gacaagtaat 600
acaaatatgt gtgctgtcat cgatggcaat agcaccacat ttgagcatca acaacccctc 660
caggatagaa tgtttaagtt cgagttgaca agaagattag accacgattt cggcaaagtg 720
acaaaacaag aggtgaagga tttctttaga tgggccaaag accatgtcgt ggaagtcgaa 780
cacgagtttt atgtgaagaa aggcggcgct aaaaagcggc ctgctccttc cgatgccgac 840
atctccgaac ctaagagagt cagagaaagc gtggcccaac ccagcaccag cgatgccgag 900
gccagcatta attatgccga tcgctatcag aataagtgca gcagacatgt cgggatgaac 960
ttaatgttat tcccttgtcg gcagtgtgaa cggatgaacc aaaacagcaa catttgtttt 1020
acccacggac aaaaggattg cctggaatgt ttccctgtca gcgagagcca gcctgtgagc 1080
gtggtgaaga aagcctacca aaagttatgt tatatccacc acattatggg caaagtcccc 1140
gatgcctgta ccgcttgtga cttagtgaac gtagacctcg acgattgtat tttcgagcag 1200
tgataagccc ctctccctcc ccccccccta acgttactgg ccgaagccgc ttggaataag 1260
gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt ggcaatgtga 1320
gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt tcccctctcg 1380
ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg gaagcttctt 1440
gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca cctggcgaca 1500
ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg gcacaacccc 1560
agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc tcaagcgtat 1620
tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct gatctggggc 1680
ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaaacgtcta ggccccccga 1740
accacgggga cgtggttttc ctttgaaaaa cacgatgata atatgcctgg cttctacgag 1800
atcgtgatca aggtgcccag cgacctggac gagcatctgc ctggcatcag cgacagcttc 1860
gtgaattggg tcgccgagaa agagtgggag ctgcctcctg acagcgacat ggacctgaac 1920
ctgattgagc aggcccctct gacagtggcc gagaagctgc agagggattt cctgacagag 1980
tggcggagag tgtctaaggc ccctgaggct ctgttcttcg tgcagttcga gaagggcgag 2040
agctacttcc acatgcacgt gctggtcgag acaaccggcg tgaagtctat ggtgctgggc 2100
agattcctga gccagatcag agagaagctg atccagcgga tctaccgggg catcgagccc 2160
acactgccta attggttcgc cgtgaccaag accagaaacg gtgctggcgg cggaaacaag 2220
gtggtggacg agtgctacat ccccaactac ctgctgccta agacacagcc cgaactgcag 2280
tgggcctgga ccaacatgga acagtacctg agcgcctgcc tgaatctgac cgagcggaaa 2340
agactggtgg cccagcatct gacccacgtg tcccagacac aagagcagaa caaagagaat 2400
cagaacccca acagcgacgc ccctgtgatc agaagcaaga ccagcgccag atacggagaa 2460
ctcgttggct ggctggtgga caagggcatc acaagcgaga agcagtggat ccaagaggac 2520
caggccagct acatcagctt caacgccgcc tccaacagca gatcccagat caaggccgct 2580
ctggacaacg ccggcaagat catgagcctg acaaagacag cccctgacta cctcgtgggc 2640
cagcagcctg tggaagatat cagcagcaac cggatctaca agatcctgga actgaacggc 2700
tacgaccctc agtatgccgc ctctgtgttt ctcggctggg ctaccaagaa gttcggcaag 2760
cggaacacca tctggctgtt tggccctgcc acaaccggca agaccaatat cgccgaggct 2820
atcgcccaca ccgtgccttt ttacggctgc gtgaactgga ccaatgagaa cttccccttc 2880
aacgactgcg tggacaagat ggtcatttgg tgggaagagg gcaagatgac cgccaaagtg 2940
gtggaaagcg ccaaggccat cctcggcgga tctaaagttc gcgtggacca gaagtgcaag 3000
tctagcgccc agatcgaccc cacacctgtg atcgtgacca gcaacaccaa catgtgcgcc 3060
gtgatcgacg gcaacagcac cacctttgaa caccagcagc cactgcagga ccggatgttc 3120
aagttcgagc tgaccagacg gctggaccac gacttcggca aagtgaccaa gcaagaagtg 3180
aaggacttct tccgctgggc caaagatcac gtggtggaag tggaacacga gttctacgtg 3240
aagaaaggcg gagccaagaa gaggcccgct ccttccgatg ccgatatcag cgagcctaag 3300
cgcgtgcggg aatctgtggc tcagcctagc acatctgatg ccgaggccag catcaactac 3360
gccgacagat accagaacaa gtgcagccgg cacgtgggaa tgaatctgat gctgttcccc 3420
tgtcggcagt gcgagcggat gaaccagaac agcaacatct gcttcaccca cggccagaaa 3480
gactgcctgg aatgcttccc cgtgtccgag tctcagcctg tgtccgtggt caagaaggcc 3540
taccagaagc tgtgttacat ccaccacatc atgggcaaag tgcccgatgc ctgcaccgcc 3600
tgcgatctgg ttaatgtgga cctggatgac tgcatcttcg agcagtga 3648
<210> 31
<211> 3648
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 31
gccgccacca tggaattagt gggctggttg gtctagaaag gcatcacaag cgaaaaacaa 60
tggattcaag aagatcaagc gagctatatt agttttaacg ccgctagtaa tagcagaagt 120
cagattaaag ccgctctcga taacgccggc aaaatcatgt ctttaaccaa gacagctcct 180
gattatttag tcgggcaaca acctgtcgag gacatcagtt ctaacagaat ctacaagatc 240
ctcgaattga atggctatga ccctcagtac gccgccagtg tgttcttagg ctgggctacc 300
aagaaatttg ggaaacgcaa tacaatttgg ttattcggcc ccgccaccac aggcaaaaca 360
aatattgccg aagctatcgc tcataccgtc cctttctatg gctgtgtgaa ttggacaaac 420
gaaaatttcc cttttaatga ttgcgtggat aaaatggtca tttggtggga agaaggcaaa 480
atgacagcta aagtggtcga aagcgctaag gctatcttgg gcggctctaa agtcagagtc 540
gatcaaaagt gtaaaagtag cgctcaaatc gatcccaccc ctgtcattgt gacaagtaat 600
acaaatatgt gtgctgtcat cgatggcaat agcaccacat ttgagcatca acaacccctc 660
caggatagaa tgtttaagtt cgagttgaca agaagattag accacgattt cggcaaagtg 720
acaaaacaag aggtgaagga tttctttaga tgggccaaag accatgtcgt ggaagtcgaa 780
cacgagtttt atgtgaagaa aggcggcgct aaaaagcggc ctgctccttc cgatgccgac 840
atctccgaac ctaagagagt cagagaaagc gtggcccaac ccagcaccag cgatgccgag 900
gccagcatta attatgccga tcgctatcag aataagtgca gcagacatgt cgggatgaac 960
ttaatgttat tcccttgtcg gcagtgtgaa cggatgaacc aaaacagcaa catttgtttt 1020
acccacggac aaaaggattg cctggaatgt ttccctgtca gcgagagcca gcctgtgagc 1080
gtggtgaaga aagcctacca aaagttatgt tatatccacc acattatggg caaagtcccc 1140
gatgcctgta ccgcttgtga cttagtgaac gtagacctcg acgattgtat tttcgagcag 1200
tgataagccc ctctccctcc ccccccccta acgttactgg ccgaagccgc ttggaataag 1260
gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt ggcaatgtga 1320
gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt tcccctctcg 1380
ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg gaagcttctt 1440
gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca cctggcgaca 1500
ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg gcacaacccc 1560
agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc tcaagcgtat 1620
tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct gatctggggc 1680
ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaaacgtcta ggccccccga 1740
accacgggga cgtggttttc ctttgaaaaa cacgatgata atatgcctgg cttctacgag 1800
atcgtgatca aggtgcccag cgacctggac gagcatctgc ctggcatcag cgacagcttc 1860
gtgaattggg tcgccgagaa agagtgggag ctgcctcctg acagcgacat ggacctgaac 1920
ctgattgagc aggcccctct gacagtggcc gagaagctgc agagggattt cctgacagag 1980
tggcggagag tgtctaaggc ccctgaggct ctgttcttcg tgcagttcga gaagggcgag 2040
agctacttcc acatgcacgt gctggtcgag acaaccggcg tgaagtctat ggtgctgggc 2100
agattcctga gccagatcag agagaagctg atccagcgga tctaccgggg catcgagccc 2160
acactgccta attggttcgc cgtgaccaag accagaaacg gtgctggcgg cggaaacaag 2220
gtggtggacg agtgctacat ccccaactac ctgctgccta agacacagcc cgaactgcag 2280
tgggcctgga ccaacatgga acagtacctg agcgcctgcc tgaatctgac cgagcggaaa 2340
agactggtgg cccagcatct gacccacgtg tcccagacac aagagcagaa caaagagaat 2400
cagaacccca acagcgacgc ccctgtgatc agaagcaaga ccagcgccag atacggagaa 2460
ctcgttggct ggctggtgta gaagggcatc acaagcgaga agcagtggat ccaagaggac 2520
caggccagct acatcagctt caacgccgcc tccaacagca gatcccagat caaggccgct 2580
ctggacaacg ccggcaagat catgagcctg acaaagacag cccctgacta cctcgtgggc 2640
cagcagcctg tggaagatat cagcagcaac cggatctaca agatcctgga actgaacggc 2700
tacgaccctc agtatgccgc ctctgtgttt ctcggctggg ctaccaagaa gttcggcaag 2760
cggaacacca tctggctgtt tggccctgcc acaaccggca agaccaatat cgccgaggct 2820
atcgcccaca ccgtgccttt ttacggctgc gtgaactgga ccaatgagaa cttccccttc 2880
aacgactgcg tggacaagat ggtcatttgg tgggaagagg gcaagatgac cgccaaagtg 2940
gtggaaagcg ccaaggccat cctcggcgga tctaaagttc gcgtggacca gaagtgcaag 3000
tctagcgccc agatcgaccc cacacctgtg atcgtgacca gcaacaccaa catgtgcgcc 3060
gtgatcgacg gcaacagcac cacctttgaa caccagcagc cactgcagga ccggatgttc 3120
aagttcgagc tgaccagacg gctggaccac gacttcggca aagtgaccaa gcaagaagtg 3180
aaggacttct tccgctgggc caaagatcac gtggtggaag tggaacacga gttctacgtg 3240
aagaaaggcg gagccaagaa gaggcccgct ccttccgatg ccgatatcag cgagcctaag 3300
cgcgtgcggg aatctgtggc tcagcctagc acatctgatg ccgaggccag catcaactac 3360
gccgacagat accagaacaa gtgcagccgg cacgtgggaa tgaatctgat gctgttcccc 3420
tgtcggcagt gcgagcggat gaaccagaac agcaacatct gcttcaccca cggccagaaa 3480
gactgcctgg aatgcttccc cgtgtccgag tctcagcctg tgtccgtggt caagaaggcc 3540
taccagaagc tgtgttacat ccaccacatc atgggcaaag tgcccgatgc ctgcaccgcc 3600
tgcgatctgg ttaatgtgga cctggatgac tgcatcttcg agcagtga 3648
<210> 32
<211> 3648
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 32
gccgccacca tggaattagt gggctggttg gtctagaaag gcatcacaag cgaaaaacaa 60
tggattcaag aagatcaagc gagctatatt agttttaacg ccgctagtaa tagcagaagt 120
cagattaaag ccgctctcga taacgccggc aaaatcatgt ctttaaccaa gacagctcct 180
gattatttag tcgggcaaca acctgtcgag gacatcagtt ctaacagaat ctacaagatc 240
ctcgaattga atggctatga ccctcagtac gccgccagtg tgttcttagg ctgggctacc 300
aagaaatttg ggaaacgcaa tacaatttgg ttattcggcc ccgccaccac aggcaaaaca 360
aatattgccg aagctatcgc tcataccgtc cctttctatg gctgtgtgaa ttggacaaac 420
gaaaatttcc cttttaatga ttgcgtggat aaaatggtca tttggtggga agaaggcaaa 480
atgacagcta aagtggtcga aagcgctaag gctatcttgg gcggctctaa agtcagagtc 540
gatcaaaagt gtaaaagtag cgctcaaatc gatcccaccc ctgtcattgt gacaagtaat 600
acaaatatgt gtgctgtcat cgatggcaat agcaccacat ttgagcatca acaacccctc 660
caggatagaa tgtttaagtt cgagttgaca agaagattag accacgattt cggcaaagtg 720
acaaaacaag aggtgaagga tttctttaga tgggccaaag accatgtcgt ggaagtcgaa 780
cacgagtttt atgtgaagaa aggcggcgct aaaaagcggc ctgctccttc cgatgccgac 840
atctccgaac ctaagagagt cagagaaagc gtggcccaac ccagcaccag cgatgccgag 900
gccagcatta attatgccga tcgctatcag aataagtgca gcagacatgt cgggatgaac 960
ttaatgttat tcccttgtcg gcagtgtgaa cggatgaacc aaaacagcaa catttgtttt 1020
acccacggac aaaaggattg cctggaatgt ttccctgtca gcgagagcca gcctgtgagc 1080
gtggtgaaga aagcctacca aaagttatgt tatatccacc acattatggg caaagtcccc 1140
gatgcctgta ccgcttgtga cttagtgaac gtagacctcg acgattgtat tttcgagcag 1200
tgataagccc ctctccctcc ccccccccta acgttactgg ccgaagccgc ttggaataag 1260
gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt ggcaatgtga 1320
gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt tcccctctcg 1380
ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg gaagcttctt 1440
gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca cctggcgaca 1500
ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg gcacaacccc 1560
agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc tcaagcgtat 1620
tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct gatctggggc 1680
ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaaacgtcta ggccccccga 1740
accacgggga cgtggttttc ctttgaaaaa cacgatgata atatgcctgg cttctacgag 1800
atcgtgatca aggtgcccag cgacctggac tagcatctgc ctggcatcag cgacagcttc 1860
gtgaattggg tcgccgagaa agagtgggag ctgcctcctg acagcgacat ggacctgaac 1920
ctgattgagc aggcccctct gacagtggcc gagaagctgc agagggattt cctgacagag 1980
tggcggagag tgtctaaggc ccctgaggct ctgttcttcg tgcagttcga gaagggcgag 2040
agctacttcc acatgcacgt gctggtcgag acaaccggcg tgaagtctat ggtgctgggc 2100
agattcctga gccagatcag agagaagctg atccagcgga tctaccgggg catcgagccc 2160
acactgccta attggttcgc cgtgaccaag accagaaacg gtgctggcgg cggaaacaag 2220
gtggtggacg agtgctacat ccccaactac ctgctgccta agacacagcc cgaactgcag 2280
tgggcctgga ccaacatgga acagtacctg agcgcctgcc tgaatctgac cgagcggaaa 2340
agactggtgg cccagcatct gacccacgtg tcccagacac aagagcagaa caaagagaat 2400
cagaacccca acagcgacgc ccctgtgatc agaagcaaga ccagcgccag atacggagaa 2460
ctcgttggct ggctggtgta gaagggcatc acaagcgaga agcagtggat ccaagaggac 2520
caggccagct acatcagctt caacgccgcc tccaacagca gatcccagat caaggccgct 2580
ctggacaacg ccggcaagat catgagcctg acaaagacag cccctgacta cctcgtgggc 2640
cagcagcctg tggaagatat cagcagcaac cggatctaca agatcctgga actgaacggc 2700
tacgaccctc agtatgccgc ctctgtgttt ctcggctggg ctaccaagaa gttcggcaag 2760
cggaacacca tctggctgtt tggccctgcc acaaccggca agaccaatat cgccgaggct 2820
atcgcccaca ccgtgccttt ttacggctgc gtgaactgga ccaatgagaa cttccccttc 2880
aacgactgcg tggacaagat ggtcatttgg tgggaagagg gcaagatgac cgccaaagtg 2940
gtggaaagcg ccaaggccat cctcggcgga tctaaagttc gcgtggacca gaagtgcaag 3000
tctagcgccc agatcgaccc cacacctgtg atcgtgacca gcaacaccaa catgtgcgcc 3060
gtgatcgacg gcaacagcac cacctttgaa caccagcagc cactgcagga ccggatgttc 3120
aagttcgagc tgaccagacg gctggaccac gacttcggca aagtgaccaa gcaagaagtg 3180
aaggacttct tccgctgggc caaagatcac gtggtggaag tggaacacga gttctacgtg 3240
aagaaaggcg gagccaagaa gaggcccgct ccttccgatg ccgatatcag cgagcctaag 3300
cgcgtgcggg aatctgtggc tcagcctagc acatctgatg ccgaggccag catcaactac 3360
gccgacagat accagaacaa gtgcagccgg cacgtgggaa tgaatctgat gctgttcccc 3420
tgtcggcagt gcgagcggat gaaccagaac agcaacatct gcttcaccca cggccagaaa 3480
gactgcctgg aatgcttccc cgtgtccgag tctcagcctg tgtccgtggt caagaaggcc 3540
taccagaagc tgtgttacat ccaccacatc atgggcaaag tgcccgatgc ctgcaccgcc 3600
tgcgatctgg ttaatgtgga cctggatgac tgcatcttcg agcagtga 3648
<210> 33
<211> 1866
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 33
atgcctggct tctacgagat cgtgatcaag gtgcccagcg acctggacga gcatctgcct 60
ggcatcagcg acagcttcgt gaattgggtc gccgagaaag agtgggagct gcctcctgac 120
agcgacatgg acctgaacct gattgagcag gcccctctga cagtggccga gaagctgcag 180
agggatttcc tgacagagtg gcggagagtg tctaaggccc ctgaggctct gttcttcgtg 240
cagttcgaga agggcgagag ctacttccac atgcacgtgc tggtcgagac aaccggcgtg 300
aagtctatgg tgctgggcag attcctgagc cagatcagag agaagctgat ccagcggatc 360
taccggggca tcgagcccac actgcctaat tggttcgccg tgaccaagac cagaaacggt 420
gctggcggcg gaaacaaggt ggtggacgag tgctacatcc ccaactacct gctgcctaag 480
acacagcccg aactgcagtg ggcctggacc aacatggaac agtacctgag cgcctgcctg 540
aatctgaccg agcggaaaag actggtggcc cagcatctga cccacgtgtc ccagacacaa 600
gagcagaaca aagagaatca gaaccccaac agcgacgccc ctgtgatcag aagcaagacc 660
agcgccagat acggagaact cgttggctgg ctggtgtaga agggcatcac aagcgagaag 720
cagtggatcc aagaggacca ggccagctac atcagcttca acgccgcctc caacagcaga 780
tcccagatca aggccgctct ggacaacgcc ggcaagatca tgagcctgac aaagacagcc 840
cctgactacc tcgtgggcca gcagcctgtg gaagatatca gcagcaaccg gatctacaag 900
atcctggaac tgaacggcta cgaccctcag tatgccgcct ctgtgtttct cggctgggct 960
accaagaagt tcggcaagcg gaacaccatc tggctgtttg gccctgccac aaccggcaag 1020
accaatatcg ccgaggctat cgcccacacc gtgccttttt acggctgcgt gaactggacc 1080
aatgagaact tccccttcaa cgactgcgtg gacaagatgg tcatttggtg ggaagagggc 1140
aagatgaccg ccaaagtggt ggaaagcgcc aaggccatcc tcggcggatc taaagttcgc 1200
gtggaccaga agtgcaagtc tagcgcccag atcgacccca cacctgtgat cgtgaccagc 1260
aacaccaaca tgtgcgccgt gatcgacggc aacagcacca cctttgaaca ccagcagcca 1320
ctgcaggacc ggatgttcaa gttcgagctg accagacggc tggaccacga cttcggcaaa 1380
gtgaccaagc aagaagtgaa ggacttcttc cgctgggcca aagatcacgt ggtggaagtg 1440
gaacacgagt tctacgtgaa gaaaggcgga gccaagaaga ggcccgctcc ttccgatgcc 1500
gatatcagcg agcctaagcg cgtgcgggaa tctgtggctc agcctagcac atctgatgcc 1560
gaggccagca tcaactacgc cgacagatac cagaacaagt gcagccggca cgtgggaatg 1620
aatctgatgc tgttcccctg tcggcagtgc gagcggatga accagaacag caacatctgc 1680
ttcacccacg gccagaaaga ctgcctggaa tgcttccccg tgtccgagtc tcagcctgtg 1740
tccgtggtca agaaggccta ccagaagctg tgttacatcc accacatcat gggcaaagtg 1800
cccgatgcct gcaccgcctg cgatctggtt aatgtggacc tggatgactg catcttcgag 1860
cagtga 1866
<210> 34
<211> 620
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 34
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Gly Glu Leu Val Gly Trp Leu Val Lys Gly Ile Thr Ser Glu Lys Gln
225 230 235 240
Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser
245 250 255
Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile
260 265 270
Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro
275 280 285
Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn
290 295 300
Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr
305 310 315 320
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
325 330 335
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
340 345 350
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
355 360 365
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
370 375 380
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
385 390 395 400
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
405 410 415
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
420 425 430
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
435 440 445
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
450 455 460
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
465 470 475 480
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
485 490 495
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
500 505 510
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
515 520 525
Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe
530 535 540
Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe
545 550 555 560
Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser
565 570 575
Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile
580 585 590
His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu
595 600 605
Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 35
<211> 1866
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 35
atgcctggct tctacgagat cgtgatcaag gtgcccagcg acctggacta gcatctgcct 60
ggcatcagcg acagcttcgt gaattgggtc gccgagaaag agtgggagct gcctcctgac 120
agcgacatgg acctgaacct gattgagcag gcccctctga cagtggccga gaagctgcag 180
agggatttcc tgacagagtg gcggagagtg tctaaggccc ctgaggctct gttcttcgtg 240
cagttcgaga agggcgagag ctacttccac atgcacgtgc tggtcgagac aaccggcgtg 300
aagtctatgg tgctgggcag attcctgagc cagatcagag agaagctgat ccagcggatc 360
taccggggca tcgagcccac actgcctaat tggttcgccg tgaccaagac cagaaacggt 420
gctggcggcg gaaacaaggt ggtggacgag tgctacatcc ccaactacct gctgcctaag 480
acacagcccg aactgcagtg ggcctggacc aacatggaac agtacctgag cgcctgcctg 540
aatctgaccg agcggaaaag actggtggcc cagcatctga cccacgtgtc ccagacacaa 600
gagcagaaca aagagaatca gaaccccaac agcgacgccc ctgtgatcag aagcaagacc 660
agcgccagat acggagaact cgttggctgg ctggtggaca agggcatcac aagcgagaag 720
cagtggatcc aagaggacca ggccagctac atcagcttca acgccgcctc caacagcaga 780
tcccagatca aggccgctct ggacaacgcc ggcaagatca tgagcctgac aaagacagcc 840
cctgactacc tcgtgggcca gcagcctgtg gaagatatca gcagcaaccg gatctacaag 900
atcctggaac tgaacggcta cgaccctcag tatgccgcct ctgtgtttct cggctgggct 960
accaagaagt tcggcaagcg gaacaccatc tggctgtttg gccctgccac aaccggcaag 1020
accaatatcg ccgaggctat cgcccacacc gtgccttttt acggctgcgt gaactggacc 1080
aatgagaact tccccttcaa cgactgcgtg gacaagatgg tcatttggtg ggaagagggc 1140
aagatgaccg ccaaagtggt ggaaagcgcc aaggccatcc tcggcggatc taaagttcgc 1200
gtggaccaga agtgcaagtc tagcgcccag atcgacccca cacctgtgat cgtgaccagc 1260
aacaccaaca tgtgcgccgt gatcgacggc aacagcacca cctttgaaca ccagcagcca 1320
ctgcaggacc ggatgttcaa gttcgagctg accagacggc tggaccacga cttcggcaaa 1380
gtgaccaagc aagaagtgaa ggacttcttc cgctgggcca aagatcacgt ggtggaagtg 1440
gaacacgagt tctacgtgaa gaaaggcgga gccaagaaga ggcccgctcc ttccgatgcc 1500
gatatcagcg agcctaagcg cgtgcgggaa tctgtggctc agcctagcac atctgatgcc 1560
gaggccagca tcaactacgc cgacagatac cagaacaagt gcagccggca cgtgggaatg 1620
aatctgatgc tgttcccctg tcggcagtgc gagcggatga accagaacag caacatctgc 1680
ttcacccacg gccagaaaga ctgcctggaa tgcttccccg tgtccgagtc tcagcctgtg 1740
tccgtggtca agaaggccta ccagaagctg tgttacatcc accacatcat gggcaaagtg 1800
cccgatgcct gcaccgcctg cgatctggtt aatgtggacc tggatgactg catcttcgag 1860
cagtga 1866
<210> 36
<211> 620
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 36
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Lys
20 25 30
Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Glu
35 40 45
Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Thr
50 55 60
Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln
65 70 75 80
Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu Thr
85 90 95
Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg
100 105 110
Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro
115 120 125
Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn
130 135 140
Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr
145 150 155 160
Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser
165 170 175
Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu
180 185 190
Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro
195 200 205
Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Gly
210 215 220
Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln
225 230 235 240
Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser
245 250 255
Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile
260 265 270
Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro
275 280 285
Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn
290 295 300
Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr
305 310 315 320
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
325 330 335
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
340 345 350
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
355 360 365
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
370 375 380
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
385 390 395 400
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
405 410 415
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
420 425 430
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
435 440 445
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
450 455 460
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
465 470 475 480
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
485 490 495
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
500 505 510
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
515 520 525
Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe
530 535 540
Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe
545 550 555 560
Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser
565 570 575
Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile
580 585 590
His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu
595 600 605
Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 37
<211> 1866
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 37
atgcctggct tctacgagat cgtgatcaag gtgcccagcg acctggacta gcatctgcct 60
ggcatcagcg acagcttcgt gaattgggtc gccgagaaag agtgggagct gcctcctgac 120
agcgacatgg acctgaacct gattgagcag gcccctctga cagtggccga gaagctgcag 180
agggatttcc tgacagagtg gcggagagtg tctaaggccc ctgaggctct gttcttcgtg 240
cagttcgaga agggcgagag ctacttccac atgcacgtgc tggtcgagac aaccggcgtg 300
aagtctatgg tgctgggcag attcctgagc cagatcagag agaagctgat ccagcggatc 360
taccggggca tcgagcccac actgcctaat tggttcgccg tgaccaagac cagaaacggt 420
gctggcggcg gaaacaaggt ggtggacgag tgctacatcc ccaactacct gctgcctaag 480
acacagcccg aactgcagtg ggcctggacc aacatggaac agtacctgag cgcctgcctg 540
aatctgaccg agcggaaaag actggtggcc cagcatctga cccacgtgtc ccagacacaa 600
gagcagaaca aagagaatca gaaccccaac agcgacgccc ctgtgatcag aagcaagacc 660
agcgccagat acggagaact cgttggctgg ctggtgtaga agggcatcac aagcgagaag 720
cagtggatcc aagaggacca ggccagctac atcagcttca acgccgcctc caacagcaga 780
tcccagatca aggccgctct ggacaacgcc ggcaagatca tgagcctgac aaagacagcc 840
cctgactacc tcgtgggcca gcagcctgtg gaagatatca gcagcaaccg gatctacaag 900
atcctggaac tgaacggcta cgaccctcag tatgccgcct ctgtgtttct cggctgggct 960
accaagaagt tcggcaagcg gaacaccatc tggctgtttg gccctgccac aaccggcaag 1020
accaatatcg ccgaggctat cgcccacacc gtgccttttt acggctgcgt gaactggacc 1080
aatgagaact tccccttcaa cgactgcgtg gacaagatgg tcatttggtg ggaagagggc 1140
aagatgaccg ccaaagtggt ggaaagcgcc aaggccatcc tcggcggatc taaagttcgc 1200
gtggaccaga agtgcaagtc tagcgcccag atcgacccca cacctgtgat cgtgaccagc 1260
aacaccaaca tgtgcgccgt gatcgacggc aacagcacca cctttgaaca ccagcagcca 1320
ctgcaggacc ggatgttcaa gttcgagctg accagacggc tggaccacga cttcggcaaa 1380
gtgaccaagc aagaagtgaa ggacttcttc cgctgggcca aagatcacgt ggtggaagtg 1440
gaacacgagt tctacgtgaa gaaaggcgga gccaagaaga ggcccgctcc ttccgatgcc 1500
gatatcagcg agcctaagcg cgtgcgggaa tctgtggctc agcctagcac atctgatgcc 1560
gaggccagca tcaactacgc cgacagatac cagaacaagt gcagccggca cgtgggaatg 1620
aatctgatgc tgttcccctg tcggcagtgc gagcggatga accagaacag caacatctgc 1680
ttcacccacg gccagaaaga ctgcctggaa tgcttccccg tgtccgagtc tcagcctgtg 1740
tccgtggtca agaaggccta ccagaagctg tgttacatcc accacatcat gggcaaagtg 1800
cccgatgcct gcaccgcctg cgatctggtt aatgtggacc tggatgactg catcttcgag 1860
cagtga 1866
<210> 38
<211> 619
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 38
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu Lys
20 25 30
Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile Glu
35 40 45
Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu Thr
50 55 60
Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln
65 70 75 80
Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu Thr
85 90 95
Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg
100 105 110
Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro
115 120 125
Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn
130 135 140
Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr
145 150 155 160
Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser
165 170 175
Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu
180 185 190
Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro
195 200 205
Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Gly
210 215 220
Glu Leu Val Gly Trp Leu Val Lys Gly Ile Thr Ser Glu Lys Gln Trp
225 230 235 240
Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser Asn
245 250 255
Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile Met
260 265 270
Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro Val
275 280 285
Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn Gly
290 295 300
Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr Lys
305 310 315 320
Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr Thr
325 330 335
Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr
340 345 350
Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val
355 360 365
Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys Val
370 375 380
Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp
385 390 395 400
Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile Val
405 410 415
Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr Thr
420 425 430
Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu Leu
435 440 445
Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu Val
450 455 460
Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu His
465 470 475 480
Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro Ser
485 490 495
Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala Gln
500 505 510
Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg Tyr
515 520 525
Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe Pro
530 535 540
Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe Thr
545 550 555 560
His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser Gln
565 570 575
Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile His
580 585 590
His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu Val
595 600 605
Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615
<210> 39
<211> 528
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 39
Met Ala Ser Arg Glu Glu Glu Gln Arg Glu Thr Thr Pro Glu Arg Gly
1 5 10 15
Arg Gly Ala Ala Arg Arg Pro Pro Thr Met Glu Asp Val Ser Ser Pro
20 25 30
Ser Pro Ser Pro Pro Pro Pro Arg Ala Pro Pro Lys Lys Arg Leu Arg
35 40 45
Arg Arg Leu Glu Ser Glu Asp Glu Glu Asp Ser Ser Gln Asp Ala Leu
50 55 60
Val Pro Arg Thr Pro Ser Pro Arg Pro Ser Thr Ser Thr Ala Asp Leu
65 70 75 80
Ala Ile Ala Ser Lys Lys Lys Lys Lys Arg Pro Ser Pro Lys Pro Glu
85 90 95
Arg Pro Pro Ser Pro Glu Val Ile Val Asp Ser Glu Glu Glu Arg Glu
100 105 110
Asp Val Ala Leu Gln Met Val Gly Phe Ser Asn Pro Pro Val Leu Ile
115 120 125
Lys His Gly Lys Gly Gly Lys Arg Thr Val Arg Arg Leu Asn Glu Asp
130 135 140
Asp Pro Val Ala Arg Gly Met Arg Thr Gln Glu Glu Lys Glu Glu Ser
145 150 155 160
Ser Glu Ala Glu Ser Glu Ser Thr Val Ile Asn Pro Leu Ser Leu Pro
165 170 175
Ile Val Ser Ala Glu Lys Gly Met Glu Ala Ala Arg Ala Leu Met Asp
180 185 190
Lys Tyr His Val Asp Asn Asp Leu Lys Ala Asn Phe Lys Leu Leu Pro
195 200 205
Asp Gln Val Glu Ala Leu Ala Ala Val Cys Lys Thr Trp Leu Asn Glu
210 215 220
Glu His Arg Gly Leu Gln Leu Thr Phe Thr Ser Asn Lys Thr Phe Val
225 230 235 240
Thr Met Met Gly Arg Phe Leu Gln Ala Tyr Leu Gln Ser Phe Ala Glu
245 250 255
Val Thr Tyr Lys His His Glu Pro Thr Gly Cys Ala Leu Trp Leu His
260 265 270
Arg Cys Ala Glu Ile Glu Gly Glu Leu Lys Cys Leu His Gly Ser Ile
275 280 285
Met Ile Asn Lys Glu His Val Ile Glu Met Asp Val Thr Ser Glu Asn
290 295 300
Gly Gln Arg Ala Leu Lys Glu Gln Ser Ser Lys Ala Lys Ile Val Lys
305 310 315 320
Asn Arg Trp Gly Arg Asn Val Val Gln Ile Ser Asn Thr Asp Ala Arg
325 330 335
Cys Cys Val His Asp Ala Ala Cys Pro Ala Asn Gln Phe Ser Gly Lys
340 345 350
Ser Cys Gly Met Phe Phe Ser Glu Gly Ala Lys Ala Gln Val Ala Phe
355 360 365
Lys Gln Ile Lys Ala Phe Met Gln Ala Leu Tyr Pro Asn Ala Gln Thr
370 375 380
Gly His Gly His Leu Leu Met Pro Leu Arg Cys Glu Cys Asn Ser Lys
385 390 395 400
Pro Gly His Ala Pro Phe Leu Gly Arg Gln Leu Pro Lys Leu Thr Pro
405 410 415
Phe Ala Leu Ser Asn Ala Glu Asp Leu Asp Ala Asp Leu Ile Ser Asp
420 425 430
Lys Ser Val Leu Ala Ser Val His His Pro Ala Leu Ile Val Phe Gln
435 440 445
Cys Cys Asn Pro Val Tyr Arg Asn Ser Arg Ala Gln Gly Gly Gly Pro
450 455 460
Asn Cys Asp Phe Lys Ile Ser Ala Pro Asp Leu Leu Asn Ala Leu Val
465 470 475 480
Met Val Arg Ser Leu Trp Ser Glu Asn Phe Thr Glu Leu Pro Arg Met
485 490 495
Val Val Pro Glu Phe Lys Trp Ser Thr Lys His Gln Tyr Arg Asn Val
500 505 510
Ser Leu Pro Val Ala His Ser Asp Ala Arg Gln Asn Pro Phe Asp Phe
515 520 525
<210> 40
<211> 528
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 40
Met Ala Ser Arg Glu Glu Glu Gln Arg Glu Thr Thr Pro Glu Arg Gly
1 5 10 15
Arg Gly Ala Ala Arg Arg Pro Pro Thr Met Glu Asp Val Ser Ser Pro
20 25 30
Ser Pro Ser Pro Pro Pro Pro Arg Ala Pro Pro Lys Lys Arg Leu Arg
35 40 45
Arg Arg Leu Glu Ser Glu Asp Glu Glu Asp Ser Ser Gln Asp Ala Leu
50 55 60
Val Pro Arg Thr Pro Ser Pro Arg Pro Ser Thr Ser Thr Ala Asp Leu
65 70 75 80
Ala Ile Ala Ser Lys Lys Lys Lys Lys Arg Pro Ser Pro Lys Pro Glu
85 90 95
Arg Pro Pro Ser Pro Glu Val Ile Val Asp Ser Glu Glu Glu Arg Glu
100 105 110
Asp Val Ala Leu Gln Met Val Gly Phe Ser Asn Pro Pro Val Leu Ile
115 120 125
Lys His Gly Lys Gly Gly Lys Arg Thr Val Arg Arg Leu Asn Glu Asp
130 135 140
Asp Pro Val Ala Arg Gly Met Arg Thr Gln Glu Glu Lys Glu Glu Ser
145 150 155 160
Ser Glu Ala Glu Ser Glu Ser Thr Val Ile Asn Pro Leu Ser Leu Pro
165 170 175
Ile Val Ser Ala Trp Glu Lys Gly Met Glu Ala Ala Arg Ala Leu Met
180 185 190
Asp Lys Tyr His Val Asp Asn Asp Leu Lys Ala Asn Phe Lys Leu Leu
195 200 205
Pro Asp Gln Val Glu Ala Leu Ala Ala Val Cys Lys Thr Trp Leu Asn
210 215 220
Glu Glu His Arg Gly Leu Gln Leu Thr Phe Thr Ser Asn Lys Thr Phe
225 230 235 240
Val Thr Met Met Gly Arg Phe Leu Gln Ala Tyr Leu Gln Ser Phe Ala
245 250 255
Glu Val Thr Tyr Lys His His Glu Pro Thr Gly Cys Ala Leu Trp Leu
260 265 270
His Arg Cys Ala Glu Ile Glu Gly Glu Leu Lys Cys Leu His Gly Ser
275 280 285
Ile Met Ile Asn Lys Glu His Val Ile Glu Met Asp Val Thr Ser Glu
290 295 300
Asn Gly Gln Arg Ala Leu Lys Glu Gln Ser Ser Lys Ala Lys Ile Val
305 310 315 320
Lys Asn Arg Gly Arg Asn Val Val Val Ile Ser Asn Thr Asp Ala Arg
325 330 335
Cys Cys Val His Asp Ala Ala Cys Pro Ala Asn Gln Phe Ser Gly Lys
340 345 350
Ser Cys Gly Met Phe Phe Ser Glu Gly Ala Lys Ala Gln Val Ala Phe
355 360 365
Lys Gln Ile Lys Ala Phe Met Gln Ala Leu Tyr Pro Asn Ala Gln Thr
370 375 380
Gly His Gly His Leu Leu Met Pro Leu Arg Cys Glu Cys Asn Ser Lys
385 390 395 400
Pro Gly His Ala Pro Phe Leu Gly Arg Gln Leu Pro Lys Leu Thr Pro
405 410 415
Phe Ala Leu Ser Asn Ala Glu Asp Leu Asp Ala Asp Leu Ile Ser Asp
420 425 430
Lys Ser Val Leu Ala Ser Val His His Pro Ala Leu Ile Val Phe Gln
435 440 445
Cys Cys Asn Pro Val Tyr Arg Asn Ser Arg Ala Gln Gly Gly Gly Pro
450 455 460
Asn Cys Asp Phe Lys Ile Ser Ala Pro Asp Leu Leu Asn Ala Leu Val
465 470 475 480
Met Val Arg Ser Leu Trp Ser Glu Asn Phe Thr Glu Leu Pro Arg Met
485 490 495
Val Val Pro Glu Phe Lys Trp Ser Thr Lys His Gln Tyr Arg Asn Val
500 505 510
Ser Leu Pro Val Ala His Ser Asp Ala Arg Gln Asn Pro Phe Asp Phe
515 520 525
<210> 41
<211> 293
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 41
Met Thr Thr Ser Gly Val Pro Phe Gly Met Thr Leu Arg Pro Thr Arg
1 5 10 15
Ser Arg Leu Ser Arg Arg Thr Pro Tyr Ser Arg Asp Arg Leu Pro Pro
20 25 30
Phe Glu Thr Glu Thr Arg Ala Thr Ile Leu Glu Asp His Pro Leu Leu
35 40 45
Pro Glu Cys Asn Thr Leu Thr Met His Asn Val Ser Tyr Val Arg Gly
50 55 60
Leu Pro Cys Ser Val Gly Phe Thr Leu Ile Gln Glu Val Val Pro Trp
65 70 75 80
Asp Met Val Leu Thr Arg Glu Glu Leu Val Ile Leu Arg Lys Cys Met
85 90 95
His Val Cys Leu Cys Cys Ala Asn Ile Asp Ile Met Thr Ser Met Met
100 105 110
Ile His Gly Tyr Glu Ser Trp Ala Leu His Cys His Cys Ser Ser Pro
115 120 125
Gly Ser Leu Gln Cys Ile Ala Gly Gly Gln Val Leu Ala Ser Trp Phe
130 135 140
Arg Met Val Val Asp Gly Ala Met Phe Asn Gln Arg Phe Ile Trp Tyr
145 150 155 160
Arg Glu Val Val Asn Tyr Asn Met Pro Lys Glu Val Met Phe Met Ser
165 170 175
Ser Val Phe Met Arg Gly Arg His Leu Ile Tyr Leu Arg Leu Trp Tyr
180 185 190
Asp Gly His Val Gly Ser Val Val Pro Ala Met Ser Phe Gly Tyr Ser
195 200 205
Ala Leu His Cys Gly Ile Leu Asn Asn Ile Val Val Leu Cys Cys Ser
210 215 220
Tyr Cys Ala Asp Leu Ser Glu Ile Arg Val Arg Cys Cys Ala Arg Arg
225 230 235 240
Thr Arg Arg Leu Met Leu Arg Ala Val Arg Ile Ile Ala Glu Glu Thr
245 250 255
Thr Ala Met Leu Tyr Ser Cys Arg Thr Glu Arg Arg Arg Gln Gln Phe
260 265 270
Ile Arg Ala Leu Leu Gln His His Arg Pro Ile Leu Met His Asp Tyr
275 280 285
Asp Ser Thr Pro Met
290
<210> 42
<211> 293
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 42
Met Thr Thr Ser Gly Val Pro Phe Gly Met Thr Leu Arg Pro Thr Arg
1 5 10 15
Ser Arg Leu Ser Arg Arg Thr Pro Tyr Ser Arg Asp Arg Leu Pro Pro
20 25 30
Phe Glu Thr Glu Thr Arg Ala Thr Ile Leu Glu Asp His Pro Leu Leu
35 40 45
Pro Glu Cys Asn Thr Leu Thr Met His Asn Val Ser Tyr Val Arg Gly
50 55 60
Leu Pro Cys Ser Val Gly Phe Thr Leu Ile Gln Glu Trp Val Val Pro
65 70 75 80
Trp Asp Met Val Leu Thr Arg Glu Glu Leu Val Ile Leu Arg Lys Cys
85 90 95
Met His Val Cys Leu Cys Cys Ala Asn Ile Asp Ile Met Thr Ser Met
100 105 110
Met Ile His Gly Tyr Glu Ser Trp Ala Leu His Cys His Cys Ser Ser
115 120 125
Pro Gly Ser Leu Gln Cys Ile Ala Gly Gly Gln Val Leu Ala Ser Trp
130 135 140
Phe Arg Met Val Val Asp Gly Ala Met Phe Asn Gln Arg Phe Ile Trp
145 150 155 160
Tyr Arg Glu Val Val Asn Tyr Asn Met Pro Lys Glu Val Met Phe Met
165 170 175
Ser Ser Val Phe Met Arg Gly Arg His Leu Ile Tyr Leu Arg Leu Tyr
180 185 190
Asp Gly His Val Gly Ser Val Val Pro Ala Met Ser Phe Gly Tyr Ser
195 200 205
Ala Leu His Cys Gly Ile Leu Asn Asn Ile Val Val Leu Cys Cys Ser
210 215 220
Tyr Cys Ala Asp Leu Ser Glu Ile Arg Val Arg Cys Cys Ala Arg Arg
225 230 235 240
Thr Arg Arg Leu Met Leu Arg Ala Val Arg Ile Ile Ala Glu Glu Thr
245 250 255
Thr Ala Met Leu Tyr Ser Cys Arg Thr Glu Arg Arg Arg Gln Gln Phe
260 265 270
Ile Arg Ala Leu Leu Gln His His Arg Pro Ile Leu Met His Asp Tyr
275 280 285
Asp Ser Thr Pro Met
290
<210> 43
<211> 396
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 43
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30
Ser Asn Ser Arg Ser Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile
35 40 45
Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro
50 55 60
Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn
65 70 75 80
Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr
85 90 95
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
100 105 110
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
115 120 125
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
130 135 140
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
145 150 155 160
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
165 170 175
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
180 185 190
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
195 200 205
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
210 215 220
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
225 230 235 240
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
245 250 255
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
260 265 270
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
275 280 285
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
290 295 300
Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe
305 310 315 320
Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe
325 330 335
Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser
340 345 350
Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile
355 360 365
His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu
370 375 380
Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
385 390 395
<210> 44
<211> 311
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 44
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30
Ser Asn Ser Arg Ser Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile
35 40 45
Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro
50 55 60
Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn
65 70 75 80
Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr
85 90 95
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
100 105 110
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
115 120 125
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
130 135 140
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
145 150 155 160
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
165 170 175
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
180 185 190
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
195 200 205
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
210 215 220
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
225 230 235 240
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
245 250 255
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
260 265 270
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
275 280 285
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
290 295 300
Leu Ala Arg Gly His Ser Leu
305 310
<210> 45
<211> 620
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 45
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile
260 265 270
Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro
275 280 285
Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn
290 295 300
Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr
305 310 315 320
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
325 330 335
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
340 345 350
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
355 360 365
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
370 375 380
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
385 390 395 400
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
405 410 415
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
420 425 430
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
435 440 445
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
450 455 460
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
465 470 475 480
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
485 490 495
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
500 505 510
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
515 520 525
Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe
530 535 540
Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe
545 550 555 560
Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser
565 570 575
Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile
580 585 590
His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu
595 600 605
Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 46
<211> 535
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 46
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile
260 265 270
Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro
275 280 285
Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn
290 295 300
Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr
305 310 315 320
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
325 330 335
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
340 345 350
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
355 360 365
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
370 375 380
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
385 390 395 400
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
405 410 415
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
420 425 430
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
435 440 445
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
450 455 460
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
465 470 475 480
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
485 490 495
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
500 505 510
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
515 520 525
Leu Ala Arg Gly His Ser Leu
530 535
<210> 47
<211> 396
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 47
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
50 55 60
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Ala Thr
85 90 95
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
100 105 110
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
115 120 125
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
130 135 140
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
145 150 155 160
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
165 170 175
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
180 185 190
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
195 200 205
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
210 215 220
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
225 230 235 240
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
245 250 255
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
260 265 270
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
275 280 285
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
290 295 300
Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe
305 310 315 320
Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe
325 330 335
Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser
340 345 350
Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile
355 360 365
His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu
370 375 380
Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
385 390 395
<210> 48
<211> 311
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 48
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
50 55 60
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Ala Thr
85 90 95
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
100 105 110
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
115 120 125
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
130 135 140
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
145 150 155 160
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
165 170 175
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
180 185 190
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
195 200 205
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
210 215 220
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
225 230 235 240
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
245 250 255
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
260 265 270
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
275 280 285
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
290 295 300
Leu Ala Arg Gly His Ser Leu
305 310
<210> 49
<211> 620
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 49
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Ala Thr
305 310 315 320
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
325 330 335
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
340 345 350
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
355 360 365
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
370 375 380
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
385 390 395 400
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
405 410 415
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
420 425 430
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
435 440 445
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
450 455 460
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
465 470 475 480
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
485 490 495
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
500 505 510
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
515 520 525
Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe
530 535 540
Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe
545 550 555 560
Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser
565 570 575
Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile
580 585 590
His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu
595 600 605
Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 50
<211> 535
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 50
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Ala Thr
305 310 315 320
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
325 330 335
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
340 345 350
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
355 360 365
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
370 375 380
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
385 390 395 400
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
405 410 415
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
420 425 430
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
435 440 445
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
450 455 460
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
465 470 475 480
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
485 490 495
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
500 505 510
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
515 520 525
Leu Ala Arg Gly His Ser Leu
530 535
<210> 51
<211> 620
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 51
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln
65 70 75 80
Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu Thr
85 90 95
Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg
100 105 110
Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro
115 120 125
Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn
130 135 140
Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr
145 150 155 160
Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser
165 170 175
Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu
180 185 190
Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro
195 200 205
Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Met
210 215 220
Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln
225 230 235 240
Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser
245 250 255
Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile
260 265 270
Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro
275 280 285
Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn
290 295 300
Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr
305 310 315 320
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
325 330 335
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
340 345 350
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
355 360 365
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
370 375 380
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
385 390 395 400
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
405 410 415
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
420 425 430
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
435 440 445
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
450 455 460
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
465 470 475 480
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
485 490 495
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
500 505 510
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
515 520 525
Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu Phe
530 535 540
Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys Phe
545 550 555 560
Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu Ser
565 570 575
Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr Ile
580 585 590
His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp Leu
595 600 605
Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 52
<211> 535
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 52
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val Gln
65 70 75 80
Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu Thr
85 90 95
Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile Arg
100 105 110
Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu Pro
115 120 125
Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly Asn
130 135 140
Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys Thr
145 150 155 160
Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu Ser
165 170 175
Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His Leu
180 185 190
Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn Pro
195 200 205
Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr Met
210 215 220
Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys Gln
225 230 235 240
Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala Ser
245 250 255
Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys Ile
260 265 270
Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln Pro
275 280 285
Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu Asn
290 295 300
Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala Thr
305 310 315 320
Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala Thr
325 330 335
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
340 345 350
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
355 360 365
Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala Lys
370 375 380
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
385 390 395 400
Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val Ile
405 410 415
Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser Thr
420 425 430
Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe Glu
435 440 445
Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln Glu
450 455 460
Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val Glu
465 470 475 480
His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala Pro
485 490 495
Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val Ala
500 505 510
Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp Arg
515 520 525
Leu Ala Arg Gly His Ser Leu
530 535
<210> 53
<211> 1932
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 53
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
agctaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
cactctctct ga 1932
<210> 54
<211> 1932
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 54
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggataggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
cactctctct ga 1932
<210> 55
<211> 1932
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 55
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggagta gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
cactctctct ga 1932
<210> 56
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 56
tgcgtaggag aagggcatgg 20
<210> 57
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 57
ccggtagggc cgaaatgtgg 20
<210> 58
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 58
atgagttgtt ccctgggata 20
<210> 59
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 59
cttgtagtat gatggccacg 20
<210> 60
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 60
cgtgtagcag caatgcctgg 20
<210> 61
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 61
actgaggatt ccgacccaag 20
<210> 62
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 62
gccttatgtg ttgacatctg 20
<210> 63
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 63
ggagtagcgc cgtgtgagta 20
<210> 64
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 64
gatttagctc cgcgagttgg 20
<210> 65
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 65
ggataggcca cgaaaaagtt 20
<210> 66
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 66
cttctcccac gcagacacga tcggcaggct 30
<210> 67
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 67
tcggccccac cggttcttca cgatcttggc 30
<210> 68
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 68
gaacaaccca ttcctgaatc agcgtaaatc 30
<210> 69
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 69
atcataccac aagcgcaggt agattaagtg 30
<210> 70
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 70
ttgctgccac acgcccatgg ccgtttgcca 30
<210> 71
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 71
ggaatcccca gttgttgttg atgagtcttt 30
<210> 72
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 72
acggcgccac tccgtcagaa agtcgcgctg 30
<210> 73
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 73
cgtggcccat cccagaaaga cggaagccgc 30
<210> 74
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 74
ctccatgccc ttctcccacg cagacacgat cggcaggctc agcgggttta 50
<210> 75
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 75
caccacattt cggccccacc ggttcttcac gatcttggcc ttgctagact 50
<210> 76
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 76
tatcccaggg aacaacccat tcctgaatca gcgtaaatcc cacactgcag 50
<210> 77
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 77
cacgtggcca tcataccaca agcgcaggta gattaagtgg cgacccctca 50
<210> 78
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 78
ctccaggcat tgctgccaca cgcccatggc cgtttgccag gtgtagcaca 50
<210> 79
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 79
tcttgggtcg gaatccccag ttgttgttga tgagtctttg ccagtcacgt 50
<210> 80
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 80
cttactcaca cggcgccact ccgtcagaaa gtcgcgctgc agcttctcgg 50
<210> 81
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 81
gaactttttc gtggcccatc ccagaaagac ggaagccgca tattggggat 50
<210> 82
<211> 1775
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 82
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr
195 200 205
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg
210 215 220
Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
225 230 235 240
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala
245 250 255
Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
260 265 270
Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys
275 280 285
Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val
290 295 300
Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
305 310 315 320
Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
325 330 335
Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln
340 345 350
Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly
355 360 365
Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
370 375 380
Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys
385 390 395 400
Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val
405 410 415
Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly
420 425 430
Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu
435 440 445
Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala
450 455 460
Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu
465 470 475 480
Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg
485 490 495
Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His
500 505 510
Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr
515 520 525
Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys
530 535 540
Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe
545 550 555 560
Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp
565 570 575
Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe
580 585 590
Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu
595 600 605
Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln
610 615 620
Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu
625 630 635 640
Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu
645 650 655
Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp
660 665 670
Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala
675 680 685
Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val
690 695 700
Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg
705 710 715 720
Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg
725 730 735
Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys
740 745 750
Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe
755 760 765
Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu
770 775 780
Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr
785 790 795 800
Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His
805 810 815
Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn
820 825 830
Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val
835 840 845
Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys
850 855 860
Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys
865 870 875 880
Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys
885 890 895
Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu
900 905 910
Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu
915 920 925
Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile
930 935 940
Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu
945 950 955 960
Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile
965 970 975
Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp
980 985 990
Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn
995 1000 1005
Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu
1010 1015 1020
Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu
1025 1030 1035
Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
1040 1045 1050
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
1055 1060 1065
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly
1070 1075 1080
Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu
1085 1090 1095
Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly
1100 1105 1110
Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
1115 1120 1125
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu
1130 1135 1140
Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
1145 1150 1155
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
1160 1165 1170
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly
1175 1180 1185
Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln
1190 1195 1200
Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met
1205 1210 1215
Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp
1220 1225 1230
Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile
1235 1240 1245
Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser
1250 1255 1260
Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr
1265 1270 1275
Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
1280 1285 1290
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
1295 1300 1305
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile
1310 1315 1320
Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys
1325 1330 1335
Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr
1340 1345 1350
Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe
1355 1360 1365
Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala
1370 1375 1380
Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro
1385 1390 1395
Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp
1400 1405 1410
Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala
1415 1420 1425
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1430 1435 1440
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1445 1450 1455
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1460 1465 1470
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1475 1480 1485
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1490 1495 1500
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1505 1510 1515
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1520 1525 1530
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1535 1540 1545
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1550 1555 1560
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1565 1570 1575
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1580 1585 1590
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1595 1600 1605
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1610 1615 1620
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1625 1630 1635
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1640 1645 1650
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1655 1660 1665
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1670 1675 1680
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1685 1690 1695
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1700 1705 1710
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1715 1720 1725
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1730 1735 1740
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1745 1750 1755
Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg
1760 1765 1770
Lys Val
1775
<210> 83
<211> 1588
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 83
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala
35 40 45
Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Ser Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Trp Arg Asn Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Cys Tyr Phe Phe Arg Met Pro Arg Arg Val Phe Asn Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
195 200 205
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
210 215 220
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
225 230 235 240
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
245 250 255
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
260 265 270
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
275 280 285
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
290 295 300
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
305 310 315 320
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
325 330 335
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
340 345 350
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
355 360 365
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
370 375 380
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
385 390 395 400
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
405 410 415
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
420 425 430
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
435 440 445
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
450 455 460
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
465 470 475 480
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
485 490 495
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
500 505 510
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
515 520 525
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
530 535 540
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
545 550 555 560
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
565 570 575
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
580 585 590
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
595 600 605
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
610 615 620
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
625 630 635 640
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
645 650 655
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
660 665 670
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
675 680 685
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
690 695 700
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
705 710 715 720
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
725 730 735
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
740 745 750
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
755 760 765
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
770 775 780
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
785 790 795 800
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
805 810 815
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
820 825 830
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
835 840 845
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
850 855 860
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
865 870 875 880
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
885 890 895
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
900 905 910
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
915 920 925
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
930 935 940
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
945 950 955 960
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
965 970 975
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
980 985 990
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
995 1000 1005
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1010 1015 1020
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1025 1030 1035
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1040 1045 1050
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1055 1060 1065
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1070 1075 1080
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1085 1090 1095
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1100 1105 1110
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1115 1120 1125
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1130 1135 1140
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1145 1150 1155
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1160 1165 1170
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1175 1180 1185
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1190 1195 1200
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1205 1210 1215
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1220 1225 1230
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1235 1240 1245
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1250 1255 1260
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1265 1270 1275
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1280 1285 1290
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1295 1300 1305
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1310 1315 1320
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1325 1330 1335
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1340 1345 1350
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1355 1360 1365
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1370 1375 1380
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1385 1390 1395
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1400 1405 1410
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1415 1420 1425
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1430 1435 1440
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1445 1450 1455
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1460 1465 1470
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1475 1480 1485
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1490 1495 1500
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1505 1510 1515
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1520 1525 1530
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1535 1540 1545
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1550 1555 1560
Gly Gly Asp Glu Gly Ala Asp Lys Arg Thr Ala Asp Gly Ser Glu
1565 1570 1575
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1580 1585
<210> 84
<211> 1495
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 84
Met Asn Ile Pro Ala Leu Val Glu Asn Gln Lys Lys Tyr Phe Gly Thr
1 5 10 15
Tyr Ser Val Met Ala Met Leu Asn Ala Gln Thr Val Leu Asp His Ile
20 25 30
Gln Lys Val Ala Asp Ile Glu Gly Glu Gln Asn Glu Asn Asn Glu Asn
35 40 45
Leu Trp Phe His Pro Val Met Ser His Leu Tyr Asn Ala Lys Asn Gly
50 55 60
Tyr Asp Lys Gln Pro Glu Lys Thr Met Phe Ile Ile Glu Arg Leu Gln
65 70 75 80
Ser Tyr Phe Pro Phe Leu Lys Ile Met Ala Glu Asn Gln Arg Glu Tyr
85 90 95
Ser Asn Gly Lys Tyr Lys Gln Asn Arg Val Glu Val Asn Ser Asn Asp
100 105 110
Ile Phe Glu Val Leu Lys Arg Ala Phe Gly Val Leu Lys Met Tyr Arg
115 120 125
Asp Leu Thr Asn Ala Tyr Lys Thr Tyr Glu Glu Lys Leu Asn Asp Gly
130 135 140
Cys Glu Phe Leu Thr Ser Thr Glu Gln Pro Leu Ser Gly Met Ile Asn
145 150 155 160
Asn Tyr Tyr Thr Val Ala Leu Arg Asn Met Asn Glu Arg Tyr Gly Tyr
165 170 175
Lys Thr Glu Asp Leu Ala Phe Ile Gln Asp Lys Arg Phe Lys Phe Val
180 185 190
Lys Asp Ala Tyr Gly Lys Lys Lys Ser Gln Val Asn Thr Gly Phe Phe
195 200 205
Leu Ser Leu Gln Asp Tyr Asn Gly Asp Thr Gln Lys Lys Leu His Leu
210 215 220
Ser Gly Val Gly Ile Ala Leu Leu Ile Cys Leu Phe Leu Asp Lys Gln
225 230 235 240
Tyr Ile Asn Ile Phe Leu Ser Arg Leu Pro Ile Phe Ser Ser Tyr Asn
245 250 255
Ala Gln Ser Glu Glu Arg Arg Ile Ile Ile Arg Ser Phe Gly Ile Asn
260 265 270
Ser Ile Lys Leu Pro Lys Asp Arg Ile His Ser Glu Lys Ser Asn Lys
275 280 285
Ser Val Ala Met Asp Met Leu Asn Glu Val Lys Arg Cys Pro Asp Glu
290 295 300
Leu Phe Thr Thr Leu Ser Ala Glu Lys Gln Ser Arg Phe Arg Ile Ile
305 310 315 320
Ser Asp Asp His Asn Glu Val Leu Met Lys Arg Ser Ser Asp Arg Phe
325 330 335
Val Pro Leu Leu Leu Gln Tyr Ile Asp Tyr Gly Lys Leu Phe Asp His
340 345 350
Ile Arg Phe His Val Asn Met Gly Lys Leu Arg Tyr Leu Leu Lys Ala
355 360 365
Asp Lys Thr Cys Ile Asp Gly Gln Thr Arg Val Arg Val Ile Glu Gln
370 375 380
Pro Leu Asn Gly Phe Gly Arg Leu Glu Glu Ala Glu Thr Met Arg Lys
385 390 395 400
Gln Glu Asn Gly Thr Phe Gly Asn Ser Gly Ile Arg Ile Arg Asp Phe
405 410 415
Glu Asn Met Lys Arg Asp Asp Ala Asn Pro Ala Asn Tyr Pro Tyr Ile
420 425 430
Val Asp Thr Tyr Thr His Tyr Ile Leu Glu Asn Asn Lys Val Glu Met
435 440 445
Phe Ile Asn Asp Lys Glu Asp Ser Ala Pro Leu Leu Pro Val Ile Glu
450 455 460
Asp Asp Arg Tyr Val Val Lys Thr Ile Pro Ser Cys Arg Met Ser Thr
465 470 475 480
Leu Glu Ile Pro Ala Met Ala Phe His Met Phe Leu Phe Gly Ser Lys
485 490 495
Lys Thr Glu Lys Leu Ile Val Asp Val His Asn Arg Tyr Lys Arg Leu
500 505 510
Phe Gln Ala Met Gln Lys Glu Glu Val Thr Ala Glu Asn Ile Ala Ser
515 520 525
Phe Gly Ile Ala Glu Ser Asp Leu Pro Gln Lys Ile Leu Asp Leu Ile
530 535 540
Ser Gly Asn Ala His Gly Lys Asp Val Asp Ala Phe Ile Arg Leu Thr
545 550 555 560
Val Asp Asp Met Leu Thr Asp Thr Glu Arg Arg Ile Lys Arg Phe Lys
565 570 575
Asp Asp Arg Lys Ser Ile Arg Ser Ala Asp Asn Lys Met Gly Lys Arg
580 585 590
Gly Phe Lys Gln Ile Ser Thr Gly Lys Leu Ala Asp Phe Leu Ala Lys
595 600 605
Asp Ile Val Leu Phe Gln Pro Ser Val Asn Asp Gly Glu Asn Lys Ile
610 615 620
Thr Gly Leu Asn Tyr Arg Ile Met Gln Ser Ala Ile Ala Val Tyr Asp
625 630 635 640
Ser Gly Asp Asp Tyr Glu Ala Lys Gln Gln Phe Lys Leu Met Phe Glu
645 650 655
Lys Ala Arg Leu Ile Gly Lys Gly Thr Thr Glu Pro His Pro Phe Leu
660 665 670
Tyr Lys Val Phe Ala Arg Ser Ile Pro Ala Asn Ala Val Glu Phe Tyr
675 680 685
Glu Arg Tyr Leu Ile Glu Arg Lys Phe Tyr Leu Thr Gly Leu Ser Asn
690 695 700
Glu Ile Lys Lys Gly Asn Arg Val Asp Val Pro Phe Ile Arg Arg Asp
705 710 715 720
Gln Asn Lys Trp Lys Thr Pro Ala Met Lys Thr Leu Gly Arg Ile Tyr
725 730 735
Ser Glu Asp Leu Pro Val Glu Leu Pro Arg Gln Met Phe Asp Asn Glu
740 745 750
Ile Lys Ser His Leu Lys Ser Leu Pro Gln Met Glu Gly Ile Asp Phe
755 760 765
Asn Asn Ala Asn Val Thr Tyr Leu Ile Ala Glu Tyr Met Lys Arg Val
770 775 780
Leu Asp Asp Asp Phe Gln Thr Phe Tyr Gln Trp Asn Arg Asn Tyr Arg
785 790 795 800
Tyr Met Asp Met Leu Lys Gly Glu Tyr Asp Arg Lys Gly Ser Leu Gln
805 810 815
His Cys Phe Thr Ser Val Glu Glu Arg Glu Gly Leu Trp Lys Glu Arg
820 825 830
Ala Ser Arg Thr Glu Arg Tyr Arg Lys Gln Ala Ser Asn Lys Ile Arg
835 840 845
Ser Asn Arg Gln Met Arg Asn Ala Ser Ser Glu Glu Ile Glu Thr Ile
850 855 860
Leu Asp Lys Arg Leu Ser Asn Ser Arg Asn Glu Tyr Gln Lys Ser Glu
865 870 875 880
Lys Val Ile Arg Arg Tyr Arg Val Gln Asp Ala Leu Leu Phe Leu Leu
885 890 895
Ala Lys Lys Thr Leu Thr Glu Leu Ala Asp Phe Asp Gly Glu Arg Phe
900 905 910
Lys Leu Lys Glu Ile Met Pro Asp Ala Glu Lys Gly Ile Leu Ser Glu
915 920 925
Ile Met Pro Met Ser Phe Thr Phe Glu Lys Gly Gly Lys Lys Tyr Thr
930 935 940
Ile Thr Ser Glu Gly Met Lys Leu Lys Asn Tyr Gly Asp Phe Phe Val
945 950 955 960
Leu Ala Ser Asp Lys Arg Ile Gly Asn Leu Leu Glu Leu Val Gly Ser
965 970 975
Asp Ile Val Ser Lys Glu Asp Ile Met Glu Glu Phe Asn Lys Tyr Asp
980 985 990
Gln Cys Arg Pro Glu Ile Ser Ser Ile Val Phe Asn Leu Glu Lys Trp
995 1000 1005
Ala Phe Asp Thr Tyr Pro Glu Leu Ser Ala Arg Val Asp Arg Glu
1010 1015 1020
Glu Lys Val Asp Phe Lys Ser Ile Leu Lys Ile Leu Leu Asn Asn
1025 1030 1035
Lys Asn Ile Asn Lys Glu Gln Ser Asp Ile Leu Arg Lys Ile Arg
1040 1045 1050
Asn Ala Phe Asp Ala Asn Asn Tyr Pro Asp Lys Gly Val Val Glu
1055 1060 1065
Ile Lys Ala Leu Pro Glu Ile Ala Met Ser Ile Lys Lys Ala Phe
1070 1075 1080
Gly Glu Tyr Ala Ile Met Lys Gly Ser Leu Gln Leu Pro Pro Leu
1085 1090 1095
Glu Arg Leu Thr Leu Gly Ser Gly Gly Gly Gly Ser Gln Leu His
1100 1105 1110
Leu Pro Gln Val Leu Ala Asp Ala Val Ser Arg Leu Val Leu Gly
1115 1120 1125
Lys Phe Gly Asp Leu Thr Asp Asn Phe Ser Ser Pro His Ala Arg
1130 1135 1140
Arg Lys Val Leu Ala Gly Val Val Met Thr Thr Gly Thr Asp Val
1145 1150 1155
Lys Asp Ala Lys Val Ile Ser Val Ser Thr Gly Thr Lys Cys Ile
1160 1165 1170
Asn Gly Glu Tyr Met Ser Asp Arg Gly Leu Ala Leu Asn Asp Cys
1175 1180 1185
His Ala Glu Ile Ile Ser Arg Arg Ser Leu Leu Arg Phe Leu Tyr
1190 1195 1200
Thr Gln Leu Glu Leu Tyr Leu Asn Asn Lys Asp Asp Gln Lys Arg
1205 1210 1215
Ser Ile Phe Gln Lys Ser Glu Arg Gly Gly Phe Arg Leu Lys Glu
1220 1225 1230
Asn Val Gln Phe His Leu Tyr Ile Ser Thr Ser Pro Cys Gly Asp
1235 1240 1245
Ala Arg Ile Phe Ser Pro His Glu Pro Ile Leu Glu Glu Pro Ala
1250 1255 1260
Asp Arg His Pro Asn Arg Lys Ala Arg Gly Gln Leu Arg Thr Lys
1265 1270 1275
Ile Glu Ser Gly Gln Gly Thr Ile Pro Val Arg Ser Asn Ala Ser
1280 1285 1290
Ile Gln Thr Trp Asp Gly Val Leu Gln Gly Glu Arg Leu Leu Thr
1295 1300 1305
Met Ser Cys Ser Asp Lys Ile Ala Arg Trp Asn Val Val Gly Ile
1310 1315 1320
Gln Gly Ser Leu Leu Ser Ile Phe Val Glu Pro Ile Tyr Phe Ser
1325 1330 1335
Ser Ile Ile Leu Gly Ser Leu Tyr His Gly Asp His Leu Ser Arg
1340 1345 1350
Ala Met Tyr Gln Arg Ile Ser Asn Ile Glu Asp Leu Pro Pro Leu
1355 1360 1365
Tyr Thr Leu Asn Lys Pro Leu Leu Ser Gly Ile Ser Asn Ala Glu
1370 1375 1380
Ala Arg Gln Pro Gly Lys Ala Pro Asn Phe Ser Val Asn Trp Thr
1385 1390 1395
Val Gly Asp Ser Ala Ile Glu Val Ile Asn Ala Thr Thr Gly Lys
1400 1405 1410
Asp Glu Leu Gly Arg Ala Ser Arg Leu Cys Lys His Ala Leu Tyr
1415 1420 1425
Cys Arg Trp Met Arg Val His Gly Lys Val Pro Ser His Leu Leu
1430 1435 1440
Arg Ser Lys Ile Thr Lys Pro Asn Val Tyr His Glu Ser Lys Leu
1445 1450 1455
Ala Ala Lys Glu Tyr Gln Ala Ala Lys Ala Arg Leu Phe Thr Ala
1460 1465 1470
Phe Ile Lys Ala Gly Leu Gly Ala Trp Val Glu Lys Pro Thr Glu
1475 1480 1485
Gln Asp Gln Phe Ser Leu Thr
1490 1495
<210> 85
<211> 1495
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 85
Met Asn Ile Pro Ala Leu Val Glu Asn Gln Lys Lys Tyr Phe Gly Thr
1 5 10 15
Tyr Ser Val Met Ala Met Leu Asn Ala Gln Thr Val Leu Asp His Ile
20 25 30
Gln Lys Val Ala Asp Ile Glu Gly Glu Gln Asn Glu Asn Asn Glu Asn
35 40 45
Leu Trp Phe His Pro Val Met Ser His Leu Tyr Asn Ala Lys Asn Gly
50 55 60
Tyr Asp Lys Gln Pro Glu Lys Thr Met Phe Ile Ile Glu Arg Leu Gln
65 70 75 80
Ser Tyr Phe Pro Phe Leu Lys Ile Met Ala Glu Asn Gln Arg Glu Tyr
85 90 95
Ser Asn Gly Lys Tyr Lys Gln Asn Arg Val Glu Val Asn Ser Asn Asp
100 105 110
Ile Phe Glu Val Leu Lys Arg Ala Phe Gly Val Leu Lys Met Tyr Arg
115 120 125
Asp Leu Thr Asn Ala Tyr Lys Thr Tyr Glu Glu Lys Leu Asn Asp Gly
130 135 140
Cys Glu Phe Leu Thr Ser Thr Glu Gln Pro Leu Ser Gly Met Ile Asn
145 150 155 160
Asn Tyr Tyr Thr Val Ala Leu Arg Asn Met Asn Glu Arg Tyr Gly Tyr
165 170 175
Lys Thr Glu Asp Leu Ala Phe Ile Gln Asp Lys Arg Phe Lys Phe Val
180 185 190
Lys Asp Ala Tyr Gly Lys Lys Lys Ser Gln Val Asn Thr Gly Phe Phe
195 200 205
Leu Ser Leu Gln Asp Tyr Asn Gly Asp Thr Gln Lys Lys Leu His Leu
210 215 220
Ser Gly Val Gly Ile Ala Leu Leu Ile Cys Leu Phe Leu Asp Lys Gln
225 230 235 240
Tyr Ile Asn Ile Phe Leu Ser Arg Leu Pro Ile Phe Ser Ser Tyr Asn
245 250 255
Ala Gln Ser Glu Glu Arg Arg Ile Ile Ile Arg Ser Phe Gly Ile Asn
260 265 270
Ser Ile Lys Leu Pro Lys Asp Arg Ile His Ser Glu Lys Ser Asn Lys
275 280 285
Ser Val Ala Met Asp Met Leu Asn Glu Val Lys Arg Cys Pro Asp Glu
290 295 300
Leu Phe Thr Thr Leu Ser Ala Glu Lys Gln Ser Arg Phe Arg Ile Ile
305 310 315 320
Ser Asp Asp His Asn Glu Val Leu Met Lys Arg Ser Ser Asp Arg Phe
325 330 335
Val Pro Leu Leu Leu Gln Tyr Ile Asp Tyr Gly Lys Leu Phe Asp His
340 345 350
Ile Arg Phe His Val Asn Met Gly Lys Leu Arg Tyr Leu Leu Lys Ala
355 360 365
Asp Lys Thr Cys Ile Asp Gly Gln Thr Arg Val Arg Val Ile Glu Gln
370 375 380
Pro Leu Asn Gly Phe Gly Arg Leu Glu Glu Ala Glu Thr Met Arg Lys
385 390 395 400
Gln Glu Asn Gly Thr Phe Gly Asn Ser Gly Ile Arg Ile Arg Asp Phe
405 410 415
Glu Asn Met Lys Arg Asp Asp Ala Asn Pro Ala Asn Tyr Pro Tyr Ile
420 425 430
Val Asp Thr Tyr Thr His Tyr Ile Leu Glu Asn Asn Lys Val Glu Met
435 440 445
Phe Ile Asn Asp Lys Glu Asp Ser Ala Pro Leu Leu Pro Val Ile Glu
450 455 460
Asp Asp Arg Tyr Val Val Lys Thr Ile Pro Ser Cys Arg Met Ser Thr
465 470 475 480
Leu Glu Ile Pro Ala Met Ala Phe His Met Phe Leu Phe Gly Ser Lys
485 490 495
Lys Thr Glu Lys Leu Ile Val Asp Val His Asn Arg Tyr Lys Arg Leu
500 505 510
Phe Gln Ala Met Gln Lys Glu Glu Val Thr Ala Glu Asn Ile Ala Ser
515 520 525
Phe Gly Ile Ala Glu Ser Asp Leu Pro Gln Lys Ile Leu Asp Leu Ile
530 535 540
Ser Gly Asn Ala His Gly Lys Asp Val Asp Ala Phe Ile Arg Leu Thr
545 550 555 560
Val Asp Asp Met Leu Thr Asp Thr Glu Arg Arg Ile Lys Arg Phe Lys
565 570 575
Asp Asp Arg Lys Ser Ile Arg Ser Ala Asp Asn Lys Met Gly Lys Arg
580 585 590
Gly Phe Lys Gln Ile Ser Thr Gly Lys Leu Ala Asp Phe Leu Ala Lys
595 600 605
Asp Ile Val Leu Phe Gln Pro Ser Val Asn Asp Gly Glu Asn Lys Ile
610 615 620
Thr Gly Leu Asn Tyr Arg Ile Met Gln Ser Ala Ile Ala Val Tyr Asp
625 630 635 640
Ser Gly Asp Asp Tyr Glu Ala Lys Gln Gln Phe Lys Leu Met Phe Glu
645 650 655
Lys Ala Arg Leu Ile Gly Lys Gly Thr Thr Glu Pro His Pro Phe Leu
660 665 670
Tyr Lys Val Phe Ala Arg Ser Ile Pro Ala Asn Ala Val Glu Phe Tyr
675 680 685
Glu Arg Tyr Leu Ile Glu Arg Lys Phe Tyr Leu Thr Gly Leu Ser Asn
690 695 700
Glu Ile Lys Lys Gly Asn Arg Val Asp Val Pro Phe Ile Arg Arg Asp
705 710 715 720
Gln Asn Lys Trp Lys Thr Pro Ala Met Lys Thr Leu Gly Arg Ile Tyr
725 730 735
Ser Glu Asp Leu Pro Val Glu Leu Pro Arg Gln Met Phe Asp Asn Glu
740 745 750
Ile Lys Ser His Leu Lys Ser Leu Pro Gln Met Glu Gly Ile Asp Phe
755 760 765
Asn Asn Ala Asn Val Thr Tyr Leu Ile Ala Glu Tyr Met Lys Arg Val
770 775 780
Leu Asp Asp Asp Phe Gln Thr Phe Tyr Gln Trp Asn Arg Asn Tyr Arg
785 790 795 800
Tyr Met Asp Met Leu Lys Gly Glu Tyr Asp Arg Lys Gly Ser Leu Gln
805 810 815
His Cys Phe Thr Ser Val Glu Glu Arg Glu Gly Leu Trp Lys Glu Arg
820 825 830
Ala Ser Arg Thr Glu Arg Tyr Arg Lys Gln Ala Ser Asn Lys Ile Arg
835 840 845
Ser Asn Arg Gln Met Arg Asn Ala Ser Ser Glu Glu Ile Glu Thr Ile
850 855 860
Leu Asp Lys Arg Leu Ser Asn Ser Arg Asn Glu Tyr Gln Lys Ser Glu
865 870 875 880
Lys Val Ile Arg Arg Tyr Arg Val Gln Asp Ala Leu Leu Phe Leu Leu
885 890 895
Ala Lys Lys Thr Leu Thr Glu Leu Ala Asp Phe Asp Gly Glu Arg Phe
900 905 910
Lys Leu Lys Glu Ile Met Pro Asp Ala Glu Lys Gly Ile Leu Ser Glu
915 920 925
Ile Met Pro Met Ser Phe Thr Phe Glu Lys Gly Gly Lys Lys Tyr Thr
930 935 940
Ile Thr Ser Glu Gly Met Lys Leu Lys Asn Tyr Gly Asp Phe Phe Val
945 950 955 960
Leu Ala Ser Asp Lys Arg Ile Gly Asn Leu Leu Glu Leu Val Gly Ser
965 970 975
Asp Ile Val Ser Lys Glu Asp Ile Met Glu Glu Phe Asn Lys Tyr Asp
980 985 990
Gln Cys Arg Pro Glu Ile Ser Ser Ile Val Phe Asn Leu Glu Lys Trp
995 1000 1005
Ala Phe Asp Thr Tyr Pro Glu Leu Ser Ala Arg Val Asp Arg Glu
1010 1015 1020
Glu Lys Val Asp Phe Lys Ser Ile Leu Lys Ile Leu Leu Asn Asn
1025 1030 1035
Lys Asn Ile Asn Lys Glu Gln Ser Asp Ile Leu Arg Lys Ile Arg
1040 1045 1050
Asn Ala Phe Asp Ala Asn Asn Tyr Pro Asp Lys Gly Val Val Glu
1055 1060 1065
Ile Lys Ala Leu Pro Glu Ile Ala Met Ser Ile Lys Lys Ala Phe
1070 1075 1080
Gly Glu Tyr Ala Ile Met Lys Gly Ser Leu Gln Leu Pro Pro Leu
1085 1090 1095
Glu Arg Leu Thr Leu Gly Ser Gly Gly Gly Gly Ser Gln Leu His
1100 1105 1110
Leu Pro Gln Val Leu Ala Asp Ala Val Ser Arg Leu Val Leu Gly
1115 1120 1125
Lys Phe Gly Asp Leu Thr Asp Asn Phe Ser Ser Pro His Ala Arg
1130 1135 1140
Arg Lys Val Leu Ala Gly Val Val Met Thr Thr Gly Thr Asp Val
1145 1150 1155
Lys Asp Ala Lys Val Ile Ser Val Ser Thr Gly Gly Lys Cys Ile
1160 1165 1170
Asn Gly Glu Tyr Met Ser Asp Arg Gly Leu Ala Leu Asn Asp Cys
1175 1180 1185
His Ala Glu Ile Ile Ser Arg Arg Ser Leu Leu Arg Phe Leu Tyr
1190 1195 1200
Thr Gln Leu Glu Leu Tyr Leu Asn Asn Lys Asp Asp Gln Lys Arg
1205 1210 1215
Ser Ile Phe Gln Lys Ser Glu Arg Gly Gly Phe Arg Leu Lys Glu
1220 1225 1230
Asn Val Gln Phe His Leu Tyr Ile Ser Thr Ser Pro Cys Gly Asp
1235 1240 1245
Ala Arg Ile Phe Ser Pro His Glu Pro Ile Leu Glu Glu Pro Ala
1250 1255 1260
Asp Arg His Pro Asn Arg Lys Ala Arg Gly Gln Leu Arg Thr Lys
1265 1270 1275
Ile Glu Ser Gly Gln Gly Thr Ile Pro Val Arg Ser Asn Ala Ser
1280 1285 1290
Ile Gln Thr Trp Asp Gly Val Leu Gln Gly Glu Arg Leu Leu Thr
1295 1300 1305
Met Ser Cys Ser Asp Lys Ile Ala Arg Trp Asn Val Val Gly Ile
1310 1315 1320
Gln Gly Ser Leu Leu Ser Ile Phe Val Glu Pro Ile Tyr Phe Ser
1325 1330 1335
Ser Ile Ile Leu Gly Ser Leu Tyr His Gly Asp His Leu Ser Arg
1340 1345 1350
Ala Met Tyr Gln Arg Ile Ser Asn Ile Glu Asp Leu Pro Pro Leu
1355 1360 1365
Tyr Thr Leu Asn Lys Pro Leu Leu Ser Gly Ile Ser Asn Ala Glu
1370 1375 1380
Ala Arg Gln Pro Gly Lys Ala Pro Asn Phe Ser Val Asn Trp Thr
1385 1390 1395
Val Gly Asp Ser Ala Ile Glu Val Ile Asn Ala Thr Thr Gly Lys
1400 1405 1410
Asp Glu Leu Gly Arg Ala Ser Arg Leu Cys Lys His Ala Leu Tyr
1415 1420 1425
Cys Arg Trp Met Arg Val His Gly Lys Val Pro Ser His Leu Leu
1430 1435 1440
Arg Ser Lys Ile Thr Lys Pro Asn Val Tyr His Glu Ser Lys Leu
1445 1450 1455
Ala Ala Lys Glu Tyr Gln Ala Ala Lys Ala Arg Leu Phe Thr Ala
1460 1465 1470
Phe Ile Lys Ala Gly Leu Gly Ala Trp Val Glu Lys Pro Thr Glu
1475 1480 1485
Gln Asp Gln Phe Ser Leu Thr
1490 1495
<210> 86
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 86
attggatcca at 12
<210> 87
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 87
tatttacaaa caaccatgaa tgtaagta 28
<210> 88
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 88
cggagtactg tcctccga 18
<210> 89
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 89
atgatacgaa acgtaccgta tcgttaaggt 30
<210> 90
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 90
agaaacaaac caacctgtct gtatta 26
<210> 91
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 91
aacaaacaga caatctggtc tgtttgta 28
<210> 92
<211> 248
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 92
Met Ser Arg Leu Asp Lys Ser Lys Val Ile Asn Ser Ala Leu Glu Leu
1 5 10 15
Leu Asn Glu Val Gly Ile Glu Gly Leu Thr Thr Arg Lys Leu Ala Gln
20 25 30
Lys Leu Gly Val Glu Gln Pro Thr Leu Tyr Trp His Val Lys Asn Lys
35 40 45
Arg Ala Leu Leu Asp Ala Leu Ala Ile Glu Met Leu Asp Arg His His
50 55 60
Thr His Phe Cys Pro Leu Glu Gly Glu Ser Trp Gln Asp Phe Leu Arg
65 70 75 80
Asn Asn Ala Lys Ser Phe Arg Cys Ala Leu Leu Ser His Arg Asp Gly
85 90 95
Ala Lys Val His Leu Gly Thr Arg Pro Thr Glu Lys Gln Tyr Glu Thr
100 105 110
Leu Glu Asn Gln Leu Ala Phe Leu Cys Gln Gln Gly Phe Ser Leu Glu
115 120 125
Asn Ala Leu Tyr Ala Leu Ser Ala Val Gly His Phe Thr Leu Gly Cys
130 135 140
Val Leu Glu Asp Gln Glu His Gln Val Ala Lys Glu Glu Arg Glu Thr
145 150 155 160
Pro Thr Thr Asp Ser Met Pro Pro Leu Leu Arg Gln Ala Ile Glu Leu
165 170 175
Phe Asp His Gln Gly Ala Glu Pro Ala Phe Leu Phe Gly Leu Glu Leu
180 185 190
Ile Ile Cys Gly Leu Glu Lys Gln Leu Lys Cys Glu Ser Gly Gly Pro
195 200 205
Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala
210 215 220
Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp
225 230 235 240
Phe Asp Leu Asp Met Leu Pro Gly
245
<210> 93
<211> 298
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 93
Met Asp Met Pro Arg Ile Lys Pro Gly Gln Arg Val Met Met Ala Leu
1 5 10 15
Arg Lys Met Ile Ala Ser Gly Glu Ile Lys Ser Gly Glu Arg Ile Ala
20 25 30
Glu Ile Pro Thr Ala Ala Ala Leu Gly Val Ser Arg Met Pro Val Arg
35 40 45
Ile Ala Leu Arg Ser Leu Glu Gln Glu Gly Leu Val Val Arg Leu Gly
50 55 60
Ala Arg Gly Tyr Ala Ala Arg Gly Val Ser Ser Asp Gln Ile Arg Asp
65 70 75 80
Ala Ile Glu Val Arg Gly Val Leu Glu Gly Phe Ala Ala Arg Arg Leu
85 90 95
Ala Glu Arg Gly Met Thr Ala Glu Thr His Ala Arg Phe Val Val Leu
100 105 110
Ile Ala Glu Gly Glu Ala Leu Phe Ala Ala Gly Arg Leu Asn Gly Glu
115 120 125
Asp Leu Asp Arg Tyr Ala Ala Tyr Asn Gln Ala Phe His Asp Thr Leu
130 135 140
Val Ser Ala Ala Gly Asn Gly Ala Val Glu Ser Ala Leu Ala Arg Asn
145 150 155 160
Gly Phe Glu Pro Phe Ala Ala Ala Gly Ala Leu Ala Leu Asp Leu Met
165 170 175
Asp Leu Ser Ala Glu Tyr Glu His Leu Leu Ala Ala His Arg Gln His
180 185 190
Gln Ala Val Leu Asp Ala Val Ser Cys Gly Asp Ala Glu Gly Ala Glu
195 200 205
Arg Ile Met Arg Asp His Ala Leu Ala Ala Ile Arg Asn Ala Lys Val
210 215 220
Phe Glu Ala Ala Ala Ser Ala Gly Ala Pro Leu Gly Ala Ala Trp Ser
225 230 235 240
Ile Arg Ala Asp Ser Gly Gly Gly Gly Pro Thr Asp Ala Leu Asp Asp
245 250 255
Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu
260 265 270
Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
275 280 285
Pro Gly Pro Pro Lys Lys Lys Arg Lys Val
290 295
<210> 94
<211> 264
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 94
Met Val Arg Arg Thr Lys Glu Glu Ala Gln Glu Thr Arg Ala Gln Ile
1 5 10 15
Ile Glu Ala Ala Glu Arg Ala Phe Tyr Lys Arg Gly Val Ala Arg Thr
20 25 30
Thr Leu Ala Asp Ile Ala Glu Leu Ala Gly Val Thr Arg Gly Ala Ile
35 40 45
Tyr Trp His Phe Asn Asn Lys Ala Glu Leu Val Gln Ala Leu Leu Asp
50 55 60
Ser Leu His Glu Thr His Asp His Leu Ala Arg Ala Ser Glu Ser Glu
65 70 75 80
Asp Glu Val Asp Pro Leu Gly Cys Met Arg Lys Leu Leu Leu Gln Val
85 90 95
Phe Asn Glu Leu Val Leu Asp Ala Arg Thr Arg Arg Ile Asn Glu Ile
100 105 110
Leu His His Lys Cys Glu Phe Thr Asp Asp Met Cys Glu Ile Arg Gln
115 120 125
Gln His Gln Ser Ala Val Leu Asp Cys His Lys Gly Ile Thr Leu Thr
130 135 140
Leu Ala Asn Val Val Arg Arg Gly Gln Leu Pro Gly Glu Leu Asp Ala
145 150 155 160
Glu Arg Ala Ala Val Ala Met Phe Ala Tyr Val Asp Gly Leu Ile Arg
165 170 175
Arg Trp Leu Leu Leu Pro Asp Ser Val Asp Leu Leu Gly Asp Val Glu
180 185 190
Lys Trp Val Asp Thr Gly Leu Asp Met Leu Arg Leu Ser Pro Ala Leu
195 200 205
Arg Lys Ser Gly Gly Gly Gly Pro Thr Asp Ala Leu Asp Asp Phe Asp
210 215 220
Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met
225 230 235 240
Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Gly
245 250 255
Pro Pro Lys Lys Lys Arg Lys Val
260
<210> 95
<211> 254
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 95
Met Ala Arg Thr Pro Ser Arg Ser Ser Ile Gly Ser Leu Arg Ser Pro
1 5 10 15
His Thr His Lys Ala Ile Leu Thr Ser Thr Ile Glu Ile Leu Lys Glu
20 25 30
Cys Gly Tyr Ser Gly Leu Ser Ile Glu Ser Val Ala Arg Arg Ala Gly
35 40 45
Ala Gly Lys Pro Thr Ile Tyr Arg Trp Trp Thr Asn Lys Ala Ala Leu
50 55 60
Ile Ala Glu Val Tyr Glu Asn Glu Ile Glu Gln Val Arg Lys Phe Pro
65 70 75 80
Asp Leu Gly Ser Phe Lys Ala Asp Leu Asp Phe Leu Leu His Asn Leu
85 90 95
Trp Lys Val Trp Arg Glu Thr Ile Cys Gly Glu Ala Phe Arg Cys Val
100 105 110
Ile Ala Glu Ala Gln Leu Asp Pro Val Thr Leu Thr Gln Leu Lys Asp
115 120 125
Gln Phe Met Glu Arg Arg Arg Glu Ile Pro Lys Lys Leu Val Glu Asp
130 135 140
Ala Ile Ser Asn Gly Glu Leu Pro Lys Asp Ile Asn Arg Glu Leu Leu
145 150 155 160
Leu Asp Met Ile Phe Gly Phe Cys Trp Tyr Arg Leu Leu Thr Glu Gln
165 170 175
Leu Thr Val Glu Gln Asp Ile Glu Glu Phe Thr Phe Leu Leu Ile Asn
180 185 190
Gly Val Cys Pro Gly Thr Gln Cys Ser Gly Gly Gly Gly Pro Thr Asp
195 200 205
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp
210 215 220
Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp
225 230 235 240
Leu Asp Met Leu Pro Gly Pro Pro Lys Lys Lys Arg Lys Val
245 250
<210> 96
<211> 257
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 96
Met Ser Pro Lys Arg Arg Thr Gln Ala Glu Arg Ala Met Glu Thr Gln
1 5 10 15
Gly Lys Leu Ile Ala Ala Ala Leu Gly Val Leu Arg Glu Lys Gly Tyr
20 25 30
Ala Gly Phe Arg Ile Ala Asp Val Pro Gly Ala Ala Gly Val Ser Arg
35 40 45
Gly Ala Gln Ser His His Phe Pro Thr Lys Leu Glu Leu Leu Leu Ala
50 55 60
Thr Phe Glu Trp Leu Tyr Glu Gln Ile Thr Glu Arg Ser Arg Ala Arg
65 70 75 80
Leu Ala Lys Leu Lys Pro Glu Asp Asp Val Ile Gln Gln Met Leu Asp
85 90 95
Asp Ala Ala Glu Phe Phe Leu Asp Asp Asp Phe Ser Ile Gly Leu Asp
100 105 110
Leu Ile Val Ala Ala Asp Arg Asp Pro Ala Leu Arg Glu Gly Ile Gln
115 120 125
Arg Thr Val Glu Arg Asn Arg Phe Val Val Glu Asp Met Trp Leu Gly
130 135 140
Val Leu Val Ser Arg Gly Leu Ser Arg Asp Asp Ala Glu Asp Ile Leu
145 150 155 160
Trp Leu Ile Phe Asn Ser Val Arg Gly Leu Val Val Arg Ser Leu Trp
165 170 175
Gln Lys Asp Lys Glu Arg Phe Glu Arg Val Arg Asn Ser Thr Leu Glu
180 185 190
Ile Ala Arg Glu Arg Tyr Ala Lys Phe Lys Arg Ser Gly Gly Gly Gly
195 200 205
Pro Thr Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp
210 215 220
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp
225 230 235 240
Asp Phe Asp Leu Asp Met Leu Pro Gly Pro Pro Lys Lys Lys Arg Lys
245 250 255
Val
<210> 97
<211> 641
<212> PRT
<213> 未知的
<220>
<223> 腺相关病毒
<400> 97
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln Met Ile Ile
610 615 620
Arg Tyr Gly Cys Arg Trp Leu Ser Ser Arg Leu Ala Arg Gly His Ser
625 630 635 640
Leu
<210> 98
<211> 804
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 98
Met Glu Ser Val Glu Lys Glu Asp Ser Leu Thr Ala Pro Phe Glu Phe
1 5 10 15
Ala Thr Thr Ala Ser Thr Asp Ala Ala Asn Ala Pro Thr Thr Phe Pro
20 25 30
Val Glu Ala Pro Pro Leu Glu Glu Glu Glu Val Ile Ile Glu Gln Asp
35 40 45
Pro Gly Phe Val Ser Glu Asp Asp Glu Asp Arg Ser Val Pro Thr Glu
50 55 60
Asp Lys Lys Gln Asp Gln Asp Asp Ala Glu Ala Asn Glu Glu Gln Val
65 70 75 80
Gly Arg Gly Asp Gln Arg His Gly Asp Tyr Leu Asp Val Gly Asp Asp
85 90 95
Val Leu Leu Lys His Leu Gln Arg Gln Cys Ala Ile Ile Cys Asp Ala
100 105 110
Leu Gln Glu Arg Ser Asp Val Pro Leu Ala Ile Ala Asp Val Ser Leu
115 120 125
Ala Tyr Glu Arg His Leu Phe Ser Pro Arg Val Pro Pro Lys Arg Gln
130 135 140
Glu Asn Gly Thr Cys Glu Pro Asn Pro Arg Leu Asn Phe Tyr Pro Val
145 150 155 160
Phe Ala Val Pro Glu Val Leu Ala Thr Tyr His Ile Phe Phe Gln Asn
165 170 175
Cys Lys Ile Pro Leu Ser Cys Arg Ala Asn Arg Ser Arg Ala Asp Lys
180 185 190
Gln Leu Ala Leu Arg Gln Gly Ala Val Ile Pro Asp Ile Ala Ser Leu
195 200 205
Asp Glu Val Pro Lys Ile Phe Glu Gly Leu Gly Arg Asp Glu Lys Arg
210 215 220
Ala Ala Asn Ala Leu Gln Gln Glu Asn Ser Glu Asn Glu Ser His Cys
225 230 235 240
Gly Val Leu Val Glu Leu Glu Gly Asp Asn Ala Arg Leu Ala Val Leu
245 250 255
Lys Arg Ser Ile Glu Val Thr His Phe Ala Tyr Pro Ala Leu Asn Leu
260 265 270
Pro Pro Lys Val Met Ser Thr Val Met Ser Glu Leu Ile Val Arg Arg
275 280 285
Ala Arg Pro Leu Glu Arg Asp Ala Asn Leu Gln Glu Gln Thr Glu Glu
290 295 300
Gly Leu Pro Ala Val Gly Asp Glu Gln Leu Ala Arg Trp Leu Glu Thr
305 310 315 320
Arg Glu Pro Ala Asp Leu Glu Glu Arg Arg Lys Leu Met Met Ala Ala
325 330 335
Val Leu Val Thr Val Glu Leu Glu Cys Met Gln Arg Phe Phe Ala Asp
340 345 350
Pro Glu Met Gln Arg Lys Leu Glu Glu Thr Leu His Tyr Thr Phe Arg
355 360 365
Gln Gly Tyr Val Arg Gln Ala Cys Lys Ile Ser Asn Val Glu Leu Cys
370 375 380
Asn Leu Val Ser Tyr Leu Gly Ile Leu His Glu Asn Arg Leu Gly Gln
385 390 395 400
Asn Val Leu His Ser Thr Leu Lys Gly Glu Ala Arg Arg Asp Tyr Val
405 410 415
Arg Asp Cys Val Tyr Leu Phe Leu Cys Tyr Thr Trp Gln Thr Ala Met
420 425 430
Gly Val Gln Gln Cys Leu Glu Glu Arg Asn Leu Lys Glu Leu Gln Lys
435 440 445
Leu Leu Lys Gln Asn Leu Lys Asp Leu Trp Thr Ala Phe Asn Glu Arg
450 455 460
Ser Val Ala Ala His Leu Ala Asp Ile Ile Phe Pro Glu Arg Leu Leu
465 470 475 480
Lys Thr Leu Gln Gln Gly Leu Pro Asp Phe Thr Ser Gln Ser Met Leu
485 490 495
Gln Asn Phe Arg Asn Phe Ile Leu Glu Arg Ser Gly Ile Leu Pro Ala
500 505 510
Thr Cys Cys Ala Leu Pro Ser Asp Phe Val Pro Ile Lys Tyr Arg Glu
515 520 525
Cys Pro Pro Pro Leu Trp Gly His Cys Tyr Leu Leu Gln Leu Ala Asn
530 535 540
Tyr Leu Ala Tyr His Ser Asp Ile Met Glu Asp Val Ser Gly Asp Gly
545 550 555 560
Leu Leu Glu Cys His Cys Arg Cys Asn Leu Cys Thr Pro His Arg Ser
565 570 575
Leu Val Cys Asn Ser Gln Leu Leu Ser Glu Ser Gln Ile Ile Gly Thr
580 585 590
Phe Glu Leu Gln Gly Pro Ser Pro Asp Glu Lys Ser Ala Ala Pro Gly
595 600 605
Leu Lys Leu Thr Pro Gly Leu Trp Thr Ser Ala Tyr Leu Arg Lys Phe
610 615 620
Val Pro Glu Asp Tyr His Ala His Glu Ile Arg Phe Tyr Glu Asp Gln
625 630 635 640
Ser Arg Pro Pro Asn Ala Glu Leu Thr Ala Cys Val Ile Thr Gln Gly
645 650 655
His Ile Leu Gly Gln Leu Gln Ala Ile Asn Lys Ala Arg Gln Glu Phe
660 665 670
Leu Leu Arg Lys Gly Arg Gly Val Tyr Leu Asp Pro Gln Ser Gly Glu
675 680 685
Glu Leu Asn Pro Ile Pro Pro Pro Pro Gln Pro Tyr Gln Gln Pro Arg
690 695 700
Ala Leu Ala Ser Gln Asp Gly Thr Gln Lys Glu Ala Ala Ala Ala Ala
705 710 715 720
Ala Ala Thr His Gly Arg Gly Gly Ile Leu Gly Gln Ser Gly Arg Gly
725 730 735
Gly Phe Gly Arg Gly Gly Gly Asp Asp Gly Arg Leu Gly Gln Pro Arg
740 745 750
Arg Ser Phe Arg Gly Arg Arg Gly Val Arg Arg Asn Thr Val Thr Leu
755 760 765
Gly Arg Ile Pro Leu Ala Gly Ala Pro Glu Ile Gly Asn Arg Ser Gln
770 775 780
His Arg Tyr Asn Leu Arg Ser Ser Gly Ala Ala Gly Thr Ala Cys Ser
785 790 795 800
Pro Thr Gln Pro
<210> 99
<211> 734
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 99
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Gly
290 295 300
Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys
305 310 315 320
Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu Thr
325 330 335
Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr Val
340 345 350
Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp Val
355 360 365
Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser Gln
370 375 380
Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln
385 390 395 400
Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu Asp
405 410 415
Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg Leu
420 425 430
Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr Asn
435 440 445
Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln Ala
450 455 460
Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly Pro
465 470 475 480
Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn Asn
485 490 495
Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly Arg
500 505 510
Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp Asp
515 520 525
Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys Gln
530 535 540
Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr Asp
545 550 555 560
Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr Gly
565 570 575
Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr Ala
580 585 590
Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg
595 600 605
Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp
610 615 620
Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His
625 630 635 640
Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro
645 650 655
Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr
660 665 670
Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu
675 680 685
Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn
690 695 700
Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser
705 710 715 720
Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730
<210> 100
<211> 597
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 100
Thr Ala Pro Gly Lys Lys Arg Pro Val Glu His Ser Pro Val Glu Pro
1 5 10 15
Asp Ser Ser Ser Gly Thr Gly Lys Ala Gly Gln Gln Pro Ala Arg Lys
20 25 30
Arg Leu Asn Phe Gly Gln Thr Gly Asp Ala Asp Ser Val Pro Asp Pro
35 40 45
Gln Pro Leu Gly Gln Pro Pro Ala Ala Pro Ser Gly Leu Gly Thr Asn
50 55 60
Thr Met Ala Thr Gly Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly
65 70 75 80
Ala Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr
85 90 95
Trp Met Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu
100 105 110
Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Gln Ser Gly
115 120 125
Ala Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
130 135 140
Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln
145 150 155 160
Arg Leu Ile Asn Asn Asn Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys
165 170 175
Leu Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr Thr
180 185 190
Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser
195 200 205
Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu
210 215 220
Pro Pro Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu
225 230 235 240
Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys
245 250 255
Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr
260 265 270
Phe Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His
275 280 285
Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu
290 295 300
Tyr Tyr Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser
305 310 315 320
Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser
325 330 335
Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys
340 345 350
Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr
355 360 365
Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala
370 375 380
Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly
385 390 395 400
Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile
405 410 415
Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro
420 425 430
Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly
435 440 445
Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro
450 455 460
Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
465 470 475 480
Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met
485 490 495
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn
500 505 510
Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe
515 520 525
Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile
530 535 540
Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile
545 550 555 560
Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val
565 570 575
Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr
580 585 590
Leu Thr Arg Asn Leu
595
<210> 101
<211> 532
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 101
Met Ala Thr Gly Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala
1 5 10 15
Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp
20 25 30
Met Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro
35 40 45
Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala
50 55 60
Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe
65 70 75 80
Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg
85 90 95
Leu Ile Asn Asn Asn Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu
100 105 110
Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr
115 120 125
Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu
130 135 140
Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro
145 150 155 160
Pro Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr
165 170 175
Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu
180 185 190
Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe
195 200 205
Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser
210 215 220
Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr
225 230 235 240
Tyr Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg
245 250 255
Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg
260 265 270
Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr
275 280 285
Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys
290 295 300
Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met
305 310 315 320
Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val
325 330 335
Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu
340 345 350
Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val
355 360 365
Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn
370 375 380
Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly
385 390 395 400
Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala
405 410 415
Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly
420 425 430
Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr
435 440 445
Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala
450 455 460
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu
465 470 475 480
Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln
485 490 495
Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp
500 505 510
Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu
515 520 525
Thr Arg Asn Leu
530
<210> 102
<211> 734
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 102
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg
595 600 605
Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp
610 615 620
Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His
625 630 635 640
Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro
645 650 655
Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr
660 665 670
Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu
675 680 685
Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn
690 695 700
Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser
705 710 715 720
Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730
<210> 103
<211> 597
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 103
Thr Ala Pro Gly Lys Lys Arg Pro Val Glu His Ser Pro Val Glu Pro
1 5 10 15
Asp Ser Ser Ser Gly Thr Gly Lys Ala Gly Gln Gln Pro Ala Arg Lys
20 25 30
Arg Leu Asn Phe Gly Gln Thr Gly Asp Ala Asp Ser Val Pro Asp Pro
35 40 45
Gln Pro Leu Gly Gln Pro Pro Ala Ala Pro Ser Gly Leu Gly Thr Asn
50 55 60
Thr Met Ala Thr Gly Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly
65 70 75 80
Ala Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr
85 90 95
Trp Met Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu
100 105 110
Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Gln Ser Gly
115 120 125
Ala Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
130 135 140
Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln
145 150 155 160
Arg Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe
165 170 175
Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr
180 185 190
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
195 200 205
Ser Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys
210 215 220
Leu Pro Pro Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr
225 230 235 240
Leu Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr
245 250 255
Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe
260 265 270
Thr Phe Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala
275 280 285
His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr
290 295 300
Leu Tyr Tyr Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln
305 310 315 320
Ser Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln
325 330 335
Ser Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser
340 345 350
Lys Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala
355 360 365
Thr Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro
370 375 380
Ala Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser
385 390 395 400
Gly Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp
405 410 415
Ile Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn
420 425 430
Pro Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg
435 440 445
Gly Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gly Val Leu Pro
450 455 460
Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
465 470 475 480
Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met
485 490 495
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn
500 505 510
Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe
515 520 525
Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile
530 535 540
Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile
545 550 555 560
Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val
565 570 575
Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr
580 585 590
Leu Thr Arg Asn Leu
595
<210> 104
<211> 532
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 104
Met Ala Thr Gly Ser Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala
1 5 10 15
Asp Gly Val Gly Asn Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp
20 25 30
Met Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro
35 40 45
Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala
50 55 60
Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe
65 70 75 80
Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg
85 90 95
Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys
100 105 110
Leu Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Asp Gly Thr Thr
115 120 125
Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser
130 135 140
Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu
145 150 155 160
Pro Pro Phe Pro Ala Asp Val Phe Met Val Pro Gln Tyr Gly Tyr Leu
165 170 175
Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys
180 185 190
Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr
195 200 205
Phe Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His
210 215 220
Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu
225 230 235 240
Tyr Tyr Leu Ser Arg Thr Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser
245 250 255
Arg Leu Gln Phe Ser Gln Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser
260 265 270
Arg Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys
275 280 285
Thr Ser Ala Asp Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr
290 295 300
Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala
305 310 315 320
Met Ala Ser His Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly
325 330 335
Val Leu Ile Phe Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile
340 345 350
Glu Lys Val Met Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro
355 360 365
Val Ala Thr Glu Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly
370 375 380
Asn Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gly Val Leu Pro Gly
385 390 395 400
Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala
405 410 415
Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly
420 425 430
Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr
435 440 445
Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala
450 455 460
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu
465 470 475 480
Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln
485 490 495
Tyr Thr Ser Asn Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp
500 505 510
Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu
515 520 525
Thr Arg Asn Leu
530
<210> 105
<211> 1590
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 105
atggccagtc gggaagagga gcagcgcgaa accacccccg agcgcggacg cggtgcggcg 60
cgacgtccac caaccatgga ggacgtgtcg tccccgtcgc cgtcgccgcc gcctccccgc 120
gcgcccccaa aaaagcggct gaggcggcgt ctcgagtccg aggacgaaga agactcgtca 180
caagatgcgc tggtgccgcg cacacccagc ccgcggccat cgacctcgac ggcggatttg 240
gccattgcgt ccaaaaagaa aaagaagcgc ccctctccca agcccgagcg cccgccatcc 300
ccagaggtga tcgtggacag cgaggaagaa agagaagatg tggcgctaca aatggtgggt 360
ttcagcaacc caccggtgct aatcaagcac ggcaagggag gtaagcgcac ggtgcggcgg 420
ctgaatgaag acgacccagt ggcgcggggt atgcggacgc aagaggaaaa ggaagagtcc 480
agtgaagcgg aaagtgaaag cacggtgata aacccgctga gcctgccgat cgtgtctgcg 540
taggagaagg gcatggaggc tgcgcgcgcg ttgatggaca agtaccacgt ggataacgat 600
ctaaaggcaa acttcaagct actgcctgac caagtggaag ctctggcggc cgtatgcaag 660
acctggctaa acgaggagca ccgcgggttg cagctgacct tcaccagcaa caagaccttt 720
gtgacgatga tggggcgatt cctgcaggcg tacctgcagt cgtttgcaga ggtaacctac 780
aagcaccacg agcccacggg ctgcgcgttg tggctgcacc gctgcgctga gatcgaaggc 840
gagcttaagt gtctacacgg gagcattatg ataaataagg agcacgtgat tgaaatggat 900
gtgacgagcg aaaacgggca gcgcgcgctg aaggagcagt ctagcaaggc caagatcgtg 960
aagaaccggt ggggccgaaa tgtggtgcag atctccaaca ccgacgcaag gtgctgcgtg 1020
catgacgcgg cctgtccggc caatcagttt tccggcaagt cttgcggcat gttcttctct 1080
gaaggcgcaa aggctcaggt ggcttttaag cagatcaagg ctttcatgca ggcgctgtat 1140
cctaacgccc agaccgggca cggtcacctt ctgatgccac tacggtgcga gtgcaactca 1200
aagcctgggc atgcaccctt tttgggaagg cagctaccaa agttgactcc gttcgccctg 1260
agcaacgcgg aggacctgga cgcggatctg atctccgaca agagcgtgct ggccagcgtg 1320
caccacccgg cgctgatagt gttccagtgc tgcaaccctg tgtatcgcaa ctcgcgcgcg 1380
cagggcggag gccccaactg cgacttcaag atatcggcgc ccgacctgct aaacgcgttg 1440
gtgatggtgc gcagcctgtg gagtgaaaac ttcaccgagc tgccgcggat ggttgtgcct 1500
gagtttaagt ggagcactaa acaccagtat cgcaacgtgt ccctgccagt ggcgcatagc 1560
gatgcgcggc agaacccctt tgatttttaa 1590
<210> 106
<211> 1590
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 106
atggccagtc gggaagagga gcagcgcgaa accacccccg agcgcggacg cggtgcggcg 60
cgacgtccac caaccatgga ggacgtgtcg tccccgtcgc cgtcgccgcc gcctccccgc 120
gcgcccccaa aaaagcggct gaggcggcgt ctcgagtccg aggacgaaga agactcgtca 180
caagatgcgc tggtgccgcg cacacccagc ccgcggccat cgacctcgac ggcggatttg 240
gccattgcgt ccaaaaagaa aaagaagcgc ccctctccca agcccgagcg cccgccatcc 300
ccagaggtga tcgtggacag cgaggaagaa agagaagatg tggcgctaca aatggtgggt 360
ttcagcaacc caccggtgct aatcaagcac ggcaagggag gtaagcgcac ggtgcggcgg 420
ctgaatgaag acgacccagt ggcgcggggt atgcggacgc aagaggaaaa ggaagagtcc 480
agtgaagcgg aaagtgaaag cacggtgata aacccgctga gcctgccgat cgtgtctgcg 540
tgggagaagg gcatggaggc tgcgcgcgcg ttgatggaca agtaccacgt ggataacgat 600
ctaaaggcaa acttcaagct actgcctgac caagtggaag ctctggcggc cgtatgcaag 660
acctggctaa acgaggagca ccgcgggttg cagctgacct tcaccagcaa caagaccttt 720
gtgacgatga tggggcgatt cctgcaggcg tacctgcagt cgtttgcaga ggtaacctac 780
aagcaccacg agcccacggg ctgcgcgttg tggctgcacc gctgcgctga gatcgaaggc 840
gagcttaagt gtctacacgg gagcattatg ataaataagg agcacgtgat tgaaatggat 900
gtgacgagcg aaaacgggca gcgcgcgctg aaggagcagt ctagcaaggc caagatcgtg 960
aagaaccggt agggccgaaa tgtggtggtg atctccaaca ccgacgcaag gtgctgcgtg 1020
catgacgcgg cctgtccggc caatcagttt tccggcaagt cttgcggcat gttcttctct 1080
gaaggcgcaa aggctcaggt ggcttttaag cagatcaagg ctttcatgca ggcgctgtat 1140
cctaacgccc agaccgggca cggtcacctt ctgatgccac tacggtgcga gtgcaactca 1200
aagcctgggc atgcaccctt tttgggaagg cagctaccaa agttgactcc gttcgccctg 1260
agcaacgcgg aggacctgga cgcggatctg atctccgaca agagcgtgct ggccagcgtg 1320
caccacccgg cgctgatagt gttccagtgc tgcaaccctg tgtatcgcaa ctcgcgcgcg 1380
cagggcggag gccccaactg cgacttcaag atatcggcgc ccgacctgct aaacgcgttg 1440
gtgatggtgc gcagcctgtg gagtgaaaac ttcaccgagc tgccgcggat ggttgtgcct 1500
gagtttaagt ggagcactaa acaccagtat cgcaacgtgt ccctgccagt ggcgcatagc 1560
gatgcgcggc agaacccctt tgatttttaa 1590
<210> 107
<211> 885
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 107
atgactacgt ccggcgttcc atttggcatg acactacgac caacacgatc tcggttgtct 60
cggcgcactc cgtacagtag ggatcgccta cctccttttg agacagagac ccgcgctacc 120
atactggagg atcatccgct gctgcccgaa tgtaacactt tgacaatgca caacgtgagt 180
tacgtgcgag gtcttccctg cagtgtggga tttacgctga ttcaggaatg agttgttccc 240
tgggatatgg ttctgacgcg ggaggagctt gtaatcctga ggaagtgtat gcacgtgtgc 300
ctgtgttgtg ccaacattga tatcatgacg agcatgatga tccatggtta cgagtcctgg 360
gctctccact gtcattgttc cagtcccggt tccctgcagt gcatagccgg cgggcaggtt 420
ttggccagct ggtttaggat ggtggtggat ggcgccatgt ttaatcagag gtttatatgg 480
taccgggagg tggtgaatta caacatgcca aaagaggtaa tgtttatgtc cagcgtgttt 540
atgaggggtc gccacttaat ctacctgcgc ttgtggtatg atggccacgt gggttctgtg 600
gtccccgcca tgagctttgg atacagcgcc ttgcactgtg ggattttgaa caatattgtg 660
gtgctgtgct gcagttactg tgctgattta agtgagatca gggtgcgctg ctgtgcccgg 720
aggacaaggc gtctcatgct gcgggcggtg cgaatcatcg ctgaggagac cactgccatg 780
ttgtattcct gcaggacgga gcggcggcgg cagcagttta ttcgcgcgct gctgcagcac 840
caccgcccta tcctgatgca cgattatgac tctaccccca tgtag 885
<210> 108
<211> 885
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 108
atgactacgt ccggcgttcc atttggcatg acactacgac caacacgatc tcggttgtct 60
cggcgcactc cgtacagtag ggatcgccta cctccttttg agacagagac ccgcgctacc 120
atactggagg atcatccgct gctgcccgaa tgtaacactt tgacaatgca caacgtgagt 180
tacgtgcgag gtcttccctg cagtgtggga tttacgctga ttcaggaatg ggttgttccc 240
tgggatatgg ttctgacgcg ggaggagctt gtaatcctga ggaagtgtat gcacgtgtgc 300
ctgtgttgtg ccaacattga tatcatgacg agcatgatga tccatggtta cgagtcctgg 360
gctctccact gtcattgttc cagtcccggt tccctgcagt gcatagccgg cgggcaggtt 420
ttggccagct ggtttaggat ggtggtggat ggcgccatgt ttaatcagag gtttatatgg 480
taccgggagg tggtgaatta caacatgcca aaagaggtaa tgtttatgtc cagcgtgttt 540
atgaggggtc gccacttaat ctacctgcgc ttgtagtatg atggccacgt gggttctgtg 600
gtccccgcca tgagctttgg atacagcgcc ttgcactgtg ggattttgaa caatattgtg 660
gtgctgtgct gcagttactg tgctgattta agtgagatca gggtgcgctg ctgtgcccgg 720
aggacaaggc gtctcatgct gcgggcggtg cgaatcatcg ctgaggagac cactgccatg 780
ttgtattcct gcaggacgga gcggcggcgg cagcagttta ttcgcgcgct gctgcagcac 840
caccgcccta tcctgatgca cgattatgac tctaccccca tgtag 885
<210> 109
<211> 2418
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 109
atggagtcag tcgagaagga ggacagccta accgccccct ttgagttcgc caccaccgcc 60
tccaccgatg ccgccaacgc gcctaccacc ttccccgtcg aggcaccccc gcttgaggag 120
gaggaagtga ttatcgagca ggacccaggt tttgtaagcg aagacgacga ggatcgctca 180
gtaccaacag aggataaaaa gcaagaccag gacgacgcag aggcaaacga ggaacaagtc 240
gggcgggggg accaaaggca tggcgactac ctagatgtgg gagacgacgt gctgttgaag 300
catctgcagc gccagtgcgc cattatctgc gacgcgttgc aagagcgcag cgatgtgccc 360
ctcgccatag cggatgtcag ccttgcctac gaacgccacc tgttctcacc gcgcgtaccc 420
cccaaacgcc aagaaaacgg cacatgcgag cccaacccgc gcctcaactt ctaccccgta 480
tttgccgtgc cagaggtgct tgccacctat cacatctttt tccaaaactg caagataccc 540
ctatcctgcc gtgccaaccg cagccgagcg gacaagcagc tggccttgcg gcagggcgct 600
gtcatacctg atatcgcctc gctcgacgaa gtgccaaaaa tctttgaggg tcttggacgc 660
gacgagaaac gcgcggcaaa cgctctgcaa caagaaaaca gcgaaaatga aagtcactgt 720
ggagtgctgg tggaacttga gggtgacaac gcgcgcctag ccgtgctgaa acgcagcatc 780
gaggtcaccc actttgccta cccggcactt aacctacccc ccaaggttat gagcacagtc 840
atgagcgagc tgatcgtgcg ccgtgcacga cccctggaga gggatgcaaa cttgcaagaa 900
caaaccgagg agggcctacc cgcagttggc gatgagcagc tggcgcgctg gcttgagacg 960
cgcgagcctg ccgacttgga ggagcgacgc aagctaatga tggccgcagt gcttgttacc 1020
gtggagcttg agtgcatgca gcggttcttt gctgacccgg agatgcagcg caagctagag 1080
gaaacgttgc actacacctt tcgccagggc tacgtgcgcc aggcctgcaa aatttccaac 1140
gtggagctct gcaacctggt ctcctacctt ggaattttgc acgaaaaccg cctcgggcaa 1200
aacgtgcttc attccacgct caagggcgag gcgcgccgcg actacgtccg cgactgcgtt 1260
tacttatttc tgtgctacac ctggcaaacg gccatgggcg tgtagcagca atgcctggag 1320
gagcgcaacc taaaggagct gcagaagctg ctaaagcaaa acttgaagga cctatggacg 1380
gccttcaacg agcgctccgt ggccgcgcac ctggcggaca ttatcttccc cgaacgcctg 1440
cttaaaaccc tgcaacaggg tctgccagac ttcaccagtc aaagcatgtt gcaaaacttt 1500
aggaacttta tcctagagcg ttcaggaatt ctgcccgcca cctgctgtgc gcttcctagc 1560
gactttgtgc ccattaagta ccgtgaatgc cctccgccgc tttggggtca ctgctacctt 1620
ctgcagctag ccaactacct tgcctaccac tccgacatca tggaagacgt gagcggtgac 1680
ggcctactgg agtgtcactg tcgctgcaac ctatgcaccc cgcaccgctc cctggtctgc 1740
aattcgcaac tgcttagcga aagtcaaatt atcggtacct ttgagctgca gggtccctcg 1800
cctgacgaaa agtccgcggc tccggggttg aaactcactc cggggctgtg gacgtcggct 1860
taccttcgca aatttgtacc tgaggactac cacgcccacg agattaggtt ctacgaagac 1920
caatcccgcc cgccaaatgc ggagcttacc gcctgcgtca ttacccaggg ccacatcctt 1980
ggccaattgc aagccatcaa caaagcccgc caagagtttc tgctacgaaa gggacggggg 2040
gtttacctgg acccccagtc cggcgaggag ctcaacccaa tccccccgcc gccgcagccc 2100
tatcagcagc cgcgggccct tgcttcccag gatggcaccc aaaaagaagc tgcagctgcc 2160
gccgccgcca cccacggacg aggaggaata ctgggacagt caggcagagg aggttttgga 2220
cgaggaggag gagatgatgg aagactggga cagcctagac gaagcttccg aggccgaaga 2280
ggtgtcagac gaaacaccgt caccctcggt cgcattcccc tcgccggcgc cccagaaatt 2340
ggcaaccgtt cccagcatcg ctacaacctc cgctcctcag gcgccgccgg cactgcctgt 2400
tcgccgaccc aaccgtag 2418
<210> 110
<211> 2208
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 110
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540
tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840
tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900
aacaacaact gaggattccg acccaagagg ctcaacttca agctctttaa cattcaagtc 960
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020
caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080
tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140
aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200
cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320
tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380
cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440
ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560
ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620
atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680
gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800
cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040
gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100
acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160
tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208
<210> 111
<211> 2208
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 111
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540
tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840
tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900
aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020
caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080
tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140
aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200
cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320
tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380
cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440
ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560
ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620
atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680
gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac ataaggcgtt 1800
cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040
gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100
acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160
tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208
<210> 112
<211> 805
<212> PRT
<213> 未知的
<220>
<223> 腺相关病毒
<400> 112
Met Glu Ser Val Glu Lys Glu Asp Ser Leu Thr Ala Pro Phe Glu Phe
1 5 10 15
Ala Thr Thr Ala Ser Thr Asp Ala Ala Asn Ala Pro Thr Thr Phe Pro
20 25 30
Val Glu Ala Pro Pro Leu Glu Glu Glu Glu Val Ile Ile Glu Gln Asp
35 40 45
Pro Gly Phe Val Ser Glu Asp Asp Glu Asp Arg Ser Val Pro Thr Glu
50 55 60
Asp Lys Lys Gln Asp Gln Asp Asp Ala Glu Ala Asn Glu Glu Gln Val
65 70 75 80
Gly Arg Gly Asp Gln Arg His Gly Asp Tyr Leu Asp Val Gly Asp Asp
85 90 95
Val Leu Leu Lys His Leu Gln Arg Gln Cys Ala Ile Ile Cys Asp Ala
100 105 110
Leu Gln Glu Arg Ser Asp Val Pro Leu Ala Ile Ala Asp Val Ser Leu
115 120 125
Ala Tyr Glu Arg His Leu Phe Ser Pro Arg Val Pro Pro Lys Arg Gln
130 135 140
Glu Asn Gly Thr Cys Glu Pro Asn Pro Arg Leu Asn Phe Tyr Pro Val
145 150 155 160
Phe Ala Val Pro Glu Val Leu Ala Thr Tyr His Ile Phe Phe Gln Asn
165 170 175
Cys Lys Ile Pro Leu Ser Cys Arg Ala Asn Arg Ser Arg Ala Asp Lys
180 185 190
Gln Leu Ala Leu Arg Gln Gly Ala Val Ile Pro Asp Ile Ala Ser Leu
195 200 205
Asp Glu Val Pro Lys Ile Phe Glu Gly Leu Gly Arg Asp Glu Lys Arg
210 215 220
Ala Ala Asn Ala Leu Gln Gln Glu Asn Ser Glu Asn Glu Ser His Cys
225 230 235 240
Gly Val Leu Val Glu Leu Glu Gly Asp Asn Ala Arg Leu Ala Val Leu
245 250 255
Lys Arg Ser Ile Glu Val Thr His Phe Ala Tyr Pro Ala Leu Asn Leu
260 265 270
Pro Pro Lys Val Met Ser Thr Val Met Ser Glu Leu Ile Val Arg Arg
275 280 285
Ala Arg Pro Leu Glu Arg Asp Ala Asn Leu Gln Glu Gln Thr Glu Glu
290 295 300
Gly Leu Pro Ala Val Gly Asp Glu Gln Leu Ala Arg Trp Leu Glu Thr
305 310 315 320
Arg Glu Pro Ala Asp Leu Glu Glu Arg Arg Lys Leu Met Met Ala Ala
325 330 335
Val Leu Val Thr Val Glu Leu Glu Cys Met Gln Arg Phe Phe Ala Asp
340 345 350
Pro Glu Met Gln Arg Lys Leu Glu Glu Thr Leu His Tyr Thr Phe Arg
355 360 365
Gln Gly Tyr Val Arg Gln Ala Cys Lys Ile Ser Asn Val Glu Leu Cys
370 375 380
Asn Leu Val Ser Tyr Leu Gly Ile Leu His Glu Asn Arg Leu Gly Gln
385 390 395 400
Asn Val Leu His Ser Thr Leu Lys Gly Glu Ala Arg Arg Asp Tyr Val
405 410 415
Arg Asp Cys Val Tyr Leu Phe Leu Cys Tyr Thr Trp Gln Thr Ala Met
420 425 430
Gly Val Trp Gln Gln Cys Leu Glu Glu Arg Asn Leu Lys Glu Leu Gln
435 440 445
Lys Leu Leu Lys Gln Asn Leu Lys Asp Leu Trp Thr Ala Phe Asn Glu
450 455 460
Arg Ser Val Ala Ala His Leu Ala Asp Ile Ile Phe Pro Glu Arg Leu
465 470 475 480
Leu Lys Thr Leu Gln Gln Gly Leu Pro Asp Phe Thr Ser Gln Ser Met
485 490 495
Leu Gln Asn Phe Arg Asn Phe Ile Leu Glu Arg Ser Gly Ile Leu Pro
500 505 510
Ala Thr Cys Cys Ala Leu Pro Ser Asp Phe Val Pro Ile Lys Tyr Arg
515 520 525
Glu Cys Pro Pro Pro Leu Trp Gly His Cys Tyr Leu Leu Gln Leu Ala
530 535 540
Asn Tyr Leu Ala Tyr His Ser Asp Ile Met Glu Asp Val Ser Gly Asp
545 550 555 560
Gly Leu Leu Glu Cys His Cys Arg Cys Asn Leu Cys Thr Pro His Arg
565 570 575
Ser Leu Val Cys Asn Ser Gln Leu Leu Ser Glu Ser Gln Ile Ile Gly
580 585 590
Thr Phe Glu Leu Gln Gly Pro Ser Pro Asp Glu Lys Ser Ala Ala Pro
595 600 605
Gly Leu Lys Leu Thr Pro Gly Leu Trp Thr Ser Ala Tyr Leu Arg Lys
610 615 620
Phe Val Pro Glu Asp Tyr His Ala His Glu Ile Arg Phe Tyr Glu Asp
625 630 635 640
Gln Ser Arg Pro Pro Asn Ala Glu Leu Thr Ala Cys Val Ile Thr Gln
645 650 655
Gly His Ile Leu Gly Gln Leu Gln Ala Ile Asn Lys Ala Arg Gln Glu
660 665 670
Phe Leu Leu Arg Lys Gly Arg Gly Val Tyr Leu Asp Pro Gln Ser Gly
675 680 685
Glu Glu Leu Asn Pro Ile Pro Pro Pro Pro Gln Pro Tyr Gln Gln Pro
690 695 700
Arg Ala Leu Ala Ser Gln Asp Gly Thr Gln Lys Glu Ala Ala Ala Ala
705 710 715 720
Ala Ala Ala Thr His Gly Arg Gly Gly Ile Leu Gly Gln Ser Gly Arg
725 730 735
Gly Gly Phe Gly Arg Gly Gly Gly Asp Asp Gly Arg Leu Gly Gln Pro
740 745 750
Arg Arg Ser Phe Arg Gly Arg Arg Gly Val Arg Arg Asn Thr Val Thr
755 760 765
Leu Gly Arg Ile Pro Leu Ala Gly Ala Pro Glu Ile Gly Asn Arg Ser
770 775 780
Gln His Arg Tyr Asn Leu Arg Ser Ser Gly Ala Ala Gly Thr Ala Cys
785 790 795 800
Ser Pro Thr Gln Pro
805
<210> 113
<211> 4068
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 113
gccaccatgg agctggtcgg gtggctcgtg tagaagggga ttacctcgga gaagcagtgg 60
atccaggagg accaggcctc atacatctcc ttcaatgcgg cctccaactc gcggtcccaa 120
atcaaggctg ccttggacaa tgcgggaaag attatgagcc tgactaaaac cgcccccgac 180
tacctggtgg gccagcagcc cgtggaggac atttccagca atcggattta taaaattttg 240
gaactaaacg ggtacgatcc ccaatatgcg gcttccgtct ttctgggatg ggccacgaaa 300
aagttcggca agaggaacac catctggctg tttgggcctg caactaccgg gaagaccaac 360
atcgcggagg ccatagccca cactgtgccc ttctacgggt gcgtaaactg gaccaatgag 420
aactttccct tcaacgactg tgtcgacaag atggtgatct ggtgggagga ggggaagatg 480
accgccaagg tcgtggagtc ggccaaagcc attctcggag gaagcaaggt gcgcgtggac 540
cagaaatgca agtcctcggc ccagatagac ccgactcccg tgatcgtcac ctccaacacc 600
aacatgtgcg ccgtgattga cgggaactca acgaccttcg aacaccagca gccgttgcaa 660
gaccggatgt tcaaatttga actcacccgc cgtctggatc atgactttgg gaaggtcacc 720
aagcaggaag tcaaagactt tttccggtgg gcaaaggatc acgtggttga ggtggagcat 780
gaattctacg tcaaaaaggg tggagccaag aaaagacccg cccccagtga cgcagatata 840
agtgagccca aacgggtgcg cgagtcagtt gcgcagccat cgacgtcaga cgcggaagct 900
tcgatcaact acgcagacag gtaccaaaac aaatgttctc gtcacgtggg catgaatctg 960
atgctgtttc cctgcagaca atgcgagaga atgaatcaga attcaaatat ctgcttcact 1020
cacggacaga aagactgttt agagtgcttt cccgtgtcag aatctcaacc cgtttctgtc 1080
gtcaaaaagg cgtatcagaa actgtgctac attcatcata tcatgggaaa ggtgccagac 1140
gcttgcactg cctgcgatct ggtcaatgtg gatttggatg actgcatctt tgaacaataa 1200
atgatttaaa tcaggtatgg ctgccgatgg ttatcttcca gattggctcg aggacactct 1260
ctctgagata actgagggat agaattccgc cccccccccc taacgttact ggccgaagcc 1320
gcttggaata aggccggtgt gcgtttgtct atatgttatt ttccaccata ttgccgtctt 1380
ttggcaatgt gagggcccgg aaacctggcc ctgtcttctt gacgagcatt cctaggggtc 1440
tttcccctct cgccaaagga atgcaaggtc tgttgaatgt cgtgaaggaa gcagttcctc 1500
tggaagcttc ttgaagacaa acaacgtctg tagcgaccct ttgcaggcag cggaaccccc 1560
cacctggcga caggtgcctc tgcggccaaa agccacgtgt ataagataca cctgcaaagg 1620
cggcacaacc ccagtgccac gttgtgagtt ggatagttgt ggaaagagtc aaatggctct 1680
cctcaagcgt attcaacaag gggctgaagg atgcccagaa ggtaccccat tgtatgggat 1740
ctgatctggg gcctcggtgc acatgcttta catgtgttta gtcgaggtta aaaaaacgtc 1800
taggcccccc gaaccacggg gacgtggttt tcctttgaaa aacacgatga taatagttat 1860
cgccgccatg ccggggtttt acgagattgt gattaaggtc cccagcgacc ttgacgagca 1920
tctgcccggc atttctgaca gctttgtgaa ctgggtggcc gagaaggaat gggagttgcc 1980
gccagattct gacatggatc tgaatctgat tgagcaggca cccctgaccg tggccgagaa 2040
gctgcagcgc gactttctga cggaatggcg ccgtgtgagt aaggccccgg aggccctttt 2100
ctttgtgcaa tttgagaagg gagagagcta cttccacatg cacgtgctcg tggaaaccac 2160
cggggtgaaa tccatggttt tgggacgttt cctgagtcag attcgcgaaa aactgattca 2220
gagaatttac cgcgggatcg agccgacttt gccaaactgg ttcgcggtca caaagacacg 2280
gaacggcgcc gggggaggaa acaaagttgt tgatgagtgc tacatcccca attacttgct 2340
ccccaaaacc cagcctgagc tccaatgggc atggaccaac atggaacagt acctgtctgc 2400
ctgtttgaat ctcacggagc gtaaacggtt ggtggcgcag catctgacgc acgtgtcgca 2460
gacgcaggag cagaacaaag agaatcagaa tcccaattct gatgcgccgg tgatcagatc 2520
aaaaacttca gccaggtaca tggagctggt cgggtggctc gtgtagaagg ggattacctc 2580
ggagaagcag tggatccagg aggaccaggc ctcatacatc tccttcaatg cggcctccaa 2640
ctcgcggtcc caaatcaagg ctgccttgga caatgcggga aagattatga gcctgactaa 2700
aaccgccccc gactacctgg tgggccagca gcccgtggag gacatttcca gcaatcggat 2760
ttataaaatt ttggaactaa acgggtacga tccccaatat gcggcttccg tctttctggg 2820
atgggccacg aaaaagttcg gcaagaggaa caccatctgg ctgtttgggc ctgcaactac 2880
cgggaagacc aacatcgcgg aggccatagc ccacactgtg cccttctacg ggtgcgtaaa 2940
ctggaccaat gagaactttc ccttcaacga ctgtgtcgac aagatggtga tctggtggga 3000
ggaggggaag atgaccgcca aggtcgtgga gtcggccaaa gccattctcg gaggaagcaa 3060
ggtgcgcgtg gaccagaaat gcaagtcctc ggcccagata gacccgactc ccgtgatcgt 3120
cacctccaac accaacatgt gcgccgtgat tgacgggaac tcaacgacct tcgaacacca 3180
gcagccgttg caagaccgga tgttcaaatt tgaactcacc cgccgtctgg atcatgactt 3240
tgggaaggtc accaagcagg aagtcaaaga ctttttccgg tgggcaaagg atcacgtggt 3300
tgaggtggag catgaattct acgtcaaaaa gggtggagcc aagaaaagac ccgcccccag 3360
tgacgcagat ataagtgagc ccaaacgggt gcgcgagtca gttgcgcagc catcgacgtc 3420
agacgcggaa gcttcgatca actacgcaga caggtaccaa aacaaatgtt ctcgtcacgt 3480
gggcatgaat ctgatgctgt ttccctgcag acaatgcgag agaatgaatc agaattcaaa 3540
tatctgcttc actcacggac agaaagactg tttagagtgc tttcccgtgt cagaatctca 3600
acccgtttct gtcgtcaaaa aggcgtatca gaaactgtgc tacattcatc atatcatggg 3660
aaaggtgcca gacgcttgca ctgcctgcga tctggtcaat gtggatttgg atgactgcat 3720
ctttgaacaa taaatgattt aaatcaggta tggctgccga tggttatctt ccagattggc 3780
tcgaggacac tctctctgag ttatcattta aatggcgcgc ccacgtgggt accgcggccg 3840
cggggatcca gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca 3900
gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat 3960
aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg 4020
ggaggtgtgg gaggtttttt cggatcctct agagtcgacc tgcaggca 4068
<210> 114
<211> 4068
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 114
gccaccatgg agctggtcgg gtggctcgtg gacaagggga ttacctcgga gaagcagtgg 60
atccaggagg accaggcctc atacatctcc ttcaatgcgg cctccaactc gcggtcccaa 120
atcaaggctg ccttggacaa tgcgggaaag attatgagcc tgactaaaac cgcccccgac 180
tacctggtgg gccagcagcc cgtggaggac atttccagca atcggattta taaaattttg 240
gaactaaacg ggtacgatcc ccaatatgcg gcttccgtct ttctgggatg ggccacgaaa 300
aagttcggca agaggaacac catctggctg tttgggcctg caactaccgg gaagaccaac 360
atcgcggagg ccatagccca cactgtgccc ttctacgggt gcgtaaactg gaccaatgag 420
aactttccct tcaacgactg tgtcgacaag atggtgatct ggtgggagga ggggaagatg 480
accgccaagg tcgtggagtc ggccaaagcc attctcggag gaagcaaggt gcgcgtggac 540
cagaaatgca agtcctcggc ccagatagac ccgactcccg tgatcgtcac ctccaacacc 600
aacatgtgcg ccgtgattga cgggaactca acgaccttcg aacaccagca gccgttgcaa 660
gaccggatgt tcaaatttga actcacccgc cgtctggatc atgactttgg gaaggtcacc 720
aagcaggaag tcaaagactt tttccggtgg gcaaaggatc acgtggttga ggtggagcat 780
gaattctacg tcaaaaaggg tggagccaag aaaagacccg cccccagtga cgcagatata 840
agtgagccca aacgggtgcg cgagtcagtt gcgcagccat cgacgtcaga cgcggaagct 900
tcgatcaact acgcagacag gtaccaaaac aaatgttctc gtcacgtggg catgaatctg 960
atgctgtttc cctgcagaca atgcgagaga atgaatcaga attcaaatat ctgcttcact 1020
cacggacaga aagactgttt agagtgcttt cccgtgtcag aatctcaacc cgtttctgtc 1080
gtcaaaaagg cgtatcagaa actgtgctac attcatcata tcatgggaaa ggtgccagac 1140
gcttgcactg cctgcgatct ggtcaatgtg gatttggatg actgcatctt tgaacaataa 1200
atgatttaaa tcaggtatgg ctgccgatgg ttatcttcca gattggctcg aggacactct 1260
ctctgagata actgagggat agaattccgc cccccccccc taacgttact ggccgaagcc 1320
gcttggaata aggccggtgt gcgtttgtct atatgttatt ttccaccata ttgccgtctt 1380
ttggcaatgt gagggcccgg aaacctggcc ctgtcttctt gacgagcatt cctaggggtc 1440
tttcccctct cgccaaagga atgcaaggtc tgttgaatgt cgtgaaggaa gcagttcctc 1500
tggaagcttc ttgaagacaa acaacgtctg tagcgaccct ttgcaggcag cggaaccccc 1560
cacctggcga caggtgcctc tgcggccaaa agccacgtgt ataagataca cctgcaaagg 1620
cggcacaacc ccagtgccac gttgtgagtt ggatagttgt ggaaagagtc aaatggctct 1680
cctcaagcgt attcaacaag gggctgaagg atgcccagaa ggtaccccat tgtatgggat 1740
ctgatctggg gcctcggtgc acatgcttta catgtgttta gtcgaggtta aaaaaacgtc 1800
taggcccccc gaaccacggg gacgtggttt tcctttgaaa aacacgatga taatagttat 1860
cgccgccatg ccggggtttt acgagattgt gattaaggtc cccagcgacc ttgacgagca 1920
tctgcccggc atttctgaca gctttgtgaa ctgggtggcc gagaaggaat gggagttgcc 1980
gccagattct gacatggatc tgaatctgat tgagcaggca cccctgaccg tggccgagaa 2040
gctgcagcgc gactttctga cggaatggcg ccgtgtgagt aaggccccgg aggccctttt 2100
ctttgtgcaa tttgagaagg gagagagcta cttccacatg cacgtgctcg tggaaaccac 2160
cggggtgaaa tccatggttt tgggacgttt cctgagtcag attcgcgaaa aactgattca 2220
gagaatttac cgcgggatcg agccgacttt gccaaactgg ttcgcggtca caaagacacg 2280
gaacggcgcc gggggaggaa acaaagttgt tgatgagtgc tacatcccca attacttgct 2340
ccccaaaacc cagcctgagc tccaatgggc atggaccaac atggaacagt acctgtctgc 2400
ctgtttgaat ctcacggagc gtaaacggtt ggtggcgcag catctgacgc acgtgtcgca 2460
gacgcaggag cagaacaaag agaatcagaa tcccaattct gatgcgccgg tgatcagatc 2520
aaaaacttca gccaggtaca tggagctggt cgggtggctc gtgtagaagg ggattacctc 2580
ggagaagcag tggatccagg aggaccaggc ctcatacatc tccttcaatg cggcctccaa 2640
ctcgcggtcc caaatcaagg ctgccttgga caatgcggga aagattatga gcctgactaa 2700
aaccgccccc gactacctgg tgggccagca gcccgtggag gacatttcca gcaatcggat 2760
ttataaaatt ttggaactaa acgggtacga tccccaatat gcggcttccg tctttctggg 2820
atgggccacg aaaaagttcg gcaagaggaa caccatctgg ctgtttgggc ctgcaactac 2880
cgggaagacc aacatcgcgg aggccatagc ccacactgtg cccttctacg ggtgcgtaaa 2940
ctggaccaat gagaactttc ccttcaacga ctgtgtcgac aagatggtga tctggtggga 3000
ggaggggaag atgaccgcca aggtcgtgga gtcggccaaa gccattctcg gaggaagcaa 3060
ggtgcgcgtg gaccagaaat gcaagtcctc ggcccagata gacccgactc ccgtgatcgt 3120
cacctccaac accaacatgt gcgccgtgat tgacgggaac tcaacgacct tcgaacacca 3180
gcagccgttg caagaccgga tgttcaaatt tgaactcacc cgccgtctgg atcatgactt 3240
tgggaaggtc accaagcagg aagtcaaaga ctttttccgg tgggcaaagg atcacgtggt 3300
tgaggtggag catgaattct acgtcaaaaa gggtggagcc aagaaaagac ccgcccccag 3360
tgacgcagat ataagtgagc ccaaacgggt gcgcgagtca gttgcgcagc catcgacgtc 3420
agacgcggaa gcttcgatca actacgcaga caggtaccaa aacaaatgtt ctcgtcacgt 3480
gggcatgaat ctgatgctgt ttccctgcag acaatgcgag agaatgaatc agaattcaaa 3540
tatctgcttc actcacggac agaaagactg tttagagtgc tttcccgtgt cagaatctca 3600
acccgtttct gtcgtcaaaa aggcgtatca gaaactgtgc tacattcatc atatcatggg 3660
aaaggtgcca gacgcttgca ctgcctgcga tctggtcaat gtggatttgg atgactgcat 3720
ctttgaacaa taaatgattt aaatcaggta tggctgccga tggttatctt ccagattggc 3780
tcgaggacac tctctctgag ttatcattta aatggcgcgc ccacgtgggt accgcggccg 3840
cggggatcca gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca 3900
gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat 3960
aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg 4020
ggaggtgtgg gaggtttttt cggatcctct agagtcgacc tgcaggca 4068
<210> 115
<211> 4068
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 115
gccaccatgg agctggtcgg gtggctcgtg gacaagggga ttacctcgga gaagcagtgg 60
atccaggagg accaggcctc atacatctcc ttcaatgcgg cctccaactc gcggtcccaa 120
atcaaggctg ccttggacaa tgcgggaaag attatgagcc tgactaaaac cgcccccgac 180
tacctggtgg gccagcagcc cgtggaggac atttccagca atcggattta taaaattttg 240
gaactaaacg ggtacgatcc ccaatatgcg gcttccgtct ttctgggatg ggccacgaaa 300
aagttcggca agaggaacac catctggctg tttgggcctg caactaccgg gaagaccaac 360
atcgcggagg ccatagccca cactgtgccc ttctacgggt gcgtaaactg gaccaatgag 420
aactttccct tcaacgactg tgtcgacaag atggtgatct ggtgggagga ggggaagatg 480
accgccaagg tcgtggagtc ggccaaagcc attctcggag gaagcaaggt gcgcgtggac 540
cagaaatgca agtcctcggc ccagatagac ccgactcccg tgatcgtcac ctccaacacc 600
aacatgtgcg ccgtgattga cgggaactca acgaccttcg aacaccagca gccgttgcaa 660
gaccggatgt tcaaatttga actcacccgc cgtctggatc atgactttgg gaaggtcacc 720
aagcaggaag tcaaagactt tttccggtgg gcaaaggatc acgtggttga ggtggagcat 780
gaattctacg tcaaaaaggg tggagccaag aaaagacccg cccccagtga cgcagatata 840
agtgagccca aacgggtgcg cgagtcagtt gcgcagccat cgacgtcaga cgcggaagct 900
tcgatcaact acgcagacag gtaccaaaac aaatgttctc gtcacgtggg catgaatctg 960
atgctgtttc cctgcagaca atgcgagaga atgaatcaga attcaaatat ctgcttcact 1020
cacggacaga aagactgttt agagtgcttt cccgtgtcag aatctcaacc cgtttctgtc 1080
gtcaaaaagg cgtatcagaa actgtgctac attcatcata tcatgggaaa ggtgccagac 1140
gcttgcactg cctgcgatct ggtcaatgtg gatttggatg actgcatctt tgaacaataa 1200
atgatttaaa tcaggtatgg ctgccgatgg ttatcttcca gattggctcg aggacactct 1260
ctctgagata actgagggat agaattccgc cccccccccc taacgttact ggccgaagcc 1320
gcttggaata aggccggtgt gcgtttgtct atatgttatt ttccaccata ttgccgtctt 1380
ttggcaatgt gagggcccgg aaacctggcc ctgtcttctt gacgagcatt cctaggggtc 1440
tttcccctct cgccaaagga atgcaaggtc tgttgaatgt cgtgaaggaa gcagttcctc 1500
tggaagcttc ttgaagacaa acaacgtctg tagcgaccct ttgcaggcag cggaaccccc 1560
cacctggcga caggtgcctc tgcggccaaa agccacgtgt ataagataca cctgcaaagg 1620
cggcacaacc ccagtgccac gttgtgagtt ggatagttgt ggaaagagtc aaatggctct 1680
cctcaagcgt attcaacaag gggctgaagg atgcccagaa ggtaccccat tgtatgggat 1740
ctgatctggg gcctcggtgc acatgcttta catgtgttta gtcgaggtta aaaaaacgtc 1800
taggcccccc gaaccacggg gacgtggttt tcctttgaaa aacacgatga taatagttat 1860
cgccgccatg ccggggtttt acgagattgt gattaaggtc cccagcgacc ttgactagca 1920
tctgcccggc atttctgaca gctttgtgaa ctgggtggcc gagaaggaat gggagttgcc 1980
gccagattct gacatggatc tgaatctgat tgagcaggca cccctgaccg tggccgagaa 2040
gctgcagcgc gactttctga cggaatggcg ccgtgtgagt aaggccccgg aggccctttt 2100
ctttgtgcaa tttgagaagg gagagagcta cttccacatg cacgtgctcg tggaaaccac 2160
cggggtgaaa tccatggttt tgggacgttt cctgagtcag attcgcgaaa aactgattca 2220
gagaatttac cgcgggatcg agccgacttt gccaaactgg ttcgcggtca caaagacacg 2280
gaacggcgcc gggggaggaa acaaagttgt tgatgagtgc tacatcccca attacttgct 2340
ccccaaaacc cagcctgagc tccaatgggc atggaccaac atggaacagt acctgtctgc 2400
ctgtttgaat ctcacggagc gtaaacggtt ggtggcgcag catctgacgc acgtgtcgca 2460
gacgcaggag cagaacaaag agaatcagaa tcccaattct gatgcgccgg tgatcagatc 2520
aaaaacttca gccaggtaca tggagctggt cgggtggctc gtggacaagg ggattacctc 2580
ggagaagcag tggatccagg aggaccaggc ctcatacatc tccttcaatg cggcctccaa 2640
ctcgcggtcc caaatcaagg ctgccttgga caatgcggga aagattatga gcctgactaa 2700
aaccgccccc gactacctgg tgggccagca gcccgtggag gacatttcca gcaatcggat 2760
ttataaaatt ttggaactaa acgggtacga tccccaatat gcggcttccg tctttctggg 2820
atgggccacg aaaaagttcg gcaagaggaa caccatctgg ctgtttgggc ctgcaactac 2880
cgggaagacc aacatcgcgg aggccatagc ccacactgtg cccttctacg ggtgcgtaaa 2940
ctggaccaat gagaactttc ccttcaacga ctgtgtcgac aagatggtga tctggtggga 3000
ggaggggaag atgaccgcca aggtcgtgga gtcggccaaa gccattctcg gaggaagcaa 3060
ggtgcgcgtg gaccagaaat gcaagtcctc ggcccagata gacccgactc ccgtgatcgt 3120
cacctccaac accaacatgt gcgccgtgat tgacgggaac tcaacgacct tcgaacacca 3180
gcagccgttg caagaccgga tgttcaaatt tgaactcacc cgccgtctgg atcatgactt 3240
tgggaaggtc accaagcagg aagtcaaaga ctttttccgg tgggcaaagg atcacgtggt 3300
tgaggtggag catgaattct acgtcaaaaa gggtggagcc aagaaaagac ccgcccccag 3360
tgacgcagat ataagtgagc ccaaacgggt gcgcgagtca gttgcgcagc catcgacgtc 3420
agacgcggaa gcttcgatca actacgcaga caggtaccaa aacaaatgtt ctcgtcacgt 3480
gggcatgaat ctgatgctgt ttccctgcag acaatgcgag agaatgaatc agaattcaaa 3540
tatctgcttc actcacggac agaaagactg tttagagtgc tttcccgtgt cagaatctca 3600
acccgtttct gtcgtcaaaa aggcgtatca gaaactgtgc tacattcatc atatcatggg 3660
aaaggtgcca gacgcttgca ctgcctgcga tctggtcaat gtggatttgg atgactgcat 3720
ctttgaacaa taaatgattt aaatcaggta tggctgccga tggttatctt ccagattggc 3780
tcgaggacac tctctctgag ttatcattta aatggcgcgc ccacgtgggt accgcggccg 3840
cggggatcca gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca 3900
gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat 3960
aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg 4020
ggaggtgtgg gaggtttttt cggatcctct agagtcgacc tgcaggca 4068
<210> 116
<211> 2208
<212> DNA
<213> 未知的
<220>
<223> 腺相关病毒
<400> 116
atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60
cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120
gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360
gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420
ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480
aaggcgggcc agcagcctgc aagaaaaaga ttgaattttg gtcagactgg agacgcagac 540
tcagtacctg acccccagcc tctcggacag ccaccagcag ccccctctgg tctgggaact 600
aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg cgccgacgga 660
gtgggtaatt cctcgggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca accacctcta caaacaaatt 780
tccagccaat caggagcctc gaacgacaat cactactttg gctacagcac cccttggggg 840
tattttgact tcaacagatt ccactgccac ttttcaccac gtgactggca aagactcatc 900
aacaacaact ggggattccg acccaagaga ctcaacttca agctctttaa cattcaagtc 960
aaagaggtca cgcagaatga cggtacgacg acgattgcca ataaccttac cagcacggtt 1020
caggtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080
tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140
aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200
cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260
cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320
tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380
cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440
ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500
tcgtggactg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560
ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620
atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680
gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740
accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcaacac acaaggcgtt 1800
cttccaggca tggtctggca ggacagagat gtgtaccttc aggggcccat ctgggcaaag 1860
attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920
caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980
ttcagtgcgg caaagtttgc ttccttcatc acacagtact ccacgggaca ggtcagcgtg 2040
gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100
acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160
tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208
<210> 117
<211> 735
<212> PRT
<213> 未知的
<220>
<223> 腺相关病毒
<400> 117
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 118
<211> 260
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 118
Met Val Ile Met Ser Pro Lys Arg Arg Thr Gln Ala Glu Arg Ala Met
1 5 10 15
Glu Thr Gln Gly Lys Leu Ile Ala Ala Ala Leu Gly Val Leu Arg Glu
20 25 30
Lys Gly Tyr Ala Gly Phe Arg Ile Ala Asp Val Pro Gly Ala Ala Gly
35 40 45
Val Ser Arg Gly Ala Gln Ser His His Phe Pro Thr Lys Leu Glu Leu
50 55 60
Leu Leu Ala Thr Phe Glu Trp Leu Tyr Glu Gln Ile Thr Glu Arg Ser
65 70 75 80
Arg Ala Arg Leu Ala Lys Leu Lys Pro Glu Asp Asp Val Ile Gln Gln
85 90 95
Met Leu Asp Asp Ala Ala Glu Phe Phe Leu Asp Asp Asp Phe Ser Ile
100 105 110
Gly Leu Asp Leu Ile Val Ala Ala Asp Arg Asp Pro Val Leu Arg Glu
115 120 125
Gly Ile Gln Arg Thr Val Glu Arg Asn Arg Phe Val Val Gly Asp Ile
130 135 140
Trp Leu Gly Val Leu Val Ser Arg Gly Leu Ser Arg Asp Asp Ala Glu
145 150 155 160
Asp Ile Leu Trp Leu Ile Phe Asn Ser Val Arg Gly Leu Val Val Arg
165 170 175
Ser Leu Trp Gln Lys Asp Lys Glu Arg Phe Glu Arg Val Arg Asn Ser
180 185 190
Thr Leu Glu Ile Ala Arg Glu Arg Tyr Ala Lys Phe Lys Arg Ser Gly
195 200 205
Gly Gly Gly Pro Thr Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
210 215 220
Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp
225 230 235 240
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Gly Pro Pro Lys Lys
245 250 255
Lys Arg Lys Val
260
<210> 119
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 119
ctccatgccc ttctcctacg cagacacgat 30
<210> 120
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 120
gagatcacca ccacatttcg gccctaccgg 30
<210> 121
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 121
tcccagggaa caactcattc ctgaatcagc 30
<210> 122
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 122
cgtggccatc atactacaag cgcaggtaga 30
<210> 123
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 123
ggccatgggc gtgtagcagc aatgcctgga 30
<210> 124
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 124
aactgaggat tccgacccaa gaggctcaac 30
<210> 125
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 125
gcagatgtca acacataagg cgttcttcca 30
<210> 126
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 126
gactttctga cggagtagcg ccgtgtgagt 30
<210> 127
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 127
ctccaactcg cggagctaaa tcaaggctgc 30
<210> 128
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 128
ccgtctttct gggataggcc acgaaaaagt 30

Claims (83)

1.一种用于AAV产生的工程化细胞,其包含一个或多个稳定整合的核酸分子,所述核酸分子共同包含编码以下每一个的核酸序列:非规范tRNA合成酶;对应非规范tRNA合成酶的非规范tRNA;NC-Rep78;和NC-Rep52;其每一个都可操作地连接至启动子;其中编码NC-Rep78的核酸序列和编码NC-Rep52的核酸序列各自包含是提前终止密码子和对应非规范tRNA的氨基酸密码子两者的密码子。
2.根据权利要求1所述的工程化细胞,其中一个或多个稳定整合的核酸分子包含第一稳定整合的核酸分子,所述第一稳定整合的核酸分子包含编码非规范tRNA合成酶的核酸序列。
3.根据权利要求2所述的工程化细胞,其中非规范tRNA合成酶是吡咯赖氨酰基-tRNA合成酶(pylRS)。
4.根据权利要求3所述的工程化细胞,其中pylRS包含SEQ ID NO:20和21中任一个的氨基酸序列。
5.根据权利要求4所述的工程化细胞,其中PylRS包含SEQ ID NO:21的氨基酸序列。
6.根据权利要求2-5中任一项所述的工程化细胞,其中第一稳定整合的核酸分子进一步包含可操作地连接至启动子的选择标记。
7.根据权利要求1-6中任一项所述的工程化细胞,其中一个或多个稳定整合的核酸分子包含第二稳定整合的核酸分子,所述第二稳定整合的核酸分子包含编码非规范tRNA的核酸序列。
8.根据权利要求1-7中任一项所述的工程化细胞,其中非规范tRNA使H-Lys(Boc)-OH带电。
9.根据权利要求7或权利要求8所述的工程化细胞,其中非规范tRNA是PylT U25C。
10.根据权利要求9所述的工程化细胞,其中PylT U25C包含SEQ ID NO:22的核酸序列。
11.根据权利要求9或权利要求10所述的工程化细胞,其中第二稳定整合的核酸分子包含四个核酸序列,所述四个核酸序列各自包含编码PylT U25C的核酸序列并且各自可操作地连接至启动子。
12.根据权利要求7-11中任一项所述的工程化细胞,其中第二稳定整合的核酸分子进一步包含可操作地连接至启动子的选择标记。
13.根据权利要求1-12中任一项所述的工程化细胞,其中一个或多个稳定整合的核酸分子包含第三稳定整合的核酸分子,所述第三稳定整合的核酸分子包含编码NC-Rep78和NC-Rep52的核酸序列。
14.根据权利要求13所述的工程化细胞,其中:NC-Rep78在位置17处包含提前终止密码子;NC-Rep52在位置233处包含提前终止密码子;或其组合。
15.根据权利要求13或权利要求14所述的工程化细胞,其中非规范tRNA合成酶是pylRS,并且非规范tRNA是PylT U25C。
16.根据权利要求13-15中任一项所述的工程化细胞,其中编码NC-Rep78的核酸序列和编码NC-Rep52的核酸序列编码为单个转录物。
17.根据权利要求16所述的工程化细胞,其中单个转录物包含编码SEQ ID NO:26-27中任一个的氨基酸序列的核酸序列。
18.根据权利要求13-17中任一项所述的工程化细胞,其中第三稳定整合的核酸分子进一步包含:编码NC-Rep40的核酸序列;编码NC-Rep68的核酸序列;或两者。
19.根据权利要求1-18中任一项所述的工程化细胞,其中工程化细胞是HEK293细胞、HeLa细胞、BHK细胞或SB9细胞。
20.一种试剂盒,其包含根据权利要求1-19中任一项所述的工程化细胞。
21.根据权利要求20所述的试剂盒,其进一步包含多核苷酸,所述多核苷酸从5’至3’包含:(i)5’反向末端重复的核酸序列;(ii)多克隆位点;和(iii)3’反向末端重复的核酸序列。
22.根据权利要求22所述的试剂盒,其中多核苷酸是质粒或载体。
23.一种用于AAV产生的方法,所述方法包括使根据权利要求1-19中任一项所述的工程化细胞与非规范氨基酸接触。
24.根据权利要求23所述的方法,其中非规范氨基酸是H-Lys(Boc)-OH。
25.一种用于AAV产生的工程化细胞,其包含一个或多个稳定整合的核酸分子,所述核酸分子共同包含编码以下每一个的核酸序列:Rep52、DA-Rep52、Rep40或DA-Rep40;Rep78、DA-Rep78、Rep68或DA-Rep68;E2A或DA-E2A;E4ORF6或DA-E4ORF6;VARNA或DA-VARNA;VP1或DA-VP1;VP2或DA-VP2;VP3或DA-VP3;AAP;以及L4 100K或DA-L4 100K,和碱基编辑器,每个核酸分子可操作地连接至启动子;其中细胞包含DA-Rep52、DA-Rep40、DA-Rep78、DA-Rep68、DA-E2A、DA-E4ORF6、DA-VP1、DA-VP2、DA-V3和DA-L4100K中至少一个的核酸序列;其中DA-Rep52、DA-Rep40、DA-Rep78、DA-Rep68、DA-E2A、DA-E4ORF6、DA-VP1、DA-VP2、DA-V3和DA-L4100K的核酸序列各自包含修饰密码子。
26.根据权利要求25所述的工程化细胞,其中修饰密码子编码错义密码子,并且其中修饰密码子中胞嘧啶或腺嘌呤的脱氨作用将编码的氨基酸转化为另一种氨基酸。
27.根据权利要求25所述的工程化细胞,其中修饰密码子编码提前终止密码子,并且其中修饰密码子中腺嘌呤的脱氨作用将修饰密码子转化为色氨酸密码子、谷氨酰胺密码子或精氨酸。
28.根据权利要求25所述的工程化细胞,其中修饰密码子编码提前终止密码子,并且其中修饰密码子中胞嘧啶的脱氨作用将编码的氨基酸转化为脯氨酸。
29.根据权利要求25-28中任一项所述的工程化细胞,其中一个或多个稳定整合的核酸分子包含编码一个或多个CTCF绝缘子的核酸序列。
30.根据权利要求25-29中任一项所述的工程化细胞,其中一个或多个稳定整合的核酸分子包含第一稳定整合的核酸分子,所述第一稳定整合的核酸分子包含编码DA-E2A的核酸序列、编码DA-E4ORF6的核酸序列以及编码VARRNA的核酸序列。
31.根据权利要求30所述的工程化细胞,其中第一稳定整合的核酸分子进一步包含编码L4 100K或DA-L4 100K的核酸序列。
32.根据权利要求30或权利要求31所述的工程化细胞,其中第一稳定整合的核酸分子进一步包含可操作地连接至启动子的选择标记。
33.根据权利要求30-32中任一项所述的工程化细胞,其中DA-E2A的核酸序列包含导致一个或多个提前终止密码子的至腺嘌呤或胞嘧啶的一个或多个突变。
34.根据权利要求31-33中任一项所述的工程化细胞,其中编码DA-E2A的核酸序列包含SEQ ID NO:39或40的氨基酸序列。
35.根据权利要求31-34中任一项所述的工程化细胞,其中DA-E2A(SEQ ID NO:39或40)的位置181和/或324对应导致提前终止密码子的至腺嘌呤的突变。
36.根据权利要求31-35中任一项所述的工程化细胞,其中DA-E4ORF6的核酸序列包含导致一个或多个提前终止密码子的至腺嘌呤的一个或多个突变。
37.根据权利要求31-36中任一项所述的工程化细胞,其中编码DA-E4ORF6的核酸序列包含SEQ ID NO:41或42的氨基酸序列。
38.根据权利要求31-37中任一项所述的工程化细胞,其中DA-E4ORF6(SEQ ID NO:41或42)的位置77和/或192对应包含导致提前终止密码子的腺嘌呤的修饰密码子。
39.根据权利要求25-38中任一项所述的工程化细胞,其中一个或多个稳定整合的核酸分子包含第二稳定整合的核酸分子,所述第二稳定整合的核酸分子包含编码DA-Rep52或DA-Rep40的核酸序列、编码DA-Rep78或DA-Rep68的核酸序列、编码VP1或DA-VP1的核酸序列、编码VP2或DA-VP2的核酸序列、以及编码VP3或DA-VP3的核酸序列。
40.根据权利要求39所述的工程化细胞,其中第二整合的核酸分子进一步包含可操作地连接至启动子的选择标记。
41.根据权利要求39-40中任一项所述的工程化细胞,其中第二稳定整合的核酸分子包含编码DA-Rep52或DA-Rep40的核酸序列。
42.根据权利要求41所述的工程化细胞,其中编码DA-Rep52的核酸序列包含SEQ IDNO:43或47的氨基酸序列。
43.根据权利要求41所述的工程化细胞,其中编码DA-Rep40的核酸序列包含SEQ IDNO:44或48的氨基酸序列。
44.根据权利要求39-43中任一项所述的工程化细胞,其中第二稳定整合的核酸分子包含编码DA-Rep78或DA-Rep68的核酸序列。
45.根据权利要求44所述的工程化细胞,其中编码DA-Rep78的核酸序列包含SEQ IDNO:45、49和51中任一个的氨基酸序列。
46.根据权利要求45所述的工程化细胞,其中编码DA-Rep68的核酸序列包含SEQ IDNO:46、50或52的氨基酸序列。
47.根据权利要求39-46中任一项所述的工程化细胞,其中第二稳定整合的核酸分子包含编码Rep52或DA-Rep52;Rep40或DA-Rep40;Rep68或DA-Rep68;以及Rep78或DA-Rep78的氨基酸序列。
48.根据权利要求47所述的工程化细胞,其中编码Rep52或DA-Rep52;Rep40或DA-Rep40;Rep68或DA-Rep68;以及Rep78或DA-Rep78的核酸序列包含SEQ ID NO:53-55、113-115中任一个的核酸序列。
49.根据权利要求48所述的工程化细胞,其中编码DA-Rep52、DA-Rep40、DA-Rep68和DA-Rep78的核酸序列包含导致一个或多个提前终止密码子的至腺嘌呤或胞嘧啶的一个或多个突变。
50.根据权利要求49所述的工程化细胞,其中核苷酸序列中的一个腺嘌呤突变在对应DA-Rep78(SEQ ID NO:45、49和51)的氨基酸位置67、262和/或319的位置处。
51.根据权利要求39-50中任一项所述的工程化细胞,其中第二稳定整合的核酸分子进一步包含编码一个或多个sgRNA的核酸序列。
52.根据权利要求51所述的工程化细胞,其中一个或多个sgRNA各自包含与含有至腺嘌呤或胞嘧啶的一个或多个突变的核酸序列互补的核酸序列。
53.根据权利要求51或权利要求52所述的工程化细胞,其中一个或多个sgRNA各自包含SEQ ID NO:56-81中任一个的核酸序列。
54.根据权利要求51-53中任一项所述的工程化细胞,其中一个或多个sgRNA可操作地连接至化学诱导型启动子。
55.根据权利要求54所述的工程化细胞,其中化学诱导型启动子选自由pTRE3G;pTREtight;或含有VanR、TtgR、PhlF、CymR或Gal4 UAS操纵子序列中至少一个的启动子组成的组。
56.根据权利要求55所述的工程化细胞,其中编码化学诱导型启动子的核酸序列是SEQID NO:1和2中任一个或包含SEQ ID NO:86-91中任一个。
57.根据权利要求39-56中任一项所述的工程化细胞,其中第二稳定整合的核酸分子包含编码VP1或DA-VP1、VP2或DA-VP2、以及VP3或DA-VP3的核酸序列。
58.根据权利要求57所述的工程化细胞,其中编码VP1的核酸序列包含SEQ ID NO:14的氨基酸序列。
59.根据权利要求58所述的工程化细胞,其中编码DA-VP1的核酸序列包含SEQ ID NO:99或102的氨基酸序列。
60.根据权利要求59或权利要求60所述的工程化细胞,其中编码VP2的核酸序列包含SEQ ID NO:15的氨基酸序列。
61.根据权利要求57或权利要求59所述的工程化细胞,其中编码DA-VP2的核酸序列包含SEQ ID NO:100或103的氨基酸序列。
62.根据权利要求57或权利要求61所述的工程化细胞,其中编码VP3的核酸序列包含SEQ ID NO:16的氨基酸序列。
63.根据权利要求57或权利要求60所述的工程化细胞,其中编码DA-VP3的核酸序列包含SEQ ID NO:101或104的氨基酸序列。
64.根据权利要求57-63中任一项所述的工程化细胞,其中第二稳定整合的核酸分子包含编码AAP的核酸序列。
65.根据权利要求64所述的工程化细胞,其中编码AAP的核酸序列包含SEQ ID NO:17的氨基酸序列。
66.根据权利要求25-65中任一项所述的工程化细胞,其中一个或多个稳定整合的核酸分子包含第三稳定整合的核酸分子,所述第三稳定整合的核酸分子包含编码转录激活子的核酸序列和编码碱基编辑器的核酸序列,所述编码转录激活子的核酸序列当在小分子诱导物的存在下表达时,结合至工程化细胞的化学诱导型启动子。
67.根据权利要求66所述的工程化细胞,其中第三稳定整合的核酸分子进一步包含可操作地连接至启动子的选择标记。
68.根据权利要求66或67所述的工程化细胞,其中碱基编辑器是腺嘌呤碱基编辑器(ABE)或胞嘧啶碱基编辑器(CBE)。
69.根据权利要求68所述的工程化细胞,其中ABE是Cas9 ABE或Cas13 ABE,或其中CBE是Cas9-CBE或Cas13 CBE。
70.根据权利要求69所述的工程化细胞,其中Cas9 ABE由包含SEQ ID NO:82或83的氨基酸序列编码。
71.根据权利要求70所述的工程化细胞,其中Cas13 ABE由包含SEQ ID NO:84或85的氨基酸序列编码。
72.根据权利要求66-71中任一项所述的工程化细胞,其中编码ABE的核酸序列可操作地连接至第三化学诱导型启动子。
73.根据权利要求66-72中任一项所述的工程化细胞,其中第三稳定整合的核酸分子进一步包含化学诱导型启动子,所述化学诱导型启动子选自由pTRE3G;pTREtight;或含有VanR、TtgR、PhlF、CymR或Gal4 UAS操纵子序列中至少一个的启动子组成的组。
74.根据权利要求73所述的工程化细胞,其中编码第三化学诱导型启动子的核酸序列是SEQ ID NO:1和2中任一个或包含SEQ ID NO:86-91中任一个。
75.根据权利要求66-74中任一项所述的工程化细胞,其中转录激活子选自由TetOn-3G、TetOn-V16、TetOff-Advanced、VanR-VP16、TtgR-VP16、PhlF-VP16和cumate cTA和rcTA组成的组。
76.根据权利要求66-75中任一项所述的工程化细胞,其中小分子诱导物选自由多西环素、香草酸盐、根皮素、雷帕霉素、脱落酸、赤霉酸乙酰氧基甲酯和cumate组成的组。
77.根据权利要求66-76中任一项所述的工程化细胞,其中转录激活子是TetOn3G,并且小分子诱导物是多西环素。
78.根据权利要求25-77中任一项所述的工程化细胞,其中工程化细胞是HEK293细胞或HeLa细胞。
79.一种试剂盒,其包含根据权利要求25-78中任一项所述的工程化细胞。
80.根据权利要求79所述的试剂盒,其进一步包含多核苷酸,所述多核苷酸从5’至3’包含:(i)5’反向末端重复的核酸序列;(ii)多克隆位点;和(iii)3’反向末端重复的核酸序列。
81.根据权利要求80所述的试剂盒,其中多核苷酸是质粒或载体。
82.一种用于AAV产生的方法,所述方法包括使根据权利要求25-78中任一项所述的工程化细胞与结合至化学诱导型启动子的小分子诱导物接触。
83.根据权利要求82所述的方法,其中小分子诱导物选自由多西环素、香草酸盐、根皮素、雷帕霉素、脱落酸、赤霉酸乙酰氧基甲酯和cumate组成的组。
CN202280044018.4A 2021-04-21 2022-04-21 用于腺相关病毒产生的稳定产生系统 Pending CN117529558A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163177760P 2021-04-21 2021-04-21
US63/177,760 2021-04-21
PCT/US2022/025755 WO2022226189A1 (en) 2021-04-21 2022-04-21 Stable production systems for adeno-associated virus production

Publications (1)

Publication Number Publication Date
CN117529558A true CN117529558A (zh) 2024-02-06

Family

ID=83723162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280044018.4A Pending CN117529558A (zh) 2021-04-21 2022-04-21 用于腺相关病毒产生的稳定产生系统

Country Status (11)

Country Link
US (1) US20240360422A1 (zh)
EP (1) EP4326883A1 (zh)
JP (1) JP2024515369A (zh)
KR (1) KR20240019759A (zh)
CN (1) CN117529558A (zh)
AU (1) AU2022262365A1 (zh)
BR (1) BR112023021963A2 (zh)
CA (1) CA3217226A1 (zh)
IL (1) IL307830A (zh)
MX (1) MX2023012518A (zh)
WO (1) WO2022226189A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL312487A (en) * 2021-11-09 2024-07-01 Asimov Inc Stable production systems for adeno-associated virus vector production
WO2024102977A1 (en) * 2022-11-10 2024-05-16 Asimov Inc. Stable production systems for adeno-associated virus production

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002532058A (ja) * 1998-08-20 2002-10-02 セル ジェネシス インコーポレイテッド 組換え遺伝子産物の産生の間の細胞傷害性を調節するためのサプレッサーtRNAの使用
WO2005080581A2 (en) * 2004-02-17 2005-09-01 University Of Florida Research Foundation, Inc. Insulated herpesvirus-derived gene expression cassettes for sustained and regulatable gene expression
WO2010114948A2 (en) * 2009-04-02 2010-10-07 University Of Florida Research Foundation, Inc. An inducible system for highly efficient production of recombinant adeno-associated virus (raav) vectors
JP6532404B2 (ja) * 2012-09-24 2019-06-19 メディミューン リミテッド 細胞株
US11702673B2 (en) * 2018-10-18 2023-07-18 University Of Florida Research Foundation, Incorporated Methods of enhancing biological potency of baculovirus system-produced recombinant adeno-associated virus
CN112888426A (zh) * 2018-10-25 2021-06-01 百特奥尔塔公司 Aav三质粒系统
EP4021945A4 (en) * 2019-08-30 2023-11-15 The General Hospital Corporation DNA-BASED COMBINATORIAL ADENINE AND CYTOSINE EDITORS
KR20220076510A (ko) * 2019-10-08 2022-06-08 트러스티스 오브 보스톤 칼리지 다수의 서로 다른 비천연 아미노산을 함유하는 단백질 및 이러한 단백질의 제조 및 사용 방법

Also Published As

Publication number Publication date
US20240360422A1 (en) 2024-10-31
EP4326883A1 (en) 2024-02-28
KR20240019759A (ko) 2024-02-14
AU2022262365A1 (en) 2023-11-09
WO2022226189A1 (en) 2022-10-27
MX2023012518A (es) 2024-02-08
CA3217226A1 (en) 2022-10-27
AU2022262365A9 (en) 2023-11-16
BR112023021963A2 (pt) 2024-01-16
IL307830A (en) 2023-12-01
JP2024515369A (ja) 2024-04-09

Similar Documents

Publication Publication Date Title
Chejanovsky et al. Mutagenesis of an AUG codon in the adeno-associated virus rep gene: effects on viral DNA replication
AU2017248840B2 (en) Methods of enhancing biological potency of baculovirus system-produced recombinant adeno-associated virus
Surosky et al. Adeno-associated virus Rep proteins target DNA sequences to a unique locus in the human genome
CN117529558A (zh) 用于腺相关病毒产生的稳定产生系统
JP2023081975A (ja) アデノ随伴ウイルスベクターの産生方法
US20040087026A1 (en) Host cells for packing a recombinant adeno-associated virus (raav), method for the production and use thereof
EP3426787A1 (en) Aav-mediated expression using a synthetic promoter and enhancer
WO2012158757A1 (en) Proviral plasmids for production of recombinant adeno-associated virus
JP2022513359A (ja) ウイルスベクターを調製するための組成物および方法
CA2269661A1 (en) Recombinase-activatable aav packaging cassettes for use in the production of aav vectors
US20210369869A1 (en) Nucleic acid molecules containing spacers and methods of use thereof
Berns et al. Adeno-associated virus (AAV) vectors in gene therapy
CN116411024A (zh) 用于生产重组腺相关病毒的质粒系统
JP2022537410A (ja) ファージ複製起点を用いたベクターの産生
Tullis et al. Efficient replication of adeno-associated virus type 2 vectors: a cis-acting element outside of the terminal repeats and a minimal size
Hirsch et al. AAV-mediated gene editing via double-strand break repair
AU2020316034A1 (en) Synthetic genetic elements for biomanufacture
WO2004106360A2 (en) Viral vectors with improved properties
AU5884498A (en) A conditional replication and expression system
AU775679B2 (en) Use of suppressor tRNA&#39;s to regulate cytotoxicity during the production of recombinant gene products
Gonçalves et al. Targeted chromosomal insertion of large DNA into the human genome by a fiber-modified high-capacity adenovirus-based vector system
Xiao et al. Adeno-associated virus (AAV) vectors for gene transfer
Trempe Packaging systems for adeno-associated virus vectors
WO2024102977A1 (en) Stable production systems for adeno-associated virus production

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination