CN114981442A - 用于生产重组aav的新颖组合物及方法 - Google Patents

用于生产重组aav的新颖组合物及方法 Download PDF

Info

Publication number
CN114981442A
CN114981442A CN202080084068.6A CN202080084068A CN114981442A CN 114981442 A CN114981442 A CN 114981442A CN 202080084068 A CN202080084068 A CN 202080084068A CN 114981442 A CN114981442 A CN 114981442A
Authority
CN
China
Prior art keywords
gly
pro
ser
ala
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080084068.6A
Other languages
English (en)
Inventor
A.M.沃德
H.陈
A.J.康
T-H.陈
R.T.苏罗斯基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sangamo Therapeutics Inc
Original Assignee
Sangamo Therapeutics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sangamo Therapeutics Inc filed Critical Sangamo Therapeutics Inc
Publication of CN114981442A publication Critical patent/CN114981442A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0601Invertebrate cells or tissues, e.g. insect cells; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/75Vector systems having a special element relevant for transcription from invertebrates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/50Vectors comprising a special translation-regulating system utilisation of non-ATG initiation codon

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Virology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

本文提供核酸构建体、宿主昆虫细胞及用于以高产率生产具有高效能的重组AAV衣壳的方法。

Description

用于生产重组AAV的新颖组合物及方法
交叉引用相关申请
本申请要求2019年12月4日提交的美国临时申请62/943,715的优先权,其内容通过引用整体并入本文。
序列表
本申请包含已以ASCII格式电子提交的序列表。序列表在此通过引用整体并入。ASCII副本创建于2020年11月30日,名为025297_WO015_SL.txt,大小为111,015字节。
【背景技术】
腺相关病毒(adeno-associated virus,AAV)系属于细小病毒科(Parvoviridae)及依赖细小病毒属(Dependoparvovirus)的小型无包膜病毒。AAV系由单股DNA基因体所构成,该基因体会被封装至衣壳中,该等衣壳系由三种衣壳蛋白-病毒蛋白(viral protein,VP)1、VP2及VP3以大约1:1:10的莫耳比组装而成(Berns及Parrish(2007)Parvoviridae inFields Virology(Knipe及Howley编,第5版,Philadelphia:Wolters Kluwer Health/Lippincott Williams&Wilkins);Wang等人,Nat Rev Drug Discov.(2019)18(5):358-78)。衣壳蛋白由单一衣壳(cap)基因编码且藉由替代性剪接及使用差异密码子所产生(同上)。VP1系最大衣壳蛋白(81.6kD)。VP2(66.6kD)系VP1的N端截短形式。VP3(59.9kD)系VP2的N端截短形式。参见例如Cecchini等人,Hum Gene Ther.(2011)22:1021-30。
已集中探索重组AAV(recombinant AAV,rAAV)作为用于人类中的基因疗法及DNA疫苗的载体。对于哺乳动物细胞中的rAAV产生,需要辅助病毒(例如腺病毒、牛痘或疱疹病毒)。多年来,已进行若干修饰以促进产生rAAV,包括(1)鉴别及选殖最小组辅助蛋白(腺病毒E1、E2A、E4及VA);(2)提供反式的AAV Rep(Rep78、Rep68、Rep52及Rep40)及衣壳蛋白;及(3)研发允许封装由AAV反向末端重复序列(Inverted Terminal Repeat,ITR)侧接的DNA序列的转基因系统。(Samulski等人,J Virol.(1989)63(9):3822-8)。当此等三种组分引入哺乳动物细胞中时,含有所关注的转基因的rAAV可以容易地被纯化。由此产生的重组AAV已用于临床试验中(Clement及Grieger,Mol Ther Methods Clin Dev.(2016)3:16002)。
针对较大临床试验及商业化的按比例放大rAAV生产的需求导致开发出基于昆虫细胞的生产系统,该等生产系统利用杆状病毒载体表现Rep及衣壳蛋白且携带针对含有转基因的AAV载体基因体的编码序列,该含有转基因的AAV载体基因体封装于rAAV衣壳中。基于昆虫细胞的重组AAV(rAAV)的制造提供优于基于哺乳动物细胞的rAAV制造的若干优点,包括非黏附细胞的可扩展性及归因于使用无血清生长条件的成本节省。此类系统亦不需要腺病毒辅助功能(参见例如Urabe等人,Hum Gene Ther.(2002)13:1935-43;Urabe等人,JVir.(2006)80(4):1874-85;Chen等人,Mol Ther.(2008)16(5):924-30;Smith等人,MolTher.(2009)17(11):1888-96;及Mietzsch等人,Hum Gene Ther Methods(2017)28(1):15-22)。尽管杆状病毒-昆虫细胞系统已成功地在多个规模下用于rAAV生产,但已观察到,与在哺乳动物细胞中产生的rAAV相比,在昆虫细胞中产生的rAAV具有降低的VP1含量(例如,VP1:VP2:VP3的比率为大约1:1:30至1:1:60)且因此降低的效能(参见例如,Urabe等人,2002,同上;Kohlbrenner等人,Mol Ther.(2005)12(6):1217-25;Urabe等人,2006,同上;Aslanidi等人,Proc Natl Acad Sci USA(2009)106(13):5059-64;Kondratov等人,MolTher.(2017)25(12):2661-75及Mietzsch等人,同上)。已做出若干努力以藉由修饰VP1的起始密码子情况来提高衣壳比率(参见,例如Kondratov等人,同上;Mietzsch等人,同上)。
因此,仍需要用于在工业规模下生产rAAV的经改良的杆状病毒-昆虫细胞系统。
【发明内容】
本发明提供用于以高产率生产强效重组AAV的杆状病毒-昆虫细胞系统。在一个态样中,本发明提供一种昆虫细胞(例如,Sf9或Sf21细胞),其包含:包含Rep78的表达盒的第一杆状病毒载体及包含Rep52的表达盒的第二杆状病毒载体,其中该第一载体及该第二载体进一步包含(i)分别,VP1的表达盒及VP2/VP3的表达盒;或(ii)分别,VP2/VP3的表达盒及VP1的表达盒。在一些实施例中,第一载体及第二载体中的一或两者稳定地整合至昆虫细胞的基因体中。
在一些实施例中,Rep78表达盒及Rep52表达盒包含一致昆虫启动子。在一些实施例中,Rep78表达盒包含Rep78编码序列的非典型起始密码子,其中该密码子任选地为ACG、TTG、GTG或CTG。
在一些实施例中,VP1表达盒及VP2/VP3表达盒包含一致昆虫启动子。在一些实施例中,VP1、VP2及VP3蛋白质包含来自相同AAV血清型或来自超过一种AAV血清型的氨基酸序列。在某些实施例中,VP1、VP2及/或VP3蛋白质包含来自AAV1、AAV2、AAV3(例如AAV3B)、AAV6及/或AAV9的氨基酸序列。在某些实施例中,Rep78及Rep52蛋白质源于来自VP1、VP2及/或VP3蛋白质的不同AAV血清型。
在一些实施例中,Rep78、Rep52、VP1及VP2/VP3表达盒各自包含选自多面体启动子、IE-1启动子及p10启动子的昆虫启动子。
本文中的昆虫细胞可进一步包含重组AAV基因体的编码序列,其中该重组AAV基因体包含处于哺乳动物启动子的转录控制下的所关注的转基因的表达盒及处于两个末端上的AAV反向末端重复序列(ITR)。在一些实施例中,重组AAV基因体的编码序列位于第一载体或第二载体上,或位于第三载体上。所关注的转基因可编码例如治疗蛋白,其包括(但不限于):功能在基因疾病(例如溶酶体贮积病或血友病)中缺失或不足的蛋白质,诸如酶(用于酶替代疗法)及血凝因子(用作替代因子);及蛋白质或调节基因表现(例如锌指蛋白(zincfinger protein,ZFP)转录因子)。所关注的转基因亦可编码基因编辑蛋白质,诸如锌指核酸酶、ZFP脱胺酶、ZFP重组酶、TALEN、CRISPR Cas蛋白质及CRISPR Cpf蛋白质。转基因亦可编码干扰RNA分子,诸如小发夹RNA。
在一些实施例中,VP1蛋白质及/或VP2蛋白质相对于野生型VP1及VP2蛋白质,分别包含在残基157、162、164、179、188、194、196、197、200及201(根据SEQ ID NO:1编号)处的两个或更多个突变。如本文中所使用,「根据SEQ ID NO:1编号」意谓SEQ ID NO:1中的氨基酸残基位置,或不同VP1序列(例如,来自除AAV6以外的血清型的VP1序列)中的对应氨基酸残基位置。在一些实施例中,VP1蛋白质及/或VP2蛋白质包含选自由以下组成的群的两个或更多个突变:S157A、T162S、Q164A、S179T、L188I、T194A、A196S、A197G、P200S及T201L(根据SEQID NO:1编号)。在其他实施例中,VP1蛋白质及/或VP2蛋白质包含所有此等十个突变。
在一些实施例中,VP1蛋白质相对于野生型VP1蛋白质进一步包含在残基67、81、84、85及92处的一或多个突变(根据SEQ ID NO:1编号)。在某些实施例中,VP1蛋白质包含选自由以下组成的群的一或多个突变:A67E、Q81R、K84D、A85S及R92K。在其他实施例中,VP1蛋白质包含所有此等五个突变。
在一些实施例中,本文所揭示的VP1蛋白质及VP2蛋白质分别与AAV6的VP1蛋白质及VP2蛋白质一致,但突变除外。在特定实施例中,VP1蛋白质及/或VP2蛋白质源于AAV6且相对于野生型AAV6VP1及VP2蛋白质分别包含突变S157A、T162S、Q164A、S179T、L188I、T194A、A196S、A197G、P200S及T201L。
在一些实施例中,表现VP1的载体亦包含用于组装活化蛋白质(assembly-activating protein,AAP)的表达盒,其中AAP相对于野生型AAP蛋白质包含在残基8、10、12、17、21及22(根据SEQ ID NO:10编号)处的一或多个突变。如本文中所使用,「根据SEQ IDNO:10编号」意谓SEQ ID NO:10中的氨基酸残基位置,或不同AAP序列(例如,来自除AAV6以外的血清型的AAP序列)中的对应氨基酸残基位置。在某些实施例中,AAP包含选自由以下组成的群的一或多个(例如全部)突变:P8Q、H10L、L12Q、Q17P、L21Q及L22V。在特定实施例中,AAP与AAV6的野生型AAP一致,但AAP突变除外。
在特定实施例中,VP1表达盒包含具有或不具有第一氨基酸的SEQ ID NO:7的编码序列(例如SEQ ID NO:14的核苷酸18至151)。在其他实施例中,衣壳表达盒包含SEQ ID NO:14的10个或更多个(例如20个或更多个、30个或更多个、40个或更多个、50个或更多个、75个或更多个、100个或更多个、125个或更多个或150个或更多个)连续核苷酸或整个核苷酸序列。
在一些实施例中,VP1蛋白质相对于野生型VP1蛋白质包含在残基81、84、85及92处的一或多个突变(根据SEQ ID NO:1编号)。在一些实施例中,VP1蛋白质包含选自由以下组成的群的一或多个突变:Q81R、K84D、A85S及R92K。在其他实施例中,VP1蛋白质包含所有此等四个突变。在特定实施例中,VP1蛋白质进一步包含在残基67处的突变,例如A67E突变。在一些实施例中,VP1蛋白质与AAV6的VP1蛋白质一致,但(一或多个)突变除外。在某些实施例中,VP1蛋白质相对于野生型AAV6 VP1包含突变A67E、Q81R、K84D、A85S及R92K。
在本发明昆虫细胞AAV生产系统的特定实施例中,VP1包含具有或不具有第一氨基酸残基的SEQ ID NO:1、SEQ ID NO:7或SEQ ID NO:16;VP2包含SEQ ID NO:1或SEQ ID NO:7的氨基酸残基138至736或139至736,或包含具有或不具有第一氨基酸残基的SEQ ID NO:18;VP3包含SEQ ID NO:1的氨基酸残基204至736或205至736或SEQ ID NO:7的氨基酸残基203至736或204至736,或包含具有或不具有第一氨基酸残基的SEQ ID NO:19。
在一些实施例中,VP1包含具有或不具有第一氨基酸残基的SEQ ID NO:24;VP2包含SEQ ID NO:24的氨基酸残基138至736或139至736;及VP3包含SEQ ID NO:24的氨基酸残基203至736或204至736。
在一些实施例中,VP1包含具有或不具有第一氨基酸残基的SEQ ID NO:25;VP2包含SEQ ID NO:25的氨基酸残基138至735或139至735;及VP3包含SEQ ID NO:25的203至735或204至735。
在一些实施例中,VP1包含具有或不具有第一氨基酸残基的SEQ ID NO:26;VP2包含SEQ ID NO:26的氨基酸残基138至736或139至736;及VP3包含SEQ ID NO:26的氨基酸残基203至736或204至736。
在一些实施例中,VP1包含具有或不具有第一氨基酸残基的SEQ ID NO:27;VP2包含SEQ ID NO:27的氨基酸残基138至736或139至736;及VP3包含SEQ ID NO:27的氨基酸残基203至736或204至736。
在一些实施例中,Rep78包含具有或不具有第一氨基酸残基的SEQ ID NO:21;及/或Rep52包含具有或不具有第一氨基酸残基的SEQ ID NO:23。
此等实施例涵盖辅助蛋白(Rep78、Rep52、VP1、VP2及VP3),该等辅助蛋白不含有由编码序列编码的第一氨基酸残基(亦即由起始密码子编码的氨基酸),因为产生细胞裂解掉该第一氨基酸残基。此等实施例亦涵盖第一氨基酸残基由非典型起始密码子编码的辅助蛋白,诸如本文所描述或此项技术中另外已知的彼等。
在另一态样中,本发明亦提供一种在本文中的昆虫细胞中产生的重组AAV病毒粒子、其在治疗需要转基因的人类患者中的用途及其在制造用于此类治疗的药剂中的用途,以及医药组合物,其包含重组AAV病毒粒子和药学上可接受的载体。
在另一态样中,本发明提供一种生产重组AAV病毒粒子的方法,其包含提供本文中的昆虫细胞;在允许重组AAV基因体的表现及重组AAV基因体在包含VP1、VP2及VP3蛋白质的AAV衣壳内的封装的条件下培养该昆虫细胞;及自培养物分离该重组AAV。还提供了在昆虫细胞内用于制造AAV病毒粒子的表达盒的组合(例如组合物)。
在以下的具体实施方式中本发明的其他特征、目标及优势显而易见。然而,应理解,具体实施方式虽然指示本发明的实施例及态样,但仅为了说明而非限制提供。对于熟习此项技术者而言,在本发明的范畴内的各种改变及修饰将自具体实施方式变得显而易见。
【图式简单说明】
图1A展示在氨基酸残基155与207之间的来自AAV血清型3B、5、6、8及9的VP1/VP2氨基酸序列的比对(基于共通序列编号)。对以SDS-PAGE凝胶为核心的蛋白水解裂解产物进行N端艾德曼降解测序(N-terminal Edman degradation sequencing),以鉴别AAV6VP1/VP2中的蛋白水解裂解位点。裂解位点定位至残基G190E191。使用Geneious软件包及ClustalW比对的预设设置产生多序列比对。VP3起始位点由残基205处的三角形指示。图1A按出现的次序分别揭示SEQ ID NO:28至33。
图1B展示在氨基酸残基155与205之间的来自AAV血清型1、2、3B、4及6至11的VP1/VP2氨基酸序列的比对(基于共通序列编号)。使用Geneious软件包及ClustalW比对的预设设置产生多序列比对。图1B按出现的次序分别揭示SEQ ID NO:34至38、73及39至43。
图1C为比较在氨基酸残基158至203之间的来自AAV血清型1、4、6、7、8及11的对应氨基酸位置的表,如图1B中所比对。该表指示可防止此等血清型中的蛋白水解裂解的氨基酸突变。氨基酸残基编号系基于图1B中所示的共通序列。
图2显示AAV9 VP1/VP2(SEQ ID NO:4)的45-氨基酸延伸部分取代AAV6 VP1/VP2序列(SEQ ID NO:3)中的对应区域,此消除所得嵌合VP1/VP2蛋白质(「AAV6/9VP1/VP2」)的蛋白水解分裂。该图展示经移植的AAV9 cap核苷酸序列与在AAV9移植体中经替换的AAV6 cap核苷酸序列的比对;箭头「A」指示AAP起始密码子。AAV9移植体:AAV6 cap基因含有来自AAV9cap基因的序列的杆状病毒辅助载体。图2按出现的次序分别揭示SEQ ID NO:44至45。
图3A及图3B说明AAV6/9VP1/VP2的变异体防止裂解。图3A:AAV6/9VP1/VP2的变异体1、2、3及4的序列比对(根据SEQ ID NO:1编号)。图3B:AAV6、AAV9移植体、变异体1、变异体2、变异体3及变异体4的cap/AAP核苷酸序列与AAP氨基酸序列(呈矩形)的部分比对。AAV9移植体的AAP氨基酸序列相对于指定区域中的AAP6的突变具有六个突变(P8Q、H10L、L12Q、Q17P、L21Q及L22V),而变异体1至3的AAP氨基酸序列各自具有仅两个突变(L21Q及L22V)。变异体4在指定区域中具有天然AAP6序列。图3A揭示SEQ ID NO:46至51及图3B揭示SEQ IDNO:52、67、53、68、54、69、55、70、56、71、57及72,其皆分别地按出现的次序。
图4A展示在指定区域中的来自AAV血清型1、2、3B、4及6至11的组装活化蛋白质(AAP)氨基酸序列的比对。氨基酸残基编号系基于共通序列。使用Geneious软件包及ClustalW比对的预设设置产生多序列比对。图4A按出现的次序分别揭示SEQ ID NO:58至62、8、63至64、9及65至66。
图4B展示(i)AAV1、AAV2、AAV4、AAV6、AAV7、AAV8、AAV10或AAV11与(ii)AAV9或AAV3B之间的指定AAP区域(共通编号)中的氨基酸差异。氨基酸残基编号系基于图4A中所示的共通序列。
图5系展示用于在昆虫细胞中生产AAV的两种杆状病毒辅助系统的示意图。展示Rep78、Rep52、VP1及VP2/VP3编码序列的起始密码子以及其转录方向。两种系统均涉及两种杆状病毒载体。包含由一对AAV反向末端重复序列(ITR)侧接的所关注的基因(gene ofinterest,GOI)的重组AAV基因体的编码序列可以置放独立杆状病毒载体上,或置放于与Rep52编码序列相同的载体上。
【发明详述】
本发明提供用于以高产率生产强效rAAV衣壳的改良的杆状病毒-昆虫细胞系统及相关组合物。本发明的rAAV生产系统利用双重杆状病毒辅助载体。第一载体携带Rep78的表达盒及VP1或VP2/VP3的表达盒,而第二载体携带Rep52的表达盒及(一或多个)剩余衣壳蛋白的表达盒(若该第一载体表现VP1,则为VP2/VP3,若该第一载体表现VP2/VP3,则为VP1)。在一些实施例中,Rep78卡匣使用与Rep52卡匣中的启动子一致(或具有类似强度)的启动子,且其任选地具有次佳起始密码子,使得Rep78及Rep52蛋白质可以优化学计量产生。在其他实施例中,Rep78卡匣使用比Rep52卡匣中的启动子弱的启动子,但其具有典型起始密码子,使得可以优化学计量产生Rep78及Rep52蛋白质。
在一些实施例中,VP1卡匣使用与VP2/VP3卡匣中的启动子一致(或具有类似强度)的启动子,且其任选地具有次佳起始密码子,使得可以优化学计量产生三种衣壳蛋白。在其他实施例中,VP1卡匣使用比VP2/VP3卡匣中的启动子弱的启动子,但其具有典型起始密码子,使得可以优化学计量产生衣壳蛋白。
为减少转导产生rAAV的细胞所需的杆状病毒载体的数目,rAAV基因体的编码序列亦可包括于两种载体中的一者中,例如,于第二载体(亦即,携带Rep52表达盒的载体)中。
本发明人已发现,自独立卡匣表现Rep78及Rep52及自独立卡匣表现VP1及VP2/VP3大大地提高了昆虫细胞系统中产生的rAAV的效能及/或产率。如以下工作实例中所表明,与衣壳蛋白由主要的单载体系统产生的生产系统相比,本发明的系统产生效能及/或产率多倍增加的rAAV,其中衣壳蛋白由单个Cap基因产生且Rep蛋白质由单个Rep基因产生。
本发明的生产系统可以用于生产任何血清型的rAAV,诸如AAV1、AAV2、AAV3、AAV3A、AAV3B、AAV4、AAV5、AAV6、AAV7、AAV8、AAV8.2、AAV9、AAVrh10或经工程改造的血清型。衣壳蛋白的编码序列可源于任何所要血清型。
本发明的系统亦可以用于生产假型的rAAV,诸如AAV2/8、AAV2/5或AAV2/6。藉由「假型」、「假型化」或「交叉封装」的rAAV意指一种重组AAV,其衣壳经另一种AAV血清型的衣壳替换,以例如改变病毒的转导功效或向性概况(参见例如Balaji等人,J Surg Res.(2013)184(1):691-8)。例如,AAV2/8假型化AAV含有AAV8的衣壳及源于AAV2的ITR。
本发明的系统亦可用于生产嵌合或杂合AAV。藉由「嵌合」
或「杂合」rAAV意指一种重组AAV,其衣壳由源于不同血清型的衣壳蛋白组装及/或其衣壳蛋白为具有源于不同血清型的序列的嵌合蛋白(例如血清型1及2;参见,例如Hauck等人,Mol Ther.(2003)7(3):419-25)。
I.衣壳蛋白表达盒
在哺乳动物细胞中,cap基因在哺乳动物p40启动子控制下会转录成两种mRNA。一种mRNA转译为VP1,且另一种mRNA转译为VP2及VP3。VP2的转译起始密码子为ACG,这是一种常引起核糖体跳跃的次佳起始密码子,而VP3的起始密码子为典型ATG。经由替代性剪接与弱VP2起始密码子的相互作用,cap基因以1:1:10的表观蛋白质比产生VP1、VP2及VP3(参见,例如Berns及Parrish,同上)。
先前昆虫细胞系统不能以高产率及效能生产rAAV部分系归因于此等系统不能实现衣壳蛋白的优化学计量。在本发明的rAAV生产系统中,可用两个独立表达盒表现VP1及VP2/VP3。使用VP1及VP2/VP3的独立表达盒意外地导致高产率生产强效rAAV。
在一些实施例中,VP1的表达盒及VP2/VP3的表达盒系使用相同或类似强度的昆虫启动子。例如,两个卡匣可使用一致的启动子。可以使用的昆虫启动子的实例为p10启动子、p35启动子、多面体(polyh)启动子、E1启动子、ΔE1启动子、4×Hsp27 EcRE+最小Hsp70启动子及基础启动子。
表达盒可含有额外调节组件,诸如Kozak序列;转录起始及终止位点(经修饰或未经修饰);mRNA剪接位点(经修饰或未经修饰,在多肽编码序列内或与其相邻;及控制mRNA的剪接、核输出、定位、稳定或转译的病毒、真核或原核RNA组件(例如,土拨鼠肝炎病毒转录后调节组件(posttranscriptional regulatory element,WPRE)(Zufferey等人,J Virol.(1999)73(4):2886-92)、MMLV/MPMV、真核组成型转运组件(constitutive transportelement,CTE)(Li等人,Nature(2006)443(7108):234-7)、RNA密码子(Jambhekar及DeRisi,RNA(2007)13(5):625-42)及增加转译效率的Ω或其他5'-UTR RNA组件)。
在一些实施例中,衣壳蛋白的编码序列可经修饰以进一步增强AAV产率及效能。例如,编码序列可经密码子修饰以增加昆虫细胞中的mRNA稳定性、转译效率及/或DNA载体稳定性。编码序列的起始密码子区域亦可经修饰以进一步微调衣壳蛋白的表现量;例如,VP1起始密码子可自野生型ATG变成次佳密码子,诸如VP2的起始密码子(ACG),使得VP1表现量较低。VP1起始密码子亦可变成其他次佳起始密码子,诸如TTG、CTG及GTG。
为了避免自VP1表达盒产生VP2及VP3或任何其他副产物肽,VP1编码序列可经突变以移除嵌入的VP2及VP3 ORF、任何超框ATG位点、任何非所要剪接受体位点、任何隐蔽启动子序列及/或任何去稳定化组件的天然起始密码子(参见,例如Smith等人,同上)。
在一些实施例中,本发明的生产系统生产rAAV6。AAV6 VP1蛋白质的完整氨基酸序列展示如下,其中VP2的起始位点(T)及VP3的突变起始位点(自天然M变化)为粗体且带下划线:
Figure BDA0003676253210000111
在以上序列中,位置1中的X可为M(野生型;来源:Genbank AAB95450.1)、T、L或V。在其他实施例中,VP1起始残基可为由诸如次佳起始密码子的非典型起始密码子编码的另一种氨基酸(参见,例如Kearse等人,Genes Dev.(2017)31:1717-31)。在一些实施例中,VP1蛋白质中的突变VP3起始位点为除上文所示的V以外的氨基酸。在一些实施例中,本文所产生的AAV6 VP2蛋白质包含跨越SEQ ID NO:1的氨基酸138至736的序列,其中VP3起始位点未突变(亦即,为天然甲硫胺酸)且AAV6 VP3蛋白质包含跨越SEQ ID NO:1的氨基酸204至736的序列,其中N端氨基酸为天然M。
编码序列修饰的额外非限制性实例在下文描述。亦参见WO
2020/168145,其揭露内容以全文引用的方式并入本文中。A.降低VP1及VP2的蛋白水解降解的修饰
在一些实施例中,VP1及VP2编码序列可在两个或更多个密码子中突变,使得由此编码的VP1及VP2蛋白质在生产过程期间对蛋白水解降解具有抗性。因为VP1编码序列亦含有AAP的开放阅读框架,所以密码子变化亦可引起AAP中的突变。VP1及VP2中的此等突变进一步改良rAAV的感染性,亦即效能。
在一些实施例中,本发明的改良的杆状病毒-昆虫细胞系统可以用于生产易受昆虫细胞中的蛋白水解影响的任何AAV血清型。此类AAV血清型可包括例如AAV1、AAV6、AAV8或其变异体,或其VP1及VP2蛋白质易受昆虫细胞中的蛋白水解影响的任何假型化或嵌合rAAV。
在本发明的改良AAV生产系统中,将两个或更多个点突变引入至AAV VP1及VP2蛋白质中,该等蛋白质源于例如AAV1、AAV4、AAV6、AAV7、AAV8或AAV11,以移除易受昆虫细胞中的蛋白水解影响的位点。所引入的点突变可为与AAV2、AAV3、AAV5、AAV9或AAV10中的对应位置处的残基一致的残基。
藉由「对应」氨基酸残基或区域意指当目标序列及含有残基或区域的参考序列比对以实现最大同源性(允许此项技术中识别的间隙)时,与参考残基或区域比对(但未必与其一致)的氨基酸残基或区域。例如,AAV8 VP1的氨基酸残基189(L)对应于AAV6 VP1的氨基酸残基188。
在此等系统中,由VP1及VP2蛋白质共享的重迭区域可突变以移除蛋白水解位点。例如,rAAV6 VP1及/或VP2可包含相对于野生型在与SEQ ID NO:1的残基138至203(例如,残基151至201、残基157至201或残基185至194(亦即,PQPLGEPPAT(SEQ ID NO:2),其中裂解已展示在G与E之间)对应的区域中的两个或更多个残基处的突变,其中突变残基选自由以下组成的群:残基157、162、164、179、188、194、196、197、200及201。在一些实施例中,AAV6 VP1及/或VP2包含选自由以下组成的群的两个或更多个突变:S157A、T162S、Q164A、S179T、L188I、T194A、A196S、A197G、P200S及T201L(根据SEQ ID NO:1编号)。例如,AAV6 VP1及/或VP2可具有突变(i)S179T、L188I、T194A、A196S、A197G、P200S及T201L(「变异体1」);(ii)S179T、L188I、T194A、A196S及A197G(「变异体2」);(iii)T194A、A196S、A197G、P200S及T201L(「变异体3」);(iv)S157A、T162S及Q164A(「变异体4」);或(v)P200S及T201L。为方便起见,在本文中仅提及VP1中的残基数目。自以上的SEQ ID NO:1可以轻易辨别出VP2中的对应残基的数目。例如,VP1中的残基S157为VP2中的残基S20。
在特定实施例中,AAV6 VP1及/或VP2包含突变L188I及该组中的一或多个其他突变。例如,AAV6 VP1及/或VP2可具有突变L188I、P200S及T201L。
在一些实施例中,AAV6 VP1及/或VP2包含S157A、T162S、Q164A、S179T、L188I、T194A、A196S、A197G、P200S及T201L的所有十个突变,使得其在对应于SEQ ID NO:1中的残基157至201的区域中的序列如下。
Figure BDA0003676253210000131
此序列与AAV9 VP1及VP2中的对应区域中的序列一致。
因此,为产生经修饰的VP1编码序列,可以使用熟知分子选殖技术用AAV9的对应氨基酸序列(SEQ ID NO:4)的编码序列替换VP1的残基157至201的编码序列(亦即,VP2的残基20至64;SEQ ID NO:3);所得经修饰的杆状病毒AAV6辅助载体在本文中称为
「AAV9移植体」且所得VP1蛋白在本文中称为「AAV6/9VP1」。可使同一移植体在VP2中突变同一区域,从而产生AAV6/9VP2。在一些实施例中,替换的AAV6 VP1基因序列的一部分包含下文所示的带下划线的序列(亦参见图2):
Figure BDA0003676253210000132
在某些实施例中,SEQ ID NO:13中的带下划线的部分经来自AAV9的对应cap基因序列替换以产生本文所揭示的AAV9移植体。在特定实施例中,移植至AAV9移植体中的AAV6cap基因的AAV9cap序列包含下文所示的带下划线的序列(亦参见图2):
Figure BDA0003676253210000133
在其他实施例中,杆状病毒AAV6辅助构建体中的经修饰的cap6基因可以藉由用来自VP1及/或VP2对昆虫细胞中的蛋白水解裂解具有抗性的血清型(例如,AAV2、AAV3、AAV5或AAV10)的对应氨基酸序列的编码序列替换SEQ ID NO:1中VP1的残基157至201(亦即,VP2的残基20至64;SEQ ID NO:3)的编码序列而产生。
在其他实施例中,诸如AAV1、AAV4、AAV7、AAV8或AAV11的AAV血清型的VP1/VP2蛋白质可以经突变,使得其含有图1C中所示的一或多个突变。预期所得蛋白质对昆虫细胞中的蛋白水解更具抗性。来自各种AAV血清型的经工程改造的VP1/VP2蛋白质的非限制性实例展示如下:
(1)经工程改造的AAV1 VP1/VP2蛋白质可含有以下突变中的一或多个:S158T/A、I160T/V、T163A/S/K、Q165K/A、K169R、S180A/T、L189E/I、T195A、A197S/T、A198S/G、V199L、P201T/S及T202N/L;
(2)经工程改造的AAV4 VP1/VP2蛋白质可含有以下突变中的一或多个:T158S/A、I160T/V、K163A/S、K165Q/A、K169R、K171R、V173N、E175G、D176Q/E、E177T、T178G、G179D/E、A180S/T、G181D/E、D182S、G183V、E189L/I、S191Q/E、T192P、S193P、G194A、M196P、S197T、D200G、D201T/S、S202N/L及E203T;
(3)经工程改造的AAV6 VP1/VP2蛋白质可含有以下突变中的一或多个:S158T/A、I160T/V、T163A/S/K、Q165K/A、K169R、S180A/T、L189E/I、T195A、A197S/T、A198S/G、V199L、P201T/S及T202N/L;
(4)经工程改造的AAV7 VP1/VP2蛋白质可含有以下突变中的一或多个:T158S/A、I160T/V、K163A/S、Q165K/A、R169K、S180A/T、L189E/I、S197T、S198G、V199L及G202N/L;
(5)经工程改造的AAV8 VP1/VP2蛋白质可含有以下突变中的一或多个:T158S/A、I160T/V、K163A/S、Q165K/A、R169K、S180A/T、L189E/I、S197T、G198S、V199L、P201T/S及N202L;及
(6)经工程改造的AAV11 VP1/VP2蛋白质可含有以下突变中的一或多个:S158T/A、I160T/V、K163A/S、K165Q/A、R169K、E175G、E176Q、D177T、T178G、G179D/E、A180S/T、G181D/E、D182S、G183V、E189L/I、S191Q/E、D192P、T193P、S194A、M196P、S197T、S200G、D201T/S、I202N/L及E203T(共通编号;参见图1C)。
在一些实施例中,来自易受昆虫细胞中的蛋白水解影响的AAV血清型的VP1/VP2蛋白质经突变以在以下氨基酸残基处含有一或多个突变(图1C中的共通编号):158、163、165、180、189、195、197、198、201及202。(此等残基分别对应于根据SEQ ID NO:1的编号的氨基酸残基157、162、164、179、188、194、196、197、200及201(AAV6)或来自与SEQ ID NO:1比对以展示最大同源性的另一个血清型的对应序列。)在其他实施例中,VP1/VP2蛋白质可在以下氨基酸残基(图1C中的共通编号)处额外含有一或多个突变:160、169、171至179、181至183、191至194、196、199及203。
在一些实施例中,来自易受昆虫细胞中的蛋白水解影响的AAV血清型的VP1/VP2蛋白质经突变以含有一或多个突变:
S158T/A、I160T/V、K/T163S/A/T、Q165K/A、K169R、K171R、V173N、E175G、D176Q/E、D/E177T、T178G、G179D/E、S180A/T、G181D/E、D182S、G183V、L189E/I、Q/S191E、T/D192P、S/T193P、G/S194A、T/G195A、M196P、A197S/T、A198G/S、V199L、S200G、D/P201 S/T、T/S202N/L及E203T(图1C中的共通编号)。
在一些实施例中,经工程改造的VP1/VP2蛋白质可含有以下突变中的一或多个:S158A、T163S、Q165A、S180T、L189I、T195A、A197S、A198G、P201S及T202L(图1C中的共通编号)。(此等残基分别对应于根据SEQ ID NO:1的编号的氨基酸残基S157A、T162S、Q164A、S179T、L188I、T194A、A196S、A197G、P200S及T201L(AAV6)或来自与SEQ ID NO:1比对以展示最大同源性的另一个血清型的对应序列)。
本文所描述的突变移除AAV衣壳蛋白中易受昆虫细胞中的蛋白水解裂解影响的位点。因此,含有经修饰的cap基因的辅助构建体将产生具有较高纯度及均匀性的rAAV产物以及改良的衣壳蛋白。
已出人意料地发现,本文中所引入至AAV VP1/VP2独特区域(亦即VP1与VP2共享但不存在于VP3中的区域)的点突变亦可以经由不依赖于仅防止蛋白水解裂解的机制而显著提高rAAV的效能。B.进一步改良rAAV生产率的修饰
另外地或可替代地,杆状病毒辅助构建体中的VP1编码序列在编码VP1 PLA2结构域的区域中的一或多个密码子中突变,使得经工程改造的PLA2结构域获取较高酶活性。已显示,较高PLA2酶活性可在昆虫细胞生产系统中产生较高产率的rAAV。
本发明提供一种杆状病毒-昆虫系统,其中VP1编码序列在VP1独特区域(亦即在VP1中但不在VP2或VP3中存在的区域)中改变以提高昆虫细胞中的rAAV的生产率。VP1独特区域(对应于SEQ ID NO:1的残基1至137)含有PLA2结构域,且该区域中的突变可增加PLA2结构域在所得VP1蛋白中的酶活性。
在一些实施例中,本发明的杆状病毒辅助构建体提供用于生产rAAV6或rAAV9的辅助功能且辅助构建体上的VP1表达盒包括具有突变PLA2结构域的经修饰的AAV6或AAV9 cap基因(各别地为cap6或cap9)。经突变的PLA2结构域相对于野生型可在对应于SEQ ID NO:1的残基1至137(例如52至97或67至92)的区域中的一或多个位置处包含突变,其中该等位置系选自由以下组成的群:残基67、81、84、85及92(SEQ ID NO:1的编号)。在一些实施例中,AAV6 VP1蛋白质包含选自由以下组成的群的一或多个突变:
A67E、Q81R、K84D、A85S及R92K(根据SEQ ID NO:1的编号)。在特定实施例中,AAV6VP1蛋白质包含所有五个突变,使得其在对应于SEQ ID NO:1中的残基52至97(SEQ ID NO:5)的区域中的序列如下。
Figure BDA0003676253210000171
此序列与AAV2 VP1中的对应区域中的序列一致。因此,为在杆状病毒AAV6辅助构建体中产生经修饰的cap6基因,可使用熟知分子选殖技术用AAV2的对应氨基酸序列的编码序列替换VP1的残基52至97或67至92的编码序列。
已意外地发现,本文中引入至AAV VP1独特区域的点突变可显著地改良VP1 PLA2结构域的酶活性且亦使得昆虫细胞中产生的rAAV的产率显著提高(例如两倍或更多倍、三倍或更多倍、四倍或更多倍或五倍或更多倍)。
在特定实施例中,经工程改造的cap基因编码含有PLA2结构域中的前述突变及移除蛋白水解位点的前述突变两者的AAV6 VP1蛋白。一个例示性经修饰的AAV6 VP1蛋白质(「AAV6/2/9VP1」)具有以下序列(其中V203可为M203或替代地另一个氨基酸):
Figure BDA0003676253210000181
其他例示性经修饰的AAV6 VP1蛋白质具有与SEQ ID NO:7相同的序列,除了位置1中的起始残基不存在,或为由非典型起始密码子(诸如次佳起始密码子)编码的T、L、V或另一个氨基酸。编码此等经修饰的AAV6 VP1蛋白质中的一者的杆状病毒辅助构建体可以用以在昆虫细胞中生产具有改良的效能及产率的rAAV6或假型化或嵌合rAAV。
在一些实施例中,经工程改造的cap基因编码含有AAV2 PLA2结构域的AAV9 VP1蛋白质。野生型AAV9 VP1序列(UniProtKB-Q6JC40(Q6JC40_9VIRU))展示如下,其中在PLA2结构域中不同于AAV9/2VP1中的对应者的五个氨基酸残基用粗体且方框指示:
Figure BDA0003676253210000191
此区域中的野生型AAV9及AAV2序列(SEQ ID NO:11的残基52至97)展示如下,其中在AAV2序列移植体的后,相对于野生型AAV9的五个氨基酸变化为粗体且加框:
Figure BDA0003676253210000192
在一些实施例中,SEQ ID NO:11中的M203可经V203或由非典型起始密码子编码的另一个氨基酸替换。
C.对AAP的修饰
在一些实施例中,VP1编码序列亦编码具有改良的使衣壳蛋白稳定及促进衣壳组装的能力的经工程改造的AAP。已显示,当AAV6 AAP的残基1至30(「AAP6」)变成AAV9 AAP的残基1至30(「AAP9」)时,由经工程改造的辅助构建体产生的rAAV的效能显著提高。AAP6及AAP9的残基1至30展示如下,其中野生型AAP9相对于野生型AAP6的六个氨基酸差异藉由粗体及方框指示:
Figure BDA0003676253210000193
完整AAV6 AAP野生型序列展示如下:
Figure BDA0003676253210000194
在一些实施例中,经工程改造的AAP蛋白质包含在残基8、10、12、17、21及22处的一或多个突变(基于图4A中的共通序列编号)。在其他实施例中,经工程改造的AAP蛋白质可包含以下氨基酸残基中的一或多个:Q8、L10、Q12、P17、Q21及V22。在一些实施例中,经工程改造的AAP蛋白质可包含以下相对于野生型AAP序列的突变中的一或多个:P8Q、H10L、L12Q、Q17P、L21Q及L22V。经工程改造的改良AAP蛋白质的非限制性实例展示如下:
(1)经工程改造的AAP1(血清型1的AAP),其包含以下突变中的一或多个:P8Q、I9T、H10L、L12Q、L16H、Q17P、L21Q、L22V及L26I;
(2)经工程改造的AAP2(血清型2的AAP),其包含以下突变中的一或多个:E2A、T5S、Y7S、L8Q、P10L、S11N、L12Q、D14E、S15N、H16L、Q17P、L21Q、E24D、I26L及R27Q;
(3)经工程改造的AAP4(血清型4的AAP),其包含以下突变中的一或多个:E2A、Q3T、A4Q、T5S、D6Q、P7S、L12Q、R13S、D14E、Q15N、L16H、P17Q、E18Q、C22V、L23W、M24D、T25L、V26I/L、R27Q及C28W;
(4)经工程改造的AAP6(血清型6的AAP),其包含以下突变中的一或多个:P8Q、H10L、L12Q、L16H、Q17P、L21Q、L22V及L26I;
(5)经工程改造的AAP7(血清型7的AAP),其包含以下突变中的一或多个:P8Q、L12Q、L16H、Q17P、L21Q、L22V及L26I;
(6)经工程改造的AAP8(血清型8的AAP),其包含以下突变中的一或多个:F7S、L12Q、L16H、Q17P、R19P、L21Q及I26L;
(7)经工程改造的AAP10(血清型10的AAP),其包含以下突变中的一或多个:S3T、P8Q、Q12L、L16H、Q17P、A19P、L21Q及V26I/L;及
(8)经工程改造的AAP11(血清型11的AAP),其包含以下突变中的一或多个:E2A、P3T、E4Q、T5S、D6Q、P7S、L12Q、R13S、D14E、Q15N、I16L/H、P17Q、A18Q、C22V、L23W、Q24D、T25L、L26I、K27Q及C28W(亦参见图4B)。
为产生经工程改造的AAP蛋白质,吾人可进行点突变。因为编码AAP的开放阅读框架嵌入于cap基因中且仅藉由读框转移而转译,所以亦可自另一种血清型移植含有AAP的N端部分的编码序列的cap基因的一部分(例如残基1至30、残基1至28、残基2至30、残基2至28等)。在一些实施例中,编码AAV9 VP1/VP2独特区域(亦即,与VP1及VP2共享但不存在于VP3中的区域)的AAV9 cap基因部分,例如包含SEQ ID NO:14的核苷酸18至151的cap9序列取代cap6的对应区域,以产生表现具有AAV9 VP1的一部分的经工程改造的AAV6 VP1的经工程改造的VP1表达盒(例如,以便移除如上文所论述的(一或多个)蛋白水解位点),以及经工程改造的AAP6,其N端1至30氨基酸残基现在与AAP9的彼等氨基酸残基系一致的。在一些实施例中,AAP突变藉由与上文关于AAV9 cap基因移植所描述的相同的方法来产生。
衣壳蛋白的额外实例描述于下文实例中。
II.Rep蛋白质表达盒
在哺乳动物细胞中,rep基因在哺乳动物p5启动子控制下转录至编码Rep78的RNA中,且在位于Rep78 ORF内的哺乳动物p19启动子下转录至编码Rep52的RNA中(参见,例如Urabe等人,2002,同上)。Rep78及Rep52两者的起始密码子为ATG。已发现,Rep78相对于Rep52的过度表现不利地影响rAAV的产率。
先前昆虫细胞系统不能以高产率生产rAAV已部分归因于此等系统不能实现Rep蛋白质的优化学计量。在本发明的rAAV生产系统中,两个独立表达盒用于表现Rep78及Rep52。在一些实施例中,Rep78的表达盒及Rep52的表达盒使用相同或类似强度的昆虫启动子;但使用Rep78的较弱起始密码子(例如CTG、TTG、GTG及ACG)帮助实现所要Rep78:Rep52的蛋白质比率及高AAV产率。在某些实施例中,两个卡匣可使用一致启动子,诸如上文针对衣壳表达盒所列的彼等启动子。在其他实施例中,Rep78表达盒具有典型起始密码子(ATG),但使用比Rep52表达盒更弱的启动子以达成所要化学计量。
在一些实施例中,Rep表达盒可含有其他调节组件,诸如上文针对衣壳蛋白质表达盒所描述的彼等调节组件。
在一些实施例中,Rep蛋白质的编码序列可经修饰以进一步增强AAV产率及效能。例如,编码序列可经密码子修饰以增加昆虫细胞中的mRNA稳定性、转译效率或DNA载体稳定性。为了避免自Rep78表达盒产生Rep52或任何其他副产物肽,Rep78编码序列可经突变以移除嵌入的Rep52 ORF、任何超框ATG位点、任何非所要剪接受体位点、任何隐蔽启动子序列及/或任何去稳定化组件的起始密码子(参见,例如Smith等人,同上)。反的,可修整Rep52编码序列以移除Rep52起始密码子上游的任何Rep78编码序列。
使用Rep78及Rep52的独立表达盒连同使用Rep78的次佳起始密码子出人意料地使得高产率生产强效rAAV。
III.在昆虫细胞中的rAAV生产
可如先前所描述进行昆虫细胞中的rAAV生产。参见,例如Urabe等人,2002及2006,同上;Chen等人,同上;Smith等人,同上;Mietzsch等人,同上;WO 2007/046703、WO 2007/148971、WO 2009/104964、WO 2013/036118及WO 2008/024998,其皆以全文引用的方式并入本文中。
本发明的生产方法中的昆虫细胞包含本文中所描述的双杆状病毒辅助载体。昆虫细胞可为(但不限于)培养细胞株,诸如源于粉纹夜蛾(Trichoplusia ni)的BTI-TN-5B1-4(High FiveTM,Thermo Fisher Scientific,Carlsbad,CA)、Sf9细胞或Sf21细胞(两者均源于草地贪夜蛾(Spodoptera frugiperda))、具有哺乳动物类型聚醣谱的Sf9或TN368细胞(GlycoBac)、或Sf-RVN细胞(MilliporeSigma)、Sf9-13F12细胞(Rhadovirus-free cells;Ma et al.,Virology(2019)536:125-33)。
rAAV在其衣壳内可包含含有所关注的转基因的AAV载体。转基因可编码报导蛋白以便使用生物化学(荧光素酶、SEAP)或成像(GFP、Venus、dTomato)技术侦测。转基因可编码治疗蛋白,其包括(但不限于)嵌合抗原受体(chimeric antigen receptor,CAR)、C-肽或胰岛素、胶原蛋白VII、IGF-I、脂蛋白脂肪酶、纤维蛋白原、凝血酶原、因子V、因子VIII、因子IX、因子XI、因子XII、因子XIII、冯威里氏因子(von Willebrand factor)、激肽释放酶原、高分子量激肽原(Fitzgerald因子)、纤维结合蛋白、抗凝血酶III、肝素辅因子II、蛋白C、蛋白S、蛋白Z、蛋白Z关联的蛋白酶抑制剂、纤维蛋白溶酶原、α2-抗纤维蛋白溶酶、组织纤维蛋白溶酶原活化因子、尿激酶、纤维蛋白溶酶原活化因子抑制剂-1、纤维蛋白溶酶原活化因子抑制剂-2或任何用于治疗溶酶体贮积病的酶,诸如α-半乳糖苷酶A(用于治疗法布立氏病(Fabry disease))。转基因可编码序列特异性结合蛋白(例如ZFP、TALE、TALEN或dCas9)。在一些实施例中,ZFP可为ZFP转录因子(例如其中ZFP结构域融合至转录因子的融合蛋白)、锌指核酸酶(例如其中ZFP结构域融合至核酸酶的融合蛋白)或ZFP碱基编辑器(例如其中ZFP结构域融合至核碱基编辑器的融合蛋白)。转基因可携带可以藉由同源重组或非同源末端连接并入宿主基因体(供体)中的特定位点中的序列。转基因可编码用于疫苗接种的免疫原性蛋白质(例如肿瘤抗原)。
AAV载体可包含转录调节组件(例如启动子及增强子),其可以引导及调节转基因在人类细胞中的表现。AAV载体亦可在转基因表达盒的一个或两个末端上包含AAV完整或部分反向末端重复序列(ITR)。ITR为封装及病毒整合至宿主(人类)基因体中所需的。AAV载体可为单股或自我互补的。
IV.rAAV的医药组合物
藉由本发明方法产生的rAAV衣壳可以与医药学上可接受的载剂一起调配为医药组合物。调配物包括(但不限于)液体或乳化液体中的悬浮液。医药学上可接受的载剂包括例如水、盐水、葡萄糖、甘油、蔗糖或其类似物及其组合。另外,组合物可含有辅助物质,诸如润湿剂或乳化剂、pH缓冲剂、稳定剂或增强rAAV医药组合物的有效性的其他试剂。
rAAV医药组合物可藉由向患者投与,例如藉由全身投与(例如静脉内、腹膜内、肌内、皮下、鞘内或颅内输注)或局部注射来进行活体内递送。或者,rAAV可以活体外递送至细胞,诸如自患者(例如淋巴细胞、骨髓抽出物或组织活体检查)或同种异体细胞(例如通用供体细胞,诸如通用CAR T细胞)体外培养的细胞,接着通常在选择已并入rAAV载体的细胞的后,将经处理的细胞引入至患者中。
除非本文中另外定义,否则结合本发明使用的科学与技术术语应具有由一般技术者通常理解的含义。下文描述例示性方法及材料,但类似或等效于本文中所描述的方法及材料的方法及材料亦可用于实践或测试本发明。在有冲突的情况下,将以本说明书(包括定义)为凖。一般而言,与本文所描述的细胞及组织培养、分子生物学、病毒学、免疫学、微生物学、遗传学、分析化学、合成有机化学、医学及医药化学以及蛋白质及核酸化学及杂交结合使用的命名法及其技术为此项技术中熟知且常用者。酶促反应及纯化技术系根据制造商的说明书如此项技术中通常所实现或如本文中所描述来进行。另外,除非上下文另外需要,否则单数术语应包括复数且复数术语应包括单数。在通篇本说明书及实施例中,词语「具有(have)」及「包含(comprise)」或诸如「具有(has/having)」、「包含(comprises/comprising)」的变化形式应理解为暗示包括陈述的整数或整数群,但不排除任何其他整数或整数群。本文中提及的所有公开案及其他文献均以全文引用的方式并入本文中。尽管本文中引用多个文件,但此引用不构成此等文件中的任一者形成此项技术中公共常识的部分的许可。
为了能更好地理解本发明,阐述以下实例。此等实例仅用于说明的目的且不应视为以任何方式限制本发明的范畴。
实例
实例1:在Sf9昆虫细胞中的AAV生产
当前,用于Sf9 AAV制造的辅助系统依赖于漏泄扫描、替代性剪接及/或内部启动子以表现AAV生产所需的所有Rep及衣壳蛋白(Smith等人,同上;Chen等人,同上)。因为AAV衣壳基于可获得的衣壳蛋白的化学计量组装(Berns及Parrish,同上),吾人假设对在rAAV生产期间表现的VP1的量施加较大控制可增加并入至rAAV衣壳中的VP1的量且从而增加病毒效能。
为了测试此假设,吾人在独立启动子的控制下,将个别衣壳蛋白的编码序列选殖至独立杆状病毒载体中。为允许在Rep蛋白质上的较大控制,吾人亦将个别Rep蛋白质的编码序列选殖至独立杆状病毒载体中。为了测试不同载体上的Rep及Cap编码序列的各种可能组合,吾人建构两种版本的杆状病毒辅助系统(图5)。
在第一版本中,吾人将Rep78表达盒与VP1表达盒配对且将Rep52表达盒与VP2/VP3表达盒配对。在第二版本中,吾人将Rep52表达盒与VP1表达盒配对且将Rep78表达盒与VP2/VP3表达盒配对。两个Rep表达盒均在多角体蛋白启动子的控制下。VP1及VP2/3表达盒均在p10启动子的控制下。除利用与AAV复制的天然情形中相同的漏泄扫描机制的VP2/3基因外,此等辅助载体中的Rep编码序列及VP1编码序列中无一者依赖于用于表现的漏泄扫描或替代性剪接。为了减少rAAV生产所需的杆状病毒载体的数目,吾人将AAV微型基因体的编码序列并入两种版本中的表现Rep52的载体中(图5)。对于本研究,AAV微型基因体含有α-半乳糖苷酶A(GLA)或锌指蛋白(ZFP)的表达盒(SBS#65918及SBS#57890;参见WO 2018/102665及WO2020/072677)。编码GLA的rAAV可适用于法布立氏病的基因疗法。ZFP结合至小鼠微管相关蛋白质tau(Mapt)基因且抑制其表现。
表达盒的编码序列及编码的多肽序列如下。在VP1编码序列中,天然VP3 ORF的ATG起始密码子变成GTG,引起M至V的取代。在Rep78编码序列中,天然Rep58 ORF的ATG起始密码子变成GTG,亦引起M至V的取代。对于本文中的研究,Rep基因源于AAV2。
rAAV的生产及相对产率的测定
用杆状病毒感染的昆虫细胞(分别由两种杆状病毒载体感染的细胞的BIIC1及BIIC2)接种原生Sf9昆虫细胞。接种的BIIC1:BIIC2:原生Sf9细胞的比率为1:1:10000。将细胞培养物培育六天。接着收集细胞,再悬浮且冷冻/解冻三次。用核酸酶处理细胞裂解物。藉由离心移除细胞碎片。藉由添加PEG及NaCl浓缩AAV,随后在冰上培育且离心沈淀的病毒。使浓缩的病毒再悬浮且施加至CsCl梯度,接着隔夜超速离心。收集带状AAV且透析。接着,进行qPCR以滴定载体基因体(vector genome,vg)含量。藉由此等方法获得本文中所测试的rAAV6(具有编码GLA的转基因)及rAAV9(具有编码ZFP的转基因)。藉由将vg/mL乘以样品的总mL计算总AAV产率且相对于标准辅助系统1的产率表现,该标准辅助系统表现AAV2复制酶及AAV6衣壳蛋白且采用同上Smith等人中所描述的单载体系统。
藉由图5中所说明的版本2方法获得额外rAAV血清型rAAV1、rAAV2及rAAV3B。rAAV1及rAAV3B病毒中的VP1含有如上文所描述的AAV2 PLA2结构域。在rAAV1的情况下,VP1及VP2额外含有如上文所描述的AAV9移植体以移除蛋白水解位点。AAV2及AAV3B似乎不易受蛋白水解分裂影响,如使用AAV1及AAV6所观测;且因此,其VP1/VP2未经工程改造以含有移植的AAV9 VP序列。此等三种病毒亦携带与rAAV9相同的ZFP转基因。
在本研究中,AAV基因体包括来自AAV2的反向末端重复序列(inverted terminalrepeats,ITR)且昆虫细胞表现AAV2复制酶。
本文中的rAAV6、rAAV9、rAAV1、rAAV2及rAAV3B病毒的衣壳蛋白序列展示如下。rAAV6的衣壳蛋白含有来自AAV2及AAV9的序列,如上文详细描述。rAAV9、rAAV1及rAAV3B的衣壳蛋白亦经工程改造以含有来自其他AAV血清型的序列,如下文所指示。
rAAV6效能的测定
将藉由此实例中上文所描述的方法获得的rAAV6以900K的感染倍率(MOI或病毒/细胞,基于vg效价)施加于HepG2细胞。培育细胞五天。收集组织培养物上清液且藉由量测自GLA受质释放的荧光报导体4-甲基伞形基(4-MU)的水平来检定GLA酶活性。相对于藉由标准辅助系统1生产的rAAV样品的活性,计算酶活性。
rAAV9效能的测定
将此实例中藉由上文所描述的方法获得的rAAV9以30K的MOI施加于小鼠皮质神经元且培育六天。收集细胞的全部RNA且用于产生cDNA。藉由qPCR分析cDNA以表现由AAV转基因编码的小鼠Mapt mRNA及锌指蛋白(ZFP)mRNA。使mRNA表现相对于宿主细胞RNA归一化的后,相对于由AAV9标准辅助系统(见下文)生产的rAAV9计算效能。rAAV1、rAAV2及rAAV3B病毒的效能亦可以相同的方式测试。
Rep及衣壳蛋白的序列
本文中所测试的rAAV6、rAAV1、rAAV2、rAAV3B及rAAV9病毒的氨基酸及编码序列展示如下。
rAAV6 VP1编码序列:
Figure BDA0003676253210000291
Figure BDA0003676253210000301
rAAV6 VP1多肽:
Figure BDA0003676253210000302
rAAV6 VP2/VP3编码序列:
Figure BDA0003676253210000303
Figure BDA0003676253210000311
rAAV6 VP2多肽序列:
Figure BDA0003676253210000312
rAAV6 VP3多肽序列:
Figure BDA0003676253210000313
rAAV1 VP1/VP2/VP3多肽序列(经移植的AAV2 PLA2结构域经加框显示;经移植的AAV9 VP2/VP3蛋白水解抗性结构域为斜体及粗体;VP2及VP3的第一氨基酸(分别为SEQ IDNO:24中的T138及V203)为粗体且带下划线):
Figure BDA0003676253210000321
rAAV2 VP1/VP2/VP3多肽序列(VP2及VP3的第一氨基酸(分别为SEQ ID NO:25中的T138及V203)为粗体且带下划线):
Figure BDA0003676253210000322
rAAV3B VP1/VP2/VP3多肽序列(经移植的AAV2 PLA2结构域经加框显示;VP2及VP3的第一氨基酸(各别为SEQ ID NO:26中的T138及V203)为粗体且带下划线):
Figure BDA0003676253210000323
rAAV9 VP1/VP2/VP3多肽序列(经移植的AAV2 PLA2结构域经加框显示;VP2及VP3的第一氨基酸(分别为SEQ ID NO:27中为T138及V203)为粗体且带下划线):
Figure BDA0003676253210000331
AAV2 Rep78编码序列:
Figure BDA0003676253210000332
AAV2 Rep78多肽:
Figure BDA0003676253210000341
AAV2 Rep52编码序列:
Figure BDA0003676253210000342
AAV2 Rep52多肽:
Figure BDA0003676253210000343
结果
吾人测试图5中各版本的生产rAAV6的能力及所得rAAV关于标准辅助系统1及标准辅助系统2的效能,该标准辅助系统2不同于标准辅助系统1,因为其衣壳表达盒使用上文所描述的AAV6/2/9杂交序列。出乎意料地,Rep与Cap基因的配对对产率及效能两者具有显著影响。版本1产率减少大约两倍且效能增加八倍,而版本2产率增加大约四倍且效能增加五倍(表1)。衣壳比率的比较演示版1的rAAV6具有极少VP2且VP1:VP3比率类似于使用野生型AAV(1:10)观测到的比率。由版本2系统生产的重组AAV具有与使用标准辅助系统2观测到的衣壳比率类似的衣壳比率(表1)。
表1 rAAV6*的表征
Figure BDA0003676253210000351
*产率及效能数值为三个独立生产批次的平均值。衣壳比率来自单个生产批次。
与标准辅助系统1相比,对于rAAV9,版本1产率减少大约三倍且效能类似,而版本2产率增加大约四倍且效能减少两倍(表2)。衣壳比率的比较演示版1的rAAV9具有多达AAV9标准辅助系统的一半的VP2且VP1:VP3比率为使用野生型AAV(1:10)观测到的比率的一半。由版本2系统生产的重组AAV9具有与使用由AAV9标准辅助系统提供的rAAV9观测到的衣壳比率类似的衣壳比率(表2)。AAV9标准辅助系统与AAV6标准辅助系统2相同,除了并非生产AAV6/2/9杂交衣壳蛋白的外,其生产杂交AAV9衣壳蛋白,其中VP1蛋白质经工程改造以含有如上文所描述的AAV2 PLA2结构域。
表2 rAAV9*的表征
Figure BDA0003676253210000361
*产率及效能数值及衣壳比率来自六个相关生产批次。
藉由图5的版本2方法成功生产额外血清型rAAV1、rAAV2及rAAV3B。
此等数据表明,辅助载体上Rep与Cap表达盒配对影响所生产的rAAV的产率及效能。此外,数据表明Rep及Cap蛋白质可以成功地自两种独立杆状病毒载体表现且有助于以高产率生产感染性rAAV。最后,此等数据表明本文所描述的生产系统广泛适用于不同AAV血清型且不限于更广泛测试的AAV6及AAV9版本。
表3序列表
Figure BDA0003676253210000362
Figure BDA0003676253210000371
序列表
<110> 桑格摩生物治疗股份有限公司(SANGAMO THERAPEUTICS, INC.)
<120> 用于生产重组AAV的新颖组合物及方法
<130> 025297.WO015
<140>
<141>
<150> 62/943,715
<151> 2019-12-04
<160> 73
<170> PatentIn version 3.5
<210> 1
<211> 737
<212> PRT
<213> 未知
<220>
<221>来源
<223> /标注=”未知的描述:
VP1 蛋白质序列"
<220>
<221>变异体
<222> (1)..(1)
<223> /替代="Thr"或 "Leu"或 "Val"
<220>
<221> 位点
<222> (1)..(737)
<223> /标注=“序列中给出的变异体残基没有相对于注释中的那些有对变异体位置有偏好”
<400> 1
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Val Val Ala Ser Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn
210 215 220
Ala Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn
260 265 270
His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr
405 410 415
Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn
435 440 445
Arg Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe
450 455 460
Ser Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu
465 470 475 480
Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp
485 490 495
Asn Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu
500 505 510
Asn Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His
515 520 525
Lys Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe
530 535 540
Gly Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met
545 550 555 560
Ile Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu
565 570 575
Arg Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro
580 585 590
Ala Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp
595 600 605
Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro
610 615 620
His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly
625 630 635 640
Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro
645 650 655
Ala Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile
660 665 670
Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu
675 680 685
Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser
690 695 700
Asn Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly
705 710 715 720
Leu Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro
725 730 735
Leu
<210> 2
<211> 10
<212> PRT
<213> 腺相关病毒6
<400> 2
Pro Gln Pro Leu Gly Glu Pro Pro Ala Thr
1 5 10
<210> 3
<211> 45
<212> PRT
<213> 腺相关病毒6
<400> 3
Ser Gly Ile Gly Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn
1 5 10 15
Phe Gly Gln Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu
20 25 30
Gly Glu Pro Pro Ala Thr Pro Ala Ala Val Gly Pro Thr
35 40 45
<210> 4
<211> 45
<212> PRT
<213> 腺相关病毒9
<400> 4
Ala Gly Ile Gly Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn
1 5 10 15
Phe Gly Gln Thr Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile
20 25 30
Gly Glu Pro Pro Ala Ala Pro Ser Gly Val Gly Ser Leu
35 40 45
<210> 5
<211> 46
<212> PRT
<213> 腺相关病毒6
<400> 5
Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro Val Asn Ala
1 5 10 15
Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln Gln Leu
20 25 30
Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala Asp
35 40 45
<210> 6
<211> 46
<212> PRT
<213> 腺相关病毒2
<400> 6
Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro Val Asn Glu
1 5 10 15
Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Arg Gln Leu
20 25 30
Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
35 40 45
<210> 7
<211> 736
<212> PRT
<213> 未知
<220>
<221>来源
<223> /标注=”未知的描述:
VP1 蛋白质序列"
<400> 7
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Val Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 8
<211> 30
<212> PRT
<213> 腺相关病毒6
<400> 8
Met Ala Thr Gln Ser Gln Ser Pro Thr His Asn Leu Ser Glu Asn Leu
1 5 10 15
Gln Gln Pro Pro Leu Leu Trp Asp Leu Leu Gln Trp Leu Gln
20 25 30
<210> 9
<211> 30
<212> PRT
<213> 腺相关病毒9
<400> 9
Met Ala Thr Gln Ser Gln Ser Gln Thr Leu Asn Gln Ser Glu Asn Leu
1 5 10 15
Pro Gln Pro Pro Gln Val Trp Asp Leu Leu Gln Trp Leu Gln
20 25 30
<210> 10
<211> 196
<212> PRT
<213> 腺相关病毒6
<400> 10
Met Ala Thr Gln Ser Gln Ser Pro Thr His Asn Leu Ser Glu Asn Leu
1 5 10 15
Gln Gln Pro Pro Leu Leu Trp Asp Leu Leu Gln Trp Leu Gln Ala Val
20 25 30
Ala His Gln Trp Gln Thr Ile Thr Lys Ala Pro Thr Glu Trp Val Met
35 40 45
Pro Gln Glu Ile Gly Ile Ala Ile Pro His Gly Trp Ala Thr Glu Ser
50 55 60
Ser Pro Pro Ala Pro Glu His Gly Pro Cys Pro Pro Ile Thr Thr Thr
65 70 75 80
Ser Thr Ser Lys Ser Pro Val Leu Gln Arg Gly Pro Ala Thr Thr Thr
85 90 95
Thr Thr Ser Ala Thr Ala Pro Pro Gly Gly Ile Leu Ile Ser Thr Asp
100 105 110
Ser Thr Ala Ile Ser His His Val Thr Gly Ser Asp Ser Ser Thr Thr
115 120 125
Ile Gly Asp Ser Gly Pro Arg Asp Ser Thr Ser Ser Ser Ser Thr Ser
130 135 140
Lys Ser Arg Arg Ser Arg Arg Met Met Ala Ser Arg Pro Ser Leu Ile
145 150 155 160
Thr Leu Pro Ala Arg Phe Lys Ser Ser Arg Thr Arg Ser Thr Ser Cys
165 170 175
Arg Thr Ser Ser Ala Leu Arg Thr Arg Ala Ala Ser Leu Arg Ser Arg
180 185 190
Arg Thr Cys Ser
195
<210> 11
<211> 736
<212> PRT
<213> 腺相关病毒9
<400> 11
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 12
<211> 46
<212> PRT
<213> 腺相关病毒9
<400> 12
Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val Asn Ala
1 5 10 15
Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln Gln Leu
20 25 30
Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
35 40 45
<210> 13
<211> 183
<212> DNA
<213> 腺相关病毒6
<400> 13
aagagccaga ctcctcctcg ggcattggca agacaggcca gcagcccgct aaaaagagac 60
tcaattttgg tcagactggc gactcagagt cagtccccga cccacaacct ctcggagaac 120
ctccagcaac ccccgctgct gtgggaccta ctacaatggc ttcaggcggt ggcgcaccaa 180
tgg 183
<210> 14
<211> 183
<212> DNA
<213> 腺相关病毒9
<400> 14
aagagccaga ctcctccgcg ggtattggca aatcgggtgc acagcccgct aaaaagagac 60
tcaatttcgg tcagactggc gacacagagt cagtcccaga ccctcaacca atcggagaac 120
ctcccgcagc cccctcaggt gtgggatctc ttacaatggc ttcaggcggt ggcgcaccaa 180
tgg 183
<210> 15
<211> 2211
<212> DNA
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成聚核苷酸”
<400> 15
acggctgccg acggttatct acccgattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acctcaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180
aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240
cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300
caggagcgcc ttcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaaga gggttctcga accttttggt ctggttgagg aaggtgctaa gaccgctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacagtgg cttcaggcgg tggcgcacca gtggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgaacatg ggccttgccc acctataaca accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg atttcaacag attccactgc catttctcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaagctctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acgaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag ttgccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcagtacgg ctacctaacg 1140
ctcaacaatg gcagccaggc agtgggacgg tcatcctttt actgcctgga atatttccca 1200
tcgcagatgc tgagaacggg caataacttt accttcagct acaccttcga ggacgtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
cagtacctgt attacctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgggggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt accggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac cttaatgggc gtgaatctat aatcaaccct 1560
ggcactgcta tggcctcaca caaagacgac aaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaggagag cgccggagct tcaaacactg cattggacaa tgtcatgatc 1680
acagacgaag aggaaatcaa agccactaac cccgtggcca ccgaaagatt tgggactgtg 1740
gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgttatggga 1800
gccttacctg gaatggtgtg gcaagacaga gacgtatatc tgcagggtcc tatttgggcc 1860
aaaattcctc acacggatgg acactttcac ccgtctcctc tcatgggcgg ctttggactt 1920
aagcacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggca 1980
gagttttcgg ctacaaagtt tgcttcattc atcacccagt attccacagg acaagtgagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaaac gctggaatcc cgaagtgcag 2100
tatacatcta actatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt tacctcaccc gtcccctgta a 2211
<210> 16
<211> 736
<212> PRT
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成多肽
<220>
<221>变异体
<222> (1)..(1)
<223> /替代="Thr"
<220>
<221> 位点
<222> (1)..(736)
<223> /标注=“序列中给出的变异体残基没有相对于注释中的那些有对变异体位置有偏好”
<400> 16
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Val Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 17
<211> 1800
<212> DNA
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成聚核苷酸”
<400> 17
acggctcctg gaaagaaacg tccggtagag cagtcgccac aagagccaga ctcctccgcg 60
ggtattggca aatcgggtgc acagcccgct aaaaagagac tcaatttcgg tcagactggc 120
gacacagagt cagtcccaga ccctcaacca atcggagaac ctcccgcagc cccctcaggt 180
gtgggatctc ttacaatggc ttcaggcggt ggcgcaccag tggcagacaa taacgaaggc 240
gccgacggag tgggtaatgc ctcaggaaat tggcattgcg attccacatg gctgggcgac 300
agagtcatca ccaccagcac ccgaacatgg gccttgccca cctataacaa ccacctctac 360
aagcaaatct ccagtgcttc aacgggggcc agcaacgaca accactactt cggctacagc 420
accccctggg ggtattttga tttcaacaga ttccactgcc atttctcacc acgtgactgg 480
cagcgactca tcaacaacaa ttggggattc cggcccaaga gactcaactt caagctcttc 540
aacatccaag tcaaggaggt cacgacgaat gatggcgtca cgaccatcgc taataacctt 600
accagcacgg ttcaagtctt ctcggactcg gagtaccagt tgccgtacgt cctcggctct 660
gcgcaccagg gctgcctccc tccgttcccg gcggacgtgt tcatgattcc gcagtacggc 720
tacctaacgc tcaacaatgg cagccaggca gtgggacggt catcctttta ctgcctggaa 780
tatttcccat cgcagatgct gagaacgggc aataacttta ccttcagcta caccttcgag 840
gacgtgcctt tccacagcag ctacgcgcac agccagagcc tggaccggct gatgaatcct 900
ctcatcgacc agtacctgta ttacctgaac agaactcaga atcagtccgg aagtgcccaa 960
aacaaggact tgctgtttag ccgggggtct ccagctggca tgtctgttca gcccaaaaac 1020
tggctacctg gaccctgtta ccggcagcag cgcgtttcta aaacaaaaac agacaacaac 1080
aacagcaact ttacctggac tggtgcttca aaatataacc ttaatgggcg tgaatctata 1140
atcaaccctg gcactgctat ggcctcacac aaagacgaca aagacaagtt ctttcccatg 1200
agcggtgtca tgatttttgg aaaggagagc gccggagctt caaacactgc attggacaat 1260
gtcatgatca cagacgaaga ggaaatcaaa gccactaacc ccgtggccac cgaaagattt 1320
gggactgtgg cagtcaatct ccagagcagc agcacagacc ctgcgaccgg agatgtgcat 1380
gttatgggag ccttacctgg aatggtgtgg caagacagag acgtatatct gcagggtcct 1440
atttgggcca aaattcctca cacggatgga cactttcacc cgtctcctct catgggcggc 1500
tttggactta agcacccgcc tcctcagatc ctcatcaaaa acacgcctgt tcctgcgaat 1560
cctccggcag agttttcggc tacaaagttt gcttcattca tcacccagta ttccacagga 1620
caagtgagcg tggagattga atgggagctg cagaaagaaa acagcaaacg ctggaatccc 1680
gaagtgcagt atacatctaa ctatgcaaaa tctgccaacg ttgatttcac tgtggacaac 1740
aatggacttt atactgagcc tcgccccatt ggcacccgtt acctcacccg tcccctgtaa 1800
<210> 18
<211> 599
<212> PRT
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成多肽
<220>
<221>变异体
<222> (1)..(1)
<223> /替代="Thr"
<220>
<221> 位点
<222> (1)..(599)
<223> /标注=“序列中给出的变异体残基没有相对于注释中的那些有对变异体位置有偏好”
<400> 18
Met Ala Pro Gly Lys Lys Arg Pro Val Glu Gln Ser Pro Gln Glu Pro
1 5 10 15
Asp Ser Ser Ala Gly Ile Gly Lys Ser Gly Ala Gln Pro Ala Lys Lys
20 25 30
Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu Ser Val Pro Asp Pro
35 40 45
Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser Gly Val Gly Ser Leu
50 55 60
Thr Met Ala Ser Gly Gly Gly Ala Pro Val Ala Asp Asn Asn Glu Gly
65 70 75 80
Ala Asp Gly Val Gly Asn Ala Ser Gly Asn Trp His Cys Asp Ser Thr
85 90 95
Trp Leu Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu
100 105 110
Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Ala Ser Thr
115 120 125
Gly Ala Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly
130 135 140
Tyr Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp
145 150 155 160
Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn
165 170 175
Phe Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Asn Asp Gly
180 185 190
Val Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Ser
195 200 205
Asp Ser Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly
210 215 220
Cys Leu Pro Pro Phe Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly
225 230 235 240
Tyr Leu Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe
245 250 255
Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn
260 265 270
Phe Thr Phe Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr
275 280 285
Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln
290 295 300
Tyr Leu Tyr Tyr Leu Asn Arg Thr Gln Asn Gln Ser Gly Ser Ala Gln
305 310 315 320
Asn Lys Asp Leu Leu Phe Ser Arg Gly Ser Pro Ala Gly Met Ser Val
325 330 335
Gln Pro Lys Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val
340 345 350
Ser Lys Thr Lys Thr Asp Asn Asn Asn Ser Asn Phe Thr Trp Thr Gly
355 360 365
Ala Ser Lys Tyr Asn Leu Asn Gly Arg Glu Ser Ile Ile Asn Pro Gly
370 375 380
Thr Ala Met Ala Ser His Lys Asp Asp Lys Asp Lys Phe Phe Pro Met
385 390 395 400
Ser Gly Val Met Ile Phe Gly Lys Glu Ser Ala Gly Ala Ser Asn Thr
405 410 415
Ala Leu Asp Asn Val Met Ile Thr Asp Glu Glu Glu Ile Lys Ala Thr
420 425 430
Asn Pro Val Ala Thr Glu Arg Phe Gly Thr Val Ala Val Asn Leu Gln
435 440 445
Ser Ser Ser Thr Asp Pro Ala Thr Gly Asp Val His Val Met Gly Ala
450 455 460
Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro
465 470 475 480
Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro
485 490 495
Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile
500 505 510
Lys Asn Thr Pro Val Pro Ala Asn Pro Pro Ala Glu Phe Ser Ala Thr
515 520 525
Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val
530 535 540
Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro
545 550 555 560
Glu Val Gln Tyr Thr Ser Asn Tyr Ala Lys Ser Ala Asn Val Asp Phe
565 570 575
Thr Val Asp Asn Asn Gly Leu Tyr Thr Glu Pro Arg Pro Ile Gly Thr
580 585 590
Arg Tyr Leu Thr Arg Pro Leu
595
<210> 19
<211> 534
<212> PRT
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成多肽
<400> 19
Met Ala Ser Gly Gly Gly Ala Pro Val Ala Asp Asn Asn Glu Gly Ala
1 5 10 15
Asp Gly Val Gly Asn Ala Ser Gly Asn Trp His Cys Asp Ser Thr Trp
20 25 30
Leu Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro
35 40 45
Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly
50 55 60
Ala Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
65 70 75 80
Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln
85 90 95
Arg Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe
100 105 110
Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Asn Asp Gly Val
115 120 125
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Ser Asp
130 135 140
Ser Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys
145 150 155 160
Leu Pro Pro Phe Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr
165 170 175
Leu Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr
180 185 190
Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe
195 200 205
Thr Phe Ser Tyr Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala
210 215 220
His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr
225 230 235 240
Leu Tyr Tyr Leu Asn Arg Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn
245 250 255
Lys Asp Leu Leu Phe Ser Arg Gly Ser Pro Ala Gly Met Ser Val Gln
260 265 270
Pro Lys Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser
275 280 285
Lys Thr Lys Thr Asp Asn Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala
290 295 300
Ser Lys Tyr Asn Leu Asn Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr
305 310 315 320
Ala Met Ala Ser His Lys Asp Asp Lys Asp Lys Phe Phe Pro Met Ser
325 330 335
Gly Val Met Ile Phe Gly Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala
340 345 350
Leu Asp Asn Val Met Ile Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn
355 360 365
Pro Val Ala Thr Glu Arg Phe Gly Thr Val Ala Val Asn Leu Gln Ser
370 375 380
Ser Ser Thr Asp Pro Ala Thr Gly Asp Val His Val Met Gly Ala Leu
385 390 395 400
Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile
405 410 415
Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu
420 425 430
Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys
435 440 445
Asn Thr Pro Val Pro Ala Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys
450 455 460
Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu
465 470 475 480
Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu
485 490 495
Val Gln Tyr Thr Ser Asn Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr
500 505 510
Val Asp Asn Asn Gly Leu Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg
515 520 525
Tyr Leu Thr Arg Pro Leu
530
<210> 20
<211> 1866
<212> DNA
<213> 腺相关病毒2
<400> 20
ctggcggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg agtgggagtt gccgccagat 120
tctgacttgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggagtg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac ttacacgtgc tcgtggaaac caccggggtg 300
aaatccttag ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaacggc 420
gccggaggcg ggaacaaggt ggtggacgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatttagaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgacgcgc cggtgatcag atcaaaaact 660
tcagccaggt acgtggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataa 1866
<210> 21
<211> 621
<212> PRT
<213> 腺相关病毒2
<220>
<221>变异体
<222> (1)..(1)
<223> /替代="Leu"
<220>
<221> 位点
<222> (1)..(621)
<223> /标注=“序列中给出的变异体残基没有相对于注释中的那些有对变异体位置有偏好”
<400> 21
Met Ala Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Leu Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Leu His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Leu Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Leu Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Val Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 22
<211> 1194
<212> DNA
<213> 腺相关病毒2
<400> 22
atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag 60
gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag 120
gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg 180
gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta 240
aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc 300
ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg 360
gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt 420
cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc 480
aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa 540
tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg 600
tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg 660
atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag 720
gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc 780
tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag 840
cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc 900
aactacgcag acaggtacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg 960
tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga 1020
cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa 1080
aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc 1140
actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataa 1194
<210> 23
<211> 397
<212> PRT
<213> 腺相关病毒2
<400> 23
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
50 55 60
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
85 90 95
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
245 250 255
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
260 265 270
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
275 280 285
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
290 295 300
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
305 310 315 320
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
325 330 335
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
340 345 350
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
355 360 365
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
370 375 380
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
385 390 395
<210> 24
<211> 736
<212> PRT
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成多肽
<400> 24
Thr Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Val Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 25
<211> 735
<212> PRT
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成多肽
<400> 25
Thr Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Val Ala Thr Gly Ser Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 26
<211> 736
<212> PRT
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成多肽
<400> 26
Leu Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Val Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 27
<211> 736
<212> PRT
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成多肽
<400> 27
Leu Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Val Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 28
<211> 52
<212> PRT
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成多肽
<220>
<221> MOD_RES
<222> (15)..(15)
<223> 任何氨基酸
<220>
<221> MOD_RES
<222> (44)..(44)
<223> 任何氨基酸
<220>
<221> MOD_RES
<222> (47)..(47)
<223> 任何氨基酸
<400> 28
Asp Ser Ser Ser Gly Ile Gly Lys Ser Gly Gln Gln Pro Ala Xaa Lys
1 5 10 15
Arg Leu Asn Phe Gly Gln Thr Gly Asp Ser Glu Ser Val Pro Asp Pro
20 25 30
Gln Pro Leu Gly Glu Pro Pro Ala Ala Pro Ser Xaa Val Gly Xaa Asn
35 40 45
Thr Met Ala Ser
50
<210> 29
<211> 52
<212> PRT
<213> 腺相关病毒3B
<400> 29
Asp Ser Ser Ser Gly Val Gly Lys Ser Gly Lys Gln Pro Ala Arg Lys
1 5 10 15
Arg Leu Asn Phe Gly Gln Thr Gly Asp Ser Glu Ser Val Pro Asp Pro
20 25 30
Gln Pro Leu Gly Glu Pro Pro Ala Ala Pro Thr Ser Leu Gly Ser Asn
35 40 45
Thr Met Ala Ser
50
<210> 30
<211> 44
<212> PRT
<213> 腺相关病毒5
<400> 30
Lys Lys Ala Arg Thr Glu Glu Asp Ser Lys Pro Ser Thr Ser Ser Asp
1 5 10 15
Ala Glu Ala Gly Pro Ser Gly Ser Gln Gln Leu Gln Ile Pro Ala Gln
20 25 30
Pro Ala Ser Ser Leu Gly Ala Asp Thr Met Ser Ala
35 40
<210> 31
<211> 52
<212> PRT
<213> 腺相关病毒6
<400> 31
Asp Ser Ser Ser Gly Ile Gly Lys Thr Gly Gln Gln Pro Ala Lys Lys
1 5 10 15
Arg Leu Asn Phe Gly Gln Thr Gly Asp Ser Glu Ser Val Pro Asp Pro
20 25 30
Gln Pro Leu Gly Glu Pro Pro Ala Thr Pro Ala Ala Val Gly Pro Thr
35 40 45
Thr Met Ala Ser
50
<210> 32
<211> 52
<212> PRT
<213> 腺相关病毒8
<400> 32
Asp Ser Ser Thr Gly Ile Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys
1 5 10 15
Arg Leu Asn Phe Gly Gln Thr Gly Asp Ser Glu Ser Val Pro Asp Pro
20 25 30
Gln Pro Leu Gly Glu Pro Pro Ala Ala Pro Ser Gly Val Gly Pro Asn
35 40 45
Thr Met Ala Ala
50
<210> 33
<211> 52
<212> PRT
<213> 腺相关病毒9
<400> 33
Asp Ser Ser Ala Gly Ile Gly Lys Ser Gly Ala Gln Pro Ala Lys Lys
1 5 10 15
Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu Ser Val Pro Asp Pro
20 25 30
Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser Gly Val Gly Ser Leu
35 40 45
Thr Met Ala Ser
50
<210> 34
<211> 51
<212> PRT
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成多肽
<220>
<221> MOD_RES
<222> (15)..(15)
<223> 任何氨基酸
<400> 34
Asp Ser Ser Ser Gly Ile Gly Lys Lys Gly Gln Gln Pro Ala Xaa Lys
1 5 10 15
Arg Leu Asn Phe Gly Gln Thr Gly Asp Ser Glu Ser Val Pro Asp Pro
20 25 30
Gln Pro Leu Gly Glu Pro Pro Ala Ala Pro Ser Gly Val Gly Ser Asn
35 40 45
Thr Met Ala
50
<210> 35
<211> 51
<212> PRT
<213> 腺相关病毒1
<400> 35
Asp Ser Ser Ser Gly Ile Gly Lys Thr Gly Gln Gln Pro Ala Lys Lys
1 5 10 15
Arg Leu Asn Phe Gly Gln Thr Gly Asp Ser Glu Ser Val Pro Asp Pro
20 25 30
Gln Pro Leu Gly Glu Pro Pro Ala Thr Pro Ala Ala Val Gly Pro Thr
35 40 45
Thr Met Ala
50
<210> 36
<211> 51
<212> PRT
<213> 腺相关病毒2
<400> 36
Asp Ser Ser Ser Gly Thr Gly Lys Ala Gly Gln Gln Pro Ala Arg Lys
1 5 10 15
Arg Leu Asn Phe Gly Gln Thr Gly Asp Ala Asp Ser Val Pro Asp Pro
20 25 30
Gln Pro Leu Gly Gln Pro Pro Ala Ala Pro Ser Gly Leu Gly Thr Asn
35 40 45
Thr Met Ala
50
<210> 37
<211> 51
<212> PRT
<213> 腺相关病毒3B
<400> 37
Asp Ser Ser Ser Gly Val Gly Lys Ser Gly Lys Gln Pro Ala Arg Lys
1 5 10 15
Arg Leu Asn Phe Gly Gln Thr Gly Asp Ser Glu Ser Val Pro Asp Pro
20 25 30
Gln Pro Leu Gly Glu Pro Pro Ala Ala Pro Thr Ser Leu Gly Ser Asn
35 40 45
Thr Met Ala
50
<210> 38
<211> 46
<212> PRT
<213> 腺相关病毒4
<400> 38
Asp Ser Ser Thr Gly Ile Gly Lys Lys Gly Lys Gln Pro Ala Lys Lys
1 5 10 15
Lys Leu Val Phe Glu Asp Glu Thr Gly Ala Gly Asp Gly Pro Pro Glu
20 25 30
Gly Ser Thr Ser Gly Ala Met Ser Asp Asp Ser Glu Met Arg
35 40 45
<210> 39
<211> 51
<212> PRT
<213> 腺相关病毒7
<400> 39
Asp Ser Ser Thr Gly Ile Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys
1 5 10 15
Arg Leu Asn Phe Gly Gln Thr Gly Asp Ser Glu Ser Val Pro Asp Pro
20 25 30
Gln Pro Leu Gly Glu Pro Pro Ala Ala Pro Ser Ser Val Gly Ser Gly
35 40 45
Thr Val Ala
50
<210> 40
<211> 51
<212> PRT
<213> 腺相关病毒8
<400> 40
Asp Ser Ser Thr Gly Ile Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys
1 5 10 15
Arg Leu Asn Phe Gly Gln Thr Gly Asp Ser Glu Ser Val Pro Asp Pro
20 25 30
Gln Pro Leu Gly Glu Pro Pro Ala Ala Pro Ser Gly Val Gly Pro Asn
35 40 45
Thr Met Ala
50
<210> 41
<211> 51
<212> PRT
<213> 腺相关病毒9
<400> 41
Asp Ser Ser Ala Gly Ile Gly Lys Ser Gly Ala Gln Pro Ala Lys Lys
1 5 10 15
Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu Ser Val Pro Asp Pro
20 25 30
Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser Gly Val Gly Ser Leu
35 40 45
Thr Met Ala
50
<210> 42
<211> 51
<212> PRT
<213> 腺相关病毒10
<400> 42
Asp Ser Ser Thr Gly Ile Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys
1 5 10 15
Arg Leu Asn Phe Gly Gln Thr Gly Glu Ser Glu Ser Val Pro Asp Pro
20 25 30
Gln Pro Ile Gly Glu Pro Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly
35 40 45
Thr Met Ala
50
<210> 43
<211> 46
<212> PRT
<213> 腺相关病毒11
<400> 43
Asp Ser Ser Ser Gly Ile Gly Lys Lys Gly Lys Gln Pro Ala Arg Lys
1 5 10 15
Arg Leu Asn Phe Glu Glu Asp Thr Gly Ala Gly Asp Gly Pro Pro Glu
20 25 30
Gly Ser Asp Thr Ser Ala Met Ser Ser Asp Ile Glu Met Arg
35 40 45
<210> 44
<211> 173
<212> DNA
<213> 腺相关病毒6
<400> 44
aagagccaga ctcctcctcg ggcattggca agacaggcca gcagcccgct aaaaagagac 60
tcaattttgg tcagactggc gagtccccga cccacaacct ctcggagaac ctccagcaac 120
ccccgctgct gtgggaccta ctacaatggc ttcaggcggt ggcgcaccaa tgg 173
<210> 45
<211> 183
<212> DNA
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成聚核苷酸”
<400> 45
aagagccaga ctcctccgcg ggtattggca aatcgggtgc acagcccgct aaaaagagac 60
tcaatttcgg tcagactggc gacacagagt cagtcccaga ccctcaacca atcggagaac 120
ctcccgcagc cccctcaggt gtgggatctc ttacaatggc ttcaggcggt ggcgcaccaa 180
tgg 183
<210> 46
<211> 57
<212> PRT
<213> 腺相关病毒6
<400> 46
Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly Lys Thr Gly Gln Gln
1 5 10 15
Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr Gly Asp Ser Glu Ser
20 25 30
Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro Ala Thr Pro Ala Ala
35 40 45
Val Gly Pro Thr Thr Met Ala Ser Gly
50 55
<210> 47
<211> 57
<212> PRT
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成多肽
<400> 47
Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly Lys Ser Gly Ala Gln
1 5 10 15
Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu Ser
20 25 30
Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser Gly
35 40 45
Val Gly Ser Leu Thr Met Ala Ser Gly
50 55
<210> 48
<211> 57
<212> PRT
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成多肽
<400> 48
Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly Lys Thr Gly Gln Gln
1 5 10 15
Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu Ser
20 25 30
Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser Gly
35 40 45
Val Gly Ser Leu Thr Met Ala Ser Gly
50 55
<210> 49
<211> 57
<212> PRT
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成多肽
<400> 49
Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly Lys Thr Gly Gln Gln
1 5 10 15
Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu Ser
20 25 30
Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser Gly
35 40 45
Val Gly Pro Thr Thr Met Ala Ser Gly
50 55
<210> 50
<211> 57
<212> PRT
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成多肽
<400> 50
Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly Lys Thr Gly Gln Gln
1 5 10 15
Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr Gly Asp Ser Glu Ser
20 25 30
Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro Ala Ala Pro Ser Gly
35 40 45
Val Gly Ser Leu Thr Met Ala Ser Gly
50 55
<210> 51
<211> 57
<212> PRT
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成多肽
<400> 51
Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly Lys Ser Gly Ala Gln
1 5 10 15
Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr Gly Asp Ser Glu Ser
20 25 30
Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro Ala Thr Pro Ala Ala
35 40 45
Val Gly Pro Thr Thr Met Ala Ser Gly
50 55
<210> 52
<211> 150
<212> DNA
<213> 腺相关病毒6
<400> 52
gccagcagcc cgctaaaaag agactcaatt ttggtcagac tggcgactca gagtcagtcc 60
ccgacccaca acctctcgga gaacctccag caacccccgc tgctgtggga cctactacaa 120
tggcttcagg cggtggcgca ccaatggcag 150
<210> 53
<211> 150
<212> DNA
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成聚核苷酸”
<400> 53
gtgcacagcc cgctaaaaag agactcaatt tcggtcagac tggcgacaca gagtcagtcc 60
cagaccctca accaatcgga gaacctcccg cagccccctc aggtgtggga tctcttacaa 120
tggcttcagg cggtggcgca ccaatggcag 150
<210> 54
<211> 150
<212> DNA
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成聚核苷酸”
<400> 54
gccagcagcc cgctaaaaag agactcaatt ttggtcagac tggcgacaca gagtcagtcc 60
ccgacccaca acctatcgga gaacctccag cagccccctc aggtgtggga tctcttacaa 120
tggcttcagg cggtggcgca ccaatggcag 150
<210> 55
<211> 150
<212> DNA
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成聚核苷酸”
<400> 55
gccagcagcc cgctaaaaag agactcaatt ttggtcagac tggcgacaca gagtcagtcc 60
ccgacccaca acctatcgga gaacctccag cagccccctc aggtgtggga cctactacaa 120
tggcttcagg cggtggcgca ccaatggcag 150
<210> 56
<211> 150
<212> DNA
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成聚核苷酸”
<400> 56
gccagcagcc cgctaaaaag agactcaatt ttggtcagac tggcgactca gagtcagtcc 60
ccgacccaca acctctcgga gaacctccag cagccccctc aggtgtggga tctcttacaa 120
tggcttcagg cggtggcgca ccaatggcag 150
<210> 57
<211> 150
<212> DNA
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成聚核苷酸”
<400> 57
gcgcgcagcc cgctaaaaag agactcaatt ttggtcagac tggcgactca gagtcagtcc 60
ccgacccaca acctctcgga gaacctccag caacccccgc tgctgtggga cctactacaa 120
tggcttcagg cggtggcgca ccaatggcag 150
<210> 58
<211> 30
<212> PRT
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成多肽
<400> 58
Met Ala Thr Gln Ser Gln Ser Pro Thr Leu Asn Leu Ser Glu Asn Leu
1 5 10 15
Gln Gln Pro Pro Leu Val Trp Asp Leu Leu Gln Trp Leu Gln
20 25 30
<210> 59
<211> 30
<212> PRT
<213> 腺相关病毒1
<400> 59
Met Ala Thr Gln Ser Gln Ser Pro Ile His Asn Leu Ser Glu Asn Leu
1 5 10 15
Gln Gln Pro Pro Leu Leu Trp Asp Leu Leu Gln Trp Leu Gln
20 25 30
<210> 60
<211> 30
<212> PRT
<213> 腺相关病毒2
<400> 60
Met Glu Thr Gln Thr Gln Tyr Leu Thr Pro Ser Leu Ser Asp Ser His
1 5 10 15
Gln Gln Pro Pro Leu Val Trp Glu Leu Ile Arg Trp Leu Gln
20 25 30
<210> 61
<211> 30
<212> PRT
<213> 腺相关病毒3B
<400> 61
Met Ala Thr Gln Ser Gln Ser Gln Thr Leu Asn Leu Ser Glu Asn His
1 5 10 15
Gln Gln Pro Pro Gln Val Trp Asp Leu Ile Gln Trp Leu Gln
20 25 30
<210> 62
<211> 24
<212> PRT
<213> 腺相关病毒4
<400> 62
Met Glu Gln Ala Thr Asp Pro Leu Arg Asp Gln Leu Pro Glu Pro Cys
1 5 10 15
Leu Met Thr Val Arg Cys Val Gln
20
<210> 63
<211> 30
<212> PRT
<213> 腺相关病毒7
<400> 63
Met Ala Thr Gln Ser Gln Ser Pro Thr Leu Asn Leu Ser Glu Asn Leu
1 5 10 15
Gln Gln Arg Pro Leu Val Trp Asp Leu Val Gln Trp Leu Gln
20 25 30
<210> 64
<211> 30
<212> PRT
<213> 腺相关病毒8
<400> 64
Met Ala Thr Gln Ser Gln Phe Gln Thr Leu Asn Leu Ser Glu Asn Leu
1 5 10 15
Gln Gln Arg Pro Leu Val Trp Asp Leu Ile Gln Trp Leu Gln
20 25 30
<210> 65
<211> 30
<212> PRT
<213> 腺相关病毒10
<400> 65
Met Ala Ser Gln Ser Gln Ser Pro Thr Leu Asn Gln Ser Glu Asn His
1 5 10 15
Gln Gln Ala Pro Leu Val Trp Asp Leu Val Gln Trp Leu Gln
20 25 30
<210> 66
<211> 24
<212> PRT
<213> 腺相关病毒11
<400> 66
Met Glu Pro Glu Thr Asp Pro Leu Lys Asp Gln Ile Pro Ala Pro Cys
1 5 10 15
Leu Gln Thr Leu Lys Cys Val Gln
20
<210> 67
<211> 49
<212> PRT
<213> 腺相关病毒6
<220>
<221>变异体
<222> (14)..(14)
<223> /替代="Met"
<220>
<221> 位点
<222> (1)..(49)
<223> /标注=“序列中给出的变异体残基没有相对于注释中的那些有对变异体位置有偏好”
<400> 67
Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Leu Ala Thr
1 5 10 15
Gln Ser Gln Ser Pro Thr His Asn Leu Ser Glu Asn Leu Gln Gln Pro
20 25 30
Pro Leu Leu Trp Asp Leu Leu Gln Trp Leu Gly Gly Gly Ala Pro Met
35 40 45
Ala
<210> 68
<211> 49
<212> PRT
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成多肽
<220>
<221>变异体
<222> (14)..(14)
<223> /替代="Met"
<220>
<221> 位点
<222> (1)..(49)
<223> /标注=“序列中给出的变异体残基没有相对于注释中的那些有对变异体位置有偏好”
<400> 68
Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Leu Ala Thr
1 5 10 15
Gln Ser Gln Ser Gln Thr Leu Asn Gln Ser Glu Asn Leu Pro Gln Pro
20 25 30
Pro Gln Val Trp Asp Leu Leu Gln Trp Leu Gly Gly Gly Ala Pro Met
35 40 45
Ala
<210> 69
<211> 49
<212> PRT
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成多肽
<220>
<221>变异体
<222> (14)..(14)
<223> /替代="Met"
<220>
<221> 位点
<222> (1)..(49)
<223> /标注=“序列中给出的变异体残基没有相对于注释中的那些有对变异体位置有偏好”
<400> 69
Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Leu Ala Thr
1 5 10 15
Gln Ser Gln Ser Pro Thr His Asn Leu Ser Glu Asn Leu Gln Gln Pro
20 25 30
Pro Gln Val Trp Asp Leu Leu Gln Trp Leu Gly Gly Gly Ala Pro Met
35 40 45
Ala
<210> 70
<211> 49
<212> PRT
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成多肽
<220>
<221>变异体
<222> (14)..(14)
<223> /替代="Met"
<220>
<221> 位点
<222> (1)..(49)
<223> /标注=“序列中给出的变异体残基没有相对于注释中的那些有对变异体位置有偏好”
<400> 70
Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Leu Ala Thr
1 5 10 15
Gln Ser Gln Ser Pro Thr His Asn Leu Ser Glu Asn Leu Gln Gln Pro
20 25 30
Pro Gln Val Trp Asp Leu Leu Gln Trp Leu Gly Gly Gly Ala Pro Met
35 40 45
Ala
<210> 71
<211> 49
<212> PRT
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成多肽
<220>
<221>变异体
<222> (14)..(14)
<223> /替代="Met"
<220>
<221> 位点
<222> (1)..(49)
<223> /标注=“序列中给出的变异体残基没有相对于注释中的那些有对变异体位置有偏好”
<400> 71
Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Leu Ala Thr
1 5 10 15
Gln Ser Gln Ser Pro Thr His Asn Leu Ser Glu Asn Leu Gln Gln Pro
20 25 30
Pro Gln Val Trp Asp Leu Leu Gln Trp Leu Gly Gly Gly Ala Pro Met
35 40 45
Ala
<210> 72
<211> 49
<212> PRT
<213> 人工序列
<220>
<221>来源
<223> /标注=“人工序列的描述:合成多肽
<220>
<221>变异体
<222> (14)..(14)
<223> /替代="Met"
<220>
<221> 位点
<222> (1)..(49)
<223> /标注=“序列中给出的变异体残基没有相对于注释中的那些有对变异体位置有偏好”
<400> 72
Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Leu Ala Thr
1 5 10 15
Gln Ser Gln Ser Pro Thr His Asn Leu Ser Glu Asn Leu Gln Gln Pro
20 25 30
Pro Leu Leu Trp Asp Leu Leu Gln Trp Leu Gly Gly Gly Ala Pro Met
35 40 45
Ala
<210> 73
<211> 51
<212> PRT
<213> 腺相关病毒6
<400> 73
Asp Ser Ser Ser Gly Ile Gly Lys Thr Gly Gln Gln Pro Ala Lys Lys
1 5 10 15
Arg Leu Asn Phe Gly Gln Thr Gly Asp Ser Glu Ser Val Pro Asp Pro
20 25 30
Gln Pro Leu Gly Glu Pro Pro Ala Thr Pro Ala Ala Val Gly Pro Thr
35 40 45
Thr Met Ala
50

Claims (20)

1.一种昆虫细胞,其包含:包含针对Rep78的表达盒的第一杆状病毒载体及包含针对Rep52的表达盒的第二杆状病毒载体,其中该第一载体及该第二载体进一步包含(i)分别针对VP1的表达盒及VP2/VP3的表达盒;或(ii)分别针对VP2/VP3的表达盒及VP1的表达盒。
2.如权利要求1的昆虫细胞,其中该Rep78表达盒及该Rep52表达盒包含相同的昆虫启动子。
3.如权利要求1或2的昆虫细胞,其中该Rep78表达盒包含针对Rep78编码序列的非典型起始密码子,其中该密码子任选地为ACG、TTG、GTG或CTG。
4.如权利要求1-3中任一项的昆虫细胞,其中该VP1表达盒及该VP2/VP3表达盒包含相同的昆虫启动子。
5.如权利要求1-4中任一项的昆虫细胞,其中该VP1、VP2及VP3蛋白质包含来自相同AAV血清型或来自超过一种AAV血清型的氨基酸序列。
6.如权利要求5的昆虫细胞,其中该VP1、VP2及/或VP3蛋白质包含来自AAV1、AAV2、AAV3(任选地AAV3B)、AAV6及/或AAV9的氨基酸序列。
7.如权利要求1-6中任一项的昆虫细胞,其中该Rep78及Rep52蛋白质源于来自VP1、VP2及/或VP3蛋白质的不同AAV血清型。
8.如权利要求1-7中任一项的昆虫细胞,其中
(i)该VP1包含具有或不具有第一氨基酸残基的SEQ ID NO:1、SEQ ID NO:7或SEQ IDNO:16;
该VP2包含SEQ ID NO:1或SEQ ID NO:7的氨基酸残基138至736或139至736,或包含具有或不具有该第一氨基酸残基的SEQ ID NO:18;及
该VP3包含SEQ ID NO:1的氨基酸残基204至736或205至736或SEQ ID NO:7的氨基酸残基203至736或204至736,或包含具有或不具有该第一氨基酸残基的SEQ ID NO:19;或
(ii)该VP1包含具有或不具有该第一氨基酸残基的SEQ ID NO:24;
该VP2包含SEQ ID NO:24的氨基酸残基138至736或139至736;及
该VP3包含SEQ ID NO:24的氨基酸残基203至736或204至736;或
(iii)该VP1包含具有或不具有该第一氨基酸残基的SEQ ID NO:25;
该VP2包含SEQ ID NO:25的氨基酸残基138至735或139至735;及
该VP3包含SEQ ID NO:25的203至735或204至735;或
(iv)该VP1包含具有或不具有该第一氨基酸残基的SEQ ID NO:26;
该VP2包含SEQ ID NO:26的氨基酸残基138至736或139至736;及
该VP3包含SEQ ID NO:26的氨基酸残基203至736或204至736;或
(v)该VP1包含具有或不具有该第一氨基酸残基的SEQ ID NO:27;
该VP2包含SEQ ID NO:27的氨基酸残基138至736或139至736;及
该VP3包含SEQ ID NO:27的氨基酸残基203至736或204至736;及
任选地,其中该Rep78包含具有或不具有该第一氨基酸残基的SEQ ID NO:21;及/或该Rep52包含具有或不具有该第一氨基酸残基的SEQ ID NO:23。
9.如权利要求1-8中任一项的昆虫细胞,其中该Rep78、Rep52、VP1及VP2/VP3表达盒各自包含选自多面体启动子、IE-1启动子及p10启动子的昆虫启动子。
10.如权利要求1-9中任一项的昆虫细胞,其中该第一杆状病毒载体包含VP2/VP3的表达盒,且该第二杆状病毒载体包含VP1的表达盒。
11.如权利要求1-10中任一项的昆虫细胞,其中该第一载体及第二载体中的一或两者稳定地整合至该昆虫细胞的基因体中。
12.如权利要求1-11中任一项的昆虫细胞,其中该细胞系Sf9或Sf21细胞。
13.如权利要求1-12中任一项的昆虫细胞,其进一步包含重组AAV基因体的编码序列,其中该重组AAV基因体包含
处于哺乳动物启动子的转录控制下的所关注的转基因的表达盒,及
处于两个末端上的AAV反向末端重复序列(inverted terminalrepeat,ITR)。
14.如权利要求13的昆虫细胞,其中该重组AAV基因体的该编码序列位于第一载体或第二载体上,或位于第三载体上。
15.如权利要求13或14的昆虫细胞,其中该所关注的转基因编码治疗蛋白质,该蛋白质任选地选自锌指蛋白(zinc finger protein,ZFP)转录因子及功能在基因疾病中缺失或不足的蛋白质。
16.如权利要求13或14的昆虫细胞,其中该所关注的转基因编码基因编辑蛋白质,该蛋白质任选地选自锌指核酸酶、ZFP脱胺酶、ZFP重组酶、TALEN、CRISPR Cas蛋白质及CRISPRCpf蛋白质。
17.一种生产重组AAV病毒粒子的方法,其包含:
提供如权利要求13至16中任一项的昆虫细胞;
在允许该重组AAV基因体的表现及将该重组AAV基因体封装在包含VP1、VP2及VP3蛋白质的AAV衣壳内的条件下培养该昆虫细胞;及
自该培养物分离出该重组AAV病毒粒子。
18.一种重组AAV病毒粒子,其在如权利要求13至16中任一项的昆虫细胞中产生或藉由如权利要求17的方法产生。
19.一种医药组合物,其包含如权利要求18中的重组AAV病毒粒子和药学上可接受的载体。
20.在如权利要求1-16中任一项的表达盒的组合。
CN202080084068.6A 2019-12-04 2020-12-04 用于生产重组aav的新颖组合物及方法 Pending CN114981442A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962943715P 2019-12-04 2019-12-04
US62/943,715 2019-12-04
PCT/US2020/063481 WO2021113767A1 (en) 2019-12-04 2020-12-04 Novel compositions and methods for producing recombinant aav

Publications (1)

Publication Number Publication Date
CN114981442A true CN114981442A (zh) 2022-08-30

Family

ID=74046186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080084068.6A Pending CN114981442A (zh) 2019-12-04 2020-12-04 用于生产重组aav的新颖组合物及方法

Country Status (10)

Country Link
US (1) US20230020565A1 (zh)
EP (1) EP4069856A1 (zh)
JP (1) JP2023504550A (zh)
KR (1) KR20220110781A (zh)
CN (1) CN114981442A (zh)
AU (1) AU2020398178A1 (zh)
CA (1) CA3163576A1 (zh)
IL (1) IL293397A (zh)
TW (1) TW202134440A (zh)
WO (1) WO2021113767A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023025920A1 (en) 2021-08-26 2023-03-02 Uniqure Biopharma B.V. Insect cell-produced high potency aav vectors with cns-tropism
CN113897396B (zh) * 2021-09-18 2022-08-30 劲帆生物医药科技(武汉)有限公司 一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒及其应用
WO2023060264A1 (en) 2021-10-08 2023-04-13 Dyno Therapeutics, Inc. Capsid variants and methods of using the same

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030148506A1 (en) * 2001-11-09 2003-08-07 The Government Of The United States Of America, Department Of Health And Human Services Production of adeno-associated virus in insect cells
US20090191597A1 (en) * 2006-01-20 2009-07-30 Asklepios Biopharmaceutical, Inc. Enhanced production of infectious parvovirus vectors in insect cells
WO2019016349A1 (en) * 2017-07-20 2019-01-24 Uniqure Ip B.V. PRODUCTION OF ENHANCED VAA CAPSIDS IN INSECT CELLS
CN113728108A (zh) * 2019-02-15 2021-11-30 桑格摩生物治疗股份有限公司 用于生产重组aav的组合物和方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003042361A2 (en) * 2001-11-09 2003-05-22 Government Of The United States Of America, Department Of Health And Human Services Production of adeno-associated virus in insect cells
PT3272872T (pt) 2005-10-20 2020-06-26 Uniqure Ip Bv Vetores aav melhorados produzidos em células de insetos
CN103849629B (zh) 2006-06-21 2017-06-09 尤尼克尔Ip股份有限公司 具有经修饰的用于在昆虫细胞中产生aav的aav‑rep78翻译起始密码子的载体
ES2385679T3 (es) 2006-08-24 2012-07-30 Virovek, Inc. Expresión de células de insecto de genes con marcos de lectura abiertos superpuestos, métodos y composiciones de éstos
WO2009104964A1 (en) 2008-02-19 2009-08-27 Amsterdam Molecular Therapeutics B.V. Optimisation of expression of parvoviral rep and cap proteins in insect cells
AU2012304993B2 (en) 2011-09-08 2017-09-14 Uniqure Ip B.V. Removal of contaminating viruses from AAV preparations
CN110214184B (zh) 2016-12-01 2024-07-02 桑格摩生物治疗股份有限公司 τ蛋白调节剂以及用于其递送的方法和组合物
AU2019355433A1 (en) 2018-10-02 2021-05-06 Sangamo Therapeutics, Inc. Methods and compositions for modulation of tau proteins

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030148506A1 (en) * 2001-11-09 2003-08-07 The Government Of The United States Of America, Department Of Health And Human Services Production of adeno-associated virus in insect cells
US20090191597A1 (en) * 2006-01-20 2009-07-30 Asklepios Biopharmaceutical, Inc. Enhanced production of infectious parvovirus vectors in insect cells
WO2019016349A1 (en) * 2017-07-20 2019-01-24 Uniqure Ip B.V. PRODUCTION OF ENHANCED VAA CAPSIDS IN INSECT CELLS
CN111183225A (zh) * 2017-07-20 2020-05-19 优尼科Ip有限公司 在昆虫细胞中改进的aav衣壳产生
CN113728108A (zh) * 2019-02-15 2021-11-30 桑格摩生物治疗股份有限公司 用于生产重组aav的组合物和方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
D S IM 等: "Partial purification of adeno-associated virus Rep78, Rep52, and Rep40 and their biochemical characterization", 《J VIROL.》, 29 February 1992 (1992-02-29) *
夏玉龙: "应用昆虫细胞表达系统生产用于基因治疗的重组腺相关病毒的研究", 《中国优秀硕士学位论文全文数据库(电子期刊)》, 15 February 2013 (2013-02-15) *

Also Published As

Publication number Publication date
WO2021113767A1 (en) 2021-06-10
US20230020565A1 (en) 2023-01-19
JP2023504550A (ja) 2023-02-03
KR20220110781A (ko) 2022-08-09
TW202134440A (zh) 2021-09-16
AU2020398178A1 (en) 2022-06-09
IL293397A (en) 2022-07-01
EP4069856A1 (en) 2022-10-12
CA3163576A1 (en) 2021-06-10

Similar Documents

Publication Publication Date Title
JP7523211B2 (ja) アデノ随伴ウイルス第viii因子ベクター
AU2017301600B2 (en) Novel adeno-associated virus capsid proteins
KR102572449B1 (ko) 곤충 세포에서 생산된 더욱 향상된 aav 벡터
Mietzsch et al. OneBac 2.0: Sf 9 Cell Lines for Production of AAV1, AAV2, and AAV8 Vectors with Minimal Encapsidation of Foreign DNA
Mietzsch et al. OneBac 2.0: Sf 9 cell lines for production of AAV5 vectors with enhanced infectivity and minimal encapsidation of foreign DNA
KR101597695B1 (ko) 차등 코돈 바이어스를 갖는 반복 암호 서열을 포함하는 배큘로바이러스 벡터
Mietzsch et al. OneBac: platform for scalable and high-titer production of adeno-associated virus serotype 1–12 vectors for gene therapy
CN114981442A (zh) 用于生产重组aav的新颖组合物及方法
KR20200130337A (ko) Aav 키메라
WO2009154452A1 (en) Parvoviral capsid with incorporated Gly-Ala repeat region
US20240167002A1 (en) Compositions and Methods for Producing Recombinant AAV
JP2023519502A (ja) Aav生成のための二重二官能基ベクター
WO2003104392A9 (en) IMPROVED REAGENTS AND METHODS FOR PRODUCING PARVOVIRUSES
Youjin et al. The treatment of hemophilia A: from protein replacement to AAV-mediated gene therapy
CN114736928A (zh) 一种杆状病毒载体及其在昆虫细胞中制备rAAV的应用
CN115851837A (zh) 一种提高杆状病毒系统生产腺相关病毒的方法及应用
EA042960B1 (ru) Молекула нуклеиновой кислоты, конструкция нуклеиновой кислоты, клетка насекомого и способ получения aav в клетке насекомого

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination