CN117716042A

CN117716042A - 腺相关病毒包装系统

Info

Publication number: CN117716042A
Application number: CN202280044370.8A
Authority: CN
Inventors: L·范利舒特; M·斯坦维克
Original assignee: Oxford Biomedica US LLC
Current assignee: Oxford Biomedica US LLC
Priority date: 2021-06-25
Filing date: 2022-06-24
Publication date: 2024-03-15

Abstract

本文提供了用于产生重组腺相关病毒(rAAV)的双重载体转染系统。所述双重载体转染系统通常包含：(1)第一核酸载体，其包含：编码AAV Rep蛋白的第一核苷酸序列、包含含有转基因的rAAV基因组的第二核苷酸序列和编码AAV衣壳蛋白的第三核苷酸序列；和(2)第二核酸载体，其包含辅助病毒基因。

Description

腺相关病毒包装系统

相关申请

本申请要求于2021年6月25日提交的美国临时专利申请序列号63/202,817、于2021年10月7日提交的美国临时专利申请序列号63/262,218和于2022年1月11日提交的美国临时专利申请序列号63/266,646的优先权，这些申请的全部公开内容特此通过引用并入本文。

序列表

本申请含有以ASCII格式以电子方式提交，并且特此通过引用整体并入本文的序列表(2022年6月21日创建的所述ASCII副本命名为“HMW-043_SL.txt”且大小为336,866字节)。

背景技术

腺相关病毒(AAV)具有独特的特征，这些独特的特征使其作为用于将外源DNA递送到细胞中用于基因治疗目的的载体具有吸引力。AAV的商业制造通常采用哺乳动物细胞或昆虫细胞系统。基于哺乳动物细胞的商业AAV生产系统通常涉及将三种质粒转染到细胞中：含有编码AAV Rep和AAV衣壳蛋白的序列的第一质粒；含有AAV载体基因组的第二质粒；和含有一个或多个辅助病毒基因(通常是腺病毒或疱疹病毒基因)的第三质粒。尽管有效，但是此三种质粒AAV制造系统优化复杂并且促成与商业AAV治疗剂相关的商品的高成本。

因此，本领域需要改进的AAV制造系统，这些系统导致有效的AAV生产，但具有降低的复杂性和成本。

发明内容

本公开提供了用于产生重组腺相关病毒(rAAV)的双重载体转染系统。本文所述的双重载体转染系统通常包含：(1)第一核酸载体，其包含：编码AAV Rep蛋白的第一核苷酸序列、包含含有转基因的rAAV基因组的第二核苷酸序列和编码AAV衣壳蛋白的第三核苷酸序列；和(2)第二核酸载体，其包含辅助病毒基因。在此类双重载体转染系统中，第一核酸载体和第二核酸载体与宿主生产细胞一起提供AAV产生所需的所有组分。已经发现，与常规的三重载体转染系统相比，本文公开的双重载体转染系统导致增加的rAAV生产率。另外，发现本文所述的双重载体转染系统中组分的特定组织会产生优于现有技术双重载体转染系统的rAAV生产率。

因此，在一个方面，本公开提供了第一核酸载体，其包含：编码AAV Rep蛋白的第一核苷酸序列；包含含有转基因的重组AAV(rAAV)基因组的第二核苷酸序列；以及编码AAV衣壳蛋白的第三核苷酸序列；其中所述核酸载体不包含辅助病毒基因。

在某些实施方案中，所述核酸载体从5'至3’包含：编码AAVRep蛋白的第一核苷酸序列；包含含有转基因的重组AAV(rAAV)基因组的第二核苷酸序列；以及编码AAV衣壳蛋白的第三核苷酸序列；其中所述核酸载体不包含辅助病毒基因。

在某些实施方案中，所述核酸载体从5'至3’包含：编码AAVRep蛋白的第一核苷酸序列；包含含有转基因的重组AAV(rAAV)基因组的第二核苷酸序列；以及编码AAV衣壳蛋白的第三核苷酸序列；其中所述核酸载体不包含辅助病毒基因，并且其中所述转基因不选自苯丙氨酸羟化酶(PAH)、芳基硫酸酯酶A(ARSA)、艾杜糖醛酸2-硫酸酯酶(I2S)和抗补体组分5(C5)抗体。

在某些实施方案中，所述核酸载体从5'至3'包含：编码AAVRep蛋白的第一核苷酸序列；包含含有转基因的重组AAV(rAAV)基因组的第二核苷酸序列；和编码AAV衣壳蛋白的第三核苷酸序列，其中所述核酸载体不包含辅助病毒基因，并且其中所述AAV衣壳蛋白不包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少95％同一性的氨基酸序列，其中衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C；衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H；衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q；衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A；衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N；衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S；衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I；衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y；衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M；衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K；衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C；或者，衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。

在某些实施方案中，所述核酸载体从5'至3'包含：编码AAVRep蛋白的第一核苷酸序列；包含含有转基因的重组AAV(rAAV)基因组的所述第二核苷酸序列；和编码AAV衣壳蛋白的第三核苷酸序列，其中所述核酸载体不包含辅助病毒基因，并且其中(i)所述转基因不选自苯丙氨酸羟化酶(PAH)、芳基硫酸酯酶A(ARSA)、艾杜糖醛酸2-硫酸酯酶(I2S)和抗补体组分5(C5)抗体，并且(ii)所述AAV衣壳蛋白不包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少95％同一性的氨基酸序列，其中衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C；衣壳蛋白中对应于SEQ IDNO:16的氨基酸296的氨基酸是H；衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q；衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A；衣壳蛋白中对应于SEQ IDNO:16的氨基酸464的氨基酸是N；衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S；衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I；衣壳蛋白中对应于SEQ IDNO:16的氨基酸505的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y；衣壳蛋白中对应于SEQID NO:16的氨基酸681的氨基酸是M；衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K；衣壳蛋白中对应于SEQID NO:16的氨基酸706的氨基酸是C；或者，衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。

在某些实施方案中，所述核酸载体从5'至3'包含：编码AAVRep蛋白的第一核苷酸序列；包含含有转基因的重组AAV(rAAV)基因组的所述第二核苷酸序列；以及编码AAV衣壳蛋白的所述第三核苷酸序列。

在某些实施方案中，所述核酸载体是DNA质粒或DNA最小载体。

在另一方面，本公开提供了重组AAV(rAAV)包装系统，其包含：(i)第一核酸载体，其包含：编码AAV Rep蛋白的第一核苷酸序列；包含含有转基因的重组AAV(rAAV)基因组的第二核苷酸序列；和编码AAV衣壳蛋白的第三核苷酸序列，和(ii)包含辅助病毒基因的第二核酸载体。

在某些实施方案中，所述第一核酸载体从5'至3'包含：编码AAV Rep蛋白的第一核苷酸序列；包含含有转基因的重组AAV(rAAV)基因组的所述第二核苷酸序列；以及编码AAV衣壳蛋白的所述第三核苷酸序列。在某些实施方案中，所述转基因不选自苯丙氨酸羟化酶(PAH)、芳基硫酸酯酶A(ARSA)、艾杜糖醛酸2-硫酸酯酶(I2S)和抗补体组分5(C5)抗体。在某些实施方案中，AAV衣壳蛋白不包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少95％同一性的氨基酸序列，其中衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C；衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H；衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q；衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A；衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N；衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S；衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I；衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y；衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M；衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K；衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C；或者，衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。在某些实施方案中，所述转基因不选自苯丙氨酸羟化酶(PAH)、芳基硫酸酯酶A(ARSA)、艾杜糖醛酸2-硫酸酯酶(I2S)和抗补体组分5(C5)抗体，并且所述AAV衣壳蛋白不包含与SEQ IDNO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少95％同一性的氨基酸序列，其中衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C；衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H；衣壳蛋白中对应于SEQ IDNO:16的氨基酸312的氨基酸是Q；衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A；衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N；衣壳蛋白中对应于SEQ IDNO:16的氨基酸468的氨基酸是S；衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I；衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R；衣壳蛋白中对应于SEQ IDNO:16的氨基酸590的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y；衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M；衣壳蛋白中对应于SEQID NO:16的氨基酸687的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K；衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C；或者，衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。

在某些实施方案中，所述第一核酸载体是DNA质粒或DNA最小载体。在某些实施方案中，所述第二核酸载体是DNA质粒或DNA最小载体。

在某些实施方案中，所述转基因编码多肽。在某些实施方案中，所述转基因编码miRNA、shRNA、siRNA、反义RNA、gRNA、antagomir、miRNA海绵(miRNA sponge)、RNA适体核酶(aptazyme)、RNA适体、lncRNA、核酶或mRNA。在某些实施方案中，所述转基因编码选自苯丙氨酸羟化酶(PAH)、葡萄糖-6-磷酸酶(G6Pase)、艾杜糖醛酸-2-硫酸酯酶(I2S)、芳基硫酸酯酶A(ARSA)和共济蛋白(FXN)的蛋白质。在某些实施方案中，所述转基因编码葡萄糖-6-磷酸酶(G6Pase)或共济蛋白(FXN)。

在某些实施方案中，rAAV基因组还包含与转基因可操作地连接的转录调控元件。在某些实施方案中，转录调控元件包括启动子元件和/或内含子元件。

在某些实施方案中，rAAV基因组还包含多聚腺苷酸化序列。在某些实施方案中，多聚腺苷酸化序列在转基因的3'。

在某些实施方案中，rAAV基因组包含与SEQ ID NO:71、85、86、87或88所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。

在某些实施方案中，rAAV基因组还包含在所述转基因的5’的5’反向末端重复(5’ITR)核苷酸序列和在所述转基因的3’的3'反向末端重复(3’ITR)核苷酸序列。在某些实施方案中，5’ITR核苷酸序列与SEQ ID NO:39、41或42中所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性，和/或3’ITR核苷酸序列与SEQ ID NO:40、43或44中所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性。

在某些实施方案中，rAAV基因组包含与SEQ ID NO:75、78、80、82或84所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。

在某些实施方案中，AAVRep蛋白是野生型Rep蛋白或其变体。在某些实施方案中，AAVRep蛋白是AAV2 Rep蛋白或其变体。

在某些实施方案中，第一核苷酸序列还包含与AAV Rep蛋白编码序列可操作地连接的转录调控元件。在某些实施方案中，所述转录调控元件包括启动子，所述启动子选自组成型启动子、诱导型启动子或天然启动子。在某些实施方案中，所述启动子选自P5启动子、P19启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。

在某些实施方案中，AAV衣壳蛋白选自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh10、AAVRh32.33、AAVrh74、AAV-DJ、AAV-LK03、NP59、VOY101、VOY201、VOY701、VOY801、VOY1101、AAVPHP.N、AAVPHP.A、AAVPHP.B、PHP.B2、PHP.B3、G2A3、G2B4、G2B5和PHP.S。在某些实施方案中，AAV衣壳蛋白选自AAV1、AAV2、AAV5、AAV6、AAV8、AAV9、AAVrh10和AAVrh74。在某些实施方案中，AAV衣壳蛋白选自AAV1、AAV2、AAV5、AAV6、AAV8和AAVrh74。

在某些实施方案中，AAV衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少85％同一性的氨基酸序列。

在某些实施方案中，衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C；衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H；衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q；衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A；衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N；衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S；衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I；衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y；衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M；衣壳蛋白中对应于SEQ IDNO:16的氨基酸687的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K；衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C；或者，衣壳蛋白中对应于SEQID NO:16的氨基酸718的氨基酸是G。

在某些实施方案中，(a)衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G；(b)衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H，衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N，衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M；(c)衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R；(d)衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A，并且衣壳蛋白中对应于SEQ IDNO:16的氨基酸505的氨基酸是R；或(e)衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I，衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C。

在某些实施方案中，AAV衣壳蛋白包含SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列。

在某些实施方案中，AAV衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少85％同一性的氨基酸序列。

在某些实施方案中，衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸160的氨基酸是D；衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C；衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H；衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q；衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A；衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N；衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S；衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I；衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y；衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M；衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R；衣壳蛋白中对应于SEQ IDNO:16的氨基酸690的氨基酸是K；衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C；或者，衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。

在某些实施方案中，AAV衣壳蛋白包含SEQ ID NO:1、2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列。

在某些实施方案中，AAV衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少85％同一性的氨基酸序列。

在某些实施方案中，衣壳蛋白中对应于SEQ ID NO:16的氨基酸2的氨基酸是T；衣壳蛋白中对应于SEQ ID NO:16的氨基酸65的氨基酸是I；衣壳蛋白中对应于SEQ ID NO:16的氨基酸68的氨基酸是V；衣壳蛋白中对应于SEQ ID NO:16的氨基酸77的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸119的氨基酸是L；衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸160的氨基酸是D；衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C；衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H；衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q；衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A；衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N；衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S；衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I；衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y；衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M；衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K；衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C；或者，衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。

在某些实施方案中，(a)衣壳蛋白中对应于SEQ ID NO:16的氨基酸2的氨基酸是T，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q；(b)衣壳蛋白中对应于SEQID NO:16的氨基酸65的氨基酸是I，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是Y；(c)衣壳蛋白中对应于SEQ ID NO:16的氨基酸77的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K；(d)衣壳蛋白中对应于SEQ ID NO:16的氨基酸119的氨基酸是L，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S；(e)衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G，并且衣壳蛋白中对应于SEQ IDNO:16的氨基酸718的氨基酸是G；(f)衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H，衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N，衣壳蛋白中对应于SEQID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M；(g)衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R；(h)衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R；或衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I，衣壳蛋白中对应于SEQ IDNO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C。

在某些实施方案中，AAV衣壳蛋白包含SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列。

在某些实施方案中，第三核苷酸序列还包含与AAV衣壳蛋白编码序列可操作地连接的转录调控元件。在某些实施方案中，所述转录调控元件包括启动子，所述启动子选自组成型启动子、诱导型启动子或天然启动子。在某些实施方案中，所述启动子选自P40启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。

在某些实施方案中，第一核酸载体包含与SEQ ID NO:73或77所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。

在某些实施方案中，第二核苷酸序列包含与SEQ ID NO:71、75、78、80、82、84、85、86、87或88所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列。

在某些实施方案中，第一核苷酸序列包含与SEQ ID NO:50、51、52、53、54、55、56、57、58或59中所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列；第二核苷酸序列包含与SEQID NO:71、75、78、80、82、84、85、86、87或88中所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列；并且第三核苷酸序列编码与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736、138-736和/或1-736的氨基酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的氨基酸序列。

在某些实施方案中，第一核酸载体从5'至3'包含：第一核苷酸序列；第二核苷酸序列；和第三核苷酸序列。

在某些实施方案中，辅助病毒基因源自选自腺病毒、疱疹病毒、痘病毒、巨细胞病毒和杆状病毒的辅助病毒。在某些实施方案中，辅助病毒基因是源自选自E1、E2、E4和VA的腺病毒的RNA基因。在某些实施方案中，辅助病毒基因是源自选自UL5/8/52、ICP0、ICP4、ICP22和UL30/UL42的疱疹病毒的基因。

在某些实施方案中，第二核酸载体还包含与所述辅助病毒基因可操作地连接的转录调控元件。在某些实施方案中，所述转录调控元件包括启动子，所述启动子选自组成型启动子、诱导型启动子或天然启动子。在某些实施方案中，所述启动子选自RSV LTR启动子、CMV立即早期启动子、SV40启动子、二氢叶酸还原酶启动子、细胞质β-肌动蛋白启动子、磷酸甘油酸激酶(PGK)启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。

在某些实施方案中，第二核酸载体包含与SEQ ID NO:60、61或62所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。

在某些实施方案中，第二核酸载体包含与SEQ ID NO:63所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。

在另一方面，本公开提供了包含本文所述的核酸载体或本文所述的包装系统的宿主细胞。本公开还提供了此类宿主细胞的群体。在某些实施方案中，宿主细胞的群体在细胞培养物中提供。在某些实施方案中，细胞培养物的体积为至少2升、至少50升或至少2000升。在某些实施方案中，细胞培养物的体积为约2升至约5000升。在某些实施方案中，细胞培养物的体积为约2升至约4000升。在某些实施方案中，细胞培养物的体积为约2升至约3000升。在某些实施方案中，细胞培养物的体积为约2升至约2500升。在某些实施方案中，细胞培养物的体积为约2升至约2000升。在某些实施方案中，细胞培养物的体积为约2升至约1500升。在某些实施方案中，细胞培养物的体积为约2升至约1000升。在某些实施方案中，细胞培养物的体积为约2升至约500升。在某些实施方案中，细胞培养物的体积为约2升至约250升。在某些实施方案中，细胞培养物的体积为约2升至约100升。在某些实施方案中，细胞培养物的体积为约2升至约50升。在某些实施方案中，细胞培养物的体积为约2升至约25升。

在某些实施方案中，宿主细胞是哺乳动物细胞。在某些实施方案中，所述哺乳动物细胞选自COS细胞、CHO细胞、BHK细胞、MDCK细胞、HEK293细胞、HEK293T细胞、HEK293F细胞、NS0细胞、PER.C6细胞、VERO细胞、CRL7O3O细胞、HsS78Bst细胞、HeLa细胞、NIH 3T3细胞、HepG2细胞、SP210细胞、R1.1细胞、B-W细胞、L-M细胞、BSC1细胞、BSC40细胞、YB/20细胞和BMT10细胞。在某些实施方案中，所述哺乳动物细胞是HEK293细胞。

在另一个方面，本公开提供了一种rAAV的重组制备方法，所述方法包括在产生rAAV的条件下将本文所述的包装系统引入哺乳动物细胞中。

在某些实施方案中，第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率选自1:0.2、1:0.4、1:0.6、1:0.8、1:1、1:2、1:3或1:4。在某些实施方案中，第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:2。在某些实施方案中，第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:0.2至1:1。在某些实施方案中，第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:0.6。在某些实施方案中，第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:0.8。在某些实施方案中，第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:1。

在某些实施方案中，所述方法包括引入所述包装系统的0.1至4μg DNA/1E6个细胞。在某些实施方案中，所述方法包括引入所述包装系统的0.5至1μg DNA/1E6个细胞。在某些实施方案中，所述方法包括引入所述包装系统的0.6、0.7、0.8、0.9或1μg DNA/1E6个细胞。在某些实施方案中，所述方法包括引入所述包装系统的0.75μg DNA/1E6个细胞。

在某些实施方案中，第一核酸载体与第二载体核酸的比率为1:2、1:3或1:4。在某些实施方案中，第一核酸载体与第二载体核酸的比率为1:2。

在某些实施方案中，所述方法与包括使用以下哺乳动物细胞产生rAAV的方法相比导致增加的rAAV滴度，所述哺乳动物细胞包含：(i)包含编码所述AAVRep蛋白和所述AAV衣壳蛋白的核苷酸序列的第一载体；(ii)包含所述rAAV基因组的第二载体；以及(iii)包含所述一种或多种辅助病毒基因的第三载体。

在某些实施方案中，所述方法与包括使用以下哺乳动物细胞产生rAAV的方法相比导致增加的完整载体基因组的百分比，所述哺乳动物细胞包含：(i)包含编码所述AAVRep蛋白和所述AAV衣壳蛋白的核苷酸序列的第一载体；(ii)包含所述rAAV基因组的第二载体；以及(iii)包含所述一种或多种辅助病毒基因的第三载体。

在某些实施方案中，所述哺乳动物细胞选自COS细胞、CHO细胞、BHK细胞、MDCK细胞、HEK293细胞、HEK293T细胞、HEK293F细胞、NS0细胞、PER.C6细胞、VERO细胞、CRL7O3O细胞、HsS78Bst细胞、HeLa细胞、NIH 3T3细胞、HepG2细胞、SP210细胞、R1.1细胞、B-W细胞、L-M细胞、BSC1细胞、BSC40细胞、YB/20细胞和BMT10细胞。在某些实施方案中，所述哺乳动物细胞是HEK293细胞。

附图说明

图1A-图1C是显示使用三重载体转染系统(1)和双重载体转染系统(2)从小规模rAAV生产获得的病毒基因组(VG)生产率(图1A)、衣壳生产率(图1B)和完整载体基因组的百分比(图1C)的图。

图2A-图2C是显示使用三重载体转染系统(1和3)和双重载体转染系统(2和4)从小规模rAAV生产获得的VG生产率(图2A)、衣壳生产率(图2B)和完整载体基因组的百分比(图2C)的图。测定两种不同的rAAV基因编辑载体的rAAV生产率：人特异性基因编辑载体(1和2)和小鼠特异性载体(3和4)。各种条件列于表3中。

图3A-图3C是显示rAAV双重载体转染系统设计-1(图3A)、设计-2(图3B)和设计-3(图3C)的示意图。

图4A-图4C是显示使用双重载体转染系统设计-1(1-3)、双重载体转染系统设计-2(4-6)和三重载体转染系统(7)从小规模rAAV生产获得的VG生产率(图4A)、衣壳生产率(图4B)和完整载体基因组的百分比(图4C)的图。测试的双重载体转染系统设计如图3A和图3B所描绘。对于测试的每个双重载体转染系统设计，用三种不同的转基因载体与辅助载体比率进行转染：1:0.5(1和4)、1:1(2和5)和1:3(3和6)。各种转染条件列于表4中。

图5A-图5C是显示使用双重载体转染系统设计-1(1)、双重载体转染系统设计-2(2)、双重载体转染系统设计-3(3)和三重载体转染系统(4)从小规模rAAV生产获得的VG生产率(图5A)、衣壳生产率(图5B)和完整载体基因组的百分比(图5C；“％完全”)。测试的双重载体转染系统设计如图3A-图3C所描绘。各种转染条件列于表5中。

图6A-图6C是显示使用双重载体转染系统设计-1以各种转基因载体与辅助载体比率：1:2(“双重1:2”)、1:3(“双重1:3”)和1:4(“双重1:4”)以及用三重载体转染系统(三重)从2L规模rAAV生产获得的VG生产率(图6A)、衣壳生产率(图6B)和完整载体基因组的百分比(图6C)的图。测试了六种不同的rAAV载体基因组(1-6)。条件1-5使用AAVHSC15衣壳，且条件6使用AAVHSC17衣壳。各种转染条件列于表6中。

图7A-图7C是显示使用双重载体转染系统设计-1(2TFX)和三重载体转染系统(3TFX)，利用AAV2衣壳从小规模rAAV生产获得的VG生产率(图7A)、衣壳生产率(图7B)和完整载体基因组的百分比(图7C)的图。各种转染条件列于表6中。

图8是显示使用设计-1双重质粒系统从rAAV生产获得的完整载体基因组的数目的图，在每种情况下该数目表示为相对于从相应的三重质粒系统对照获得的完整载体基因组的数目的百分比增加。测试了四种不同的rAAV载体基因组(1-4)。条件1-3使用AAVHSC15衣壳，且条件4使用AAVHSC17衣壳。各种转染条件列于表7中。

图9是显示来自双重载体转染系统设计-1和设计-2的衣壳生成水平的图，其中衣壳生成水平来自含有每种相应设计的Rep/Cap序列的载体。各种转染条件列于表8中。

图10A-图10C是显示使用双重载体转染系统设计-1(2TFX)和三重载体转染系统(3TFX)从50L生物反应器rAAV生产获得的VG生产率(图10A)、衣壳生产率(图10B)和完整载体基因组的百分比(图10C)的图。转染条件列于表6，条件4，设计-1的载体比率为1:2，以及相关的三重转染对照。图10D-图10F是显示使用2TFX和3TFX系统获得的纯化AAV载体中的纯度百分比(图10D)、聚集百分比(图10E)和残留宿主细胞蛋白水平(图10F)的图。图10G-10J是显示使用2TFX和3TFX系统获得的纯化AAV载体中包装的残留宿主细胞DNA(图10G)、Rep/Cap(图10H)、E1a(图10I)和辅助序列(图10J)的量的图。在图10F和图10I中，水平虚线指示测定的检测限，其中确定样品低于定量限(BLoQ)。ns意指不显著；*意指p<0.05统计学显著；并且***意指p<0.001统计学显著性。

图11A-图11B是显示以1E12个VG/kg(图11A)和1E14个VG/kg(图11B)的剂量，施用从表6中对于设计1(2TFX)而言载体比率为1:4和相关三重转染对照(3TFX)的条件5获得的AAV载体的Pah^enu2小鼠的血清中测得的苯丙氨酸(Phe)水平的图。进行仅媒介物的施用作为对照(媒介物)。图11C-图11E是显示在给药后6周，在治疗的小鼠中的肝脏中载体基因组(图11C)、转基因表达(图11D)和中靶整合(图11E)的定量的图。ns意指不显著。

图12A-图12C是显示使用双重载体转染系统设计-1从小规模rAAV生产获得的VG生产率(图12A)、衣壳生产率(图12B)和完整载体基因组的百分比(图12C)的图，所述双重载体转染系统设计-1在各种总转染DNA水平(x轴)下测试载体V3和载体V12之间所示的各种比率。所用的PEI:DNA比率为2:1。

图13A-图13C是显示使用双重载体转染系统设计-1从小规模rAAV生产获得的VG生产率(图13A)、衣壳生产率(图13B)和完整载体基因组的百分比(图13C)的图，所述双重载体转染系统设计-1在各种总转染DNA水平(x轴)下测试载体V3和载体V8之间所示的各种比率。所用的PEI:DNA比率为2:1。

图14A-图14C是显示使用双重载体转染系统设计-1和相关三重转染对照在AAV衣壳血清型AAV1、AAV2、AAV5、AAV6、AAV8、AAV9、AAVrh10和AAVrh74中从2L规模rAAV生产获得的VG生产率(图14A)、衣壳生产率(图14B)和完整载体基因组的百分比(图14C)的图。

图15是显示使用双重载体转染系统设计-1从50L和2000L生物反应器rAAV生产获得的VG生产率的图。

具体实施方式

本公开提供了用于产生重组腺相关病毒(rAAV)的双重载体转染系统。本公开基于这样的发现，即使用本文所述的双重载体转染方法的rAAV生产产生比常规三重载体转染方法更高的AAV生产率。本文所述的双重载体转染系统中组分的特定组织也产生优于现有技术双重载体转染方法的AAV生产率。

I.定义

如本文所用，术语“重组腺相关病毒”或“rAAV”是指包含缺乏功能性rep和cap基因的基因组的AAV。

如本文所用，术语“cap基因”是指编码AAV衣壳蛋白的核酸序列。

如本文所用，术语“rep基因”是指编码AAV复制所需的AAVRep蛋白(例如Rep78、Rep68、Rep52和Rep40)的核酸序列。

如本文所用，术语“Rep-Cap元件”是指编码AAV复制所需的AAV Rep蛋白(例如Rep78、Rep68、Rep52和Rep40)以及AAV衣壳蛋白(例如VP1、VP2和VP3)的核酸序列。

如本文所用，术语“辅助病毒基因”是指编码介导AAV复制的病毒基因(例如腺病毒基因或疱疹病毒基因)的核酸序列。

如本文所用，术语“rAAV基因组”是指包含rAAV基因组序列的核酸分子。本领域技术人员将理解，当rAAV基因组包含转基因时，该rAAV基因组相对于转基因的转录方向可以处于有义或反义取向。

如本文所用，术语“编辑基因组”是指能够经由同源重组将编辑元件(例如，一个或多个核苷酸或核苷酸间键)整合到靶基因座中以纠正靶基因中的遗传缺陷的重组AAV基因组。本领域技术人员将理解，包含5'同源臂、编辑元件和3'同源臂的编辑基因组部分相对于靶基因座可以处于有义或反义取向。

如本文所用，术语“编辑元件”是指当整合在靶基因座时修饰靶基因座的编辑基因组的部分。编辑元件可以介导靶基因座处一个或多个核苷酸的插入、缺失或取代。如本文所用，术语“靶基因座”是指被编辑元件修饰的染色体的区域或核苷酸间键(例如靶基因的区域或核苷酸间键)。

如本文所用，术语“同源臂”是指编辑基因组的位于编辑元件5'或3'的一部分，该部分与靶基因座侧翼的基因组基本上相同。

如本文所用，两个核苷酸序列之间或两个氨基酸序列之间的“同一性百分比”通过将比对序列对之间的匹配数乘以100，并除以包括内部空位的比对区域的长度来计算。同一性评分仅对完美匹配进行计数，而不考虑氨基酸彼此的相似性程度。注意，长度仅包括内部空位，而不包括序列末端的空位。

如本文所用，术语“编码序列”是指编码多肽的互补DNA(cDNA)的部分，起始于起始密码子并终止于终止密码子。由于群体内的选择性剪接、选择性翻译起始和变异，基因可具有一个或多个编码序列。编码序列可以是野生型或非天然存在的变体(例如密码子优化的变体)。

如本文所用，术语“转录调控元件”或“TRE”是指通过RNA聚合酶调控(例如控制、增加或减少)可操作地连接的核苷酸序列的转录以形成RNA分子的顺式作用核苷酸序列，例如DNA序列。TRE依赖于一种或多种反式作用分子，诸如转录因子来调控转录。因此，一种TRE当其与不同反式作用分子接触时，例如当其处于不同类型的细胞中时，可以以不同的方式调控转录。TRE可以包含一个或多个启动子元件和/或增强子元件。本领域技术人员将理解，基因中的启动子和增强子元件可以在位置上接近，并且术语“启动子”可以指包含启动子元件和增强子元件的序列。因此，术语“启动子”不排除序列中的增强子元件。启动子和增强子元件不需要源自相同的基因或物种，并且每个启动子或增强子元件的序列可以与基因组中相应的内源序列相同或基本上相同。

如本文所用，术语“可操作地连接”用于描述TRE和待转录的编码序列之间的连接。通常，基因表达置于包含一个或多个启动子和/或增强子元件的TRE的控制下。如果编码序列的转录受TRE控制或影响，则编码序列与TRE“可操作地连接”。TRE的启动子和增强子元件可以与编码序列处于任何取向和/或距离，只要获得期望的转录活性即可。在某些实施方案中，TRE在编码序列的上游。

如本文所用，术语“多聚腺苷酸化序列”是指当转录成RNA时构成多聚腺苷酸化信号序列的DNA序列。多聚腺苷酸化序列可以是天然的或外源的。外源多聚腺苷酸化序列可以是哺乳动物或病毒多聚腺苷酸化序列(例如SV40多聚腺苷酸化序列)。

如本文所用，“外源多聚腺苷酸化序列”是指与转基因的内源多聚腺苷酸化序列不相同或基本上相同的多聚腺苷酸化序列。在某些实施方案中，外源多聚腺苷酸化序列是不同于转基因但在相同物种(例如人)内的基因的多聚腺苷酸化序列。在某些实施方案中，外源多聚腺苷酸化序列是不同生物体(例如病毒)的多聚腺苷酸化序列。

II.第一核酸载体

用于产生rAAV的常规三重载体转染系统通常包含：含有编码AAV Rep蛋白和AAV衣壳蛋白的序列的第一载体；包含rAAV基因组的第二载体；和包含一个或多个辅助病毒基因的第三载体。先前已经证实，编码AAVRep蛋白、AAV衣壳蛋白的基因和所述一种或多种辅助病毒基因可以克隆到与(“Rep-Cap-辅助载体”)相同的载体中。在此类情况下，Rep-Cap-辅助载体与包含rAAV基因组的第二载体(即，与rAAV基因组呈反式提供Rep、Cap和H辅助基因)的双重转染可用于生成rAAV。参见，例如Grimm等人(1998)Hum.Gene Ther.9(18):2745-2760，其公开内容通过引用整体并入本文。

与先前的双重载体转染系统对比，本公开的双重载体转染系统提供与rAAV基因组呈顺式的Rep和Cap基因。因此，本公开提供了用于产生重组腺相关病毒(rAAV)的双重载体转染系统，其中本文所述的双重载体转染系统通常包含：(1)第一核酸载体，其包含：编码AAV Rep蛋白的第一核苷酸序列、包含含有转基因的rAAV基因组的第二核苷酸序列和编码AAV衣壳蛋白的第三核苷酸序列；和(2)第二核酸载体，其包含辅助病毒基因。

在某些实施方案中，第一核酸载体从5'至3’包含：编码AAVRep蛋白的第一核苷酸序列，包含含有转基因的rAAV基因组的第二核苷酸序列，以及编码AAV衣壳蛋白的第三核苷酸序列。本公开的某些方面提供第一核酸载体不包含辅助病毒基因(例如，编码AAV生产辅助因子的基因)。

本文所述的双重载体转染系统通常涉及将第一核酸载体和第二核酸载体转染到合适的宿主细胞中以产生AAV(例如，rAAV)。在某些实施方案中，第一核酸载体和第二核酸载体一起提供AAV(例如，rAAV)产生所需的所有组分。在某些实施方案中，第一核酸载体和第二核酸载体以及另外的宿主细胞一起提供AAV(例如，rAAV)产生所需的所有组分。

已经发现，与常规的三重载体转染系统和先前描述的双重载体转染系统相比，本文公开的双重载体转染系统导致增加的rAAV生产率。在不受任何理论束缚的情况下，申请人相信在本文所述的双重载体转染系统中提供与rAAV基因组呈顺式的Rep和Cap基因导致较高的rAAV生产率，这部分是因为产生较少的空AAV衣壳。

rAAV基因组

在本文公开的双重载体系统中，第一核酸载体通常包含含有rAAV基因组的核苷酸序列。在某些实施方案中，rAAV基因组包含转基因。

在某些实施方案中，转基因包含一个或多个编码RNA分子的序列。合适的RNA分子包括但不限于本领域已知的miRNA、shRNA、siRNA、反义RNA、gRNA、antagomir、miRNA海绵、RNA适体核酶、RNA适体、mRNA、lncRNA、核酶和合成RNA。

在某些实施方案中，转基因编码一种或多种多肽或其片段。此类转基因可包含多肽的完整编码序列，或仅包含多肽的编码序列的片段。在某些实施方案中，转基因编码可用于治疗受试者的疾病或病症的多肽。合适的多肽包括但不限于β-珠蛋白、血红蛋白、组织纤溶酶原激活物和凝血因子；集落刺激因子(CSF)；白细胞介素，诸如IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9等；生长因子，诸如角质形成细胞生长因子(KGF)、干细胞因子(SCF)、成纤维细胞生长因子(FGF，诸如碱性FGF和酸性FGF)、肝细胞生长因子(HGF)、胰岛素样生长因子(IGF)、骨形态发生蛋白(BMP)、表皮生长因子(EGF)、生长分化因子-9(GDF-9)、肝细胞瘤来源的生长因子(HDGF)、肌生长抑制素(GDF-8)、神经生长因子(NGF)、神经营养蛋白、血小板源性生长因子(PDGF)、血小板生成素(TPO)、转化生长因子α(TGF-a)、转化生长因子β(TGF-β)等；可溶性受体，诸如可溶性TNF-a受体、可溶性白介素受体(例如，可溶性IL-1受体和可溶性II型IL-1受体)、可溶性γ/ΔT细胞受体、可溶性受体的配体结合片段等；酶，诸如α-葡糖苷酶、伊米苷酶(imiglucerase)、β-葡糖脑苷脂酶和阿糖脑苷酶(alglucerase)；酶活化剂，诸如组织纤溶酶原活化剂；趋化因子，诸如IP-10、由干扰素-γ(Mig)诱导的单核因子、Groα/IL-8、RANTES、MIP-1a、MIP-1β、MCP-1、PF-4等；血管生成剂，诸如血管内皮生长因子(VEGF，例如VEGF121、VEGF165、VEGF-C、VEGF-2)、神经胶质瘤来源的生长因子、血管生成素、血管生成素-2等等；抗血管生成剂，诸如可溶性VEGF受体；蛋白疫苗；神经活性肽，诸如神经生长因子(NGF)、缓激肽、缩胆囊素、胃泌素、分泌素、催产素、促性腺激素释放激素、β-内啡肽、脑啡肽、P物质、促生长素抑制素、催乳素、甘丙肽、生长激素释放激素、铃蟾肽、强啡肽、华法林(warfarin)、神经降压素、促胃动素、促甲状腺激素、神经肽Y、黄体化激素、降钙素、胰岛素、胰高血糖素、血管加压素、血管紧张素II、促甲状腺激素释放激素、血管活性肠肽、睡眠肽等；血栓溶解剂；心房钠尿肽；松弛肽；神经胶质纤维酸性蛋白；促卵泡激素(FSH)；人α-1抗胰蛋白酶；白血病抑制因子(LIF)；组织因子；巨噬细胞激活因子；肿瘤坏死因子(TNF)；嗜中性粒细胞趋化因子；组织金属蛋白酶抑制剂；血管活性肠肽；血管生成素；促血管收缩素；纤维蛋白；水蛭素；IL-1受体拮抗剂；睫状神经营养因子(CNTF)；脑源性神经营养因子(BDNF)；神经营养蛋白3和4/5(NT-3和4/5)；胶质细胞源性神经营养因子(GDNF)；芳族氨基酸脱羧酶(AADC)；因子VIII、因子IX、因子X；抗肌萎缩蛋白或小抗肌萎缩蛋白；溶酶体酸性脂肪酶；苯丙氨酸羟化酶(PAH)；糖原贮积病相关酶，诸如葡萄糖-6-磷酸酶、酸性麦芽糖酶、糖原脱支酶、肌糖原磷酸化酶、肝糖原磷酸化酶、肌肉磷酸果糖激酶、磷酸化酶激酶、葡萄糖转运蛋白、醛缩酶A、β-烯醇化酶、糖原合酶；溶酶体酶，诸如艾杜糖醛酸-2-硫酸酯酶(I2S)和芳基硫酸酯酶A；和线粒体蛋白，诸如共济蛋白。

在某些实施方案中，转基因编码在一种或多种溶酶体贮积病中可能有缺陷的蛋白质。合适的蛋白质包括但不限于α-唾液酸酶、组织蛋白酶A、α-甘露糖苷酶、β-甘露糖苷酶、糖基天冬酰胺酶、α-岩藻糖苷酶、α-N-乙酰葡糖胺糖苷酶、β-半乳糖苷酶、β-己糖胺酶α-亚基、β-己糖胺酶β-亚基、GM2激活蛋白、葡糖脑苷脂酶、皂素C、芳基硫酸酯酶A、皂素B、甲酰甘氨酸生成酶、β-半乳糖基神经酰胺酶、α-半乳糖苷酶A、艾杜糖醛酸硫酸酯酶、α-艾杜糖醛酸酶、乙酰肝素N-硫酸酯酶、乙酰CoA转移酶、N-乙酰氨基葡糖苷酶、β-葡糖醛酸糖苷酶、N-乙酰葡糖胺6-硫酸酯酶、N-乙酰半乳糖胺4-硫酸酯酶、半乳糖6-硫酸酯酶、透明质酸酶、α-葡糖苷酶、酸性鞘磷脂酶、酸性神经酰胺酶、酸性脂肪酶、组织蛋白酶K、三肽基肽酶、棕榈酰蛋白硫酯酶、胱氨酸转运蛋白(cystinosin)、唾液酸转运蛋白(sialin)、UDP-N-乙酰氨基葡萄糖、磷酸转移酶γ-亚基、粘脂蛋白-1、LAMP-2、NPC1、CLN3、CLN 6、CLN 8、LYST、MYOV、RAB27A、黑素亲和素(melanophilin)和AP3β-亚基。

在某些实施方案中，转基因编码抗体或其片段(例如，Fab、scFv或全长抗体)。合适的抗体包括但不限于莫罗单抗(muromonab)-cd3、依法利珠单抗(efalizumab)、托西莫单抗(tositumomab)、达克利珠单抗(daclizumab)、奈巴库单抗(nebacumab)、卡妥索单抗(catumaxomab)、依决洛单抗(edrecolomab)、阿昔单抗(abciximab)、利妥昔单抗(rituximab)、巴利昔单抗(basiliximab)、帕利珠单抗(palivizumab)、英夫利昔单抗(infliximab)、曲妥珠单抗(trastuzumab)、阿达木单抗(adalimumab)、替伊莫单抗(ibritumomab tiuxetan)、奥马珠单抗(omalizumab)、西妥昔单抗(cetuximab)、贝伐单抗(bevacizumab)、那他珠单抗(natalizumab)、帕尼单抗(panitumumab)、兰尼单抗(ranibizumab)、依库丽单抗(eculiz umab)、赛妥珠单抗(certolizumab)、优特克单抗(ustekinumab)、卡那单抗(canakinumab)、戈利木单抗(golimumab)、奥法木单抗(ofatumumab)、托珠单抗(tocilizumab)、地诺单抗(denosumab)、贝利木单抗(beli mumab)、伊匹单抗(ipilimumab)、本妥昔单抗(brentuximab vedotin)、帕妥珠单抗(pertuzumab)、雷昔库单抗(raxibacumab)、奥比妥珠单抗(o binutuzumab)、阿仑单抗(alemtuzumab)、司妥昔单抗(siltuximab)、雷莫芦单抗(ramucirumab)、维多珠单抗(vedolizumab)、博纳吐单抗(blinatumomab)、纳武单抗(nivolumab)、派姆单抗(pembrolizumab)、依达鲁奇单抗(idarucizumab)、耐昔妥珠单抗(necitumumab)、达妥昔单抗(d inutuximab)、苏金单抗(secukinumab)、美泊利单抗(mepolizumab)、阿莫罗布单抗(alirocumab)、依洛尤单抗(evolocumab)、达雷木单抗(dara tumumab)、埃罗妥珠单抗(elotuzumab)、伊克苏单抗(ixekizumab)、瑞替珠单抗(reslizumab)、奥拉单抗(olaratumab)、贝洛托舒单抗(bezlotoxumab)、阿特珠单抗(atezolizumab)、奥托萨昔单抗(obiltoxaximab)、奥加伊妥珠单抗(inotuzumab ozogamicin)、柏达鲁单抗(brodalumab)、优特克单抗(guselkumab)、度普利尤单抗(dupilumab)、沙利姆单抗(sa rilumab)、阿维鲁单抗(avelumab)、奥克莱珠单抗(ocrelizumab)、艾美赛珠单抗(emicizumab)、贝那利珠单抗(benralizumab)、吉妥珠单抗(g emtuzumab ozogamicin)、度伐利尤单抗(durvalumab)、布罗索尤单抗(b urosumab)、依瑞奈尤单抗(erenumab)、加卡奈珠单抗(galcanezumab)、拉那利尤单抗(lanadelumab)、莫格利珠单抗(mogamulizumab)、替曲吉珠单抗(tildrakizumab)、西米普利单抗(cemiplimab)、瑞玛奈珠单抗(fr emanezumab)、雷夫利珠单抗(ravulizumab)、依马利尤单抗(emapalum ab)、伊巴珠单抗(ibalizumab)、莫西妥单抗(moxetumomab)、卡普赛珠单抗(caplacizumab)、罗莫单抗(romosozumab)、利桑珠单抗(risankizu mab)、泊洛妥珠单抗(polatuzumab)、艾普奈珠单抗(eptinezumab)、乐龙单抗(leronlimab)、戈沙妥珠单抗(sacituzumab)、布西珠单抗(broluci zumab)、伊莎妥昔单抗(isatuximab)和特普鲁木单抗(teprotumumab)。

在某些实施方案中，所述转基因编码核酸酶。合适的核酸酶包括但不限于锌指核酸酶(ZFN)(参见，例如，Porteus和Baltimore(2003)Science 300:763；Miller等人(2007)Nat.Biotechnol.25:778-785；S ander等人(2011)Nature Methods 8:67-69；及Wood等人(2011)Scie nce 333:307，其各自通过引用整体在此并入)、转录激活物样效应物核酸酶(TALEN)(参见，例如Wood等人(2011)Science 333:307；Boc h等人(2009)Science 326:1509-1512；Moscou和Bogdanove(2009)Science 326:1501；Christian等人(2010)Genetics186:757-761；Mille r等人(2011)Nat.Biotechnol.29:143-148；Zhang等人(2011)Nat.Biotechnol.29:149-153；及Reyon等人(2012)Nat.Biotechnol.30(5):460-465，其各自通过引用整体在此并入)、归巢核酸内切酶、大范围核酸酶(参见，例如美国专利公开第US2014/0121115号，其通过引用整体在此并入)和RNA引导的核酸酶(参见，例如Makarova等人(2018)The CRISPR Journal 1(5):325-336；及Adli(2018)Nat.Commu nications 9:1911，其各自通过引用整体在此并入)。

在某些实施方案中，所述转基因编码RNA引导的核酸酶。合适的RNA引导的核酸酶包括但不限于I类和II类成簇规律间隔短回文重复序列(CRISPR)相关核酸酶。I类分为I型、III型和IV型，并且包括但不限于I型(Cas3)、I型-A(Cas8a、Cas5)、I型-B(Cas8b)、I型-C(Cas8c)、I型-D(Cas10d)、I型-E(Csel、Cse2)、I型-F(Csyl、Csy2、Csy3)、I型-U(GSU0054)、III型(Cas10)、III型-A(Csm2)、III型-B(C mr5)、III型-C(Csx10或Csx11)、III型-D(Csx10)和IV型(Csf1)。II类分为II型、V型和VI型，并且包括但不限于II型(Cas9)、II型-A(C sn2)、II型-B(Cas4)、V型(Cpf1、C2c1、C2c3)和VI型(Cas13a、Cas13b、Cas13c)。RNA引导的核酸酶还包括天然存在的II类CRISPR核酸酶，诸如Cas9(II型)或Cas12a/Cpf1(V型)，以及由其来源或获得的其他核酸酶。可用于本发明的示例性Cas9核酸酶包括但不限于化脓性链球菌(S.pyogenes)Cas9(SpCas9)、金黄色葡萄球菌(S.aureu s)Cas9(SaCas9)、脑膜炎双球菌(N.meningitidis)Cas9(NmCas9)、空肠弯曲菌(C.jejuni)Cas9(CjCas9)和地芽胞杆菌(Geobacillus)Cas9(G eoCas9)。

在某些实施方案中，转基因编码一种或多种报告序列，其在表达时产生可检测的信号。此类报告序列包括但不限于编码以下的DNA序列：β-内酰胺酶、β-半乳糖苷酶(LacZ)、碱性磷酸酶、胸苷激酶、绿色荧光蛋白(GFP)、红色荧光蛋白(RFP)、氯霉素乙酰转移酶(CAT)、荧光素酶、膜结合蛋白(包括例如CD2、CD4、CD8)、流感血凝素蛋白和本领域熟知的存在针对其的高亲和力抗体或者可通过常规手段产生的其他蛋白，以及包含与来自血凝素或Myc的抗原标签结构域适当融合的膜结合蛋白的融合蛋白。

在某些实施方案中，rAAV基因组包含与转基因可操作地连接的转录调控元件(TRE)，以控制由转基因编码的RNA或多肽的表达。在某些实施方案中，TRE包括组成型启动子。在某些实施方案中，TRE可以在任何哺乳动物细胞(例如，任何人细胞)中具有活性。在某些实施方案中，TRE在广泛范围的人细胞中具有活性。此类TRE可包含组成型启动子和/或增强子元件，包括本文所述的那些中的任一种和本领域技术人员已知的那些中的任一种。在某些实施方案中，TRE包括诱导型启动子。在某些实施方案中，TRE可以是组织特异性TRE，即其在特定组织和/或器官中具有活性。组织特异性TRE包括一种或多种组织特异性启动子和/或增强子元件，和任选地一种或多种组成型启动子和/或增强子元件。技术人员将理解，组织特异性启动子和/或增强子元件可以通过本领域熟知的方法从组织中特异性表达的基因中分离。

合适的启动子包括，例如，巨细胞病毒启动子(CMV)(Stinski等人(1985)JournalofVirology 55(2):431-441)、CMV早期增强子/鸡β-肌动蛋白(CBA)启动子/兔β-珠蛋白内含子(CAG)(Miyazaki等人(1989)Gene 79(2):269-277)、CB^SB(Jacobson等人(2006)Molecular Therapy13(6):1074-1084)、人延伸因子1α启动子(EF1α)(Kim等人(1990)Gene91(2):217-223)、人磷酸甘油酸激酶启动子(PGK)(Singer-Sam等人(1984)Gene 32(3):409-417)、线粒体重链启动子(Lodeiro等人(2012)PNAS109(17):6513-6518)、泛素启动子(Wulff等人(1990)FEBS Letters 261:101-105)。在某些实施方案中，TRE包含巨细胞病毒(CMV)启动子/增强子(例如，包含与SEQ ID NO:18或19具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列)、SV40启动子、鸡β肌动蛋白(CBA)启动子(例如，包含与SEQ ID NO:20或21具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列)、smCBA启动子(例如，包含与SEQ ID NO:22具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列)、人延伸因子1α(EF1α)启动子(例如，包含与SEQ ID NO:23具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列)、包含转录因子结合位点的小鼠微小病毒(MVM)内含子(例如，包含与SEQ ID NO:24或25具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列)、人磷酸甘油酸激酶(PGK1)启动子、人泛素C(Ubc)启动子、人β肌动蛋白启动子、人神经元特异性烯醇化酶(ENO2)启动子、人β-葡糖醛酸糖苷酶(GUSB)启动子、兔β-珠蛋白元件(例如，包含与SEQ ID NO:26或27具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列)、人钙调蛋白1(CALM1)启动子(例如，包含与SEQ ID NO:28具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列)，人ApoE/C-I肝控制区(HCR1)(例如，包含与SEQ ID NO:29具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列)、人αl抗胰蛋白酶(hAAT)启动子(例如，包含与SEQ ID NO:30、31或32具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列)、延长的HCR1(例如，包含与SEQ ID NO:33具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列)、hAAT启动子的HS-CRM8元件(例如，包含与SEQ ID NO:34具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列)、人转甲状腺素蛋白(TTR)启动子(例如，包含与SEQ ID NO:35具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列)和/或人甲基-CpG结合蛋白2(MeCP2)启动子。本文所述的任何TRE可以任何顺序组合以驱动有效转录。例如，rAAV基因组可包含TRE，其包括CMV增强子、CBA启动子和来自兔β-珠蛋白基因外显子3的剪接受体，统称为CAG启动子(例如，包含与SEQ ID NO:36具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列)。例如，rAAV基因组可包含TRE，其包括CMV增强子和CBA启动子的杂合体，随后是剪接供体和剪接受体，统称为CASI启动子区(例如，包含与SEQ ID NO:37具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列)。例如，rAAV基因组可包含TRE，其包括HCR1和hAAT启动子(也称为LP1启动子，例如包含与SEQ ID NO:38具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列)。

在某些实施方案中，TRE是脑特异性的(例如，神经元特异性的、神经胶质细胞特异性的、星形胶质细胞特异性的、少突胶质细胞特异性的、小胶质细胞特异性的和/或中枢神经系统特异性的)。示例性的脑特异性TRE可包含来自但不限于人神经胶质纤维酸性蛋白(GFAP)启动子、人突触蛋白1(SYN1)启动子、人突触蛋白2(SYN2)启动子、人金属硫蛋白3(MT3)启动子和/或人蛋白脂质蛋白1(PLP1)启动子的一个或多个元件。更多的脑特异性启动子元件公开于WO 2016/100575A1中，其通过引用整体并入本文。

在某些实施方案中，可以使用转基因的天然启动子。当期望转基因的表达模拟天然表达时，优选天然启动子。当转基因的表达必须在时间上或发育上，或以组织特异性方式，或响应于特异性转录刺激来调控时，可以使用天然启动子。在另一个实施方案中，其他天然表达控制元件，诸如增强子元件、多聚腺苷酸化位点或Kozak共有序列也可用于模拟天然表达。

在某些实施方案中，rAAV基因组包含编辑基因组。编辑基因组可用于通过编辑基因组与细胞中靶基因座周围的基因组区域的同源重组来编辑细胞的基因组。在某些实施方案中，设计编辑基因组以通过同源重组纠正基因中的遗传缺陷。编辑基因组通常包含：(i)编辑元件，用于编辑靶基因中的靶基因座；(ii)编辑元件5'的5'同源臂核苷酸序列，其与靶基因座5'的第一基因组区具有同源性；和(iii)编辑元件3'的3'同源臂核苷酸序列，其与靶基因座3'的第二基因组区具有同源性，其中包含5'同源臂、编辑元件和3'同源臂的编辑基因组的部分相对于靶基因座可以处于有义或反义取向。使用编辑基因组进行编辑的合适靶基因包括但不限于苯丙氨酸羟化酶(PAH)、囊性纤维化传导跨膜调控因子(CFTR)、β血红蛋白(HBB)、眼皮肤白化病II(OCA2)、亨廷顿蛋白(HTT)、萎缩性肌强直病蛋白激酶(DMPK)、低密度脂蛋白受体(LDLR)、载脂蛋白B(APOB)、神经纤维瘤蛋白1(NF1)、多囊肾病1(PKD1)、多囊肾病2(PKD2)、凝血因子VIII(F8)、抗肌萎缩蛋白(DMD)、X连锁磷酸调节内肽酶同源物(PHEX)、甲基-CpG结合蛋白2(MECP2)和Y连锁泛素特异性肽酶9Y(USP9Y)。

在某些实施方案中，本文公开的rAAV基因组还包含转录终止子(例如，多聚腺苷酸化序列)。在某些实施方案中，转录终止子在转基因的3'。转录终止子可以是有效终止转录的任何序列，并且本领域技术人员应当理解，此类序列可以分离自在期望转录抗体编码序列的至少一部分的细胞中表达的任何基因。在某些实施方案中，转录终止子包含多聚腺苷酸化序列。在某些实施方案中，多聚腺苷酸化序列与免疫球蛋白基因的内源多聚腺苷酸化序列相同或基本上相同。在某些实施方案中，多聚腺苷酸化序列是外源多聚腺苷酸化序列。在某些实施方案中，多聚腺苷酸化序列是SV40多聚腺苷酸化序列(例如，包含与SEQ ID NO:65、68或69具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列，或与其互补的核苷酸序列)。在某些实施方案中，多聚腺苷酸化序列包含SEQ ID NO:65所示的核苷酸序列。在某些实施方案中，多聚腺苷酸化序列由SEQ ID NO:65所示的核苷酸序列组成。在某些实施方案中，多聚腺苷酸化序列是牛生长激素(BGH)多聚腺苷酸化序列(例如，包含与SEQID NO:67具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列，或与其互补的核苷酸序列)。在某些实施方案中，多聚腺苷酸化序列包含SEQ ID NO:67所示的核苷酸序列。在某些实施方案中，多聚腺苷酸化序列由SEQ ID NO:67所示的核苷酸序列组成。

在某些实施方案中，rAAV基因组包含与SEQ ID NO:71、85、86、87或88所示的序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。在某些实施方案中，编辑元件包含SEQ ID NO:71、85、86、87或88所示的核苷酸序列。在某些实施方案中，编辑元件由SEQ ID NO:71、85、86、87或88所示的核苷酸序列组成。

在某些实施方案中，本文公开的rAAV基因组还包含在TRE的5’的5’反向末端重复(5’ITR)核苷酸序列和在与抗体轻链编码序列相关的多聚腺苷酸化序列的3’的3'反向末端重复(3’ITR)核苷酸序列。来自任何AAV血清型或其变体的ITR序列可用于本文公开的rAAV基因组中。5'和3’ITR可以来自相同血清型的AAV或来自不同血清型的AAV。在本文公开的rAAV基因组中使用的示例性ITR在本文SEQ ID NO:39、40、41、42、43和44中示出。

在某些实施方案中，5’ITR或3’ITR来自AAV2。在某些实施方案中，5’ITR和3’ITR均来自AAV2。在某些实施方案中，5’ITR核苷酸序列与SEQ ID NO:39具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性，或3’ITR核苷酸序列与SEQ ID NO:40具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在某些实施方案中，5’ITR核苷酸序列与SEQ ID NO:39具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性，和/或3’ITR核苷酸序列与SEQ ID NO:40具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在某些实施方案中，rAAV基因组包含具有SEQ ID NO:39的序列的5’ITR核苷酸序列和具有SEQID NO:40的序列的3’ITR核苷酸序列。

在某些实施方案中，5’ITR或3’ITR来自AAV5。在某些实施方案中，5’ITR和3’ITR均来自AAV5。在某些实施方案中，5’ITR核苷酸序列与SEQ ID NO:42具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性，或3’ITR核苷酸序列与SEQ ID NO:43具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在某些实施方案中，5’ITR核苷酸序列与SEQ ID NO:42具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性，和/或3’ITR核苷酸序列与SEQ ID NO:43具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性。在某些实施方案中，rAAV基因组包含具有SEQ ID NO:42的序列的5’ITR核苷酸序列和具有SEQID NO:43的序列的3’ITR核苷酸序列。

在某些实施方案中，5’ITR核苷酸序列和3’ITR核苷酸序列基本上彼此互补(例如，彼此互补，除了在5'或3’ITR中的1、2、3、4或5个核苷酸位置处错配以外)。

在某些实施方案中，修饰5’ITR或3’ITR以减少或消除Rep蛋白的分解(“不可分解的ITR”)。在某些实施方案中，不可分解的ITR包含在末端分解位点的核苷酸序列中的插入、缺失或取代。此类修饰允许在受感染细胞中复制rAAV基因组后形成AAV的自身互补的双链DNA基因组。示例性的不可分解的ITR序列是本领域已知的(参见，例如，美国专利第7,790,154号和第9,783,824号中提供的那些，其通过引用整体并入本文)。在某些实施方案中，5’ITR包含与SEQ ID NO:41具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。在某些实施方案中，5’ITR由与SEQ ID NO:41具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列组成。在某些实施方案中，5’ITR由SEQ ID NO:41所示的核苷酸序列组成。在某些实施方案中，3’ITR包含与SEQ ID NO:44具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。在某些实施方案中，5’ITR由与SEQ ID NO:44具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列组成。在某些实施方案中，3’ITR由SEQ ID NO:44所示的核苷酸序列组成。在某些实施方案中，5’ITR由SEQ ID NO:41所示的核苷酸序列组成，并且3’ITR由SEQ ID NO:44所示的核苷酸序列组成。在某些实施方案中，5’ITR由SEQ ID NO:41所示的核苷酸序列组成，并且3’ITR由SEQ ID NO:44所示的核苷酸序列组成。

在某些实施方案中，5’ITR的侧翼是源自野生型AAV2基因组序列的附加核苷酸序列。在某些实施方案中，5’ITR的侧翼是源自野生型AAV2序列的与AAV2基因组中野生型AAV2ITR相邻的附加46bp序列。在某些实施方案中，附加46bp序列在rAAV基因组中5’ITR的3'。在某些实施方案中，该46bp序列由SEQ ID NO:45所示的核苷酸序列组成。

在某些实施方案中，3’ITR的侧翼是源自野生型AAV2基因组序列的附加核苷酸序列。在某些实施方案中，3’ITR的侧翼是源自野生型AAV2序列的与AAV2基因组中野生型AAV2ITR相邻的附加37bp序列。参见，例如，Savy等人，Human Gene TherapyMethods(2017)28(5):277-289(其通过引用整体并入本文)。在某些实施方案中，附加37bp序列在rAAV基因组中3’ITR的5'。在某些实施方案中，该37bp序列由SEQ ID NO:46所示的核苷酸序列组成。

在某些实施方案中，rAAV基因组包含与SEQ ID NO:75、78、80、82或84所示的序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。在某些实施方案中，编辑元件包含SEQ ID NO:75、78、80、82或84所示的核苷酸序列。在某些实施方案中，编辑元件由SEQ ID NO:75、78、80、82或84所示的核苷酸序列组成。

AAVRep蛋白

本公开提供了包含Rep蛋白编码序列或其功能变体的编码序列的第一核酸载体。通过使用两个启动子和可变剪接控制AAV Rep基因的表达，产生四种Rep蛋白Rep78、Rep68、Rep52和Rep40。Rep蛋白参与AAV基因组复制和病毒基因组的包装。Rep蛋白的表达受p5和p19启动子控制。p5启动子驱动选择性剪接变体Rep78和Rep68的表达。p19启动子驱动选择性剪接变体Rep52和Rep40的表达。因此，第一核酸载体可以包含编码一种或多种Rep蛋白或其功能变体的核苷酸序列。

所述一种或多种Rep蛋白可以源自AAV2。示例性AAV2基因组序列可以经由NCBI参考序列NC_001401.2找到。根据NCBI参考序列，Rep68由核苷酸321至2252编码；Rep78由核苷酸321至2186编码；Rep40由核苷酸993至2252编码；并且Rep52由核苷酸993至2186编码。

在某些实施方案中，本公开提供了包含编码Rep78的核苷酸序列的核酸，其中编码Rep78的核苷酸序列包含与SEQ ID NO:50中所示的序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在某些实施方案中，编码Rep78的核苷酸序列包含SEQ ID NO:50所示的序列或由SEQ ID NO:50所示的序列组成。在某些实施方案中，包含编码Rep78的核苷酸序列的核酸包含与编码Rep78的核苷酸序列可操作地连接的转录调控元件。在某些实施方案中，与编码Rep78的核苷酸序列可操作地连接的转录调控元件包含与SEQ ID NO:47所示的序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在某些实施方案中，与编码Rep78的核苷酸序列可操作地连接的转录调控元件包含SEQ ID NO:47所示的序列或由SEQ ID NO:47所示的序列组成。在某些实施方案中，包含编码Rep78的核苷酸序列的核酸包含与SEQ ID NO:51中所示的序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在某些实施方案中，包含编码Rep78的核苷酸序列的核酸包含SEQ ID NO:51所示的序列或由SEQ ID NO:51所示的序列组成。在某些实施方案中，本公开提供了在不同腺病毒血清型中的包含对应于如针对AAV2所述的编码Rep78的序列的核苷酸序列的核酸。

在某些实施方案中，本公开提供了包含编码Rep68的核苷酸序列的核酸，其中编码Rep68的核苷酸序列包含与SEQ ID NO:52中所示的序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在某些实施方案中，编码Rep68的核苷酸序列包含SEQ ID NO:52所示的序列或由SEQ ID NO:52所示的序列组成。在某些实施方案中，包含编码Rep68的核苷酸序列的核酸包含与编码Rep68的核苷酸序列可操作地连接的转录调控元件。在某些实施方案中，与编码Rep68的核苷酸序列可操作连接的转录调控元件包含与SEQ ID NO:47所示的序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在某些实施方案中，与编码Rep68的核苷酸序列可操作地连接的转录调控元件包含SEQ ID NO:47所示的序列或由SEQ ID NO:47所示的序列组成。在某些实施方案中，包含编码Rep68的核苷酸序列的核酸包含与SEQ ID NO:53中所示的序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在某些实施方案中，包含编码Rep68的核苷酸序列的核酸包含SEQ ID NO:53所示的序列或由SEQ ID NO:53所示的序列组成。在某些实施方案中，本公开提供了在不同腺病毒血清型中的包含对应于如针对AAV2所述的编码Rep68的序列的核苷酸序列的核酸。

在某些实施方案中，本公开提供了包含编码Rep40的核苷酸序列的核酸，其中编码Rep40的核苷酸序列包含与SEQ ID NO:54中所示的序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在某些实施方案中，编码Rep40的核苷酸序列包含SEQ ID NO:54所示的序列或由SEQ ID NO:54所示的序列组成。在某些实施方案中，包含编码Rep40的核苷酸序列的核酸包含与编码Rep40的核苷酸序列可操作地连接的转录调控元件。在某些实施方案中，与编码Rep40的核苷酸序列可操作连接的转录调控元件包含与SEQ ID NO:48所示的序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在某些实施方案中，与编码Rep40的核苷酸序列可操作地连接的转录调控元件包含SEQ ID NO:48所示的序列或由SEQ ID NO:48所示的序列组成。在某些实施方案中，包含编码Rep40的核苷酸序列的核酸包含与SEQ ID NO:55中所示的序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在某些实施方案中，包含编码Rep40的核苷酸序列的核酸包含SEQ ID NO:55所示的序列或由SEQ ID NO:55所示的序列组成。在某些实施方案中，本公开提供了在不同腺病毒血清型中的包含对应于如针对AAV2所述的编码Rep40的序列的核苷酸序列的核酸。

在某些实施方案中，本公开提供了包含编码Rep52的核苷酸序列的核酸，其中编码Rep52的核苷酸序列包含与SEQ ID NO:56中所示的序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在某些实施方案中，编码Rep52的核苷酸序列包含SEQ ID NO:56所示的序列或由SEQ ID NO:56所示的序列组成。在某些实施方案中，包含编码Rep52的核苷酸序列的核酸包含与编码Rep52的核苷酸序列可操作地连接的转录调控元件。在某些实施方案中，与编码Rep52的核苷酸序列可操作地连接的转录调控元件包含与SEQ ID NO:48所示的序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在某些实施方案中，与编码Rep52的核苷酸序列可操作地连接的转录调控元件包含SEQ ID NO:48所示的序列或由SEQ ID NO:48所示的序列组成。在某些实施方案中，包含编码Rep52的核苷酸序列的核酸包含与SEQ ID NO:57中所示的序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在某些实施方案中，包含编码Rep52的核苷酸序列的核酸包含SEQ ID NO:57所示的序列或由SEQ ID NO:57所示的序列组成。在某些实施方案中，本公开提供了在不同腺病毒血清型中的包含对应于如针对AAV2所述的编码Rep52的序列的核苷酸序列的核酸。

在某些实施方案中，本公开提供了包含编码Rep78、Rep68、Rep40和Rep52的核苷酸序列的核酸，其中编码Rep78、Rep68、Rep40和Rep52的核苷酸序列包含与SEQ ID NO:58中所示的序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在某些实施方案中，编码Rep78、Rep68、Rep40和Rep52的核苷酸序列包含SEQ ID NO:58所示的序列或由SEQ ID NO:58所示的序列组成。在某些实施方案中，包含编码Rep78、Rep68、Rep40和Rep52的核苷酸序列的核酸包含一个或多个转录调控元件，所述转录调控元件可操作地连接至编码Rep78、Rep68、Rep40和Rep52的核苷酸序列中的每一个核苷酸序列。在某些实施方案中，包含编码Rep78、Rep68、Rep40和Rep52的核苷酸序列的核酸包含与SEQ ID NO:59中所示的序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在某些实施方案中，包含编码Rep78、Rep68、Rep40和Rep52的核苷酸序列的核酸包含SEQ ID NO:59所示的序列或由SEQ ID NO:59所示的序列组成。

AAV衣壳蛋白

本公开提供了包含含有AAV衣壳蛋白编码序列的核苷酸序列的第一核酸载体。第一核酸载体可包含编码来自本领域已知的任何AAV衣壳(包括天然AAV分离物及其变体)的AAV衣壳蛋白的核苷酸序列。

AAV衣壳蛋白包括VP1、VP2和VP3衣壳蛋白。VP1、VP2和/或VP3衣壳蛋白组装成包围rAAV基因组的衣壳。在某些实施方案中，衣壳蛋白的组装由组装激活蛋白(AAP)促进。某些AAV血清型的衣壳需要AAP在将衣壳蛋白转运到核仁进行组装中的作用。例如，AAV1、AAV2、AAV3、AAV6、AAV7、AAV8、AAV9、AAV10和AAV12需要AAP来形成衣壳，而AAV4、AAV5和AAV11的衣壳可以在没有AAP的情况下组装。参见，例如，Earley等人(2017)J.Virol.91(3):e01980-16。

不同的AAV血清型或其变体包含具有不同氨基酸序列的AAV衣壳蛋白。合适的AAV衣壳蛋白包括但不限于来自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、AAV-DJ、AAV-LK03、NP59、VOY101、VOY201、VOY701、VOY801、VOY1101、AAVPHP.N、AAVPHP.A、AAVPHP.B、PHP.B2、PHP.B3、G2A3、G2B4、G2B5、PHP.S、AAVrh10、AAVRh32.33、AAVrh74、AAVHSC1、AAVHSC2、AAVHSC3、AAVHSC4、AAVHSC5、AAVHSC6、AAVHSC7、AAVHSC8、AAVHSC9、AAVHSC10、AAVHSC11、AAVHSC12、AAVHSC13、AAVHSC14、AAVHSC15、AAVHSC16、AAVHSC17的衣壳蛋白，及其任何变体。在某些实施方案中，AAV衣壳蛋白选自AAV1、AAV2、AAV5、AAV6、AAV8、AAV9、AAVrh10和AAVrh74。在某些实施方案中，AAV衣壳蛋白选自AAV1、AAV2、AAV5、AAV6、AAV8和AAVrh74。各种AAV衣壳蛋白的序列公开于例如美国专利公开号：US20030138772、US20140359799、US20150159173、US20150376607、US20170081680和US20170360962A1，以及PCT公开号WO2020227515，其公开内容通过引用整体并入本文。

例如，在某些实施方案中，衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的氨基酸序列。在某些实施方案中，衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的氨基酸序列，其中：衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C；衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H；衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q；衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A；衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N；衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S；衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I；衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y；衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M；衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K；衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C；或者，衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。在某些实施方案中，衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。在某些实施方案中，衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H，衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N，衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M。在某些实施方案中，衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R。在某些实施方案中，衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A，并且衣壳蛋白中对应于SEQID NO:16的氨基酸505的氨基酸是R。在某些实施方案中，衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I，衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C。在某些实施方案中，衣壳蛋白包含SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列。

例如，在某些实施方案中，衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的氨基酸序列。在某些实施方案中，衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的氨基酸序列，其中：衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸160的氨基酸是D；衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C；衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H；衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q；衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A；衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N；衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S；衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I；衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y；衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M；衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K；衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C；或者，衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。在某些实施方案中，衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。在某些实施方案中，衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H，衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N，衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M。在某些实施方案中，衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R。在某些实施方案中，衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R。在某些实施方案中，衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I，衣壳蛋白中对应于SEQ IDNO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C。在某些实施方案中，衣壳蛋白包含SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列。

例如，在某些实施方案中，衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的氨基酸序列。在某些实施方案中，衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的氨基酸序列，其中：衣壳蛋白中对应于SEQ ID NO:16的氨基酸2的氨基酸是T；衣壳蛋白中对应于SEQ ID NO:16的氨基酸65的氨基酸是I；衣壳蛋白中对应于SEQ ID NO:16的氨基酸68的氨基酸是V；衣壳蛋白中对应于SEQ ID NO:16的氨基酸77的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸119的氨基酸是L；衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸160的氨基酸是D；衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C；衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H；衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q；衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A；衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N；衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S；衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I；衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y；衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M；衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K；衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C；或者，衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。在某些实施方案中，衣壳蛋白中对应于SEQ ID NO:16的氨基酸2的氨基酸是T，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q。在某些实施方案中，衣壳蛋白中对应于SEQ ID NO:16的氨基酸65的氨基酸是I，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是Y。在某些实施方案中，衣壳蛋白中对应于SEQ IDNO:16的氨基酸77的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K。在某些实施方案中，衣壳蛋白中对应于SEQ ID NO:16的氨基酸119的氨基酸是L，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S。在某些实施方案中，衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。在某些实施方案中，衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H，衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N，衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M。在某些实施方案中，衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R。在某些实施方案中，衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R。在某些实施方案中，衣壳蛋白中对应于SEQ IDNO:16的氨基酸501的氨基酸是I，衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C。在某些实施方案中，衣壳蛋白包含SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列。

在某些实施方案中，AAV衣壳包含以下的两种或更多种：(a)包含SEQ ID NO:1、2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列的衣壳蛋白；(b)包含SEQID NO:1、2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列的衣壳蛋白；和(c)包含SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施方案中，AAV衣壳包含：(a)具有由SEQ ID NO:1、2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736组成的氨基酸序列的衣壳蛋白；(b)具有由SEQ ID NO:1、2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736组成的氨基酸序列的衣壳蛋白；和(c)具有由SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736组成的氨基酸序列的衣壳蛋白。

在某些实施方案中，AAV衣壳包含以下的一种或多种：(a)包含与SEQ ID NO:8的氨基酸203-736的序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列的衣壳蛋白；(b)包含与SEQ ID NO:8的氨基酸138-736的序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列的衣壳蛋白；和(c)包含与SEQ ID NO:8的氨基酸1-736的序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列的衣壳蛋白。在某些实施方案中，AAV衣壳包含以下的一种或多种：(a)包含SEQ ID NO:8的氨基酸203-736的氨基酸序列的衣壳蛋白；(b)包含SEQ ID NO:8的氨基酸138-736的氨基酸序列的衣壳蛋白；和(c)包含SEQ ID NO:8的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施方案中，AAV衣壳包含以下的两种或更多种：(a)包含SEQ ID NO:8的氨基酸203-736的氨基酸序列的衣壳蛋白；(b)包含SEQ ID NO:8的氨基酸138-736的氨基酸序列的衣壳蛋白；和(c)包含SEQ ID NO:8的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施方案中，AAV衣壳包含：(a)具有由SEQ ID NO:8的氨基酸203-736组成的氨基酸序列的衣壳蛋白；(b)具有由SEQ ID NO:8的氨基酸138-736组成的氨基酸序列的衣壳蛋白；和(c)具有由SEQ ID NO:8的氨基酸1-736组成的氨基酸序列的衣壳蛋白。

在某些实施方案中，AAV衣壳包含以下的一种或多种：(a)包含与SEQ ID NO:11的氨基酸203-736的序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列的衣壳蛋白；(b)包含与SEQ ID NO:11的氨基酸138-736的序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列的衣壳蛋白；和(c)包含与SEQ ID NO:11的氨基酸1-736的序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列的衣壳蛋白。在某些实施方案中，AAV衣壳包含以下的一种或多种：(a)包含SEQ ID NO:11的氨基酸203-736的氨基酸序列的衣壳蛋白；(b)包含SEQ ID NO:11的氨基酸138-736的氨基酸序列的衣壳蛋白；和(c)包含SEQ ID NO:11的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施方案中，AAV衣壳包含以下的两种或更多种：(a)包含SEQ ID NO:11的氨基酸203-736的氨基酸序列的衣壳蛋白；(b)包含SEQ ID NO:11的氨基酸138-736的氨基酸序列的衣壳蛋白；和(c)包含SEQ ID NO:11的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施方案中，AAV衣壳包含：(a)具有由SEQ ID NO:11的氨基酸203-736组成的氨基酸序列的衣壳蛋白；(b)具有由SEQ ID NO:11的氨基酸138-736组成的氨基酸序列的衣壳蛋白；和(c)具有由SEQ ID NO:11的氨基酸1-736组成的氨基酸序列的衣壳蛋白。

在某些实施方案中，AAV衣壳包含以下的一种或多种：(a)包含与SEQ ID NO:13的氨基酸203-736的序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列的衣壳蛋白；(b)包含与SEQ ID NO:13的氨基酸138-736的序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列的衣壳蛋白；和(c)包含与SEQ ID NO:13的氨基酸1-736的序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列的衣壳蛋白。在某些实施方案中，AAV衣壳包含以下的一种或多种：(a)包含SEQ ID NO:13的氨基酸203-736的氨基酸序列的衣壳蛋白；(b)包含SEQ ID NO:13的氨基酸138-736的氨基酸序列的衣壳蛋白；和(c)包含SEQ ID NO:13的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施方案中，AAV衣壳包含以下的两种或更多种：(a)包含SEQ ID NO:13的氨基酸203-736的氨基酸序列的衣壳蛋白；(b)包含SEQ ID NO:13的氨基酸138-736的氨基酸序列的衣壳蛋白；和(c)包含SEQ ID NO:13的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施方案中，AAV衣壳包含：(a)具有由SEQ ID NO:13的氨基酸203-736组成的氨基酸序列的衣壳蛋白；(b)具有由SEQ ID NO:13的氨基酸138-736组成的氨基酸序列的衣壳蛋白；和(c)具有由SEQ ID NO:13的氨基酸1-736组成的氨基酸序列的衣壳蛋白。

在某些实施方案中，AAV衣壳包含以下的一种或多种：(a)包含与SEQ ID NO:16的氨基酸203-736的序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的氨基酸序列的衣壳蛋白；(b)包含与SEQ ID NO:16的氨基酸138-736的序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的氨基酸序列的衣壳蛋白；和(c)包含与SEQ ID NO:16的氨基酸1-736的序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的氨基酸序列的衣壳蛋白。在某些实施方案中，AAV衣壳包含以下的一种或多种：(a)包含SEQ ID NO:16的氨基酸203-736的氨基酸序列的衣壳蛋白；(b)包含SEQ ID NO:16的氨基酸138-736的氨基酸序列的衣壳蛋白；和(c)包含SEQ ID NO:16的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施方案中，AAV衣壳包含以下的两种或更多种：(a)包含SEQ ID NO:16的氨基酸203-736的氨基酸序列的衣壳蛋白；(b)包含SEQ ID NO:16的氨基酸138-736的氨基酸序列的衣壳蛋白；和(c)包含SEQ IDNO:16的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施方案中，AAV衣壳包含：(a)具有由SEQ ID NO:16的氨基酸203-736组成的氨基酸序列的衣壳蛋白；(b)具有由SEQ ID NO:16的氨基酸138-736组成的氨基酸序列的衣壳蛋白；和(c)具有由SEQ ID NO:16的氨基酸1-736组成的氨基酸序列的衣壳蛋白。

在某些实施方案中，编码AAV衣壳蛋白的核苷酸与控制AAV衣壳蛋白表达的转录调控元件可操作地连接。在某些实施方案中，所述转录调控元件包括启动子，所述启动子选自组成型启动子、诱导型启动子或天然启动子。可以使用本领域已知的能够控制AAV衣壳蛋白表达的任何启动子。适合使用的启动子是本领域技术人员已知的，并且包括但不限于p40启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。其他合适的启动子包括但不限于CMV启动子、CBA启动子和CAG启动子。

在某些实施方案中，与编码AAV衣壳蛋白的核苷酸序列可操作地连接的转录调控元件包含与SEQ ID NO:47、48或49所示的序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在某些实施方案中，与编码AAV衣壳蛋白的核苷酸序列可操作地连接的转录调控元件包含SEQ ID NO:47、48或49所示的序列或由SEQ ID NO:47、48或49所示的序列组成。

在另一个方面，本公开提供了第一核酸载体，其包含：含有Rep-Cap元件的第一核苷酸序列和含有包含转基因的rAAV基因组的第二核苷酸序列。在某些实施方案中，Rep-Cap元件包含编码AAV Rep蛋白的核酸序列和编码AAV衣壳蛋白的核酸序列。Rep-Cap元件可包含编码本领域已知的任何AAV Rep蛋白的核酸序列和编码本领域已知的任何AAV衣壳蛋白的核酸序列。在某些实施方案中，Rep-Cap元件包含与SEQ ID NO:73或77所示的序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的核苷酸序列。

III.第二核酸载体

本文所述的双重载体转染系统通常包含含有一个或多个辅助病毒基因的第二核酸载体。如本领域技术人员所理解的，AAV的复制依赖于由辅助病毒基因编码的辅助因子的存在。辅助因子可经由辅助病毒的共感染提供，诸如来自但不限于腺病毒、疱疹病毒、乳头瘤病毒、巨细胞病毒、杆状病毒和人博卡病毒的辅助病毒。然而，使AAV在辅助病毒的存在下生长可导致宿主细胞的裂解和/或AAV产物的污染。因此，可以在用于转染宿主细胞的载体上提供编码AAV复制所需的辅助因子的辅助病毒的基因。

本文所述的双重载体转染系统通常涉及将两种核酸载体转染到宿主细胞中以产生AAV(例如，rAAV)：(1)第一核酸载体，其包含：编码AAV Rep蛋白的第一核苷酸序列、包含含有转基因的rAAV基因组的第二核苷酸序列和编码AAV衣壳蛋白的第三核苷酸序列；和(2)第二核酸载体，其包含辅助病毒基因。在某些实施方案中，第二核酸载体不包含在第一核酸载体中发现的AAV产生的任何组分。在某些实施方案中，第二核酸载体不包含含有转基因的rAAV基因组。在某些实施方案中，第二核酸载体不包含AAV衣壳蛋白编码序列。在某些实施方案中，第二核酸载体不包含Rep编码序列或其功能片段的编码序列。在某些实施方案中，第二核酸载体不包含含有转基因的rAAV基因组，第二核酸载体不包含AAV衣壳蛋白编码序列，和/或第二核酸载体不包含Rep编码序列或其功能片段的编码序列。

在某些实施方案中，第二核酸载体包含至少一个可源自选自腺病毒、疱疹病毒、痘病毒、巨细胞病毒和杆状病毒的辅助病毒的辅助病毒基因。辅助病毒基因可以与控制辅助病毒基因表达的转录调控元件可操作地连接。在某些实施方案中，所述转录调控元件包括启动子，所述启动子选自组成型启动子、诱导型启动子或天然启动子。适合使用的启动子是本领域技术人员已知的，并且包括但不限于RSV LTR启动子、CMV立即早期启动子、SV40启动子、二氢叶酸还原酶启动子、细胞质β-肌动蛋白启动子、磷酸甘油酸激酶(PGK)启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。

在某些实施方案中，第二核酸载体包含至少一个辅助病毒基因。所述至少一种辅助病毒基因可以源自腺病毒(AdV)。已知有效AAV产生所需的最小AdV辅助因子集合由AdV分子E1、E2、E4和VA RNA组成(参见，例如，Meier等人(2020)Viruses 12(6):662)。具体而言，有效AAV产生所需的最小AdV辅助因子集合包括AdV分子E1A、E1B、E2A、E4和VARNA。在某些实施方案中，第二核酸载体包含足够的辅助病毒基因集合，其将允许在宿主细胞(例如，宿主AAV生产细胞)中有效的AAV产生(例如，AAV复制和包装)。

典型的AdV基因组表达约40种分为早期和晚期的紧密调控的蛋白质。早期蛋白包括E1A、E1B、E2A和E4。简言之，E1A和E2A蛋白起到激活控制AAVRep蛋白表达的AAV启动子p5和p19的作用。已发现AAV复制需要E1A介导的p5活性。E2A是单链DNA结合蛋白，已经证实其会促进AAV复制的各个方面。E1B基因编码E1B19K和E1B55K癌蛋白。E1B19K抑制E1A诱导的细胞凋亡，并且E1B55K抑制肿瘤抑制蛋白p53。E1B55K与E4orf6一起作用以促进AAV第二链合成和病毒DNA复制。还证实E1B55K会促进AAV mRNA输出并抑制细胞mRNA输出，一起促进AAV基因表达。已经发现E1B19K当与其他AdV辅助因子诸如E1A、E1B55K、E2A和E4orf6共表达时在提高AAV滴度中起作用。

已发现VA RNA在抑制细胞先天免疫蛋白双链RNA活化激酶(PKR)中起作用，对该激酶的抑制确保有效的病毒蛋白合成。还已证实VARNA会促进AAV结构蛋白的合成和组装。本领域技术人员容易理解，AdV基因组内的VA核酸是产生VA RNA的非翻译核酸序列。

最常用的辅助功能之一来自人AdV 5型。腺病毒辅助病毒基因也可以源自其他已知的腺病毒，例如AdV 2型。AdV5基因组为约36千碱基，并且示例性AdV5基因组序列可经由NCBI参考序列AC_000008.1找到。根据NCBI参考序列，E1A由核苷酸560至1545编码；E1B19K由核苷酸1714至2244编码；E1B55K由核苷酸2019至3509编码；E2A由核苷酸22443至24032编码；并且E4orf6/7由核苷酸32914至34077编码。

在某些实施方案中，本公开提供了包含编码AdV5 E2A的核苷酸序列的核酸。在某些实施方案中，包含编码AdV5 E2A的核苷酸序列的核酸包含与编码AdV5 E2A的核苷酸序列可操作地连接的转录调控元件。在某些实施方案中，包含编码AdV5 E2A的核苷酸序列的核酸包含与SEQ ID NO:60中所示的序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在某些实施方案中，包含编码AdV5 E2A的核苷酸序列的核酸包含SEQ ID NO:60所示的序列或由SEQ ID NO:60所示的序列组成。在某些实施方案中，本公开提供了在不同腺病毒血清型(例如，AdV2)中的包含对应于如针对AdV5所述的编码E2A的序列的核苷酸序列的核酸。

在某些实施方案中，本公开提供了包含编码AdV5 E4的核苷酸序列的核酸。在某些实施方案中，包含编码AdV5 E4的核苷酸序列的核酸包含与编码AdV5 E4的核苷酸序列可操作地连接的转录调控元件。在某些实施方案中，包含编码AdV5 E4的核苷酸序列的核酸包含与SEQ ID NO:61中所示的序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在某些实施方案中，包含编码AdV5 E4的核苷酸序列的核酸包含SEQ ID NO:61所示的序列或由SEQ ID NO:61所示的序列组成。在某些实施方案中，本公开提供了在不同腺病毒血清型(例如，AdV2)中的包含对应于如针对AdV5所述的编码E4的序列的核苷酸序列的核酸。

在某些实施方案中，本公开提供了包含编码AdV5 VARNA的核苷酸序列的核酸。在某些实施方案中，包含编码AdV5 VARNA的核苷酸序列的核酸包含与编码AdV5 VA RNA的核苷酸序列可操作地连接的转录调控元件。在某些实施方案中，包含编码AdV5 VARNA的核苷酸序列的核酸包含与SEQ ID NO:62中所示的序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在某些实施方案中，包含编码AdV5 VA RNA的核苷酸序列的核酸包含SEQ ID NO:62所示的序列或由SEQID NO:62所示的序列组成。本领域技术人员容易理解，VA RNA核酸序列是产生(例如，“编码”)VARNA的非翻译核酸序列。在某些实施方案中，本公开提供了在不同腺病毒血清型(例如，AdV2)中的包含对应于如针对AdV5所述的编码VARNA的序列的核苷酸序列的核酸。

在某些实施方案中，本公开提供了包含编码AdV5 E2A、E4和VA RNA的核苷酸序列的核酸。在某些实施方案中，包含编码AdV5E2A、E4和VA RNA的核苷酸序列的核酸包含一个或多个转录调控元件，所述转录调控元件可操作地连接至编码AdV5 E2A、E4和VA RNA的核苷酸序列中的每一个核苷酸序列。在某些实施方案中，包含编码AdV5 E2A、E4和VA RNA的核苷酸序列的核酸包含与SEQ ID NO:63中所示的序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在某些实施方案中，包含编码AdV5 E2A、E4和VA RNA的核苷酸序列的核酸包含SEQ ID NO:63所示的序列或由SEQ ID NO:63所示的序列组成。

在某些实施方案中，本公开提供了包含编码有效AAV产生所需的最小AdV辅助因子集合的核苷酸序列的核酸。在某些实施方案中，包含编码最小AdV辅助因子集合的核苷酸的核酸编码AdV分子E1A、E1B、E2A、E4和VARNA。

某些宿主细胞诸如HEK293T细胞内源性地提供一些但不是全部所需的辅助因子，并且其余的辅助因子可经由质粒转染外源性地提供。例如，HEK293T细胞内源性表达腺病毒E1A和E1B基因，并提供有其余腺病毒辅助基因，即编码AdV5 E4、E2A和病毒相关(VA)RNA的那些。此类AdV5辅助基因可以通过转染由单一载体提供。在某些实施方案中，本公开提供了包含选自E2A、E4和VARNA的AdV5辅助病毒基因的第二核酸载体。在某些实施方案中，本公开提供了包含辅助病毒基因的第二核酸载体，所述辅助病毒基因编码如针对AdV5所述的源自不同腺病毒血清型(例如，AdV2)的E2A、E4和VA RNA。

辅助病毒基因也可以源自疱疹病毒、乳头瘤病毒和人博卡病毒。辅助病毒因子所来源的疱疹病毒的实例包括HSV-1和HSV-2。已知参与支持AAV产生的源自HSV-1的辅助病毒因子包括但不限于UL5、UL8、UL52、ICP8、ICP0、ICP4、ICP22、UL30和UL42。这些HSV-1辅助病毒因子的各种功能以及它们如何支持AAV产生是本领域技术人员已知的。例如，除单链DNA结合蛋白ICP8外，已知HSV-1解旋酶-引发酶复合物UL5/UL8/UL52足以在AAV感染模型中恢复AAV子代产生；ICP0、ICP4和ICP22参与促进Rep蛋白的表达；并且HSV-1DNA聚合酶UL30/UL42参与AAV DNA的复制。因此，在某些实施方案中，第二核酸载体包含至少一种选自UL5、UL8、UL52、ICP8、ICP0、ICP4、ICP22、UL30和UL42的辅助病毒基因。辅助病毒因子所来源的乳头瘤病毒的实例是HPV-16。在某些实施方案中，源自HPV-16的辅助病毒因子可以在AdV辅助因子的存在下增强AAV产生。已知参与支持AAV复制的此类HPV-16辅助因子包括但不限于E1、E2和E6。辅助病毒因子可以源自其中的人博卡病毒的实例是人博卡病毒1(HBoVl)。已知参与支持AAV产生的源自HBoV1的辅助病毒因子包括但不限于NP1、NS2、NS4及病毒长非编码RNABocaSR。

IV.载体和细胞

本公开提供了第一核酸载体，其包含：编码AAV Rep蛋白的第一核苷酸序列、包含含有转基因的rAAV基因组的第二核苷酸序列和编码AAV衣壳蛋白的第三核苷酸序列；和第二核酸载体，其包含辅助病毒基因。

第一核酸载体和第二核酸载体可以独立地为任何形式的核酸载体。合适的载体包括但不限于质粒、最小载体(例如，微环、Nanopla smids^TM、doggybone、MIDGE载体等)、病毒、粘粒、人工染色体、线性DNA和mRNA。在某些实施方案中，第一核酸载体和/或第二核酸载体是DNA质粒或DNA最小载体。可容纳必需载体元件的任何D NA质粒或DNA最小载体可用于第一核酸载体和第二核酸载体。合适的DNA最小载体包括但不限于线性共价闭合的DNA(例如，小串DNA)、线性共价闭合的哑铃形DNA(例如，doggybone DNA，哑铃形DNA)、微环、Nanoplasmids^TM、最小免疫限定的基因表达(MIDGE)载体和本领域技术人员已知的其他载体。DNA最小载体及其生产方法描述于例如美国专利申请第20100233814号、第20120282283号、第20130216562号、第20150218565号、第20150218586号、第20160008488号、第20160215296号、第20160355827号、第20190185924号、第20200277624号和第20210010021号，所有专利申请通过引用整体并入本文。

在某些实施方案中，本文公开的载体中的核酸例如通过密码子/RNA优化、用异源信号序列置换和/或消除mRNA不稳定性元件来优化。通过引入密码子变化和/或消除mRNA中的抑制区来生成用于重组表达的优化多核苷酸的方法可通过修改例如美国专利第5,965,726号、第6,174,666号、第6,291,664号、第6,414,132号和第6,794,498号中描述的优化方法来进行，所有专利通过引用整体并入本文。例如，可以使RNA内的潜在剪接位点和不稳定元件(例如，富含A/T或A/U的元件)突变，而不改变由核酸序列编码的氨基酸，以增加用于重组表达的RNA的稳定性。所述改变利用遗传密码的简并性，例如使用相同氨基酸的替代密码子。在某些实施方案中，可能期望改变一个或多个密码子以编码保守性突变，例如与原始氨基酸具有相似化学结构和性质和/或功能的相似氨基酸。相对于由尚未优化的多核苷酸编码的衣壳的表达，此类方法可以增加编码的衣壳蛋白的表达。

可以将本文公开的载体引入细胞(使用本领域已知的任何技术)用于载体的增殖和/或用于由载体编码的蛋白质的表达。因此，在另一个方面，本公开提供了包含本文公开的载体的重组细胞。此外，在另一个方面，本公开提供了产生rAAV的方法，所述方法包括在表达多核苷酸和产生rAAV的条件下培养重组细胞。

可以利用多种宿主细胞和表达系统。此类表达系统表示媒介物，通过该媒介物可以产生感兴趣的编码序列并随后纯化，但也表示细胞，当用本文所述的合适核苷酸编码序列转化或转染时，该细胞可以产生rAAV。这些包括但不限于微生物，诸如用例如含有本文所述的核苷酸编码序列的重组噬菌体DNA、质粒DNA或粘粒DNA表达载体转化的细菌(例如，大肠杆菌(E.coli)和枯草芽孢杆菌(B.subtilis))；用例如含有本文所述的核苷酸编码序列的重组酵母表达载体转化的酵母(例如，毕赤酵母(Saccharomyces Pichia))；用例如含有本文所述的核苷酸编码序列的重组病毒表达载体(例如，杆状病毒)感染的昆虫细胞系统；用例如重组病毒表达载体(例如，花椰菜花叶病毒，CaMV；烟草花叶病毒，TMV)感染或用例如含有本文所述的核苷酸编码序列的重组质粒表达载体(例如，Ti质粒)转化的植物细胞系统(例如，绿藻诸如莱氏衣藻(Chlamydomonas reinhardtii))；或哺乳动物细胞系统(例如，COS(例如，COS1或COS)、CHO、BHK、MDCK、HEK293、NS0、PER.C6、VERO、CRL7O3O、HsS78Bst、HeLa和NIH 3T3、HEK293T、HEK293F、HepG2、SP210、R1.1、B-W、L-M、BSC1、BSC40、YB/20和BMT10细胞)，其携带例如含有本文所述的核苷酸编码序列的重组表达构建体，所述核苷酸编码序列包含源自哺乳动物细胞的基因组的启动子(例如，金属硫蛋白启动子)或源自哺乳动物病毒的启动子(例如，腺病毒晚期启动子；痘苗病毒7.5K启动子)。在某些实施方案中，用于表达本文所述的核苷酸编码序列的细胞是人细胞，例如人细胞系。在某些实施方案中，哺乳动物表达载体是pOptiVEC^TM或pcDNA3.3。在某些实施方案中，细菌细胞诸如大肠杆菌或真核细胞(例如，哺乳动物细胞)用于表达本文所述的核苷酸编码序列。例如，哺乳动物细胞诸如CHO或HEK293细胞连同载体元件诸如来自人巨细胞病毒的主要中间早期基因启动子元件是本文所述多核苷酸的有效表达系统。

在细菌系统中，可以根据所表达的蛋白质的预期用途有利地选择许多表达载体。例如，当要产生大量蛋白质时，期望指导易于纯化的高水平融合蛋白产物表达的载体。此类载体包括但不限于大肠杆菌表达载体pUR278(Ruether U和Mueller-Hill B(1983)EMBO J2:1791-1794)，其中蛋白质编码序列可以与lac Z编码区在框内单独连接到载体中，以便产生融合蛋白；pIN载体(Inouye S和Inouye M(1985)Nuc Acids Res 13:3101-3109；VanHeeke G和Schuster SM(1989)J Biol Chem 24:5503-5509)；等等，所有这些文献通过引用整体并入本文。例如，pGEX载体也可用于表达作为与谷胱甘肽5-转移酶(GST)的融合蛋白的外源多肽。一般而言，此类融合蛋白是可溶的，并且可以通过吸附和结合到基质谷胱甘肽琼脂糖珠粒，随后在游离谷胱甘肽的存在下洗脱而容易地从裂解细胞中纯化。pGEX载体被设计为包括凝血酶或因子Xa蛋白酶切割位点，使得克隆的靶基因产物可以从GST部分释放。

在昆虫系统中，例如，苜蓿夜蛾核多角体病毒(Autographa cahf ornicanuclearpolyhedrosis virus，AcNPV)可用作表达外源基因的载体。病毒在草地贪夜蛾(Spodopterafrugiperda)细胞中生长。蛋白质编码序列可以单独克隆到病毒的非必需区(例如多角体蛋白基因)中，并置于AcNPV启动子(例如多角体蛋白启动子)的控制下。

在哺乳动物宿主细胞中，可以使用许多基于病毒的表达系统。在使用腺病毒作为表达载体的情况下，可以将感兴趣的蛋白质编码序列连接到腺病毒转录/翻译控制复合物，例如晚期启动子和三联体前导序列。然后可以通过体外或体内重组将该嵌合基因插入腺病毒基因组中。插入病毒基因组的非必需区域(例如，区域E1或E3)中将产生活的并且能够在受感染的宿主中表达本文所述的核苷酸编码序列的重组病毒(参见，例如，Logan J和ShenkT(1984)PNAS 81(12):3655-9，其通过引用整体并入本文)。插入的蛋白质编码序列的有效翻译也需要特定的起始信号。这些信号包括ATG起始密码子和相邻序列。此外，起始密码子必须与所需编码序列的阅读框同相，以确保整个插入片段的翻译。这些外源翻译控制信号和起始密码子可以是天然和合成的多种来源的。表达的效率可以通过包含适当的转录增强子元件、转录终止子等来增强(参见，例如，Bitter G等人(1987)MethodsEnzymol.153:516-544，其通过引用整体并入本文)。

另外，可以选择调节插入的序列的表达或以期望的特定方式修饰和加工基因产物的宿主细胞株。蛋白质产物的此类修饰(例如，糖基化)和加工(例如，裂解)对于蛋白质的功能可能很重要。不同的宿主细胞具有用于蛋白质和基因产物的翻译后加工和修饰的特征性和特异性机制。可以选择适当的细胞系或宿主系统以确保表达的外源蛋白的正确修饰和加工。为此，可以使用具有用于适当加工初级转录物、糖基化和基因产物磷酸化的细胞机制的真核宿主细胞。此类哺乳动物宿主细胞包括但不限于CHO、VERO、BHK、Hela、MDCK、HEK293、HEK293T、HEK293F、HEK293EBNA、NIH 3T3、W138、BT483、Hs578T、HTB2、BT2O和T47D、NS0(不内源性产生任何免疫球蛋白链的鼠骨髓瘤细胞系)、CAP、CAP-T、CRL7O3O、COS(例如，COS1或COS)、PER.C6、VERO、AGE1.CR、A549、HsS78Bst、HepG2、C139、EB66、SP210、R1.1、B-W、L-M、BSC1、BSC40、YB/20、BMT10和HsS78Bst细胞。

在某些实施方案中，不是使用含有病毒复制起点的表达载体，而是可以用受适当的转录调控元件(例如，启动子、增强子、序列、转录终止子、多聚腺苷酸化位点等)控制的多核苷酸(例如，DNA或RNA)和选择标记转化宿主细胞。在引入多核苷酸后，可以使工程化细胞在富集培养基中生长1-2天，然后转换到选择性培养基中。重组质粒中的选择性标记赋予对选择的抗性，并允许细胞稳定地将质粒整合到它们的染色体中并生长形成灶，灶又可以被克隆并扩增到细胞系中。该方法可有利地用于工程改造表达本文所述的蛋白质或其片段的细胞系。

可以使用许多选择系统，包括但不限于分别在tk-、hgprt-或aprt-细胞中的单纯疱疹病毒胸苷激酶(Wigler M等人(1977)Cell 11(1):223-32)、次黄嘌呤鸟嘌呤磷酸核糖转移酶(Szybalska EH和Szybalski W(1962)PNAS 48(12):2026-2034)和腺嘌呤磷酸核糖转移酶(Lowy I等人(1980)Cell 22(3):817-23)基因，所有这些通过引用整体并入本文。此外，抗代谢物抗性可用作选择以下基因的基础：dhfr，其赋予对氨甲蝶呤的抗性(WiglerM等人(1980)PNAS 77(6):3567-70；O’Hare K等人(1981)PNAS 78:1527-31)；gpt，其赋予对霉酚酸的抗性(Mulligan RC和Berg P(1981)PNAS 78(4):2072-6)；neo，其赋予对氨基糖苷G-418的抗性(Wu GY和Wu CH(1991)Biotherapy 3:87-95；Tolstoshev P(1993)Ann RevPharmacol Toxicol 32:573-596；Mulligan RC(1993)Science 260:926-932；及MorganRA和AndersonWF(1993)Ann Rev Biochem 62:191-217；Nabel GJ和Felgner PL(1993)TrendsBiotechnol 11(5):211-5)；和hygro，其赋予对潮霉素的抗性(Santerre RF等人(1984)Gene 30(1-3):147-56)，所有这些通过引用整体并入本文。重组DNA技术领域通常已知的方法可常规应用于选择期望的重组克隆并且此类方法描述于例如Ausubel FM等人(编辑),CurrentProtocols in MolecularBiology,John Wiley&Sons,NY(1993)；KrieglerM,GeneTransfer and Expression,A Laboratory Manual,Stockton Press,NY(1990)，以及Dracopoli NC等人(编辑),Current Protocols in Human Genetics第12和13章,JohnWiley&Sons,NY(1994)；Colbere-Garapin F等人(1981)J Mol Biol 150:1-14中，其全部通过引用整体并入本文。

V.腺相关病毒包装系统和方法

在另一个方面，本公开提供了用于重组制备本文公开的重组腺相关病毒(rAAV)的包装系统。具体而言，本公开提供了可用于在本文所述的双重载体转染系统下产生AAV的包装系统(例如，AAV产生通过使用包含递送到宿主细胞中的第一核酸载体和第二核酸载体的包装系统来介导)。此类包装系统通常包括以下或由以下组成：(1)第一核酸载体，其包含：编码AAV Rep蛋白的第一核苷酸序列、包含含有转基因的rAAV基因组的第二核苷酸序列和编码AAV衣壳蛋白的第三核苷酸序列；和(2)第二核酸载体，其包含辅助病毒基因。第一核酸载体和第二核酸载体一起能够提供产生rAAV所需的所有组分。在某些实施方案中，产生rAAV所需的组分由从中产生rAAV的宿主细胞提供。在此类实施方案中，第一核酸载体和第二核酸载体与宿主细胞一起能够提供产生rAAV所需的所有组分。本文所述的包装系统在将rAAV基因组包封在衣壳中以形成rAAV的细胞中是有效的。

在某些实施方案中，包装系统的第一核酸载体包含含有转基因的rAAV基因组。本公开的包装系统的第一核酸载体还包含AAV Rep蛋白编码序列或其功能变体的编码序列，和AAV衣壳蛋白编码序列。因此，本公开提供了包装系统的第一核酸载体，其包含：编码AAVRep蛋白或其功能变体的第一核苷酸序列、包含含有转基因的rAAV基因组的第二核苷酸序列和编码AAV衣壳蛋白的第三核苷酸序列。在某些实施方案中，包装系统的第一核酸载体从5'至3’包含：编码AAV Rep蛋白或其功能变体的第一核苷酸序列，包含含有转基因的rAAV基因组的第二核苷酸序列，以及编码AAV衣壳蛋白的第三核苷酸序列。在某些实施方案中，包装系统的第一核酸载体不包含辅助病毒基因。

任何AAV Rep蛋白可用于本文公开的包装系统中。在包装系统的某些实施方案中，Rep核苷酸序列编码AAV2 Rep蛋白。合适的AAV2 Rep蛋白可包括但不限于Rep78/68或Rep68/52。在包装系统的某些实施方案中，编码AAV2 Rep蛋白的核苷酸序列包含编码与SEQID NO:64的AAV2 Rep氨基酸序列具有最小序列同一性百分比的蛋白的核苷酸序列，其中最小序列同一性百分比在AAV2 Rep蛋白的氨基酸序列的全长上为至少70％(例如，至少75％、至少80％、至少85％、至少90％、至少95％、至少98％、至少99％或100％)。在包装系统的某些实施方案中，AAV2 Rep蛋白具有SEQ ID NO:64所示的氨基酸序列。

在某些实施方案中，包装系统的第二核酸载体包含辅助病毒基因。本公开的包装系统的第二核酸载体可包含一种或多种辅助病毒基因。本公开的某些方面提供包装系统的第二核酸载体不包含如本文所述的第一核酸载体中发现的AAV产生的任何组分。在某些实施方案中，包装系统的第二核酸载体不包含含有转基因的rAAV基因组。在某些实施方案中，包装系统的第二核酸载体不包含AAV衣壳蛋白编码序列。在某些实施方案中，包装系统的第二核酸载体不包含Rep编码序列或其功能变体的编码序列。在某些实施方案中，包装系统的第二核酸载体不包含含有转基因的rAAV基因组，包装系统的第二核酸载体不包含AAV衣壳蛋白编码序列，和/或包装系统的第二核酸载体不包含Rep编码序列或其功能变体的编码序列。

在包装系统的某些实施方案中，辅助病毒选自腺病毒、疱疹病毒(包括单纯疱疹病毒(HSV))、痘病毒(诸如痘苗病毒)、巨细胞病毒(CMV)和杆状病毒。在包装系统的某些实施方案中，在辅助病毒是腺病毒的情况下，腺病毒基因组包含一个或多个选自E1、E2、E4和VA的腺病毒RNA基因。在包装系统的某些实施方案中，其中腺病毒基因组包含一个或多个选自E2、E4和VA的腺病毒RNA基因。在包装系统的某些实施方案中，在辅助病毒是HSV的情况下，HSV基因组包含一个或多个选自UL5/8/52、ICP0、ICP4、ICP22和UL30/UL42的HSV基因。

在包装系统的某些实施方案中，包装系统的第一核酸载体和第二核酸载体包含在两个质粒中。在某些实施方案中，包装系统的第一核酸载体包含在第一质粒中。在某些实施方案中，包装系统的第二核酸载体包含在第二质粒中。

在包装系统的某些实施方案中，包装系统的第一核酸载体和第二核酸载体包含在两种重组辅助病毒中。在某些实施方案中，包装系统的第一核酸载体包含在第一重组辅助病毒中。在某些实施方案中，包装系统的第二核酸载体包含在第二重组辅助病毒中。在某些实施方案中，包装系统的第一核酸载体和第二核酸载体包含在单一重组辅助病毒中。

在再一个方面，本公开提供了一种用于重组制备rAAV的方法，其中所述方法包括在对于将rAAV基因组包封在衣壳中以形成rAAV有效的条件下用如本文所述的包装系统转染或转导细胞。重组制备rAAV的示例性方法包括瞬时转染(例如，用一种或多种转染质粒)、病毒感染(例如，用一种或多种重组辅助病毒，诸如腺病毒、痘病毒(诸如牛痘病毒)、疱疹病毒(包括HSV、巨细胞病毒或杆状病毒))和稳定生产细胞系转染或感染(例如，用稳定生产细胞，诸如哺乳动物或昆虫细胞)。

因此，本公开提供了用于制备rAAV的包装系统，其中所述包装系统包含：(1)第一核酸载体，其包含：编码AAVRep蛋白或其功能变体的第一核苷酸序列；包含rAAV基因组的第二核苷酸序列；和编码AAV衣壳蛋白的第三核苷酸序列，和(2)包含辅助病毒基因的第二核酸载体。在某些实施方案中，本公开提供了用于制备rAAV的包装系统，其中所述包装系统包含：(1)第一核酸载体，其从5'至3'包含：编码AAV Rep蛋白或其功能变体的第一核苷酸序列；包含rAAV基因组的第二核苷酸序列；和编码AAV衣壳蛋白的第三核苷酸序列，和(2)第二核酸载体，其包含辅助病毒基因。

因此，本公开提供了用于重组制备rAAV的方法，其中所述方法包括用包装系统转染或转导细胞，所述包装系统包含：(1)第一核酸载体，其包含：编码AAV Rep蛋白或其功能变体的第一核苷酸序列；包含rAAV基因组的第二核苷酸序列；和编码AAV衣壳蛋白的第三核苷酸序列，和(2)第二核酸载体，其包含辅助病毒基因。在某些实施方案中，本公开提供了用于重组制备rAAV的方法，其中所述方法包括用包装系统转染或转导细胞，所述包装系统包含：(1)第一核酸载体，其从5’至3’包含：编码AAVRep蛋白或其功能变体的第一核苷酸序列；包含rAAV基因组的第二核苷酸序列；和编码AAV衣壳蛋白的第三核苷酸序列，和(2)第二核酸载体，其包含辅助病毒基因。

在某些实施方案中，转染或转导到细胞中的核酸的总量为0.1μg DNA/1E6个细胞至4μg DNA/1E6个细胞，所述核酸包括(1)第一核酸载体，其包含：编码AAVRep蛋白或其功能变体的第一核苷酸序列；包含rAAV基因组的第二核苷酸序列；编码AAV衣壳蛋白的第三核苷酸序列，和(2)第二核酸载体，其包含辅助病毒基因。例如，转染或转导到细胞中的核酸(包括第一核酸载体和第二核酸载体)的总量为0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9、3、3.1、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9或4μg DNA/1E6个细胞。在某些实施方案中，转染或转导到细胞中的核酸(包括第一核酸载体和第二核酸载体)的总量为1μg DNA/1E6个细胞。在某些实施方案中，转染或转导到细胞中的核酸(包括第一核酸载体和第二核酸载体)的总量为0.6μg DNA/1E6个细胞。在某些实施方案中，转染或转导到细胞中的核酸(包括第一核酸载体和第二核酸载体)的总量为0.7μg DNA/1E6个细胞。在某些实施方案中，转染或转导到细胞中的核酸(包括第一核酸载体和第二核酸载体)的总量为0.75μg DNA/1E6个细胞。在某些实施方案中，转染或转导到细胞中的核酸(包括第一核酸载体和第二核酸载体)的总量为0.8μg DNA/1E6个细胞。在某些实施方案中，转染或转导到细胞中的核酸(包括第一核酸载体和第二核酸载体)的总量为0.9μg DNA/1E6个细胞。

在某些实施方案中，第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:0.1至1:20。例如，第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:0.1、1:0.2、1:0.3、1:0.4、1:0.5、1:0.6、1:0.7、1:0.8、1:1、1:1.1、1:1.2、1:1.3、1:1.4、1:1.5、1:1.6、1:1.7、1:1.8、1:1.9、1:2、1:2.1、1:2.2、1:2.3、1:2.4、1:2.5、1:2.6、1:2.7、1:2.8、1:2.9、1:3、1:3.1、1:3.2、1:3.2、1:3.3、1:3.4、1:3.5、1:3.6、1:3.7、1:3.8、1:3.9、1:4、1.4.5、1:5、1:5.5、1:6、1:6.5、1:7、1:7.5、1:8、1:8.5、1:9、1:9.5、1:10、1:10.5、1:11、1:11.5、1:12、1:12.5、1:13、1:13.5、1:14、1:14.5、1:15、1:15.5、1:16、1:16.5、1:17、1:17.5、1:18、1:18.5、1:19、1:19.5或1:20。在某些实施方案中，第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率选自1:0.2、1:0.4、1:0.6、1:0.8、1:1、1:2、1:3或1:4。在某些实施方案中，第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:2。在某些实施方案中，第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:0.2至1:1。在某些实施方案中，第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:0.6。在某些实施方案中，第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:0.8。在某些实施方案中，第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:1。

在某些实施方案中，用于重组制备本文公开的rAAV的方法与包括使用以下哺乳动物细胞产生rAAV的方法相比导致增加的rAAV滴度，所述哺乳动物细胞包含：(i)包含编码AAVRep蛋白和AAV衣壳蛋白的核苷酸序列的第一载体；(ii)包含所述rAAV基因组的第二载体；以及(iii)包含所述一种或多种辅助病毒基因的第三载体。在某些实施方案中，用于重组制备本文公开的rAAV的方法与包括使用以下哺乳动物细胞产生rAAV的方法相比导致增加的rAAV滴度，所述哺乳动物细胞包含：(i)包含编码AAVRep蛋白和AAV衣壳蛋白的核苷酸序列的第一载体；(ii)包含所述rAAV基因组的第二载体；以及(iii)包含所述一种或多种辅助病毒基因的第三载体。

在某些实施方案中，哺乳动物细胞在细胞培养物中提供。在某些实施方案中，细胞培养物的体积为至少2升、至少50升或至少2000升。在某些实施方案中，细胞培养物的体积为约2升至约5000升。在某些实施方案中，细胞培养物的体积为约2升至约4000升。在某些实施方案中，细胞培养物的体积为约2升至约3000升。在某些实施方案中，细胞培养物的体积为约2升至约2500升。在某些实施方案中，细胞培养物的体积为约2升至约2000升。在某些实施方案中，细胞培养物的体积为约2升至约1500升。在某些实施方案中，细胞培养物的体积为约2升至约1000升。在某些实施方案中，细胞培养物的体积为约2升至约500升。在某些实施方案中，细胞培养物的体积为约2升至约250升。在某些实施方案中，细胞培养物的体积为约2升至约100升。在某些实施方案中，细胞培养物的体积为约2升至约50升。在某些实施方案中，细胞培养物的体积为约2升至约25升。在某些实施方案中，本文所述的方法在体积为至少2升、至少50升或至少2000升的生物反应器中进行。在某些实施方案中，本文所述的方法在体积为2000升的生物反应器中进行。

实施例

以下实施例是以说明的方式而不是以限制的方式提供的。

实施例1：材料和方法

在以下实施例中使用以下一般材料和方法。

小规模生产：使HEK293细胞扩增至少一代，并在转染前接种到含有适量的细胞培养基的摇瓶中。将摇瓶在振荡器中在37℃、8％CO₂和135rpm下孵育。当细胞达到1.8E6至2.4E6个细胞/mL(对于实施例1-8)或3.6E6至5E6个细胞/mL(对于实施例9)的密度时，转染细胞。通过将计算体积的载体、OptiPro培养基和聚乙烯亚胺(PEI)全部在环境温度下混合来制备转染混合物。然后将转染混合物添加到摇瓶中，并且在振荡器中在37℃、8％CO₂和135rpm下孵育72小时，然后收获。孵育72小时后，使用含有1M Tris(pH 9.5)、10％TritonX-100、1M MgCl₂、核酸内切酶(例如，)和5M NaCl的裂解缓冲液裂解细胞，并将摇瓶在37℃、8％CO₂和135rpm下孵育60分钟。通过离心收集粗裂解物样品。

2L生物反应器生产：将HEK293细胞扩增至少一代，并在转染前接种到含有适量的细胞培养基的2L生物反应器(Millipore Mobius)中。转染前将pH调至7.1±0.1，并以1.8E6至2.4E6个细胞/mL(对于实施例4-8)或3.6E6-5E6个细胞/mL(对于实施例9-11)的密度转染细胞。通过将计算体积的载体、OptiPro SFM培养基和聚乙烯亚胺(PEI)全部在环境温度下混合来制备转染混合物，并使其平衡10分钟，然后将转染混合物添加到细胞中。在转染后69-75小时收获细胞。使用含有1M Tris(pH 9.5)、10％Triton X-100、1M MgCl₂、核酸内切酶(例如，)和5M NaCl的裂解缓冲液裂解收获的细胞。向生物反应器中添加适当体积的裂解缓冲液，并将细胞在37℃和283rpm下孵育120分钟。离心后收集粗裂解物样品以去除细胞碎片。

通过微滴数字PCR(ddPCR)，通过标准方法，使用对包含转基因的载体(即转基因载体)的转基因有效负荷具有特异性的引物/探针集，测定以每个细胞的载体基因组数目(vg/细胞)表示的载体基因组生产率。通过微滴数字PCR(ddPCR)，通过标准方法，使用对包含转基因的载体(即转基因载体)的转基因有效负荷具有特异性的引物/探针集，测定以每升的载体基因组数目(vg/L)表示的载体基因组生产率。使用酶联免疫吸附测定(ELISA)，通过标准方法，用针对由包含Cap序列的载体编码的衣壳的表位的固定化抗体测定每个细胞的衣壳数。完整载体基因组的百分比(即，完整衣壳的百分比)通过将通过ddPCR测定的载体基因组生产率除以通过ELISA测定的(在实施例2-4中)或通过分析超速离心沉降速度(AUC)分析测定的(在实施例5中)每个细胞的衣壳数来计算。

实施例2：双重和三重转染系统之间的比较

进行初始小规模生产、概念验证研究以评估双重载体转染系统相对于其载体基因组(VG)生产率的效用，以及与三重转染系统相比可获得的完整载体基因组的百分比。根据表1示出的那些设定转染条件。

表1：转染条件

如表1所示，双重载体转染系统包含第一V4载体和第二V3载体。三重载体转染系统包含载体V1、V2和V3。在表1中，载体比率是基于质量。各种载体中所含的元件示于表2中。

在适当大小的锥形管中通过全部在环境温度下添加计算体积的载体、OptiPro培养基和聚乙烯亚胺(PEI)，制备每种转染条件的转染混合物。将转染混合物以1μg DNA/1E6个细胞的浓度添加到细胞中。将摇瓶孵育72小时，之后收获。在收获时，裂解细胞，离心后收集粗裂解物样品以去除细胞碎片，用于随后的微滴数字PCR(ddPCR)和通过ELISA进行的衣壳分析。

表2：载体元件

/>

图1A-图1C示出了由使用双重和三重转染系统的生产获得的VG生产率(图1A)、衣壳生产率(图1B)和完整载体基因组的百分比(图1C)。如图1A和图1C所示，发现由使用双重载体转染系统的生产获得的VG生产率和完整载体基因组的百分比高于由三重载体转染系统获得的VG生产率和完整载体基因组的百分比。这些数据证明，与对照三重载体转染系统相比，使用双重载体转染系统产生增加的rAAV滴度。图1A-图1C中所示的各种条件示于表1中。

用另外的转染条件进行验证性实验以确定使用不同的转基因载体是否可以复制从双重转染系统获得的增加的VG生产率和增加的完整载体基因组的百分比。根据表3所示的那些设定转染条件，并且各种载体中所含的元件示于表2中。在表2中，载体比率基于质量。

表3：转染条件

图2A-图2C示出了由使用双重和三重转染系统的生产获得的VG生产率(图2A)、衣壳生产率(图2B)和完整载体基因组的百分比(图2C)。如图2A和图2C所示，发现使用双重载体转染系统由产生获得的VG生产率和完整载体基因组的百分比高于由三重载体转染系统获得的VG产率和完整载体基因组的百分比。发现双重载体转染系统的增加的生产率在至少两种不同的转基因载体中是一致的，所述转基因载体包含含有人基因组特异性同源臂的编辑基因组(条件1和条件2)或含有小鼠基因组特异性同源臂的编辑基因组(条件3和条件4)。图2A-图2C中所示的各种条件示于表3中。

总的来说，本实施例中呈现的数据指示与三重转染系统相比，双重载体转染系统的功效。具体而言，双重载体转染系统增加粗裂解物滴度和完整载体基因组的百分比。

实施例3：双重载体转染系统设计之间的比较

为了研究双重载体转染系统中载体元件的组织是否影响生产率，测试了两种双重载体转染系统设计。评价从基于每种设计的生产获得的载体基因组(VG)生产率和完整载体基因组的百分比。双重载体转染系统设计-1(“设计-1”)和设计-2(“设计-2”)的区别在于相对于载体基因组和辅助序列而言，Rep/Cap序列所在的载体不同。图3A-图3B提供了设计-1(图3A)和设计-2(图3B)的示意图。如图所示，设计-1包含含有Rep/Cap序列和转基因(“GOI”)的第一载体和含有辅助序列的第二载体(图3A)；并且设计-2包含含有转基因(“GOI”)的第一载体，和含有辅助序列和Rep/Cap序列的第二载体(图3B)。根据表4示出的那些设定转染条件。

表4：转染条件

如表4所示，设计-1包含第一V4载体和第二V3载体。设计-2包含第一V1载体和第二V7载体。评估从三重转染获得的VG生产率和完整载体基因组的百分比作为对照。各种载体中所含的元件示于表2中。在表4中，载体比率是基于质粒大小(即摩尔比)以在比较双重载体转染系统设计时考虑载体的不同大小。

图4A-图4C示出了由使用双重和三重转染系统的生产获得的VG生产率(图4A)、衣壳生产率(图4B)和完整载体基因组的百分比(图4C)。如图4A和图4C所示，发现使用设计-1的生产获得的VG生产率和完整载体基因组的百分比高于由三重转染系统获得的VG生产率和完整载体基因组的百分比。此外，如图4A和图4C所示，发现由使用设计-1的生产获得的VG生产率和计算的完整载体基因组的百分比高于由使用设计-2的生产获得的那些。基于这些结果，选择设计-1进行进一步研究。图4A-图4C中所示的各种条件示于表4中。

测试第三种双重载体转染系统设计(“设计-3”)。一起评价由基于三种设计中的每一种的生产获得的载体基因组(VG)生产率和完整载体基因组的百分比。如以上所讨论，设计-1包含含有Rep/Cap序列和转基因(“GOI”)的第一载体和含有辅助序列的第二载体(图3A)；设计-2包含含有转基因的第一载体(“GOP”)和含有辅助序列和Rep/Cap序列的第二载体(图3B)；并且设计3包含含有转基因(“GOI”)和辅助序列的第一载体，和含有Rep/Cap序列的第二载体(图3C)。根据表5示出的那些设定转染条件。

表5：转染条件

如表5所示，设计-1包含第一V20载体和第二V3载体。设计-2包含第一V19载体和第二V7载体。设计-3包含第一V21载体和第二V2载体。评估从三重转染获得的VG生产率和完整载体基因组的百分比作为对照。各种载体中所含的元件示于表2中。在表5中，载体比率是从1:1(1:1:1)摩尔比转换的质量比。

图5A-图5C示出了由使用双重和三重转染系统的生产获得的VG生产率(图5A)、衣壳生产率(图5B)和完整载体基因组的百分比(图5C)。如图5A和图5C所示，发现由使用设计-1的生产获得的VG生产率和完整载体基因组的百分比高于由三重转染系统获得的VG生产率和完整载体基因组的百分比。此外，如图5A和图5C所示，发现由使用设计-1的生产获得的VG生产率和计算的完整载体基因组的百分比高于由使用设计-2和设计-3的生产获得的那些。这些数据证明，与设计-2双重载体转染系统、设计-3双重载体转染系统和对照三重载体转染系统相比，使用设计-1双重载体转染系统产生增加的rAAV滴度。图5A-图5C中所示的各种条件示于表5中。

实施例4：双重和三重转染系统之间的比较

为了证实与实施例3中观察到的三重转染相比，设计-1的生产率增加，设定转染条件以研究增加的功效在更大规模(2L规模)是否维持，以及设计-1的增加的功效是否在具有不同转基因的rAAV基因组的包装并进入不同的衣壳中持续。根据表6示出的那些设定转染条件。在表6中，载体比率基于质量。

表6：转染条件

如表6所示，设定转染条件1、2、3、4、5和6以研究设计-1增加的功效是否在具有不同转基因的rAAV基因组的包装中持续。除了研究设计-1在具有不同转基因的rAAV基因组在包装中的功效外，条件6和条件7还评估功效是否在rAAV基因组包装到不同衣壳中持续。条件1-5各自利用AAVHSCS15衣壳，条件6利用AAVHSCS17衣壳，条件7利用AAV2衣壳。评估从三重转染获得的VG生产率和完整载体基因组的百分比作为对照。各种载体中所含的元件示于表2中。

在适当大小的转移组件中通过全部在环境温度下添加计算体积的载体、OptiPro培养基和聚乙烯亚胺(PEI)，制备每种转染条件的转染混合物。将转染混合物以1μg DNA/1E6个细胞的浓度添加到细胞中。将细胞孵育72小时，之后收获。

在收获时，裂解细胞，离心后收集粗裂解物样品以去除细胞碎片，用于随后的微滴数字PCR(ddPCR)和通过ELISA进行的衣壳分析。

图6A-图6C示出了由使用设计-1和对照三重转染系统的生产获得的VG生产率(图6A)、衣壳生产率(图6B)和完整载体基因组的百分比(图6C)。如图6A和图6C所示，发现在所有测试条件下，由使用设计-1的生产获得的VG生产率和完整载体基因组的百分比高于从三重转染系统获得的VG生产率和完整载体基因组的百分比。基于这些结果，在具有不同转基因的rAAV包装到不同衣壳中，观察到使用设计-1生产的功效相对于三重转染增加。发现双重载体转染系统的增加的生产率在五种不同的rAAV基因组中是一致的，其中两种包含编辑基因组(条件1和条件2)。这些数据证明使用设计-1双重载体转染系统相对于使用对照三重载体转染系统获得的增加的rAAV滴度在具有不同转基因的rAAV包装到不同衣壳中持续。图6A-图6C中所示的各种条件示于表6中。

图7A-图7C示出了由利用AAV2衣壳，使用设计-1和对照三重转染系统(条件7)的生产获得的VG生产率(图7A)、衣壳生产率(图7B)和完整载体基因组的百分比(图7C)。如图7A和图7C所示，发现由利用AAV2衣壳，使用设计-1的生产获得的VG生产率和完整载体基因组的百分比高于由三重转染系统获得的VG生产率和完整载体基因组的百分比。图7A-图7C中的数据由小规模生产研究生成。

在单独的实验中，发现设计-1也能够产生包含AAVHSC13衣壳的rAAV(参见美国专利第9,803,218号，其整体并入本文)。

这些数据表明设计-1双重质粒系统(相对于三重质粒系统对照)表现出的AAV生产的改进可能是普遍适用的。

实施例5：双重和三重转染系统之间的比较

与使用对照三重转染系统的生产相比，实施例3和实施例4展示出在从使用设计-1的生产获得的粗裂解物中测得增加的VG生产率和增加的完整载体基因组的百分比。

为了证实增加的VG生产率和增加的完整载体基因组的百分比在纯化后得以维持，将获自根据表7中列出的那些设定的转染的粗裂解物澄清，随后通过亲和色谱法和阴离子交换色谱法纯化。在表7中，除了以50L规模进行的条件3之外，条件1、2和4分别根据表6中的条件2、3和5(即，以2L规模)进行。单独纯化使用不同载体比率产生的裂解物。条件1-3各自利用AAVHSCS15衣壳，而条件4利用AAVHSCS17衣壳。从设计-1双重质粒系统获得的完整载体基因组表示为相对于从所示对照三重质粒系统获得的完整载体基因组的量的百分比增加(表7和图8)。在表7中，载体比率基于质量。各种载体中所含的元件示于表2中。

表7：转染条件

图8中描绘的数据基于分析超速离心沉降速度(AUC)分析，这是一种用于基于沉降系数对大分子进行定量的方法。AUC用于确定相对于相应的三重质粒系统对照，由每个设计-1双重质粒系统产生的完整载体基因组和缺少载体基因组的衣壳的百分比。在图8中，对于条件1和条件2，对从设计-1载体比率(即，表7所示的1:2、1:3和1:4比率)中的每一个比率获得的纯化载体进行AUC以确定完整载体基因组的数目，然后取平均值并呈现为相对于相应的三重质粒系统对照的百分比增加。如图8所示，对于测试的四种设计-1双重质粒系统中的每一种，获得完整载体基因组数目的增加(相对于从相应的三重质粒系统控制获得的完整载体基因组的数目)。这些数据表明设计-1双重质粒系统(相对于三重质粒系统对照)表现出的AAV生产的改进可能是普遍适用的并且可扩展的。

实施例6：双重转染系统中的衣壳背景表达

为了阐明设计-1优于其他双重质粒转染系统设计的原因，在设计-1中测定背景衣壳表达水平，并与设计-2中的背景衣壳表达水平进行比较。根据表8示出的那些设定转染条件。在表8中，载体比率基于质量。

表8：转染条件

如表8所示，对于每种相应的双重设计，设计-1和设计-2与仅含Rep/Cap的载体一起测试。相同量的含有Rep/Cap的载体单独使用(例如，条件2和条件4)或作为双重设计中的载体使用(例如，条件1和条件3)。

发现来自设计-2(仅载体V7转染；条件2)的背景衣壳生成水平与设计2的双重转染(载体V1和载体V7两者转染；条件1)生成的背景衣壳水平相同(图9)。如图9所示，来自设计-1的背景衣壳生成低于由设计-1的双重转染生成的背景衣壳水平的1％(比较条件4与条件3)。

实施例7：来自双重和三重转染系统的AAV的大规模生产和质量评估

为了研究设计-1的提高的生产率在更大规模的生产下是否维持，在50L生物反应器规模下重复表6中设计-1的载体比率为1:2的条件4。与摇瓶和2L生物反应器规模的趋势一致，来自50L生物反应器的结果证明，与从三重转染系统(“3TFX”，参见表6中三重转染对照的条件)获得的粗裂解物相比，从设计-1(“2TFX”)获得的粗裂解物中VG生产率几乎增加2倍，衣壳产量相当，并且计算的完整载体基因组加倍(图10A-图10C)。这些数据证明，与对照三重载体转染系统相比，使用设计-1双重载体转染系统获得的增加的rAAV滴度在更大规模的生产中得以维持。

使用各种分析方法表征从设计-1和三重转染系统获得的AAV载体的产物质量(图10D-图10J)。如图所示，纯度百分比(图10D)、聚集百分比(图10E)和残留宿主细胞蛋白水平(图10F；BLoQ意指低于定量限)无论转染方法如何均保持一致。与从三重转染系统获得的那些相比，在从设计-1获得的纯化AAV载体中包装的残留宿主细胞DNA(图10G)、Rep/Cap(图10H)、Ela(图10I)和辅助序列(图10J)的量中没有发现偏差。

实施例8：从双重和三重转染系统获得的AAV载体的生物活性

为了确保从设计1获得的AAV载体和从三重转染系统获得的AAV载体之间的产物可比性，纯化表6中对于设计1而言载体比率为1:4和相关三重转染对照的条件5获得的AAV载体，并且评估体内生物活性。rAAV基因组包含在侧翼是鼠特异性同源臂的肝特异性启动子控制下的表达苯丙氨酸羟化酶(PAH)的编辑基因组。将从设计-1和从三重转染系统获得的AAV载体注射到Pah^enu2小鼠中，该小鼠是展示经典苯丙酮尿症的几个特征的模型。评价两个剂量以及仅媒介物的对照组。每周采集血清样品并分析苯丙氨酸(Phe)水平。如图11A和图11B所示，在1E12个VG/kg(图11A)和1E14个VG/kg(图11B)的两个剂量下，从设计-1和从三重转染系统获得的AAV载体的生物活性(如通过给药后血清Phe水平的降低所指示的)，在六周期间内是没有区别的。此外，在六周时，肝脏中载体基因组和PAH mRNA表达的定量显示VG转导和转基因表达的剂量依赖性增加，但在每个剂量下设计-1和三重转染组之间没有显著差异(图11C和图11D)。在1E14个VG/kg剂量下完成对中靶整合的定量，并展示出从设计-1或三重转染系统产生的AAV载体的同等整合效率(图11E)。

实施例9：载体比率的优化

为了研究是否存在引起生产率提高的最佳载体比率，测试了各种设计-1载体比率。如实施例1针对小规模生产所述设定转染。

图12A-图12C示出了在测试指示的V3:V12载体比率的条件1下，以各种总转染DNA水平(x轴)生产获得的VG生产率(图12A)、衣壳生产率(图12B)和完整载体基因组的百分比(图12C)。V3和V12中所含的元件示于表2中。如图12A-图12C所示，在1:0.3至1:1的V3:V12载体比率下，每1E6个细胞使用0.6至1μg总转染DNA实现提高的VG和衣壳生产率。

图13A-图13C示出了在测试指示的V3:V8比率的条件2下，以各种总转染DNA水平(x轴)生产获得的VG生产率(图13A)、衣壳生产率(图13B)和完整载体基因组的百分比(图13C)。V3和V8中所含的元件示于表2中。如图13A-图13C所示，在1:0.6至1:1的V3:V8载体比率下，每1E6个细胞使用0.6至1μg总转染DNA实现提高的VG和衣壳生产率。这些数据证明，使用这些载体比率和总转染DNA水平实现增加的rAAV滴度。

实施例10：使用双重质粒转染评估多种衣壳血清型

为了研究设计-1的提高的生产率是否在其他AAV衣壳血清型中得以维持，利用AAV衣壳血清型AAV1、AAV2、AAV5、AAV6、AAV8、AAV9、AAVrh10和AAVrh74测试由设计-1或三重转染系统产生的AAV载体。如实施例1针对2L生物反应器生产所述设定转染。根据表9示出的那些设定转染条件。

表9：转染条件

图14A-图14C示出了在表9所示的条件下生产获得的VG生产率(图14A)、衣壳生产率(图14B)和完整载体基因组的百分比(图14C)。如图14A所示，相对于相应的三重转染系统对照，使用设计-1的生产获得的提高的VG生产率在所有测试的AAV衣壳血清型中得以维持。如图14B所示，相对于相应的三重转染系统对照，由使用设计-1的生产获得的衣壳生产率得以提高或维持。如图14C所示，相对于相应的三重转染系统对照，由使用设计-1的生产获得的完整载体基因组的百分比得以提高或维持。这些数据证明，与对照三重载体转染系统相比，使用设计-1双重载体转染系统获得的增加的rAAV滴度在不同AAV衣壳血清型中持续。

实施例11：双重质粒向2000L的可扩展性

实施例7显示，设计-1提高的生产率在50L生物反应器规模下得以维持。来自50L生物反应器的结果证明，与从三重转染系统对照获得的粗裂解物相比，从设计-1获得的粗裂解物中VG生产率几乎增加2倍。

为了研究设计-1提高的VG生产率是否是可扩展的，将50L生物反应器规模的生产率与2000L生物反应器规模的生产率进行比较。如实施例1针对2L生物反应器生产所述设定转染，除了将细胞接种到50L和2000L生物反应器中以外。以3.6E6至5E6个细胞/mL的密度转染细胞。根据表10示出的那些设定50L生物反应器和2000L生物反应器的转染条件。

表10：转染条件

图15显示50L和2000L生物反应器规模实现同等的VG生产率。这些数据证明了设计-1双重质粒转染系统的可扩展性。

本发明的另外的实施方案在以下条款中阐述：

1.一种第一核酸载体，其包含：编码AAVRep蛋白的第一核苷酸序列；包含含有转基因的重组AAV(rAAV)基因组的第二核苷酸序列；和编码AAV衣壳蛋白的第三核苷酸序列，其中所述核酸载体不包含辅助病毒基因。

2.如条款1所述的核酸载体，其从5'至3'包含：编码AAV Rep蛋白的所述第一核苷酸序列；包含含有转基因的重组AAV(rAAV)基因组的所述第二核苷酸序列；和编码AAV衣壳蛋白的所述第三核苷酸序列，其中所述核酸载体不包含辅助病毒基因。

3.如条款1所述的核酸载体，其从5'至3'包含：编码AAV Rep蛋白的所述第一核苷酸序列；包含含有转基因的重组AAV(rAAV)基因组的所述第二核苷酸序列；以及编码AAV衣壳蛋白的所述第三核苷酸序列。

4.如条款1-3中任一项所述的核酸载体，其中所述核酸载体是DNA质粒或DNA最小载体。

5.一种重组AAV(rAAV)包装系统，其包含：(i)第一核酸载体，其包含：编码AAV Rep蛋白的第一核苷酸序列；包含含有转基因的重组AAV(rAAV)基因组的第二核苷酸序列；和编码AAV衣壳蛋白的第三核苷酸序列，和(ii)第二核酸载体，其包含辅助病毒基因。

6.如条款5所述的包装系统，其中所述第一核酸载体从5'至3'包含：编码AAV Rep蛋白的第一核苷酸序列；包含含有转基因的重组AAV(rAAV)基因组的所述第二核苷酸序列；以及编码AAV衣壳蛋白的所述第三核苷酸序列。

7.如条款5或条款6所述的包装系统，其中所述第一核酸载体是DNA质粒或DNA最小载体。

8.如条款5-7中任一项所述的包装系统，其中所述第二核酸载体是DNA质粒或DNA最小载体。

9.如条款1-8中任一项所述的核酸载体或包装系统，其中所述转基因编码多肽。

10.如条款1-8中任一项所述的核酸载体或包装系统，其中所述转基因编码miRNA、shRNA、siRNA、反义RNA、gRNA、antagomir、miRNA海绵、RNA适体核酶、RNA适体、lncRNA、核酶或mRNA。

11.如条款1-8中任一项所述的核酸载体或包装系统，其中所述转基因编码选自苯丙氨酸羟化酶(PAH)、葡萄糖-6-磷酸酶(G6Pase)、艾杜糖醛酸-2-硫酸酯酶(I2S)、芳基硫酸酯酶A(ARSA)和共济蛋白(FXN)的蛋白质。

12.如任一前述条款所述的核酸载体或包装系统，其中所述rAAV基因组还包含与所述转基因可操作地连接的转录调控元件。

13.如条款12所述的核酸载体或包装系统，其中所述转录调控元件包含启动子元件和/或内含子元件。

14.如任一前述条款所述的核酸载体或包装系统，其中所述rAAV基因组还包含多聚腺苷酸化序列。

15.如条款14所述的核酸载体或包装系统，其中所述多聚腺苷酸化序列在所述转基因的3'。

16.如任一前述条款所述的核酸载体或包装系统，其中所述rAAV基因组包含与SEQID NO:71、85、86、87或88所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。

17.如任一前述条款所述的核酸载体或包装系统，其中所述rAAV基因组还包含在所述转基因的5’的5’反向末端重复(5’ITR)核苷酸序列和在所述转基因的3’的3'反向末端重复(3’ITR)核苷酸序列。

18.如条款17所述的核酸载体或包装系统，其中所述5’ITR核苷酸序列与SEQ IDNO:39、41或42中所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性，和/或所述3’ITR核苷酸序列与SEQ ID NO:40、43或44中所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性。

19.如任一前述条款所述的核酸载体或包装系统，其中所述rAAV基因组包含与SEQID NO:75、78、80、82或84所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。

20.如任一前述条款所述的核酸载体或包装系统，其中所述AAV Rep蛋白是野生型Rep蛋白或其变体。

21.如任一前述条款所述的核酸载体或包装系统，其中所述AAV Rep蛋白是AAV2Rep蛋白或其变体

22.如任一前述条款所述的核酸载体或包装系统，其中所述第一核苷酸序列还包含与所述AAV Rep蛋白编码序列可操作地连接的转录调控元件。

23.如条款22所述的核酸载体或包装系统，其中所述转录调控元件包含选自组成型启动子、诱导型启动子或天然启动子的启动子。

24.如条款23所述的核酸载体或包装系统，其中所述启动子选自P5启动子、P19启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。

25.如任一前述条款所述的核酸载体或包装系统，其中所述AAV衣壳蛋白选自AAV1、AAV2、AAV3、AAV4、AAVS、AAV6、AAV7、AAV8、AAV9、AAVrhl0、AAVRh32.33、AAVrh74、AAV-DJ、AAV-LK03、NP59、VOY101、VOY201、VOY701、VOY801、VOY1101、AAVPHP.N、AAVPHP.A、AAVPHP.B、PHP.B2、PHP.B3、G2A3、G2B4、G2B5和PHP.S。

26.如任一前述条款所述的核酸载体或包装系统，其中所述AAV衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少85％同一性的氨基酸序列。

27.如条款26所述的核酸载体或包装系统，其中：衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C；衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H；衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q；衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A；衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N；衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S；衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I；衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y；衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M；衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K；衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C；或者，衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。

28.如条款27所述的核酸载体或包装系统，其中：(a)衣壳蛋白中对应于SEQ IDNO:16的氨基酸626的氨基酸是G，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G；(b)衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H，衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N，衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M；(c)衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R；(d)衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R；或(e)衣壳蛋白中对应于SEQID NO:16的氨基酸501的氨基酸是I，衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C。

29.如条款27所述的核酸载体或包装系统，其中所述AAV衣壳蛋白包含SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列。

30.如任一前述条款所述的核酸载体或包装系统，其中所述AAV衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少85％同一性的氨基酸序列。

31.如条款30所述的核酸载体或包装系统，其中：衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸160的氨基酸是D；衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C；衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H；衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q；衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A；衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N；衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S；衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I；衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y；衣壳蛋白中对应于SEQ IDNO:16的氨基酸681的氨基酸是M；衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K；衣壳蛋白中对应于SEQ IDNO:16的氨基酸706的氨基酸是C；或者，衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。

32.如条款31所述的核酸载体或包装系统，其中：(a)衣壳蛋白中对应于SEQ IDNO:16的氨基酸626的氨基酸是G，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G；(b)衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H，衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N，衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M；(c)衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R；(d)衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R；或(e)衣壳蛋白中对应于SEQID NO:16的氨基酸501的氨基酸是I，衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C。

33.如条款31所述的核酸载体或包装系统，其中所述AAV衣壳蛋白包含SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列。

34.如任一前述条款所述的核酸载体或包装系统，其中所述AAV衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少85％同一性的氨基酸序列。

35.如条款34所述的核酸载体或包装系统，其中：衣壳蛋白中对应于SEQ ID NO:16的氨基酸2的氨基酸是T；衣壳蛋白中对应于SEQ ID NO:16的氨基酸65的氨基酸是I；衣壳蛋白中对应于SEQ ID NO:16的氨基酸68的氨基酸是V；衣壳蛋白中对应于SEQ ID NO:16的氨基酸77的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸119的氨基酸是L；衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸160的氨基酸是D；衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C；衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H；衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q；衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A；衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N；衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S；衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I；衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y；衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M；衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R；衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K；衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C；或者，衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。

36.如条款35所述的核酸载体或包装系统，其中：(a)衣壳蛋白中对应于SEQ IDNO:16的氨基酸2的氨基酸是T，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q；(b)衣壳蛋白中对应于SEQ ID NO:16的氨基酸65的氨基酸是I，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是Y；(c)衣壳蛋白中对应于SEQ ID NO:16的氨基酸77的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K；(d)衣壳蛋白中对应于SEQ ID NO:16的氨基酸119的氨基酸是L，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S；(e)衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G；(f)衣壳蛋白中对应于SEQID NO:16的氨基酸296的氨基酸是H，衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N，衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M；(g)衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R；(h)衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A，并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R；或(i)衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I，衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R，并且衣壳蛋白中对应于SEQID NO:16的氨基酸706的氨基酸是C。

37.如条款35所述的核酸载体或包装系统，其中所述AAV衣壳蛋白包含SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列。

38.如任一前述条款所述的核酸载体或包装系统，其中所述第三核苷酸序列还包含与所述AAV衣壳蛋白编码序列可操作地连接的转录调控元件。

39.如条款38所述的核酸载体或包装系统，其中所述转录调控元件包含选自组成型启动子、诱导型启动子或天然启动子的启动子。

40.如条款39所述的核酸载体或包装系统，其中所述启动子选自P40启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。

41.如任一前述条款所述的核酸载体或包装系统，其中所述第一核酸载体包含与SEQ ID NO:73或77所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。

42.如任一前述条款所述的核酸载体或包装系统，其中所述第二核苷酸序列包含与SEQ ID NO:71、75、78、80、82、84、85、86、87或88所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。

43.如任一前述条款所述的核酸载体或包装系统，其中：所述第一核苷酸序列包含与SEQ ID NO:50、51、52、53、54、55、56、57、58或59所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列；所述第二核苷酸序列包含与SEQ ID NO:71、75、78、80、82、84、85、86、87或88所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的序列；并且所述第三核苷酸序列编码与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736、138736和/或1-736的氨基酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的氨基酸序列。

44.如条款43所述的核酸载体或包装系统，其中所述第一核酸载体从5'至3'包含：第一核苷酸序列；第二核苷酸序列；和第三核苷酸序列。

45.如条款5-44中任一项所述的包装系统，其中所述辅助病毒基因源自选自腺病毒、疱疹病毒、痘病毒、巨细胞病毒和杆状病毒的辅助病毒。

46.如条款5-45中任一项所述的包装系统，其中所述辅助病毒基因是源自选自E1、E2、E4和VA的腺病毒的RNA基因。

47.如条款5-46中任一项所述的包装系统，其中所述第二核酸载体还包含与所述辅助病毒基因可操作地连接的转录调控元件。

48.如条款47所述的包装系统，其中所述转录调控元件包含选自组成型启动子、诱导型启动子或天然启动子的启动子。

49.如条款48所述的包装系统，其中所述启动子选自RSV LTR启动子、CMV立即早期启动子、SV40启动子、二氢叶酸还原酶启动子、细胞质β-肌动蛋白启动子、磷酸甘油酸激酶(PGK)启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。

50.如条款5-49中任一项所述的包装系统，其中所述第二核酸载体包含与SEQ IDNO:60、61或62所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。

51.如条款5-50中任一项所述的包装系统，其中所述第二核酸载体包含与SEQ IDNO:63所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。

52.如条款5-45中任一项所述的包装系统，其中所述辅助病毒基因是源自选自UL5/8/52、ICP0、ICP4、ICP22和UL30/UL42的疱疹病毒的基因。

53.如条款52所述的包装系统，其中所述第二核酸载体还包含与所述辅助病毒基因可操作地连接的转录调控元件。

54.如条款53所述的包装系统，其中所述转录调控元件包含选自组成型启动子、诱导型启动子或天然启动子的启动子。

55.如条款54所述的包装系统，其中所述启动子选自RSV LTR启动子、CMV立即早期启动子、SV40启动子、二氢叶酸还原酶启动子、细胞质β-肌动蛋白启动子、磷酸甘油酸激酶(PGK)启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。

56.一种宿主细胞，其包含如条款1-4或9-44中任一项所述的核酸载体，或如条款5-55中任一项所述的包装系统。

57.如条款56所述的宿主细胞，其中所述宿主细胞是哺乳动物细胞。

58.如条款57所述的宿主细胞，其中所述哺乳动物细胞选自COS细胞、CHO细胞、BHK细胞、MDCK细胞、HEK293细胞、HEK293T细胞、HEK293F细胞、NS0细胞、PER.C6细胞、VERO细胞、CRL7O3O细胞、HsS78Bst细胞、HeLa细胞、NIH 3T3细胞、HepG2细胞、SP210细胞、R1.1细胞、B-W细胞、L-M细胞、BSC1细胞、BSC40细胞、YB/20细胞和BMT10细胞。

59.如条款57或58所述的宿主细胞，其中所述哺乳动物细胞是HEK293细胞。

60.一种rAAV的重组制备方法，所述方法包括在产生所述rAAV的条件下将条款5-55中任一项所述的包装系统引入哺乳动物细胞中。

61.如条款60所述的方法，其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率选自1:0.2、1:0.4、1:0.6、1:0.8、1:1、1:2、1:3或1:4。

62.如条款60或61所述的方法，其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率为1:2。

63.如条款60或61所述的方法，其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率为1:0.2至1:1。

64.如条款63所述的方法，其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率为1:0.6。

65.如条款63所述的方法，其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率为1:0.8。

66.如条款63所述的方法，其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率为1:1。

67.如条款60-66中任一项所述的方法，其中所述方法包括引入所述包装系统的0.1至4μg DNA/1E6个细胞。

68.如条款60-67中任一项所述的方法，其中所述方法包括引入所述包装系统的0.5至1μg DNA/1E6个细胞。

69.如条款60-68中任一项所述的方法，其中所述方法包括引入所述包装系统的0.6、0.7、0.8、0.9或1μg DNA/1E6个细胞。

70.如条款60-68中任一项所述的方法，其中所述方法包括引入所述包装系统的0.75μg DNA/1E6个细胞。

71.如条款60-70中任一项所述的方法，其中所述方法与包括使用以下哺乳动物细胞产生rAAV的方法相比导致增加的rAAV滴度，所述哺乳动物细胞包含：(i)包含编码AAVRep蛋白和AAV衣壳蛋白的核苷酸序列的第一载体；(ii)包含所述rAAV基因组的第二载体；以及(iii)包含所述一种或多种辅助病毒基因的第三载体。

72.如条款60-70中任一项所述的方法，其中所述方法与包括使用以下哺乳动物细胞产生rAAV的方法相比导致增加的完整载体基因组的百分比，所述哺乳动物细胞包含：(i)包含编码AAV Rep蛋白和AAV衣壳蛋白的核苷酸序列的第一载体；(ii)包含所述rAAV基因组的第二载体；以及(iii)包含所述一种或多种辅助病毒基因的第三载体。

73.如条款60-72中任一项所述的方法，其中所述哺乳动物细胞选自COS细胞、CHO细胞、BHK细胞、MDCK细胞、HEK293细胞、HEK293T细胞、HEK293F细胞、NS0细胞、PER.C6细胞、VERO细胞、CRL7O3O细胞、HsS78Bst细胞、HeLa细胞、NIH 3T3细胞、HepG2细胞、SP210细胞、R1.1细胞、B-W细胞、L-M细胞、BSC1细胞、BSC40细胞、YB/20细胞和BMT10细胞。

74.如条款60-73中任一项所述的方法，其中所述哺乳动物细胞为HEK293细胞。

75.如条款60-74中任一项所述的方法，其中所述哺乳动物细胞在细胞培养物中孵育。

76.一种如条款56-59中任一项所定义的宿主细胞的群体，其中所述宿主细胞在细胞培养物中提供。

77.如条款75所述的方法或如条款76所述的宿主细胞的群体，其中所述细胞培养物的体积为至少2升、至少50升或至少2000升。

***

本发明在范围上不限于本文所述的具体实施方案。实际上，除了本文中所描述的那些内容之外，本领域的技术人员根据前述说明和附图将显而易知本发明的各种修改。此类修改旨在落入所附权利要求书的范围内。

本文引用的所有参考文献(例如，出版物或专利或专利申请)通过引用整体并入本文并且用于所有目的，其程度如同具体和单独指示每个单独的参考文献(例如，出版物或专利或专利申请)通过引用整体并入用于所有目的。其他实施方案在以下权利要求内。

序列表

<110> 牛津生物医学解决方案有限公司(OXFORD BIOMEDICA SOLUTIONS LLC)

同源药物公司(HOMOLOGY MEDICINES, INC.)

<120> 腺相关病毒包装系统

<130> G211157PM

<160> 106

<170> PatentIn version 3.5

<210> 1

<211> 736

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 腺相关病毒9

<400> 1

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 2

<211> 736

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> AAV分离物

<400> 2

Met Thr Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Gln Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 3

<211> 736

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> AAV分离物

<400> 3

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Gly Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Gly Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 4

<211> 736

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> AAV分离物

<400> 4

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Ile Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Tyr Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 5

<211> 736

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> AAV分离物

<400> 5

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Asp

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 6

<211> 736

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> AAV分离物

<400> 6

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Leu Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Ser Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 7

<211> 736

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> AAV分离物

<400> 7

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Arg Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 8

<211> 736

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> AAV分离物

<400> 8

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Val Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 9

<211> 736

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> AAV分离物

<400> 9

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Arg Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 10

<211> 736

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> AAV分离物

<400> 10

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Cys Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 11

<211> 736

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> AAV分离物

<400> 11

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Arg Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Lys Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 12

<211> 736

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> AAV分离物

<400> 12

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro His Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Asn

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Met Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 13

<211> 736

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> AAV分离物

<400> 13

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 14

<211> 0

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> AAV分离物

<400> 14

000

<210> 15

<211> 736

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> AAV分离物

<400> 15

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Arg Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 16

<211> 736

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> AAV分离物

<400> 16

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Ala Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 17

<211> 736

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> AAV分离物

<400> 17

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Ile Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Cys Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 18

<211> 365

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 18

ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 60

gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 120

tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 180

aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 240

caagtccgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 300

acatgacctt acgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 360

ccatg 365

<210> 19

<211> 380

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 19

ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60

catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120

acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180

ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240

aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300

ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360

tagtcatcgc tattaccatg 380

<210> 20

<211> 479

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 20

tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60

ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120

ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180

cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240

ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg agtcgctgcg cgctgccttc 300

gccccgtgcc ccgctccgcc gccgcctcgc gccgcccgcc ccggctctga ctgaccgcgt 360

tactcccaca ggtgagcggg cgggacggcc cttctcctcc gggctgtaat tagcgcttgg 420

tttaatgacg gcttgtttct tttctgtggc tgcgtgaaag ccttgagggg ctccgggag 479

<210> 21

<211> 1246

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 21

tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60

ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120

ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180

cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240

ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg agtcgctgcg cgctgccttc 300

gccccgtgcc ccgctccgcc gccgcctcgc gccgcccgcc ccggctctga ctgaccgcgt 360

tactcccaca ggtgagcggg cgggacggcc cttctcctcc gggctgtaat tagcgcttgg 420

tttaatgacg gcttgtttct tttctgtggc tgcgtgaaag ccttgagggg ctccgggagg 480

gccctttgtg cggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg 540

ccgcgtgcgg ctccgcgctg cccggcggct gtgagcgctg cgggcgcggc gcggggcttt 600

gtgcgctccg cagtgtgcgc gaggggagcg cggccggggg cggtgccccg cggtgcgggg 660

ggggctgcga ggggaacaaa ggctgcgtgc ggggtgtgtg cgtggggggg tgagcagggg 720

gtgtgggcgc gtcggtcggg ctgcaacccc ccctgcaccc ccctccccga gttgctgagc 780

acggcccggc ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc gccgtgccgg 840

gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccggggagg 900

gctcggggga ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc 960

gcagccattg ccttttatgg taatcgtgcg agagggcgca gggacttcct ttgtcccaaa 1020

tctgtgcgga gccgaaatct gggaggcgcc gccgcacccc ctctagcggg cgcggggcga 1080

agcggtgcgg cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc 1140

gccgtcccct tctccctctc cagcctcggg gctgtccgcg gggggacggc tgccttcggg 1200

ggggacgggg cagggcgggg ttcggcttct ggcgtgtgac cggcgg 1246

<210> 22

<211> 953

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 22

aattcggtac cctagttatt aatagtaatc aattacgggg tcattagttc atagcccata 60

tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga 120

cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt 180

ccattgacgt caatgggtgg actatttacg gtaaactgcc cacttggcag tacatcaagt 240

gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca 300

ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt 360

catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc 420

cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg 480

ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg 540

ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt 600

tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt 660

cgctgcgacg ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc 720

ggctctgact gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg 780

gctgtaatta gcgcttggtt taatgacggc ttgtttcttt tctgtggctg cgtgaaagcc 840

ttgaggggct ccgggagcta gagcctctgc taaccatgtt catgccttct tctttttcct 900

acagctcctg ggcaacgtgc tggttattgt gctgtctcat cattttggca aag 953

<210> 23

<211> 1168

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 23

cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60

tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120

aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180

gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240

gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300

gaattacttc cacctggctc cagtacgtga ttcttgatcc cgagctggag ccaggggcgg 360

gccttgcgct ttaggagccc cttcgcctcg tgcttgagtt gaggcctggc ctgggcgctg 420

gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt ctcgctgctt tcgataagtc 480

tctagccatt taaaattttt gatgacctgc tgcgacgctt tttttctggc aagatagtct 540

tgtaaatgcg ggccaggatc tgcacactgg tatttcggtt tttggggccg cgggcggcga 600

cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg ggcctgcgag cgcggccacc 660

gagaatcgga cgggggtagt ctcaagctgg ccggcctgct ctggtgcctg gcctcgcgcc 720

gccgtgtatc gccccgccct gggcggcaag gctggcccgg tcggcaccag ttgcgtgagc 780

ggaaagatgg ccgcttcccg gccctgctcc agggggctca aaatggagga cgcggcgctc 840

gggagagcgg gcgggtgagt cacccacaca aaggaaaggg gcctttccgt cctcagccgt 900

cgcttcatgt gactccacgg agtaccgggc gccgtccagg cacctcgatt agttctggag 960

cttttggagt acgtcgtctt taggttgggg ggaggggttt tatgcgatgg agtttcccca 1020

cactgagtgg gtggagactg aagttaggcc agcttggcac ttgatgtaat tctccttgga 1080

atttgccctt tttgagtttg gatcttggtt cattctcaag cctcagacag tggttcaaag 1140

tttttttctt ccatttcagg tgtcgtga 1168

<210> 24

<211> 92

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 24

aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 60

cacctgcctg aaatcacttt ttttcaggtt gg 92

<210> 25

<211> 79

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 25

aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 60

cacctgcctg aaatcactt 79

<210> 26

<211> 95

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 26

cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 60

ttattgtgct gtctcatcat tttggcaaag aattc 95

<210> 27

<211> 90

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 27

cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 60

ttattgtgct gtctcatcat tttggcaaag 90

<210> 28

<211> 918

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 28

ggcatcctaa aaaatattca gtggaaacgt aaaaacatta aagactgatt aaacatcgca 60

gcatgacaca gatttagcaa ctgagcataa ataatttgac tcggatactg ctccaaaatc 120

cgaagaggac caatttcttc caggaggaca actacctcgt cctctgcaga cccctctcct 180

cggcagctga aggagtgtgg ccaatctgcc tccacctccc cgcggacccc ctactctcag 240

gacctcctgc agcaccccaa actggaagtg gccgctgcag acccaaggac gaggggcacg 300

cgggagccgg cagccctagt ggagcggttg gagatgttga ggtgggaggg tcacccaggt 360

ggggtgaggc tggggtaggt agcggagtga acggcttccg aagctctggg ccgcccccag 420

gttggactaa gcaggcgctc tgtcttcgcc cccgcccagg gtgggcgtct cctgaggact 480

ccccgccaca cctgacccga gaccgcgcgc ccagcctaga acgcttcccc gacccagcgt 540

agggccgccg cgactggcgg gcgagggtcg gcgggaggcc tggcgaaccc gggggcggga 600

ccaggcgggc aaggcccggc tgccgcagcg ccgctctgcg cgaggcggct ccgccgcggc 660

ggagggatac ggcgcaccat atatatatcg cggggcgcag actcgcgctc cggcagtggt 720

gctgggagtg tcgtggacgc cgtgccgtta ctcgtagtca ggcggcggcg caggcggcgg 780

cggcggcata gcgcacagcg cgccttagca gcagcagcag cagcagcggc atcggaggta 840

cccccgccgt cgcagccccc gcgctggtgc agccaccctc gctccctctg ctcttcctcc 900

cttcgctcgc accaagag 918

<210> 29

<211> 192

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 29

ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60

tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120

cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180

agtgtgagag gg 192

<210> 30

<211> 205

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 30

aatgactcct ttcggtaagt gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc 60

agcgtaggcg ggcgactcag atcccagcca gtggacttag cccctgtttg ctcctccgat 120

aactggggtg accttggtta atattcacca gcagcctccc ccgttgcccc tctggatcca 180

ctgcttaaat acggacgagg acagg 205

<210> 31

<211> 913

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 31

tagggaggtc ctgcacagaa ggggaggagg gggcagcagc tgtctgacca ctgttggtct 60

tgcaacttgt gtccccaggt taatttttaa aaagcagtca aaagtccaag tggcccttgg 120

cagcatttac tctctctgtt tgctctggtt aataatctca ggagcacaaa cattcctgga 180

ggcaggagaa gaaatcaaca tcctggactt atcctctggg cctctcccca cccccaggat 240

tgtaactgaa atgcttcact ggtgctcctt ttgttttaag gcattggatc ttcatagcta 300

ctgatcgtgc ccaagcacac agtatctgca gcaaccactt aggcctccag gaatgtggtg 360

accattgacc ctaattcatt ccccttcatg gatcctatgt aaccatcctc caaaaagagc 420

tttcgcaaac tcaaataaac acaggaaagg aagaccttct tatctttgag agtatatgtt 480

tagccctata gctctaaccc actctgatct cccagggcgg cagtaagtct tcagcatcag 540

gcattttggg gtgactcagt aaatggtaga tcttgctacc agtggaacag ccactaagga 600

ttctgcagtg agagcagagg gccagctaag tggtactctc ccagagactg tctgactcac 660

gccaccccct ccaccttgga cacaggacgc tgtggtttct gagccaggta caatgactcc 720

tttcggtaag tgcagtggaa gctgtacact gcccaggcaa agcgtccggg cagcgtaggc 780

gggcgactca gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt 840

gaccttggtt aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa 900

tacggacgag gac 913

<210> 32

<211> 423

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 32

gctctaaccc actctgatct cccagggcgg cagtaagtct tcagcatcag gcattttggg 60

gtgactcagt aaatggtaga tcttgctacc agtggaacag ccactaagga ttctgcagtg 120

agagcagagg gccagctaag tggtactctc ccagagactg tctgactcac gccaccccct 180

ccaccttgga cacaggacgc tgtggtttct gagccaggta caatgactcc tttcggtaag 240

tgcagtggaa gctgtacact gcccaggcaa agcgtccggg cagcgtaggc gggcgactca 300

gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt gaccttggtt 360

aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa tacggacgag 420

gac 423

<210> 33

<211> 592

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 33

gtaaatttta tggaatgtga atcataattc aatttttcaa catgcgttag gagggacatt 60

tcaaactctt ttttacccta gactttccta ccatcaccca gagtatccag ccaggagggg 120

aggggctaga gacaccagaa gtttagcagg gaggagggcg tagggattcg gggaatgaag 180

ggatgggatt cagactaggg ccaggaccca gggatggaga gaaagagatg agagtggttt 240

gggggcttgg tgacttagag aacagagctg caggctcaga ggcacacagg agtttctggg 300

ctcaccctgc ccccttccaa cccctcagtt cccatcctcc agcagctgtt tgtgtgctgc 360

ctctgaagtc cacactgaac aaacttcagc ctactcatgt ccctaaaatg ggcaaacatt 420

gcaagcagca aacagcaaac acacagccct ccctgcctgc tgaccttgga gctggggcag 480

aggtcagaga cctctctggg cccatgccac ctccaacatc cactcgaccc cttggaattt 540

cggtggagag gagcagaggt tgtcctggcg tggtttaggt agtgtgagag gg 592

<210> 34

<211> 72

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 34

gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60

ggctaagtcc ac 72

<210> 35

<211> 170

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 35

cgatgctcta atctctctag acaaggttca tatttgtatg ggttacttat tctctctttg 60

ttgactaagt caataatcag aatcagcagg tttgcagtca gattggcagg gataagcagc 120

ctagctcagg agaagtgagt ataaaagccc caggctggga gcagccatca 170

<210> 36

<211> 1873

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 36

gatcttcaat attggccatt agccatatta ttcattggtt atatagcata aatcaatatt 60

ggctattggc cattgcatac gttgtatcta tatcataata tgtacattta tattggctca 120

tgtccaatat gaccgccatg ttggcattga ttattgacta gttattaata gtaatcaatt 180

acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 240

ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 300

cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 360

actgcccact tggcagtaca tcaagtgtat catatgccaa gtccgccccc tattgacgtc 420

aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttacg ggactttcct 480

acttggcagt acatctacgt attagtcatc gctattacca tggtcgaggt gagccccacg 540

ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt 600

ttttaattat tttgtgcagc gatgggggcg gggggggggg gggggcgcgc gccaggcggg 660

gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 720

agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 780

aagcgaagcg cgcggcgggc gggagtcgct gcgacgctgc cttcgccccg tgccccgctc 840

cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 900

cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 960

ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg 1020

ggagcggctc ggggggtgcg tgcgtgtgtg tgtgcgtggg gagcgccgcg tgcggcccgc 1080

gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt 1140

gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa 1200

caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcggcggt 1260

cgggctgtaa cccccccctg cacccccctc cccgagttgc tgagcacggc ccggcttcgg 1320

gtgcggggct ccgtacgggg cgtggcgcgg ggctcgccgt gccgggcggg gggtggcggc 1380

aggtgggggt gccgggcggg gcggggccgc ctcgggccgg ggagggctcg ggggaggggc 1440

gcggcggccc ccggagcgcc ggcggctgtc gaggcgcggc gagccgcagc cattgccttt 1500

tatggtaatc gtgcgagagg gcgcagggac ttcctttgtc ccaaatctgt gcggagccga 1560

aatctgggag gcgccgccgc accccctcta gcgggcgcgg ggcgaagcgg tgcggcgccg 1620

gcaggaagga aatgggcggg gagggccttc gtgcgtcgcc gcgccgccgt ccccttctcc 1680

ctctccagcc tcggggctgt ccgcgggggg acggctgcct tcggggggga cggggcaggg 1740

cggggttcgg cttctggcgt gtgaccggcg gctctagagc ctctgctaac catgttcatg 1800

ccttcttctt tttcctacag ctcctgggca acgtgctggt tattgtgctg tctcatcatt 1860

ttggcaaaga att 1873

<210> 37

<211> 1061

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 37

tagggaggtc ctgcacgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 60

cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 120

tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 180

agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 240

gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 300

agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc 360

ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat 420

gggggcgggg gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc 480

ggggcgaggc ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct 540

tttatggcga ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg gcgggcggga 600

gtcgctgcgc gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc 660

cggctctgac tgaccgcgtt actaaaacag gtaagtccgg cctccgcgcc gggttttggc 720

gcctcccgcg ggcgcccccc tcctcacggc gagcgctgcc acgtcagacg aagggcgcag 780

cgagcgtcct gatccttccg cccggacgct caggacagcg gcccgctgct cataagactc 840

ggccttagaa ccccagtatc agcagaagga cattttagga cgggacttgg gtgactctag 900

ggcactggtt ttctttccag agagcggaac aggcgaggaa aagtagtccc ttctcggcga 960

ttctgcggag ggatctccgt ggggcggtga acgccgatga tgcctctact aaccatgttc 1020

atgttttctt tttttttcta caggtcctgg gtgacgaaca g 1061

<210> 38

<211> 398

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 38

ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60

tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120

cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180

agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240

aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300

ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360

ccctctggat ccactgctta aatacggacg aggacagg 398

<210> 39

<211> 145

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 39

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcct 145

<210> 40

<211> 145

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 40

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60

ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120

gagcgcgcag agagggagtg gccaa 145

<210> 41

<211> 106

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 41

ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgg 106

<210> 42

<211> 167

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 42

ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60

agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120

cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgta 167

<210> 43

<211> 167

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 43

tacaaaacct ccttgcttga gagtgtggca ctctcccccc tgtcgcgttc gctcgctcgc 60

tggctcgttt gggggggtgg cagctcaaag agctgccaga cgacggccct ctggccgtcg 120

cccccccaaa cgagccagcg agcgagcgaa cgcgacaggg gggagag 167

<210> 44

<211> 143

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 44

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60

ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120

gagcgcgcag agagggagtg gcc 143

<210> 45

<211> 46

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 45

ggaggggtgg agtcgtgacg tgaattacgt catagggtta gggagg 46

<210> 46

<211> 37

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 46

gtagataagt agcatggcgg gttaatcatt aactaca 37

<210> 47

<211> 96

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 47

tcctgtatta gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtcacgct 60

gggtatttaa gcccgagtga gcacgcaggg tctcca 96

<210> 48

<211> 135

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 48

gtcacaaaga ccagaaatgg cgccggaggc gggaacaagg tggtggatga gtgctacatc 60

cccaattact tgctccccaa aacccagcct gagctccagt gggcgtggac taatatggaa 120

cagtatttaa gcgcc 135

<210> 49

<211> 154

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 49

ggtcaccaag caggaagtca aagacttttt ccggtgggca aaggatcacg tggttgaggt 60

ggagcatgaa ttctacgtca aaaagggtgg agccaagaaa agacccgccc ccagtgacgc 120

agatataagt gagcccaaac gggtgcgcga gtca 154

<210> 50

<211> 1866

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 50

atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60

ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120

tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180

cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240

caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300

aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360

taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420

gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480

acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540

aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600

gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660

tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720

cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780

tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840

cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900

attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960

acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020

accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080

aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140

aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200

gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260

aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320

ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380

gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440

gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500

gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560

gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620

aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680

ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740

tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800

ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860

caataa 1866

<210> 51

<211> 1995

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 51

tcctgtatta gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtcacgct 60

gggtatttaa gcccgagtga gcacgcaggg tctccatttt gaagcgggag gtttgaacgc 120

gcagccgcca tgccggggtt ttacgagatt gtgattaagg tccccagcga ccttgacgag 180

catctgcccg gcatttctga cagctttgtg aactgggtgg ccgagaagga atgggagttg 240

ccgccagatt ctgacatgga tctgaatctg attgagcagg cacccctgac cgtggccgag 300

aagctgcagc gcgactttct gacggaatgg cgccgtgtga gtaaggcccc ggaggccctt 360

ttctttgtgc aatttgagaa gggagagagc tacttccaca tgcacgtgct cgtggaaacc 420

accggggtga aatccatggt tttgggacgt ttcctgagtc agattcgcga aaaactgatt 480

cagagaattt accgcgggat cgagccgact ttgccaaact ggttcgcggt cacaaagacc 540

agaaatggcg ccggaggcgg gaacaaggtg gtggatgagt gctacatccc caattacttg 600

ctccccaaaa cccagcctga gctccagtgg gcgtggacta atatggaaca gtatttaagc 660

gcctgtttga atctcacgga gcgtaaacgg ttggtggcgc agcatctgac gcacgtgtcg 720

cagacgcagg agcagaacaa agagaatcag aatcccaatt ctgatgcgcc ggtgatcaga 780

tcaaaaactt cagccaggta catggagctg gtcgggtggc tcgtggacaa ggggattacc 840

tcggagaagc agtggatcca ggaggaccag gcctcataca tctccttcaa tgcggcctcc 900

aactcgcggt cccaaatcaa ggctgccttg gacaatgcgg gaaagattat gagcctgact 960

aaaaccgccc ccgactacct ggtgggccag cagcccgtgg aggacatttc cagcaatcgg 1020

atttataaaa ttttggaact aaacgggtac gatccccaat atgcggcttc cgtctttctg 1080

ggatgggcca cgaaaaagtt cggcaagagg aacaccatct ggctgtttgg gcctgcaact 1140

accgggaaga ccaacatcgc ggaggccata gcccacactg tgcccttcta cgggtgcgta 1200

aactggacca atgagaactt tcccttcaac gactgtgtcg acaagatggt gatctggtgg 1260

gaggagggga agatgaccgc caaggtcgtg gagtcggcca aagccattct cggaggaagc 1320

aaggtgcgcg tggaccagaa atgcaagtcc tcggcccaga tagacccgac tcccgtgatc 1380

gtcacctcca acaccaacat gtgcgccgtg attgacggga actcaacgac cttcgaacac 1440

cagcagccgt tgcaagaccg gatgttcaaa tttgaactca cccgccgtct ggatcatgac 1500

tttgggaagg tcaccaagca ggaagtcaaa gactttttcc ggtgggcaaa ggatcacgtg 1560

gttgaggtgg agcatgaatt ctacgtcaaa aagggtggag ccaagaaaag acccgccccc 1620

agtgacgcag atataagtga gcccaaacgg gtgcgcgagt cagttgcgca gccatcgacg 1680

tcagacgcgg aagcttcgat caactacgca gacaggtacc aaaacaaatg ttctcgtcac 1740

gtgggcatga atctgatgct gtttccctgc agacaatgcg agagaatgaa tcagaattca 1800

aatatctgct tcactcacgg acagaaagac tgtttagagt gctttcccgt gtcagaatct 1860

caacccgttt ctgtcgtcaa aaaggcgtat cagaaactgt gctacattca tcatatcatg 1920

ggaaaggtgc cagacgcttg cactgcctgc gatctggtca atgtggattt ggatgactgc 1980

atctttgaac aataa 1995

<210> 52

<211> 1930

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 52

atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60

ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120

tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180

cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240

caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300

aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360

taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420

gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480

acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540

aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600

gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660

tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720

cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780

tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840

cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900

attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960

acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020

accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080

aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140

aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200

gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260

aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320

ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380

gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440

gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500

gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560

gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620

aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680

ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740

tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800

ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860

caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920

caaccttagt 1930

<210> 53

<211> 2059

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 53

tcctgtatta gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtcacgct 60

gggtatttaa gcccgagtga gcacgcaggg tctccatttt gaagcgggag gtttgaacgc 120

gcagccgcca tgccggggtt ttacgagatt gtgattaagg tccccagcga ccttgacgag 180

catctgcccg gcatttctga cagctttgtg aactgggtgg ccgagaagga atgggagttg 240

ccgccagatt ctgacatgga tctgaatctg attgagcagg cacccctgac cgtggccgag 300

aagctgcagc gcgactttct gacggaatgg cgccgtgtga gtaaggcccc ggaggccctt 360

ttctttgtgc aatttgagaa gggagagagc tacttccaca tgcacgtgct cgtggaaacc 420

accggggtga aatccatggt tttgggacgt ttcctgagtc agattcgcga aaaactgatt 480

cagagaattt accgcgggat cgagccgact ttgccaaact ggttcgcggt cacaaagacc 540

agaaatggcg ccggaggcgg gaacaaggtg gtggatgagt gctacatccc caattacttg 600

ctccccaaaa cccagcctga gctccagtgg gcgtggacta atatggaaca gtatttaagc 660

gcctgtttga atctcacgga gcgtaaacgg ttggtggcgc agcatctgac gcacgtgtcg 720

cagacgcagg agcagaacaa agagaatcag aatcccaatt ctgatgcgcc ggtgatcaga 780

tcaaaaactt cagccaggta catggagctg gtcgggtggc tcgtggacaa ggggattacc 840

tcggagaagc agtggatcca ggaggaccag gcctcataca tctccttcaa tgcggcctcc 900

aactcgcggt cccaaatcaa ggctgccttg gacaatgcgg gaaagattat gagcctgact 960

aaaaccgccc ccgactacct ggtgggccag cagcccgtgg aggacatttc cagcaatcgg 1020

atttataaaa ttttggaact aaacgggtac gatccccaat atgcggcttc cgtctttctg 1080

ggatgggcca cgaaaaagtt cggcaagagg aacaccatct ggctgtttgg gcctgcaact 1140

accgggaaga ccaacatcgc ggaggccata gcccacactg tgcccttcta cgggtgcgta 1200

aactggacca atgagaactt tcccttcaac gactgtgtcg acaagatggt gatctggtgg 1260

gaggagggga agatgaccgc caaggtcgtg gagtcggcca aagccattct cggaggaagc 1320

aaggtgcgcg tggaccagaa atgcaagtcc tcggcccaga tagacccgac tcccgtgatc 1380

gtcacctcca acaccaacat gtgcgccgtg attgacggga actcaacgac cttcgaacac 1440

cagcagccgt tgcaagaccg gatgttcaaa tttgaactca cccgccgtct ggatcatgac 1500

tttgggaagg tcaccaagca ggaagtcaaa gactttttcc ggtgggcaaa ggatcacgtg 1560

gttgaggtgg agcatgaatt ctacgtcaaa aagggtggag ccaagaaaag acccgccccc 1620

agtgacgcag atataagtga gcccaaacgg gtgcgcgagt cagttgcgca gccatcgacg 1680

tcagacgcgg aagcttcgat caactacgca gacaggtacc aaaacaaatg ttctcgtcac 1740

gtgggcatga atctgatgct gtttccctgc agacaatgcg agagaatgaa tcagaattca 1800

aatatctgct tcactcacgg acagaaagac tgtttagagt gctttcccgt gtcagaatct 1860

caacccgttt ctgtcgtcaa aaaggcgtat cagaaactgt gctacattca tcatatcatg 1920

ggaaaggtgc cagacgcttg cactgcctgc gatctggtca atgtggattt ggatgactgc 1980

atctttgaac aataaatgac ttaaaccagg tatggctgcc gatggttatc ttccagattg 2040

gctcgaggac aaccttagt 2059

<210> 54

<211> 1258

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 54

atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag 60

gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag 120

gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg 180

gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta 240

aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc 300

ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg 360

gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt 420

cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc 480

aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa 540

tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg 600

tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg 660

atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag 720

gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc 780

tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag 840

cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc 900

aactacgcag acaggtacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg 960

tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga 1020

cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa 1080

aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc 1140

actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataaatgact 1200

taaaccaggt atggctgccg atggttatct tccagattgg ctcgaggaca accttagt 1258

<210> 55

<211> 1531

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 55

gtcacaaaga ccagaaatgg cgccggaggc gggaacaagg tggtggatga gtgctacatc 60

cccaattact tgctccccaa aacccagcct gagctccagt gggcgtggac taatatggaa 120

cagtatttaa gcgcctgttt gaatctcacg gagcgtaaac ggttggtggc gcagcatctg 180

acgcacgtgt cgcagacgca ggagcagaac aaagagaatc agaatcccaa ttctgatgcg 240

ccggtgatca gatcaaaaac ttcagccagg tacatggagc tggtcgggtg gctcgtggac 300

aaggggatta cctcggagaa gcagtggatc caggaggacc aggcctcata catctccttc 360

aatgcggcct ccaactcgcg gtcccaaatc aaggctgcct tggacaatgc gggaaagatt 420

atgagcctga ctaaaaccgc ccccgactac ctggtgggcc agcagcccgt ggaggacatt 480

tccagcaatc ggatttataa aattttggaa ctaaacgggt acgatcccca atatgcggct 540

tccgtctttc tgggatgggc cacgaaaaag ttcggcaaga ggaacaccat ctggctgttt 600

gggcctgcaa ctaccgggaa gaccaacatc gcggaggcca tagcccacac tgtgcccttc 660

tacgggtgcg taaactggac caatgagaac tttcccttca acgactgtgt cgacaagatg 720

gtgatctggt gggaggaggg gaagatgacc gccaaggtcg tggagtcggc caaagccatt 780

ctcggaggaa gcaaggtgcg cgtggaccag aaatgcaagt cctcggccca gatagacccg 840

actcccgtga tcgtcacctc caacaccaac atgtgcgccg tgattgacgg gaactcaacg 900

accttcgaac accagcagcc gttgcaagac cggatgttca aatttgaact cacccgccgt 960

ctggatcatg actttgggaa ggtcaccaag caggaagtca aagacttttt ccggtgggca 1020

aaggatcacg tggttgaggt ggagcatgaa ttctacgtca aaaagggtgg agccaagaaa 1080

agacccgccc ccagtgacgc agatataagt gagcccaaac gggtgcgcga gtcagttgcg 1140

cagccatcga cgtcagacgc ggaagcttcg atcaactacg cagacaggta ccaaaacaaa 1200

tgttctcgtc acgtgggcat gaatctgatg ctgtttccct gcagacaatg cgagagaatg 1260

aatcagaatt caaatatctg cttcactcac ggacagaaag actgtttaga gtgctttccc 1320

gtgtcagaat ctcaacccgt ttctgtcgtc aaaaaggcgt atcagaaact gtgctacatt 1380

catcatatca tgggaaaggt gccagacgct tgcactgcct gcgatctggt caatgtggat 1440

ttggatgact gcatctttga acaataaatg acttaaacca ggtatggctg ccgatggtta 1500

tcttccagat tggctcgagg acaaccttag t 1531

<210> 56

<211> 1194

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 56

atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag 60

gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag 120

gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg 180

gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta 240

aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc 300

ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg 360

gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt 420

cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc 480

aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa 540

tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg 600

tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg 660

atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag 720

gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc 780

tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag 840

cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc 900

aactacgcag acaggtacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg 960

tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga 1020

cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa 1080

aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc 1140

actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataa 1194

<210> 57

<211> 1467

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 57

gtcacaaaga ccagaaatgg cgccggaggc gggaacaagg tggtggatga gtgctacatc 60

cccaattact tgctccccaa aacccagcct gagctccagt gggcgtggac taatatggaa 120

cagtatttaa gcgcctgttt gaatctcacg gagcgtaaac ggttggtggc gcagcatctg 180

acgcacgtgt cgcagacgca ggagcagaac aaagagaatc agaatcccaa ttctgatgcg 240

ccggtgatca gatcaaaaac ttcagccagg tacatggagc tggtcgggtg gctcgtggac 300

aaggggatta cctcggagaa gcagtggatc caggaggacc aggcctcata catctccttc 360

aatgcggcct ccaactcgcg gtcccaaatc aaggctgcct tggacaatgc gggaaagatt 420

atgagcctga ctaaaaccgc ccccgactac ctggtgggcc agcagcccgt ggaggacatt 480

tccagcaatc ggatttataa aattttggaa ctaaacgggt acgatcccca atatgcggct 540

tccgtctttc tgggatgggc cacgaaaaag ttcggcaaga ggaacaccat ctggctgttt 600

gggcctgcaa ctaccgggaa gaccaacatc gcggaggcca tagcccacac tgtgcccttc 660

tacgggtgcg taaactggac caatgagaac tttcccttca acgactgtgt cgacaagatg 720

gtgatctggt gggaggaggg gaagatgacc gccaaggtcg tggagtcggc caaagccatt 780

ctcggaggaa gcaaggtgcg cgtggaccag aaatgcaagt cctcggccca gatagacccg 840

actcccgtga tcgtcacctc caacaccaac atgtgcgccg tgattgacgg gaactcaacg 900

accttcgaac accagcagcc gttgcaagac cggatgttca aatttgaact cacccgccgt 960

ctggatcatg actttgggaa ggtcaccaag caggaagtca aagacttttt ccggtgggca 1020

aaggatcacg tggttgaggt ggagcatgaa ttctacgtca aaaagggtgg agccaagaaa 1080

agacccgccc ccagtgacgc agatataagt gagcccaaac gggtgcgcga gtcagttgcg 1140

cagccatcga cgtcagacgc ggaagcttcg atcaactacg cagacaggta ccaaaacaaa 1200

tgttctcgtc acgtgggcat gaatctgatg ctgtttccct gcagacaatg cgagagaatg 1260

aatcagaatt caaatatctg cttcactcac ggacagaaag actgtttaga gtgctttccc 1320

gtgtcagaat ctcaacccgt ttctgtcgtc aaaaaggcgt atcagaaact gtgctacatt 1380

catcatatca tgggaaaggt gccagacgct tgcactgcct gcgatctggt caatgtggat 1440

ttggatgact gcatctttga acaataa 1467

<210> 58

<211> 1930

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 58

atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60

ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120

tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180

cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240

caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300

aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360

taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420

gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480

acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540

aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600

gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660

tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720

cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780

tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840

cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900

attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960

acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020

accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080

aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140

aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200

gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260

aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320

ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380

gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440

gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500

gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560

gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620

aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680

ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740

tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800

ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860

caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920

caaccttagt 1930

<210> 59

<211> 2059

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 59

tcctgtatta gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtcacgct 60

gggtatttaa gcccgagtga gcacgcaggg tctccatttt gaagcgggag gtttgaacgc 120

gcagccgcca tgccggggtt ttacgagatt gtgattaagg tccccagcga ccttgacgag 180

catctgcccg gcatttctga cagctttgtg aactgggtgg ccgagaagga atgggagttg 240

ccgccagatt ctgacatgga tctgaatctg attgagcagg cacccctgac cgtggccgag 300

aagctgcagc gcgactttct gacggaatgg cgccgtgtga gtaaggcccc ggaggccctt 360

ttctttgtgc aatttgagaa gggagagagc tacttccaca tgcacgtgct cgtggaaacc 420

accggggtga aatccatggt tttgggacgt ttcctgagtc agattcgcga aaaactgatt 480

cagagaattt accgcgggat cgagccgact ttgccaaact ggttcgcggt cacaaagacc 540

agaaatggcg ccggaggcgg gaacaaggtg gtggatgagt gctacatccc caattacttg 600

ctccccaaaa cccagcctga gctccagtgg gcgtggacta atatggaaca gtatttaagc 660

gcctgtttga atctcacgga gcgtaaacgg ttggtggcgc agcatctgac gcacgtgtcg 720

cagacgcagg agcagaacaa agagaatcag aatcccaatt ctgatgcgcc ggtgatcaga 780

tcaaaaactt cagccaggta catggagctg gtcgggtggc tcgtggacaa ggggattacc 840

tcggagaagc agtggatcca ggaggaccag gcctcataca tctccttcaa tgcggcctcc 900

aactcgcggt cccaaatcaa ggctgccttg gacaatgcgg gaaagattat gagcctgact 960

aaaaccgccc ccgactacct ggtgggccag cagcccgtgg aggacatttc cagcaatcgg 1020

atttataaaa ttttggaact aaacgggtac gatccccaat atgcggcttc cgtctttctg 1080

ggatgggcca cgaaaaagtt cggcaagagg aacaccatct ggctgtttgg gcctgcaact 1140

accgggaaga ccaacatcgc ggaggccata gcccacactg tgcccttcta cgggtgcgta 1200

aactggacca atgagaactt tcccttcaac gactgtgtcg acaagatggt gatctggtgg 1260

gaggagggga agatgaccgc caaggtcgtg gagtcggcca aagccattct cggaggaagc 1320

aaggtgcgcg tggaccagaa atgcaagtcc tcggcccaga tagacccgac tcccgtgatc 1380

gtcacctcca acaccaacat gtgcgccgtg attgacggga actcaacgac cttcgaacac 1440

cagcagccgt tgcaagaccg gatgttcaaa tttgaactca cccgccgtct ggatcatgac 1500

tttgggaagg tcaccaagca ggaagtcaaa gactttttcc ggtgggcaaa ggatcacgtg 1560

gttgaggtgg agcatgaatt ctacgtcaaa aagggtggag ccaagaaaag acccgccccc 1620

agtgacgcag atataagtga gcccaaacgg gtgcgcgagt cagttgcgca gccatcgacg 1680

tcagacgcgg aagcttcgat caactacgca gacaggtacc aaaacaaatg ttctcgtcac 1740

gtgggcatga atctgatgct gtttccctgc agacaatgcg agagaatgaa tcagaattca 1800

aatatctgct tcactcacgg acagaaagac tgtttagagt gctttcccgt gtcagaatct 1860

caacccgttt ctgtcgtcaa aaaggcgtat cagaaactgt gctacattca tcatatcatg 1920

ggaaaggtgc cagacgcttg cactgcctgc gatctggtca atgtggattt ggatgactgc 1980

atctttgaac aataaatgac ttaaaccagg tatggctgcc gatggttatc ttccagattg 2040

gctcgaggac aaccttagt 2059

<210> 60

<211> 5336

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 60

ggtacccaac tccatgctta acagtcccca ggtacagccc accctgcgtc gcaaccagga 60

acagctctac agcttcctgg agcgccactc gccctacttc cgcagccaca gtgcgcagat 120

taggagcgcc acttcttttt gtcacttgaa aaacatgtaa aaataatgta ctaggagaca 180

ctttcaataa aggcaaatgt ttttatttgt acactctcgg gtgattattt accccccacc 240

cttgccgtct gcgccgttta aaaatcaaag gggttctgcc gcgcatcgct atgcgccact 300

ggcagggaca cgttgcgata ctggtgttta gtgctccact taaactcagg cacaaccatc 360

cgcggcagct cggtgaagtt ttcactccac aggctgcgca ccatcaccaa cgcgtttagc 420

aggtcgggcg ccgatatctt gaagtcgcag ttggggcctc cgccctgcgc gcgcgagttg 480

cgatacacag ggttgcagca ctggaacact atcagcgccg ggtggtgcac gctggccagc 540

acgctcttgt cggagatcag atccgcgtcc aggtcctccg cgttgctcag ggcgaacgga 600

gtcaactttg gtagctgcct tcccaaaaag ggtgcatgcc caggctttga gttgcactcg 660

caccgtagtg gcatcagaag gtgaccgtgc ccggtctggg cgttaggata cagcgcctgc 720

atgaaagcct tgatctgctt aaaagccacc tgagcctttg cgccttcaga gaagaacatg 780

ccgcaagact tgccggaaaa ctgattggcc ggacaggccg cgtcatgcac gcagcacctt 840

gcgtcggtgt tggagatctg caccacattt cggccccacc ggttcttcac gatcttggcc 900

ttgctagact gctccttcag cgcgcgctgc ccgttttcgc tcgtcacatc catttcaatc 960

acgtgctcct tatttatcat aatgctcccg tgtagacact taagctcgcc ttcgatctca 1020

gcgcagcggt gcagccacaa cgcgcagccc gtgggctcgt ggtgcttgta ggttacctct 1080

gcaaacgact gcaggtacgc ctgcaggaat cgccccatca tcgtcacaaa ggtcttgttg 1140

ctggtgaagg tcagctgcaa cccgcggtgc tcctcgttta gccaggtctt gcatacggcc 1200

gccagagctt ccacttggtc aggcagtagc ttgaagtttg cctttagatc gttatccacg 1260

tggtacttgt ccatcaacgc gcgcgcagcc tccatgccct tctcccacgc agacacgatc 1320

ggcaggctca gcgggtttat caccgtgctt tcactttccg cttcactgga ctcttccttt 1380

tcctcttgcg tccgcatacc ccgcgccact gggtcgtctt cattcagccg ccgcaccgtg 1440

cgcttacctc ccttgccgtg cttgattagc accggtgggt tgctgaaacc caccatttgt 1500

agcgccacat cttctctttc ttcctcgctg tccacgatca cctctgggga tggcgggcgc 1560

tcgggcttgg gagaggggcg cttctttttc tttttggacg caatggccaa atccgccgtc 1620

gaggtcgatg gccgcgggct gggtgtgcgc ggcaccagcg catcttgtga cgagtcttct 1680

tcgtcctcgg actcgagacg ccgcctcagc cgcttttttg ggggcgcgcg gggaggcggc 1740

ggcgacggcg acggggacga cacgtcctcc atggttggtg gacgtcgcgc cgcaccgcgt 1800

ccgcgctcgg gggtggtttc gcgctgctcc tcttcccgac tggccatttc cttctcctat 1860

aggcagaaaa agatcatgga gtcagtcgag aaggaggaca gcctaaccgc cccctttgag 1920

ttcgccacca ccgcctccac cgatgccgcc aacgcgccta ccaccttccc cgtcgaggca 1980

cccccgcttg aggaggagga agtgattatc gagcaggacc caggttttgt aagcgaagac 2040

gacgaggatc gctcagtacc aacagaggat aaaaagcaag accaggacga cgcagaggca 2100

aacgaggaac aagtcgggcg gggggaccaa aggcatggcg actacctaga tgtgggagac 2160

gacgtgctgt tgaagcatct gcagcgccag tgcgccatta tctgcgacgc gttgcaagag 2220

cgcagcgatg tgcccctcgc catagcggat gtcagccttg cctacgaacg ccacctgttc 2280

tcaccgcgcg taccccccaa acgccaagaa aacggcacat gcgagcccaa cccgcgcctc 2340

aacttctacc ccgtatttgc cgtgccagag gtgcttgcca cctatcacat ctttttccaa 2400

aactgcaaga tacccctatc ctgccgtgcc aaccgcagcc gagcggacaa gcagctggcc 2460

ttgcggcagg gcgctgtcat acctgatatc gcctcgctcg acgaagtgcc aaaaatcttt 2520

gagggtcttg gacgcgacga gaaacgcgcg gcaaacgctc tgcaacaaga aaacagcgaa 2580

aatgaaagtc actgtggagt gctggtggaa cttgagggtg acaacgcgcg cctagccgtg 2640

ctgaaacgca gcatcgaggt cacccacttt gcctacccgg cacttaacct accccccaag 2700

gttatgagca cagtcatgag cgagctgatc gtgcgccgtg cacgacccct ggagagggat 2760

gcaaacttgc aagaacaaac cgaggagggc ctacccgcag ttggcgatga gcagctggcg 2820

cgctggcttg agacgcgcga gcctgccgac ttggaggagc gacgcaagct aatgatggcc 2880

gcagtgcttg ttaccgtgga gcttgagtgc atgcagcggt tctttgctga cccggagatg 2940

cagcgcaagc tagaggaaac gttgcactac acctttcgcc agggctacgt gcgccaggcc 3000

tgcaaaattt ccaacgtgga gctctgcaac ctggtctcct accttggaat tttgcacgaa 3060

aaccgcctcg ggcaaaacgt gcttcattcc acgctcaagg gcgaggcgcg ccgcgactac 3120

gtccgcgact gcgtttactt atttctgtgc tacacctggc aaacggccat gggcgtgtgg 3180

cagcaatgcc tggaggagcg caacctaaag gagctgcaga agctgctaaa gcaaaacttg 3240

aaggacctat ggacggcctt caacgagcgc tccgtggccg cgcacctggc ggacattatc 3300

ttccccgaac gcctgcttaa aaccctgcaa cagggtctgc cagacttcac cagtcaaagc 3360

atgttgcaaa actttaggaa ctttatccta gagcgttcag gaattctgcc cgccacctgc 3420

tgtgcgcttc ctagcgactt tgtgcccatt aagtaccgtg aatgccctcc gccgctttgg 3480

ggtcactgct accttctgca gctagccaac taccttgcct accactccga catcatggaa 3540

gacgtgagcg gtgacggcct actggagtgt cactgtcgct gcaacctatg caccccgcac 3600

cgctccctgg tctgcaattc gcaactgctt agcgaaagtc aaattatcgg tacctttgag 3660

ctgcagggtc cctcgcctga cgaaaagtcc gcggctccgg ggttgaaact cactccgggg 3720

ctgtggacgt cggcttacct tcgcaaattt gtacctgagg actaccacgc ccacgagatt 3780

aggttctacg aagaccaatc ccgcccgcca aatgcggagc ttaccgcctg cgtcattacc 3840

cagggccaca tccttggcca attgcaagcc atcaacaaag cccgccaaga gtttctgcta 3900

cgaaagggac ggggggttta cctggacccc cagtccggcg aggagctcaa cccaatcccc 3960

ccgccgccgc agccctatca gcagccgcgg gcccttgctt cccaggatgg cacccaaaaa 4020

gaagctgcag ctgccgccgc cgccacccac ggacgaggag gaatactggg acagtcaggc 4080

agaggaggtt ttggacgagg aggaggagat gatggaagac tgggacagcc tagacgaagc 4140

ttccgaggcc gaagaggtgt cagacgaaac accgtcaccc tcggtcgcat tcccctcgcc 4200

ggcgccccag aaattggcaa ccgttcccag catcgctaca acctccgctc ctcaggcgcc 4260

gccggcactg cctgttcgcc gacccaaccg tagatgggac accactggaa ccagggccgg 4320

taagtctaag cagccgccgc cgttagccca agagcaacaa cagcgccaag gctaccgctc 4380

gtggcgcggg cacaagaacg ccatagttgc ttgcttgcaa gactgtgggg gcaacatctc 4440

cttcgcccgc cgctttcttc tctaccatca cggcgtggcc ttcccccgta acatcctgca 4500

ttactaccgt catctctaca gcccctactg caccggcggc agcggcagcg gcagcaacag 4560

cagcggtcac acagaagcaa aggcgaccgg atagcaagac tctgacaaag cccaagaaat 4620

ccacagcggc ggcagcagca ggaggaggag cgctgcgtct ggcgcccaac gaacccgtat 4680

cgacccgcga gcttagaaat aggatttttc ccactctgta tgctatattt caacaaagca 4740

ggggccaaga acaagagctg aaaataaaaa acaggtctct gcgctccctc acccgcagct 4800

gcctgtatca caaaagcgaa gatcagcttc ggcgcacgct ggaagacgcg gaggctctct 4860

tcagcaaata ctgcgcgctg actcttaagg actagtttcg cgccctttct caaatttaag 4920

cgcgaaaact acgtcatctc cagcggccac acccggcgcc agcacctgtc gtcagcgcca 4980

ttatgagcaa ggaaattccc acgccctaca tgtggagtta ccagccacaa atgggacttg 5040

cggctggagc tgcccaagac tactcaaccc gaataaacta catgagcgcg ggaccccaca 5100

tgatatcccg ggtcaacgga atccgcgccc accgaaaccg aattctcctc gaacaggcgg 5160

ctattaccac cacacctcgt aataacctta atccccgtag ttggcccgct gccctggtgt 5220

accaggaaag tcccgctccc accactgtgg tacttcccag agacgcccag gccgaagttc 5280

agatgactaa ctcaggggcg cagcttgcgg gcggctttcg tcacagggtg cggtcg 5336

<210> 61

<211> 3201

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 61

cccgggcgtt ttagggcgga gtaacttgca tgtattggga attgtagttt ttttaaaatg 60

ggaagtgacg tatcgtggga aaacggaagt gaagatttga ggaagttgtg ggttttttgg 120

ctttcgtttc tgggcgtagg ttcgcgtgcg gttttctggg tgttttttgt ggactttaac 180

cgttacgtca ttttttagtc ctatatatac tcgctctgta cttggccctt tttacactgt 240

gactgattga gctggtgccg tgtcgagtgg tgttttttaa taggtttttt tactggtaag 300

gctgactgtt atggctgccg ctgtggaagc gctgtatgtt gttctggagc gggagggtgc 360

tattttgcct aggcaggagg gtttttcagg tgtttatgtg tttttctctc ctattaattt 420

tgttatacct cctatggggg ctgtaatgtt gtctctacgc ctgcgggtat gtattccccc 480

gggctatttc ggtcgctttt tagcactgac cgatgttaac caacctgatg tgtttaccga 540

gtcttacatt atgactccgg acatgaccga ggaactgtcg gtggtgcttt ttaatcacgg 600

tgaccagttt ttttacggtc acgccggcat ggccgtagtc cgtcttatgc ttataagggt 660

tgtttttcct gttgtaagac aggcttctaa tgtttaaatg tttttttttt tgttatttta 720

ttttgtgttt aatgcaggaa cccgcagaca tgtttgagag aaaaatggtg tctttttctg 780

tggtggttcc ggaacttacc tgcctttatc tgcatgagca tgactacgat gtgcttgctt 840

ttttgcgcga ggctttgcct gattttttga gcagcacctt gcattttata tcgccgccca 900

tgcaacaagc ttacataggg gctacgctgg ttagcatagc tccgagtatg cgtgtcataa 960

tcagtgtggg ttcttttgtc atggttcctg gcggggaagt ggccgcgctg gtccgtgcag 1020

acctgcacga ttatgttcag ctggccctgc gaagggacct acgggatcgc ggtatttttg 1080

ttaatgttcc gcttttgaat cttatacagg tctgtgagga acctgaattt ttgcaatcat 1140

gattcgctgc ttgaggctga aggtggaggg cgctctggag cagattttta caatggccgg 1200

acttaatatt cgggatttgc ttagagacat attgataagg tggcgagatg aaaattattt 1260

gggcatggtt gaaggtgctg gaatgtttat agaggagatt caccctgaag ggtttagcct 1320

ttacgtccac ttggacgtga gggcagtttg ccttttggaa gccattgtgc aacatcttac 1380

aaatgccatt atctgttctt tggctgtaga gtttgaccac gccaccggag gggagcgcgt 1440

tcacttaata gatcttcatt ttgaggtttt ggataatctt ttggaataaa aaaaaaaaaa 1500

catggttctt ccagctcttc ccgctcctcc cgtgtgtgac tcgcagaacg aatgtgtagg 1560

ttggctgggt gtggcttatt ctgcggtggt ggatgttatc agggcagcgg cgcatgaagg 1620

agtttacata gaacccgaag ccagggggcg cctggatgct ttgagagagt ggatatacta 1680

caactactac acagagcgag ctaagcgacg agaccggaga cgcagatctg tttgtcacgc 1740

ccgcacctgg ttttgcttca ggaaatatga ctacgtccgg cgttccattt ggcatgacac 1800

tacgaccaac acgatctcgg ttgtctcggc gcactccgta cagtagggat cgcctacctc 1860

cttttgagac agagacccgc gctaccatac tggaggatca tccgctgctg cccgaatgta 1920

acactttgac aatgcacaac gtgagttacg tgcgaggtct tccctgcagt gtgggattta 1980

cgctgattca ggaatgggtt gttccctggg atatggttct gacgcgggag gagcttgtaa 2040

tcctgaggaa gtgtatgcac gtgtgcctgt gttgtgccaa cattgatatc atgacgagca 2100

tgatgatcca tggttacgag tcctgggctc tccactgtca ttgttccagt cccggttccc 2160

tgcagtgcat agccggcggg caggttttgg ccagctggtt taggatggtg gtggatggcg 2220

ccatgtttaa tcagaggttt atatggtacc gggaggtggt gaattacaac atgccaaaag 2280

aggtaatgtt tatgtccagc gtgtttatga ggggtcgcca cttaatctac ctgcgcttgt 2340

ggtatgatgg ccacgtgggt tctgtggtcc ccgccatgag ctttggatac agcgccttgc 2400

actgtgggat tttgaacaat attgtggtgc tgtgctgcag ttactgtgct gatttaagtg 2460

agatcagggt gcgctgctgt gcccggagga caaggcgtct catgctgcgg gcggtgcgaa 2520

tcatcgctga ggagaccact gccatgttgt attcctgcag gacggagcgg cggcggcagc 2580

agtttattcg cgcgctgctg cagcaccacc gccctatcct gatgcacgat tatgactcta 2640

cccccatgta ggcgtggact tccccttcgc cgcccgttga gcaaccgcaa gttggacagc 2700

agcctgtggc tcagcagctg gacagcgaca tgaacttaag cgagctgccc ggggagttta 2760

ttaatatcac tgatgagcgt ttggctcgac aggaaaccgt gtggaatata acacctaaga 2820

atatgtctgt tacccatgat atgatgcttt ttaaggccag ccggggagaa aggactgtgt 2880

actctgtgtg ttgggaggga ggtggcaggt tgaatactag ggttctgtga gtttgattaa 2940

ggtacggtga tcaatataag ctatgtggtg gtggggctat actactgaat gaaaaatgac 3000

ttgaaatttt ctgcaattga aaaataaaca cgttgaaaca taacatgcaa caggttcacg 3060

attctttatt cctgggcaat gtaggagaag gtgtaagagt tggtagcaaa agtttcagtg 3120

gtgtattttc cactttccca ggaccatgta aaagacatag agtaagtgct tacctcgcta 3180

gtttctgtgg attcactaga a 3201

<210> 62

<211> 743

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 62

tcgatgtagg atgttgcccc tcctgacgcg gtaggagaag gggagggtgc cctgcatgtc 60

tgccgctgct cttgctcttg ccgctgctga ggaggggggc gcatctgccg cagcaccgga 120

tgcatctggg aaaagcaaaa aaggggctcg tccctgtttc cggaggaatt tgcaagcggg 180

gtcttgcatg acggggaggc aaacccccgt tcgccgcagt ccggccggcc cgagactcga 240

accgggggtc ctgcgactca acccttggaa aataaccctc cggctacagg gagcgagcca 300

cttaatgctt tcgctttcca gcctaaccgc ttacgccgcg cgcggccagt ggccaaaaaa 360

gctagcgcag cagccgccgc gcctggaagg aagccaaaag gagcgctccc ccgttgtctg 420

acgtcgcaca cctgggttcg acacgcgggc ggtaaccgca tggatcacgg cggacggccg 480

gatccggggt tcgaaccccg gtcgtccgcc atgataccct tgcgaattta tccaccagac 540

cacggaagag tgcccgctta caggctctcc ttttgcacgg tctagagcgt caacgactgc 600

gcacgcctca ccggccagag cgtcccgacc atggagcact ttttgccgct gcgcaacatc 660

tggaaccgcg tccgcgactt tccgcgcgcc tccaccaccg ccgccggcat cacctggatg 720

tccaggtaca tctacggatt acg 743

<210> 63

<211> 9280

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 63

ggtacccaac tccatgctta acagtcccca ggtacagccc accctgcgtc gcaaccagga 60

acagctctac agcttcctgg agcgccactc gccctacttc cgcagccaca gtgcgcagat 120

taggagcgcc acttcttttt gtcacttgaa aaacatgtaa aaataatgta ctaggagaca 180

ctttcaataa aggcaaatgt ttttatttgt acactctcgg gtgattattt accccccacc 240

cttgccgtct gcgccgttta aaaatcaaag gggttctgcc gcgcatcgct atgcgccact 300

ggcagggaca cgttgcgata ctggtgttta gtgctccact taaactcagg cacaaccatc 360

cgcggcagct cggtgaagtt ttcactccac aggctgcgca ccatcaccaa cgcgtttagc 420

aggtcgggcg ccgatatctt gaagtcgcag ttggggcctc cgccctgcgc gcgcgagttg 480

cgatacacag ggttgcagca ctggaacact atcagcgccg ggtggtgcac gctggccagc 540

acgctcttgt cggagatcag atccgcgtcc aggtcctccg cgttgctcag ggcgaacgga 600

gtcaactttg gtagctgcct tcccaaaaag ggtgcatgcc caggctttga gttgcactcg 660

caccgtagtg gcatcagaag gtgaccgtgc ccggtctggg cgttaggata cagcgcctgc 720

atgaaagcct tgatctgctt aaaagccacc tgagcctttg cgccttcaga gaagaacatg 780

ccgcaagact tgccggaaaa ctgattggcc ggacaggccg cgtcatgcac gcagcacctt 840

gcgtcggtgt tggagatctg caccacattt cggccccacc ggttcttcac gatcttggcc 900

ttgctagact gctccttcag cgcgcgctgc ccgttttcgc tcgtcacatc catttcaatc 960

acgtgctcct tatttatcat aatgctcccg tgtagacact taagctcgcc ttcgatctca 1020

gcgcagcggt gcagccacaa cgcgcagccc gtgggctcgt ggtgcttgta ggttacctct 1080

gcaaacgact gcaggtacgc ctgcaggaat cgccccatca tcgtcacaaa ggtcttgttg 1140

ctggtgaagg tcagctgcaa cccgcggtgc tcctcgttta gccaggtctt gcatacggcc 1200

gccagagctt ccacttggtc aggcagtagc ttgaagtttg cctttagatc gttatccacg 1260

tggtacttgt ccatcaacgc gcgcgcagcc tccatgccct tctcccacgc agacacgatc 1320

ggcaggctca gcgggtttat caccgtgctt tcactttccg cttcactgga ctcttccttt 1380

tcctcttgcg tccgcatacc ccgcgccact gggtcgtctt cattcagccg ccgcaccgtg 1440

cgcttacctc ccttgccgtg cttgattagc accggtgggt tgctgaaacc caccatttgt 1500

agcgccacat cttctctttc ttcctcgctg tccacgatca cctctgggga tggcgggcgc 1560

tcgggcttgg gagaggggcg cttctttttc tttttggacg caatggccaa atccgccgtc 1620

gaggtcgatg gccgcgggct gggtgtgcgc ggcaccagcg catcttgtga cgagtcttct 1680

tcgtcctcgg actcgagacg ccgcctcagc cgcttttttg ggggcgcgcg gggaggcggc 1740

ggcgacggcg acggggacga cacgtcctcc atggttggtg gacgtcgcgc cgcaccgcgt 1800

ccgcgctcgg gggtggtttc gcgctgctcc tcttcccgac tggccatttc cttctcctat 1860

aggcagaaaa agatcatgga gtcagtcgag aaggaggaca gcctaaccgc cccctttgag 1920

ttcgccacca ccgcctccac cgatgccgcc aacgcgccta ccaccttccc cgtcgaggca 1980

cccccgcttg aggaggagga agtgattatc gagcaggacc caggttttgt aagcgaagac 2040

gacgaggatc gctcagtacc aacagaggat aaaaagcaag accaggacga cgcagaggca 2100

aacgaggaac aagtcgggcg gggggaccaa aggcatggcg actacctaga tgtgggagac 2160

gacgtgctgt tgaagcatct gcagcgccag tgcgccatta tctgcgacgc gttgcaagag 2220

cgcagcgatg tgcccctcgc catagcggat gtcagccttg cctacgaacg ccacctgttc 2280

tcaccgcgcg taccccccaa acgccaagaa aacggcacat gcgagcccaa cccgcgcctc 2340

aacttctacc ccgtatttgc cgtgccagag gtgcttgcca cctatcacat ctttttccaa 2400

aactgcaaga tacccctatc ctgccgtgcc aaccgcagcc gagcggacaa gcagctggcc 2460

ttgcggcagg gcgctgtcat acctgatatc gcctcgctcg acgaagtgcc aaaaatcttt 2520

gagggtcttg gacgcgacga gaaacgcgcg gcaaacgctc tgcaacaaga aaacagcgaa 2580

aatgaaagtc actgtggagt gctggtggaa cttgagggtg acaacgcgcg cctagccgtg 2640

ctgaaacgca gcatcgaggt cacccacttt gcctacccgg cacttaacct accccccaag 2700

gttatgagca cagtcatgag cgagctgatc gtgcgccgtg cacgacccct ggagagggat 2760

gcaaacttgc aagaacaaac cgaggagggc ctacccgcag ttggcgatga gcagctggcg 2820

cgctggcttg agacgcgcga gcctgccgac ttggaggagc gacgcaagct aatgatggcc 2880

gcagtgcttg ttaccgtgga gcttgagtgc atgcagcggt tctttgctga cccggagatg 2940

cagcgcaagc tagaggaaac gttgcactac acctttcgcc agggctacgt gcgccaggcc 3000

tgcaaaattt ccaacgtgga gctctgcaac ctggtctcct accttggaat tttgcacgaa 3060

aaccgcctcg ggcaaaacgt gcttcattcc acgctcaagg gcgaggcgcg ccgcgactac 3120

gtccgcgact gcgtttactt atttctgtgc tacacctggc aaacggccat gggcgtgtgg 3180

cagcaatgcc tggaggagcg caacctaaag gagctgcaga agctgctaaa gcaaaacttg 3240

aaggacctat ggacggcctt caacgagcgc tccgtggccg cgcacctggc ggacattatc 3300

ttccccgaac gcctgcttaa aaccctgcaa cagggtctgc cagacttcac cagtcaaagc 3360

atgttgcaaa actttaggaa ctttatccta gagcgttcag gaattctgcc cgccacctgc 3420

tgtgcgcttc ctagcgactt tgtgcccatt aagtaccgtg aatgccctcc gccgctttgg 3480

ggtcactgct accttctgca gctagccaac taccttgcct accactccga catcatggaa 3540

gacgtgagcg gtgacggcct actggagtgt cactgtcgct gcaacctatg caccccgcac 3600

cgctccctgg tctgcaattc gcaactgctt agcgaaagtc aaattatcgg tacctttgag 3660

ctgcagggtc cctcgcctga cgaaaagtcc gcggctccgg ggttgaaact cactccgggg 3720

ctgtggacgt cggcttacct tcgcaaattt gtacctgagg actaccacgc ccacgagatt 3780

aggttctacg aagaccaatc ccgcccgcca aatgcggagc ttaccgcctg cgtcattacc 3840

cagggccaca tccttggcca attgcaagcc atcaacaaag cccgccaaga gtttctgcta 3900

cgaaagggac ggggggttta cctggacccc cagtccggcg aggagctcaa cccaatcccc 3960

ccgccgccgc agccctatca gcagccgcgg gcccttgctt cccaggatgg cacccaaaaa 4020

gaagctgcag ctgccgccgc cgccacccac ggacgaggag gaatactggg acagtcaggc 4080

agaggaggtt ttggacgagg aggaggagat gatggaagac tgggacagcc tagacgaagc 4140

ttccgaggcc gaagaggtgt cagacgaaac accgtcaccc tcggtcgcat tcccctcgcc 4200

ggcgccccag aaattggcaa ccgttcccag catcgctaca acctccgctc ctcaggcgcc 4260

gccggcactg cctgttcgcc gacccaaccg tagatgggac accactggaa ccagggccgg 4320

taagtctaag cagccgccgc cgttagccca agagcaacaa cagcgccaag gctaccgctc 4380

gtggcgcggg cacaagaacg ccatagttgc ttgcttgcaa gactgtgggg gcaacatctc 4440

cttcgcccgc cgctttcttc tctaccatca cggcgtggcc ttcccccgta acatcctgca 4500

ttactaccgt catctctaca gcccctactg caccggcggc agcggcagcg gcagcaacag 4560

cagcggtcac acagaagcaa aggcgaccgg atagcaagac tctgacaaag cccaagaaat 4620

ccacagcggc ggcagcagca ggaggaggag cgctgcgtct ggcgcccaac gaacccgtat 4680

cgacccgcga gcttagaaat aggatttttc ccactctgta tgctatattt caacaaagca 4740

ggggccaaga acaagagctg aaaataaaaa acaggtctct gcgctccctc acccgcagct 4800

gcctgtatca caaaagcgaa gatcagcttc ggcgcacgct ggaagacgcg gaggctctct 4860

tcagcaaata ctgcgcgctg actcttaagg actagtttcg cgccctttct caaatttaag 4920

cgcgaaaact acgtcatctc cagcggccac acccggcgcc agcacctgtc gtcagcgcca 4980

ttatgagcaa ggaaattccc acgccctaca tgtggagtta ccagccacaa atgggacttg 5040

cggctggagc tgcccaagac tactcaaccc gaataaacta catgagcgcg ggaccccaca 5100

tgatatcccg ggtcaacgga atccgcgccc accgaaaccg aattctcctc gaacaggcgg 5160

ctattaccac cacacctcgt aataacctta atccccgtag ttggcccgct gccctggtgt 5220

accaggaaag tcccgctccc accactgtgg tacttcccag agacgcccag gccgaagttc 5280

agatgactaa ctcaggggcg cagcttgcgg gcggctttcg tcacagggtg cggtcgcccg 5340

ggcgttttag ggcggagtaa cttgcatgta ttgggaattg tagttttttt aaaatgggaa 5400

gtgacgtatc gtgggaaaac ggaagtgaag atttgaggaa gttgtgggtt ttttggcttt 5460

cgtttctggg cgtaggttcg cgtgcggttt tctgggtgtt ttttgtggac tttaaccgtt 5520

acgtcatttt ttagtcctat atatactcgc tctgtacttg gcccttttta cactgtgact 5580

gattgagctg gtgccgtgtc gagtggtgtt ttttaatagg tttttttact ggtaaggctg 5640

actgttatgg ctgccgctgt ggaagcgctg tatgttgttc tggagcggga gggtgctatt 5700

ttgcctaggc aggagggttt ttcaggtgtt tatgtgtttt tctctcctat taattttgtt 5760

atacctccta tgggggctgt aatgttgtct ctacgcctgc gggtatgtat tcccccgggc 5820

tatttcggtc gctttttagc actgaccgat gttaaccaac ctgatgtgtt taccgagtct 5880

tacattatga ctccggacat gaccgaggaa ctgtcggtgg tgctttttaa tcacggtgac 5940

cagttttttt acggtcacgc cggcatggcc gtagtccgtc ttatgcttat aagggttgtt 6000

tttcctgttg taagacaggc ttctaatgtt taaatgtttt tttttttgtt attttatttt 6060

gtgtttaatg caggaacccg cagacatgtt tgagagaaaa atggtgtctt tttctgtggt 6120

ggttccggaa cttacctgcc tttatctgca tgagcatgac tacgatgtgc ttgctttttt 6180

gcgcgaggct ttgcctgatt ttttgagcag caccttgcat tttatatcgc cgcccatgca 6240

acaagcttac ataggggcta cgctggttag catagctccg agtatgcgtg tcataatcag 6300

tgtgggttct tttgtcatgg ttcctggcgg ggaagtggcc gcgctggtcc gtgcagacct 6360

gcacgattat gttcagctgg ccctgcgaag ggacctacgg gatcgcggta tttttgttaa 6420

tgttccgctt ttgaatctta tacaggtctg tgaggaacct gaatttttgc aatcatgatt 6480

cgctgcttga ggctgaaggt ggagggcgct ctggagcaga tttttacaat ggccggactt 6540

aatattcggg atttgcttag agacatattg ataaggtggc gagatgaaaa ttatttgggc 6600

atggttgaag gtgctggaat gtttatagag gagattcacc ctgaagggtt tagcctttac 6660

gtccacttgg acgtgagggc agtttgcctt ttggaagcca ttgtgcaaca tcttacaaat 6720

gccattatct gttctttggc tgtagagttt gaccacgcca ccggagggga gcgcgttcac 6780

ttaatagatc ttcattttga ggttttggat aatcttttgg aataaaaaaa aaaaaacatg 6840

gttcttccag ctcttcccgc tcctcccgtg tgtgactcgc agaacgaatg tgtaggttgg 6900

ctgggtgtgg cttattctgc ggtggtggat gttatcaggg cagcggcgca tgaaggagtt 6960

tacatagaac ccgaagccag ggggcgcctg gatgctttga gagagtggat atactacaac 7020

tactacacag agcgagctaa gcgacgagac cggagacgca gatctgtttg tcacgcccgc 7080

acctggtttt gcttcaggaa atatgactac gtccggcgtt ccatttggca tgacactacg 7140

accaacacga tctcggttgt ctcggcgcac tccgtacagt agggatcgcc tacctccttt 7200

tgagacagag acccgcgcta ccatactgga ggatcatccg ctgctgcccg aatgtaacac 7260

tttgacaatg cacaacgtga gttacgtgcg aggtcttccc tgcagtgtgg gatttacgct 7320

gattcaggaa tgggttgttc cctgggatat ggttctgacg cgggaggagc ttgtaatcct 7380

gaggaagtgt atgcacgtgt gcctgtgttg tgccaacatt gatatcatga cgagcatgat 7440

gatccatggt tacgagtcct gggctctcca ctgtcattgt tccagtcccg gttccctgca 7500

gtgcatagcc ggcgggcagg ttttggccag ctggtttagg atggtggtgg atggcgccat 7560

gtttaatcag aggtttatat ggtaccggga ggtggtgaat tacaacatgc caaaagaggt 7620

aatgtttatg tccagcgtgt ttatgagggg tcgccactta atctacctgc gcttgtggta 7680

tgatggccac gtgggttctg tggtccccgc catgagcttt ggatacagcg ccttgcactg 7740

tgggattttg aacaatattg tggtgctgtg ctgcagttac tgtgctgatt taagtgagat 7800

cagggtgcgc tgctgtgccc ggaggacaag gcgtctcatg ctgcgggcgg tgcgaatcat 7860

cgctgaggag accactgcca tgttgtattc ctgcaggacg gagcggcggc ggcagcagtt 7920

tattcgcgcg ctgctgcagc accaccgccc tatcctgatg cacgattatg actctacccc 7980

catgtaggcg tggacttccc cttcgccgcc cgttgagcaa ccgcaagttg gacagcagcc 8040

tgtggctcag cagctggaca gcgacatgaa cttaagcgag ctgcccgggg agtttattaa 8100

tatcactgat gagcgtttgg ctcgacagga aaccgtgtgg aatataacac ctaagaatat 8160

gtctgttacc catgatatga tgctttttaa ggccagccgg ggagaaagga ctgtgtactc 8220

tgtgtgttgg gagggaggtg gcaggttgaa tactagggtt ctgtgagttt gattaaggta 8280

cggtgatcaa tataagctat gtggtggtgg ggctatacta ctgaatgaaa aatgacttga 8340

aattttctgc aattgaaaaa taaacacgtt gaaacataac atgcaacagg ttcacgattc 8400

tttattcctg ggcaatgtag gagaaggtgt aagagttggt agcaaaagtt tcagtggtgt 8460

attttccact ttcccaggac catgtaaaag acatagagta agtgcttacc tcgctagttt 8520

ctgtggattc actagaatcg atgtaggatg ttgcccctcc tgacgcggta ggagaagggg 8580

agggtgccct gcatgtctgc cgctgctctt gctcttgccg ctgctgagga ggggggcgca 8640

tctgccgcag caccggatgc atctgggaaa agcaaaaaag gggctcgtcc ctgtttccgg 8700

aggaatttgc aagcggggtc ttgcatgacg gggaggcaaa cccccgttcg ccgcagtccg 8760

gccggcccga gactcgaacc gggggtcctg cgactcaacc cttggaaaat aaccctccgg 8820

ctacagggag cgagccactt aatgctttcg ctttccagcc taaccgctta cgccgcgcgc 8880

ggccagtggc caaaaaagct agcgcagcag ccgccgcgcc tggaaggaag ccaaaaggag 8940

cgctcccccg ttgtctgacg tcgcacacct gggttcgaca cgcgggcggt aaccgcatgg 9000

atcacggcgg acggccggat ccggggttcg aaccccggtc gtccgccatg atacccttgc 9060

gaatttatcc accagaccac ggaagagtgc ccgcttacag gctctccttt tgcacggtct 9120

agagcgtcaa cgactgcgca cgcctcaccg gccagagcgt cccgaccatg gagcactttt 9180

tgccgctgcg caacatctgg aaccgcgtcc gcgactttcc gcgcgcctcc accaccgccg 9240

ccggcatcac ctggatgtcc aggtacatct acggattacg 9280

<210> 64

<211> 621

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> AAV2 Rep

<400> 64

Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp

1 5 10 15

Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu

20 25 30

Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile

35 40 45

Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu

50 55 60

Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val

65 70 75 80

Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu

85 90 95

Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile

100 105 110

Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu

115 120 125

Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly

130 135 140

Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys

145 150 155 160

Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu

165 170 175

Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His

180 185 190

Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn

195 200 205

Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr

210 215 220

Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys

225 230 235 240

Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala

245 250 255

Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys

260 265 270

Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln

275 280 285

Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu

290 295 300

Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala

305 310 315 320

Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala

325 330 335

Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro

340 345 350

Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp

355 360 365

Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala

370 375 380

Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg

385 390 395 400

Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val

405 410 415

Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser

420 425 430

Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe

435 440 445

Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln

450 455 460

Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val

465 470 475 480

Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala

485 490 495

Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val

500 505 510

Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp

515 520 525

Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu

530 535 540

Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys

545 550 555 560

Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu

565 570 575

Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr

580 585 590

Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp

595 600 605

Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln

610 615 620

<210> 65

<211> 198

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 65

gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 60

aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 120

tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 180

gtgtgggagg ttttttaa 198

<210> 66

<211> 4186

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 66

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180

ggttagggag gtcctgcata tgcggccgca gcattagctt ccatttatgc agtgtaaatg 240

gtgagaacag ccccgactga atacccagag catcatctcg tctgtgtcat tcatgcacat 300

aacatatctc agcgaggtgg cccttctgtc ctctttgcag agacccagcc accatactag 360

tacctagaga actggctgga tttcagcccc gatacctccg ggcttttgct catgttcgcc 420

tcatagggtc atctgggtgg ttgcctaagg aaaagtatgt catggagact aacttgcttg 480

gcattgaata aaaggtgagt tgagagtgga gcgtgtttaa attgcaatcc tgcctctatt 540

tctgtgcttg cagggaacag tcatccttaa ttgctatcct ccatcatcat catgattatt 600

tctggttttt ctctggttgc ggagaatcca tactccaggt attccaatgt ctcagcattg 660

ccaggcctgt ctgagcgtca ggatgtaggt agtctgggct ctctgccttc tattcttgtc 720

caggatactc tgccaaaaga atcatgttgt ggctgccacc cctcccacaa agcctcccgc 780

ttgggtcagt ccaggactgg agttgggtat ggactgttca tgtctatcca ctgctacgtc 840

agggcaacac ccactgagag tgaccttgta gactgcagtg ggagacaccc ttcaaaacct 900

ctcctctcct gtcctgagag ccaggttaaa accatcagcc ccgcatcctg agtgcaaact 960

tttcctaacc ctgctgctaa gctagacacc tcacttactg agagccagcc cctaaaatgg 1020

gcaaacattg caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag 1080

ctggggcaga ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc 1140

ttggaatttc ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg 1200

ggaatgactc ctttcggtaa gtgcagtgga agctgtacac tgcccaggca aagcgtccgg 1260

gcagcgtagg cgggcgactc agatcccagc cagtggactt agcccctgtt tgctcctccg 1320

ataactgggg tgaccttggt taatattcac cagcagcctc ccccgttgcc cctctggatc 1380

cactgcttaa atacggacga ggacagggcc ctgtctcctc agcttcaggc accaccactg 1440

acctgggaca gtgaatcctc taaggtaaat ataaaatttt taagtgtata atgtgttaaa 1500

ctactgattc taattgtttc tctcttttag attccaacct ttggaactga ccgccaccat 1560

gtccaccgct gtgctggaga accctgggct ggggaggaaa ctgtcagact tcgggcagga 1620

gacttcatac attgaggata actgtaacca gaatggcgcc atctctctga tcttcagcct 1680

gaaggaggaa gtgggcgccc tggcaaaggt gctgcgcctg tttgaggaga acgacgtgaa 1740

tctgacccac atcgagtccc ggccttctag actgaagaag gacgagtacg agttctttac 1800

ccacctggat aagcggtccc tgccagccct gacaaacatc atcaagatcc tgaggcacga 1860

catcggagca accgtgcacg agctgtctcg ggacaagaag aaggataccg tgccctggtt 1920

ccctcggaca atccaggagc tggatagatt tgccaaccag atcctgtctt acggagcaga 1980

gctggacgca gatcaccctg gcttcaagga cccagtgtat cgggcccgga gaaagcagtt 2040

tgccgatatc gcctacaatt ataggcacgg acagccaatc cctcgcgtgg agtatatgga 2100

ggaggagaag aagacctggg gcacagtgtt caagaccctg aagagcctgt acaagacaca 2160

cgcctgctac gagtataacc acatcttccc cctgctggag aagtattgtg gctttcacga 2220

ggacaatatc cctcagctgg aggacgtgag ccagttcctg cagacctgca caggctttag 2280

gctgaggcca gtggcaggac tgctgagctc ccgggacttc ctgggaggac tggccttcag 2340

agtgtttcac tgcacccagt acatcaggca cggctccaag ccaatgtata caccagagcc 2400

cgacatctgt cacgagctgc tgggccacgt gcccctgttt agcgatagat ccttcgccca 2460

gttttcccag gagatcggac tggcatctct gggagcacct gacgagtaca tcgagaagct 2520

ggccaccatc tattggttca cagtggagtt tggcctgtgc aagcagggcg atagcatcaa 2580

ggcctacgga gcaggactgc tgtctagctt cggcgagctg cagtattgtc tgtccgagaa 2640

gccaaagctg ctgcccctgg agctggagaa gaccgccatc cagaactaca ccgtgacaga 2700

gttccagccc ctgtactatg tggccgagtc ttttaacgat gccaaggaga aggtgagaaa 2760

tttcgccgcc acaatcccta ggcccttcag tgtgcgttac gacccttata cccagaggat 2820

cgaggtgctg gataatacac agcagctgaa gatcctggct gactcaatca atagcgaaat 2880

cggaatcctg tgctccgccc tgcagaaaat caaatgagaa ttcaaggcct ctcgagcctc 2940

tagaactata gtgagtcgta ttacgtagat ccagacatga taagatacat tgatgagttt 3000

ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct 3060

attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt 3120

cattttatgt ttcaggttca gggggaggtg tgggaggttt tttaagcttt acgtacgatc 3180

gtcgagcagc tgttgtcctg gagaacggag tcctgagcag aaaactctca gactttgggc 3240

aggtaagcct gttgggcttc cactgctagg agagaattgg ttccccacat gtgaaagcag 3300

tctgggaaat gctggtattt ccagtctcct aaggctacta agaaatatga ctttatttag 3360

aggcgaggaa aatgcccagg aagtcaactg atgagactag tcttaacaag ttgaggatac 3420

agaaagttgg ggatctgagc tgctaccaac atctgtgtgt ctttgggtgg ctcattggta 3480

tcctctgcct attggcttta tcttctgtac actgaaagga aatggctggt ccttagtcac 3540

ctggggtggg agtccctatc tctccaggga tacttattca atcctttctt ctgggtatca 3600

aaatgacaag cttgtaagaa actgtcctct ttcggctttc aggaggtgat gtcgcatgaa 3660

gagaatttgg ggggggggac ttactcagaa ccaaggaggg agaaattaaa cagagaggga 3720

aatgaacagg agttagcccg gagcctgaag caccttgggg attatgctgg gggtggaggg 3780

aatccattgt cctccctagg gagggcttgc agaacatgtt cttttctgtg atatttgtac 3840

tttccccaga ttgcaaatca tggtttgtac actgagattc agtctctgga ggtaatatgc 3900

cttttctagc ttttccttgg acaggactaa ggggttgagg gttgcctgga gtcagagaaa 3960

tttgtgttaa agaaggttga tatgaaacct gcaggtctag atacgtagat aagtagcatg 4020

gcgggttaat cattaactac aaggaacccc tagtgatgga gttggccact ccctctctgc 4080

gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc 4140

gggcggcctc agtgagcgag cgagcgcgca gagagggagt ggccaa 4186

<210> 67

<211> 171

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 67

ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 60

tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 120

tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag g 171

<210> 68

<211> 122

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 68

aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60

aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120

ta 122

<210> 69

<211> 133

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 69

tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 60

aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 120

gaggtttttt aaa 133

<210> 70

<211> 3637

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 70

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180

ggttagggag gtcctgcata tgcggccgca gcattagctt ccatttatgc agtgtaaatg 240

gtgagaacag ccccgactga atacccagag catcatctcg tctgtgtcat tcatgcacat 300

aacatatctc agcgaggtgg cccttctgtc ctctttgcag agacccagcc accatactag 360

tacctagaga actggctgga tttcagcccc gatacctccg ggcttttgct catgttcgcc 420

tcatagggtc atctgggtgg ttgcctaagg aaaagtatgt catggagact aacttgcttg 480

gcattgaata aaaggtgagt tgagagtgga gcgtgtttaa attgcaatcc tgcctctatt 540

tctgtgcttg cagggaacag tcatccttaa ttgctatcct ccatcatcat catgattatt 600

tctggttttt ctctggttgc ggagaatcca tactccaggt attccaatgt ctcagcattg 660

ccaggcctgt ctgagcgtca ggatgtaggt agtctgggct ctctgccttc tattcttgtc 720

caggatactc tgccaaaaga atcatgttgt ggctgccacc cctcccacaa agcctcccgc 780

ttgggtcagt ccaggactgg agttgggtat ggactgttca tgtctatcca ctgctacgtc 840

agggcaacac ccactgagag tgaccttgta gactgcagtg ggagacaccc ttcaaaacct 900

ctcctctcct gtcctgagag ccaggttaaa accatcagcc ccgcatcctg agtgcaaact 960

tttcctaacc ctgctgctaa gctagacacc tcacttactg agagccagca tgtccaccgc 1020

tgtgctggag aaccctgggc tggggaggaa actgtcagac ttcgggcagg agacttcata 1080

cattgaggat aactgtaacc agaatggcgc catctctctg atcttcagcc tgaaggagga 1140

agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag aacgacgtga atctgaccca 1200

catcgagtcc cggccttcta gactgaagaa ggacgagtac gagttcttta cccacctgga 1260

taagcggtcc ctgccagccc tgacaaacat catcaagatc ctgaggcacg acatcggagc 1320

aaccgtgcac gagctgtctc gggacaagaa gaaggatacc gtgccctggt tccctcggac 1380

aatccaggag ctggatagat ttgccaacca gatcctgtct tacggagcag agctggacgc 1440

agatcaccct ggcttcaagg acccagtgta tcgggcccgg agaaagcagt ttgccgatat 1500

cgcctacaat tataggcacg gacagccaat ccctcgcgtg gagtatatgg aggaggagaa 1560

gaagacctgg ggcacagtgt tcaagaccct gaagagcctg tacaagacac acgcctgcta 1620

cgagtataac cacatcttcc ccctgctgga gaagtattgt ggctttcacg aggacaatat 1680

ccctcagctg gaggacgtga gccagttcct gcagacctgc acaggcttta ggctgaggcc 1740

agtggcagga ctgctgagct cccgggactt cctgggagga ctggccttca gagtgtttca 1800

ctgcacccag tacatcaggc acggctccaa gccaatgtat acaccagagc ccgacatctg 1860

tcacgagctg ctgggccacg tgcccctgtt tagcgataga tccttcgccc agttttccca 1920

ggagatcgga ctggcatctc tgggagcacc tgacgagtac atcgagaagc tggccaccat 1980

ctattggttc acagtggagt ttggcctgtg caagcagggc gatagcatca aggcctacgg 2040

agcaggactg ctgtctagct tcggcgagct gcagtattgt ctgtccgaga agccaaagct 2100

gctgcccctg gagctggaga agaccgccat ccagaactac accgtgacag agttccagcc 2160

cctgtactat gtggccgagt cttttaacga tgccaaggag aaggtgagaa atttcgccgc 2220

cacaatccct aggcccttca gcgtgcggta cgacccttat acccagagga tcgaggtgct 2280

ggataataca cagcagctga agatcctggc tgactcaatc aatagcgaaa tcggaatcct 2340

gtgctccgcc ctgcagaaaa tcaaatgaga attcaaggcc tctcgagcct ctagaactat 2400

agtgagtcgt attacgtaga tccagacatg ataagataca ttgatgagtt tggacaaacc 2460

acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta 2520

tttgtaacca ttataagctg caataaacaa gttaacaaca acaattgcat tcattttatg 2580

tttcaggttc agggggaggt gtgggaggtt ttttaagctt tacgtacgat cgtcgagcag 2640

ctgttgtcct ggagaacgga gtcctgagca gaaaactctc agactttggg caggtaagcc 2700

tgttgggctt ccactgctag gagagaattg gttccccaca tgtgaaagca gtctgggaaa 2760

tgctggtatt tccagtctcc taaggctact aagaaatatg actttattta gaggcgagga 2820

aaatgcccag gaagtcaact gatgagacta gtcttaacaa gttgaggata cagaaagttg 2880

gggatctgag ctgctaccaa catctgtgtg tctttgggtg gctcattggt atcctctgcc 2940

tattggcttt atcttctgta cactgaaagg aaatggctgg tccttagtca cctggggtgg 3000

gagtccctat ctctccaggg atacttattc aatcctttct tctgggtatc aaaatgacaa 3060

gcttgtaaga aactgtcctc tttcggcttt caggaggtga tgtcgcatga agagaatttg 3120

ggggggggga cttactcaga accaaggagg gagaaattaa acagagaggg aaatgaacag 3180

gagttagccc ggagcctgaa gcaccttggg gattatgctg ggggtggagg gaatccattg 3240

tcctccctag ggagggcttg cagaacatgt tcttttctgt gatatttgta ctttccccag 3300

attgcaaatc atggtttgta cactgagatt cagtctctgg aggtaatatg ccttttctag 3360

cttttccttg gacaggacta aggggttgag ggttgcctgg agtcagagaa atttgtgtta 3420

aagaaggttg atatgaaacc tgcaggtcta gatacgtaga taagtagcat ggcgggttaa 3480

tcattaacta caaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 3540

cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 3600

cagtgagcga gcgagcgcgc agagagggag tggccaa 3637

<210> 71

<211> 4075

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 71

ccttgctgtc ctgccccacc ccacccccca gaatagaatg acacctactc agacaatgcg 60

atgcaatttc ctcattttat taggaaagga cagtgggagt ggcaccttcc agggtcaagg 120

aaggcacggg ggaggggcaa acaacagatg gctggcaact agaaggcaca gcctcgagga 180

acgttttatt ttcccagaga caggctcagg gacttctggg tgtagtggct gtgcagggct 240

tcgtggagca cgctgcagct aaacacgttg ccctcttgcc atcggctctt gtccacggtc 300

agccgtgaat acaggaagaa gctgccatcg ctgtccagca ctggaggggt cgtcttgtag 360

ttgttttcag gctgtccgtt gctctcccat tcgacggcga tgtcgctggg gtagaagccc 420

ttcaccaggc aggtcagaga cacttggttc tttgtcattt cttcttgaga aggaggcagt 480

gtatagactt ggggctctct gggctggccc ttggcctttg agatggtctt ctcgatgctg 540

ctaggcaggc ccttgttaga caccttgcac ttgtactctt tgccgttcag ccagtcctgg 600

tgcagcactg tcagcacgga caccacccgg taggtgctgt taaactgttc ctcgcggggt 660

ttggtcttgg cattatgaac ttccactccg tcaacgtacc aattaaactg cacctcagga 720

tcctcctggg acacatccac caccacacat gtcacttcag gggtccggct gatcatcagg 780

gtgtctttgg gctttggtgg gaacaggaaa acagaagggc cggcgactgg tggagctgga 840

catggtgggc attccacgca gcactttctc tcaacggtct tatccacttt ggtgttgcta 900

ggcttgtggt ccacattaca ggtgtaggtc tgtgtgccga agttggagct aggaacggtg 960

accacgctac tcagagaata caggccagag ctctgcagca cggctgggaa ggtgtgcacg 1020

ccgcttgtca gggcgccgct gttccagctc actgtcacgg gttcggggaa gtagtctttg 1080

accagacaac ccagggcggc tgtgctttca gatgtgcttc tgctgcatgg ggccagtggg 1140

aacacgctgg gtcccttagt actggcgctg ctgacggtga caagggtgcc ttggccccac 1200

acgtcgaagt accagttagg ggatgagcca aaaaagtatc tggcgcagta gtacacagct 1260

gtgtcctcgc ttctcaggct gctcagttcc atgtacacgg tgcttgtgga ggtatctctg 1320

gtcatggtca ctctatcctt gaagttctct gtgtactcgg tgtggccaga tcctggcagg 1380

atctcgccca tccattccag gccttggcca ggggcctgcc gcacccactg gatccagtag 1440

ttgctgaaga tgtggccgct ggccttgcag gacaccttca cgctagctcc gggctttttc 1500

acttcggctc cgctttgaac cagctgcact tggctgtgca cgcctgtggc ggtggccacc 1560

aggaacagga tgatgcagga ccagcccatg gtggcactag ttcagttcca aaggttggaa 1620

tctaaaagag agaaacaatt agaatcagta gtttaacaca ttatacactt aaaaatttta 1680

tatttacctt agaggattca ctgtcccagg tcagtggtgg tgcctgaagc tgaggagaca 1740

gggccctgtc ctcgtccgta tttaagcagt ggatccagag gggcaacggg ggaggctgct 1800

ggtgaatatt aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccact 1860

ggctgggatc tgagtcgccc gcctacgctg cccggacgct ttgcctgggc agtgtacagc 1920

ttccactgca cttaccgaaa ggagtcattc ccctctcaca ctacctaaac cacgccagga 1980

caacctctgc tcctctccac cgaaattcca aggggtcgag tggatgttgg aggtggcatg 2040

ggcccagaga ggtctctgac ctctgcccca gctccaaggt cagcaggcag ggagggctgt 2100

gtgtttgctg tttgctgctt gcaatgtttg cccattttag ggccgcggca cgtgcttaag 2160

gccccctttt gcatccagtt tattcctaca tttgtcacac tgttaacagc ccaccccttc 2220

caatgagacc agtggtatca gtgagttgtg gagatcagga aaagggctca agagaaaggc 2280

agtcaaagcc ctttttctgt ccctgtccca gctgctttaa taagatctcc ataagagaag 2340

agggacagct atgactggga gtagtcagga gaggaggaaa aatctggcta gtaaaacatg 2400

taaggaaaat tttagggatg ttaaagaaaa aaataacaca aaacaaaata taaaaaaaat 2460

ctaacctcaa gtcaaggctt ttctatggaa taaggaatgg acagcagggg gctgtttcat 2520

atactgatga cctctttata gccaaccttt gttcatggca gccagcatat gggcatatgt 2580

tgccaaactc taaaccaaat actcattctg atgttttaaa tgatttgccc tcccatatgt 2640

ccttccgagt gagagacaca aaaaattcca acacactatt gcaatgaaaa taaatttcct 2700

ttattagcca gaagtcagat gctcaagggg cttcatgatg tccccataat ttttggcaga 2760

gggaaaaaga tctccggagg gggaggctgc tggtgaatat taaccaaggt caccccagtt 2820

atcggaggag caaacagggg ctaagtccac ctcgagccat ggcgatgctc taatctctct 2880

agacaaggtt catatttgta tgggttactt attctctctt tgttgactaa gtcaataatc 2940

agaatcagca ggtttgcagt cagattggca gggataagca gcctagctca ggagaagtga 3000

gtataaaagc cccaggctgg gagcagccat cagctagcgc cggcaagagg taagggttta 3060

agggatggtt ggttggtggg gtattaatgt ttaattacct ggagcacctg cctgaaatca 3120

ctttttttca ggttggaccg gtgccaccat ggacatgagg gtccctgctc agctgctggg 3180

gctcctgctg ctctggctca gcggtgccag atgtgatatc cagatgaccc agtctccatc 3240

tagcctgtcc gccagcgtgg gcgacagagt gaccatcacc tgcggcgcca gcgagaacat 3300

ctatggcgct ctgaactggt accagcagaa acctggcaag gcccctaagc tgctgatcta 3360

cggcgccacc aacctggccg atggcgtgcc tagtagattc agcggatctg gcagcggcac 3420

agacttcacc ctgaccatca gcagcctgca acctgaggac tttgccacat actactgcca 3480

gaacgtgctg aatacacctc tgacattcgg ccaaggaacc aaagtggaaa tcaagcggac 3540

cgtggccgct cctagcgtgt tcatcttccc tccttccgat gaacaactga agagcggaac 3600

cgcctctgtg gtgtgcctgc tgaacaactt ctaccctaga gaggccaagg tgcagtggaa 3660

ggtcgacaac gccctgcaga gcggcaacag ccaggagagc gtgacggaac aggacagcaa 3720

ggacagcacc tacagcctga gctccaccct tacactgtct aaagccgact acgagaagca 3780

caaggtgtac gcctgtgaag tgacacacca gggcctgagc agccctgtga ccaagtcttt 3840

taaccggggc gagtgctgaa ttcgaatcgt acctagggat ccagacatga taagatacat 3900

tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat 3960

ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa 4020

caattgcatt cattttatgt ttcaggttca gggggaggtg tgggaggttt tttaa 4075

<210> 72

<211> 2211

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 72

atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60

gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120

aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180

aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240

cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300

caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360

gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420

ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480

aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540

tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600

cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660

gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720

accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780

tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840

tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900

ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960

caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020

acggtccagg tcttcgcgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080

gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140

acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200

ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260

cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320

gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380

ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440

ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500

tttgcttggc ctagagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560

ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620

ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680

accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740

gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800

atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860

aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920

aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980

gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040

gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100

tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160

tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211

<210> 73

<211> 4093

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 73

atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60

ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120

tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180

cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240

caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300

aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360

taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420

gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480

acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540

aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600

gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660

tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720

cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780

tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840

cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900

attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960

acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020

accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080

aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140

aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200

gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260

aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320

ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380

gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440

gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500

gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560

gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620

aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680

ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740

tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800

ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860

caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920

caaccttagt gaaggaattc gcgagtggtg ggctttgaaa cctggagccc ctcaacccaa 1980

ggcaaatcaa caacatcaag acaacgctcg aggtcttgtg cttccgggtt acaaatacct 2040

tggacccggc aacggactcg acaaggggga gccggtcaac gcagcagacg cggcggccct 2100

cgagcacgac aaggcctacg accagcagct caaggccgga gacaacccgt acctcaagta 2160

caaccacgcc gacgccgagt tccaggagcg gctcaaagaa gatacgtctt ttgggggcaa 2220

cctcgggcga gcagtcttcc aggccaaaaa gaggcttctt gaacctcttg gtctggttga 2280

ggaagcggct aagacggctc ctggaaagaa gaggcctgta gagcagtctc ctcaggaacc 2340

ggactcctcc gcgggtattg gcaaatcggg tgcacagccc gctaaaaaga gactcaattt 2400

cggtcagact ggcgacacag agtcagtccc agaccctcaa ccaatcggag aacctcccgc 2460

agccccctca ggtgtgggat ctcttacaat ggcttcaggt ggtggcgcac cagtggcaga 2520

caataacgaa ggtgccgatg gagtgggtag ttcctcggga aattggcatt gcgattccca 2580

atggctgggg gacagagtca tcaccaccag cacccgaacc tgggccctgc ccacctacaa 2640

caatcacctc tacaagcaaa tctccaacag cacatctgga ggatcttcaa atgacaacgc 2700

ctacttcggc tacagcaccc cctgggggta ttttgacttc aacagattcc actgccactt 2760

ctcaccacgt gactggcagc gactcatcaa caacaactgg ggattccggc ctaagcgact 2820

caacttcaag ctcttcaaca ttcaggtcaa agaggttacg gacaacaatg gagtcaagac 2880

catcgccaat aaccttacca gcacggtcca ggtcttcgcg gactcagact atcagctccc 2940

gtacgtgctc gggtcggctc acgagggctg cctcccgccg ttcccagcgg acgttttcat 3000

gattcctcag tacgggtatc tgacgcttaa tgatggaagc caggccgtgg gtcgttcgtc 3060

cttttactgc ctggaatatt tcccgtcgca aatgctaaga acgggtaaca acttccagtt 3120

cagctacgag tttgagaacg tacctttcca tagcagctac gctcacagcc aaagcctgga 3180

ccgactaatg aatccactca tcgaccaata cttgtactat ctctcaaaga ctattaacgg 3240

ttctggacag aatcaacaaa cgctaaaatt cagtgtggcc ggacccagca acatggctgt 3300

ccagggaaga aactacatac ctggacccag ctaccgacaa caacgtgtct caaccactgt 3360

gactcaaaac aacaacagcg aatttgcttg gcctagagct tcttcttggg ctctcaatgg 3420

acgtaatagc ttgatgaatc ctggacctgc tatggccagc cacaaagaag gagaggaccg 3480

tttctttcct ttgtctggat ctttaatttt tggcaaacaa ggaactggaa gagacaacgt 3540

ggatgcggac aaagtcatga taaccaacga agaagaaatt aaaactacta acccggtagc 3600

aacggagtcc tatggacaag tggccacaaa ccaccagagt gcccaagcac aggcgcagac 3660

cggctgggtt caaaaccaag gaatacttcc gggtatggtt tggcaggaca gagatgtgta 3720

cctgcaagga cccatttggg ccaaaattcc tcacacggac ggcaactttc acccttctcc 3780

gctgatggga gggtttggaa tgaagcaccc gcctcctcag atcctcatca aaaacacacc 3840

tgtacctgcg gatcctccaa cggccttcaa caaggacaag ctgaactctt tcatcaccca 3900

gtattctact ggccaagtca gcgtggagat cgagtgggag ctgcagaagg aaaacagcaa 3960

gcgctggaac ccggagatcc agtacacttc caactattac aagtctaata atgttgaatt 4020

tgctgttaat actgaaggtg tatatagtga accccgcccc attggcacca gatacctgac 4080

tcgtaatctg taa 4093

<210> 74

<211> 1353

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 74

tccaccgctg tgctggagaa ccctgggctg gggaggaaac tgtcagactt cgggcaggag 60

acttcataca ttgaggataa ctgtaaccag aatggcgcca tctctctgat cttcagcctg 120

aaggaggaag tgggcgccct ggcaaaggtg ctgcgcctgt ttgaggagaa cgacgtgaat 180

ctgacccaca tcgagtcccg gccttctaga ctgaagaagg acgagtacga gttctttacc 240

cacctggata agcggtccct gccagccctg acaaacatca tcaagatcct gaggcacgac 300

atcggagcaa ccgtgcacga gctgtctcgg gacaagaaga aggataccgt gccctggttc 360

cctcggacaa tccaggagct ggatagattt gccaaccaga tcctgtctta cggagcagag 420

ctggacgcag atcaccctgg cttcaaggac ccagtgtatc gggcccggag aaagcagttt 480

gccgatatcg cctacaatta taggcacgga cagccaatcc ctcgcgtgga gtatatggag 540

gaggagaaga agacctgggg cacagtgttc aagaccctga agagcctgta caagacacac 600

gcctgctacg agtataacca catcttcccc ctgctggaga agtattgtgg ctttcacgag 660

gacaatatcc ctcagctgga ggacgtgagc cagttcctgc agacctgcac aggctttagg 720

ctgaggccag tggcaggact gctgagctcc cgggacttcc tgggaggact ggccttcaga 780

gtgtttcact gcacccagta catcaggcac ggctccaagc caatgtatac accagagccc 840

gacatctgtc acgagctgct gggccacgtg cccctgttta gcgatagatc cttcgcccag 900

ttttcccagg agatcggact ggcatctctg ggagcacctg acgagtacat cgagaagctg 960

gccaccatct attggttcac agtggagttt ggcctgtgca agcagggcga tagcatcaag 1020

gcctacggag caggactgct gtctagcttc ggcgagctgc agtattgtct gtccgagaag 1080

ccaaagctgc tgcccctgga gctggagaag accgccatcc agaactacac cgtgacagag 1140

ttccagcccc tgtactatgt ggccgagtct tttaacgatg ccaaggagaa ggtgagaaat 1200

ttcgccgcca caatccctag gcccttcagc gtgcggtacg acccttatac ccagaggatc 1260

gaggtgctgg ataatacaca gcagctgaag atcctggctg actcaatcaa tagcgaaatc 1320

ggaatcctgt gctccgccct gcagaaaatc aaa 1353

<210> 75

<211> 3939

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 75

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180

ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240

caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300

cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360

agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420

cagctggggg taaggggggc ggattattca tataattgtt ataccagacg gtcgcaggct 480

tagtccaatt gcagagaact cgcttcccag gcttctgaga gtcccggaag tgcctaaacc 540

tgtctaatcg acggggcttg ggtggcccgt cgctccctgg cttcttccct ttacccaggg 600

cgggcagcga agtggtgcct cctgcgtccc ccacaccctc cctcagcccc tcccctccgg 660

cccgtcctgg gcaggtgacc tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga 720

caacgcccac gaggggcgtt actgtgcgga gatgcaccac gcaagagaca ccctttgtaa 780

ctctcttctc ctccctagtg cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc 840

tgcctgtacc tgaggcccta aaaagccaga gacctcactc ccggggagcc agcatgtcca 900

ctgcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 960

acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatctgaaga 1020

ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 1080

gagaatatcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 1140

atctgtcctc ggtggctttc acaggaaaag cttctgacct cttctcttcc tcccacaggg 1200

cggtaccaga tctggcagcg gagagggcag aggaagtctt ctaacatgcg gtgacgtgga 1260

ggagaatccc ggcccttcca ccgctgtgct ggagaaccct gggctgggga ggaaactgtc 1320

agacttcggg caggagactt catacattga ggataactgt aaccagaatg gcgccatctc 1380

tctgatcttc agcctgaagg aggaagtggg cgccctggca aaggtgctgc gcctgtttga 1440

ggagaacgac gtgaatctga cccacatcga gtcccggcct tctagactga agaaggacga 1500

gtacgagttc tttacccacc tggataagcg gtccctgcca gccctgacaa acatcatcaa 1560

gatcctgagg cacgacatcg gagcaaccgt gcacgagctg tctcgggaca agaagaagga 1620

taccgtgccc tggttccctc ggacaatcca ggagctggat agatttgcca accagatcct 1680

gtcttacgga gcagagctgg acgcagatca ccctggcttc aaggacccag tgtatcgggc 1740

ccggagaaag cagtttgccg atatcgccta caattatagg cacggacagc caatccctcg 1800

cgtggagtat atggaggagg agaagaagac ctggggcaca gtgttcaaga ccctgaagag 1860

cctgtacaag acacacgcct gctacgagta taaccacatc ttccccctgc tggagaagta 1920

ttgtggcttt cacgaggaca atatccctca gctggaggac gtgagccagt tcctgcagac 1980

ctgcacaggc tttaggctga ggccagtggc aggactgctg agctcccggg acttcctggg 2040

aggactggcc ttcagagtgt ttcactgcac ccagtacatc aggcacggct ccaagccaat 2100

gtatacacca gagcccgaca tctgtcacga gctgctgggc cacgtgcccc tgtttagcga 2160

tagatccttc gcccagtttt cccaggagat cggactggca tctctgggag cacctgacga 2220

gtacatcgag aagctggcca ccatctattg gttcacagtg gagtttggcc tgtgcaagca 2280

gggcgatagc atcaaggcct acggagcagg actgctgtct agcttcggcg agctgcagta 2340

ttgtctgtcc gagaagccaa agctgctgcc cctggagctg gagaagaccg ccatccagaa 2400

ctacaccgtg acagagttcc agcccctgta ctatgtggcc gagtctttta acgatgccaa 2460

ggagaaggtg agaaatttcg ccgccacaat ccctaggccc ttcagcgtgc ggtacgaccc 2520

ttatacccag aggatcgagg tgctggataa tacacagcag ctgaagatcc tggctgactc 2580

aatcaatagc gaaatcggaa tcctgtgctc cgccctgcag aaaatcaaat gagatccaga 2640

catgataaga tacattgatg agtttggaca aaccacaact agaatgcagt gaaaaaaatg 2700

ctttatttgt gaaatttgtg atgctattgc tttatttgta accattataa gctgcaataa 2760

acaagttaac aacaacaatt gcattcattt tatgtttcag gttcaggggg aggtgtggga 2820

ggttttttaa ctgggatggg atgtggaatc cttctagatt tcttttgtaa tatttataaa 2880

gtgctctcag caaggtatca aaatggcaaa attgtgagta actatcctcc tttcattttg 2940

ggaagaagat gaggcatgaa gagaattcag acagaaactt actcagacca ggggaggcag 3000

aaactaagca gagaggaaaa tgaccaagag ttagccctgg gcatggaatg tgaaagaacc 3060

ctaaacgtga cttggaaata atgcccaagg tatattccat tctccgggat ttgttggcat 3120

tttcttgagg tgaagaattg cagaatacat tctttaatgt gacctacata tttacccatg 3180

ggaggaagtc tgctcctgga ctcttgagat tcagtcataa agcccaggcc agggaaataa 3240

tgtaagtctg caggcccctg tcatcagtag gattagggag aagagttctc agtagaaaac 3300

agggaggctg gagagaaaag aatggttaat gttaacgtta atataactag aaagactgca 3360

gaacttagga ctgattttta tttgaatcct taaaaaaaaa atttcttatg aaaatagtac 3420

atggctctta ggagacagaa cttattgtac agaggaacag cgtgagagtc agagtgatcc 3480

cagaacaggt cctggctcca tcctgcacat agttttggtg ctgctggcaa tacggtcccc 3540

acaactgtgg gaaggggtta ggggcaggga tctcatcagg aaagcatagg ggtttaaagt 3600

tctttataga gcacttagaa gattgagaat ccacaaatta tattaataac aaacaaagta 3660

gtgtcgtgtt atatagtaaa tgtgaatttg cagacacatt tagggaaaag ttataattaa 3720

aaaaataggc tgtatatata cctgcaggtc tagatacgta gataagtagc atggcgggtt 3780

aatcattaac tacaaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 3840

ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc 3900

ctcagtgagc gagcgagcgc gcagagaggg agtggccaa 3939

<210> 76

<211> 2211

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 76

atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60

gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120

aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgat 180

aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240

cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300

caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360

gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420

ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480

aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540

tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600

cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660

gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720

accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780

tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840

tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900

ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960

caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020

acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080

gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140

acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200

ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260

cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320

gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380

ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440

ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500

tttgcttggc ctagagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560

ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620

ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680

accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740

gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800

atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860

aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920

aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980

gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040

gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100

tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160

tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211

<210> 77

<211> 4093

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 77

atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60

ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120

tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180

cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240

caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300

aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360

taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420

gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480

acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540

aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600

gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660

tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720

cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780

tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840

cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900

attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960

acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020

accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080

aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140

aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200

gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260

aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320

ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380

gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440

gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500

gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560

gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620

aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680

ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740

tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800

ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860

caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920

caaccttagt gaaggaattc gcgagtggtg ggctttgaaa cctggagccc ctcaacccaa 1980

ggcaaatcaa caacatcaag acaacgctcg aggtcttgtg cttccgggtt acaaatacct 2040

tggacccggc aacggactcg ataaggggga gccggtcaac gcagcagacg cggcggccct 2100

cgagcacgac aaggcctacg accagcagct caaggccgga gacaacccgt acctcaagta 2160

caaccacgcc gacgccgagt tccaggagcg gctcaaagaa gatacgtctt ttgggggcaa 2220

cctcgggcga gcagtcttcc aggccaaaaa gaggcttctt gaacctcttg gtctggttga 2280

ggaagcggct aagacggctc ctggaaagaa gaggcctgta gagcagtctc ctcaggaacc 2340

ggactcctcc gcgggtattg gcaaatcggg tgcacagccc gctaaaaaga gactcaattt 2400

cggtcagact ggcgacacag agtcagtccc agaccctcaa ccaatcggag aacctcccgc 2460

agccccctca ggtgtgggat ctcttacaat ggcttcaggt ggtggcgcac cagtggcaga 2520

caataacgaa ggtgccgatg gagtgggtag ttcctcggga aattggcatt gcgattccca 2580

atggctgggg gacagagtca tcaccaccag cacccgaacc tgggccctgc ccacctacaa 2640

caatcacctc tacaagcaaa tctccaacag cacatctgga ggatcttcaa atgacaacgc 2700

ctacttcggc tacagcaccc cctgggggta ttttgacttc aacagattcc actgccactt 2760

ctcaccacgt gactggcagc gactcatcaa caacaactgg ggattccggc ctaagcgact 2820

caacttcaag ctcttcaaca ttcaggtcaa agaggttacg gacaacaatg gagtcaagac 2880

catcgccaat aaccttacca gcacggtcca ggtcttcacg gactcagact atcagctccc 2940

gtacgtgctc gggtcggctc acgagggctg cctcccgccg ttcccagcgg acgttttcat 3000

gattcctcag tacgggtatc tgacgcttaa tgatggaagc caggccgtgg gtcgttcgtc 3060

cttttactgc ctggaatatt tcccgtcgca aatgctaaga acgggtaaca acttccagtt 3120

cagctacgag tttgagaacg tacctttcca tagcagctac gctcacagcc aaagcctgga 3180

ccgactaatg aatccactca tcgaccaata cttgtactat ctctcaaaga ctattaacgg 3240

ttctggacag aatcaacaaa cgctaaaatt cagtgtggcc ggacccagca acatggctgt 3300

ccagggaaga aactacatac ctggacccag ctaccgacaa caacgtgtct caaccactgt 3360

gactcaaaac aacaacagcg aatttgcttg gcctagagct tcttcttggg ctctcaatgg 3420

acgtaatagc ttgatgaatc ctggacctgc tatggccagc cacaaagaag gagaggaccg 3480

tttctttcct ttgtctggat ctttaatttt tggcaaacaa ggaactggaa gagacaacgt 3540

ggatgcggac aaagtcatga taaccaacga agaagaaatt aaaactacta acccggtagc 3600

aacggagtcc tatggacaag tggccacaaa ccaccagagt gcccaagcac aggcgcagac 3660

cggctgggtt caaaaccaag gaatacttcc gggtatggtt tggcaggaca gagatgtgta 3720

cctgcaagga cccatttggg ccaaaattcc tcacacggac ggcaactttc acccttctcc 3780

gctgatggga gggtttggaa tgaagcaccc gcctcctcag atcctcatca aaaacacacc 3840

tgtacctgcg gatcctccaa cggccttcaa caaggacaag ctgaactctt tcatcaccca 3900

gtattctact ggccaagtca gcgtggagat cgagtgggag ctgcagaagg aaaacagcaa 3960

gcgctggaac ccggagatcc agtacacttc caactattac aagtctaata atgttgaatt 4020

tgctgttaat actgaaggtg tatatagtga accccgcccc attggcacca gatacctgac 4080

tcgtaatctg taa 4093

<210> 78

<211> 2356

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 78

ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggaatt cacgcgtgga 120

tctgaattca attcacgcgt ggtacctccc taaaatgggc aaacattgca agcagcaaac 180

agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg tcagagacct 240

ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg tggagaggag 300

cagaggttgt cctggcgtgg tttaggtagt gtgagagggg aatgactcct ttcggtaagt 360

gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag 420

atcccagcca gtggacttag cccctgtttg ctcctccgat aactggggtg accttggtta 480

atattcacca gcagcctccc ccgttgcccc tctggatcca ctgcttaaat acggacgagg 540

acagggccct gtctcctcag cttcaggcac caccactgac ctgggacagt gaatcctcta 600

aggtaaatat aaaattttta agtgtataat gtgttaaact actgattcta attgtttctc 660

tcttttagat tccaaccttt ggaactgacc gccaccatgt ccaccgctgt gctggagaac 720

cctgggctgg ggaggaaact gtcagacttc gggcaggaga cttcatacat tgaggataac 780

tgtaaccaga atggcgccat ctctctgatc ttcagcctga aggaggaagt gggcgccctg 840

gcaaaggtgc tgcgcctgtt tgaggagaac gacgtgaatc tgacccacat cgagtcccgg 900

ccttctagac tgaagaagga cgagtacgag ttctttaccc acctggataa gcggtccctg 960

ccagccctga caaacatcat caagatcctg aggcacgaca tcggagcaac cgtgcacgag 1020

ctgtctcggg acaagaagaa ggataccgtg ccctggttcc ctcggacaat ccaggagctg 1080

gatagatttg ccaaccagat cctgtcttac ggagcagagc tggacgcaga tcaccctggc 1140

ttcaaggacc cagtgtatcg ggcccggaga aagcagtttg ccgatatcgc ctacaattat 1200

aggcacggac agccaatccc tcgcgtggag tatatggagg aggagaagaa gacctggggc 1260

acagtgttca agaccctgaa gagcctgtac aagacacacg cctgctacga gtataaccac 1320

atcttccccc tgctggagaa gtattgtggc tttcacgagg acaatatccc tcagctggag 1380

gacgtgagcc agttcctgca gacctgcaca ggctttaggc tgaggccagt ggcaggactg 1440

ctgagctccc gggacttcct gggaggactg gccttcagag tgtttcactg cacccagtac 1500

atcaggcacg gctccaagcc aatgtataca ccagagcccg acatctgtca cgagctgctg 1560

ggccacgtgc ccctgtttag cgatagatcc ttcgcccagt tttcccagga gatcggactg 1620

gcatctctgg gagcacctga cgagtacatc gagaagctgg ccaccatcta ttggttcaca 1680

gtggagtttg gcctgtgcaa gcagggcgat agcatcaagg cctacggagc aggactgctg 1740

tctagcttcg gcgagctgca gtattgtctg tccgagaagc caaagctgct gcccctggag 1800

ctggagaaga ccgccatcca gaactacacc gtgacagagt tccagcccct gtactatgtg 1860

gccgagtctt ttaacgatgc caaggagaag gtgagaaatt tcgccgccac aatccctagg 1920

cccttcagcg tgcggtacga cccttatacc cagaggatcg aggtgctgga taatacacag 1980

cagctgaaga tcctggctga ctcaatcaat agcgaaatcg gaatcctgtg ctccgccctg 2040

cagaaaatca aatgaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac 2100

cattataagc tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt 2160

tcagggggag gtgtgggagg ttttttaaag catgctgggg agagatcgat ctgaggaacc 2220

cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 2280

accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg 2340

cagagaggga gtggcc 2356

<210> 79

<211> 1359

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 79

atgtccaccg ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag 60

gagacttcat acattgagga taactgtaac cagaatggcg ccatctctct gatcttcagc 120

ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg 180

aatctgaccc acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt 240

acccacctgg ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgaggcac 300

gacatcggag caaccgtgca cgagctgtct cgggacaaga agaaggatac cgtgccctgg 360

ttccctcgga caatccagga gctggataga tttgccaacc agatcctgtc ttacggagca 420

gagctggacg cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag 480

tttgccgata tcgcctacaa ttataggcac ggacagccaa tccctcgcgt ggagtatatg 540

gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca 600

cacgcctgct acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac 660

gaggacaata tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt 720

aggctgaggc cagtggcagg actgctgagc tcccgggact tcctgggagg actggccttc 780

agagtgtttc actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag 840

cccgacatct gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc 900

cagttttccc aggagatcgg actggcatct ctgggagcac ctgacgagta catcgagaag 960

ctggccacca tctattggtt cacagtggag tttggcctgt gcaagcaggg cgatagcatc 1020

aaggcctacg gagcaggact gctgtctagc ttcggcgagc tgcagtattg tctgtccgag 1080

aagccaaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgaca 1140

gagttccagc ccctgtacta tgtggccgag tcttttaacg atgccaagga gaaggtgaga 1200

aatttcgccg ccacaatccc taggcccttc agtgtgcgtt acgaccctta tacccagagg 1260

atcgaggtgc tggataatac acagcagctg aagatcctgg ctgactcaat caatagcgaa 1320

atcggaatcc tgtgctccgc cctgcagaaa atcaaatga 1359

<210> 80

<211> 4452

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 80

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180

ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240

caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300

cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360

agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420

cagctggggg taaggggggc ggattattca tataattgtt ataccagacg gtcgcaggct 480

tagtccaatt gcagagaact cgcttcccag gcttctgaga gtcccggaag tgcctaaacc 540

tgtctaatcg acggggcttg ggtggcccgt cgctccctgg cttcttccct ttacccaggg 600

cgggcagcga agtggtgcct cctgcgtccc ccacaccctc cctcagcccc tcccctccgg 660

cccgtcctgg gcaggtgacc tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga 720

caacgcccac gaggggcgtt actgtgcgga gatgcaccac gcaagagaca ccctttgtaa 780

ctctcttctc ctccctagtg cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc 840

tgcctgtacc tgaggcccta aaaagccaga gacctcactc ccggggagcc agcatgtcca 900

ctgcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 960

acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatctgaaga 1020

ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 1080

gagaatatcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 1140

atctgtcctc ggtggctttc acaggaaccc taaaatgggc aaacattgca agcagcaaac 1200

agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg tcagagacct 1260

ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg tggagaggag 1320

cagaggttgt cctggcgtgg tttaggtagt gtgagagggg aatgactcct ttcggtaagt 1380

gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag 1440

atcccagcca gtggacttag cccctgtttg ctcctccgat aactggggtg accttggtta 1500

atattcacca gcagcctccc ccgttgcccc tctggatcca ctgcttaaat acggacgagg 1560

acagggccct gtctcctcag cttcaggcac caccactgac ctgggacagt gaatcctcta 1620

aggtaaatat aaaattttta agtgtataat gtgttaaact actgattcta attgtttctc 1680

tcttttagat tccaaccttt ggaactgacc gccaccatgt ccaccgctgt gctggagaac 1740

cctgggctgg ggaggaaact gtcagacttc gggcaggaga cttcatacat tgaggataac 1800

tgtaaccaga atggcgccat ctctctgatc ttcagcctga aggaggaagt gggcgccctg 1860

gcaaaggtgc tgcgcctgtt tgaggagaac gacgtgaatc tgacccacat cgagtcccgg 1920

ccttctagac tgaagaagga cgagtacgag ttctttaccc acctggataa gcggtccctg 1980

ccagccctga caaacatcat caagatcctg aggcacgaca tcggagcaac cgtgcacgag 2040

ctgtctcggg acaagaagaa ggataccgtg ccctggttcc ctcggacaat ccaggagctg 2100

gatagatttg ccaaccagat cctgtcttac ggagcagagc tggacgcaga tcaccctggc 2160

ttcaaggacc cagtgtatcg ggcccggaga aagcagtttg ccgatatcgc ctacaattat 2220

aggcacggac agccaatccc tcgcgtggag tatatggagg aggagaagaa gacctggggc 2280

acagtgttca agaccctgaa gagcctgtac aagacacacg cctgctacga gtataaccac 2340

atcttccccc tgctggagaa gtattgtggc tttcacgagg acaatatccc tcagctggag 2400

gacgtgagcc agttcctgca gacctgcaca ggctttaggc tgaggccagt ggcaggactg 2460

ctgagctccc gggacttcct gggaggactg gccttcagag tgtttcactg cacccagtac 2520

atcaggcacg gctccaagcc aatgtataca ccagagcccg acatctgtca cgagctgctg 2580

ggccacgtgc ccctgtttag cgatagatcc ttcgcccagt tttcccagga gatcggactg 2640

gcatctctgg gagcacctga cgagtacatc gagaagctgg ccaccatcta ttggttcaca 2700

gtggagtttg gcctgtgcaa gcagggcgat agcatcaagg cctacggagc aggactgctg 2760

tctagcttcg gcgagctgca gtattgtctg tccgagaagc caaagctgct gcccctggag 2820

ctggagaaga ccgccatcca gaactacacc gtgacagagt tccagcccct gtactatgtg 2880

gccgagtctt ttaacgatgc caaggagaag gtgagaaatt tcgccgccac aatccctagg 2940

cccttcagtg tgcgttacga cccttatacc cagaggatcg aggtgctgga taatacacag 3000

cagctgaaga tcctggctga ctcaatcaat agcgaaatcg gaatcctgtg ctccgccctg 3060

cagaaaatca aatgagaatt caaggcctct cgagcctcta gaactatagt gagtcgtatt 3120

acgtagatcc agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc 3180

agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta 3240

taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg 3300

gggaggtgtg ggaggttttt taagctttac gtacgatcgt cgactgggat gggatgtgga 3360

atccttctag atttcttttg taatatttat aaagtgctct cagcaaggta tcaaaatggc 3420

aaaattgtga gtaactatcc tcctttcatt ttgggaagaa gatgaggcat gaagagaatt 3480

cagacagaaa cttactcaga ccaggggagg cagaaactaa gcagagagga aaatgaccaa 3540

gagttagccc tgggcatgga atgtgaaaga accctaaacg tgacttggaa ataatgccca 3600

aggtatattc cattctccgg gatttgttgg cattttcttg aggtgaagaa ttgcagaata 3660

cattctttaa tgtgacctac atatttaccc atgggaggaa gtctgctcct ggactcttga 3720

gattcagtca taaagcccag gccagggaaa taatgtaagt ctgcaggccc ctgtcatcag 3780

taggattagg gagaagagtt ctcagtagaa aacagggagg ctggagagaa aagaatggtt 3840

aatgttaacg ttaatataac tagaaagact gcagaactta ggactgattt ttatttgaat 3900

ccttaaaaaa aaaatttctt atgaaaatag tacatggctc ttaggagaca gaacttattg 3960

tacagaggaa cagcgtgaga gtcagagtga tcccagaaca ggtcctggct ccatcctgca 4020

catagttttg gtgctgctgg caatacggtc cccacaactg tgggaagggg ttaggggcag 4080

ggatctcatc aggaaagcat aggggtttaa agttctttat agagcactta gaagattgag 4140

aatccacaaa ttatattaat aacaaacaaa gtagtgtcgt gttatatagt aaatgtgaat 4200

ttgcagacac atttagggaa aagttataat taaaaaaata ggctgtatat atacctgcag 4260

gtctagatac gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt 4320

gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa 4380

ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga 4440

gggagtggcc aa 4452

<210> 81

<211> 1735

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 81

atgcccccac ccaggaccgg aagaggcctg ctgtggctgg gcctggtgct ctcttccgtg 60

tgcgtggccc tgggaagcga aacccaggcc aacagcacaa ccgacgccct gaatgtgctg 120

ctgatcattg tggacgatct gagaccctcc ctgggctgtt acggcgacaa actggtgcgg 180

tccccaaaca tcgaccagct ggcctcccac tccctgctgt tccagaacgc cttcgcccag 240

caggccgtgt gtgcccccag cagggtgagc ttcctgaccg gcagaagacc tgacaccacc 300

aggctgtacg actttaacag ctactggcgg gtgcacgccg gcaatttcag caccattcct 360

cagtacttca aggagaatgg ctacgtgaca atgtccgtgg gcaaggtgtt tcatcccggc 420

attagctcca accacaccga cgatagccca tactcctggt ccttcccccc ctaccatccc 480

tccagcgaga agtacgagaa caccaaaacc tgcagaggcc ctgacggaga gctgcacgcc 540

aacctgctgt gccctgtgga tgtcctggat gtgcccgaag gtaagggttt aagggatggt 600

tggttggtgg ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc 660

aggcaccctg ccagacaagc agtccacaga gcaggccatc cagctgctgg agaagatgaa 720

gacaagcgcc agccccttct ttctggccgt gggataccac aagcctcaca ttccattccg 780

gtacccaaaa gagttccaga agctgtaccc tctggaaaac atcaccctgg cccctgaccc 840

cgaggtgcca gacgggctgc ctcctgtggc ctacaatccc tggatggaca tcagacagcg 900

ggaggatgtg caggccctga atatttccgt gccctatggg cccatccctg tggactttca 960

gcggaaaatc agacagtctt actttgccag cgtgtcctac ctggacaccc aggtgggccg 1020

cctgctctca gccctggacg acctgcagct ggccaattcc accatcatcg ccttcaccag 1080

cgatcacggc tgggccctgg gcgagcacgg ggagtgggcc aaatacagca acttcgatgt 1140

ggccacccac gtgcctctga ttttttatgt gcccggccgg acagccagcc tgcccgaggc 1200

cggggagaag ctctttcctt acctggaccc tttcgactct gccagccagc tgatggaacc 1260

tggcagacag agcatggacc tggtggagct ggtgagcctc ttccccactc tggccggcct 1320

ggctggcctg caggtgccac caagatgccc agtgccttct ttccacgtgg agctgtgtag 1380

agagggaaag aacctgctga agcacttcag atttagagat ctggaggagg atccctacct 1440

gccaggcaac ccaagggagc tgatcgccta cagccagtat cccagaccct ctgatatccc 1500

ccagtggaac agcgataagc cctccctgaa agacatcaag attatgggct actccatcag 1560

gaccattgac taccggtaca cagtgtgggt gggcttcaac cccgatgagt ttctggccaa 1620

cttcagcgac atccacgccg gcgagctgta ttttgtggac tccgaccccc tgcaggacca 1680

caacatgtac aacgactccc agggcggcga cctgttccag ctgctgatgc cctga 1735

<210> 82

<211> 2521

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 82

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180

ggttagggag gtcctgcata tgcggccgca actcacgggg atttccaagt ctccacccca 240

ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta 300

ataaccccgc cccgttgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa 360

gcagagctcg tttagtgaac cgtgccacca tgcccccacc caggaccgga agaggcctgc 420

tgtggctggg cctggtgctc tcttccgtgt gcgtggccct gggaagcgaa acccaggcca 480

acagcacaac cgacgccctg aatgtgctgc tgatcattgt ggacgatctg agaccctccc 540

tgggctgtta cggcgacaaa ctggtgcggt ccccaaacat cgaccagctg gcctcccact 600

ccctgctgtt ccagaacgcc ttcgcccagc aggccgtgtg tgcccccagc agggtgagct 660

tcctgaccgg cagaagacct gacaccacca ggctgtacga ctttaacagc tactggcggg 720

tgcacgccgg caatttcagc accattcctc agtacttcaa ggagaatggc tacgtgacaa 780

tgtccgtggg caaggtgttt catcccggca ttagctccaa ccacaccgac gatagcccat 840

actcctggtc cttccccccc taccatccct ccagcgagaa gtacgagaac accaaaacct 900

gcagaggccc tgacggagag ctgcacgcca acctgctgtg ccctgtggat gtcctggatg 960

tgcccgaagg taagggttta agggatggtt ggttggtggg gtattaatgt ttaattacct 1020

ggagcacctg cctgaaatca ctttttttca ggcaccctgc cagacaagca gtccacagag 1080

caggccatcc agctgctgga gaagatgaag acaagcgcca gccccttctt tctggccgtg 1140

ggataccaca agcctcacat tccattccgg tacccaaaag agttccagaa gctgtaccct 1200

ctggaaaaca tcaccctggc ccctgacccc gaggtgccag acgggctgcc tcctgtggcc 1260

tacaatccct ggatggacat cagacagcgg gaggatgtgc aggccctgaa tatttccgtg 1320

ccctatgggc ccatccctgt ggactttcag cggaaaatca gacagtctta ctttgccagc 1380

gtgtcctacc tggacaccca ggtgggccgc ctgctctcag ccctggacga cctgcagctg 1440

gccaattcca ccatcatcgc cttcaccagc gatcacggct gggccctggg cgagcacggg 1500

gagtgggcca aatacagcaa cttcgatgtg gccacccacg tgcctctgat tttttatgtg 1560

cccggccgga cagccagcct gcccgaggcc ggggagaagc tctttcctta cctggaccct 1620

ttcgactctg ccagccagct gatggaacct ggcagacaga gcatggacct ggtggagctg 1680

gtgagcctct tccccactct ggccggcctg gctggcctgc aggtgccacc aagatgccca 1740

gtgccttctt tccacgtgga gctgtgtaga gagggaaaga acctgctgaa gcacttcaga 1800

tttagagatc tggaggagga tccctacctg ccaggcaacc caagggagct gatcgcctac 1860

agccagtatc ccagaccctc tgatatcccc cagtggaaca gcgataagcc ctccctgaaa 1920

gacatcaaga ttatgggcta ctccatcagg accattgact accggtacac agtgtgggtg 1980

ggcttcaacc ccgatgagtt tctggccaac ttcagcgaca tccacgccgg cgagctgtat 2040

tttgtggact ccgaccccct gcaggaccac aacatgtaca acgactccca gggcggcgac 2100

ctgttccagc tgctgatgcc ctgagatcca gacatgataa gatacattga tgagtttgga 2160

caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt 2220

gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat 2280

tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aacctgcagg tctagatacg 2340

tagataagta gcatggcggg ttaatcatta actacaagga acccctagtg atggagttgg 2400

ccactccctc tctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 2460

gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 2520

a 2521

<210> 83

<211> 3668

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 83

ttttcccaga gacaggctca gggacttctg ggtgtagtgg ctgtgcaggg cttcgtggag 60

cacgctgcag ctaaacacgt tgccctcttg ccatcggctc ttgtccacgg tcagccgtga 120

atacaggaag aagctgccat cgctgtccag cactggaggg gtcgtcttgt agttgttttc 180

aggctgtccg ttgctctccc attcgacggc gatgtcgctg gggtagaagc ccttcaccag 240

gcaggtcaga gacacttggt tctttgtcat ttcttcttga gaaggaggca gtgtatagac 300

ttggggctct ctgggctggc ccttggcctt tgagatggtc ttctcgatgc tgctaggcag 360

gcccttgtta gacaccttgc acttgtactc tttgccgttc agccagtcct ggtgcagcac 420

tgtcagcacg gacaccaccc ggtaggtgct gttaaactgt tcctcgcggg gtttggtctt 480

ggcattatga acttccactc cgtcaacgta ccaattaaac tgcacctcag gatcctcctg 540

ggacacatcc accaccacac atgtcacttc aggggtccgg ctgatcatca gggtgtcttt 600

gggctttggt gggaacagga aaacagaagg gccggcgact ggtggagctg gacatggtgg 660

gcattccacg cagcactttc tctcaacggt cttatccact ttggtgttgc taggcttgtg 720

gtccacatta caggtgtagg tctgtgtgcc gaagttggag ctaggaacgg tgaccacgct 780

actcagagaa tacaggccag agctctgcag cacggctggg aaggtgtgca cgccgcttgt 840

cagggcgccg ctgttccagc tcactgtcac gggttcgggg aagtagtctt tgaccagaca 900

acccagggcg gctgtgcttt cagatgtgct tctgctgcat ggggccagtg ggaacacgct 960

gggtccctta gtactggcgc tgctgacggt gacaagggtg ccttggcccc acacgtcgaa 1020

gtaccagtta ggggatgagc caaaaaagta tctggcgcag tagtacacag ctgtgtcctc 1080

gcttctcagg ctgctcagtt ccatgtacac ggtgcttgtg gaggtatctc tggtcatggt 1140

cactctatcc ttgaagttct ctgtgtactc ggtgtggcca gatcctggca ggatctcgcc 1200

catccattcc aggccttggc caggggcctg ccgcacccac tggatccagt agttgctgaa 1260

gatgtggccg ctggccttgc aggacacctt cacgctagct ccgggctttt tcacttcggc 1320

tccgctttga accagctgca cttggctgtg cacgcctgtg gcggtggcca ccaggaacag 1380

gatgatgcag gaccagccca tggtggcact agttcagttc caaaggttgg aatctaaaag 1440

agagaaacaa ttagaatcag tagtttaaca cattatacac ttaaaaattt tatatttacc 1500

ttagaggatt cactgtccca ggtcagtggt ggtgcctgaa gctgaggaga cagggccctg 1560

tcctcgtccg tatttaagca gtggatccag aggggcaacg ggggaggctg ctggtgaata 1620

ttaaccaagg tcaccccagt tatcggagga gcaaacaggg gctaagtcca ctggctggga 1680

tctgagtcgc ccgcctacgc tgcccggacg ctttgcctgg gcagtgtaca gcttccactg 1740

cacttaccga aaggagtcat tcccctctca cactacctaa accacgccag gacaacctct 1800

gctcctctcc accgaaattc caaggggtcg agtggatgtt ggaggtggca tgggcccaga 1860

gaggtctctg acctctgccc cagctccaag gtcagcaggc agggagggct gtgtgtttgc 1920

tgtttgctgc ttgcaatgtt tgcccatttt agggccgcgg cacgtgctta aggccccctt 1980

ttgcatccag tttattccta catttgtcac actgttaaca gcccacccct tccaatgaga 2040

ccagtggtat cagtgagttg tggagatcag gaaaagggct caagagaaag gcagtcaaag 2100

ccctttttct gtccctgtcc cagctgcttt aataagatct ccataagaga agagggacag 2160

ctatgactgg gagtagtcag gagaggagga aaaatctggc tagtaaaaca tgtaaggaaa 2220

attttaggga tgttaaagaa aaaaataaca caaaacaaaa tataaaaaaa atctaacctc 2280

aagtcaaggc ttttctatgg aataaggaat ggacagcagg gggctgtttc atatactgat 2340

gacctcttta tagccaacct ttgttcatgg cagccagcat atgggcatat gttgccaaac 2400

tctaaaccaa atactcattc tgatgtttta aatgatttgc cctcccatat gtccttccga 2460

gtgagagaca caaaaaattc caacacacta ttgcaatgaa aataaatttc ctttattagc 2520

cagaagtcag atgctcaagg ggcttcatga tgtccccata atttttggca gagggaaaaa 2580

gatctccgga gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg 2640

agcaaacagg ggctaagtcc acctcgagcc atggcgatgc tctaatctct ctagacaagg 2700

ttcatatttg tatgggttac ttattctctc tttgttgact aagtcaataa tcagaatcag 2760

caggtttgca gtcagattgg cagggataag cagcctagct caggagaagt gagtataaaa 2820

gccccaggct gggagcagcc atcagctagc gccggcaaga ggtaagggtt taagggatgg 2880

ttggttggtg gggtattaat gtttaattac ctggagcacc tgcctgaaat cacttttttt 2940

caggttggac cggtgccacc atggacatga gggtccctgc tcagctgctg gggctcctgc 3000

tgctctggct cagcggtgcc agatgtgata tccagatgac ccagtctcca tctagcctgt 3060

ccgccagcgt gggcgacaga gtgaccatca cctgcggcgc cagcgagaac atctatggcg 3120

ctctgaactg gtaccagcag aaacctggca aggcccctaa gctgctgatc tacggcgcca 3180

ccaacctggc cgatggcgtg cctagtagat tcagcggatc tggcagcggc acagacttca 3240

ccctgaccat cagcagcctg caacctgagg actttgccac atactactgc cagaacgtgc 3300

tgaatacacc tctgacattc ggccaaggaa ccaaagtgga aatcaagcgg accgtggccg 3360

ctcctagcgt gttcatcttc cctccttccg atgaacaact gaagagcgga accgcctctg 3420

tggtgtgcct gctgaacaac ttctacccta gagaggccaa ggtgcagtgg aaggtcgaca 3480

acgccctgca gagcggcaac agccaggaga gcgtgacgga acaggacagc aaggacagca 3540

cctacagcct gagctccacc cttacactgt ctaaagccga ctacgagaag cacaaggtgt 3600

acgcctgtga agtgacacac cagggcctga gcagccctgt gaccaagtct tttaaccggg 3660

gcgagtgc 3668

<210> 84

<211> 4483

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 84

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180

ggttagggag gtcctgcaca cgtgacgcgt ccttgctgtc ctgccccacc ccacccccca 240

gaatagaatg acacctactc agacaatgcg atgcaatttc ctcattttat taggaaagga 300

cagtgggagt ggcaccttcc agggtcaagg aaggcacggg ggaggggcaa acaacagatg 360

gctggcaact agaaggcaca gcctcgagga acgttttatt ttcccagaga caggctcagg 420

gacttctggg tgtagtggct gtgcagggct tcgtggagca cgctgcagct aaacacgttg 480

ccctcttgcc atcggctctt gtccacggtc agccgtgaat acaggaagaa gctgccatcg 540

ctgtccagca ctggaggggt cgtcttgtag ttgttttcag gctgtccgtt gctctcccat 600

tcgacggcga tgtcgctggg gtagaagccc ttcaccaggc aggtcagaga cacttggttc 660

tttgtcattt cttcttgaga aggaggcagt gtatagactt ggggctctct gggctggccc 720

ttggcctttg agatggtctt ctcgatgctg ctaggcaggc ccttgttaga caccttgcac 780

ttgtactctt tgccgttcag ccagtcctgg tgcagcactg tcagcacgga caccacccgg 840

taggtgctgt taaactgttc ctcgcggggt ttggtcttgg cattatgaac ttccactccg 900

tcaacgtacc aattaaactg cacctcagga tcctcctggg acacatccac caccacacat 960

gtcacttcag gggtccggct gatcatcagg gtgtctttgg gctttggtgg gaacaggaaa 1020

acagaagggc cggcgactgg tggagctgga catggtgggc attccacgca gcactttctc 1080

tcaacggtct tatccacttt ggtgttgcta ggcttgtggt ccacattaca ggtgtaggtc 1140

tgtgtgccga agttggagct aggaacggtg accacgctac tcagagaata caggccagag 1200

ctctgcagca cggctgggaa ggtgtgcacg ccgcttgtca gggcgccgct gttccagctc 1260

actgtcacgg gttcggggaa gtagtctttg accagacaac ccagggcggc tgtgctttca 1320

gatgtgcttc tgctgcatgg ggccagtggg aacacgctgg gtcccttagt actggcgctg 1380

ctgacggtga caagggtgcc ttggccccac acgtcgaagt accagttagg ggatgagcca 1440

aaaaagtatc tggcgcagta gtacacagct gtgtcctcgc ttctcaggct gctcagttcc 1500

atgtacacgg tgcttgtgga ggtatctctg gtcatggtca ctctatcctt gaagttctct 1560

gtgtactcgg tgtggccaga tcctggcagg atctcgccca tccattccag gccttggcca 1620

ggggcctgcc gcacccactg gatccagtag ttgctgaaga tgtggccgct ggccttgcag 1680

gacaccttca cgctagctcc gggctttttc acttcggctc cgctttgaac cagctgcact 1740

tggctgtgca cgcctgtggc ggtggccacc aggaacagga tgatgcagga ccagcccatg 1800

gtggcactag ttcagttcca aaggttggaa tctaaaagag agaaacaatt agaatcagta 1860

gtttaacaca ttatacactt aaaaatttta tatttacctt agaggattca ctgtcccagg 1920

tcagtggtgg tgcctgaagc tgaggagaca gggccctgtc ctcgtccgta tttaagcagt 1980

ggatccagag gggcaacggg ggaggctgct ggtgaatatt aaccaaggtc accccagtta 2040

tcggaggagc aaacaggggc taagtccact ggctgggatc tgagtcgccc gcctacgctg 2100

cccggacgct ttgcctgggc agtgtacagc ttccactgca cttaccgaaa ggagtcattc 2160

ccctctcaca ctacctaaac cacgccagga caacctctgc tcctctccac cgaaattcca 2220

aggggtcgag tggatgttgg aggtggcatg ggcccagaga ggtctctgac ctctgcccca 2280

gctccaaggt cagcaggcag ggagggctgt gtgtttgctg tttgctgctt gcaatgtttg 2340

cccattttag ggccgcggca cgtgcttaag gccccctttt gcatccagtt tattcctaca 2400

tttgtcacac tgttaacagc ccaccccttc caatgagacc agtggtatca gtgagttgtg 2460

gagatcagga aaagggctca agagaaaggc agtcaaagcc ctttttctgt ccctgtccca 2520

gctgctttaa taagatctcc ataagagaag agggacagct atgactggga gtagtcagga 2580

gaggaggaaa aatctggcta gtaaaacatg taaggaaaat tttagggatg ttaaagaaaa 2640

aaataacaca aaacaaaata taaaaaaaat ctaacctcaa gtcaaggctt ttctatggaa 2700

taaggaatgg acagcagggg gctgtttcat atactgatga cctctttata gccaaccttt 2760

gttcatggca gccagcatat gggcatatgt tgccaaactc taaaccaaat actcattctg 2820

atgttttaaa tgatttgccc tcccatatgt ccttccgagt gagagacaca aaaaattcca 2880

acacactatt gcaatgaaaa taaatttcct ttattagcca gaagtcagat gctcaagggg 2940

cttcatgatg tccccataat ttttggcaga gggaaaaaga tctccggagg gggaggctgc 3000

tggtgaatat taaccaaggt caccccagtt atcggaggag caaacagggg ctaagtccac 3060

ctcgagccat ggcgatgctc taatctctct agacaaggtt catatttgta tgggttactt 3120

attctctctt tgttgactaa gtcaataatc agaatcagca ggtttgcagt cagattggca 3180

gggataagca gcctagctca ggagaagtga gtataaaagc cccaggctgg gagcagccat 3240

cagctagcgc cggcaagagg taagggttta agggatggtt ggttggtggg gtattaatgt 3300

ttaattacct ggagcacctg cctgaaatca ctttttttca ggttggaccg gtgccaccat 3360

ggacatgagg gtccctgctc agctgctggg gctcctgctg ctctggctca gcggtgccag 3420

atgtgatatc cagatgaccc agtctccatc tagcctgtcc gccagcgtgg gcgacagagt 3480

gaccatcacc tgcggcgcca gcgagaacat ctatggcgct ctgaactggt accagcagaa 3540

acctggcaag gcccctaagc tgctgatcta cggcgccacc aacctggccg atggcgtgcc 3600

tagtagattc agcggatctg gcagcggcac agacttcacc ctgaccatca gcagcctgca 3660

acctgaggac tttgccacat actactgcca gaacgtgctg aatacacctc tgacattcgg 3720

ccaaggaacc aaagtggaaa tcaagcggac cgtggccgct cctagcgtgt tcatcttccc 3780

tccttccgat gaacaactga agagcggaac cgcctctgtg gtgtgcctgc tgaacaactt 3840

ctaccctaga gaggccaagg tgcagtggaa ggtcgacaac gccctgcaga gcggcaacag 3900

ccaggagagc gtgacggaac aggacagcaa ggacagcacc tacagcctga gctccaccct 3960

tacactgtct aaagccgact acgagaagca caaggtgtac gcctgtgaag tgacacacca 4020

gggcctgagc agccctgtga ccaagtcttt taaccggggc gagtgctgaa ttcgaatcgt 4080

acctagggat ccagacatga taagatacat tgatgagttt ggacaaacca caactagaat 4140

gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat 4200

tataagctgc aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca 4260

gggggaggtg tgggaggttt tttaagcttg tttaaacgta cgtagataag tagcatggcg 4320

ggttaatcat taactacaag gaacccctag tgatggagtt ggccactccc tctctgcgcg 4380

ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg 4440

cggcctcagt gagcgagcga gcgcgcagag agggagtggc caa 4483

<210> 85

<211> 3533

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 85

gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60

ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120

tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180

caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240

tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300

caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360

cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420

cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480

tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540

ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600

aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660

agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720

gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780

gaatttgggc ctccagagaa agagatctga agactgctgg tgcttcctgg tttcataagc 840

tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900

atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960

aagcttctga cctcttctct tcctcccaca gggcggtacc agatctggca gcggagaggg 1020

cagaggaagt cttctaacat gcggtgacgt ggaggagaat cccggccctt ccaccgctgt 1080

gctggagaac cctgggctgg ggaggaaact gtcagacttc gggcaggaga cttcatacat 1140

tgaggataac tgtaaccaga atggcgccat ctctctgatc ttcagcctga aggaggaagt 1200

gggcgccctg gcaaaggtgc tgcgcctgtt tgaggagaac gacgtgaatc tgacccacat 1260

cgagtcccgg ccttctagac tgaagaagga cgagtacgag ttctttaccc acctggataa 1320

gcggtccctg ccagccctga caaacatcat caagatcctg aggcacgaca tcggagcaac 1380

cgtgcacgag ctgtctcggg acaagaagaa ggataccgtg ccctggttcc ctcggacaat 1440

ccaggagctg gatagatttg ccaaccagat cctgtcttac ggagcagagc tggacgcaga 1500

tcaccctggc ttcaaggacc cagtgtatcg ggcccggaga aagcagtttg ccgatatcgc 1560

ctacaattat aggcacggac agccaatccc tcgcgtggag tatatggagg aggagaagaa 1620

gacctggggc acagtgttca agaccctgaa gagcctgtac aagacacacg cctgctacga 1680

gtataaccac atcttccccc tgctggagaa gtattgtggc tttcacgagg acaatatccc 1740

tcagctggag gacgtgagcc agttcctgca gacctgcaca ggctttaggc tgaggccagt 1800

ggcaggactg ctgagctccc gggacttcct gggaggactg gccttcagag tgtttcactg 1860

cacccagtac atcaggcacg gctccaagcc aatgtataca ccagagcccg acatctgtca 1920

cgagctgctg ggccacgtgc ccctgtttag cgatagatcc ttcgcccagt tttcccagga 1980

gatcggactg gcatctctgg gagcacctga cgagtacatc gagaagctgg ccaccatcta 2040

ttggttcaca gtggagtttg gcctgtgcaa gcagggcgat agcatcaagg cctacggagc 2100

aggactgctg tctagcttcg gcgagctgca gtattgtctg tccgagaagc caaagctgct 2160

gcccctggag ctggagaaga ccgccatcca gaactacacc gtgacagagt tccagcccct 2220

gtactatgtg gccgagtctt ttaacgatgc caaggagaag gtgagaaatt tcgccgccac 2280

aatccctagg cccttcagcg tgcggtacga cccttatacc cagaggatcg aggtgctgga 2340

taatacacag cagctgaaga tcctggctga ctcaatcaat agcgaaatcg gaatcctgtg 2400

ctccgccctg cagaaaatca aatgagatcc agacatgata agatacattg atgagtttgg 2460

acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat 2520

tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca 2580

ttttatgttt caggttcagg gggaggtgtg ggaggttttt taactgggat gggatgtgga 2640

atccttctag atttcttttg taatatttat aaagtgctct cagcaaggta tcaaaatggc 2700

aaaattgtga gtaactatcc tcctttcatt ttgggaagaa gatgaggcat gaagagaatt 2760

cagacagaaa cttactcaga ccaggggagg cagaaactaa gcagagagga aaatgaccaa 2820

gagttagccc tgggcatgga atgtgaaaga accctaaacg tgacttggaa ataatgccca 2880

aggtatattc cattctccgg gatttgttgg cattttcttg aggtgaagaa ttgcagaata 2940

cattctttaa tgtgacctac atatttaccc atgggaggaa gtctgctcct ggactcttga 3000

gattcagtca taaagcccag gccagggaaa taatgtaagt ctgcaggccc ctgtcatcag 3060

taggattagg gagaagagtt ctcagtagaa aacagggagg ctggagagaa aagaatggtt 3120

aatgttaacg ttaatataac tagaaagact gcagaactta ggactgattt ttatttgaat 3180

ccttaaaaaa aaaatttctt atgaaaatag tacatggctc ttaggagaca gaacttattg 3240

tacagaggaa cagcgtgaga gtcagagtga tcccagaaca ggtcctggct ccatcctgca 3300

catagttttg gtgctgctgg caatacggtc cccacaactg tgggaagggg ttaggggcag 3360

ggatctcatc aggaaagcat aggggtttaa agttctttat agagcactta gaagattgag 3420

aatccacaaa ttatattaat aacaaacaaa gtagtgtcgt gttatatagt aaatgtgaat 3480

ttgcagacac atttagggaa aagttataat taaaaaaata ggctgtatat ata 3533

<210> 86

<211> 4061

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 86

tgcggccgct tcaggagcag ttgtgcgaat agctggagaa caccaggctg gatttaaacc 60

cagatcgctc ttacatttgc tctttacctg ctgtgctcag cgttcacgtg ccctctagct 120

gtagttttct gaagtcagcg cacagcaagg cagtgtgctt agaggttaac agaagggaaa 180

acaacaacaa caaaaatcta aatgagaatc ctgactgttt cagctggggg taaggggggc 240

ggattattca tataattgtt ataccagacg gtcgcaggct tagtccaatt gcagagaact 300

cgcttcccag gcttctgaga gtcccggaag tgcctaaacc tgtctaatcg acggggcttg 360

ggtggcccgt cgctccctgg cttcttccct ttacccaggg cgggcagcga agtggtgcct 420

cctgcgtccc ccacaccctc cctcagcccc tcccctccgg cccgtcctgg gcaggtgacc 480

tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga caacgcccac gaggggcgtt 540

actgtgcgga gatgcaccac gcaagagaca ccctttgtaa ctctcttctc ctccctagtg 600

cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc tgcctgtacc tgaggcccta 660

aaaagccaga gacctcactc ccggggagcc agcatgtcca ctgcggtcct ggaaaaccca 720

ggcttgggca ggaaactctc tgactttgga caggtgagcc acggcagcct gagctgctca 780

gttaggggaa tttgggcctc cagagaaaga gatctgaaga ctgctggtgc ttcctggttt 840

cataagctca gtaagaagtc tgaattcgtt ggaagctgat gagaatatcc aggaagtcaa 900

cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac atctgtcctc ggtggctttc 960

acaggaaccc taaaatgggc aaacattgca agcagcaaac agcaaacaca cagccctccc 1020

tgcctgctga ccttggagct ggggcagagg tcagagacct ctctgggccc atgccacctc 1080

caacatccac tcgacccctt ggaatttcgg tggagaggag cagaggttgt cctggcgtgg 1140

tttaggtagt gtgagagggg aatgactcct ttcggtaagt gcagtggaag ctgtacactg 1200

cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1260

cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1320

ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagggccct gtctcctcag 1380

cttcaggcac caccactgac ctgggacagt gaatcctcta aggtaaatat aaaattttta 1440

agtgtataat gtgttaaact actgattcta attgtttctc tcttttagat tccaaccttt 1500

ggaactgacc gccaccatgt ccaccgctgt gctggagaac cctgggctgg ggaggaaact 1560

gtcagacttc gggcaggaga cttcatacat tgaggataac tgtaaccaga atggcgccat 1620

ctctctgatc ttcagcctga aggaggaagt gggcgccctg gcaaaggtgc tgcgcctgtt 1680

tgaggagaac gacgtgaatc tgacccacat cgagtcccgg ccttctagac tgaagaagga 1740

cgagtacgag ttctttaccc acctggataa gcggtccctg ccagccctga caaacatcat 1800

caagatcctg aggcacgaca tcggagcaac cgtgcacgag ctgtctcggg acaagaagaa 1860

ggataccgtg ccctggttcc ctcggacaat ccaggagctg gatagatttg ccaaccagat 1920

cctgtcttac ggagcagagc tggacgcaga tcaccctggc ttcaaggacc cagtgtatcg 1980

ggcccggaga aagcagtttg ccgatatcgc ctacaattat aggcacggac agccaatccc 2040

tcgcgtggag tatatggagg aggagaagaa gacctggggc acagtgttca agaccctgaa 2100

gagcctgtac aagacacacg cctgctacga gtataaccac atcttccccc tgctggagaa 2160

gtattgtggc tttcacgagg acaatatccc tcagctggag gacgtgagcc agttcctgca 2220

gacctgcaca ggctttaggc tgaggccagt ggcaggactg ctgagctccc gggacttcct 2280

gggaggactg gccttcagag tgtttcactg cacccagtac atcaggcacg gctccaagcc 2340

aatgtataca ccagagcccg acatctgtca cgagctgctg ggccacgtgc ccctgtttag 2400

cgatagatcc ttcgcccagt tttcccagga gatcggactg gcatctctgg gagcacctga 2460

cgagtacatc gagaagctgg ccaccatcta ttggttcaca gtggagtttg gcctgtgcaa 2520

gcagggcgat agcatcaagg cctacggagc aggactgctg tctagcttcg gcgagctgca 2580

gtattgtctg tccgagaagc caaagctgct gcccctggag ctggagaaga ccgccatcca 2640

gaactacacc gtgacagagt tccagcccct gtactatgtg gccgagtctt ttaacgatgc 2700

caaggagaag gtgagaaatt tcgccgccac aatccctagg cccttcagtg tgcgttacga 2760

cccttatacc cagaggatcg aggtgctgga taatacacag cagctgaaga tcctggctga 2820

ctcaatcaat agcgaaatcg gaatcctgtg ctccgccctg cagaaaatca aatgagaatt 2880

caaggcctct cgagcctcta gaactatagt gagtcgtatt acgtagatcc agacatgata 2940

agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 3000

tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 3060

aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 3120

taagctttac gtacgatcgt cgactgggat gggatgtgga atccttctag atttcttttg 3180

taatatttat aaagtgctct cagcaaggta tcaaaatggc aaaattgtga gtaactatcc 3240

tcctttcatt ttgggaagaa gatgaggcat gaagagaatt cagacagaaa cttactcaga 3300

ccaggggagg cagaaactaa gcagagagga aaatgaccaa gagttagccc tgggcatgga 3360

atgtgaaaga accctaaacg tgacttggaa ataatgccca aggtatattc cattctccgg 3420

gatttgttgg cattttcttg aggtgaagaa ttgcagaata cattctttaa tgtgacctac 3480

atatttaccc atgggaggaa gtctgctcct ggactcttga gattcagtca taaagcccag 3540

gccagggaaa taatgtaagt ctgcaggccc ctgtcatcag taggattagg gagaagagtt 3600

ctcagtagaa aacagggagg ctggagagaa aagaatggtt aatgttaacg ttaatataac 3660

tagaaagact gcagaactta ggactgattt ttatttgaat ccttaaaaaa aaaatttctt 3720

atgaaaatag tacatggctc ttaggagaca gaacttattg tacagaggaa cagcgtgaga 3780

gtcagagtga tcccagaaca ggtcctggct ccatcctgca catagttttg gtgctgctgg 3840

caatacggtc cccacaactg tgggaagggg ttaggggcag ggatctcatc aggaaagcat 3900

aggggtttaa agttctttat agagcactta gaagattgag aatccacaaa ttatattaat 3960

aacaaacaaa gtagtgtcgt gttatatagt aaatgtgaat ttgcagacac atttagggaa 4020

aagttataat taaaaaaata ggctgtatat atacctgcag g 4061

<210> 87

<211> 2141

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 87

gcggccgcaa ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 60

tttggcacca aaatcaacgg gactttccaa aatgtcgtaa taaccccgcc ccgttgacgc 120

aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctcgt ttagtgaacc 180

gtgccaccat gcccccaccc aggaccggaa gaggcctgct gtggctgggc ctggtgctct 240

cttccgtgtg cgtggccctg ggaagcgaaa cccaggccaa cagcacaacc gacgccctga 300

atgtgctgct gatcattgtg gacgatctga gaccctccct gggctgttac ggcgacaaac 360

tggtgcggtc cccaaacatc gaccagctgg cctcccactc cctgctgttc cagaacgcct 420

tcgcccagca ggccgtgtgt gcccccagca gggtgagctt cctgaccggc agaagacctg 480

acaccaccag gctgtacgac tttaacagct actggcgggt gcacgccggc aatttcagca 540

ccattcctca gtacttcaag gagaatggct acgtgacaat gtccgtgggc aaggtgtttc 600

atcccggcat tagctccaac cacaccgacg atagcccata ctcctggtcc ttccccccct 660

accatccctc cagcgagaag tacgagaaca ccaaaacctg cagaggccct gacggagagc 720

tgcacgccaa cctgctgtgc cctgtggatg tcctggatgt gcccgaaggt aagggtttaa 780

gggatggttg gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac 840

tttttttcag gcaccctgcc agacaagcag tccacagagc aggccatcca gctgctggag 900

aagatgaaga caagcgccag ccccttcttt ctggccgtgg gataccacaa gcctcacatt 960

ccattccggt acccaaaaga gttccagaag ctgtaccctc tggaaaacat caccctggcc 1020

cctgaccccg aggtgccaga cgggctgcct cctgtggcct acaatccctg gatggacatc 1080

agacagcggg aggatgtgca ggccctgaat atttccgtgc cctatgggcc catccctgtg 1140

gactttcagc ggaaaatcag acagtcttac tttgccagcg tgtcctacct ggacacccag 1200

gtgggccgcc tgctctcagc cctggacgac ctgcagctgg ccaattccac catcatcgcc 1260

ttcaccagcg atcacggctg ggccctgggc gagcacgggg agtgggccaa atacagcaac 1320

ttcgatgtgg ccacccacgt gcctctgatt ttttatgtgc ccggccggac agccagcctg 1380

cccgaggccg gggagaagct ctttccttac ctggaccctt tcgactctgc cagccagctg 1440

atggaacctg gcagacagag catggacctg gtggagctgg tgagcctctt ccccactctg 1500

gccggcctgg ctggcctgca ggtgccacca agatgcccag tgccttcttt ccacgtggag 1560

ctgtgtagag agggaaagaa cctgctgaag cacttcagat ttagagatct ggaggaggat 1620

ccctacctgc caggcaaccc aagggagctg atcgcctaca gccagtatcc cagaccctct 1680

gatatccccc agtggaacag cgataagccc tccctgaaag acatcaagat tatgggctac 1740

tccatcagga ccattgacta ccggtacaca gtgtgggtgg gcttcaaccc cgatgagttt 1800

ctggccaact tcagcgacat ccacgccggc gagctgtatt ttgtggactc cgaccccctg 1860

caggaccaca acatgtacaa cgactcccag ggcggcgacc tgttccagct gctgatgccc 1920

tgagatccag acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag 1980

tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata 2040

agctgcaata aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg 2100

gaggtgtggg aggtttttta acctgcaggt ctagatacgt a 2141

<210> 88

<211> 2042

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 88

ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60

tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120

cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180

agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240

aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300

ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360

ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 420

caccaccact gacctgggac agtgaatcct ctaaggtaaa tataaaattt ttaagtgtat 480

aatgtgttaa actactgatt ctaattgttt ctctctttta gattccaacc tttggaactg 540

accgccacca tgtccaccgc tgtgctggag aaccctgggc tggggaggaa actgtcagac 600

ttcgggcagg agacttcata cattgaggat aactgtaacc agaatggcgc catctctctg 660

atcttcagcc tgaaggagga agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag 720

aacgacgtga atctgaccca catcgagtcc cggccttcta gactgaagaa ggacgagtac 780

gagttcttta cccacctgga taagcggtcc ctgccagccc tgacaaacat catcaagatc 840

ctgaggcacg acatcggagc aaccgtgcac gagctgtctc gggacaagaa gaaggatacc 900

gtgccctggt tccctcggac aatccaggag ctggatagat ttgccaacca gatcctgtct 960

tacggagcag agctggacgc agatcaccct ggcttcaagg acccagtgta tcgggcccgg 1020

agaaagcagt ttgccgatat cgcctacaat tataggcacg gacagccaat ccctcgcgtg 1080

gagtatatgg aggaggagaa gaagacctgg ggcacagtgt tcaagaccct gaagagcctg 1140

tacaagacac acgcctgcta cgagtataac cacatcttcc ccctgctgga gaagtattgt 1200

ggctttcacg aggacaatat ccctcagctg gaggacgtga gccagttcct gcagacctgc 1260

acaggcttta ggctgaggcc agtggcagga ctgctgagct cccgggactt cctgggagga 1320

ctggccttca gagtgtttca ctgcacccag tacatcaggc acggctccaa gccaatgtat 1380

acaccagagc ccgacatctg tcacgagctg ctgggccacg tgcccctgtt tagcgataga 1440

tccttcgccc agttttccca ggagatcgga ctggcatctc tgggagcacc tgacgagtac 1500

atcgagaagc tggccaccat ctattggttc acagtggagt ttggcctgtg caagcagggc 1560

gatagcatca aggcctacgg agcaggactg ctgtctagct tcggcgagct gcagtattgt 1620

ctgtccgaga agccaaagct gctgcccctg gagctggaga agaccgccat ccagaactac 1680

accgtgacag agttccagcc cctgtactat gtggccgagt cttttaacga tgccaaggag 1740

aaggtgagaa atttcgccgc cacaatccct aggcccttca gcgtgcggta cgacccttat 1800

acccagagga tcgaggtgct ggataataca cagcagctga agatcctggc tgactcaatc 1860

aatagcgaaa tcggaatcct gtgctccgcc ctgcagaaaa tcaaatgaat gctttatttg 1920

tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa 1980

caacaacaat tgcattcatt ttatgtttca ggttcagggg gaggtgtggg aggtttttta 2040

aa 2042

<210> 89

<211> 720

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 89

atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60

ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120

ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180

ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240

cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300

ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360

gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420

aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480

ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540

gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600

tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660

ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720

<210> 90

<211> 2162

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 90

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180

ggttagggag gtcctgcata tgcggccgca cgcgtggtac ctctggtcgt tacataactt 240

acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaataatg 300

acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg ggtggagtat 360

ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag tacgccccct 420

attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat gaccttatgg 480

gactttccta cttggcagta catctactcg aggccacgtt ctgcttcact ctccccatct 540

cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 600

tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 660

gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 720

cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 780

gagcgggatc agccaccgcg gtggcggcct agagtcgacg aggaactgaa aaaccagaaa 840

gttaactggt aagtttagtc tttttgtctt ttatttcagg tcccggatcc ggtggtggtg 900

caaatcaaag aactgctcct cagtggatgt tgcctttact tctaggcctg tacggaagtg 960

ttacttctgc tctaaaagct gcggaattgt acccgcggcc gatccaccgg tcgccaccat 1020

ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg 1080

cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg 1140

caagctgacc ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct 1200

cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca 1260

gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt 1320

caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt 1380

gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa 1440

gctggagtac aactacaaca gccacaacgt ctatatcatg gccgacaagc agaagaacgg 1500

catcaaggtg aacttcaaga tccgccacaa catcgaggac ggcagcgtgc agctcgccga 1560

ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta 1620

cctgagcacc cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct 1680

gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagtaaag 1740

cggccatcaa gcttatcgat accgtcgact agagctcgct gatcagcctc gactgtgcct 1800

tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 1860

gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 1920

tgtcattcta ttctgggggg tggggtgggg caggacagca aggcctgcag gtctagatac 1980

gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 2040

gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 2100

cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc 2160

aa 2162

<210> 91

<211> 2208

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 腺相关病毒2

<400> 91

ttacagatta cgagtcaggt atctggtgcc aatggggcga ggctctgaat acacgccatt 60

agtgtccaca gtaaagtcca cattaacaga cttgttgtag ttggaagtgt actgaatttc 120

gggattccag cgtttgctgt tttccttctg cagctcccac tcgatctcca cgctgacctg 180

tcccgtggag tactgtgtga tgaaggaagc aaactttgcc gcactgaagg tggtcgaagg 240

attcgcaggt accggggtgt tcttgatgag aatctgtgga ggagggtgtt taagtccgaa 300

tccacccatg aggggagagg ggtgaaaatg tccgtccgtg tgtggaatct ttgcccagat 360

gggcccctga aggtacacat ctctgtcctg ccagaccatg cctggaagaa cgccttgtgt 420

gttgacatct gcggtagctg cttgtctgtt gcctctctgg aggttggtag atacagaacc 480

atactgctcc gtagccacgg gattggttgt cctgatttcc tcttcgtctg taatcatgac 540

cttttcaatg tccacatttg ttttctctga gccttgcttc ccaaagatga gaaccccgct 600

ctgaggaaaa aacttttctt catcgtcctt gtggcttgcc atggccgggc ccggattcac 660

cagagagtct ctgccattga ggtggtactt ggtagctcca gtccacgagt attcactgtt 720

gttgttatcc gcagatgtct ttgatactcg ctgctggcgg taacagggtc caggaagcca 780

gttcctagac tggtcccgaa tgtcactcgc tccggcctga gaaaactgaa gccttgactg 840

cgtggtggtt ccacttggag tgtttgttct gctcaagtaa tacaggtact ggtcgatgag 900

aggattcatg agacggtcca gactctggct gtgagcgtag ctgctgtgga aaggaacgtc 960

ctcaaaagtg tagctgaagg taaagttgtt tccggtacgc agcatctgag aaggaaagta 1020

ctccaggcag taaaatgaag agcgtcctac tgcctgactc ccgttgttca gggtgaggta 1080

tccatactgt ggcaccatga agacgtctgc tgggaacggc gggaggcatc cttgatgcgc 1140

cgagccgagg acgtacggga gctggtactc cgagtcagta aacacctgaa ccgtgctggt 1200

aaggttattg gcaatcgtcg tcgtaccgtc attctgcgtg acctctttga cttgaatgtt 1260

aaagagcttg aagttgagtc tcttgggtcg gaatccccag ttgttgttga tgagtctttg 1320

ccagtcacgt ggtgaaaagt ggcagtggaa tctgttgaag tcaaaatacc cccaaggggt 1380

gctgtagcca aagtagtgat tgtcgttcga ggctcctgat tggctggaaa tttgtttgta 1440

gaggtggttg ttgtaggtgg gcagggccca ggttcgggtg ctggtggtga tgactctgtc 1500

gcccatccat gtggaatcgc aatgccaatt tcccgaggaa ttacccactc cgtcggcgcc 1560

ctcgttattg tctgccattg gtgcgccact gcctgtagcc atcgtattag ttcccagacc 1620

agagggggct gctggtggct gtccgagagg ctgggggtca ggtactgagt ctgcgtctcc 1680

agtctgacca aaattcaatc tttttcttgc aggctgctgg cccgcctttc cggttcccga 1740

ggaggagtct ggctccacag gagagtgctc taccggcctc ttttttcccg gagccgtctt 1800

aacaggttcc tcaaccaggc ccagaggttc aagaaccctc tttttcgcct ggaagactgc 1860

tcgtccgagg ttgcccccaa aagacgtatc ttctttaagg cgctcctgaa actccgcgtc 1920

ggcgtggttg tacttgaggt acgggttgtc tccgctgtcg agctgccggt cgtaggcttt 1980

gtcgtgctcg agggccgcgg cgtctgcctc gttgaccggc tctcccttgt cgagtccgtt 2040

gaagggtccg aggtacttgt acccaggaag cacaagaccc ctgctgtcgt ccttatgccg 2100

ctctgcgggc tttggtggtg gtgggccagg tttgagcttc caccactgtc ttattccttc 2160

agagagagtg tcctcgagcc aatctggaag ataaccatcg gcagccat 2208

<210> 92

<211> 4219

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 92

ttacagatta cgagtcaggt atctggtgcc aatggggcga ggctctgaat acacgccatt 60

agtgtccaca gtaaagtcca cattaacaga cttgttgtag ttggaagtgt actgaatttc 120

gggattccag cgtttgctgt tttccttctg cagctcccac tcgatctcca cgctgacctg 180

tcccgtggag tactgtgtga tgaaggaagc aaactttgcc gcactgaagg tggtcgaagg 240

attcgcaggt accggggtgt tcttgatgag aatctgtgga ggagggtgtt taagtccgaa 300

tccacccatg aggggagagg ggtgaaaatg tccgtccgtg tgtggaatct ttgcccagat 360

gggcccctga aggtacacat ctctgtcctg ccagaccatg cctggaagaa cgccttgtgt 420

gttgacatct gcggtagctg cttgtctgtt gcctctctgg aggttggtag atacagaacc 480

atactgctcc gtagccacgg gattggttgt cctgatttcc tcttcgtctg taatcatgac 540

cttttcaatg tccacatttg ttttctctga gccttgcttc ccaaagatga gaaccccgct 600

ctgaggaaaa aacttttctt catcgtcctt gtggcttgcc atggccgggc ccggattcac 660

cagagagtct ctgccattga ggtggtactt ggtagctcca gtccacgagt attcactgtt 720

gttgttatcc gcagatgtct ttgatactcg ctgctggcgg taacagggtc caggaagcca 780

gttcctagac tggtcccgaa tgtcactcgc tccggcctga gaaaactgaa gccttgactg 840

cgtggtggtt ccacttggag tgtttgttct gctcaagtaa tacaggtact ggtcgatgag 900

aggattcatg agacggtcca gactctggct gtgagcgtag ctgctgtgga aaggaacgtc 960

ctcaaaagtg tagctgaagg taaagttgtt tccggtacgc agcatctgag aaggaaagta 1020

ctccaggcag taaaatgaag agcgtcctac tgcctgactc ccgttgttca gggtgaggta 1080

tccatactgt ggcaccatga agacgtctgc tgggaacggc gggaggcatc cttgatgcgc 1140

cgagccgagg acgtacggga gctggtactc cgagtcagta aacacctgaa ccgtgctggt 1200

aaggttattg gcaatcgtcg tcgtaccgtc attctgcgtg acctctttga cttgaatgtt 1260

aaagagcttg aagttgagtc tcttgggtcg gaatccccag ttgttgttga tgagtctttg 1320

ccagtcacgt ggtgaaaagt ggcagtggaa tctgttgaag tcaaaatacc cccaaggggt 1380

gctgtagcca aagtagtgat tgtcgttcga ggctcctgat tggctggaaa tttgtttgta 1440

gaggtggttg ttgtaggtgg gcagggccca ggttcgggtg ctggtggtga tgactctgtc 1500

gcccatccat gtggaatcgc aatgccaatt tcccgaggaa ttacccactc cgtcggcgcc 1560

ctcgttattg tctgccattg gtgcgccact gcctgtagcc atcgtattag ttcccagacc 1620

agagggggct gctggtggct gtccgagagg ctgggggtca ggtactgagt ctgcgtctcc 1680

agtctgacca aaattcaatc tttttcttgc aggctgctgg cccgcctttc cggttcccga 1740

ggaggagtct ggctccacag gagagtgctc taccggcctc ttttttcccg gagccgtctt 1800

aacaggttcc tcaaccaggc ccagaggttc aagaaccctc tttttcgcct ggaagactgc 1860

tcgtccgagg ttgcccccaa aagacgtatc ttctttaagg cgctcctgaa actccgcgtc 1920

ggcgtggttg tacttgaggt acgggttgtc tccgctgtcg agctgccggt cgtaggcttt 1980

gtcgtgctcg agggccgcgg cgtctgcctc gttgaccggc tctcccttgt cgagtccgtt 2040

gaagggtccg aggtacttgt acccaggaag cacaagaccc ctgctgtcgt ccttatgccg 2100

ctctgcgggc tttggtggtg gtgggccagg tttgagcttc caccactgtc ttattccttc 2160

agagagagtg tcctcgagcc aatctggaag ataaccatcg gcagccatac ctggtttaag 2220

tcatttattg ttcaaagatg cagtcatcca aatccacatt gaccagatcg caggcagtgc 2280

aagcgtctgg cacctttccc atgatatgat gaatgtagca cagtttctga tacgcctttt 2340

tgacgacaga aacgggttga gattctgaca cgggaaagca ctctaaacag tctttctgtc 2400

cgtgagtgaa gcagatattt gaattctgat tcattctctc gcattgtctg cagggaaaca 2460

gcatcagatt catgcccacg tgacgagaac atttgttttg gtacctgtct gcgtagttga 2520

tcgaagcttc cgcgtctgac gtcgatggct gcgcaactga ctcgcgcacc cgtttgggct 2580

cacttatatc tgcgtcactg ggggcgggtc ttttcttggc tccacccttt ttgacgtaga 2640

attcatgctc cacctcaacc acgtgatcct ttgcccaccg gaaaaagtct ttgacttcct 2700

gcttggtgac cttcccaaag tcatgatcca gacggcgggt gagttcaaat ttgaacatcc 2760

ggtcttgcaa cggctgctgg tgttcgaagg tcgttgagtt cccgtcaatc acggcgcaca 2820

tgttggtgtt ggaggtgacg atcacgggag tcgggtctat ctgggccgag gacttgcatt 2880

tctggtccac gcgcaccttg cttcctccga gaatggcttt ggccgactcc acgaccttgg 2940

cggtcatctt cccctcctcc caccagatca ccatcttgtc gacacagtcg ttgaagggaa 3000

agttctcatt ggtccagttt acgcacccgt agaagggcac agtgtgggct atggcctccg 3060

cgatgttggt cttcccggta gttgcaggcc caaacagcca gatggtgttc ctcttgccga 3120

actttttcgt ggcccatccc agaaagacgg aagccgcata ttggggatcg tacccgttta 3180

gttccaaaat tttataaatc cgattgctgg aaatgtcctc cacgggctgc tggcccacca 3240

ggtagtcggg ggcggtttta gtcaggctca taatctttcc cgcattgtcc aaggcagcct 3300

tgatttggga ccgcgagttg gaggccgcat tgaaggagat gtatgaggcc tggtcctcct 3360

ggatccactg cttctccgag gtaatcccct tgtccacgag ccacccgacc agctccatgt 3420

acctggctga agtttttgat ctgatcaccg gcgcatcaga attgggattc tgattctctt 3480

tgttctgctc ctgcgtctgc gacacgtgcg tcagatgctg cgccaccaac cgtttacgct 3540

ccgtgagatt caaacaggcg cttaaatact gttccatatt agtccacgcc cactggagct 3600

caggctgggt tttggggagc aagtaattgg ggatgtagca ctcatccacc accttgttcc 3660

cgcctccggc gccatttctg gtctttgtga ccgcgaacca gtttggcaaa gtcggctcga 3720

tcccgcggta aattctctga atcagttttt cgcgaatctg actcaggaaa cgtcccaaaa 3780

ccatggattt caccccggtg gtttccacga gcacgtgcat gtggaagtag ctctctccct 3840

tctcaaattg cacaaagaaa agggcctccg gggccttact cacacggcgc cattccgtca 3900

gaaagtcgcg ctgcagcttc tcggccacgg tcaggggtgc ctgctcaatc agattcagat 3960

ccatgtcaga atctggcggc aactcccatt ccttctcggc cacccagttc acaaagctgt 4020

cagaaatgcc gggcagatgc tcgtcaaggt cgctggggac cttaatcaca atctcgtaaa 4080

accccggcat ggcggctgcg cgttcaaacc tcccgcttca aaatggagac cctgcgtgct 4140

cactcgggct taaataccca gcgtgaccac atggtgtcgc aaaatgtcgc aaaacactca 4200

cgtgacctct aatacagga 4219

<210> 93

<211> 2211

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 93

atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60

gagtggtggg acttgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120

gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180

aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240

cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300

caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360

gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420

ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcatcggc 480

aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540

tcagtccccg atccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600

actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660

gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720

accaccagca cccgcacctg ggccttgccc acctacaata accacctcta caagcaaatc 780

tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840

gggtattttg atttcaacag attccactgc cacttttcac cacgtgactg gcagcgactc 900

atcaacaaca attggggatt ccggcccaag agactcaact tcaaactctt caacatccaa 960

gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020

gttcaagtct tctcggactc ggagtaccag cttccgtacg tcctcggctc tgcgcaccag 1080

ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcaatacgg ctacctgacg 1140

ctcaacaatg gcagccaagc cgtgggacgt tcatcctttt actgcctgga atatttccct 1200

tctcagatgc tgagaacggg caacaacttt accttcagct acacctttga ggaagtgcct 1260

ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320

caatacctgt attacctgaa cagaactcaa aatcagtccg gaagtgccca aaacaaggac 1380

ttgctgttta gccgtgggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440

ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaat 1500

tttacctgga ctggtgcttc aaaatataac ctcaatgggc gtgaatccat catcaaccct 1560

ggcactgcta tggcctcaca caaagacgac gaagacaagt tctttcccat gagcggtgtc 1620

atgatttttg gaaaagagag cgccggagct tcaaacactg cattggacaa tgtcatgatt 1680

acagacgaag aggaaattaa agccactaac cctgtggcca ccgaaagatt tgggaccgtg 1740

gcagtcaatt tccagagcag cagcacagac cctgcgaccg gagatgtgca tgctatggga 1800

gcattacctg gcatggtgtg gcaagataga gacgtgtacc tgcagggtcc catttgggcc 1860

aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920

aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggcg 1980

gagttttcag ctacaaagtt tgcttcattc atcacccaat actccacagg acaagtgagt 2040

gtggaaattg aatgggagct gcagaaagaa aacagcaagc gctggaatcc cgaagtgcag 2100

tacacatcca attatgcaaa atctgccaac gttgatttta ctgtggacaa caatggactt 2160

tatactgagc ctcgccccat tggcacccgt taccttaccc gtcccctgta a 2211

<210> 94

<211> 4263

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 94

ggtggagtcg tgacgtgaat tacgtcatag ggttagggag gtcctgtatt agaggtcacg 60

tgagtgtttt gcgacatttt gcgacaccat gtggtcacgc tgggtattta agcccgagtg 120

agcacgcagg gtctccattt tgaagcggga ggtttgaacg cgcagccgcc atgccggggt 180

tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc ggcatttctg 240

acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat tctgacatgg 300

atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag cgcgactttc 360

tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg caatttgaga 420

agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg aaatccatgg 480

ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt taccgcggga 540

tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc gccggaggcg 600

ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa acccagcctg 660

agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg aatctcacgg 720

agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag gagcagaaca 780

aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact tcagccaggt 840

acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag cagtggatcc 900

aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg tcccaaatca 960

aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc cccgactacc 1020

tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa attttggaac 1080

taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc acgaaaaagt 1140

tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag accaacatcg 1200

cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc aatgagaact 1260

ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg aagatgaccg 1320

ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc gtggaccaga 1380

aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc aacaccaaca 1440

tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg ttgcaagacc 1500

ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag gtcaccaagc 1560

aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg gagcatgaat 1620

tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca gatataagtg 1680

agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg gaagcttcga 1740

tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg aatctgatgc 1800

tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc ttcactcacg 1860

gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt tctgtcgtca 1920

aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg ccagacgctt 1980

gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa caataaatga 2040

cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga caacctctct 2100

gagggcattc gcgagtggtg ggacttgaaa cctggagccc cgaagcccaa agccaaccag 2160

caaaagcagg acgacggccg gggtctggtg cttcctggct acaagtacct cggacccttc 2220

aacggactcg acaaggggga gcccgtcaac gcggcggacg cagcggccct cgagcacgac 2280

aaggcctacg accagcagct caaagcgggt gacaatccgt acctgcggta taaccacgcc 2340

gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa cctcgggcga 2400

gcagtcttcc aggccaagaa gcgggttctc gaacctctcg gtctggttga ggaaggcgct 2460

aagacggctc ctggaaagaa acgtccggta gagcagtcgc cacaagagcc agactcctcc 2520

tcgggcatcg gcaagacagg ccagcagccc gctaaaaaga gactcaattt tggtcagact 2580

ggcgactcag agtcagtccc cgatccacaa cctctcggag aacctccagc aacccccgct 2640

gctgtgggac ctactacaat ggcttcaggc ggtggcgcac caatggcaga caataacgaa 2700

ggcgccgacg gagtgggtaa tgcctcagga aattggcatt gcgattccac atggctgggc 2760

gacagagtca tcaccaccag cacccgcacc tgggccttgc ccacctacaa taaccacctc 2820

tacaagcaaa tctccagtgc ttcaacgggg gccagcaacg acaaccacta cttcggctac 2880

agcaccccct gggggtattt tgatttcaac agattccact gccacttttc accacgtgac 2940

tggcagcgac tcatcaacaa caattgggga ttccggccca agagactcaa cttcaaactc 3000

ttcaacatcc aagtcaagga ggtcacgacg aatgatggcg tcacaaccat cgctaataac 3060

cttaccagca cggttcaagt cttctcggac tcggagtacc agcttccgta cgtcctcggc 3120

tctgcgcacc agggctgcct ccctccgttc ccggcggacg tgttcatgat tccgcaatac 3180

ggctacctga cgctcaacaa tggcagccaa gccgtgggac gttcatcctt ttactgcctg 3240

gaatatttcc cttctcagat gctgagaacg ggcaacaact ttaccttcag ctacaccttt 3300

gaggaagtgc ctttccacag cagctacgcg cacagccaga gcctggaccg gctgatgaat 3360

cctctcatcg accaatacct gtattacctg aacagaactc aaaatcagtc cggaagtgcc 3420

caaaacaagg acttgctgtt tagccgtggg tctccagctg gcatgtctgt tcagcccaaa 3480

aactggctac ctggaccctg ttatcggcag cagcgcgttt ctaaaacaaa aacagacaac 3540

aacaacagca attttacctg gactggtgct tcaaaatata acctcaatgg gcgtgaatcc 3600

atcatcaacc ctggcactgc tatggcctca cacaaagacg acgaagacaa gttctttccc 3660

atgagcggtg tcatgatttt tggaaaagag agcgccggag cttcaaacac tgcattggac 3720

aatgtcatga ttacagacga agaggaaatt aaagccacta accctgtggc caccgaaaga 3780

tttgggaccg tggcagtcaa tttccagagc agcagcacag accctgcgac cggagatgtg 3840

catgctatgg gagcattacc tggcatggtg tggcaagata gagacgtgta cctgcagggt 3900

cccatttggg ccaaaattcc tcacacagat ggacactttc acccgtctcc tcttatgggc 3960

ggctttggac tcaagaaccc gcctcctcag atcctcatca aaaacacgcc tgttcctgcg 4020

aatcctccgg cggagttttc agctacaaag tttgcttcat tcatcaccca atactccaca 4080

ggacaagtga gtgtggaaat tgaatgggag ctgcagaaag aaaacagcaa gcgctggaat 4140

cccgaagtgc agtacacatc caattatgca aaatctgcca acgttgattt tactgtggac 4200

aacaatggac tttatactga gcctcgcccc attggcaccc gttaccttac ccgtcccctg 4260

taa 4263

<210> 95

<211> 2175

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 95

atgtcttttg ttgatcaccc tccagattgg ttggaagaag ttggtgaagg tcttcgcgag 60

tttttgggcc ttgaagcggg cccaccgaaa ccaaaaccca atcagcagca tcaagatcaa 120

gcccgtggtc ttgtgctgcc tggttataac tatctcggac ccggaaacgg tctcgatcga 180

ggagagcctg tcaacagggc agacgaggtc gcgcgagagc acgacatctc gtacaacgag 240

cagcttgagg cgggagacaa cccctacctc aagtacaacc acgcggacgc cgagtttcag 300

gagaagctcg ccgacgacac atccttcggg ggaaacctcg gaaaggcagt ctttcaggcc 360

aagaaaaggg ttctcgaacc ttttggcctg gttgaagagg gtgctaagac ggcccctacc 420

ggaaagcgga tagacgacca ctttccaaaa agaaagaagg ctcggaccga agaggactcc 480

aagccttcca cctcgtcaga cgccgaagct ggacccagcg gatcccagca gctgcaaatc 540

ccagcccaac cagcctcaag tttgggagct gatacaatgt ctgcgggagg tggcggccca 600

ttgggcgaca ataaccaagg tgccgatgga gtgggcaatg cctcgggaga ttggcattgc 660

gattccacgt ggatggggga cagagtcgtc accaagtcca cccgaacctg ggtgctgccc 720

agctacaaca accaccagta ccgagagatc aaaagcggct ccgtcgacgg aagcaacgcc 780

aacgcctact ttggatacag caccccctgg gggtactttg actttaaccg cttccacagc 840

cactggagcc cccgagactg gcaaagactc atcaacaact actggggctt cagaccccgg 900

tccctcagag tcaaaatctt caacattcaa gtcaaagagg tcacggtgca ggactccacc 960

accaccatcg ccaacaacct cacctccacc gtccaagtgt ttacggacga cgactaccag 1020

ctgccctacg tcgtcggcaa cgggaccgag ggatgcctgc cggccttccc tccgcaggtc 1080

tttacgctgc cgcagtacgg ttacgcgacg ctgaaccgcg acaacacaga aaatcccacc 1140

gagaggagca gcttcttctg cctagagtac tttcccagca agatgctgag aacgggcaac 1200

aactttgagt ttacctacaa ctttgaggag gtgcccttcc actccagctt cgctcccagt 1260

cagaacctgt tcaagctggc caacccgctg gtggaccagt acttgtaccg cttcgtgagc 1320

acaaataaca ctggcggagt ccagttcaac aagaacctgg ccgggagata cgccaacacc 1380

tacaaaaact ggttcccggg gcccatgggc cgaacccagg gctggaacct gggctccggg 1440

gtcaaccgcg ccagtgtcag cgccttcgcc acgaccaata ggatggagct cgagggcgcg 1500

agttaccagg tgcccccgca gccgaacggc atgaccaaca acctccaggg cagcaacacc 1560

tatgccctgg agaacactat gatcttcaac agccagccgg cgaacccggg caccaccgcc 1620

acgtacctcg agggcaacat gctcatcacc agcgagagcg agacgcagcc ggtgaaccgc 1680

gtggcgtaca acgtcggcgg gcagatggcc accaacaacc agagctccac cactgccccc 1740

gcgaccggca cgtacaacct ccaggaaatc gtgcccggca gcgtgtggat ggagagggac 1800

gtgtacctcc aaggacccat ctgggccaag atcccagaga cgggggcgca ctttcacccc 1860

tctccggcca tgggcggatt cggactcaaa cacccaccgc ccatgatgct catcaagaac 1920

acgcctgtgc ccggaaatat caccagcttc tcggacgtgc ccgtcagcag cttcatcacc 1980

cagtacagca ccgggcaggt caccgtggag atggagtggg agctcaagaa ggaaaactcc 2040

aagaggtgga acccagagat ccagtacaca aacaactaca acgaccccca gtttgtggac 2100

tttgccccgg acagcaccgg ggaatacaga accaccagac ctatcggaac ccgatacctt 2160

acccgacccc tttaa 2175

<210> 96

<211> 4057

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 96

atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60

ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120

tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180

cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240

caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300

aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360

taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420

gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480

acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540

aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600

gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660

tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720

cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780

tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840

cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900

attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960

acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020

accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080

aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140

aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200

gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260

aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320

ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380

gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440

gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500

gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560

gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620

aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680

ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740

tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800

ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860

caataaatga cttaaaccag gtatgtcttt tgttgatcac cctccagatt ggttggaaga 1920

agttggtgaa ggtcttcgcg agtttttggg ccttgaagcg ggcccaccga aaccaaaacc 1980

caatcagcag catcaagatc aagcccgtgg tcttgtgctg cctggttata actatctcgg 2040

acccggaaac ggtctcgatc gaggagagcc tgtcaacagg gcagacgagg tcgcgcgaga 2100

gcacgacatc tcgtacaacg agcagcttga ggcgggagac aacccctacc tcaagtacaa 2160

ccacgcggac gccgagtttc aggagaagct cgccgacgac acatccttcg ggggaaacct 2220

cggaaaggca gtctttcagg ccaagaaaag ggttctcgaa ccttttggcc tggttgaaga 2280

gggtgctaag acggccccta ccggaaagcg gatagacgac cactttccaa aaagaaagaa 2340

ggctcggacc gaagaggact ccaagccttc cacctcgtca gacgccgaag ctggacccag 2400

cggatcccag cagctgcaaa tcccagccca accagcctca agtttgggag ctgatacaat 2460

gtctgcggga ggtggcggcc cattgggcga caataaccaa ggtgccgatg gagtgggcaa 2520

tgcctcggga gattggcatt gcgattccac gtggatgggg gacagagtcg tcaccaagtc 2580

cacccgaacc tgggtgctgc ccagctacaa caaccaccag taccgagaga tcaaaagcgg 2640

ctccgtcgac ggaagcaacg ccaacgccta ctttggatac agcaccccct gggggtactt 2700

tgactttaac cgcttccaca gccactggag cccccgagac tggcaaagac tcatcaacaa 2760

ctactggggc ttcagacccc ggtccctcag agtcaaaatc ttcaacattc aagtcaaaga 2820

ggtcacggtg caggactcca ccaccaccat cgccaacaac ctcacctcca ccgtccaagt 2880

gtttacggac gacgactacc agctgcccta cgtcgtcggc aacgggaccg agggatgcct 2940

gccggccttc cctccgcagg tctttacgct gccgcagtac ggttacgcga cgctgaaccg 3000

cgacaacaca gaaaatccca ccgagaggag cagcttcttc tgcctagagt actttcccag 3060

caagatgctg agaacgggca acaactttga gtttacctac aactttgagg aggtgccctt 3120

ccactccagc ttcgctccca gtcagaacct gttcaagctg gccaacccgc tggtggacca 3180

gtacttgtac cgcttcgtga gcacaaataa cactggcgga gtccagttca acaagaacct 3240

ggccgggaga tacgccaaca cctacaaaaa ctggttcccg gggcccatgg gccgaaccca 3300

gggctggaac ctgggctccg gggtcaaccg cgccagtgtc agcgccttcg ccacgaccaa 3360

taggatggag ctcgagggcg cgagttacca ggtgcccccg cagccgaacg gcatgaccaa 3420

caacctccag ggcagcaaca cctatgccct ggagaacact atgatcttca acagccagcc 3480

ggcgaacccg ggcaccaccg ccacgtacct cgagggcaac atgctcatca ccagcgagag 3540

cgagacgcag ccggtgaacc gcgtggcgta caacgtcggc gggcagatgg ccaccaacaa 3600

ccagagctcc accactgccc ccgcgaccgg cacgtacaac ctccaggaaa tcgtgcccgg 3660

cagcgtgtgg atggagaggg acgtgtacct ccaaggaccc atctgggcca agatcccaga 3720

gacgggggcg cactttcacc cctctccggc catgggcgga ttcggactca aacacccacc 3780

gcccatgatg ctcatcaaga acacgcctgt gcccggaaat atcaccagct tctcggacgt 3840

gcccgtcagc agcttcatca cccagtacag caccgggcag gtcaccgtgg agatggagtg 3900

ggagctcaag aaggaaaact ccaagaggtg gaacccagag atccagtaca caaacaacta 3960

caacgacccc cagtttgtgg actttgcccc ggacagcacc ggggaataca gaaccaccag 4020

acctatcgga acccgatacc ttacccgacc cctttaa 4057

<210> 97

<211> 2220

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 97

atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60

gagtggtggg acttgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120

gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180

aagggggagc ccgtcaacgc ggcggatgca gcggccctcg agcacgacaa ggcctacgac 240

cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300

caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360

gccaagaaga gggttctcga acctcttggt ctggttgagg aaggtgctaa gacggctcct 420

ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcattggc 480

aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540

tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600

actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660

gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720

accaccagca cccgaacatg ggccttgccc acctataaca accacctcta caagcaaatc 780

tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840

gggtattttg atttcaacag attccactgc catttctcac cacgtgactg gcagcgactc 900

atcaacaaca attggggatt ccggcccaag agactcaact tcaagctctt caacatccaa 960

gtcaaggagg tcacgacgaa tgatggcgtc acgaccatcg ctaataacct taccagcacg 1020

gttcaagtct tctcggactc ggagtaccag ttgccgtacg tcctcggctc tgcgcaccag 1080

ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcagtacgg ctacctaacg 1140

ctcaacaatg gcagccaggc agtgggacgg tcatcctttt actgcctgga atatttccca 1200

tcgcagatgc tgagaacggg caataacttt accttcagct acaccttcga ggacgtgcct 1260

ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320

cagtacctgt attacctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380

ttgctgttta gccgggggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440

ggaccctgtt accggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500

tttacctgga ctggtgcttc aaaatataac cttaatgggc gtgaatctat aatcaaccct 1560

ggcactgcta tggcctcaca caaagacgac aaagacaagt tctttcccat gagcggtgtc 1620

atgatttttg gaaaggagag cgccggagct tcaaacactg cattggacaa tgtcatgatc 1680

acagacgaag aggaaatcaa agccactaac cccgtggcca ccgaaagatt tgggactgtg 1740

gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgttatggga 1800

gccttacctg gaatggtgtg gcaagacaga gacgtatacc tgcagggtcc tatttgggcc 1860

aaaattcctc acacggatgg acactttcac ccgtctcctc tcatgggcgg ctttggactt 1920

aagcacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggca 1980

gagttttcgg ctacaaagtt tgcttcattc atcacccagt attccacagg acaagtgagc 2040

gtggagattg aatgggagct gcagaaagaa aacagcaaac gctggaatcc cgaagtgcag 2100

tatacatcta actatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160

tatactgagc ctcgccccat tggcacccgt tacctcaccc gtcccctgta tgcttgttaa 2220

<210> 98

<211> 4102

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 98

atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60

ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120

tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180

cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240

caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300

aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360

taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420

gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480

acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540

aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600

gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660

tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720

cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780

tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840

cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900

attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960

acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020

accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080

aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140

aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200

gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260

aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320

ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380

gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440

gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500

gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560

gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620

aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680

ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740

tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800

ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860

caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920

caacctctct gagggcattc gcgagtggtg ggacttgaaa cctggagccc cgaaacccaa 1980

agccaaccag caaaagcagg acgacggccg gggtctggtg cttcctggct acaagtacct 2040

cggacccttc aacggactcg acaaggggga gcccgtcaac gcggcggatg cagcggccct 2100

cgagcacgac aaggcctacg accagcagct caaagcgggt gacaatccgt acctgcggta 2160

taaccacgcc gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa 2220

cctcgggcga gcagtcttcc aggccaagaa gagggttctc gaacctcttg gtctggttga 2280

ggaaggtgct aagacggctc ctggaaagaa acgtccggta gagcagtcgc cacaagagcc 2340

agactcctcc tcgggcattg gcaagacagg ccagcagccc gctaaaaaga gactcaattt 2400

tggtcagact ggcgactcag agtcagtccc cgacccacaa cctctcggag aacctccagc 2460

aacccccgct gctgtgggac ctactacaat ggcttcaggc ggtggcgcac caatggcaga 2520

caataacgaa ggcgccgacg gagtgggtaa tgcctcagga aattggcatt gcgattccac 2580

atggctgggc gacagagtca tcaccaccag cacccgaaca tgggccttgc ccacctataa 2640

caaccacctc tacaagcaaa tctccagtgc ttcaacgggg gccagcaacg acaaccacta 2700

cttcggctac agcaccccct gggggtattt tgatttcaac agattccact gccatttctc 2760

accacgtgac tggcagcgac tcatcaacaa caattgggga ttccggccca agagactcaa 2820

cttcaagctc ttcaacatcc aagtcaagga ggtcacgacg aatgatggcg tcacgaccat 2880

cgctaataac cttaccagca cggttcaagt cttctcggac tcggagtacc agttgccgta 2940

cgtcctcggc tctgcgcacc agggctgcct ccctccgttc ccggcggacg tgttcatgat 3000

tccgcagtac ggctacctaa cgctcaacaa tggcagccag gcagtgggac ggtcatcctt 3060

ttactgcctg gaatatttcc catcgcagat gctgagaacg ggcaataact ttaccttcag 3120

ctacaccttc gaggacgtgc ctttccacag cagctacgcg cacagccaga gcctggaccg 3180

gctgatgaat cctctcatcg accagtacct gtattacctg aacagaactc agaatcagtc 3240

cggaagtgcc caaaacaagg acttgctgtt tagccggggg tctccagctg gcatgtctgt 3300

tcagcccaaa aactggctac ctggaccctg ttaccggcag cagcgcgttt ctaaaacaaa 3360

aacagacaac aacaacagca actttacctg gactggtgct tcaaaatata accttaatgg 3420

gcgtgaatct ataatcaacc ctggcactgc tatggcctca cacaaagacg acaaagacaa 3480

gttctttccc atgagcggtg tcatgatttt tggaaaggag agcgccggag cttcaaacac 3540

tgcattggac aatgtcatga tcacagacga agaggaaatc aaagccacta accccgtggc 3600

caccgaaaga tttgggactg tggcagtcaa tctccagagc agcagcacag accctgcgac 3660

cggagatgtg catgttatgg gagccttacc tggaatggtg tggcaagaca gagacgtata 3720

cctgcagggt cctatttggg ccaaaattcc tcacacggat ggacactttc acccgtctcc 3780

tctcatgggc ggctttggac ttaagcaccc gcctcctcag atcctcatca aaaacacgcc 3840

tgttcctgcg aatcctccgg cagagttttc ggctacaaag tttgcttcat tcatcaccca 3900

gtattccaca ggacaagtga gcgtggagat tgaatgggag ctgcagaaag aaaacagcaa 3960

acgctggaat cccgaagtgc agtatacatc taactatgca aaatctgcca acgttgattt 4020

cactgtggac aacaatggac tttatactga gcctcgcccc attggcaccc gttacctcac 4080

ccgtcccctg tatgcttgtt aa 4102

<210> 99

<211> 2217

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 99

atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60

gagtggtggg cgctgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120

gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180

aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240

cagcagctgc aggcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300

caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360

gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420

ggaaagaaga gaccggtaga gccatcaccc cagcgttctc cagactcctc tacgggcatc 480

ggcaagaaag gccaacagcc cgccagaaaa agactcaatt ttggtcagac tggcgactca 540

gagtcagttc cagaccctca acctctcgga gaacctccag cagcgccctc tggtgtggga 600

cctaatacaa tggctgcagg cggtggcgca ccaatggcag acaataacga aggcgccgac 660

ggagtgggta gttcctcggg aaattggcat tgcgattcca catggctggg cgacagagtc 720

atcaccacca gcacccgaac ctgggccctg cccacctaca acaaccacct ctacaagcaa 780

atctccaacg ggacatcggg aggagccacc aacgacaaca cctacttcgg ctacagcacc 840

ccctgggggt attttgactt taacagattc cactgccact tttcaccacg tgactggcag 900

cgactcatca acaacaactg gggattccgg cccaagagac tcagcttcaa gctcttcaac 960

atccaggtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taacctcacc 1020

agcaccatcc aggtgtttac ggactcggag taccagctgc cgtacgttct cggctctgcc 1080

caccagggct gcctgcctcc gttcccggcg gacgtgttca tgattcccca gtacggctac 1140

ctaacactca acaacggtag tcaggccgtg ggacgctcct ccttctactg cctggaatac 1200

tttccttcgc agatgctgag aaccggcaac aacttccagt ttacttacac cttcgaggac 1260

gtgcctttcc acagcagcta cgcccacagc cagagcttgg accggctgat gaatcctctg 1320

attgaccagt acctgtacta cttgtctcgg actcaaacaa caggaggcac ggcaaatacg 1380

cagactctgg gcttcagcca aggtgggcct aatacaatgg ccaatcaggc aaagaactgg 1440

ctgccaggac cctgttaccg ccaacaacgc gtctcaacga caaccgggca aaacaacaat 1500

agcaactttg cctggactgc tgggaccaaa taccatctga atggaagaaa ttcattggct 1560

aatcctggca tcgctatggc aacacacaaa gacgacgagg agcgtttttt tcccagtaac 1620

gggatcctga tttttggcaa acaaaatgct gccagagaca atgcggatta cagcgatgtc 1680

atgctcacca gcgaggaaga aatcaaaacc actaaccctg tggctacaga ggaatacggt 1740

atcgtggcag ataacttgca gcagcaaaac acggctcctc aaattggaac tgtcaacagc 1800

cagggggcct tacccggtat ggtctggcag aaccgggacg tgtacctgca gggtcccatc 1860

tgggccaaga ttcctcacac ggacggcaac ttccacccgt ctccgctgat gggcggcttt 1920

ggcctgaaac atcctccgcc tcagatcctg atcaagaaca cgcctgtacc tgcggatcct 1980

ccgaccacct tcaaccagtc aaagctgaac tctttcatca cgcaatacag caccggacag 2040

gtcagcgtgg aaattgaatg ggagctgcag aaggaaaaca gcaagcgctg gaaccccgag 2100

atccagtaca cctccaacta ctacaaatct acaagtgtgg actttgctgt taatacagaa 2160

ggcgtgtact ctgaaccccg ccccattggc acccgttacc tcacccgtaa tctgtaa 2217

<210> 100

<211> 4269

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 100

ggtggagtcg tgacgtgaat tacgtcatag ggttagggag gtcctgtatt agaggtcacg 60

tgagtgtttt gcgacatttt gcgacaccat gtggtcacgc tgggtattta agcccgagtg 120

agcacgcagg gtctccattt tgaagcggga ggtttgaacg cgcagccgcc atgccggggt 180

tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc ggcatttctg 240

acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat tctgacatgg 300

atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag cgcgactttc 360

tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg caatttgaga 420

agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg aaatccatgg 480

ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt taccgcggga 540

tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc gccggaggcg 600

ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa acccagcctg 660

agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg aatctcacgg 720

agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag gagcagaaca 780

aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact tcagccaggt 840

acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag cagtggatcc 900

aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg tcccaaatca 960

aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc cccgactacc 1020

tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa attttggaac 1080

taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc acgaaaaagt 1140

tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag accaacatcg 1200

cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc aatgagaact 1260

ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg aagatgaccg 1320

ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc gtggaccaga 1380

aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc aacaccaaca 1440

tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg ttgcaagacc 1500

ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag gtcaccaagc 1560

aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg gagcatgaat 1620

tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca gatataagtg 1680

agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg gaagcttcga 1740

tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg aatctgatgc 1800

tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc ttcactcacg 1860

gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt tctgtcgtca 1920

aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg ccagacgctt 1980

gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa caataaatga 2040

cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga caacctctct 2100

gagggcattc gcgagtggtg ggcgctgaaa cctggagccc cgaagcccaa agccaaccag 2160

caaaagcagg acgacggccg gggtctggtg cttcctggct acaagtacct cggacccttc 2220

aacggactcg acaaggggga gcccgtcaac gcggcggacg cagcggccct cgagcacgac 2280

aaggcctacg accagcagct gcaggcgggt gacaatccgt acctgcggta taaccacgcc 2340

gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa cctcgggcga 2400

gcagtcttcc aggccaagaa gcgggttctc gaacctctcg gtctggttga ggaaggcgct 2460

aagacggctc ctggaaagaa gagaccggta gagccatcac cccagcgttc tccagactcc 2520

tctacgggca tcggcaagaa aggccaacag cccgccagaa aaagactcaa ttttggtcag 2580

actggcgact cagagtcagt tccagaccct caacctctcg gagaacctcc agcagcgccc 2640

tctggtgtgg gacctaatac aatggctgca ggcggtggcg caccaatggc agacaataac 2700

gaaggcgccg acggagtggg tagttcctcg ggaaattggc attgcgattc cacatggctg 2760

ggcgacagag tcatcaccac cagcacccga acctgggccc tgcccaccta caacaaccac 2820

ctctacaagc aaatctccaa cgggacatcg ggaggagcca ccaacgacaa cacctacttc 2880

ggctacagca ccccctgggg gtattttgac tttaacagat tccactgcca cttttcacca 2940

cgtgactggc agcgactcat caacaacaac tggggattcc ggcccaagag actcagcttc 3000

aagctcttca acatccaggt caaggaggtc acgcagaatg aaggcaccaa gaccatcgcc 3060

aataacctca ccagcaccat ccaggtgttt acggactcgg agtaccagct gccgtacgtt 3120

ctcggctctg cccaccaggg ctgcctgcct ccgttcccgg cggacgtgtt catgattccc 3180

cagtacggct acctaacact caacaacggt agtcaggccg tgggacgctc ctccttctac 3240

tgcctggaat actttccttc gcagatgctg agaaccggca acaacttcca gtttacttac 3300

accttcgagg acgtgccttt ccacagcagc tacgcccaca gccagagctt ggaccggctg 3360

atgaatcctc tgattgacca gtacctgtac tacttgtctc ggactcaaac aacaggaggc 3420

acggcaaata cgcagactct gggcttcagc caaggtgggc ctaatacaat ggccaatcag 3480

gcaaagaact ggctgccagg accctgttac cgccaacaac gcgtctcaac gacaaccggg 3540

caaaacaaca atagcaactt tgcctggact gctgggacca aataccatct gaatggaaga 3600

aattcattgg ctaatcctgg catcgctatg gcaacacaca aagacgacga ggagcgtttt 3660

tttcccagta acgggatcct gatttttggc aaacaaaatg ctgccagaga caatgcggat 3720

tacagcgatg tcatgctcac cagcgaggaa gaaatcaaaa ccactaaccc tgtggctaca 3780

gaggaatacg gtatcgtggc agataacttg cagcagcaaa acacggctcc tcaaattgga 3840

actgtcaaca gccagggggc cttacccggt atggtctggc agaaccggga cgtgtacctg 3900

cagggtccca tctgggccaa gattcctcac acggacggca acttccaccc gtctccgctg 3960

atgggcggct ttggcctgaa acatcctccg cctcagatcc tgatcaagaa cacgcctgta 4020

cctgcggatc ctccgaccac cttcaaccag tcaaagctga actctttcat cacgcaatac 4080

agcaccggac aggtcagcgt ggaaattgaa tgggagctgc agaaggaaaa cagcaagcgc 4140

tggaaccccg agatccagta cacctccaac tactacaaat ctacaagtgt ggactttgct 4200

gttaatacag aaggcgtgta ctctgaaccc cgccccattg gcacccgtta cctcacccgt 4260

aatctgtaa 4269

<210> 101

<211> 2211

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 101

atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60

gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120

aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180

aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240

cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300

caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360

gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420

ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480

aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540

tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600

cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660

gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720

accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780

tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840

tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900

ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960

caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020

acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080

gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140

acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200

ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260

cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320

gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380

ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440

ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500

tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560

ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620

ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680

accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740

gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800

atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860

aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920

aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980

gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040

gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100

tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160

tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211

<210> 102

<211> 4093

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 102

atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60

ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120

tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180

cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240

caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300

aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360

taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420

gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480

acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540

aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600

gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660

tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720

cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780

tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840

cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900

attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960

acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020

accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080

aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140

aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200

gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260

aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320

ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380

gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440

gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500

gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560

gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620

aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680

ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740

tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800

ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860

caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920

caaccttagt gaaggaattc gcgagtggtg ggctttgaaa cctggagccc ctcaacccaa 1980

ggcaaatcaa caacatcaag acaacgctcg aggtcttgtg cttccgggtt acaaatacct 2040

tggacccggc aacggactcg acaaggggga gccggtcaac gcagcagacg cggcggccct 2100

cgagcacgac aaggcctacg accagcagct caaggccgga gacaacccgt acctcaagta 2160

caaccacgcc gacgccgagt tccaggagcg gctcaaagaa gatacgtctt ttgggggcaa 2220

cctcgggcga gcagtcttcc aggccaaaaa gaggcttctt gaacctcttg gtctggttga 2280

ggaagcggct aagacggctc ctggaaagaa gaggcctgta gagcagtctc ctcaggaacc 2340

ggactcctcc gcgggtattg gcaaatcggg tgcacagccc gctaaaaaga gactcaattt 2400

cggtcagact ggcgacacag agtcagtccc agaccctcaa ccaatcggag aacctcccgc 2460

agccccctca ggtgtgggat ctcttacaat ggcttcaggt ggtggcgcac cagtggcaga 2520

caataacgaa ggtgccgatg gagtgggtag ttcctcggga aattggcatt gcgattccca 2580

atggctgggg gacagagtca tcaccaccag cacccgaacc tgggccctgc ccacctacaa 2640

caatcacctc tacaagcaaa tctccaacag cacatctgga ggatcttcaa atgacaacgc 2700

ctacttcggc tacagcaccc cctgggggta ttttgacttc aacagattcc actgccactt 2760

ctcaccacgt gactggcagc gactcatcaa caacaactgg ggattccggc ctaagcgact 2820

caacttcaag ctcttcaaca ttcaggtcaa agaggttacg gacaacaatg gagtcaagac 2880

catcgccaat aaccttacca gcacggtcca ggtcttcacg gactcagact atcagctccc 2940

gtacgtgctc gggtcggctc acgagggctg cctcccgccg ttcccagcgg acgttttcat 3000

gattcctcag tacgggtatc tgacgcttaa tgatggaagc caggccgtgg gtcgttcgtc 3060

cttttactgc ctggaatatt tcccgtcgca aatgctaaga acgggtaaca acttccagtt 3120

cagctacgag tttgagaacg tacctttcca tagcagctac gctcacagcc aaagcctgga 3180

ccgactaatg aatccactca tcgaccaata cttgtactat ctctcaaaga ctattaacgg 3240

ttctggacag aatcaacaaa cgctaaaatt cagtgtggcc ggacccagca acatggctgt 3300

ccagggaaga aactacatac ctggacccag ctaccgacaa caacgtgtct caaccactgt 3360

gactcaaaac aacaacagcg aatttgcttg gcctggagct tcttcttggg ctctcaatgg 3420

acgtaatagc ttgatgaatc ctggacctgc tatggccagc cacaaagaag gagaggaccg 3480

tttctttcct ttgtctggat ctttaatttt tggcaaacaa ggaactggaa gagacaacgt 3540

ggatgcggac aaagtcatga taaccaacga agaagaaatt aaaactacta acccggtagc 3600

aacggagtcc tatggacaag tggccacaaa ccaccagagt gcccaagcac aggcgcagac 3660

cggctgggtt caaaaccaag gaatacttcc gggtatggtt tggcaggaca gagatgtgta 3720

cctgcaagga cccatttggg ccaaaattcc tcacacggac ggcaactttc acccttctcc 3780

gctgatggga gggtttggaa tgaagcaccc gcctcctcag atcctcatca aaaacacacc 3840

tgtacctgcg gatcctccaa cggccttcaa caaggacaag ctgaactctt tcatcaccca 3900

gtattctact ggccaagtca gcgtggagat cgagtgggag ctgcagaagg aaaacagcaa 3960

gcgctggaac ccggagatcc agtacacttc caactattac aagtctaata atgttgaatt 4020

tgctgttaat actgaaggtg tatatagtga accccgcccc attggcacca gatacctgac 4080

tcgtaatctg taa 4093

<210> 103

<211> 2217

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 103

atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60

gagtggtggg acttgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120

gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180

aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240

cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300

caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360

gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420

ggaaagaaga gaccggtaga gccatcaccc cagcgttctc cagactcctc tacgggcatc 480

ggcaagaaag gccagcagcc cgcgaaaaag agactcaact ttgggcagac tggcgactca 540

gagtcagtgc ccgaccctca accaatcgga gaaccccccg caggcccctc tggtctggga 600

tctggtacaa tggctgcagg cggtggcgct ccaatggcag acaataacga aggcgccgac 660

ggagtgggta gttcctcagg aaattggcat tgcgattcca catggctggg cgacagagtc 720

atcaccacca gcacccgaac ctgggccctc cccacctaca acaaccacct ctacaagcaa 780

atctccaacg ggacttcggg aggaagcacc aacgacaaca cctacttcgg ctacagcacc 840

ccctgggggt attttgactt taacagattc cactgccact tctcaccacg tgactggcag 900

cgactcatca acaacaactg gggattccgg cccaagagac tcaacttcaa gctcttcaac 960

atccaggtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taaccttacc 1020

agcacgattc aggtctttac ggactcggaa taccagctcc cgtacgtcct cggctctgcg 1080

caccagggct gcctgcctcc gttcccggcg gacgtcttca tgattcctca gtacgggtac 1140

ctgactctga acaatggcag tcaggccgtg ggccgttcct ccttctactg cctggagtac 1200

tttccttctc aaatgctgag aacgggcaac aactttgagt tcagctacca gtttgaggac 1260

gtgccttttc acagcagcta cgcgcacagc caaagcctgg accggctgat gaaccccctc 1320

atcgaccagt acctgtacta cctgtctcgg actcagtcca cgggaggtac cgcaggaact 1380

cagcagttgc tattttctca ggccgggcct aataacatgt cggctcaggc caaaaactgg 1440

ctacccgggc cctgctaccg gcagcaacgc gtctccacga cactgtcgca aaataacaac 1500

agcaactttg cctggaccgg tgccaccaag tatcatctga atggcagaga ctctctggta 1560

aatcccggtg tcgctatggc aacccacaag gacgacgaag agcgattttt tccgtccagc 1620

ggagtcttaa tgtttgggaa acagggagct ggaaaagaca acgtggacta tagcagcgtt 1680

atgctaacca gtgaggaaga aattaaaacc accaacccag tggccacaga acagtacggc 1740

gtggtggccg ataacctgca acagcaaaac gccgctccta ttgtaggggc cgtcaacagt 1800

caaggagcct tacctggcat ggtctggcag aaccgggacg tgtacctgca gggtcctatc 1860

tgggccaaga ttcctcacac ggacggaaac tttcatccct cgccgctgat gggaggcttt 1920

ggactgaaac acccgcctcc tcagatcctg attaagaata cacctgttcc cgcggatcct 1980

ccaactacct tcagtcaagc taagctggcg tcgttcatca cgcagtacag caccggacag 2040

gtcagcgtgg aaattgaatg ggagctgcag aaagaaaaca gcaaacgctg gaacccagag 2100

attcaataca cttccaacta ctacaaatct acaaatgtgg actttgctgt taacacagat 2160

ggcacttatt ctgagcctcg ccccatcggc acccgttacc tcacccgtaa tctgtaa 2217

<210> 104

<211> 4269

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 104

ggtggagtcg tgacgtgaat tacgtcatag ggttagggag gtcctgtatt agaggtcacg 60

tgagtgtttt gcgacatttt gcgacaccat gtggtcacgc tgggtattta agcccgagtg 120

agcacgcagg gtctccattt tgaagcggga ggtttgaacg cgcagccgcc atgccggggt 180

tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc ggcatttctg 240

acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat tctgacatgg 300

atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag cgcgactttc 360

tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg caatttgaga 420

agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg aaatccatgg 480

ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt taccgcggga 540

tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc gccggaggcg 600

ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa acccagcctg 660

agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg aatctcacgg 720

agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag gagcagaaca 780

aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact tcagccaggt 840

acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag cagtggatcc 900

aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg tcccaaatca 960

aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc cccgactacc 1020

tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa attttggaac 1080

taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc acgaaaaagt 1140

tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag accaacatcg 1200

cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc aatgagaact 1260

ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg aagatgaccg 1320

ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc gtggaccaga 1380

aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc aacaccaaca 1440

tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg ttgcaagacc 1500

ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag gtcaccaagc 1560

aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg gagcatgaat 1620

tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca gatataagtg 1680

agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg gaagcttcga 1740

tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg aatctgatgc 1800

tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc ttcactcacg 1860

gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt tctgtcgtca 1920

aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg ccagacgctt 1980

gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa caataaatga 2040

cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga caacctctct 2100

gagggcattc gcgagtggtg ggacttgaaa cctggagccc cgaaacccaa agccaaccag 2160

caaaagcagg acgacggccg gggtctggtg cttcctggct acaagtacct cggacccttc 2220

aacggactcg acaaggggga gcccgtcaac gcggcggacg cagcggccct cgagcacgac 2280

aaggcctacg accagcagct caaagcgggt gacaatccgt acctgcggta taaccacgcc 2340

gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa cctcgggcga 2400

gcagtcttcc aggccaagaa gcgggttctc gaacctctcg gtctggttga ggaaggcgct 2460

aagacggctc ctggaaagaa gagaccggta gagccatcac cccagcgttc tccagactcc 2520

tctacgggca tcggcaagaa aggccagcag cccgcgaaaa agagactcaa ctttgggcag 2580

actggcgact cagagtcagt gcccgaccct caaccaatcg gagaaccccc cgcaggcccc 2640

tctggtctgg gatctggtac aatggctgca ggcggtggcg ctccaatggc agacaataac 2700

gaaggcgccg acggagtggg tagttcctca ggaaattggc attgcgattc cacatggctg 2760

ggcgacagag tcatcaccac cagcacccga acctgggccc tccccaccta caacaaccac 2820

ctctacaagc aaatctccaa cgggacttcg ggaggaagca ccaacgacaa cacctacttc 2880

ggctacagca ccccctgggg gtattttgac tttaacagat tccactgcca cttctcacca 2940

cgtgactggc agcgactcat caacaacaac tggggattcc ggcccaagag actcaacttc 3000

aagctcttca acatccaggt caaggaggtc acgcagaatg aaggcaccaa gaccatcgcc 3060

aataacctta ccagcacgat tcaggtcttt acggactcgg aataccagct cccgtacgtc 3120

ctcggctctg cgcaccaggg ctgcctgcct ccgttcccgg cggacgtctt catgattcct 3180

cagtacgggt acctgactct gaacaatggc agtcaggccg tgggccgttc ctccttctac 3240

tgcctggagt actttccttc tcaaatgctg agaacgggca acaactttga gttcagctac 3300

cagtttgagg acgtgccttt tcacagcagc tacgcgcaca gccaaagcct ggaccggctg 3360

atgaaccccc tcatcgacca gtacctgtac tacctgtctc ggactcagtc cacgggaggt 3420

accgcaggaa ctcagcagtt gctattttct caggccgggc ctaataacat gtcggctcag 3480

gccaaaaact ggctacccgg gccctgctac cggcagcaac gcgtctccac gacactgtcg 3540

caaaataaca acagcaactt tgcctggacc ggtgccacca agtatcatct gaatggcaga 3600

gactctctgg taaatcccgg tgtcgctatg gcaacccaca aggacgacga agagcgattt 3660

tttccgtcca gcggagtctt aatgtttggg aaacagggag ctggaaaaga caacgtggac 3720

tatagcagcg ttatgctaac cagtgaggaa gaaattaaaa ccaccaaccc agtggccaca 3780

gaacagtacg gcgtggtggc cgataacctg caacagcaaa acgccgctcc tattgtaggg 3840

gccgtcaaca gtcaaggagc cttacctggc atggtctggc agaaccggga cgtgtacctg 3900

cagggtccta tctgggccaa gattcctcac acggacggaa actttcatcc ctcgccgctg 3960

atgggaggct ttggactgaa acacccgcct cctcagatcc tgattaagaa tacacctgtt 4020

cccgcggatc ctccaactac cttcagtcaa gctaagctgg cgtcgttcat cacgcagtac 4080

agcaccggac aggtcagcgt ggaaattgaa tgggagctgc agaaagaaaa cagcaaacgc 4140

tggaacccag agattcaata cacttccaac tactacaaat ctacaaatgt ggactttgct 4200

gttaacacag atggcactta ttctgagcct cgccccatcg gcacccgtta cctcacccgt 4260

aatctgtaa 4269

<210> 105

<211> 2217

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 105

atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60

gagtggtggg acctgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120

aacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180

aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240

cagcagctcc aagcgggtga caatccgtac ctgcggtata atcacgccga cgccgagttt 300

caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgcgc agtcttccag 360

gccaaaaagc gggttctcga acctctgggc ctggttgaat cgccggttaa gacggctcct 420

ggaaagaaga gaccggtaga gccatcaccc cagcgctctc cagactcctc tacgggcatc 480

ggcaagaaag gccagcagcc cgcaaaaaag agactcaatt ttgggcagac tggcgactca 540

gagtcagtcc ccgaccctca accaatcgga gaaccaccag caggcccctc tggtctggga 600

tctggtacaa tggctgcagg cggtggcgct ccaatggcag acaataacga aggcgccgac 660

ggagtgggta gttcctcagg aaattggcat tgcgattcca catggctggg cgacagagtc 720

atcaccacca gcacccgcac ctgggccctg cccacctaca acaaccacct ctacaagcaa 780

atctccaacg ggacctcggg aggaagcacc aacgacaaca cctacttcgg ctacagcacc 840

ccctgggggt attttgactt caacagattc cactgccact tttcaccacg tgactggcag 900

cgactcatca acaacaactg gggattccgg cccaagaggc tcaacttcaa gctcttcaac 960

atccaagtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taaccttacc 1020

agcacgattc aggtctttac ggactcggaa taccagctcc cgtacgtgct cggctcggcg 1080

caccagggct gcctgcctcc gttcccggcg gacgtcttca tgattcctca gtacgggtac 1140

ctgactctga acaatggcag tcaggctgtg ggccggtcgt ccttctactg cctggagtac 1200

tttccttctc aaatgctgag aacgggcaac aactttgaat tcagctacaa cttcgaggac 1260

gtgcccttcc acagcagcta cgcgcacagc cagagcctgg accggctgat gaaccctctc 1320

atcgaccagt acttgtacta cctgtcccgg actcaaagca cgggcggtac tgcaggaact 1380

cagcagttgc tattttctca ggccgggcct aacaacatgt cggctcaggc caagaactgg 1440

ctacccggtc cctgctaccg gcagcaacgc gtctccacga cactgtcgca gaacaacaac 1500

agcaactttg cctggacggg tgccaccaag tatcatctga atggcagaga ctctctggtg 1560

aatcctggcg ttgccatggc tacccacaag gacgacgaag agcgattttt tccatccagc 1620

ggagtcttaa tgtttgggaa acagggagct ggaaaagaca acgtggacta tagcagcgtg 1680

atgctaacca gcgaggaaga aataaagacc accaacccag tggccacaga acagtacggc 1740

gtggtggccg ataacctgca acagcaaaac gccgctccta ttgtaggggc cgtcaatagt 1800

caaggagcct tacctgggat ggtgtggcag aaccgggacg tgtacctgca gggtcccatc 1860

tgggccaaga ttcctcatac ggacggcaac tttcatccct cgccgctgat gggaggcttt 1920

ggactgaagc atccgcctcc tcagatcctg attaaaaaca cacctgttcc cgcggatcct 1980

ccgaccacct tcaatcaggc caagctggct tctttcatca cgcagtacag taccggccag 2040

gtcagcgtgg agatcgagtg ggagctgcag aaggagaaca gcaaacgctg gaacccagag 2100

attcagtaca cttccaacta ctacaaatct acaaatgtgg actttgctgt caatactgag 2160

ggtacttatt ccgagcctcg ccccattggc acccgttacc tcacccgtaa tctgtaa 2217

<210> 106

<211> 4099

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 106

atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60

ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120

tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180

cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240

caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300

aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360

taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420

gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480

acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540

aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600

gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660

tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720

cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780

tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840

cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900

attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960

acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020

accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080

aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140

aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200

gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260

aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320

ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380

gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440

gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500

gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560

gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620

aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680

ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740

tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800

ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860

caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920

caacctctct gagggcattc gcgagtggtg ggacctgaaa cctggagccc cgaaacccaa 1980

agccaaccag caaaagcagg acaacggccg gggtctggtg cttcctggct acaagtacct 2040

cggacccttc aacggactcg acaaggggga gcccgtcaac gcggcggacg cagcggccct 2100

cgagcacgac aaggcctacg accagcagct ccaagcgggt gacaatccgt acctgcggta 2160

taatcacgcc gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa 2220

cctcgggcgc gcagtcttcc aggccaaaaa gcgggttctc gaacctctgg gcctggttga 2280

atcgccggtt aagacggctc ctggaaagaa gagaccggta gagccatcac cccagcgctc 2340

tccagactcc tctacgggca tcggcaagaa aggccagcag cccgcaaaaa agagactcaa 2400

ttttgggcag actggcgact cagagtcagt ccccgaccct caaccaatcg gagaaccacc 2460

agcaggcccc tctggtctgg gatctggtac aatggctgca ggcggtggcg ctccaatggc 2520

agacaataac gaaggcgccg acggagtggg tagttcctca ggaaattggc attgcgattc 2580

cacatggctg ggcgacagag tcatcaccac cagcacccgc acctgggccc tgcccaccta 2640

caacaaccac ctctacaagc aaatctccaa cgggacctcg ggaggaagca ccaacgacaa 2700

cacctacttc ggctacagca ccccctgggg gtattttgac ttcaacagat tccactgcca 2760

cttttcacca cgtgactggc agcgactcat caacaacaac tggggattcc ggcccaagag 2820

gctcaacttc aagctcttca acatccaagt caaggaggtc acgcagaatg aaggcaccaa 2880

gaccatcgcc aataacctta ccagcacgat tcaggtcttt acggactcgg aataccagct 2940

cccgtacgtg ctcggctcgg cgcaccaggg ctgcctgcct ccgttcccgg cggacgtctt 3000

catgattcct cagtacgggt acctgactct gaacaatggc agtcaggctg tgggccggtc 3060

gtccttctac tgcctggagt actttccttc tcaaatgctg agaacgggca acaactttga 3120

attcagctac aacttcgagg acgtgccctt ccacagcagc tacgcgcaca gccagagcct 3180

ggaccggctg atgaaccctc tcatcgacca gtacttgtac tacctgtccc ggactcaaag 3240

cacgggcggt actgcaggaa ctcagcagtt gctattttct caggccgggc ctaacaacat 3300

gtcggctcag gccaagaact ggctacccgg tccctgctac cggcagcaac gcgtctccac 3360

gacactgtcg cagaacaaca acagcaactt tgcctggacg ggtgccacca agtatcatct 3420

gaatggcaga gactctctgg tgaatcctgg cgttgccatg gctacccaca aggacgacga 3480

agagcgattt tttccatcca gcggagtctt aatgtttggg aaacagggag ctggaaaaga 3540

caacgtggac tatagcagcg tgatgctaac cagcgaggaa gaaataaaga ccaccaaccc 3600

agtggccaca gaacagtacg gcgtggtggc cgataacctg caacagcaaa acgccgctcc 3660

tattgtaggg gccgtcaata gtcaaggagc cttacctggg atggtgtggc agaaccggga 3720

cgtgtacctg cagggtccca tctgggccaa gattcctcat acggacggca actttcatcc 3780

ctcgccgctg atgggaggct ttggactgaa gcatccgcct cctcagatcc tgattaaaaa 3840

cacacctgtt cccgcggatc ctccgaccac cttcaatcag gccaagctgg cttctttcat 3900

cacgcagtac agtaccggcc aggtcagcgt ggagatcgag tgggagctgc agaaggagaa 3960

cagcaaacgc tggaacccag agattcagta cacttccaac tactacaaat ctacaaatgt 4020

ggactttgct gtcaatactg agggtactta ttccgagcct cgccccattg gcacccgtta 4080

cctcacccgt aatctgtaa 4099

Claims

1.一种第一核酸载体，其包含：

编码AAVRep蛋白的第一核苷酸序列；

包含含有转基因的重组AAV(rAAV)基因组的第二核苷酸序列；以及

编码AAV衣壳蛋白的第三核苷酸序列，

其中所述核酸载体不包含辅助病毒基因。

2.如权利要求1所述的核酸载体，其从5'至3'包含：

编码AAVRep蛋白的所述第一核苷酸序列；

包含含有转基因的重组AAV(rAAV)基因组的所述第二核苷酸序列；以及

编码AAV衣壳蛋白的所述第三核苷酸序列，

其中所述核酸载体不包含辅助病毒基因。

3.如权利要求1所述的核酸载体，其从5'至3'包含：

编码AAVRep蛋白的所述第一核苷酸序列；

编码AAV衣壳蛋白的所述第三核苷酸序列。

4.如权利要求1-3中任一项所述的核酸载体，其中所述核酸载体是DNA质粒或DNA最小载体。

5.一种重组AAV(rAAV)包装系统，其包含：

(i)第一核酸载体，其包含：

编码AAVRep蛋白的第一核苷酸序列；

编码AAV衣壳蛋白的第三核苷酸序列，以及

(ii)第二核酸载体，其包含辅助病毒基因。

6.如权利要求5所述的包装系统，其中所述第一核酸载体从5'至3'包含：

编码AAVRep蛋白的所述第一核苷酸序列；

编码AAV衣壳蛋白的所述第三核苷酸序列。

7.如权利要求5或6所述的包装系统，其中所述第一核酸载体是DNA质粒或DNA最小载体。

8.如权利要求5-7中任一项所述的包装系统，其中所述第二核酸载体是DNA质粒或DNA最小载体。

9.如权利要求1-8中任一项所述的核酸载体或包装系统，其中所述转基因编码多肽。

10.如权利要求1-8中任一项所述的核酸载体或包装系统，其中所述转基因编码miRNA、shRNA、siRNA、反义RNA、gRNA、antagomir、miRNA海绵、RNA适体核酶、RNA适体、lncRNA、核酶或mRNA。

11.如权利要求1-8中任一项所述的核酸载体或包装系统，其中所述转基因编码葡萄糖-6-磷酸酶(G6Pase)或共济蛋白(FXN)。

12.如任一前述权利要求所述的核酸载体或包装系统，其中所述rAAV基因组还包含与所述转基因可操作地连接的转录调控元件。

13.如权利要求12所述的核酸载体或包装系统，其中所述转录调控元件包含启动子元件和/或内含子元件。

14.如任一前述权利要求所述的核酸载体或包装系统，其中所述rAAV基因组还包含多聚腺苷酸化序列。

15.如权利要求14所述的核酸载体或包装系统，其中所述多聚腺苷酸化序列在所述转基因的3'。

16.如任一前述权利要求所述的核酸载体或包装系统，其中所述rAAV基因组还包含在所述转基因的5’的5’反向末端重复(5’ITR)核苷酸序列和在所述转基因的3’的3'反向末端重复(3’ITR)核苷酸序列。

17.如任一前述权利要求所述的核酸载体或包装系统，其中所述AAV Rep蛋白是野生型Rep蛋白或其变体。

18.如任一前述权利要求所述的核酸载体或包装系统，其中所述AAV Rep蛋白是AAV2Rep蛋白或其变体。

19.如任一前述权利要求所述的核酸载体或包装系统，其中所述第一核苷酸序列还包含与所述AAV Rep蛋白编码序列可操作地连接的转录调控元件。

20.如权利要求19所述的核酸载体或包装系统，其中所述转录调控元件包含选自组成型启动子、诱导型启动子或天然启动子的启动子。

21.如权利要求20所述的核酸载体或包装系统，其中所述启动子选自P5启动子、P19启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。

22.如任一前述权利要求所述的核酸载体或包装系统，其中所述AAV衣壳蛋白选自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh10、AAVRh32.33、AAVrh74、AAV-DJ、AAV-LK03、NP59、VOY101、VOY201、VOY701、VOY801、VOY1101、AAVPHP.N、AAVPHP.A、AAVPHP.B、PHP.B2、PHP.B3、G2A3、G2B4、G2B5和PHP.S。

23.如任一前述权利要求所述的核酸载体或包装系统，其中所述第三核苷酸序列还包含与所述AAV衣壳蛋白编码序列可操作地连接的转录调控元件。

24.如权利要求23所述的核酸载体或包装系统，其中所述转录调控元件包含选自组成型启动子、诱导型启动子或天然启动子的启动子。

25.如权利要求24所述的核酸载体或包装系统，其中所述启动子选自P40启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。

26.如权利要求5-25中任一项所述的包装系统，其中所述辅助病毒基因源自选自腺病毒、疱疹病毒、痘病毒、巨细胞病毒和杆状病毒的辅助病毒。

27.如权利要求5-26中任一项所述的包装系统，其中所述辅助病毒基因是源自选自E1、E2、E4和VA的腺病毒的RNA基因。

28.如权利要求5-27中任一项所述的包装系统，其中所述第二核酸载体还包含与所述辅助病毒基因可操作地连接的转录调控元件。

29.如权利要求28所述的包装系统，其中所述转录调控元件包含选自组成型启动子、诱导型启动子或天然启动子的启动子。

30.如权利要求29所述的包装系统，其中所述启动子选自RSV LTR启动子、CMV立即早期启动子、SV40启动子、二氢叶酸还原酶启动子、细胞质β-肌动蛋白启动子、磷酸甘油酸激酶(PGK)启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。

31.如权利要求5-30中任一项所述的包装系统，其中所述第二核酸载体包含与SEQ IDNO:60、61或62所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。

32.如权利要求5-31中任一项所述的包装系统，其中所述第二核酸载体包含与SEQ IDNO:63所示的核苷酸序列具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一性的核苷酸序列。

33.如权利要求5-32中任一项所述的包装系统，其中所述辅助病毒基因是源自选自UL5/8/52、ICP0、ICP4、ICP22和UL30/UL42的疱疹病毒的基因。

34.如权利要求33所述的包装系统，其中所述第二核酸载体还包含与所述辅助病毒基因可操作地连接的转录调控元件。

35.如权利要求34所述的包装系统，其中所述转录调控元件包含选自组成型启动子、诱导型启动子或天然启动子的启动子。

36.如权利要求35所述的包装系统，其中所述启动子选自RSV LTR启动子、CMV立即早期启动子、SV40启动子、二氢叶酸还原酶启动子、细胞质β-肌动蛋白启动子、磷酸甘油酸激酶(PGK)启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。

37.一种宿主细胞，其包含权利要求1-4或9-25中任一项所述的核酸载体，或权利要求5-36中任一项所述的包装系统。

38.如权利要求37所述的宿主细胞，其中所述宿主细胞是哺乳动物细胞。

39.如权利要求38所述的宿主细胞，其中所述哺乳动物细胞选自COS细胞、CHO细胞、BHK细胞、MDCK细胞、HEK293细胞、HEK293T细胞、HEK293F细胞、NS0细胞、PER.C6细胞、VERO细胞、CRL7O3O细胞、HsS78Bst细胞、HeLa细胞、NIH 3T3细胞、HepG2细胞、SP210细胞、R1.1细胞、B-W细胞、L-M细胞、BSC1细胞、BSC40细胞、YB/20细胞和BMT10细胞。

40.如权利要求38或39所述的宿主细胞，其中所述哺乳动物细胞是HEK293细胞。

41.一种rAAV的重组制备方法，所述方法包括在产生所述rAAV的条件下将权利要求5-36中任一项所述的包装系统引入哺乳动物细胞中。

42.如权利要求41所述的方法，其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率选自1:0.2、1:0.4、1:0.6、1:0.8、1:1、1:2、1:3或1:4。

43.如权利要求41或42所述的方法，其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率为1:2。

44.如权利要求41或42所述的方法，其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率为1:0.2至1:1。

45.如权利要求44所述的方法，其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率为1:0.6。

46.如权利要求44所述的方法，其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率为1:0.8。

47.如权利要求44所述的方法，其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率为1:1。

48.如权利要求41-47中任一项所述的方法，其中所述方法包括引入所述包装系统的0.1至4μg DNA/1E6个细胞。

49.如权利要求41-48中任一项所述的方法，其中所述方法包括引入所述包装系统的0.5至1μg DNA/1E6个细胞。

50.如权利要求41-49中任一项所述的方法，其中所述方法包括引入所述包装系统的0.6、0.7、0.8、0.9或1μg DNA/1E6个细胞。

51.如权利要求41-49中任一项所述的方法，其中所述方法包括引入所述包装系统的0.75DNA/1E6个细胞。

52.如权利要求41-51中任一项所述的方法，其中所述方法与包括使用以下哺乳动物细胞产生rAAV的方法相比导致增加的rAAV滴度，所述哺乳动物细胞包含：

(i)包含编码所述AAV Rep蛋白和所述AAV衣壳蛋白的核苷酸序列的第一载体；

(ii)包含所述rAAV基因组的第二载体；以及

(iii)包含所述一种或多种辅助病毒基因的第三载体。

53.如权利要求41-51中任一项所述的方法，其中所述方法与包括使用以下哺乳动物细胞产生rAAV的方法相比导致增加的完整载体基因组的百分比，所述哺乳动物细胞包含：

(ii)包含所述rAAV基因组的第二载体；以及

(iii)包含所述一种或多种辅助病毒基因的第三载体。

54.如权利要求41-53中任一项所述的方法，其中所述哺乳动物细胞选自COS细胞、CHO细胞、BHK细胞、MDCK细胞、HEK293细胞、HEK293T细胞、HEK293F细胞、NS0细胞、PER.C6细胞、VERO细胞、CRL7O3O细胞、HsS78Bst细胞、HeLa细胞、NIH 3T3细胞、HepG2细胞、SP210细胞、R1.1细胞、B-W细胞、L-M细胞、BSC1细胞、BSC40细胞、YB/20细胞和BMT10细胞。

55.如权利要求41-54中任一项所述的方法，其中所述哺乳动物细胞为HEK293细胞。

56.如权利要求41-55中任一项所述的方法，其中所述哺乳动物细胞在细胞培养物中提供。

57.一种如权利要求37-40中任一项所定义的宿主细胞的群体，其中所述宿主细胞的群体在细胞培养物中提供。

58.如权利要求56所述的方法或如权利要求57所述的宿主细胞的群体，其中所述细胞培养物的体积为至少2升、至少50升或至少2000升。