CN117716042A - 腺相关病毒包装系统 - Google Patents

腺相关病毒包装系统 Download PDF

Info

Publication number
CN117716042A
CN117716042A CN202280044370.8A CN202280044370A CN117716042A CN 117716042 A CN117716042 A CN 117716042A CN 202280044370 A CN202280044370 A CN 202280044370A CN 117716042 A CN117716042 A CN 117716042A
Authority
CN
China
Prior art keywords
amino acid
nucleic acid
promoter
vector
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280044370.8A
Other languages
English (en)
Inventor
L·范利舒特
M·斯坦维克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oxford Biomedica US LLC
Original Assignee
Oxford Biomedica US LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oxford Biomedica US LLC filed Critical Oxford Biomedica US LLC
Priority claimed from PCT/US2022/073138 external-priority patent/WO2022272297A1/en
Publication of CN117716042A publication Critical patent/CN117716042A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本文提供了用于产生重组腺相关病毒(rAAV)的双重载体转染系统。所述双重载体转染系统通常包含:(1)第一核酸载体,其包含:编码AAV Rep蛋白的第一核苷酸序列、包含含有转基因的rAAV基因组的第二核苷酸序列和编码AAV衣壳蛋白的第三核苷酸序列;和(2)第二核酸载体,其包含辅助病毒基因。

Description

腺相关病毒包装系统
相关申请
本申请要求于2021年6月25日提交的美国临时专利申请序列号63/202,817、于2021年10月7日提交的美国临时专利申请序列号63/262,218和于2022年1月11日提交的美国临时专利申请序列号63/266,646的优先权,这些申请的全部公开内容特此通过引用并入本文。
序列表
本申请含有以ASCII格式以电子方式提交,并且特此通过引用整体并入本文的序列表(2022年6月21日创建的所述ASCII副本命名为“HMW-043_SL.txt”且大小为336,866字节)。
背景技术
腺相关病毒(AAV)具有独特的特征,这些独特的特征使其作为用于将外源DNA递送到细胞中用于基因治疗目的的载体具有吸引力。AAV的商业制造通常采用哺乳动物细胞或昆虫细胞系统。基于哺乳动物细胞的商业AAV生产系统通常涉及将三种质粒转染到细胞中:含有编码AAV Rep和AAV衣壳蛋白的序列的第一质粒;含有AAV载体基因组的第二质粒;和含有一个或多个辅助病毒基因(通常是腺病毒或疱疹病毒基因)的第三质粒。尽管有效,但是此三种质粒AAV制造系统优化复杂并且促成与商业AAV治疗剂相关的商品的高成本。
因此,本领域需要改进的AAV制造系统,这些系统导致有效的AAV生产,但具有降低的复杂性和成本。
发明内容
本公开提供了用于产生重组腺相关病毒(rAAV)的双重载体转染系统。本文所述的双重载体转染系统通常包含:(1)第一核酸载体,其包含:编码AAV Rep蛋白的第一核苷酸序列、包含含有转基因的rAAV基因组的第二核苷酸序列和编码AAV衣壳蛋白的第三核苷酸序列;和(2)第二核酸载体,其包含辅助病毒基因。在此类双重载体转染系统中,第一核酸载体和第二核酸载体与宿主生产细胞一起提供AAV产生所需的所有组分。已经发现,与常规的三重载体转染系统相比,本文公开的双重载体转染系统导致增加的rAAV生产率。另外,发现本文所述的双重载体转染系统中组分的特定组织会产生优于现有技术双重载体转染系统的rAAV生产率。
因此,在一个方面,本公开提供了第一核酸载体,其包含:编码AAV Rep蛋白的第一核苷酸序列;包含含有转基因的重组AAV(rAAV)基因组的第二核苷酸序列;以及编码AAV衣壳蛋白的第三核苷酸序列;其中所述核酸载体不包含辅助病毒基因。
在某些实施方案中,所述核酸载体从5'至3’包含:编码AAVRep蛋白的第一核苷酸序列;包含含有转基因的重组AAV(rAAV)基因组的第二核苷酸序列;以及编码AAV衣壳蛋白的第三核苷酸序列;其中所述核酸载体不包含辅助病毒基因。
在某些实施方案中,所述核酸载体从5'至3’包含:编码AAVRep蛋白的第一核苷酸序列;包含含有转基因的重组AAV(rAAV)基因组的第二核苷酸序列;以及编码AAV衣壳蛋白的第三核苷酸序列;其中所述核酸载体不包含辅助病毒基因,并且其中所述转基因不选自苯丙氨酸羟化酶(PAH)、芳基硫酸酯酶A(ARSA)、艾杜糖醛酸2-硫酸酯酶(I2S)和抗补体组分5(C5)抗体。
在某些实施方案中,所述核酸载体从5'至3'包含:编码AAVRep蛋白的第一核苷酸序列;包含含有转基因的重组AAV(rAAV)基因组的第二核苷酸序列;和编码AAV衣壳蛋白的第三核苷酸序列,其中所述核酸载体不包含辅助病毒基因,并且其中所述AAV衣壳蛋白不包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少95%同一性的氨基酸序列,其中衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C;衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H;衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q;衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A;衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N;衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S;衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y;衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M;衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K;衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C;或者,衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。
在某些实施方案中,所述核酸载体从5'至3'包含:编码AAVRep蛋白的第一核苷酸序列;包含含有转基因的重组AAV(rAAV)基因组的所述第二核苷酸序列;和编码AAV衣壳蛋白的第三核苷酸序列,其中所述核酸载体不包含辅助病毒基因,并且其中(i)所述转基因不选自苯丙氨酸羟化酶(PAH)、芳基硫酸酯酶A(ARSA)、艾杜糖醛酸2-硫酸酯酶(I2S)和抗补体组分5(C5)抗体,并且(ii)所述AAV衣壳蛋白不包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少95%同一性的氨基酸序列,其中衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C;衣壳蛋白中对应于SEQ IDNO:16的氨基酸296的氨基酸是H;衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q;衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A;衣壳蛋白中对应于SEQ IDNO:16的氨基酸464的氨基酸是N;衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S;衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I;衣壳蛋白中对应于SEQ IDNO:16的氨基酸505的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y;衣壳蛋白中对应于SEQID NO:16的氨基酸681的氨基酸是M;衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K;衣壳蛋白中对应于SEQID NO:16的氨基酸706的氨基酸是C;或者,衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。
在某些实施方案中,所述核酸载体从5'至3'包含:编码AAVRep蛋白的第一核苷酸序列;包含含有转基因的重组AAV(rAAV)基因组的所述第二核苷酸序列;以及编码AAV衣壳蛋白的所述第三核苷酸序列。
在某些实施方案中,所述核酸载体是DNA质粒或DNA最小载体。
在另一方面,本公开提供了重组AAV(rAAV)包装系统,其包含:(i)第一核酸载体,其包含:编码AAV Rep蛋白的第一核苷酸序列;包含含有转基因的重组AAV(rAAV)基因组的第二核苷酸序列;和编码AAV衣壳蛋白的第三核苷酸序列,和(ii)包含辅助病毒基因的第二核酸载体。
在某些实施方案中,所述第一核酸载体从5'至3'包含:编码AAV Rep蛋白的第一核苷酸序列;包含含有转基因的重组AAV(rAAV)基因组的所述第二核苷酸序列;以及编码AAV衣壳蛋白的所述第三核苷酸序列。在某些实施方案中,所述转基因不选自苯丙氨酸羟化酶(PAH)、芳基硫酸酯酶A(ARSA)、艾杜糖醛酸2-硫酸酯酶(I2S)和抗补体组分5(C5)抗体。在某些实施方案中,AAV衣壳蛋白不包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少95%同一性的氨基酸序列,其中衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C;衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H;衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q;衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A;衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N;衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S;衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y;衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M;衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K;衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C;或者,衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。在某些实施方案中,所述转基因不选自苯丙氨酸羟化酶(PAH)、芳基硫酸酯酶A(ARSA)、艾杜糖醛酸2-硫酸酯酶(I2S)和抗补体组分5(C5)抗体,并且所述AAV衣壳蛋白不包含与SEQ IDNO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少95%同一性的氨基酸序列,其中衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C;衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H;衣壳蛋白中对应于SEQ IDNO:16的氨基酸312的氨基酸是Q;衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A;衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N;衣壳蛋白中对应于SEQ IDNO:16的氨基酸468的氨基酸是S;衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R;衣壳蛋白中对应于SEQ IDNO:16的氨基酸590的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y;衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M;衣壳蛋白中对应于SEQID NO:16的氨基酸687的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K;衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C;或者,衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。
在某些实施方案中,所述第一核酸载体是DNA质粒或DNA最小载体。在某些实施方案中,所述第二核酸载体是DNA质粒或DNA最小载体。
在某些实施方案中,所述转基因编码多肽。在某些实施方案中,所述转基因编码miRNA、shRNA、siRNA、反义RNA、gRNA、antagomir、miRNA海绵(miRNA sponge)、RNA适体核酶(aptazyme)、RNA适体、lncRNA、核酶或mRNA。在某些实施方案中,所述转基因编码选自苯丙氨酸羟化酶(PAH)、葡萄糖-6-磷酸酶(G6Pase)、艾杜糖醛酸-2-硫酸酯酶(I2S)、芳基硫酸酯酶A(ARSA)和共济蛋白(FXN)的蛋白质。在某些实施方案中,所述转基因编码葡萄糖-6-磷酸酶(G6Pase)或共济蛋白(FXN)。
在某些实施方案中,rAAV基因组还包含与转基因可操作地连接的转录调控元件。在某些实施方案中,转录调控元件包括启动子元件和/或内含子元件。
在某些实施方案中,rAAV基因组还包含多聚腺苷酸化序列。在某些实施方案中,多聚腺苷酸化序列在转基因的3'。
在某些实施方案中,rAAV基因组包含与SEQ ID NO:71、85、86、87或88所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。
在某些实施方案中,rAAV基因组还包含在所述转基因的5’的5’反向末端重复(5’ITR)核苷酸序列和在所述转基因的3’的3'反向末端重复(3’ITR)核苷酸序列。在某些实施方案中,5’ITR核苷酸序列与SEQ ID NO:39、41或42中所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性,和/或3’ITR核苷酸序列与SEQ ID NO:40、43或44中所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性。
在某些实施方案中,rAAV基因组包含与SEQ ID NO:75、78、80、82或84所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。
在某些实施方案中,AAVRep蛋白是野生型Rep蛋白或其变体。在某些实施方案中,AAVRep蛋白是AAV2 Rep蛋白或其变体。
在某些实施方案中,第一核苷酸序列还包含与AAV Rep蛋白编码序列可操作地连接的转录调控元件。在某些实施方案中,所述转录调控元件包括启动子,所述启动子选自组成型启动子、诱导型启动子或天然启动子。在某些实施方案中,所述启动子选自P5启动子、P19启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。
在某些实施方案中,AAV衣壳蛋白选自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh10、AAVRh32.33、AAVrh74、AAV-DJ、AAV-LK03、NP59、VOY101、VOY201、VOY701、VOY801、VOY1101、AAVPHP.N、AAVPHP.A、AAVPHP.B、PHP.B2、PHP.B3、G2A3、G2B4、G2B5和PHP.S。在某些实施方案中,AAV衣壳蛋白选自AAV1、AAV2、AAV5、AAV6、AAV8、AAV9、AAVrh10和AAVrh74。在某些实施方案中,AAV衣壳蛋白选自AAV1、AAV2、AAV5、AAV6、AAV8和AAVrh74。
在某些实施方案中,AAV衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少85%同一性的氨基酸序列。
在某些实施方案中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C;衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H;衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q;衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A;衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N;衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S;衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y;衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M;衣壳蛋白中对应于SEQ IDNO:16的氨基酸687的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K;衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C;或者,衣壳蛋白中对应于SEQID NO:16的氨基酸718的氨基酸是G。
在某些实施方案中,(a)衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G;(b)衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H,衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M;(c)衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R;(d)衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A,并且衣壳蛋白中对应于SEQ IDNO:16的氨基酸505的氨基酸是R;或(e)衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C。
在某些实施方案中,AAV衣壳蛋白包含SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列。
在某些实施方案中,AAV衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少85%同一性的氨基酸序列。
在某些实施方案中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸160的氨基酸是D;衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C;衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H;衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q;衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A;衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N;衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S;衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y;衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M;衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R;衣壳蛋白中对应于SEQ IDNO:16的氨基酸690的氨基酸是K;衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C;或者,衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。
在某些实施方案中,(a)衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G;(b)衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H,衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M;(c)衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R;(d)衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A,并且衣壳蛋白中对应于SEQ IDNO:16的氨基酸505的氨基酸是R;或(e)衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C。
在某些实施方案中,AAV衣壳蛋白包含SEQ ID NO:1、2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列。
在某些实施方案中,AAV衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少85%同一性的氨基酸序列。
在某些实施方案中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸2的氨基酸是T;衣壳蛋白中对应于SEQ ID NO:16的氨基酸65的氨基酸是I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸68的氨基酸是V;衣壳蛋白中对应于SEQ ID NO:16的氨基酸77的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸119的氨基酸是L;衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸160的氨基酸是D;衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C;衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H;衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q;衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A;衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N;衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S;衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y;衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M;衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K;衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C;或者,衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。
在某些实施方案中,(a)衣壳蛋白中对应于SEQ ID NO:16的氨基酸2的氨基酸是T,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q;(b)衣壳蛋白中对应于SEQID NO:16的氨基酸65的氨基酸是I,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是Y;(c)衣壳蛋白中对应于SEQ ID NO:16的氨基酸77的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K;(d)衣壳蛋白中对应于SEQ ID NO:16的氨基酸119的氨基酸是L,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S;(e)衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G,并且衣壳蛋白中对应于SEQ IDNO:16的氨基酸718的氨基酸是G;(f)衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H,衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N,衣壳蛋白中对应于SEQID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M;(g)衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R;(h)衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R;或衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I,衣壳蛋白中对应于SEQ IDNO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C。
在某些实施方案中,AAV衣壳蛋白包含SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列。
在某些实施方案中,第三核苷酸序列还包含与AAV衣壳蛋白编码序列可操作地连接的转录调控元件。在某些实施方案中,所述转录调控元件包括启动子,所述启动子选自组成型启动子、诱导型启动子或天然启动子。在某些实施方案中,所述启动子选自P40启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。
在某些实施方案中,第一核酸载体包含与SEQ ID NO:73或77所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。
在某些实施方案中,第二核苷酸序列包含与SEQ ID NO:71、75、78、80、82、84、85、86、87或88所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列。
在某些实施方案中,第一核苷酸序列包含与SEQ ID NO:50、51、52、53、54、55、56、57、58或59中所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;第二核苷酸序列包含与SEQID NO:71、75、78、80、82、84、85、86、87或88中所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;并且第三核苷酸序列编码与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736、138-736和/或1-736的氨基酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
在某些实施方案中,第一核酸载体从5'至3'包含:第一核苷酸序列;第二核苷酸序列;和第三核苷酸序列。
在某些实施方案中,辅助病毒基因源自选自腺病毒、疱疹病毒、痘病毒、巨细胞病毒和杆状病毒的辅助病毒。在某些实施方案中,辅助病毒基因是源自选自E1、E2、E4和VA的腺病毒的RNA基因。在某些实施方案中,辅助病毒基因是源自选自UL5/8/52、ICP0、ICP4、ICP22和UL30/UL42的疱疹病毒的基因。
在某些实施方案中,第二核酸载体还包含与所述辅助病毒基因可操作地连接的转录调控元件。在某些实施方案中,所述转录调控元件包括启动子,所述启动子选自组成型启动子、诱导型启动子或天然启动子。在某些实施方案中,所述启动子选自RSV LTR启动子、CMV立即早期启动子、SV40启动子、二氢叶酸还原酶启动子、细胞质β-肌动蛋白启动子、磷酸甘油酸激酶(PGK)启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。
在某些实施方案中,第二核酸载体包含与SEQ ID NO:60、61或62所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。
在某些实施方案中,第二核酸载体包含与SEQ ID NO:63所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。
在另一方面,本公开提供了包含本文所述的核酸载体或本文所述的包装系统的宿主细胞。本公开还提供了此类宿主细胞的群体。在某些实施方案中,宿主细胞的群体在细胞培养物中提供。在某些实施方案中,细胞培养物的体积为至少2升、至少50升或至少2000升。在某些实施方案中,细胞培养物的体积为约2升至约5000升。在某些实施方案中,细胞培养物的体积为约2升至约4000升。在某些实施方案中,细胞培养物的体积为约2升至约3000升。在某些实施方案中,细胞培养物的体积为约2升至约2500升。在某些实施方案中,细胞培养物的体积为约2升至约2000升。在某些实施方案中,细胞培养物的体积为约2升至约1500升。在某些实施方案中,细胞培养物的体积为约2升至约1000升。在某些实施方案中,细胞培养物的体积为约2升至约500升。在某些实施方案中,细胞培养物的体积为约2升至约250升。在某些实施方案中,细胞培养物的体积为约2升至约100升。在某些实施方案中,细胞培养物的体积为约2升至约50升。在某些实施方案中,细胞培养物的体积为约2升至约25升。
在某些实施方案中,宿主细胞是哺乳动物细胞。在某些实施方案中,所述哺乳动物细胞选自COS细胞、CHO细胞、BHK细胞、MDCK细胞、HEK293细胞、HEK293T细胞、HEK293F细胞、NS0细胞、PER.C6细胞、VERO细胞、CRL7O3O细胞、HsS78Bst细胞、HeLa细胞、NIH 3T3细胞、HepG2细胞、SP210细胞、R1.1细胞、B-W细胞、L-M细胞、BSC1细胞、BSC40细胞、YB/20细胞和BMT10细胞。在某些实施方案中,所述哺乳动物细胞是HEK293细胞。
在另一个方面,本公开提供了一种rAAV的重组制备方法,所述方法包括在产生rAAV的条件下将本文所述的包装系统引入哺乳动物细胞中。
在某些实施方案中,第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率选自1:0.2、1:0.4、1:0.6、1:0.8、1:1、1:2、1:3或1:4。在某些实施方案中,第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:2。在某些实施方案中,第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:0.2至1:1。在某些实施方案中,第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:0.6。在某些实施方案中,第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:0.8。在某些实施方案中,第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:1。
在某些实施方案中,所述方法包括引入所述包装系统的0.1至4μg DNA/1E6个细胞。在某些实施方案中,所述方法包括引入所述包装系统的0.5至1μg DNA/1E6个细胞。在某些实施方案中,所述方法包括引入所述包装系统的0.6、0.7、0.8、0.9或1μg DNA/1E6个细胞。在某些实施方案中,所述方法包括引入所述包装系统的0.75μg DNA/1E6个细胞。
在某些实施方案中,第一核酸载体与第二载体核酸的比率为1:2、1:3或1:4。在某些实施方案中,第一核酸载体与第二载体核酸的比率为1:2。
在某些实施方案中,所述方法与包括使用以下哺乳动物细胞产生rAAV的方法相比导致增加的rAAV滴度,所述哺乳动物细胞包含:(i)包含编码所述AAVRep蛋白和所述AAV衣壳蛋白的核苷酸序列的第一载体;(ii)包含所述rAAV基因组的第二载体;以及(iii)包含所述一种或多种辅助病毒基因的第三载体。
在某些实施方案中,所述方法与包括使用以下哺乳动物细胞产生rAAV的方法相比导致增加的完整载体基因组的百分比,所述哺乳动物细胞包含:(i)包含编码所述AAVRep蛋白和所述AAV衣壳蛋白的核苷酸序列的第一载体;(ii)包含所述rAAV基因组的第二载体;以及(iii)包含所述一种或多种辅助病毒基因的第三载体。
在某些实施方案中,所述哺乳动物细胞选自COS细胞、CHO细胞、BHK细胞、MDCK细胞、HEK293细胞、HEK293T细胞、HEK293F细胞、NS0细胞、PER.C6细胞、VERO细胞、CRL7O3O细胞、HsS78Bst细胞、HeLa细胞、NIH 3T3细胞、HepG2细胞、SP210细胞、R1.1细胞、B-W细胞、L-M细胞、BSC1细胞、BSC40细胞、YB/20细胞和BMT10细胞。在某些实施方案中,所述哺乳动物细胞是HEK293细胞。
附图说明
图1A-图1C是显示使用三重载体转染系统(1)和双重载体转染系统(2)从小规模rAAV生产获得的病毒基因组(VG)生产率(图1A)、衣壳生产率(图1B)和完整载体基因组的百分比(图1C)的图。
图2A-图2C是显示使用三重载体转染系统(1和3)和双重载体转染系统(2和4)从小规模rAAV生产获得的VG生产率(图2A)、衣壳生产率(图2B)和完整载体基因组的百分比(图2C)的图。测定两种不同的rAAV基因编辑载体的rAAV生产率:人特异性基因编辑载体(1和2)和小鼠特异性载体(3和4)。各种条件列于表3中。
图3A-图3C是显示rAAV双重载体转染系统设计-1(图3A)、设计-2(图3B)和设计-3(图3C)的示意图。
图4A-图4C是显示使用双重载体转染系统设计-1(1-3)、双重载体转染系统设计-2(4-6)和三重载体转染系统(7)从小规模rAAV生产获得的VG生产率(图4A)、衣壳生产率(图4B)和完整载体基因组的百分比(图4C)的图。测试的双重载体转染系统设计如图3A和图3B所描绘。对于测试的每个双重载体转染系统设计,用三种不同的转基因载体与辅助载体比率进行转染:1:0.5(1和4)、1:1(2和5)和1:3(3和6)。各种转染条件列于表4中。
图5A-图5C是显示使用双重载体转染系统设计-1(1)、双重载体转染系统设计-2(2)、双重载体转染系统设计-3(3)和三重载体转染系统(4)从小规模rAAV生产获得的VG生产率(图5A)、衣壳生产率(图5B)和完整载体基因组的百分比(图5C;“%完全”)。测试的双重载体转染系统设计如图3A-图3C所描绘。各种转染条件列于表5中。
图6A-图6C是显示使用双重载体转染系统设计-1以各种转基因载体与辅助载体比率:1:2(“双重1:2”)、1:3(“双重1:3”)和1:4(“双重1:4”)以及用三重载体转染系统(三重)从2L规模rAAV生产获得的VG生产率(图6A)、衣壳生产率(图6B)和完整载体基因组的百分比(图6C)的图。测试了六种不同的rAAV载体基因组(1-6)。条件1-5使用AAVHSC15衣壳,且条件6使用AAVHSC17衣壳。各种转染条件列于表6中。
图7A-图7C是显示使用双重载体转染系统设计-1(2TFX)和三重载体转染系统(3TFX),利用AAV2衣壳从小规模rAAV生产获得的VG生产率(图7A)、衣壳生产率(图7B)和完整载体基因组的百分比(图7C)的图。各种转染条件列于表6中。
图8是显示使用设计-1双重质粒系统从rAAV生产获得的完整载体基因组的数目的图,在每种情况下该数目表示为相对于从相应的三重质粒系统对照获得的完整载体基因组的数目的百分比增加。测试了四种不同的rAAV载体基因组(1-4)。条件1-3使用AAVHSC15衣壳,且条件4使用AAVHSC17衣壳。各种转染条件列于表7中。
图9是显示来自双重载体转染系统设计-1和设计-2的衣壳生成水平的图,其中衣壳生成水平来自含有每种相应设计的Rep/Cap序列的载体。各种转染条件列于表8中。
图10A-图10C是显示使用双重载体转染系统设计-1(2TFX)和三重载体转染系统(3TFX)从50L生物反应器rAAV生产获得的VG生产率(图10A)、衣壳生产率(图10B)和完整载体基因组的百分比(图10C)的图。转染条件列于表6,条件4,设计-1的载体比率为1:2,以及相关的三重转染对照。图10D-图10F是显示使用2TFX和3TFX系统获得的纯化AAV载体中的纯度百分比(图10D)、聚集百分比(图10E)和残留宿主细胞蛋白水平(图10F)的图。图10G-10J是显示使用2TFX和3TFX系统获得的纯化AAV载体中包装的残留宿主细胞DNA(图10G)、Rep/Cap(图10H)、E1a(图10I)和辅助序列(图10J)的量的图。在图10F和图10I中,水平虚线指示测定的检测限,其中确定样品低于定量限(BLoQ)。ns意指不显著;*意指p<0.05统计学显著;并且***意指p<0.001统计学显著性。
图11A-图11B是显示以1E12个VG/kg(图11A)和1E14个VG/kg(图11B)的剂量,施用从表6中对于设计1(2TFX)而言载体比率为1:4和相关三重转染对照(3TFX)的条件5获得的AAV载体的Pahenu2小鼠的血清中测得的苯丙氨酸(Phe)水平的图。进行仅媒介物的施用作为对照(媒介物)。图11C-图11E是显示在给药后6周,在治疗的小鼠中的肝脏中载体基因组(图11C)、转基因表达(图11D)和中靶整合(图11E)的定量的图。ns意指不显著。
图12A-图12C是显示使用双重载体转染系统设计-1从小规模rAAV生产获得的VG生产率(图12A)、衣壳生产率(图12B)和完整载体基因组的百分比(图12C)的图,所述双重载体转染系统设计-1在各种总转染DNA水平(x轴)下测试载体V3和载体V12之间所示的各种比率。所用的PEI:DNA比率为2:1。
图13A-图13C是显示使用双重载体转染系统设计-1从小规模rAAV生产获得的VG生产率(图13A)、衣壳生产率(图13B)和完整载体基因组的百分比(图13C)的图,所述双重载体转染系统设计-1在各种总转染DNA水平(x轴)下测试载体V3和载体V8之间所示的各种比率。所用的PEI:DNA比率为2:1。
图14A-图14C是显示使用双重载体转染系统设计-1和相关三重转染对照在AAV衣壳血清型AAV1、AAV2、AAV5、AAV6、AAV8、AAV9、AAVrh10和AAVrh74中从2L规模rAAV生产获得的VG生产率(图14A)、衣壳生产率(图14B)和完整载体基因组的百分比(图14C)的图。
图15是显示使用双重载体转染系统设计-1从50L和2000L生物反应器rAAV生产获得的VG生产率的图。
具体实施方式
本公开提供了用于产生重组腺相关病毒(rAAV)的双重载体转染系统。本公开基于这样的发现,即使用本文所述的双重载体转染方法的rAAV生产产生比常规三重载体转染方法更高的AAV生产率。本文所述的双重载体转染系统中组分的特定组织也产生优于现有技术双重载体转染方法的AAV生产率。
I.定义
如本文所用,术语“重组腺相关病毒”或“rAAV”是指包含缺乏功能性rep和cap基因的基因组的AAV。
如本文所用,术语“cap基因”是指编码AAV衣壳蛋白的核酸序列。
如本文所用,术语“rep基因”是指编码AAV复制所需的AAVRep蛋白(例如Rep78、Rep68、Rep52和Rep40)的核酸序列。
如本文所用,术语“Rep-Cap元件”是指编码AAV复制所需的AAV Rep蛋白(例如Rep78、Rep68、Rep52和Rep40)以及AAV衣壳蛋白(例如VP1、VP2和VP3)的核酸序列。
如本文所用,术语“辅助病毒基因”是指编码介导AAV复制的病毒基因(例如腺病毒基因或疱疹病毒基因)的核酸序列。
如本文所用,术语“rAAV基因组”是指包含rAAV基因组序列的核酸分子。本领域技术人员将理解,当rAAV基因组包含转基因时,该rAAV基因组相对于转基因的转录方向可以处于有义或反义取向。
如本文所用,术语“编辑基因组”是指能够经由同源重组将编辑元件(例如,一个或多个核苷酸或核苷酸间键)整合到靶基因座中以纠正靶基因中的遗传缺陷的重组AAV基因组。本领域技术人员将理解,包含5'同源臂、编辑元件和3'同源臂的编辑基因组部分相对于靶基因座可以处于有义或反义取向。
如本文所用,术语“编辑元件”是指当整合在靶基因座时修饰靶基因座的编辑基因组的部分。编辑元件可以介导靶基因座处一个或多个核苷酸的插入、缺失或取代。如本文所用,术语“靶基因座”是指被编辑元件修饰的染色体的区域或核苷酸间键(例如靶基因的区域或核苷酸间键)。
如本文所用,术语“同源臂”是指编辑基因组的位于编辑元件5'或3'的一部分,该部分与靶基因座侧翼的基因组基本上相同。
如本文所用,两个核苷酸序列之间或两个氨基酸序列之间的“同一性百分比”通过将比对序列对之间的匹配数乘以100,并除以包括内部空位的比对区域的长度来计算。同一性评分仅对完美匹配进行计数,而不考虑氨基酸彼此的相似性程度。注意,长度仅包括内部空位,而不包括序列末端的空位。
如本文所用,术语“编码序列”是指编码多肽的互补DNA(cDNA)的部分,起始于起始密码子并终止于终止密码子。由于群体内的选择性剪接、选择性翻译起始和变异,基因可具有一个或多个编码序列。编码序列可以是野生型或非天然存在的变体(例如密码子优化的变体)。
如本文所用,术语“转录调控元件”或“TRE”是指通过RNA聚合酶调控(例如控制、增加或减少)可操作地连接的核苷酸序列的转录以形成RNA分子的顺式作用核苷酸序列,例如DNA序列。TRE依赖于一种或多种反式作用分子,诸如转录因子来调控转录。因此,一种TRE当其与不同反式作用分子接触时,例如当其处于不同类型的细胞中时,可以以不同的方式调控转录。TRE可以包含一个或多个启动子元件和/或增强子元件。本领域技术人员将理解,基因中的启动子和增强子元件可以在位置上接近,并且术语“启动子”可以指包含启动子元件和增强子元件的序列。因此,术语“启动子”不排除序列中的增强子元件。启动子和增强子元件不需要源自相同的基因或物种,并且每个启动子或增强子元件的序列可以与基因组中相应的内源序列相同或基本上相同。
如本文所用,术语“可操作地连接”用于描述TRE和待转录的编码序列之间的连接。通常,基因表达置于包含一个或多个启动子和/或增强子元件的TRE的控制下。如果编码序列的转录受TRE控制或影响,则编码序列与TRE“可操作地连接”。TRE的启动子和增强子元件可以与编码序列处于任何取向和/或距离,只要获得期望的转录活性即可。在某些实施方案中,TRE在编码序列的上游。
如本文所用,术语“多聚腺苷酸化序列”是指当转录成RNA时构成多聚腺苷酸化信号序列的DNA序列。多聚腺苷酸化序列可以是天然的或外源的。外源多聚腺苷酸化序列可以是哺乳动物或病毒多聚腺苷酸化序列(例如SV40多聚腺苷酸化序列)。
如本文所用,“外源多聚腺苷酸化序列”是指与转基因的内源多聚腺苷酸化序列不相同或基本上相同的多聚腺苷酸化序列。在某些实施方案中,外源多聚腺苷酸化序列是不同于转基因但在相同物种(例如人)内的基因的多聚腺苷酸化序列。在某些实施方案中,外源多聚腺苷酸化序列是不同生物体(例如病毒)的多聚腺苷酸化序列。
II.第一核酸载体
用于产生rAAV的常规三重载体转染系统通常包含:含有编码AAV Rep蛋白和AAV衣壳蛋白的序列的第一载体;包含rAAV基因组的第二载体;和包含一个或多个辅助病毒基因的第三载体。先前已经证实,编码AAVRep蛋白、AAV衣壳蛋白的基因和所述一种或多种辅助病毒基因可以克隆到与(“Rep-Cap-辅助载体”)相同的载体中。在此类情况下,Rep-Cap-辅助载体与包含rAAV基因组的第二载体(即,与rAAV基因组呈反式提供Rep、Cap和H辅助基因)的双重转染可用于生成rAAV。参见,例如Grimm等人(1998)Hum.Gene Ther.9(18):2745-2760,其公开内容通过引用整体并入本文。
与先前的双重载体转染系统对比,本公开的双重载体转染系统提供与rAAV基因组呈顺式的Rep和Cap基因。因此,本公开提供了用于产生重组腺相关病毒(rAAV)的双重载体转染系统,其中本文所述的双重载体转染系统通常包含:(1)第一核酸载体,其包含:编码AAV Rep蛋白的第一核苷酸序列、包含含有转基因的rAAV基因组的第二核苷酸序列和编码AAV衣壳蛋白的第三核苷酸序列;和(2)第二核酸载体,其包含辅助病毒基因。
在某些实施方案中,第一核酸载体从5'至3’包含:编码AAVRep蛋白的第一核苷酸序列,包含含有转基因的rAAV基因组的第二核苷酸序列,以及编码AAV衣壳蛋白的第三核苷酸序列。本公开的某些方面提供第一核酸载体不包含辅助病毒基因(例如,编码AAV生产辅助因子的基因)。
本文所述的双重载体转染系统通常涉及将第一核酸载体和第二核酸载体转染到合适的宿主细胞中以产生AAV(例如,rAAV)。在某些实施方案中,第一核酸载体和第二核酸载体一起提供AAV(例如,rAAV)产生所需的所有组分。在某些实施方案中,第一核酸载体和第二核酸载体以及另外的宿主细胞一起提供AAV(例如,rAAV)产生所需的所有组分。
已经发现,与常规的三重载体转染系统和先前描述的双重载体转染系统相比,本文公开的双重载体转染系统导致增加的rAAV生产率。在不受任何理论束缚的情况下,申请人相信在本文所述的双重载体转染系统中提供与rAAV基因组呈顺式的Rep和Cap基因导致较高的rAAV生产率,这部分是因为产生较少的空AAV衣壳。
rAAV基因组
在本文公开的双重载体系统中,第一核酸载体通常包含含有rAAV基因组的核苷酸序列。在某些实施方案中,rAAV基因组包含转基因。
在某些实施方案中,转基因包含一个或多个编码RNA分子的序列。合适的RNA分子包括但不限于本领域已知的miRNA、shRNA、siRNA、反义RNA、gRNA、antagomir、miRNA海绵、RNA适体核酶、RNA适体、mRNA、lncRNA、核酶和合成RNA。
在某些实施方案中,转基因编码一种或多种多肽或其片段。此类转基因可包含多肽的完整编码序列,或仅包含多肽的编码序列的片段。在某些实施方案中,转基因编码可用于治疗受试者的疾病或病症的多肽。合适的多肽包括但不限于β-珠蛋白、血红蛋白、组织纤溶酶原激活物和凝血因子;集落刺激因子(CSF);白细胞介素,诸如IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9等;生长因子,诸如角质形成细胞生长因子(KGF)、干细胞因子(SCF)、成纤维细胞生长因子(FGF,诸如碱性FGF和酸性FGF)、肝细胞生长因子(HGF)、胰岛素样生长因子(IGF)、骨形态发生蛋白(BMP)、表皮生长因子(EGF)、生长分化因子-9(GDF-9)、肝细胞瘤来源的生长因子(HDGF)、肌生长抑制素(GDF-8)、神经生长因子(NGF)、神经营养蛋白、血小板源性生长因子(PDGF)、血小板生成素(TPO)、转化生长因子α(TGF-a)、转化生长因子β(TGF-β)等;可溶性受体,诸如可溶性TNF-a受体、可溶性白介素受体(例如,可溶性IL-1受体和可溶性II型IL-1受体)、可溶性γ/ΔT细胞受体、可溶性受体的配体结合片段等;酶,诸如α-葡糖苷酶、伊米苷酶(imiglucerase)、β-葡糖脑苷脂酶和阿糖脑苷酶(alglucerase);酶活化剂,诸如组织纤溶酶原活化剂;趋化因子,诸如IP-10、由干扰素-γ(Mig)诱导的单核因子、Groα/IL-8、RANTES、MIP-1a、MIP-1β、MCP-1、PF-4等;血管生成剂,诸如血管内皮生长因子(VEGF,例如VEGF121、VEGF165、VEGF-C、VEGF-2)、神经胶质瘤来源的生长因子、血管生成素、血管生成素-2等等;抗血管生成剂,诸如可溶性VEGF受体;蛋白疫苗;神经活性肽,诸如神经生长因子(NGF)、缓激肽、缩胆囊素、胃泌素、分泌素、催产素、促性腺激素释放激素、β-内啡肽、脑啡肽、P物质、促生长素抑制素、催乳素、甘丙肽、生长激素释放激素、铃蟾肽、强啡肽、华法林(warfarin)、神经降压素、促胃动素、促甲状腺激素、神经肽Y、黄体化激素、降钙素、胰岛素、胰高血糖素、血管加压素、血管紧张素II、促甲状腺激素释放激素、血管活性肠肽、睡眠肽等;血栓溶解剂;心房钠尿肽;松弛肽;神经胶质纤维酸性蛋白;促卵泡激素(FSH);人α-1抗胰蛋白酶;白血病抑制因子(LIF);组织因子;巨噬细胞激活因子;肿瘤坏死因子(TNF);嗜中性粒细胞趋化因子;组织金属蛋白酶抑制剂;血管活性肠肽;血管生成素;促血管收缩素;纤维蛋白;水蛭素;IL-1受体拮抗剂;睫状神经营养因子(CNTF);脑源性神经营养因子(BDNF);神经营养蛋白3和4/5(NT-3和4/5);胶质细胞源性神经营养因子(GDNF);芳族氨基酸脱羧酶(AADC);因子VIII、因子IX、因子X;抗肌萎缩蛋白或小抗肌萎缩蛋白;溶酶体酸性脂肪酶;苯丙氨酸羟化酶(PAH);糖原贮积病相关酶,诸如葡萄糖-6-磷酸酶、酸性麦芽糖酶、糖原脱支酶、肌糖原磷酸化酶、肝糖原磷酸化酶、肌肉磷酸果糖激酶、磷酸化酶激酶、葡萄糖转运蛋白、醛缩酶A、β-烯醇化酶、糖原合酶;溶酶体酶,诸如艾杜糖醛酸-2-硫酸酯酶(I2S)和芳基硫酸酯酶A;和线粒体蛋白,诸如共济蛋白。
在某些实施方案中,转基因编码在一种或多种溶酶体贮积病中可能有缺陷的蛋白质。合适的蛋白质包括但不限于α-唾液酸酶、组织蛋白酶A、α-甘露糖苷酶、β-甘露糖苷酶、糖基天冬酰胺酶、α-岩藻糖苷酶、α-N-乙酰葡糖胺糖苷酶、β-半乳糖苷酶、β-己糖胺酶α-亚基、β-己糖胺酶β-亚基、GM2激活蛋白、葡糖脑苷脂酶、皂素C、芳基硫酸酯酶A、皂素B、甲酰甘氨酸生成酶、β-半乳糖基神经酰胺酶、α-半乳糖苷酶A、艾杜糖醛酸硫酸酯酶、α-艾杜糖醛酸酶、乙酰肝素N-硫酸酯酶、乙酰CoA转移酶、N-乙酰氨基葡糖苷酶、β-葡糖醛酸糖苷酶、N-乙酰葡糖胺6-硫酸酯酶、N-乙酰半乳糖胺4-硫酸酯酶、半乳糖6-硫酸酯酶、透明质酸酶、α-葡糖苷酶、酸性鞘磷脂酶、酸性神经酰胺酶、酸性脂肪酶、组织蛋白酶K、三肽基肽酶、棕榈酰蛋白硫酯酶、胱氨酸转运蛋白(cystinosin)、唾液酸转运蛋白(sialin)、UDP-N-乙酰氨基葡萄糖、磷酸转移酶γ-亚基、粘脂蛋白-1、LAMP-2、NPC1、CLN3、CLN 6、CLN 8、LYST、MYOV、RAB27A、黑素亲和素(melanophilin)和AP3β-亚基。
在某些实施方案中,转基因编码抗体或其片段(例如,Fab、scFv或全长抗体)。合适的抗体包括但不限于莫罗单抗(muromonab)-cd3、依法利珠单抗(efalizumab)、托西莫单抗(tositumomab)、达克利珠单抗(daclizumab)、奈巴库单抗(nebacumab)、卡妥索单抗(catumaxomab)、依决洛单抗(edrecolomab)、阿昔单抗(abciximab)、利妥昔单抗(rituximab)、巴利昔单抗(basiliximab)、帕利珠单抗(palivizumab)、英夫利昔单抗(infliximab)、曲妥珠单抗(trastuzumab)、阿达木单抗(adalimumab)、替伊莫单抗(ibritumomab tiuxetan)、奥马珠单抗(omalizumab)、西妥昔单抗(cetuximab)、贝伐单抗(bevacizumab)、那他珠单抗(natalizumab)、帕尼单抗(panitumumab)、兰尼单抗(ranibizumab)、依库丽单抗(eculiz umab)、赛妥珠单抗(certolizumab)、优特克单抗(ustekinumab)、卡那单抗(canakinumab)、戈利木单抗(golimumab)、奥法木单抗(ofatumumab)、托珠单抗(tocilizumab)、地诺单抗(denosumab)、贝利木单抗(beli mumab)、伊匹单抗(ipilimumab)、本妥昔单抗(brentuximab vedotin)、帕妥珠单抗(pertuzumab)、雷昔库单抗(raxibacumab)、奥比妥珠单抗(o binutuzumab)、阿仑单抗(alemtuzumab)、司妥昔单抗(siltuximab)、雷莫芦单抗(ramucirumab)、维多珠单抗(vedolizumab)、博纳吐单抗(blinatumomab)、纳武单抗(nivolumab)、派姆单抗(pembrolizumab)、依达鲁奇单抗(idarucizumab)、耐昔妥珠单抗(necitumumab)、达妥昔单抗(d inutuximab)、苏金单抗(secukinumab)、美泊利单抗(mepolizumab)、阿莫罗布单抗(alirocumab)、依洛尤单抗(evolocumab)、达雷木单抗(dara tumumab)、埃罗妥珠单抗(elotuzumab)、伊克苏单抗(ixekizumab)、瑞替珠单抗(reslizumab)、奥拉单抗(olaratumab)、贝洛托舒单抗(bezlotoxumab)、阿特珠单抗(atezolizumab)、奥托萨昔单抗(obiltoxaximab)、奥加伊妥珠单抗(inotuzumab ozogamicin)、柏达鲁单抗(brodalumab)、优特克单抗(guselkumab)、度普利尤单抗(dupilumab)、沙利姆单抗(sa rilumab)、阿维鲁单抗(avelumab)、奥克莱珠单抗(ocrelizumab)、艾美赛珠单抗(emicizumab)、贝那利珠单抗(benralizumab)、吉妥珠单抗(g emtuzumab ozogamicin)、度伐利尤单抗(durvalumab)、布罗索尤单抗(b urosumab)、依瑞奈尤单抗(erenumab)、加卡奈珠单抗(galcanezumab)、拉那利尤单抗(lanadelumab)、莫格利珠单抗(mogamulizumab)、替曲吉珠单抗(tildrakizumab)、西米普利单抗(cemiplimab)、瑞玛奈珠单抗(fr emanezumab)、雷夫利珠单抗(ravulizumab)、依马利尤单抗(emapalum ab)、伊巴珠单抗(ibalizumab)、莫西妥单抗(moxetumomab)、卡普赛珠单抗(caplacizumab)、罗莫单抗(romosozumab)、利桑珠单抗(risankizu mab)、泊洛妥珠单抗(polatuzumab)、艾普奈珠单抗(eptinezumab)、乐龙单抗(leronlimab)、戈沙妥珠单抗(sacituzumab)、布西珠单抗(broluci zumab)、伊莎妥昔单抗(isatuximab)和特普鲁木单抗(teprotumumab)。
在某些实施方案中,所述转基因编码核酸酶。合适的核酸酶包括但不限于锌指核酸酶(ZFN)(参见,例如,Porteus和Baltimore(2003)Science 300:763;Miller等人(2007)Nat.Biotechnol.25:778-785;S ander等人(2011)Nature Methods 8:67-69;及Wood等人(2011)Scie nce 333:307,其各自通过引用整体在此并入)、转录激活物样效应物核酸酶(TALEN)(参见,例如Wood等人(2011)Science 333:307;Boc h等人(2009)Science 326:1509-1512;Moscou和Bogdanove(2009)Science 326:1501;Christian等人(2010)Genetics186:757-761;Mille r等人(2011)Nat.Biotechnol.29:143-148;Zhang等人(2011)Nat.Biotechnol.29:149-153;及Reyon等人(2012)Nat.Biotechnol.30(5):460-465,其各自通过引用整体在此并入)、归巢核酸内切酶、大范围核酸酶(参见,例如美国专利公开第US2014/0121115号,其通过引用整体在此并入)和RNA引导的核酸酶(参见,例如Makarova等人(2018)The CRISPR Journal 1(5):325-336;及Adli(2018)Nat.Commu nications 9:1911,其各自通过引用整体在此并入)。
在某些实施方案中,所述转基因编码RNA引导的核酸酶。合适的RNA引导的核酸酶包括但不限于I类和II类成簇规律间隔短回文重复序列(CRISPR)相关核酸酶。I类分为I型、III型和IV型,并且包括但不限于I型(Cas3)、I型-A(Cas8a、Cas5)、I型-B(Cas8b)、I型-C(Cas8c)、I型-D(Cas10d)、I型-E(Csel、Cse2)、I型-F(Csyl、Csy2、Csy3)、I型-U(GSU0054)、III型(Cas10)、III型-A(Csm2)、III型-B(C mr5)、III型-C(Csx10或Csx11)、III型-D(Csx10)和IV型(Csf1)。II类分为II型、V型和VI型,并且包括但不限于II型(Cas9)、II型-A(C sn2)、II型-B(Cas4)、V型(Cpf1、C2c1、C2c3)和VI型(Cas13a、Cas13b、Cas13c)。RNA引导的核酸酶还包括天然存在的II类CRISPR核酸酶,诸如Cas9(II型)或Cas12a/Cpf1(V型),以及由其来源或获得的其他核酸酶。可用于本发明的示例性Cas9核酸酶包括但不限于化脓性链球菌(S.pyogenes)Cas9(SpCas9)、金黄色葡萄球菌(S.aureu s)Cas9(SaCas9)、脑膜炎双球菌(N.meningitidis)Cas9(NmCas9)、空肠弯曲菌(C.jejuni)Cas9(CjCas9)和地芽胞杆菌(Geobacillus)Cas9(G eoCas9)。
在某些实施方案中,转基因编码一种或多种报告序列,其在表达时产生可检测的信号。此类报告序列包括但不限于编码以下的DNA序列:β-内酰胺酶、β-半乳糖苷酶(LacZ)、碱性磷酸酶、胸苷激酶、绿色荧光蛋白(GFP)、红色荧光蛋白(RFP)、氯霉素乙酰转移酶(CAT)、荧光素酶、膜结合蛋白(包括例如CD2、CD4、CD8)、流感血凝素蛋白和本领域熟知的存在针对其的高亲和力抗体或者可通过常规手段产生的其他蛋白,以及包含与来自血凝素或Myc的抗原标签结构域适当融合的膜结合蛋白的融合蛋白。
在某些实施方案中,rAAV基因组包含与转基因可操作地连接的转录调控元件(TRE),以控制由转基因编码的RNA或多肽的表达。在某些实施方案中,TRE包括组成型启动子。在某些实施方案中,TRE可以在任何哺乳动物细胞(例如,任何人细胞)中具有活性。在某些实施方案中,TRE在广泛范围的人细胞中具有活性。此类TRE可包含组成型启动子和/或增强子元件,包括本文所述的那些中的任一种和本领域技术人员已知的那些中的任一种。在某些实施方案中,TRE包括诱导型启动子。在某些实施方案中,TRE可以是组织特异性TRE,即其在特定组织和/或器官中具有活性。组织特异性TRE包括一种或多种组织特异性启动子和/或增强子元件,和任选地一种或多种组成型启动子和/或增强子元件。技术人员将理解,组织特异性启动子和/或增强子元件可以通过本领域熟知的方法从组织中特异性表达的基因中分离。
合适的启动子包括,例如,巨细胞病毒启动子(CMV)(Stinski等人(1985)JournalofVirology 55(2):431-441)、CMV早期增强子/鸡β-肌动蛋白(CBA)启动子/兔β-珠蛋白内含子(CAG)(Miyazaki等人(1989)Gene 79(2):269-277)、CBSB(Jacobson等人(2006)Molecular Therapy13(6):1074-1084)、人延伸因子1α启动子(EF1α)(Kim等人(1990)Gene91(2):217-223)、人磷酸甘油酸激酶启动子(PGK)(Singer-Sam等人(1984)Gene 32(3):409-417)、线粒体重链启动子(Lodeiro等人(2012)PNAS109(17):6513-6518)、泛素启动子(Wulff等人(1990)FEBS Letters 261:101-105)。在某些实施方案中,TRE包含巨细胞病毒(CMV)启动子/增强子(例如,包含与SEQ ID NO:18或19具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列)、SV40启动子、鸡β肌动蛋白(CBA)启动子(例如,包含与SEQ ID NO:20或21具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列)、smCBA启动子(例如,包含与SEQ ID NO:22具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列)、人延伸因子1α(EF1α)启动子(例如,包含与SEQ ID NO:23具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列)、包含转录因子结合位点的小鼠微小病毒(MVM)内含子(例如,包含与SEQ ID NO:24或25具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列)、人磷酸甘油酸激酶(PGK1)启动子、人泛素C(Ubc)启动子、人β肌动蛋白启动子、人神经元特异性烯醇化酶(ENO2)启动子、人β-葡糖醛酸糖苷酶(GUSB)启动子、兔β-珠蛋白元件(例如,包含与SEQ ID NO:26或27具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列)、人钙调蛋白1(CALM1)启动子(例如,包含与SEQ ID NO:28具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列),人ApoE/C-I肝控制区(HCR1)(例如,包含与SEQ ID NO:29具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列)、人αl抗胰蛋白酶(hAAT)启动子(例如,包含与SEQ ID NO:30、31或32具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列)、延长的HCR1(例如,包含与SEQ ID NO:33具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列)、hAAT启动子的HS-CRM8元件(例如,包含与SEQ ID NO:34具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列)、人转甲状腺素蛋白(TTR)启动子(例如,包含与SEQ ID NO:35具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列)和/或人甲基-CpG结合蛋白2(MeCP2)启动子。本文所述的任何TRE可以任何顺序组合以驱动有效转录。例如,rAAV基因组可包含TRE,其包括CMV增强子、CBA启动子和来自兔β-珠蛋白基因外显子3的剪接受体,统称为CAG启动子(例如,包含与SEQ ID NO:36具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列)。例如,rAAV基因组可包含TRE,其包括CMV增强子和CBA启动子的杂合体,随后是剪接供体和剪接受体,统称为CASI启动子区(例如,包含与SEQ ID NO:37具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列)。例如,rAAV基因组可包含TRE,其包括HCR1和hAAT启动子(也称为LP1启动子,例如包含与SEQ ID NO:38具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列)。
在某些实施方案中,TRE是脑特异性的(例如,神经元特异性的、神经胶质细胞特异性的、星形胶质细胞特异性的、少突胶质细胞特异性的、小胶质细胞特异性的和/或中枢神经系统特异性的)。示例性的脑特异性TRE可包含来自但不限于人神经胶质纤维酸性蛋白(GFAP)启动子、人突触蛋白1(SYN1)启动子、人突触蛋白2(SYN2)启动子、人金属硫蛋白3(MT3)启动子和/或人蛋白脂质蛋白1(PLP1)启动子的一个或多个元件。更多的脑特异性启动子元件公开于WO 2016/100575A1中,其通过引用整体并入本文。
在某些实施方案中,可以使用转基因的天然启动子。当期望转基因的表达模拟天然表达时,优选天然启动子。当转基因的表达必须在时间上或发育上,或以组织特异性方式,或响应于特异性转录刺激来调控时,可以使用天然启动子。在另一个实施方案中,其他天然表达控制元件,诸如增强子元件、多聚腺苷酸化位点或Kozak共有序列也可用于模拟天然表达。
在某些实施方案中,rAAV基因组包含编辑基因组。编辑基因组可用于通过编辑基因组与细胞中靶基因座周围的基因组区域的同源重组来编辑细胞的基因组。在某些实施方案中,设计编辑基因组以通过同源重组纠正基因中的遗传缺陷。编辑基因组通常包含:(i)编辑元件,用于编辑靶基因中的靶基因座;(ii)编辑元件5'的5'同源臂核苷酸序列,其与靶基因座5'的第一基因组区具有同源性;和(iii)编辑元件3'的3'同源臂核苷酸序列,其与靶基因座3'的第二基因组区具有同源性,其中包含5'同源臂、编辑元件和3'同源臂的编辑基因组的部分相对于靶基因座可以处于有义或反义取向。使用编辑基因组进行编辑的合适靶基因包括但不限于苯丙氨酸羟化酶(PAH)、囊性纤维化传导跨膜调控因子(CFTR)、β血红蛋白(HBB)、眼皮肤白化病II(OCA2)、亨廷顿蛋白(HTT)、萎缩性肌强直病蛋白激酶(DMPK)、低密度脂蛋白受体(LDLR)、载脂蛋白B(APOB)、神经纤维瘤蛋白1(NF1)、多囊肾病1(PKD1)、多囊肾病2(PKD2)、凝血因子VIII(F8)、抗肌萎缩蛋白(DMD)、X连锁磷酸调节内肽酶同源物(PHEX)、甲基-CpG结合蛋白2(MECP2)和Y连锁泛素特异性肽酶9Y(USP9Y)。
在某些实施方案中,本文公开的rAAV基因组还包含转录终止子(例如,多聚腺苷酸化序列)。在某些实施方案中,转录终止子在转基因的3'。转录终止子可以是有效终止转录的任何序列,并且本领域技术人员应当理解,此类序列可以分离自在期望转录抗体编码序列的至少一部分的细胞中表达的任何基因。在某些实施方案中,转录终止子包含多聚腺苷酸化序列。在某些实施方案中,多聚腺苷酸化序列与免疫球蛋白基因的内源多聚腺苷酸化序列相同或基本上相同。在某些实施方案中,多聚腺苷酸化序列是外源多聚腺苷酸化序列。在某些实施方案中,多聚腺苷酸化序列是SV40多聚腺苷酸化序列(例如,包含与SEQ ID NO:65、68或69具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列,或与其互补的核苷酸序列)。在某些实施方案中,多聚腺苷酸化序列包含SEQ ID NO:65所示的核苷酸序列。在某些实施方案中,多聚腺苷酸化序列由SEQ ID NO:65所示的核苷酸序列组成。在某些实施方案中,多聚腺苷酸化序列是牛生长激素(BGH)多聚腺苷酸化序列(例如,包含与SEQID NO:67具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列,或与其互补的核苷酸序列)。在某些实施方案中,多聚腺苷酸化序列包含SEQ ID NO:67所示的核苷酸序列。在某些实施方案中,多聚腺苷酸化序列由SEQ ID NO:67所示的核苷酸序列组成。
在某些实施方案中,rAAV基因组包含与SEQ ID NO:71、85、86、87或88所示的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。在某些实施方案中,编辑元件包含SEQ ID NO:71、85、86、87或88所示的核苷酸序列。在某些实施方案中,编辑元件由SEQ ID NO:71、85、86、87或88所示的核苷酸序列组成。
在某些实施方案中,本文公开的rAAV基因组还包含在TRE的5’的5’反向末端重复(5’ITR)核苷酸序列和在与抗体轻链编码序列相关的多聚腺苷酸化序列的3’的3'反向末端重复(3’ITR)核苷酸序列。来自任何AAV血清型或其变体的ITR序列可用于本文公开的rAAV基因组中。5'和3’ITR可以来自相同血清型的AAV或来自不同血清型的AAV。在本文公开的rAAV基因组中使用的示例性ITR在本文SEQ ID NO:39、40、41、42、43和44中示出。
在某些实施方案中,5’ITR或3’ITR来自AAV2。在某些实施方案中,5’ITR和3’ITR均来自AAV2。在某些实施方案中,5’ITR核苷酸序列与SEQ ID NO:39具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或3’ITR核苷酸序列与SEQ ID NO:40具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。在某些实施方案中,5’ITR核苷酸序列与SEQ ID NO:39具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,和/或3’ITR核苷酸序列与SEQ ID NO:40具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。在某些实施方案中,rAAV基因组包含具有SEQ ID NO:39的序列的5’ITR核苷酸序列和具有SEQID NO:40的序列的3’ITR核苷酸序列。
在某些实施方案中,5’ITR或3’ITR来自AAV5。在某些实施方案中,5’ITR和3’ITR均来自AAV5。在某些实施方案中,5’ITR核苷酸序列与SEQ ID NO:42具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或3’ITR核苷酸序列与SEQ ID NO:43具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。在某些实施方案中,5’ITR核苷酸序列与SEQ ID NO:42具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,和/或3’ITR核苷酸序列与SEQ ID NO:43具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。在某些实施方案中,rAAV基因组包含具有SEQ ID NO:42的序列的5’ITR核苷酸序列和具有SEQID NO:43的序列的3’ITR核苷酸序列。
在某些实施方案中,5’ITR核苷酸序列和3’ITR核苷酸序列基本上彼此互补(例如,彼此互补,除了在5'或3’ITR中的1、2、3、4或5个核苷酸位置处错配以外)。
在某些实施方案中,修饰5’ITR或3’ITR以减少或消除Rep蛋白的分解(“不可分解的ITR”)。在某些实施方案中,不可分解的ITR包含在末端分解位点的核苷酸序列中的插入、缺失或取代。此类修饰允许在受感染细胞中复制rAAV基因组后形成AAV的自身互补的双链DNA基因组。示例性的不可分解的ITR序列是本领域已知的(参见,例如,美国专利第7,790,154号和第9,783,824号中提供的那些,其通过引用整体并入本文)。在某些实施方案中,5’ITR包含与SEQ ID NO:41具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。在某些实施方案中,5’ITR由与SEQ ID NO:41具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列组成。在某些实施方案中,5’ITR由SEQ ID NO:41所示的核苷酸序列组成。在某些实施方案中,3’ITR包含与SEQ ID NO:44具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。在某些实施方案中,5’ITR由与SEQ ID NO:44具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列组成。在某些实施方案中,3’ITR由SEQ ID NO:44所示的核苷酸序列组成。在某些实施方案中,5’ITR由SEQ ID NO:41所示的核苷酸序列组成,并且3’ITR由SEQ ID NO:44所示的核苷酸序列组成。在某些实施方案中,5’ITR由SEQ ID NO:41所示的核苷酸序列组成,并且3’ITR由SEQ ID NO:44所示的核苷酸序列组成。
在某些实施方案中,5’ITR的侧翼是源自野生型AAV2基因组序列的附加核苷酸序列。在某些实施方案中,5’ITR的侧翼是源自野生型AAV2序列的与AAV2基因组中野生型AAV2ITR相邻的附加46bp序列。在某些实施方案中,附加46bp序列在rAAV基因组中5’ITR的3'。在某些实施方案中,该46bp序列由SEQ ID NO:45所示的核苷酸序列组成。
在某些实施方案中,3’ITR的侧翼是源自野生型AAV2基因组序列的附加核苷酸序列。在某些实施方案中,3’ITR的侧翼是源自野生型AAV2序列的与AAV2基因组中野生型AAV2ITR相邻的附加37bp序列。参见,例如,Savy等人,Human Gene TherapyMethods(2017)28(5):277-289(其通过引用整体并入本文)。在某些实施方案中,附加37bp序列在rAAV基因组中3’ITR的5'。在某些实施方案中,该37bp序列由SEQ ID NO:46所示的核苷酸序列组成。
在某些实施方案中,rAAV基因组包含与SEQ ID NO:75、78、80、82或84所示的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。在某些实施方案中,编辑元件包含SEQ ID NO:75、78、80、82或84所示的核苷酸序列。在某些实施方案中,编辑元件由SEQ ID NO:75、78、80、82或84所示的核苷酸序列组成。
AAVRep蛋白
本公开提供了包含Rep蛋白编码序列或其功能变体的编码序列的第一核酸载体。通过使用两个启动子和可变剪接控制AAV Rep基因的表达,产生四种Rep蛋白Rep78、Rep68、Rep52和Rep40。Rep蛋白参与AAV基因组复制和病毒基因组的包装。Rep蛋白的表达受p5和p19启动子控制。p5启动子驱动选择性剪接变体Rep78和Rep68的表达。p19启动子驱动选择性剪接变体Rep52和Rep40的表达。因此,第一核酸载体可以包含编码一种或多种Rep蛋白或其功能变体的核苷酸序列。
所述一种或多种Rep蛋白可以源自AAV2。示例性AAV2基因组序列可以经由NCBI参考序列NC_001401.2找到。根据NCBI参考序列,Rep68由核苷酸321至2252编码;Rep78由核苷酸321至2186编码;Rep40由核苷酸993至2252编码;并且Rep52由核苷酸993至2186编码。
在某些实施方案中,本公开提供了包含编码Rep78的核苷酸序列的核酸,其中编码Rep78的核苷酸序列包含与SEQ ID NO:50中所示的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在某些实施方案中,编码Rep78的核苷酸序列包含SEQ ID NO:50所示的序列或由SEQ ID NO:50所示的序列组成。在某些实施方案中,包含编码Rep78的核苷酸序列的核酸包含与编码Rep78的核苷酸序列可操作地连接的转录调控元件。在某些实施方案中,与编码Rep78的核苷酸序列可操作地连接的转录调控元件包含与SEQ ID NO:47所示的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在某些实施方案中,与编码Rep78的核苷酸序列可操作地连接的转录调控元件包含SEQ ID NO:47所示的序列或由SEQ ID NO:47所示的序列组成。在某些实施方案中,包含编码Rep78的核苷酸序列的核酸包含与SEQ ID NO:51中所示的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在某些实施方案中,包含编码Rep78的核苷酸序列的核酸包含SEQ ID NO:51所示的序列或由SEQ ID NO:51所示的序列组成。在某些实施方案中,本公开提供了在不同腺病毒血清型中的包含对应于如针对AAV2所述的编码Rep78的序列的核苷酸序列的核酸。
在某些实施方案中,本公开提供了包含编码Rep68的核苷酸序列的核酸,其中编码Rep68的核苷酸序列包含与SEQ ID NO:52中所示的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在某些实施方案中,编码Rep68的核苷酸序列包含SEQ ID NO:52所示的序列或由SEQ ID NO:52所示的序列组成。在某些实施方案中,包含编码Rep68的核苷酸序列的核酸包含与编码Rep68的核苷酸序列可操作地连接的转录调控元件。在某些实施方案中,与编码Rep68的核苷酸序列可操作连接的转录调控元件包含与SEQ ID NO:47所示的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在某些实施方案中,与编码Rep68的核苷酸序列可操作地连接的转录调控元件包含SEQ ID NO:47所示的序列或由SEQ ID NO:47所示的序列组成。在某些实施方案中,包含编码Rep68的核苷酸序列的核酸包含与SEQ ID NO:53中所示的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在某些实施方案中,包含编码Rep68的核苷酸序列的核酸包含SEQ ID NO:53所示的序列或由SEQ ID NO:53所示的序列组成。在某些实施方案中,本公开提供了在不同腺病毒血清型中的包含对应于如针对AAV2所述的编码Rep68的序列的核苷酸序列的核酸。
在某些实施方案中,本公开提供了包含编码Rep40的核苷酸序列的核酸,其中编码Rep40的核苷酸序列包含与SEQ ID NO:54中所示的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在某些实施方案中,编码Rep40的核苷酸序列包含SEQ ID NO:54所示的序列或由SEQ ID NO:54所示的序列组成。在某些实施方案中,包含编码Rep40的核苷酸序列的核酸包含与编码Rep40的核苷酸序列可操作地连接的转录调控元件。在某些实施方案中,与编码Rep40的核苷酸序列可操作连接的转录调控元件包含与SEQ ID NO:48所示的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在某些实施方案中,与编码Rep40的核苷酸序列可操作地连接的转录调控元件包含SEQ ID NO:48所示的序列或由SEQ ID NO:48所示的序列组成。在某些实施方案中,包含编码Rep40的核苷酸序列的核酸包含与SEQ ID NO:55中所示的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在某些实施方案中,包含编码Rep40的核苷酸序列的核酸包含SEQ ID NO:55所示的序列或由SEQ ID NO:55所示的序列组成。在某些实施方案中,本公开提供了在不同腺病毒血清型中的包含对应于如针对AAV2所述的编码Rep40的序列的核苷酸序列的核酸。
在某些实施方案中,本公开提供了包含编码Rep52的核苷酸序列的核酸,其中编码Rep52的核苷酸序列包含与SEQ ID NO:56中所示的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在某些实施方案中,编码Rep52的核苷酸序列包含SEQ ID NO:56所示的序列或由SEQ ID NO:56所示的序列组成。在某些实施方案中,包含编码Rep52的核苷酸序列的核酸包含与编码Rep52的核苷酸序列可操作地连接的转录调控元件。在某些实施方案中,与编码Rep52的核苷酸序列可操作地连接的转录调控元件包含与SEQ ID NO:48所示的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在某些实施方案中,与编码Rep52的核苷酸序列可操作地连接的转录调控元件包含SEQ ID NO:48所示的序列或由SEQ ID NO:48所示的序列组成。在某些实施方案中,包含编码Rep52的核苷酸序列的核酸包含与SEQ ID NO:57中所示的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在某些实施方案中,包含编码Rep52的核苷酸序列的核酸包含SEQ ID NO:57所示的序列或由SEQ ID NO:57所示的序列组成。在某些实施方案中,本公开提供了在不同腺病毒血清型中的包含对应于如针对AAV2所述的编码Rep52的序列的核苷酸序列的核酸。
在某些实施方案中,本公开提供了包含编码Rep78、Rep68、Rep40和Rep52的核苷酸序列的核酸,其中编码Rep78、Rep68、Rep40和Rep52的核苷酸序列包含与SEQ ID NO:58中所示的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在某些实施方案中,编码Rep78、Rep68、Rep40和Rep52的核苷酸序列包含SEQ ID NO:58所示的序列或由SEQ ID NO:58所示的序列组成。在某些实施方案中,包含编码Rep78、Rep68、Rep40和Rep52的核苷酸序列的核酸包含一个或多个转录调控元件,所述转录调控元件可操作地连接至编码Rep78、Rep68、Rep40和Rep52的核苷酸序列中的每一个核苷酸序列。在某些实施方案中,包含编码Rep78、Rep68、Rep40和Rep52的核苷酸序列的核酸包含与SEQ ID NO:59中所示的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在某些实施方案中,包含编码Rep78、Rep68、Rep40和Rep52的核苷酸序列的核酸包含SEQ ID NO:59所示的序列或由SEQ ID NO:59所示的序列组成。
AAV衣壳蛋白
本公开提供了包含含有AAV衣壳蛋白编码序列的核苷酸序列的第一核酸载体。第一核酸载体可包含编码来自本领域已知的任何AAV衣壳(包括天然AAV分离物及其变体)的AAV衣壳蛋白的核苷酸序列。
AAV衣壳蛋白包括VP1、VP2和VP3衣壳蛋白。VP1、VP2和/或VP3衣壳蛋白组装成包围rAAV基因组的衣壳。在某些实施方案中,衣壳蛋白的组装由组装激活蛋白(AAP)促进。某些AAV血清型的衣壳需要AAP在将衣壳蛋白转运到核仁进行组装中的作用。例如,AAV1、AAV2、AAV3、AAV6、AAV7、AAV8、AAV9、AAV10和AAV12需要AAP来形成衣壳,而AAV4、AAV5和AAV11的衣壳可以在没有AAP的情况下组装。参见,例如,Earley等人(2017)J.Virol.91(3):e01980-16。
不同的AAV血清型或其变体包含具有不同氨基酸序列的AAV衣壳蛋白。合适的AAV衣壳蛋白包括但不限于来自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、AAV-DJ、AAV-LK03、NP59、VOY101、VOY201、VOY701、VOY801、VOY1101、AAVPHP.N、AAVPHP.A、AAVPHP.B、PHP.B2、PHP.B3、G2A3、G2B4、G2B5、PHP.S、AAVrh10、AAVRh32.33、AAVrh74、AAVHSC1、AAVHSC2、AAVHSC3、AAVHSC4、AAVHSC5、AAVHSC6、AAVHSC7、AAVHSC8、AAVHSC9、AAVHSC10、AAVHSC11、AAVHSC12、AAVHSC13、AAVHSC14、AAVHSC15、AAVHSC16、AAVHSC17的衣壳蛋白,及其任何变体。在某些实施方案中,AAV衣壳蛋白选自AAV1、AAV2、AAV5、AAV6、AAV8、AAV9、AAVrh10和AAVrh74。在某些实施方案中,AAV衣壳蛋白选自AAV1、AAV2、AAV5、AAV6、AAV8和AAVrh74。各种AAV衣壳蛋白的序列公开于例如美国专利公开号:US20030138772、US20140359799、US20150159173、US20150376607、US20170081680和US20170360962A1,以及PCT公开号WO2020227515,其公开内容通过引用整体并入本文。
例如,在某些实施方案中,衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。在某些实施方案中,衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中:衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C;衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H;衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q;衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A;衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N;衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S;衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y;衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M;衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K;衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C;或者,衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。在某些实施方案中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。在某些实施方案中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H,衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M。在某些实施方案中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R。在某些实施方案中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A,并且衣壳蛋白中对应于SEQID NO:16的氨基酸505的氨基酸是R。在某些实施方案中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C。在某些实施方案中,衣壳蛋白包含SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列。
例如,在某些实施方案中,衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。在某些实施方案中,衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中:衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸160的氨基酸是D;衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C;衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H;衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q;衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A;衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N;衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S;衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y;衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M;衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K;衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C;或者,衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。在某些实施方案中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。在某些实施方案中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H,衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M。在某些实施方案中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R。在某些实施方案中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R。在某些实施方案中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I,衣壳蛋白中对应于SEQ IDNO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C。在某些实施方案中,衣壳蛋白包含SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列。
例如,在某些实施方案中,衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。在某些实施方案中,衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,其中:衣壳蛋白中对应于SEQ ID NO:16的氨基酸2的氨基酸是T;衣壳蛋白中对应于SEQ ID NO:16的氨基酸65的氨基酸是I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸68的氨基酸是V;衣壳蛋白中对应于SEQ ID NO:16的氨基酸77的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸119的氨基酸是L;衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸160的氨基酸是D;衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C;衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H;衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q;衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A;衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N;衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S;衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y;衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M;衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K;衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C;或者,衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。在某些实施方案中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸2的氨基酸是T,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q。在某些实施方案中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸65的氨基酸是I,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是Y。在某些实施方案中,衣壳蛋白中对应于SEQ IDNO:16的氨基酸77的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K。在某些实施方案中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸119的氨基酸是L,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S。在某些实施方案中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。在某些实施方案中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H,衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M。在某些实施方案中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R。在某些实施方案中,衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R。在某些实施方案中,衣壳蛋白中对应于SEQ IDNO:16的氨基酸501的氨基酸是I,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C。在某些实施方案中,衣壳蛋白包含SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列。
在某些实施方案中,AAV衣壳包含以下的两种或更多种:(a)包含SEQ ID NO:1、2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列的衣壳蛋白;(b)包含SEQID NO:1、2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列的衣壳蛋白;和(c)包含SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施方案中,AAV衣壳包含:(a)具有由SEQ ID NO:1、2、3、4、6、7、10、11、12、13、15、16或17的氨基酸203-736组成的氨基酸序列的衣壳蛋白;(b)具有由SEQ ID NO:1、2、3、4、5、6、7、9、10、11、12、13、15、16或17的氨基酸138-736组成的氨基酸序列的衣壳蛋白;和(c)具有由SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736组成的氨基酸序列的衣壳蛋白。
在某些实施方案中,AAV衣壳包含以下的一种或多种:(a)包含与SEQ ID NO:8的氨基酸203-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的衣壳蛋白;(b)包含与SEQ ID NO:8的氨基酸138-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的衣壳蛋白;和(c)包含与SEQ ID NO:8的氨基酸1-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的衣壳蛋白。在某些实施方案中,AAV衣壳包含以下的一种或多种:(a)包含SEQ ID NO:8的氨基酸203-736的氨基酸序列的衣壳蛋白;(b)包含SEQ ID NO:8的氨基酸138-736的氨基酸序列的衣壳蛋白;和(c)包含SEQ ID NO:8的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施方案中,AAV衣壳包含以下的两种或更多种:(a)包含SEQ ID NO:8的氨基酸203-736的氨基酸序列的衣壳蛋白;(b)包含SEQ ID NO:8的氨基酸138-736的氨基酸序列的衣壳蛋白;和(c)包含SEQ ID NO:8的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施方案中,AAV衣壳包含:(a)具有由SEQ ID NO:8的氨基酸203-736组成的氨基酸序列的衣壳蛋白;(b)具有由SEQ ID NO:8的氨基酸138-736组成的氨基酸序列的衣壳蛋白;和(c)具有由SEQ ID NO:8的氨基酸1-736组成的氨基酸序列的衣壳蛋白。
在某些实施方案中,AAV衣壳包含以下的一种或多种:(a)包含与SEQ ID NO:11的氨基酸203-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的衣壳蛋白;(b)包含与SEQ ID NO:11的氨基酸138-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的衣壳蛋白;和(c)包含与SEQ ID NO:11的氨基酸1-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的衣壳蛋白。在某些实施方案中,AAV衣壳包含以下的一种或多种:(a)包含SEQ ID NO:11的氨基酸203-736的氨基酸序列的衣壳蛋白;(b)包含SEQ ID NO:11的氨基酸138-736的氨基酸序列的衣壳蛋白;和(c)包含SEQ ID NO:11的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施方案中,AAV衣壳包含以下的两种或更多种:(a)包含SEQ ID NO:11的氨基酸203-736的氨基酸序列的衣壳蛋白;(b)包含SEQ ID NO:11的氨基酸138-736的氨基酸序列的衣壳蛋白;和(c)包含SEQ ID NO:11的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施方案中,AAV衣壳包含:(a)具有由SEQ ID NO:11的氨基酸203-736组成的氨基酸序列的衣壳蛋白;(b)具有由SEQ ID NO:11的氨基酸138-736组成的氨基酸序列的衣壳蛋白;和(c)具有由SEQ ID NO:11的氨基酸1-736组成的氨基酸序列的衣壳蛋白。
在某些实施方案中,AAV衣壳包含以下的一种或多种:(a)包含与SEQ ID NO:13的氨基酸203-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的衣壳蛋白;(b)包含与SEQ ID NO:13的氨基酸138-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的衣壳蛋白;和(c)包含与SEQ ID NO:13的氨基酸1-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的衣壳蛋白。在某些实施方案中,AAV衣壳包含以下的一种或多种:(a)包含SEQ ID NO:13的氨基酸203-736的氨基酸序列的衣壳蛋白;(b)包含SEQ ID NO:13的氨基酸138-736的氨基酸序列的衣壳蛋白;和(c)包含SEQ ID NO:13的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施方案中,AAV衣壳包含以下的两种或更多种:(a)包含SEQ ID NO:13的氨基酸203-736的氨基酸序列的衣壳蛋白;(b)包含SEQ ID NO:13的氨基酸138-736的氨基酸序列的衣壳蛋白;和(c)包含SEQ ID NO:13的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施方案中,AAV衣壳包含:(a)具有由SEQ ID NO:13的氨基酸203-736组成的氨基酸序列的衣壳蛋白;(b)具有由SEQ ID NO:13的氨基酸138-736组成的氨基酸序列的衣壳蛋白;和(c)具有由SEQ ID NO:13的氨基酸1-736组成的氨基酸序列的衣壳蛋白。
在某些实施方案中,AAV衣壳包含以下的一种或多种:(a)包含与SEQ ID NO:16的氨基酸203-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列的衣壳蛋白;(b)包含与SEQ ID NO:16的氨基酸138-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列的衣壳蛋白;和(c)包含与SEQ ID NO:16的氨基酸1-736的序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列的衣壳蛋白。在某些实施方案中,AAV衣壳包含以下的一种或多种:(a)包含SEQ ID NO:16的氨基酸203-736的氨基酸序列的衣壳蛋白;(b)包含SEQ ID NO:16的氨基酸138-736的氨基酸序列的衣壳蛋白;和(c)包含SEQ ID NO:16的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施方案中,AAV衣壳包含以下的两种或更多种:(a)包含SEQ ID NO:16的氨基酸203-736的氨基酸序列的衣壳蛋白;(b)包含SEQ ID NO:16的氨基酸138-736的氨基酸序列的衣壳蛋白;和(c)包含SEQ IDNO:16的氨基酸1-736的氨基酸序列的衣壳蛋白。在某些实施方案中,AAV衣壳包含:(a)具有由SEQ ID NO:16的氨基酸203-736组成的氨基酸序列的衣壳蛋白;(b)具有由SEQ ID NO:16的氨基酸138-736组成的氨基酸序列的衣壳蛋白;和(c)具有由SEQ ID NO:16的氨基酸1-736组成的氨基酸序列的衣壳蛋白。
在某些实施方案中,编码AAV衣壳蛋白的核苷酸与控制AAV衣壳蛋白表达的转录调控元件可操作地连接。在某些实施方案中,所述转录调控元件包括启动子,所述启动子选自组成型启动子、诱导型启动子或天然启动子。可以使用本领域已知的能够控制AAV衣壳蛋白表达的任何启动子。适合使用的启动子是本领域技术人员已知的,并且包括但不限于p40启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。其他合适的启动子包括但不限于CMV启动子、CBA启动子和CAG启动子。
在某些实施方案中,与编码AAV衣壳蛋白的核苷酸序列可操作地连接的转录调控元件包含与SEQ ID NO:47、48或49所示的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在某些实施方案中,与编码AAV衣壳蛋白的核苷酸序列可操作地连接的转录调控元件包含SEQ ID NO:47、48或49所示的序列或由SEQ ID NO:47、48或49所示的序列组成。
在另一个方面,本公开提供了第一核酸载体,其包含:含有Rep-Cap元件的第一核苷酸序列和含有包含转基因的rAAV基因组的第二核苷酸序列。在某些实施方案中,Rep-Cap元件包含编码AAV Rep蛋白的核酸序列和编码AAV衣壳蛋白的核酸序列。Rep-Cap元件可包含编码本领域已知的任何AAV Rep蛋白的核酸序列和编码本领域已知的任何AAV衣壳蛋白的核酸序列。在某些实施方案中,Rep-Cap元件包含与SEQ ID NO:73或77所示的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的核苷酸序列。
III.第二核酸载体
本文所述的双重载体转染系统通常包含含有一个或多个辅助病毒基因的第二核酸载体。如本领域技术人员所理解的,AAV的复制依赖于由辅助病毒基因编码的辅助因子的存在。辅助因子可经由辅助病毒的共感染提供,诸如来自但不限于腺病毒、疱疹病毒、乳头瘤病毒、巨细胞病毒、杆状病毒和人博卡病毒的辅助病毒。然而,使AAV在辅助病毒的存在下生长可导致宿主细胞的裂解和/或AAV产物的污染。因此,可以在用于转染宿主细胞的载体上提供编码AAV复制所需的辅助因子的辅助病毒的基因。
本文所述的双重载体转染系统通常涉及将两种核酸载体转染到宿主细胞中以产生AAV(例如,rAAV):(1)第一核酸载体,其包含:编码AAV Rep蛋白的第一核苷酸序列、包含含有转基因的rAAV基因组的第二核苷酸序列和编码AAV衣壳蛋白的第三核苷酸序列;和(2)第二核酸载体,其包含辅助病毒基因。在某些实施方案中,第二核酸载体不包含在第一核酸载体中发现的AAV产生的任何组分。在某些实施方案中,第二核酸载体不包含含有转基因的rAAV基因组。在某些实施方案中,第二核酸载体不包含AAV衣壳蛋白编码序列。在某些实施方案中,第二核酸载体不包含Rep编码序列或其功能片段的编码序列。在某些实施方案中,第二核酸载体不包含含有转基因的rAAV基因组,第二核酸载体不包含AAV衣壳蛋白编码序列,和/或第二核酸载体不包含Rep编码序列或其功能片段的编码序列。
在某些实施方案中,第二核酸载体包含至少一个可源自选自腺病毒、疱疹病毒、痘病毒、巨细胞病毒和杆状病毒的辅助病毒的辅助病毒基因。辅助病毒基因可以与控制辅助病毒基因表达的转录调控元件可操作地连接。在某些实施方案中,所述转录调控元件包括启动子,所述启动子选自组成型启动子、诱导型启动子或天然启动子。适合使用的启动子是本领域技术人员已知的,并且包括但不限于RSV LTR启动子、CMV立即早期启动子、SV40启动子、二氢叶酸还原酶启动子、细胞质β-肌动蛋白启动子、磷酸甘油酸激酶(PGK)启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。
在某些实施方案中,第二核酸载体包含至少一个辅助病毒基因。所述至少一种辅助病毒基因可以源自腺病毒(AdV)。已知有效AAV产生所需的最小AdV辅助因子集合由AdV分子E1、E2、E4和VA RNA组成(参见,例如,Meier等人(2020)Viruses 12(6):662)。具体而言,有效AAV产生所需的最小AdV辅助因子集合包括AdV分子E1A、E1B、E2A、E4和VARNA。在某些实施方案中,第二核酸载体包含足够的辅助病毒基因集合,其将允许在宿主细胞(例如,宿主AAV生产细胞)中有效的AAV产生(例如,AAV复制和包装)。
典型的AdV基因组表达约40种分为早期和晚期的紧密调控的蛋白质。早期蛋白包括E1A、E1B、E2A和E4。简言之,E1A和E2A蛋白起到激活控制AAVRep蛋白表达的AAV启动子p5和p19的作用。已发现AAV复制需要E1A介导的p5活性。E2A是单链DNA结合蛋白,已经证实其会促进AAV复制的各个方面。E1B基因编码E1B19K和E1B55K癌蛋白。E1B19K抑制E1A诱导的细胞凋亡,并且E1B55K抑制肿瘤抑制蛋白p53。E1B55K与E4orf6一起作用以促进AAV第二链合成和病毒DNA复制。还证实E1B55K会促进AAV mRNA输出并抑制细胞mRNA输出,一起促进AAV基因表达。已经发现E1B19K当与其他AdV辅助因子诸如E1A、E1B55K、E2A和E4orf6共表达时在提高AAV滴度中起作用。
已发现VA RNA在抑制细胞先天免疫蛋白双链RNA活化激酶(PKR)中起作用,对该激酶的抑制确保有效的病毒蛋白合成。还已证实VARNA会促进AAV结构蛋白的合成和组装。本领域技术人员容易理解,AdV基因组内的VA核酸是产生VA RNA的非翻译核酸序列。
最常用的辅助功能之一来自人AdV 5型。腺病毒辅助病毒基因也可以源自其他已知的腺病毒,例如AdV 2型。AdV5基因组为约36千碱基,并且示例性AdV5基因组序列可经由NCBI参考序列AC_000008.1找到。根据NCBI参考序列,E1A由核苷酸560至1545编码;E1B19K由核苷酸1714至2244编码;E1B55K由核苷酸2019至3509编码;E2A由核苷酸22443至24032编码;并且E4orf6/7由核苷酸32914至34077编码。
在某些实施方案中,本公开提供了包含编码AdV5 E2A的核苷酸序列的核酸。在某些实施方案中,包含编码AdV5 E2A的核苷酸序列的核酸包含与编码AdV5 E2A的核苷酸序列可操作地连接的转录调控元件。在某些实施方案中,包含编码AdV5 E2A的核苷酸序列的核酸包含与SEQ ID NO:60中所示的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在某些实施方案中,包含编码AdV5 E2A的核苷酸序列的核酸包含SEQ ID NO:60所示的序列或由SEQ ID NO:60所示的序列组成。在某些实施方案中,本公开提供了在不同腺病毒血清型(例如,AdV2)中的包含对应于如针对AdV5所述的编码E2A的序列的核苷酸序列的核酸。
在某些实施方案中,本公开提供了包含编码AdV5 E4的核苷酸序列的核酸。在某些实施方案中,包含编码AdV5 E4的核苷酸序列的核酸包含与编码AdV5 E4的核苷酸序列可操作地连接的转录调控元件。在某些实施方案中,包含编码AdV5 E4的核苷酸序列的核酸包含与SEQ ID NO:61中所示的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在某些实施方案中,包含编码AdV5 E4的核苷酸序列的核酸包含SEQ ID NO:61所示的序列或由SEQ ID NO:61所示的序列组成。在某些实施方案中,本公开提供了在不同腺病毒血清型(例如,AdV2)中的包含对应于如针对AdV5所述的编码E4的序列的核苷酸序列的核酸。
在某些实施方案中,本公开提供了包含编码AdV5 VARNA的核苷酸序列的核酸。在某些实施方案中,包含编码AdV5 VARNA的核苷酸序列的核酸包含与编码AdV5 VA RNA的核苷酸序列可操作地连接的转录调控元件。在某些实施方案中,包含编码AdV5 VARNA的核苷酸序列的核酸包含与SEQ ID NO:62中所示的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在某些实施方案中,包含编码AdV5 VA RNA的核苷酸序列的核酸包含SEQ ID NO:62所示的序列或由SEQID NO:62所示的序列组成。本领域技术人员容易理解,VA RNA核酸序列是产生(例如,“编码”)VARNA的非翻译核酸序列。在某些实施方案中,本公开提供了在不同腺病毒血清型(例如,AdV2)中的包含对应于如针对AdV5所述的编码VARNA的序列的核苷酸序列的核酸。
在某些实施方案中,本公开提供了包含编码AdV5 E2A、E4和VA RNA的核苷酸序列的核酸。在某些实施方案中,包含编码AdV5E2A、E4和VA RNA的核苷酸序列的核酸包含一个或多个转录调控元件,所述转录调控元件可操作地连接至编码AdV5 E2A、E4和VA RNA的核苷酸序列中的每一个核苷酸序列。在某些实施方案中,包含编码AdV5 E2A、E4和VA RNA的核苷酸序列的核酸包含与SEQ ID NO:63中所示的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在某些实施方案中,包含编码AdV5 E2A、E4和VA RNA的核苷酸序列的核酸包含SEQ ID NO:63所示的序列或由SEQ ID NO:63所示的序列组成。
在某些实施方案中,本公开提供了包含编码有效AAV产生所需的最小AdV辅助因子集合的核苷酸序列的核酸。在某些实施方案中,包含编码最小AdV辅助因子集合的核苷酸的核酸编码AdV分子E1A、E1B、E2A、E4和VARNA。
某些宿主细胞诸如HEK293T细胞内源性地提供一些但不是全部所需的辅助因子,并且其余的辅助因子可经由质粒转染外源性地提供。例如,HEK293T细胞内源性表达腺病毒E1A和E1B基因,并提供有其余腺病毒辅助基因,即编码AdV5 E4、E2A和病毒相关(VA)RNA的那些。此类AdV5辅助基因可以通过转染由单一载体提供。在某些实施方案中,本公开提供了包含选自E2A、E4和VARNA的AdV5辅助病毒基因的第二核酸载体。在某些实施方案中,本公开提供了包含辅助病毒基因的第二核酸载体,所述辅助病毒基因编码如针对AdV5所述的源自不同腺病毒血清型(例如,AdV2)的E2A、E4和VA RNA。
辅助病毒基因也可以源自疱疹病毒、乳头瘤病毒和人博卡病毒。辅助病毒因子所来源的疱疹病毒的实例包括HSV-1和HSV-2。已知参与支持AAV产生的源自HSV-1的辅助病毒因子包括但不限于UL5、UL8、UL52、ICP8、ICP0、ICP4、ICP22、UL30和UL42。这些HSV-1辅助病毒因子的各种功能以及它们如何支持AAV产生是本领域技术人员已知的。例如,除单链DNA结合蛋白ICP8外,已知HSV-1解旋酶-引发酶复合物UL5/UL8/UL52足以在AAV感染模型中恢复AAV子代产生;ICP0、ICP4和ICP22参与促进Rep蛋白的表达;并且HSV-1DNA聚合酶UL30/UL42参与AAV DNA的复制。因此,在某些实施方案中,第二核酸载体包含至少一种选自UL5、UL8、UL52、ICP8、ICP0、ICP4、ICP22、UL30和UL42的辅助病毒基因。辅助病毒因子所来源的乳头瘤病毒的实例是HPV-16。在某些实施方案中,源自HPV-16的辅助病毒因子可以在AdV辅助因子的存在下增强AAV产生。已知参与支持AAV复制的此类HPV-16辅助因子包括但不限于E1、E2和E6。辅助病毒因子可以源自其中的人博卡病毒的实例是人博卡病毒1(HBoVl)。已知参与支持AAV产生的源自HBoV1的辅助病毒因子包括但不限于NP1、NS2、NS4及病毒长非编码RNABocaSR。
IV.载体和细胞
本公开提供了第一核酸载体,其包含:编码AAV Rep蛋白的第一核苷酸序列、包含含有转基因的rAAV基因组的第二核苷酸序列和编码AAV衣壳蛋白的第三核苷酸序列;和第二核酸载体,其包含辅助病毒基因。
第一核酸载体和第二核酸载体可以独立地为任何形式的核酸载体。合适的载体包括但不限于质粒、最小载体(例如,微环、Nanopla smidsTM、doggybone、MIDGE载体等)、病毒、粘粒、人工染色体、线性DNA和mRNA。在某些实施方案中,第一核酸载体和/或第二核酸载体是DNA质粒或DNA最小载体。可容纳必需载体元件的任何D NA质粒或DNA最小载体可用于第一核酸载体和第二核酸载体。合适的DNA最小载体包括但不限于线性共价闭合的DNA(例如,小串DNA)、线性共价闭合的哑铃形DNA(例如,doggybone DNA,哑铃形DNA)、微环、NanoplasmidsTM、最小免疫限定的基因表达(MIDGE)载体和本领域技术人员已知的其他载体。DNA最小载体及其生产方法描述于例如美国专利申请第20100233814号、第20120282283号、第20130216562号、第20150218565号、第20150218586号、第20160008488号、第20160215296号、第20160355827号、第20190185924号、第20200277624号和第20210010021号,所有专利申请通过引用整体并入本文。
在某些实施方案中,本文公开的载体中的核酸例如通过密码子/RNA优化、用异源信号序列置换和/或消除mRNA不稳定性元件来优化。通过引入密码子变化和/或消除mRNA中的抑制区来生成用于重组表达的优化多核苷酸的方法可通过修改例如美国专利第5,965,726号、第6,174,666号、第6,291,664号、第6,414,132号和第6,794,498号中描述的优化方法来进行,所有专利通过引用整体并入本文。例如,可以使RNA内的潜在剪接位点和不稳定元件(例如,富含A/T或A/U的元件)突变,而不改变由核酸序列编码的氨基酸,以增加用于重组表达的RNA的稳定性。所述改变利用遗传密码的简并性,例如使用相同氨基酸的替代密码子。在某些实施方案中,可能期望改变一个或多个密码子以编码保守性突变,例如与原始氨基酸具有相似化学结构和性质和/或功能的相似氨基酸。相对于由尚未优化的多核苷酸编码的衣壳的表达,此类方法可以增加编码的衣壳蛋白的表达。
可以将本文公开的载体引入细胞(使用本领域已知的任何技术)用于载体的增殖和/或用于由载体编码的蛋白质的表达。因此,在另一个方面,本公开提供了包含本文公开的载体的重组细胞。此外,在另一个方面,本公开提供了产生rAAV的方法,所述方法包括在表达多核苷酸和产生rAAV的条件下培养重组细胞。
可以利用多种宿主细胞和表达系统。此类表达系统表示媒介物,通过该媒介物可以产生感兴趣的编码序列并随后纯化,但也表示细胞,当用本文所述的合适核苷酸编码序列转化或转染时,该细胞可以产生rAAV。这些包括但不限于微生物,诸如用例如含有本文所述的核苷酸编码序列的重组噬菌体DNA、质粒DNA或粘粒DNA表达载体转化的细菌(例如,大肠杆菌(E.coli)和枯草芽孢杆菌(B.subtilis));用例如含有本文所述的核苷酸编码序列的重组酵母表达载体转化的酵母(例如,毕赤酵母(Saccharomyces Pichia));用例如含有本文所述的核苷酸编码序列的重组病毒表达载体(例如,杆状病毒)感染的昆虫细胞系统;用例如重组病毒表达载体(例如,花椰菜花叶病毒,CaMV;烟草花叶病毒,TMV)感染或用例如含有本文所述的核苷酸编码序列的重组质粒表达载体(例如,Ti质粒)转化的植物细胞系统(例如,绿藻诸如莱氏衣藻(Chlamydomonas reinhardtii));或哺乳动物细胞系统(例如,COS(例如,COS1或COS)、CHO、BHK、MDCK、HEK293、NS0、PER.C6、VERO、CRL7O3O、HsS78Bst、HeLa和NIH 3T3、HEK293T、HEK293F、HepG2、SP210、R1.1、B-W、L-M、BSC1、BSC40、YB/20和BMT10细胞),其携带例如含有本文所述的核苷酸编码序列的重组表达构建体,所述核苷酸编码序列包含源自哺乳动物细胞的基因组的启动子(例如,金属硫蛋白启动子)或源自哺乳动物病毒的启动子(例如,腺病毒晚期启动子;痘苗病毒7.5K启动子)。在某些实施方案中,用于表达本文所述的核苷酸编码序列的细胞是人细胞,例如人细胞系。在某些实施方案中,哺乳动物表达载体是pOptiVECTM或pcDNA3.3。在某些实施方案中,细菌细胞诸如大肠杆菌或真核细胞(例如,哺乳动物细胞)用于表达本文所述的核苷酸编码序列。例如,哺乳动物细胞诸如CHO或HEK293细胞连同载体元件诸如来自人巨细胞病毒的主要中间早期基因启动子元件是本文所述多核苷酸的有效表达系统。
在细菌系统中,可以根据所表达的蛋白质的预期用途有利地选择许多表达载体。例如,当要产生大量蛋白质时,期望指导易于纯化的高水平融合蛋白产物表达的载体。此类载体包括但不限于大肠杆菌表达载体pUR278(Ruether U和Mueller-Hill B(1983)EMBO J2:1791-1794),其中蛋白质编码序列可以与lac Z编码区在框内单独连接到载体中,以便产生融合蛋白;pIN载体(Inouye S和Inouye M(1985)Nuc Acids Res 13:3101-3109;VanHeeke G和Schuster SM(1989)J Biol Chem 24:5503-5509);等等,所有这些文献通过引用整体并入本文。例如,pGEX载体也可用于表达作为与谷胱甘肽5-转移酶(GST)的融合蛋白的外源多肽。一般而言,此类融合蛋白是可溶的,并且可以通过吸附和结合到基质谷胱甘肽琼脂糖珠粒,随后在游离谷胱甘肽的存在下洗脱而容易地从裂解细胞中纯化。pGEX载体被设计为包括凝血酶或因子Xa蛋白酶切割位点,使得克隆的靶基因产物可以从GST部分释放。
在昆虫系统中,例如,苜蓿夜蛾核多角体病毒(Autographa cahf ornicanuclearpolyhedrosis virus,AcNPV)可用作表达外源基因的载体。病毒在草地贪夜蛾(Spodopterafrugiperda)细胞中生长。蛋白质编码序列可以单独克隆到病毒的非必需区(例如多角体蛋白基因)中,并置于AcNPV启动子(例如多角体蛋白启动子)的控制下。
在哺乳动物宿主细胞中,可以使用许多基于病毒的表达系统。在使用腺病毒作为表达载体的情况下,可以将感兴趣的蛋白质编码序列连接到腺病毒转录/翻译控制复合物,例如晚期启动子和三联体前导序列。然后可以通过体外或体内重组将该嵌合基因插入腺病毒基因组中。插入病毒基因组的非必需区域(例如,区域E1或E3)中将产生活的并且能够在受感染的宿主中表达本文所述的核苷酸编码序列的重组病毒(参见,例如,Logan J和ShenkT(1984)PNAS 81(12):3655-9,其通过引用整体并入本文)。插入的蛋白质编码序列的有效翻译也需要特定的起始信号。这些信号包括ATG起始密码子和相邻序列。此外,起始密码子必须与所需编码序列的阅读框同相,以确保整个插入片段的翻译。这些外源翻译控制信号和起始密码子可以是天然和合成的多种来源的。表达的效率可以通过包含适当的转录增强子元件、转录终止子等来增强(参见,例如,Bitter G等人(1987)MethodsEnzymol.153:516-544,其通过引用整体并入本文)。
另外,可以选择调节插入的序列的表达或以期望的特定方式修饰和加工基因产物的宿主细胞株。蛋白质产物的此类修饰(例如,糖基化)和加工(例如,裂解)对于蛋白质的功能可能很重要。不同的宿主细胞具有用于蛋白质和基因产物的翻译后加工和修饰的特征性和特异性机制。可以选择适当的细胞系或宿主系统以确保表达的外源蛋白的正确修饰和加工。为此,可以使用具有用于适当加工初级转录物、糖基化和基因产物磷酸化的细胞机制的真核宿主细胞。此类哺乳动物宿主细胞包括但不限于CHO、VERO、BHK、Hela、MDCK、HEK293、HEK293T、HEK293F、HEK293EBNA、NIH 3T3、W138、BT483、Hs578T、HTB2、BT2O和T47D、NS0(不内源性产生任何免疫球蛋白链的鼠骨髓瘤细胞系)、CAP、CAP-T、CRL7O3O、COS(例如,COS1或COS)、PER.C6、VERO、AGE1.CR、A549、HsS78Bst、HepG2、C139、EB66、SP210、R1.1、B-W、L-M、BSC1、BSC40、YB/20、BMT10和HsS78Bst细胞。
在某些实施方案中,不是使用含有病毒复制起点的表达载体,而是可以用受适当的转录调控元件(例如,启动子、增强子、序列、转录终止子、多聚腺苷酸化位点等)控制的多核苷酸(例如,DNA或RNA)和选择标记转化宿主细胞。在引入多核苷酸后,可以使工程化细胞在富集培养基中生长1-2天,然后转换到选择性培养基中。重组质粒中的选择性标记赋予对选择的抗性,并允许细胞稳定地将质粒整合到它们的染色体中并生长形成灶,灶又可以被克隆并扩增到细胞系中。该方法可有利地用于工程改造表达本文所述的蛋白质或其片段的细胞系。
可以使用许多选择系统,包括但不限于分别在tk-、hgprt-或aprt-细胞中的单纯疱疹病毒胸苷激酶(Wigler M等人(1977)Cell 11(1):223-32)、次黄嘌呤鸟嘌呤磷酸核糖转移酶(Szybalska EH和Szybalski W(1962)PNAS 48(12):2026-2034)和腺嘌呤磷酸核糖转移酶(Lowy I等人(1980)Cell 22(3):817-23)基因,所有这些通过引用整体并入本文。此外,抗代谢物抗性可用作选择以下基因的基础:dhfr,其赋予对氨甲蝶呤的抗性(WiglerM等人(1980)PNAS 77(6):3567-70;O’Hare K等人(1981)PNAS 78:1527-31);gpt,其赋予对霉酚酸的抗性(Mulligan RC和Berg P(1981)PNAS 78(4):2072-6);neo,其赋予对氨基糖苷G-418的抗性(Wu GY和Wu CH(1991)Biotherapy 3:87-95;Tolstoshev P(1993)Ann RevPharmacol Toxicol 32:573-596;Mulligan RC(1993)Science 260:926-932;及MorganRA和AndersonWF(1993)Ann Rev Biochem 62:191-217;Nabel GJ和Felgner PL(1993)TrendsBiotechnol 11(5):211-5);和hygro,其赋予对潮霉素的抗性(Santerre RF等人(1984)Gene 30(1-3):147-56),所有这些通过引用整体并入本文。重组DNA技术领域通常已知的方法可常规应用于选择期望的重组克隆并且此类方法描述于例如Ausubel FM等人(编辑),CurrentProtocols in MolecularBiology,John Wiley&Sons,NY(1993);KrieglerM,GeneTransfer and Expression,A Laboratory Manual,Stockton Press,NY(1990),以及Dracopoli NC等人(编辑),Current Protocols in Human Genetics第12和13章,JohnWiley&Sons,NY(1994);Colbere-Garapin F等人(1981)J Mol Biol 150:1-14中,其全部通过引用整体并入本文。
V.腺相关病毒包装系统和方法
在另一个方面,本公开提供了用于重组制备本文公开的重组腺相关病毒(rAAV)的包装系统。具体而言,本公开提供了可用于在本文所述的双重载体转染系统下产生AAV的包装系统(例如,AAV产生通过使用包含递送到宿主细胞中的第一核酸载体和第二核酸载体的包装系统来介导)。此类包装系统通常包括以下或由以下组成:(1)第一核酸载体,其包含:编码AAV Rep蛋白的第一核苷酸序列、包含含有转基因的rAAV基因组的第二核苷酸序列和编码AAV衣壳蛋白的第三核苷酸序列;和(2)第二核酸载体,其包含辅助病毒基因。第一核酸载体和第二核酸载体一起能够提供产生rAAV所需的所有组分。在某些实施方案中,产生rAAV所需的组分由从中产生rAAV的宿主细胞提供。在此类实施方案中,第一核酸载体和第二核酸载体与宿主细胞一起能够提供产生rAAV所需的所有组分。本文所述的包装系统在将rAAV基因组包封在衣壳中以形成rAAV的细胞中是有效的。
在某些实施方案中,包装系统的第一核酸载体包含含有转基因的rAAV基因组。本公开的包装系统的第一核酸载体还包含AAV Rep蛋白编码序列或其功能变体的编码序列,和AAV衣壳蛋白编码序列。因此,本公开提供了包装系统的第一核酸载体,其包含:编码AAVRep蛋白或其功能变体的第一核苷酸序列、包含含有转基因的rAAV基因组的第二核苷酸序列和编码AAV衣壳蛋白的第三核苷酸序列。在某些实施方案中,包装系统的第一核酸载体从5'至3’包含:编码AAV Rep蛋白或其功能变体的第一核苷酸序列,包含含有转基因的rAAV基因组的第二核苷酸序列,以及编码AAV衣壳蛋白的第三核苷酸序列。在某些实施方案中,包装系统的第一核酸载体不包含辅助病毒基因。
在某些实施方案中,包装系统的第一核酸载体包含含有转基因的rAAV基因组。本公开的包装系统的第一核酸载体还包含AAV Rep蛋白编码序列或其功能变体的编码序列,和AAV衣壳蛋白编码序列。因此,本公开提供了包装系统的第一核酸载体,其包含:编码AAVRep蛋白或其功能变体的第一核苷酸序列、包含含有转基因的rAAV基因组的第二核苷酸序列和编码AAV衣壳蛋白的第三核苷酸序列。在某些实施方案中,包装系统的第一核酸载体从5'至3’包含:编码AAV Rep蛋白或其功能变体的第一核苷酸序列,包含含有转基因的rAAV基因组的第二核苷酸序列,以及编码AAV衣壳蛋白的第三核苷酸序列。在某些实施方案中,包装系统的第一核酸载体不包含辅助病毒基因。
任何AAV Rep蛋白可用于本文公开的包装系统中。在包装系统的某些实施方案中,Rep核苷酸序列编码AAV2 Rep蛋白。合适的AAV2 Rep蛋白可包括但不限于Rep78/68或Rep68/52。在包装系统的某些实施方案中,编码AAV2 Rep蛋白的核苷酸序列包含编码与SEQID NO:64的AAV2 Rep氨基酸序列具有最小序列同一性百分比的蛋白的核苷酸序列,其中最小序列同一性百分比在AAV2 Rep蛋白的氨基酸序列的全长上为至少70%(例如,至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)。在包装系统的某些实施方案中,AAV2 Rep蛋白具有SEQ ID NO:64所示的氨基酸序列。
在某些实施方案中,包装系统的第二核酸载体包含辅助病毒基因。本公开的包装系统的第二核酸载体可包含一种或多种辅助病毒基因。本公开的某些方面提供包装系统的第二核酸载体不包含如本文所述的第一核酸载体中发现的AAV产生的任何组分。在某些实施方案中,包装系统的第二核酸载体不包含含有转基因的rAAV基因组。在某些实施方案中,包装系统的第二核酸载体不包含AAV衣壳蛋白编码序列。在某些实施方案中,包装系统的第二核酸载体不包含Rep编码序列或其功能变体的编码序列。在某些实施方案中,包装系统的第二核酸载体不包含含有转基因的rAAV基因组,包装系统的第二核酸载体不包含AAV衣壳蛋白编码序列,和/或包装系统的第二核酸载体不包含Rep编码序列或其功能变体的编码序列。
在包装系统的某些实施方案中,辅助病毒选自腺病毒、疱疹病毒(包括单纯疱疹病毒(HSV))、痘病毒(诸如痘苗病毒)、巨细胞病毒(CMV)和杆状病毒。在包装系统的某些实施方案中,在辅助病毒是腺病毒的情况下,腺病毒基因组包含一个或多个选自E1、E2、E4和VA的腺病毒RNA基因。在包装系统的某些实施方案中,其中腺病毒基因组包含一个或多个选自E2、E4和VA的腺病毒RNA基因。在包装系统的某些实施方案中,在辅助病毒是HSV的情况下,HSV基因组包含一个或多个选自UL5/8/52、ICP0、ICP4、ICP22和UL30/UL42的HSV基因。
在包装系统的某些实施方案中,包装系统的第一核酸载体和第二核酸载体包含在两个质粒中。在某些实施方案中,包装系统的第一核酸载体包含在第一质粒中。在某些实施方案中,包装系统的第二核酸载体包含在第二质粒中。
在包装系统的某些实施方案中,包装系统的第一核酸载体和第二核酸载体包含在两种重组辅助病毒中。在某些实施方案中,包装系统的第一核酸载体包含在第一重组辅助病毒中。在某些实施方案中,包装系统的第二核酸载体包含在第二重组辅助病毒中。在某些实施方案中,包装系统的第一核酸载体和第二核酸载体包含在单一重组辅助病毒中。
在再一个方面,本公开提供了一种用于重组制备rAAV的方法,其中所述方法包括在对于将rAAV基因组包封在衣壳中以形成rAAV有效的条件下用如本文所述的包装系统转染或转导细胞。重组制备rAAV的示例性方法包括瞬时转染(例如,用一种或多种转染质粒)、病毒感染(例如,用一种或多种重组辅助病毒,诸如腺病毒、痘病毒(诸如牛痘病毒)、疱疹病毒(包括HSV、巨细胞病毒或杆状病毒))和稳定生产细胞系转染或感染(例如,用稳定生产细胞,诸如哺乳动物或昆虫细胞)。
因此,本公开提供了用于制备rAAV的包装系统,其中所述包装系统包含:(1)第一核酸载体,其包含:编码AAVRep蛋白或其功能变体的第一核苷酸序列;包含rAAV基因组的第二核苷酸序列;和编码AAV衣壳蛋白的第三核苷酸序列,和(2)包含辅助病毒基因的第二核酸载体。在某些实施方案中,本公开提供了用于制备rAAV的包装系统,其中所述包装系统包含:(1)第一核酸载体,其从5'至3'包含:编码AAV Rep蛋白或其功能变体的第一核苷酸序列;包含rAAV基因组的第二核苷酸序列;和编码AAV衣壳蛋白的第三核苷酸序列,和(2)第二核酸载体,其包含辅助病毒基因。
因此,本公开提供了用于重组制备rAAV的方法,其中所述方法包括用包装系统转染或转导细胞,所述包装系统包含:(1)第一核酸载体,其包含:编码AAV Rep蛋白或其功能变体的第一核苷酸序列;包含rAAV基因组的第二核苷酸序列;和编码AAV衣壳蛋白的第三核苷酸序列,和(2)第二核酸载体,其包含辅助病毒基因。在某些实施方案中,本公开提供了用于重组制备rAAV的方法,其中所述方法包括用包装系统转染或转导细胞,所述包装系统包含:(1)第一核酸载体,其从5’至3’包含:编码AAVRep蛋白或其功能变体的第一核苷酸序列;包含rAAV基因组的第二核苷酸序列;和编码AAV衣壳蛋白的第三核苷酸序列,和(2)第二核酸载体,其包含辅助病毒基因。
在某些实施方案中,转染或转导到细胞中的核酸的总量为0.1μg DNA/1E6个细胞至4μg DNA/1E6个细胞,所述核酸包括(1)第一核酸载体,其包含:编码AAVRep蛋白或其功能变体的第一核苷酸序列;包含rAAV基因组的第二核苷酸序列;编码AAV衣壳蛋白的第三核苷酸序列,和(2)第二核酸载体,其包含辅助病毒基因。例如,转染或转导到细胞中的核酸(包括第一核酸载体和第二核酸载体)的总量为0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9、3、3.1、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9或4μg DNA/1E6个细胞。在某些实施方案中,转染或转导到细胞中的核酸(包括第一核酸载体和第二核酸载体)的总量为1μg DNA/1E6个细胞。在某些实施方案中,转染或转导到细胞中的核酸(包括第一核酸载体和第二核酸载体)的总量为0.6μg DNA/1E6个细胞。在某些实施方案中,转染或转导到细胞中的核酸(包括第一核酸载体和第二核酸载体)的总量为0.7μg DNA/1E6个细胞。在某些实施方案中,转染或转导到细胞中的核酸(包括第一核酸载体和第二核酸载体)的总量为0.75μg DNA/1E6个细胞。在某些实施方案中,转染或转导到细胞中的核酸(包括第一核酸载体和第二核酸载体)的总量为0.8μg DNA/1E6个细胞。在某些实施方案中,转染或转导到细胞中的核酸(包括第一核酸载体和第二核酸载体)的总量为0.9μg DNA/1E6个细胞。
在某些实施方案中,第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:0.1至1:20。例如,第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:0.1、1:0.2、1:0.3、1:0.4、1:0.5、1:0.6、1:0.7、1:0.8、1:1、1:1.1、1:1.2、1:1.3、1:1.4、1:1.5、1:1.6、1:1.7、1:1.8、1:1.9、1:2、1:2.1、1:2.2、1:2.3、1:2.4、1:2.5、1:2.6、1:2.7、1:2.8、1:2.9、1:3、1:3.1、1:3.2、1:3.2、1:3.3、1:3.4、1:3.5、1:3.6、1:3.7、1:3.8、1:3.9、1:4、1.4.5、1:5、1:5.5、1:6、1:6.5、1:7、1:7.5、1:8、1:8.5、1:9、1:9.5、1:10、1:10.5、1:11、1:11.5、1:12、1:12.5、1:13、1:13.5、1:14、1:14.5、1:15、1:15.5、1:16、1:16.5、1:17、1:17.5、1:18、1:18.5、1:19、1:19.5或1:20。在某些实施方案中,第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率选自1:0.2、1:0.4、1:0.6、1:0.8、1:1、1:2、1:3或1:4。在某些实施方案中,第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:2。在某些实施方案中,第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:0.2至1:1。在某些实施方案中,第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:0.6。在某些实施方案中,第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:0.8。在某些实施方案中,第一核酸载体与第二核酸载体的比率或第二核酸载体与第一核酸载体的比率为1:1。
在某些实施方案中,用于重组制备本文公开的rAAV的方法与包括使用以下哺乳动物细胞产生rAAV的方法相比导致增加的rAAV滴度,所述哺乳动物细胞包含:(i)包含编码AAVRep蛋白和AAV衣壳蛋白的核苷酸序列的第一载体;(ii)包含所述rAAV基因组的第二载体;以及(iii)包含所述一种或多种辅助病毒基因的第三载体。在某些实施方案中,用于重组制备本文公开的rAAV的方法与包括使用以下哺乳动物细胞产生rAAV的方法相比导致增加的rAAV滴度,所述哺乳动物细胞包含:(i)包含编码AAVRep蛋白和AAV衣壳蛋白的核苷酸序列的第一载体;(ii)包含所述rAAV基因组的第二载体;以及(iii)包含所述一种或多种辅助病毒基因的第三载体。
在某些实施方案中,哺乳动物细胞在细胞培养物中提供。在某些实施方案中,细胞培养物的体积为至少2升、至少50升或至少2000升。在某些实施方案中,细胞培养物的体积为约2升至约5000升。在某些实施方案中,细胞培养物的体积为约2升至约4000升。在某些实施方案中,细胞培养物的体积为约2升至约3000升。在某些实施方案中,细胞培养物的体积为约2升至约2500升。在某些实施方案中,细胞培养物的体积为约2升至约2000升。在某些实施方案中,细胞培养物的体积为约2升至约1500升。在某些实施方案中,细胞培养物的体积为约2升至约1000升。在某些实施方案中,细胞培养物的体积为约2升至约500升。在某些实施方案中,细胞培养物的体积为约2升至约250升。在某些实施方案中,细胞培养物的体积为约2升至约100升。在某些实施方案中,细胞培养物的体积为约2升至约50升。在某些实施方案中,细胞培养物的体积为约2升至约25升。在某些实施方案中,本文所述的方法在体积为至少2升、至少50升或至少2000升的生物反应器中进行。在某些实施方案中,本文所述的方法在体积为2000升的生物反应器中进行。
实施例
以下实施例是以说明的方式而不是以限制的方式提供的。
实施例1:材料和方法
在以下实施例中使用以下一般材料和方法。
小规模生产:使HEK293细胞扩增至少一代,并在转染前接种到含有适量的细胞培养基的摇瓶中。将摇瓶在振荡器中在37℃、8%CO2和135rpm下孵育。当细胞达到1.8E6至2.4E6个细胞/mL(对于实施例1-8)或3.6E6至5E6个细胞/mL(对于实施例9)的密度时,转染细胞。通过将计算体积的载体、OptiPro培养基和聚乙烯亚胺(PEI)全部在环境温度下混合来制备转染混合物。然后将转染混合物添加到摇瓶中,并且在振荡器中在37℃、8%CO2和135rpm下孵育72小时,然后收获。孵育72小时后,使用含有1M Tris(pH 9.5)、10%TritonX-100、1M MgCl2、核酸内切酶(例如,)和5M NaCl的裂解缓冲液裂解细胞,并将摇瓶在37℃、8%CO2和135rpm下孵育60分钟。通过离心收集粗裂解物样品。
2L生物反应器生产:将HEK293细胞扩增至少一代,并在转染前接种到含有适量的细胞培养基的2L生物反应器(Millipore Mobius)中。转染前将pH调至7.1±0.1,并以1.8E6至2.4E6个细胞/mL(对于实施例4-8)或3.6E6-5E6个细胞/mL(对于实施例9-11)的密度转染细胞。通过将计算体积的载体、OptiPro SFM培养基和聚乙烯亚胺(PEI)全部在环境温度下混合来制备转染混合物,并使其平衡10分钟,然后将转染混合物添加到细胞中。在转染后69-75小时收获细胞。使用含有1M Tris(pH 9.5)、10%Triton X-100、1M MgCl2、核酸内切酶(例如,)和5M NaCl的裂解缓冲液裂解收获的细胞。向生物反应器中添加适当体积的裂解缓冲液,并将细胞在37℃和283rpm下孵育120分钟。离心后收集粗裂解物样品以去除细胞碎片。
通过微滴数字PCR(ddPCR),通过标准方法,使用对包含转基因的载体(即转基因载体)的转基因有效负荷具有特异性的引物/探针集,测定以每个细胞的载体基因组数目(vg/细胞)表示的载体基因组生产率。通过微滴数字PCR(ddPCR),通过标准方法,使用对包含转基因的载体(即转基因载体)的转基因有效负荷具有特异性的引物/探针集,测定以每升的载体基因组数目(vg/L)表示的载体基因组生产率。使用酶联免疫吸附测定(ELISA),通过标准方法,用针对由包含Cap序列的载体编码的衣壳的表位的固定化抗体测定每个细胞的衣壳数。完整载体基因组的百分比(即,完整衣壳的百分比)通过将通过ddPCR测定的载体基因组生产率除以通过ELISA测定的(在实施例2-4中)或通过分析超速离心沉降速度(AUC)分析测定的(在实施例5中)每个细胞的衣壳数来计算。
实施例2:双重和三重转染系统之间的比较
进行初始小规模生产、概念验证研究以评估双重载体转染系统相对于其载体基因组(VG)生产率的效用,以及与三重转染系统相比可获得的完整载体基因组的百分比。根据表1示出的那些设定转染条件。
表1:转染条件
如表1所示,双重载体转染系统包含第一V4载体和第二V3载体。三重载体转染系统包含载体V1、V2和V3。在表1中,载体比率是基于质量。各种载体中所含的元件示于表2中。
在适当大小的锥形管中通过全部在环境温度下添加计算体积的载体、OptiPro培养基和聚乙烯亚胺(PEI),制备每种转染条件的转染混合物。将转染混合物以1μg DNA/1E6个细胞的浓度添加到细胞中。将摇瓶孵育72小时,之后收获。在收获时,裂解细胞,离心后收集粗裂解物样品以去除细胞碎片,用于随后的微滴数字PCR(ddPCR)和通过ELISA进行的衣壳分析。
表2:载体元件
/>
图1A-图1C示出了由使用双重和三重转染系统的生产获得的VG生产率(图1A)、衣壳生产率(图1B)和完整载体基因组的百分比(图1C)。如图1A和图1C所示,发现由使用双重载体转染系统的生产获得的VG生产率和完整载体基因组的百分比高于由三重载体转染系统获得的VG生产率和完整载体基因组的百分比。这些数据证明,与对照三重载体转染系统相比,使用双重载体转染系统产生增加的rAAV滴度。图1A-图1C中所示的各种条件示于表1中。
用另外的转染条件进行验证性实验以确定使用不同的转基因载体是否可以复制从双重转染系统获得的增加的VG生产率和增加的完整载体基因组的百分比。根据表3所示的那些设定转染条件,并且各种载体中所含的元件示于表2中。在表2中,载体比率基于质量。
表3:转染条件
在适当大小的锥形管中通过全部在环境温度下添加计算体积的载体、OptiPro培养基和聚乙烯亚胺(PEI),制备每种转染条件的转染混合物。将转染混合物以1μg DNA/1E6个细胞的浓度添加到细胞中。将摇瓶孵育72小时,之后收获。在收获时,裂解细胞,离心后收集粗裂解物样品以去除细胞碎片,用于随后的微滴数字PCR(ddPCR)和通过ELISA进行的衣壳分析。
图2A-图2C示出了由使用双重和三重转染系统的生产获得的VG生产率(图2A)、衣壳生产率(图2B)和完整载体基因组的百分比(图2C)。如图2A和图2C所示,发现使用双重载体转染系统由产生获得的VG生产率和完整载体基因组的百分比高于由三重载体转染系统获得的VG产率和完整载体基因组的百分比。发现双重载体转染系统的增加的生产率在至少两种不同的转基因载体中是一致的,所述转基因载体包含含有人基因组特异性同源臂的编辑基因组(条件1和条件2)或含有小鼠基因组特异性同源臂的编辑基因组(条件3和条件4)。图2A-图2C中所示的各种条件示于表3中。
总的来说,本实施例中呈现的数据指示与三重转染系统相比,双重载体转染系统的功效。具体而言,双重载体转染系统增加粗裂解物滴度和完整载体基因组的百分比。
实施例3:双重载体转染系统设计之间的比较
为了研究双重载体转染系统中载体元件的组织是否影响生产率,测试了两种双重载体转染系统设计。评价从基于每种设计的生产获得的载体基因组(VG)生产率和完整载体基因组的百分比。双重载体转染系统设计-1(“设计-1”)和设计-2(“设计-2”)的区别在于相对于载体基因组和辅助序列而言,Rep/Cap序列所在的载体不同。图3A-图3B提供了设计-1(图3A)和设计-2(图3B)的示意图。如图所示,设计-1包含含有Rep/Cap序列和转基因(“GOI”)的第一载体和含有辅助序列的第二载体(图3A);并且设计-2包含含有转基因(“GOI”)的第一载体,和含有辅助序列和Rep/Cap序列的第二载体(图3B)。根据表4示出的那些设定转染条件。
表4:转染条件
如表4所示,设计-1包含第一V4载体和第二V3载体。设计-2包含第一V1载体和第二V7载体。评估从三重转染获得的VG生产率和完整载体基因组的百分比作为对照。各种载体中所含的元件示于表2中。在表4中,载体比率是基于质粒大小(即摩尔比)以在比较双重载体转染系统设计时考虑载体的不同大小。
在适当大小的锥形管中通过全部在环境温度下添加计算体积的载体、OptiPro培养基和聚乙烯亚胺(PEI),制备每种转染条件的转染混合物。将转染混合物以1μg DNA/1E6个细胞的浓度添加到细胞中。将摇瓶孵育72小时,之后收获。在收获时,裂解细胞,离心后收集粗裂解物样品以去除细胞碎片,用于随后的微滴数字PCR(ddPCR)和通过ELISA进行的衣壳分析。
图4A-图4C示出了由使用双重和三重转染系统的生产获得的VG生产率(图4A)、衣壳生产率(图4B)和完整载体基因组的百分比(图4C)。如图4A和图4C所示,发现使用设计-1的生产获得的VG生产率和完整载体基因组的百分比高于由三重转染系统获得的VG生产率和完整载体基因组的百分比。此外,如图4A和图4C所示,发现由使用设计-1的生产获得的VG生产率和计算的完整载体基因组的百分比高于由使用设计-2的生产获得的那些。基于这些结果,选择设计-1进行进一步研究。图4A-图4C中所示的各种条件示于表4中。
测试第三种双重载体转染系统设计(“设计-3”)。一起评价由基于三种设计中的每一种的生产获得的载体基因组(VG)生产率和完整载体基因组的百分比。如以上所讨论,设计-1包含含有Rep/Cap序列和转基因(“GOI”)的第一载体和含有辅助序列的第二载体(图3A);设计-2包含含有转基因的第一载体(“GOP”)和含有辅助序列和Rep/Cap序列的第二载体(图3B);并且设计3包含含有转基因(“GOI”)和辅助序列的第一载体,和含有Rep/Cap序列的第二载体(图3C)。根据表5示出的那些设定转染条件。
表5:转染条件
如表5所示,设计-1包含第一V20载体和第二V3载体。设计-2包含第一V19载体和第二V7载体。设计-3包含第一V21载体和第二V2载体。评估从三重转染获得的VG生产率和完整载体基因组的百分比作为对照。各种载体中所含的元件示于表2中。在表5中,载体比率是从1:1(1:1:1)摩尔比转换的质量比。
在适当大小的锥形管中通过全部在环境温度下添加计算体积的载体、OptiPro培养基和聚乙烯亚胺(PEI),制备每种转染条件的转染混合物。将转染混合物以1μg DNA/1E6个细胞的浓度添加到细胞中。将摇瓶孵育72小时,之后收获。在收获时,裂解细胞,离心后收集粗裂解物样品以去除细胞碎片,用于随后的微滴数字PCR(ddPCR)和通过ELISA进行的衣壳分析。
图5A-图5C示出了由使用双重和三重转染系统的生产获得的VG生产率(图5A)、衣壳生产率(图5B)和完整载体基因组的百分比(图5C)。如图5A和图5C所示,发现由使用设计-1的生产获得的VG生产率和完整载体基因组的百分比高于由三重转染系统获得的VG生产率和完整载体基因组的百分比。此外,如图5A和图5C所示,发现由使用设计-1的生产获得的VG生产率和计算的完整载体基因组的百分比高于由使用设计-2和设计-3的生产获得的那些。这些数据证明,与设计-2双重载体转染系统、设计-3双重载体转染系统和对照三重载体转染系统相比,使用设计-1双重载体转染系统产生增加的rAAV滴度。图5A-图5C中所示的各种条件示于表5中。
实施例4:双重和三重转染系统之间的比较
为了证实与实施例3中观察到的三重转染相比,设计-1的生产率增加,设定转染条件以研究增加的功效在更大规模(2L规模)是否维持,以及设计-1的增加的功效是否在具有不同转基因的rAAV基因组的包装并进入不同的衣壳中持续。根据表6示出的那些设定转染条件。在表6中,载体比率基于质量。
表6:转染条件
如表6所示,设定转染条件1、2、3、4、5和6以研究设计-1增加的功效是否在具有不同转基因的rAAV基因组的包装中持续。除了研究设计-1在具有不同转基因的rAAV基因组在包装中的功效外,条件6和条件7还评估功效是否在rAAV基因组包装到不同衣壳中持续。条件1-5各自利用AAVHSCS15衣壳,条件6利用AAVHSCS17衣壳,条件7利用AAV2衣壳。评估从三重转染获得的VG生产率和完整载体基因组的百分比作为对照。各种载体中所含的元件示于表2中。
在适当大小的转移组件中通过全部在环境温度下添加计算体积的载体、OptiPro培养基和聚乙烯亚胺(PEI),制备每种转染条件的转染混合物。将转染混合物以1μg DNA/1E6个细胞的浓度添加到细胞中。将细胞孵育72小时,之后收获。
在收获时,裂解细胞,离心后收集粗裂解物样品以去除细胞碎片,用于随后的微滴数字PCR(ddPCR)和通过ELISA进行的衣壳分析。
图6A-图6C示出了由使用设计-1和对照三重转染系统的生产获得的VG生产率(图6A)、衣壳生产率(图6B)和完整载体基因组的百分比(图6C)。如图6A和图6C所示,发现在所有测试条件下,由使用设计-1的生产获得的VG生产率和完整载体基因组的百分比高于从三重转染系统获得的VG生产率和完整载体基因组的百分比。基于这些结果,在具有不同转基因的rAAV包装到不同衣壳中,观察到使用设计-1生产的功效相对于三重转染增加。发现双重载体转染系统的增加的生产率在五种不同的rAAV基因组中是一致的,其中两种包含编辑基因组(条件1和条件2)。这些数据证明使用设计-1双重载体转染系统相对于使用对照三重载体转染系统获得的增加的rAAV滴度在具有不同转基因的rAAV包装到不同衣壳中持续。图6A-图6C中所示的各种条件示于表6中。
图7A-图7C示出了由利用AAV2衣壳,使用设计-1和对照三重转染系统(条件7)的生产获得的VG生产率(图7A)、衣壳生产率(图7B)和完整载体基因组的百分比(图7C)。如图7A和图7C所示,发现由利用AAV2衣壳,使用设计-1的生产获得的VG生产率和完整载体基因组的百分比高于由三重转染系统获得的VG生产率和完整载体基因组的百分比。图7A-图7C中的数据由小规模生产研究生成。
在单独的实验中,发现设计-1也能够产生包含AAVHSC13衣壳的rAAV(参见美国专利第9,803,218号,其整体并入本文)。
这些数据表明设计-1双重质粒系统(相对于三重质粒系统对照)表现出的AAV生产的改进可能是普遍适用的。
实施例5:双重和三重转染系统之间的比较
与使用对照三重转染系统的生产相比,实施例3和实施例4展示出在从使用设计-1的生产获得的粗裂解物中测得增加的VG生产率和增加的完整载体基因组的百分比。
为了证实增加的VG生产率和增加的完整载体基因组的百分比在纯化后得以维持,将获自根据表7中列出的那些设定的转染的粗裂解物澄清,随后通过亲和色谱法和阴离子交换色谱法纯化。在表7中,除了以50L规模进行的条件3之外,条件1、2和4分别根据表6中的条件2、3和5(即,以2L规模)进行。单独纯化使用不同载体比率产生的裂解物。条件1-3各自利用AAVHSCS15衣壳,而条件4利用AAVHSCS17衣壳。从设计-1双重质粒系统获得的完整载体基因组表示为相对于从所示对照三重质粒系统获得的完整载体基因组的量的百分比增加(表7和图8)。在表7中,载体比率基于质量。各种载体中所含的元件示于表2中。
表7:转染条件
图8中描绘的数据基于分析超速离心沉降速度(AUC)分析,这是一种用于基于沉降系数对大分子进行定量的方法。AUC用于确定相对于相应的三重质粒系统对照,由每个设计-1双重质粒系统产生的完整载体基因组和缺少载体基因组的衣壳的百分比。在图8中,对于条件1和条件2,对从设计-1载体比率(即,表7所示的1:2、1:3和1:4比率)中的每一个比率获得的纯化载体进行AUC以确定完整载体基因组的数目,然后取平均值并呈现为相对于相应的三重质粒系统对照的百分比增加。如图8所示,对于测试的四种设计-1双重质粒系统中的每一种,获得完整载体基因组数目的增加(相对于从相应的三重质粒系统控制获得的完整载体基因组的数目)。这些数据表明设计-1双重质粒系统(相对于三重质粒系统对照)表现出的AAV生产的改进可能是普遍适用的并且可扩展的。
实施例6:双重转染系统中的衣壳背景表达
为了阐明设计-1优于其他双重质粒转染系统设计的原因,在设计-1中测定背景衣壳表达水平,并与设计-2中的背景衣壳表达水平进行比较。根据表8示出的那些设定转染条件。在表8中,载体比率基于质量。
表8:转染条件
如表8所示,对于每种相应的双重设计,设计-1和设计-2与仅含Rep/Cap的载体一起测试。相同量的含有Rep/Cap的载体单独使用(例如,条件2和条件4)或作为双重设计中的载体使用(例如,条件1和条件3)。
发现来自设计-2(仅载体V7转染;条件2)的背景衣壳生成水平与设计2的双重转染(载体V1和载体V7两者转染;条件1)生成的背景衣壳水平相同(图9)。如图9所示,来自设计-1的背景衣壳生成低于由设计-1的双重转染生成的背景衣壳水平的1%(比较条件4与条件3)。
实施例7:来自双重和三重转染系统的AAV的大规模生产和质量评估
为了研究设计-1的提高的生产率在更大规模的生产下是否维持,在50L生物反应器规模下重复表6中设计-1的载体比率为1:2的条件4。与摇瓶和2L生物反应器规模的趋势一致,来自50L生物反应器的结果证明,与从三重转染系统(“3TFX”,参见表6中三重转染对照的条件)获得的粗裂解物相比,从设计-1(“2TFX”)获得的粗裂解物中VG生产率几乎增加2倍,衣壳产量相当,并且计算的完整载体基因组加倍(图10A-图10C)。这些数据证明,与对照三重载体转染系统相比,使用设计-1双重载体转染系统获得的增加的rAAV滴度在更大规模的生产中得以维持。
使用各种分析方法表征从设计-1和三重转染系统获得的AAV载体的产物质量(图10D-图10J)。如图所示,纯度百分比(图10D)、聚集百分比(图10E)和残留宿主细胞蛋白水平(图10F;BLoQ意指低于定量限)无论转染方法如何均保持一致。与从三重转染系统获得的那些相比,在从设计-1获得的纯化AAV载体中包装的残留宿主细胞DNA(图10G)、Rep/Cap(图10H)、Ela(图10I)和辅助序列(图10J)的量中没有发现偏差。
实施例8:从双重和三重转染系统获得的AAV载体的生物活性
为了确保从设计1获得的AAV载体和从三重转染系统获得的AAV载体之间的产物可比性,纯化表6中对于设计1而言载体比率为1:4和相关三重转染对照的条件5获得的AAV载体,并且评估体内生物活性。rAAV基因组包含在侧翼是鼠特异性同源臂的肝特异性启动子控制下的表达苯丙氨酸羟化酶(PAH)的编辑基因组。将从设计-1和从三重转染系统获得的AAV载体注射到Pahenu2小鼠中,该小鼠是展示经典苯丙酮尿症的几个特征的模型。评价两个剂量以及仅媒介物的对照组。每周采集血清样品并分析苯丙氨酸(Phe)水平。如图11A和图11B所示,在1E12个VG/kg(图11A)和1E14个VG/kg(图11B)的两个剂量下,从设计-1和从三重转染系统获得的AAV载体的生物活性(如通过给药后血清Phe水平的降低所指示的),在六周期间内是没有区别的。此外,在六周时,肝脏中载体基因组和PAH mRNA表达的定量显示VG转导和转基因表达的剂量依赖性增加,但在每个剂量下设计-1和三重转染组之间没有显著差异(图11C和图11D)。在1E14个VG/kg剂量下完成对中靶整合的定量,并展示出从设计-1或三重转染系统产生的AAV载体的同等整合效率(图11E)。
实施例9:载体比率的优化
为了研究是否存在引起生产率提高的最佳载体比率,测试了各种设计-1载体比率。如实施例1针对小规模生产所述设定转染。
图12A-图12C示出了在测试指示的V3:V12载体比率的条件1下,以各种总转染DNA水平(x轴)生产获得的VG生产率(图12A)、衣壳生产率(图12B)和完整载体基因组的百分比(图12C)。V3和V12中所含的元件示于表2中。如图12A-图12C所示,在1:0.3至1:1的V3:V12载体比率下,每1E6个细胞使用0.6至1μg总转染DNA实现提高的VG和衣壳生产率。
图13A-图13C示出了在测试指示的V3:V8比率的条件2下,以各种总转染DNA水平(x轴)生产获得的VG生产率(图13A)、衣壳生产率(图13B)和完整载体基因组的百分比(图13C)。V3和V8中所含的元件示于表2中。如图13A-图13C所示,在1:0.6至1:1的V3:V8载体比率下,每1E6个细胞使用0.6至1μg总转染DNA实现提高的VG和衣壳生产率。这些数据证明,使用这些载体比率和总转染DNA水平实现增加的rAAV滴度。
实施例10:使用双重质粒转染评估多种衣壳血清型
为了研究设计-1的提高的生产率是否在其他AAV衣壳血清型中得以维持,利用AAV衣壳血清型AAV1、AAV2、AAV5、AAV6、AAV8、AAV9、AAVrh10和AAVrh74测试由设计-1或三重转染系统产生的AAV载体。如实施例1针对2L生物反应器生产所述设定转染。根据表9示出的那些设定转染条件。
表9:转染条件
图14A-图14C示出了在表9所示的条件下生产获得的VG生产率(图14A)、衣壳生产率(图14B)和完整载体基因组的百分比(图14C)。如图14A所示,相对于相应的三重转染系统对照,使用设计-1的生产获得的提高的VG生产率在所有测试的AAV衣壳血清型中得以维持。如图14B所示,相对于相应的三重转染系统对照,由使用设计-1的生产获得的衣壳生产率得以提高或维持。如图14C所示,相对于相应的三重转染系统对照,由使用设计-1的生产获得的完整载体基因组的百分比得以提高或维持。这些数据证明,与对照三重载体转染系统相比,使用设计-1双重载体转染系统获得的增加的rAAV滴度在不同AAV衣壳血清型中持续。
实施例11:双重质粒向2000L的可扩展性
实施例7显示,设计-1提高的生产率在50L生物反应器规模下得以维持。来自50L生物反应器的结果证明,与从三重转染系统对照获得的粗裂解物相比,从设计-1获得的粗裂解物中VG生产率几乎增加2倍。
为了研究设计-1提高的VG生产率是否是可扩展的,将50L生物反应器规模的生产率与2000L生物反应器规模的生产率进行比较。如实施例1针对2L生物反应器生产所述设定转染,除了将细胞接种到50L和2000L生物反应器中以外。以3.6E6至5E6个细胞/mL的密度转染细胞。根据表10示出的那些设定50L生物反应器和2000L生物反应器的转染条件。
表10:转染条件
图15显示50L和2000L生物反应器规模实现同等的VG生产率。这些数据证明了设计-1双重质粒转染系统的可扩展性。
本发明的另外的实施方案在以下条款中阐述:
1.一种第一核酸载体,其包含:编码AAVRep蛋白的第一核苷酸序列;包含含有转基因的重组AAV(rAAV)基因组的第二核苷酸序列;和编码AAV衣壳蛋白的第三核苷酸序列,其中所述核酸载体不包含辅助病毒基因。
2.如条款1所述的核酸载体,其从5'至3'包含:编码AAV Rep蛋白的所述第一核苷酸序列;包含含有转基因的重组AAV(rAAV)基因组的所述第二核苷酸序列;和编码AAV衣壳蛋白的所述第三核苷酸序列,其中所述核酸载体不包含辅助病毒基因。
3.如条款1所述的核酸载体,其从5'至3'包含:编码AAV Rep蛋白的所述第一核苷酸序列;包含含有转基因的重组AAV(rAAV)基因组的所述第二核苷酸序列;以及编码AAV衣壳蛋白的所述第三核苷酸序列。
4.如条款1-3中任一项所述的核酸载体,其中所述核酸载体是DNA质粒或DNA最小载体。
5.一种重组AAV(rAAV)包装系统,其包含:(i)第一核酸载体,其包含:编码AAV Rep蛋白的第一核苷酸序列;包含含有转基因的重组AAV(rAAV)基因组的第二核苷酸序列;和编码AAV衣壳蛋白的第三核苷酸序列,和(ii)第二核酸载体,其包含辅助病毒基因。
6.如条款5所述的包装系统,其中所述第一核酸载体从5'至3'包含:编码AAV Rep蛋白的第一核苷酸序列;包含含有转基因的重组AAV(rAAV)基因组的所述第二核苷酸序列;以及编码AAV衣壳蛋白的所述第三核苷酸序列。
7.如条款5或条款6所述的包装系统,其中所述第一核酸载体是DNA质粒或DNA最小载体。
8.如条款5-7中任一项所述的包装系统,其中所述第二核酸载体是DNA质粒或DNA最小载体。
9.如条款1-8中任一项所述的核酸载体或包装系统,其中所述转基因编码多肽。
10.如条款1-8中任一项所述的核酸载体或包装系统,其中所述转基因编码miRNA、shRNA、siRNA、反义RNA、gRNA、antagomir、miRNA海绵、RNA适体核酶、RNA适体、lncRNA、核酶或mRNA。
11.如条款1-8中任一项所述的核酸载体或包装系统,其中所述转基因编码选自苯丙氨酸羟化酶(PAH)、葡萄糖-6-磷酸酶(G6Pase)、艾杜糖醛酸-2-硫酸酯酶(I2S)、芳基硫酸酯酶A(ARSA)和共济蛋白(FXN)的蛋白质。
12.如任一前述条款所述的核酸载体或包装系统,其中所述rAAV基因组还包含与所述转基因可操作地连接的转录调控元件。
13.如条款12所述的核酸载体或包装系统,其中所述转录调控元件包含启动子元件和/或内含子元件。
14.如任一前述条款所述的核酸载体或包装系统,其中所述rAAV基因组还包含多聚腺苷酸化序列。
15.如条款14所述的核酸载体或包装系统,其中所述多聚腺苷酸化序列在所述转基因的3'。
16.如任一前述条款所述的核酸载体或包装系统,其中所述rAAV基因组包含与SEQID NO:71、85、86、87或88所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。
17.如任一前述条款所述的核酸载体或包装系统,其中所述rAAV基因组还包含在所述转基因的5’的5’反向末端重复(5’ITR)核苷酸序列和在所述转基因的3’的3'反向末端重复(3’ITR)核苷酸序列。
18.如条款17所述的核酸载体或包装系统,其中所述5’ITR核苷酸序列与SEQ IDNO:39、41或42中所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性,和/或所述3’ITR核苷酸序列与SEQ ID NO:40、43或44中所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性。
19.如任一前述条款所述的核酸载体或包装系统,其中所述rAAV基因组包含与SEQID NO:75、78、80、82或84所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。
20.如任一前述条款所述的核酸载体或包装系统,其中所述AAV Rep蛋白是野生型Rep蛋白或其变体。
21.如任一前述条款所述的核酸载体或包装系统,其中所述AAV Rep蛋白是AAV2Rep蛋白或其变体
22.如任一前述条款所述的核酸载体或包装系统,其中所述第一核苷酸序列还包含与所述AAV Rep蛋白编码序列可操作地连接的转录调控元件。
23.如条款22所述的核酸载体或包装系统,其中所述转录调控元件包含选自组成型启动子、诱导型启动子或天然启动子的启动子。
24.如条款23所述的核酸载体或包装系统,其中所述启动子选自P5启动子、P19启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。
25.如任一前述条款所述的核酸载体或包装系统,其中所述AAV衣壳蛋白选自AAV1、AAV2、AAV3、AAV4、AAVS、AAV6、AAV7、AAV8、AAV9、AAVrhl0、AAVRh32.33、AAVrh74、AAV-DJ、AAV-LK03、NP59、VOY101、VOY201、VOY701、VOY801、VOY1101、AAVPHP.N、AAVPHP.A、AAVPHP.B、PHP.B2、PHP.B3、G2A3、G2B4、G2B5和PHP.S。
26.如任一前述条款所述的核酸载体或包装系统,其中所述AAV衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列具有至少85%同一性的氨基酸序列。
27.如条款26所述的核酸载体或包装系统,其中:衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C;衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H;衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q;衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A;衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N;衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S;衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y;衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M;衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K;衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C;或者,衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。
28.如条款27所述的核酸载体或包装系统,其中:(a)衣壳蛋白中对应于SEQ IDNO:16的氨基酸626的氨基酸是G,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G;(b)衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H,衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M;(c)衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R;(d)衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R;或(e)衣壳蛋白中对应于SEQID NO:16的氨基酸501的氨基酸是I,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C。
29.如条款27所述的核酸载体或包装系统,其中所述AAV衣壳蛋白包含SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736的氨基酸序列。
30.如任一前述条款所述的核酸载体或包装系统,其中所述AAV衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列具有至少85%同一性的氨基酸序列。
31.如条款30所述的核酸载体或包装系统,其中:衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸160的氨基酸是D;衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C;衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H;衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q;衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A;衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N;衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S;衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y;衣壳蛋白中对应于SEQ IDNO:16的氨基酸681的氨基酸是M;衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K;衣壳蛋白中对应于SEQ IDNO:16的氨基酸706的氨基酸是C;或者,衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。
32.如条款31所述的核酸载体或包装系统,其中:(a)衣壳蛋白中对应于SEQ IDNO:16的氨基酸626的氨基酸是G,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G;(b)衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H,衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M;(c)衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R;(d)衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R;或(e)衣壳蛋白中对应于SEQID NO:16的氨基酸501的氨基酸是I,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C。
33.如条款31所述的核酸载体或包装系统,其中所述AAV衣壳蛋白包含SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸138-736的氨基酸序列。
34.如任一前述条款所述的核酸载体或包装系统,其中所述AAV衣壳蛋白包含与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列具有至少85%同一性的氨基酸序列。
35.如条款34所述的核酸载体或包装系统,其中:衣壳蛋白中对应于SEQ ID NO:16的氨基酸2的氨基酸是T;衣壳蛋白中对应于SEQ ID NO:16的氨基酸65的氨基酸是I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸68的氨基酸是V;衣壳蛋白中对应于SEQ ID NO:16的氨基酸77的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸119的氨基酸是L;衣壳蛋白中对应于SEQ ID NO:16的氨基酸151的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸160的氨基酸是D;衣壳蛋白中对应于SEQ ID NO:16的氨基酸206的氨基酸是C;衣壳蛋白中对应于SEQ ID NO:16的氨基酸296的氨基酸是H;衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q;衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A;衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N;衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S;衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I;衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸590的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G或Y;衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M;衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R;衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K;衣壳蛋白中对应于SEQ ID NO:16的氨基酸706的氨基酸是C;或者,衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G。
36.如条款35所述的核酸载体或包装系统,其中:(a)衣壳蛋白中对应于SEQ IDNO:16的氨基酸2的氨基酸是T,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸312的氨基酸是Q;(b)衣壳蛋白中对应于SEQ ID NO:16的氨基酸65的氨基酸是I,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是Y;(c)衣壳蛋白中对应于SEQ ID NO:16的氨基酸77的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸690的氨基酸是K;(d)衣壳蛋白中对应于SEQ ID NO:16的氨基酸119的氨基酸是L,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸468的氨基酸是S;(e)衣壳蛋白中对应于SEQ ID NO:16的氨基酸626的氨基酸是G,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸718的氨基酸是G;(f)衣壳蛋白中对应于SEQID NO:16的氨基酸296的氨基酸是H,衣壳蛋白中对应于SEQ ID NO:16的氨基酸464的氨基酸是N,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸681的氨基酸是M;(g)衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸687的氨基酸是R;(h)衣壳蛋白中对应于SEQ ID NO:16的氨基酸346的氨基酸是A,并且衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R;或(i)衣壳蛋白中对应于SEQ ID NO:16的氨基酸501的氨基酸是I,衣壳蛋白中对应于SEQ ID NO:16的氨基酸505的氨基酸是R,并且衣壳蛋白中对应于SEQID NO:16的氨基酸706的氨基酸是C。
37.如条款35所述的核酸载体或包装系统,其中所述AAV衣壳蛋白包含SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸1-736的氨基酸序列。
38.如任一前述条款所述的核酸载体或包装系统,其中所述第三核苷酸序列还包含与所述AAV衣壳蛋白编码序列可操作地连接的转录调控元件。
39.如条款38所述的核酸载体或包装系统,其中所述转录调控元件包含选自组成型启动子、诱导型启动子或天然启动子的启动子。
40.如条款39所述的核酸载体或包装系统,其中所述启动子选自P40启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。
41.如任一前述条款所述的核酸载体或包装系统,其中所述第一核酸载体包含与SEQ ID NO:73或77所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。
42.如任一前述条款所述的核酸载体或包装系统,其中所述第二核苷酸序列包含与SEQ ID NO:71、75、78、80、82、84、85、86、87或88所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。
43.如任一前述条款所述的核酸载体或包装系统,其中:所述第一核苷酸序列包含与SEQ ID NO:50、51、52、53、54、55、56、57、58或59所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;所述第二核苷酸序列包含与SEQ ID NO:71、75、78、80、82、84、85、86、87或88所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列;并且所述第三核苷酸序列编码与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、15、16或17的氨基酸203-736、138736和/或1-736的氨基酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
44.如条款43所述的核酸载体或包装系统,其中所述第一核酸载体从5'至3'包含:第一核苷酸序列;第二核苷酸序列;和第三核苷酸序列。
45.如条款5-44中任一项所述的包装系统,其中所述辅助病毒基因源自选自腺病毒、疱疹病毒、痘病毒、巨细胞病毒和杆状病毒的辅助病毒。
46.如条款5-45中任一项所述的包装系统,其中所述辅助病毒基因是源自选自E1、E2、E4和VA的腺病毒的RNA基因。
47.如条款5-46中任一项所述的包装系统,其中所述第二核酸载体还包含与所述辅助病毒基因可操作地连接的转录调控元件。
48.如条款47所述的包装系统,其中所述转录调控元件包含选自组成型启动子、诱导型启动子或天然启动子的启动子。
49.如条款48所述的包装系统,其中所述启动子选自RSV LTR启动子、CMV立即早期启动子、SV40启动子、二氢叶酸还原酶启动子、细胞质β-肌动蛋白启动子、磷酸甘油酸激酶(PGK)启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。
50.如条款5-49中任一项所述的包装系统,其中所述第二核酸载体包含与SEQ IDNO:60、61或62所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。
51.如条款5-50中任一项所述的包装系统,其中所述第二核酸载体包含与SEQ IDNO:63所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。
52.如条款5-45中任一项所述的包装系统,其中所述辅助病毒基因是源自选自UL5/8/52、ICP0、ICP4、ICP22和UL30/UL42的疱疹病毒的基因。
53.如条款52所述的包装系统,其中所述第二核酸载体还包含与所述辅助病毒基因可操作地连接的转录调控元件。
54.如条款53所述的包装系统,其中所述转录调控元件包含选自组成型启动子、诱导型启动子或天然启动子的启动子。
55.如条款54所述的包装系统,其中所述启动子选自RSV LTR启动子、CMV立即早期启动子、SV40启动子、二氢叶酸还原酶启动子、细胞质β-肌动蛋白启动子、磷酸甘油酸激酶(PGK)启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。
56.一种宿主细胞,其包含如条款1-4或9-44中任一项所述的核酸载体,或如条款5-55中任一项所述的包装系统。
57.如条款56所述的宿主细胞,其中所述宿主细胞是哺乳动物细胞。
58.如条款57所述的宿主细胞,其中所述哺乳动物细胞选自COS细胞、CHO细胞、BHK细胞、MDCK细胞、HEK293细胞、HEK293T细胞、HEK293F细胞、NS0细胞、PER.C6细胞、VERO细胞、CRL7O3O细胞、HsS78Bst细胞、HeLa细胞、NIH 3T3细胞、HepG2细胞、SP210细胞、R1.1细胞、B-W细胞、L-M细胞、BSC1细胞、BSC40细胞、YB/20细胞和BMT10细胞。
59.如条款57或58所述的宿主细胞,其中所述哺乳动物细胞是HEK293细胞。
60.一种rAAV的重组制备方法,所述方法包括在产生所述rAAV的条件下将条款5-55中任一项所述的包装系统引入哺乳动物细胞中。
61.如条款60所述的方法,其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率选自1:0.2、1:0.4、1:0.6、1:0.8、1:1、1:2、1:3或1:4。
62.如条款60或61所述的方法,其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率为1:2。
63.如条款60或61所述的方法,其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率为1:0.2至1:1。
64.如条款63所述的方法,其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率为1:0.6。
65.如条款63所述的方法,其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率为1:0.8。
66.如条款63所述的方法,其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率为1:1。
67.如条款60-66中任一项所述的方法,其中所述方法包括引入所述包装系统的0.1至4μg DNA/1E6个细胞。
68.如条款60-67中任一项所述的方法,其中所述方法包括引入所述包装系统的0.5至1μg DNA/1E6个细胞。
69.如条款60-68中任一项所述的方法,其中所述方法包括引入所述包装系统的0.6、0.7、0.8、0.9或1μg DNA/1E6个细胞。
70.如条款60-68中任一项所述的方法,其中所述方法包括引入所述包装系统的0.75μg DNA/1E6个细胞。
71.如条款60-70中任一项所述的方法,其中所述方法与包括使用以下哺乳动物细胞产生rAAV的方法相比导致增加的rAAV滴度,所述哺乳动物细胞包含:(i)包含编码AAVRep蛋白和AAV衣壳蛋白的核苷酸序列的第一载体;(ii)包含所述rAAV基因组的第二载体;以及(iii)包含所述一种或多种辅助病毒基因的第三载体。
72.如条款60-70中任一项所述的方法,其中所述方法与包括使用以下哺乳动物细胞产生rAAV的方法相比导致增加的完整载体基因组的百分比,所述哺乳动物细胞包含:(i)包含编码AAV Rep蛋白和AAV衣壳蛋白的核苷酸序列的第一载体;(ii)包含所述rAAV基因组的第二载体;以及(iii)包含所述一种或多种辅助病毒基因的第三载体。
73.如条款60-72中任一项所述的方法,其中所述哺乳动物细胞选自COS细胞、CHO细胞、BHK细胞、MDCK细胞、HEK293细胞、HEK293T细胞、HEK293F细胞、NS0细胞、PER.C6细胞、VERO细胞、CRL7O3O细胞、HsS78Bst细胞、HeLa细胞、NIH 3T3细胞、HepG2细胞、SP210细胞、R1.1细胞、B-W细胞、L-M细胞、BSC1细胞、BSC40细胞、YB/20细胞和BMT10细胞。
74.如条款60-73中任一项所述的方法,其中所述哺乳动物细胞为HEK293细胞。
75.如条款60-74中任一项所述的方法,其中所述哺乳动物细胞在细胞培养物中孵育。
76.一种如条款56-59中任一项所定义的宿主细胞的群体,其中所述宿主细胞在细胞培养物中提供。
77.如条款75所述的方法或如条款76所述的宿主细胞的群体,其中所述细胞培养物的体积为至少2升、至少50升或至少2000升。
***
本发明在范围上不限于本文所述的具体实施方案。实际上,除了本文中所描述的那些内容之外,本领域的技术人员根据前述说明和附图将显而易知本发明的各种修改。此类修改旨在落入所附权利要求书的范围内。
本文引用的所有参考文献(例如,出版物或专利或专利申请)通过引用整体并入本文并且用于所有目的,其程度如同具体和单独指示每个单独的参考文献(例如,出版物或专利或专利申请)通过引用整体并入用于所有目的。其他实施方案在以下权利要求内。
序列表
<110> 牛津生物医学解决方案有限公司(OXFORD BIOMEDICA SOLUTIONS LLC)
同源药物公司(HOMOLOGY MEDICINES, INC.)
<120> 腺相关病毒包装系统
<130> G211157PM
<160> 106
<170> PatentIn version 3.5
<210> 1
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 腺相关病毒9
<400> 1
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 2
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV分离物
<400> 2
Met Thr Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Gln Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 3
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV分离物
<400> 3
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Gly Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Gly Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 4
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV分离物
<400> 4
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Ile Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Tyr Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 5
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV分离物
<400> 5
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Asp
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 6
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV分离物
<400> 6
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Leu Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Ser Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 7
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV分离物
<400> 7
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Arg Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 8
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV分离物
<400> 8
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Val Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 9
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV分离物
<400> 9
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Arg Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 10
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV分离物
<400> 10
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Cys Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 11
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV分离物
<400> 11
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Arg Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Lys Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 12
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV分离物
<400> 12
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro His Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Asn
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Met Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 13
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV分离物
<400> 13
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 14
<211> 0
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV分离物
<400> 14
000
<210> 15
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV分离物
<400> 15
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Arg Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 16
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV分离物
<400> 16
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Ala Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 17
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV分离物
<400> 17
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Ile Ala Trp Pro Arg Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Cys Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 18
<211> 365
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 18
ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 60
gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 120
tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 180
aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 240
caagtccgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 300
acatgacctt acgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 360
ccatg 365
<210> 19
<211> 380
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 19
ggcattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt ccgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttacggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg 380
<210> 20
<211> 479
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 20
tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60
ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120
ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180
cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240
ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg agtcgctgcg cgctgccttc 300
gccccgtgcc ccgctccgcc gccgcctcgc gccgcccgcc ccggctctga ctgaccgcgt 360
tactcccaca ggtgagcggg cgggacggcc cttctcctcc gggctgtaat tagcgcttgg 420
tttaatgacg gcttgtttct tttctgtggc tgcgtgaaag ccttgagggg ctccgggag 479
<210> 21
<211> 1246
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 21
tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60
ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120
ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180
cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240
ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg agtcgctgcg cgctgccttc 300
gccccgtgcc ccgctccgcc gccgcctcgc gccgcccgcc ccggctctga ctgaccgcgt 360
tactcccaca ggtgagcggg cgggacggcc cttctcctcc gggctgtaat tagcgcttgg 420
tttaatgacg gcttgtttct tttctgtggc tgcgtgaaag ccttgagggg ctccgggagg 480
gccctttgtg cggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg 540
ccgcgtgcgg ctccgcgctg cccggcggct gtgagcgctg cgggcgcggc gcggggcttt 600
gtgcgctccg cagtgtgcgc gaggggagcg cggccggggg cggtgccccg cggtgcgggg 660
ggggctgcga ggggaacaaa ggctgcgtgc ggggtgtgtg cgtggggggg tgagcagggg 720
gtgtgggcgc gtcggtcggg ctgcaacccc ccctgcaccc ccctccccga gttgctgagc 780
acggcccggc ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc gccgtgccgg 840
gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccggggagg 900
gctcggggga ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc 960
gcagccattg ccttttatgg taatcgtgcg agagggcgca gggacttcct ttgtcccaaa 1020
tctgtgcgga gccgaaatct gggaggcgcc gccgcacccc ctctagcggg cgcggggcga 1080
agcggtgcgg cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc 1140
gccgtcccct tctccctctc cagcctcggg gctgtccgcg gggggacggc tgccttcggg 1200
ggggacgggg cagggcgggg ttcggcttct ggcgtgtgac cggcgg 1246
<210> 22
<211> 953
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 22
aattcggtac cctagttatt aatagtaatc aattacgggg tcattagttc atagcccata 60
tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga 120
cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt 180
ccattgacgt caatgggtgg actatttacg gtaaactgcc cacttggcag tacatcaagt 240
gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca 300
ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt 360
catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc 420
cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg 480
ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg 540
ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt 600
tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt 660
cgctgcgacg ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc 720
ggctctgact gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctcctccgg 780
gctgtaatta gcgcttggtt taatgacggc ttgtttcttt tctgtggctg cgtgaaagcc 840
ttgaggggct ccgggagcta gagcctctgc taaccatgtt catgccttct tctttttcct 900
acagctcctg ggcaacgtgc tggttattgt gctgtctcat cattttggca aag 953
<210> 23
<211> 1168
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 23
cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60
tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120
aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180
gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240
gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300
gaattacttc cacctggctc cagtacgtga ttcttgatcc cgagctggag ccaggggcgg 360
gccttgcgct ttaggagccc cttcgcctcg tgcttgagtt gaggcctggc ctgggcgctg 420
gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt ctcgctgctt tcgataagtc 480
tctagccatt taaaattttt gatgacctgc tgcgacgctt tttttctggc aagatagtct 540
tgtaaatgcg ggccaggatc tgcacactgg tatttcggtt tttggggccg cgggcggcga 600
cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg ggcctgcgag cgcggccacc 660
gagaatcgga cgggggtagt ctcaagctgg ccggcctgct ctggtgcctg gcctcgcgcc 720
gccgtgtatc gccccgccct gggcggcaag gctggcccgg tcggcaccag ttgcgtgagc 780
ggaaagatgg ccgcttcccg gccctgctcc agggggctca aaatggagga cgcggcgctc 840
gggagagcgg gcgggtgagt cacccacaca aaggaaaggg gcctttccgt cctcagccgt 900
cgcttcatgt gactccacgg agtaccgggc gccgtccagg cacctcgatt agttctggag 960
cttttggagt acgtcgtctt taggttgggg ggaggggttt tatgcgatgg agtttcccca 1020
cactgagtgg gtggagactg aagttaggcc agcttggcac ttgatgtaat tctccttgga 1080
atttgccctt tttgagtttg gatcttggtt cattctcaag cctcagacag tggttcaaag 1140
tttttttctt ccatttcagg tgtcgtga 1168
<210> 24
<211> 92
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 24
aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 60
cacctgcctg aaatcacttt ttttcaggtt gg 92
<210> 25
<211> 79
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 25
aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 60
cacctgcctg aaatcactt 79
<210> 26
<211> 95
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 26
cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 60
ttattgtgct gtctcatcat tttggcaaag aattc 95
<210> 27
<211> 90
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 27
cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 60
ttattgtgct gtctcatcat tttggcaaag 90
<210> 28
<211> 918
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 28
ggcatcctaa aaaatattca gtggaaacgt aaaaacatta aagactgatt aaacatcgca 60
gcatgacaca gatttagcaa ctgagcataa ataatttgac tcggatactg ctccaaaatc 120
cgaagaggac caatttcttc caggaggaca actacctcgt cctctgcaga cccctctcct 180
cggcagctga aggagtgtgg ccaatctgcc tccacctccc cgcggacccc ctactctcag 240
gacctcctgc agcaccccaa actggaagtg gccgctgcag acccaaggac gaggggcacg 300
cgggagccgg cagccctagt ggagcggttg gagatgttga ggtgggaggg tcacccaggt 360
ggggtgaggc tggggtaggt agcggagtga acggcttccg aagctctggg ccgcccccag 420
gttggactaa gcaggcgctc tgtcttcgcc cccgcccagg gtgggcgtct cctgaggact 480
ccccgccaca cctgacccga gaccgcgcgc ccagcctaga acgcttcccc gacccagcgt 540
agggccgccg cgactggcgg gcgagggtcg gcgggaggcc tggcgaaccc gggggcggga 600
ccaggcgggc aaggcccggc tgccgcagcg ccgctctgcg cgaggcggct ccgccgcggc 660
ggagggatac ggcgcaccat atatatatcg cggggcgcag actcgcgctc cggcagtggt 720
gctgggagtg tcgtggacgc cgtgccgtta ctcgtagtca ggcggcggcg caggcggcgg 780
cggcggcata gcgcacagcg cgccttagca gcagcagcag cagcagcggc atcggaggta 840
cccccgccgt cgcagccccc gcgctggtgc agccaccctc gctccctctg ctcttcctcc 900
cttcgctcgc accaagag 918
<210> 29
<211> 192
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 29
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gg 192
<210> 30
<211> 205
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 30
aatgactcct ttcggtaagt gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc 60
agcgtaggcg ggcgactcag atcccagcca gtggacttag cccctgtttg ctcctccgat 120
aactggggtg accttggtta atattcacca gcagcctccc ccgttgcccc tctggatcca 180
ctgcttaaat acggacgagg acagg 205
<210> 31
<211> 913
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 31
tagggaggtc ctgcacagaa ggggaggagg gggcagcagc tgtctgacca ctgttggtct 60
tgcaacttgt gtccccaggt taatttttaa aaagcagtca aaagtccaag tggcccttgg 120
cagcatttac tctctctgtt tgctctggtt aataatctca ggagcacaaa cattcctgga 180
ggcaggagaa gaaatcaaca tcctggactt atcctctggg cctctcccca cccccaggat 240
tgtaactgaa atgcttcact ggtgctcctt ttgttttaag gcattggatc ttcatagcta 300
ctgatcgtgc ccaagcacac agtatctgca gcaaccactt aggcctccag gaatgtggtg 360
accattgacc ctaattcatt ccccttcatg gatcctatgt aaccatcctc caaaaagagc 420
tttcgcaaac tcaaataaac acaggaaagg aagaccttct tatctttgag agtatatgtt 480
tagccctata gctctaaccc actctgatct cccagggcgg cagtaagtct tcagcatcag 540
gcattttggg gtgactcagt aaatggtaga tcttgctacc agtggaacag ccactaagga 600
ttctgcagtg agagcagagg gccagctaag tggtactctc ccagagactg tctgactcac 660
gccaccccct ccaccttgga cacaggacgc tgtggtttct gagccaggta caatgactcc 720
tttcggtaag tgcagtggaa gctgtacact gcccaggcaa agcgtccggg cagcgtaggc 780
gggcgactca gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt 840
gaccttggtt aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa 900
tacggacgag gac 913
<210> 32
<211> 423
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 32
gctctaaccc actctgatct cccagggcgg cagtaagtct tcagcatcag gcattttggg 60
gtgactcagt aaatggtaga tcttgctacc agtggaacag ccactaagga ttctgcagtg 120
agagcagagg gccagctaag tggtactctc ccagagactg tctgactcac gccaccccct 180
ccaccttgga cacaggacgc tgtggtttct gagccaggta caatgactcc tttcggtaag 240
tgcagtggaa gctgtacact gcccaggcaa agcgtccggg cagcgtaggc gggcgactca 300
gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt gaccttggtt 360
aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa tacggacgag 420
gac 423
<210> 33
<211> 592
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 33
gtaaatttta tggaatgtga atcataattc aatttttcaa catgcgttag gagggacatt 60
tcaaactctt ttttacccta gactttccta ccatcaccca gagtatccag ccaggagggg 120
aggggctaga gacaccagaa gtttagcagg gaggagggcg tagggattcg gggaatgaag 180
ggatgggatt cagactaggg ccaggaccca gggatggaga gaaagagatg agagtggttt 240
gggggcttgg tgacttagag aacagagctg caggctcaga ggcacacagg agtttctggg 300
ctcaccctgc ccccttccaa cccctcagtt cccatcctcc agcagctgtt tgtgtgctgc 360
ctctgaagtc cacactgaac aaacttcagc ctactcatgt ccctaaaatg ggcaaacatt 420
gcaagcagca aacagcaaac acacagccct ccctgcctgc tgaccttgga gctggggcag 480
aggtcagaga cctctctggg cccatgccac ctccaacatc cactcgaccc cttggaattt 540
cggtggagag gagcagaggt tgtcctggcg tggtttaggt agtgtgagag gg 592
<210> 34
<211> 72
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 34
gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60
ggctaagtcc ac 72
<210> 35
<211> 170
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 35
cgatgctcta atctctctag acaaggttca tatttgtatg ggttacttat tctctctttg 60
ttgactaagt caataatcag aatcagcagg tttgcagtca gattggcagg gataagcagc 120
ctagctcagg agaagtgagt ataaaagccc caggctggga gcagccatca 170
<210> 36
<211> 1873
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 36
gatcttcaat attggccatt agccatatta ttcattggtt atatagcata aatcaatatt 60
ggctattggc cattgcatac gttgtatcta tatcataata tgtacattta tattggctca 120
tgtccaatat gaccgccatg ttggcattga ttattgacta gttattaata gtaatcaatt 180
acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 240
ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 300
cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 360
actgcccact tggcagtaca tcaagtgtat catatgccaa gtccgccccc tattgacgtc 420
aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttacg ggactttcct 480
acttggcagt acatctacgt attagtcatc gctattacca tggtcgaggt gagccccacg 540
ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt 600
ttttaattat tttgtgcagc gatgggggcg gggggggggg gggggcgcgc gccaggcggg 660
gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 720
agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 780
aagcgaagcg cgcggcgggc gggagtcgct gcgacgctgc cttcgccccg tgccccgctc 840
cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 900
cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 960
ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg 1020
ggagcggctc ggggggtgcg tgcgtgtgtg tgtgcgtggg gagcgccgcg tgcggcccgc 1080
gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt 1140
gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa 1200
caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcggcggt 1260
cgggctgtaa cccccccctg cacccccctc cccgagttgc tgagcacggc ccggcttcgg 1320
gtgcggggct ccgtacgggg cgtggcgcgg ggctcgccgt gccgggcggg gggtggcggc 1380
aggtgggggt gccgggcggg gcggggccgc ctcgggccgg ggagggctcg ggggaggggc 1440
gcggcggccc ccggagcgcc ggcggctgtc gaggcgcggc gagccgcagc cattgccttt 1500
tatggtaatc gtgcgagagg gcgcagggac ttcctttgtc ccaaatctgt gcggagccga 1560
aatctgggag gcgccgccgc accccctcta gcgggcgcgg ggcgaagcgg tgcggcgccg 1620
gcaggaagga aatgggcggg gagggccttc gtgcgtcgcc gcgccgccgt ccccttctcc 1680
ctctccagcc tcggggctgt ccgcgggggg acggctgcct tcggggggga cggggcaggg 1740
cggggttcgg cttctggcgt gtgaccggcg gctctagagc ctctgctaac catgttcatg 1800
ccttcttctt tttcctacag ctcctgggca acgtgctggt tattgtgctg tctcatcatt 1860
ttggcaaaga att 1873
<210> 37
<211> 1061
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 37
tagggaggtc ctgcacgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 60
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 120
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 180
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 240
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 300
agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc 360
ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat 420
gggggcgggg gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc 480
ggggcgaggc ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct 540
tttatggcga ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg gcgggcggga 600
gtcgctgcgc gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc 660
cggctctgac tgaccgcgtt actaaaacag gtaagtccgg cctccgcgcc gggttttggc 720
gcctcccgcg ggcgcccccc tcctcacggc gagcgctgcc acgtcagacg aagggcgcag 780
cgagcgtcct gatccttccg cccggacgct caggacagcg gcccgctgct cataagactc 840
ggccttagaa ccccagtatc agcagaagga cattttagga cgggacttgg gtgactctag 900
ggcactggtt ttctttccag agagcggaac aggcgaggaa aagtagtccc ttctcggcga 960
ttctgcggag ggatctccgt ggggcggtga acgccgatga tgcctctact aaccatgttc 1020
atgttttctt tttttttcta caggtcctgg gtgacgaaca g 1061
<210> 38
<211> 398
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 38
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360
ccctctggat ccactgctta aatacggacg aggacagg 398
<210> 39
<211> 145
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 39
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcct 145
<210> 40
<211> 145
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 40
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gccaa 145
<210> 41
<211> 106
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 41
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgg 106
<210> 42
<211> 167
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 42
ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgta 167
<210> 43
<211> 167
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 43
tacaaaacct ccttgcttga gagtgtggca ctctcccccc tgtcgcgttc gctcgctcgc 60
tggctcgttt gggggggtgg cagctcaaag agctgccaga cgacggccct ctggccgtcg 120
cccccccaaa cgagccagcg agcgagcgaa cgcgacaggg gggagag 167
<210> 44
<211> 143
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 44
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gcc 143
<210> 45
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 45
ggaggggtgg agtcgtgacg tgaattacgt catagggtta gggagg 46
<210> 46
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 46
gtagataagt agcatggcgg gttaatcatt aactaca 37
<210> 47
<211> 96
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 47
tcctgtatta gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtcacgct 60
gggtatttaa gcccgagtga gcacgcaggg tctcca 96
<210> 48
<211> 135
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 48
gtcacaaaga ccagaaatgg cgccggaggc gggaacaagg tggtggatga gtgctacatc 60
cccaattact tgctccccaa aacccagcct gagctccagt gggcgtggac taatatggaa 120
cagtatttaa gcgcc 135
<210> 49
<211> 154
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 49
ggtcaccaag caggaagtca aagacttttt ccggtgggca aaggatcacg tggttgaggt 60
ggagcatgaa ttctacgtca aaaagggtgg agccaagaaa agacccgccc ccagtgacgc 120
agatataagt gagcccaaac gggtgcgcga gtca 154
<210> 50
<211> 1866
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 50
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataa 1866
<210> 51
<211> 1995
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 51
tcctgtatta gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtcacgct 60
gggtatttaa gcccgagtga gcacgcaggg tctccatttt gaagcgggag gtttgaacgc 120
gcagccgcca tgccggggtt ttacgagatt gtgattaagg tccccagcga ccttgacgag 180
catctgcccg gcatttctga cagctttgtg aactgggtgg ccgagaagga atgggagttg 240
ccgccagatt ctgacatgga tctgaatctg attgagcagg cacccctgac cgtggccgag 300
aagctgcagc gcgactttct gacggaatgg cgccgtgtga gtaaggcccc ggaggccctt 360
ttctttgtgc aatttgagaa gggagagagc tacttccaca tgcacgtgct cgtggaaacc 420
accggggtga aatccatggt tttgggacgt ttcctgagtc agattcgcga aaaactgatt 480
cagagaattt accgcgggat cgagccgact ttgccaaact ggttcgcggt cacaaagacc 540
agaaatggcg ccggaggcgg gaacaaggtg gtggatgagt gctacatccc caattacttg 600
ctccccaaaa cccagcctga gctccagtgg gcgtggacta atatggaaca gtatttaagc 660
gcctgtttga atctcacgga gcgtaaacgg ttggtggcgc agcatctgac gcacgtgtcg 720
cagacgcagg agcagaacaa agagaatcag aatcccaatt ctgatgcgcc ggtgatcaga 780
tcaaaaactt cagccaggta catggagctg gtcgggtggc tcgtggacaa ggggattacc 840
tcggagaagc agtggatcca ggaggaccag gcctcataca tctccttcaa tgcggcctcc 900
aactcgcggt cccaaatcaa ggctgccttg gacaatgcgg gaaagattat gagcctgact 960
aaaaccgccc ccgactacct ggtgggccag cagcccgtgg aggacatttc cagcaatcgg 1020
atttataaaa ttttggaact aaacgggtac gatccccaat atgcggcttc cgtctttctg 1080
ggatgggcca cgaaaaagtt cggcaagagg aacaccatct ggctgtttgg gcctgcaact 1140
accgggaaga ccaacatcgc ggaggccata gcccacactg tgcccttcta cgggtgcgta 1200
aactggacca atgagaactt tcccttcaac gactgtgtcg acaagatggt gatctggtgg 1260
gaggagggga agatgaccgc caaggtcgtg gagtcggcca aagccattct cggaggaagc 1320
aaggtgcgcg tggaccagaa atgcaagtcc tcggcccaga tagacccgac tcccgtgatc 1380
gtcacctcca acaccaacat gtgcgccgtg attgacggga actcaacgac cttcgaacac 1440
cagcagccgt tgcaagaccg gatgttcaaa tttgaactca cccgccgtct ggatcatgac 1500
tttgggaagg tcaccaagca ggaagtcaaa gactttttcc ggtgggcaaa ggatcacgtg 1560
gttgaggtgg agcatgaatt ctacgtcaaa aagggtggag ccaagaaaag acccgccccc 1620
agtgacgcag atataagtga gcccaaacgg gtgcgcgagt cagttgcgca gccatcgacg 1680
tcagacgcgg aagcttcgat caactacgca gacaggtacc aaaacaaatg ttctcgtcac 1740
gtgggcatga atctgatgct gtttccctgc agacaatgcg agagaatgaa tcagaattca 1800
aatatctgct tcactcacgg acagaaagac tgtttagagt gctttcccgt gtcagaatct 1860
caacccgttt ctgtcgtcaa aaaggcgtat cagaaactgt gctacattca tcatatcatg 1920
ggaaaggtgc cagacgcttg cactgcctgc gatctggtca atgtggattt ggatgactgc 1980
atctttgaac aataa 1995
<210> 52
<211> 1930
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 52
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
caaccttagt 1930
<210> 53
<211> 2059
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 53
tcctgtatta gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtcacgct 60
gggtatttaa gcccgagtga gcacgcaggg tctccatttt gaagcgggag gtttgaacgc 120
gcagccgcca tgccggggtt ttacgagatt gtgattaagg tccccagcga ccttgacgag 180
catctgcccg gcatttctga cagctttgtg aactgggtgg ccgagaagga atgggagttg 240
ccgccagatt ctgacatgga tctgaatctg attgagcagg cacccctgac cgtggccgag 300
aagctgcagc gcgactttct gacggaatgg cgccgtgtga gtaaggcccc ggaggccctt 360
ttctttgtgc aatttgagaa gggagagagc tacttccaca tgcacgtgct cgtggaaacc 420
accggggtga aatccatggt tttgggacgt ttcctgagtc agattcgcga aaaactgatt 480
cagagaattt accgcgggat cgagccgact ttgccaaact ggttcgcggt cacaaagacc 540
agaaatggcg ccggaggcgg gaacaaggtg gtggatgagt gctacatccc caattacttg 600
ctccccaaaa cccagcctga gctccagtgg gcgtggacta atatggaaca gtatttaagc 660
gcctgtttga atctcacgga gcgtaaacgg ttggtggcgc agcatctgac gcacgtgtcg 720
cagacgcagg agcagaacaa agagaatcag aatcccaatt ctgatgcgcc ggtgatcaga 780
tcaaaaactt cagccaggta catggagctg gtcgggtggc tcgtggacaa ggggattacc 840
tcggagaagc agtggatcca ggaggaccag gcctcataca tctccttcaa tgcggcctcc 900
aactcgcggt cccaaatcaa ggctgccttg gacaatgcgg gaaagattat gagcctgact 960
aaaaccgccc ccgactacct ggtgggccag cagcccgtgg aggacatttc cagcaatcgg 1020
atttataaaa ttttggaact aaacgggtac gatccccaat atgcggcttc cgtctttctg 1080
ggatgggcca cgaaaaagtt cggcaagagg aacaccatct ggctgtttgg gcctgcaact 1140
accgggaaga ccaacatcgc ggaggccata gcccacactg tgcccttcta cgggtgcgta 1200
aactggacca atgagaactt tcccttcaac gactgtgtcg acaagatggt gatctggtgg 1260
gaggagggga agatgaccgc caaggtcgtg gagtcggcca aagccattct cggaggaagc 1320
aaggtgcgcg tggaccagaa atgcaagtcc tcggcccaga tagacccgac tcccgtgatc 1380
gtcacctcca acaccaacat gtgcgccgtg attgacggga actcaacgac cttcgaacac 1440
cagcagccgt tgcaagaccg gatgttcaaa tttgaactca cccgccgtct ggatcatgac 1500
tttgggaagg tcaccaagca ggaagtcaaa gactttttcc ggtgggcaaa ggatcacgtg 1560
gttgaggtgg agcatgaatt ctacgtcaaa aagggtggag ccaagaaaag acccgccccc 1620
agtgacgcag atataagtga gcccaaacgg gtgcgcgagt cagttgcgca gccatcgacg 1680
tcagacgcgg aagcttcgat caactacgca gacaggtacc aaaacaaatg ttctcgtcac 1740
gtgggcatga atctgatgct gtttccctgc agacaatgcg agagaatgaa tcagaattca 1800
aatatctgct tcactcacgg acagaaagac tgtttagagt gctttcccgt gtcagaatct 1860
caacccgttt ctgtcgtcaa aaaggcgtat cagaaactgt gctacattca tcatatcatg 1920
ggaaaggtgc cagacgcttg cactgcctgc gatctggtca atgtggattt ggatgactgc 1980
atctttgaac aataaatgac ttaaaccagg tatggctgcc gatggttatc ttccagattg 2040
gctcgaggac aaccttagt 2059
<210> 54
<211> 1258
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 54
atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag 60
gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag 120
gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg 180
gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta 240
aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc 300
ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg 360
gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt 420
cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc 480
aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa 540
tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg 600
tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg 660
atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag 720
gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc 780
tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag 840
cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc 900
aactacgcag acaggtacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg 960
tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga 1020
cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa 1080
aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc 1140
actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataaatgact 1200
taaaccaggt atggctgccg atggttatct tccagattgg ctcgaggaca accttagt 1258
<210> 55
<211> 1531
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 55
gtcacaaaga ccagaaatgg cgccggaggc gggaacaagg tggtggatga gtgctacatc 60
cccaattact tgctccccaa aacccagcct gagctccagt gggcgtggac taatatggaa 120
cagtatttaa gcgcctgttt gaatctcacg gagcgtaaac ggttggtggc gcagcatctg 180
acgcacgtgt cgcagacgca ggagcagaac aaagagaatc agaatcccaa ttctgatgcg 240
ccggtgatca gatcaaaaac ttcagccagg tacatggagc tggtcgggtg gctcgtggac 300
aaggggatta cctcggagaa gcagtggatc caggaggacc aggcctcata catctccttc 360
aatgcggcct ccaactcgcg gtcccaaatc aaggctgcct tggacaatgc gggaaagatt 420
atgagcctga ctaaaaccgc ccccgactac ctggtgggcc agcagcccgt ggaggacatt 480
tccagcaatc ggatttataa aattttggaa ctaaacgggt acgatcccca atatgcggct 540
tccgtctttc tgggatgggc cacgaaaaag ttcggcaaga ggaacaccat ctggctgttt 600
gggcctgcaa ctaccgggaa gaccaacatc gcggaggcca tagcccacac tgtgcccttc 660
tacgggtgcg taaactggac caatgagaac tttcccttca acgactgtgt cgacaagatg 720
gtgatctggt gggaggaggg gaagatgacc gccaaggtcg tggagtcggc caaagccatt 780
ctcggaggaa gcaaggtgcg cgtggaccag aaatgcaagt cctcggccca gatagacccg 840
actcccgtga tcgtcacctc caacaccaac atgtgcgccg tgattgacgg gaactcaacg 900
accttcgaac accagcagcc gttgcaagac cggatgttca aatttgaact cacccgccgt 960
ctggatcatg actttgggaa ggtcaccaag caggaagtca aagacttttt ccggtgggca 1020
aaggatcacg tggttgaggt ggagcatgaa ttctacgtca aaaagggtgg agccaagaaa 1080
agacccgccc ccagtgacgc agatataagt gagcccaaac gggtgcgcga gtcagttgcg 1140
cagccatcga cgtcagacgc ggaagcttcg atcaactacg cagacaggta ccaaaacaaa 1200
tgttctcgtc acgtgggcat gaatctgatg ctgtttccct gcagacaatg cgagagaatg 1260
aatcagaatt caaatatctg cttcactcac ggacagaaag actgtttaga gtgctttccc 1320
gtgtcagaat ctcaacccgt ttctgtcgtc aaaaaggcgt atcagaaact gtgctacatt 1380
catcatatca tgggaaaggt gccagacgct tgcactgcct gcgatctggt caatgtggat 1440
ttggatgact gcatctttga acaataaatg acttaaacca ggtatggctg ccgatggtta 1500
tcttccagat tggctcgagg acaaccttag t 1531
<210> 56
<211> 1194
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 56
atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag 60
gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag 120
gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg 180
gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta 240
aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc 300
ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg 360
gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt 420
cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc 480
aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa 540
tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg 600
tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg 660
atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag 720
gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc 780
tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag 840
cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc 900
aactacgcag acaggtacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg 960
tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga 1020
cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa 1080
aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc 1140
actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataa 1194
<210> 57
<211> 1467
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 57
gtcacaaaga ccagaaatgg cgccggaggc gggaacaagg tggtggatga gtgctacatc 60
cccaattact tgctccccaa aacccagcct gagctccagt gggcgtggac taatatggaa 120
cagtatttaa gcgcctgttt gaatctcacg gagcgtaaac ggttggtggc gcagcatctg 180
acgcacgtgt cgcagacgca ggagcagaac aaagagaatc agaatcccaa ttctgatgcg 240
ccggtgatca gatcaaaaac ttcagccagg tacatggagc tggtcgggtg gctcgtggac 300
aaggggatta cctcggagaa gcagtggatc caggaggacc aggcctcata catctccttc 360
aatgcggcct ccaactcgcg gtcccaaatc aaggctgcct tggacaatgc gggaaagatt 420
atgagcctga ctaaaaccgc ccccgactac ctggtgggcc agcagcccgt ggaggacatt 480
tccagcaatc ggatttataa aattttggaa ctaaacgggt acgatcccca atatgcggct 540
tccgtctttc tgggatgggc cacgaaaaag ttcggcaaga ggaacaccat ctggctgttt 600
gggcctgcaa ctaccgggaa gaccaacatc gcggaggcca tagcccacac tgtgcccttc 660
tacgggtgcg taaactggac caatgagaac tttcccttca acgactgtgt cgacaagatg 720
gtgatctggt gggaggaggg gaagatgacc gccaaggtcg tggagtcggc caaagccatt 780
ctcggaggaa gcaaggtgcg cgtggaccag aaatgcaagt cctcggccca gatagacccg 840
actcccgtga tcgtcacctc caacaccaac atgtgcgccg tgattgacgg gaactcaacg 900
accttcgaac accagcagcc gttgcaagac cggatgttca aatttgaact cacccgccgt 960
ctggatcatg actttgggaa ggtcaccaag caggaagtca aagacttttt ccggtgggca 1020
aaggatcacg tggttgaggt ggagcatgaa ttctacgtca aaaagggtgg agccaagaaa 1080
agacccgccc ccagtgacgc agatataagt gagcccaaac gggtgcgcga gtcagttgcg 1140
cagccatcga cgtcagacgc ggaagcttcg atcaactacg cagacaggta ccaaaacaaa 1200
tgttctcgtc acgtgggcat gaatctgatg ctgtttccct gcagacaatg cgagagaatg 1260
aatcagaatt caaatatctg cttcactcac ggacagaaag actgtttaga gtgctttccc 1320
gtgtcagaat ctcaacccgt ttctgtcgtc aaaaaggcgt atcagaaact gtgctacatt 1380
catcatatca tgggaaaggt gccagacgct tgcactgcct gcgatctggt caatgtggat 1440
ttggatgact gcatctttga acaataa 1467
<210> 58
<211> 1930
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 58
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
caaccttagt 1930
<210> 59
<211> 2059
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 59
tcctgtatta gaggtcacgt gagtgttttg cgacattttg cgacaccatg tggtcacgct 60
gggtatttaa gcccgagtga gcacgcaggg tctccatttt gaagcgggag gtttgaacgc 120
gcagccgcca tgccggggtt ttacgagatt gtgattaagg tccccagcga ccttgacgag 180
catctgcccg gcatttctga cagctttgtg aactgggtgg ccgagaagga atgggagttg 240
ccgccagatt ctgacatgga tctgaatctg attgagcagg cacccctgac cgtggccgag 300
aagctgcagc gcgactttct gacggaatgg cgccgtgtga gtaaggcccc ggaggccctt 360
ttctttgtgc aatttgagaa gggagagagc tacttccaca tgcacgtgct cgtggaaacc 420
accggggtga aatccatggt tttgggacgt ttcctgagtc agattcgcga aaaactgatt 480
cagagaattt accgcgggat cgagccgact ttgccaaact ggttcgcggt cacaaagacc 540
agaaatggcg ccggaggcgg gaacaaggtg gtggatgagt gctacatccc caattacttg 600
ctccccaaaa cccagcctga gctccagtgg gcgtggacta atatggaaca gtatttaagc 660
gcctgtttga atctcacgga gcgtaaacgg ttggtggcgc agcatctgac gcacgtgtcg 720
cagacgcagg agcagaacaa agagaatcag aatcccaatt ctgatgcgcc ggtgatcaga 780
tcaaaaactt cagccaggta catggagctg gtcgggtggc tcgtggacaa ggggattacc 840
tcggagaagc agtggatcca ggaggaccag gcctcataca tctccttcaa tgcggcctcc 900
aactcgcggt cccaaatcaa ggctgccttg gacaatgcgg gaaagattat gagcctgact 960
aaaaccgccc ccgactacct ggtgggccag cagcccgtgg aggacatttc cagcaatcgg 1020
atttataaaa ttttggaact aaacgggtac gatccccaat atgcggcttc cgtctttctg 1080
ggatgggcca cgaaaaagtt cggcaagagg aacaccatct ggctgtttgg gcctgcaact 1140
accgggaaga ccaacatcgc ggaggccata gcccacactg tgcccttcta cgggtgcgta 1200
aactggacca atgagaactt tcccttcaac gactgtgtcg acaagatggt gatctggtgg 1260
gaggagggga agatgaccgc caaggtcgtg gagtcggcca aagccattct cggaggaagc 1320
aaggtgcgcg tggaccagaa atgcaagtcc tcggcccaga tagacccgac tcccgtgatc 1380
gtcacctcca acaccaacat gtgcgccgtg attgacggga actcaacgac cttcgaacac 1440
cagcagccgt tgcaagaccg gatgttcaaa tttgaactca cccgccgtct ggatcatgac 1500
tttgggaagg tcaccaagca ggaagtcaaa gactttttcc ggtgggcaaa ggatcacgtg 1560
gttgaggtgg agcatgaatt ctacgtcaaa aagggtggag ccaagaaaag acccgccccc 1620
agtgacgcag atataagtga gcccaaacgg gtgcgcgagt cagttgcgca gccatcgacg 1680
tcagacgcgg aagcttcgat caactacgca gacaggtacc aaaacaaatg ttctcgtcac 1740
gtgggcatga atctgatgct gtttccctgc agacaatgcg agagaatgaa tcagaattca 1800
aatatctgct tcactcacgg acagaaagac tgtttagagt gctttcccgt gtcagaatct 1860
caacccgttt ctgtcgtcaa aaaggcgtat cagaaactgt gctacattca tcatatcatg 1920
ggaaaggtgc cagacgcttg cactgcctgc gatctggtca atgtggattt ggatgactgc 1980
atctttgaac aataaatgac ttaaaccagg tatggctgcc gatggttatc ttccagattg 2040
gctcgaggac aaccttagt 2059
<210> 60
<211> 5336
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 60
ggtacccaac tccatgctta acagtcccca ggtacagccc accctgcgtc gcaaccagga 60
acagctctac agcttcctgg agcgccactc gccctacttc cgcagccaca gtgcgcagat 120
taggagcgcc acttcttttt gtcacttgaa aaacatgtaa aaataatgta ctaggagaca 180
ctttcaataa aggcaaatgt ttttatttgt acactctcgg gtgattattt accccccacc 240
cttgccgtct gcgccgttta aaaatcaaag gggttctgcc gcgcatcgct atgcgccact 300
ggcagggaca cgttgcgata ctggtgttta gtgctccact taaactcagg cacaaccatc 360
cgcggcagct cggtgaagtt ttcactccac aggctgcgca ccatcaccaa cgcgtttagc 420
aggtcgggcg ccgatatctt gaagtcgcag ttggggcctc cgccctgcgc gcgcgagttg 480
cgatacacag ggttgcagca ctggaacact atcagcgccg ggtggtgcac gctggccagc 540
acgctcttgt cggagatcag atccgcgtcc aggtcctccg cgttgctcag ggcgaacgga 600
gtcaactttg gtagctgcct tcccaaaaag ggtgcatgcc caggctttga gttgcactcg 660
caccgtagtg gcatcagaag gtgaccgtgc ccggtctggg cgttaggata cagcgcctgc 720
atgaaagcct tgatctgctt aaaagccacc tgagcctttg cgccttcaga gaagaacatg 780
ccgcaagact tgccggaaaa ctgattggcc ggacaggccg cgtcatgcac gcagcacctt 840
gcgtcggtgt tggagatctg caccacattt cggccccacc ggttcttcac gatcttggcc 900
ttgctagact gctccttcag cgcgcgctgc ccgttttcgc tcgtcacatc catttcaatc 960
acgtgctcct tatttatcat aatgctcccg tgtagacact taagctcgcc ttcgatctca 1020
gcgcagcggt gcagccacaa cgcgcagccc gtgggctcgt ggtgcttgta ggttacctct 1080
gcaaacgact gcaggtacgc ctgcaggaat cgccccatca tcgtcacaaa ggtcttgttg 1140
ctggtgaagg tcagctgcaa cccgcggtgc tcctcgttta gccaggtctt gcatacggcc 1200
gccagagctt ccacttggtc aggcagtagc ttgaagtttg cctttagatc gttatccacg 1260
tggtacttgt ccatcaacgc gcgcgcagcc tccatgccct tctcccacgc agacacgatc 1320
ggcaggctca gcgggtttat caccgtgctt tcactttccg cttcactgga ctcttccttt 1380
tcctcttgcg tccgcatacc ccgcgccact gggtcgtctt cattcagccg ccgcaccgtg 1440
cgcttacctc ccttgccgtg cttgattagc accggtgggt tgctgaaacc caccatttgt 1500
agcgccacat cttctctttc ttcctcgctg tccacgatca cctctgggga tggcgggcgc 1560
tcgggcttgg gagaggggcg cttctttttc tttttggacg caatggccaa atccgccgtc 1620
gaggtcgatg gccgcgggct gggtgtgcgc ggcaccagcg catcttgtga cgagtcttct 1680
tcgtcctcgg actcgagacg ccgcctcagc cgcttttttg ggggcgcgcg gggaggcggc 1740
ggcgacggcg acggggacga cacgtcctcc atggttggtg gacgtcgcgc cgcaccgcgt 1800
ccgcgctcgg gggtggtttc gcgctgctcc tcttcccgac tggccatttc cttctcctat 1860
aggcagaaaa agatcatgga gtcagtcgag aaggaggaca gcctaaccgc cccctttgag 1920
ttcgccacca ccgcctccac cgatgccgcc aacgcgccta ccaccttccc cgtcgaggca 1980
cccccgcttg aggaggagga agtgattatc gagcaggacc caggttttgt aagcgaagac 2040
gacgaggatc gctcagtacc aacagaggat aaaaagcaag accaggacga cgcagaggca 2100
aacgaggaac aagtcgggcg gggggaccaa aggcatggcg actacctaga tgtgggagac 2160
gacgtgctgt tgaagcatct gcagcgccag tgcgccatta tctgcgacgc gttgcaagag 2220
cgcagcgatg tgcccctcgc catagcggat gtcagccttg cctacgaacg ccacctgttc 2280
tcaccgcgcg taccccccaa acgccaagaa aacggcacat gcgagcccaa cccgcgcctc 2340
aacttctacc ccgtatttgc cgtgccagag gtgcttgcca cctatcacat ctttttccaa 2400
aactgcaaga tacccctatc ctgccgtgcc aaccgcagcc gagcggacaa gcagctggcc 2460
ttgcggcagg gcgctgtcat acctgatatc gcctcgctcg acgaagtgcc aaaaatcttt 2520
gagggtcttg gacgcgacga gaaacgcgcg gcaaacgctc tgcaacaaga aaacagcgaa 2580
aatgaaagtc actgtggagt gctggtggaa cttgagggtg acaacgcgcg cctagccgtg 2640
ctgaaacgca gcatcgaggt cacccacttt gcctacccgg cacttaacct accccccaag 2700
gttatgagca cagtcatgag cgagctgatc gtgcgccgtg cacgacccct ggagagggat 2760
gcaaacttgc aagaacaaac cgaggagggc ctacccgcag ttggcgatga gcagctggcg 2820
cgctggcttg agacgcgcga gcctgccgac ttggaggagc gacgcaagct aatgatggcc 2880
gcagtgcttg ttaccgtgga gcttgagtgc atgcagcggt tctttgctga cccggagatg 2940
cagcgcaagc tagaggaaac gttgcactac acctttcgcc agggctacgt gcgccaggcc 3000
tgcaaaattt ccaacgtgga gctctgcaac ctggtctcct accttggaat tttgcacgaa 3060
aaccgcctcg ggcaaaacgt gcttcattcc acgctcaagg gcgaggcgcg ccgcgactac 3120
gtccgcgact gcgtttactt atttctgtgc tacacctggc aaacggccat gggcgtgtgg 3180
cagcaatgcc tggaggagcg caacctaaag gagctgcaga agctgctaaa gcaaaacttg 3240
aaggacctat ggacggcctt caacgagcgc tccgtggccg cgcacctggc ggacattatc 3300
ttccccgaac gcctgcttaa aaccctgcaa cagggtctgc cagacttcac cagtcaaagc 3360
atgttgcaaa actttaggaa ctttatccta gagcgttcag gaattctgcc cgccacctgc 3420
tgtgcgcttc ctagcgactt tgtgcccatt aagtaccgtg aatgccctcc gccgctttgg 3480
ggtcactgct accttctgca gctagccaac taccttgcct accactccga catcatggaa 3540
gacgtgagcg gtgacggcct actggagtgt cactgtcgct gcaacctatg caccccgcac 3600
cgctccctgg tctgcaattc gcaactgctt agcgaaagtc aaattatcgg tacctttgag 3660
ctgcagggtc cctcgcctga cgaaaagtcc gcggctccgg ggttgaaact cactccgggg 3720
ctgtggacgt cggcttacct tcgcaaattt gtacctgagg actaccacgc ccacgagatt 3780
aggttctacg aagaccaatc ccgcccgcca aatgcggagc ttaccgcctg cgtcattacc 3840
cagggccaca tccttggcca attgcaagcc atcaacaaag cccgccaaga gtttctgcta 3900
cgaaagggac ggggggttta cctggacccc cagtccggcg aggagctcaa cccaatcccc 3960
ccgccgccgc agccctatca gcagccgcgg gcccttgctt cccaggatgg cacccaaaaa 4020
gaagctgcag ctgccgccgc cgccacccac ggacgaggag gaatactggg acagtcaggc 4080
agaggaggtt ttggacgagg aggaggagat gatggaagac tgggacagcc tagacgaagc 4140
ttccgaggcc gaagaggtgt cagacgaaac accgtcaccc tcggtcgcat tcccctcgcc 4200
ggcgccccag aaattggcaa ccgttcccag catcgctaca acctccgctc ctcaggcgcc 4260
gccggcactg cctgttcgcc gacccaaccg tagatgggac accactggaa ccagggccgg 4320
taagtctaag cagccgccgc cgttagccca agagcaacaa cagcgccaag gctaccgctc 4380
gtggcgcggg cacaagaacg ccatagttgc ttgcttgcaa gactgtgggg gcaacatctc 4440
cttcgcccgc cgctttcttc tctaccatca cggcgtggcc ttcccccgta acatcctgca 4500
ttactaccgt catctctaca gcccctactg caccggcggc agcggcagcg gcagcaacag 4560
cagcggtcac acagaagcaa aggcgaccgg atagcaagac tctgacaaag cccaagaaat 4620
ccacagcggc ggcagcagca ggaggaggag cgctgcgtct ggcgcccaac gaacccgtat 4680
cgacccgcga gcttagaaat aggatttttc ccactctgta tgctatattt caacaaagca 4740
ggggccaaga acaagagctg aaaataaaaa acaggtctct gcgctccctc acccgcagct 4800
gcctgtatca caaaagcgaa gatcagcttc ggcgcacgct ggaagacgcg gaggctctct 4860
tcagcaaata ctgcgcgctg actcttaagg actagtttcg cgccctttct caaatttaag 4920
cgcgaaaact acgtcatctc cagcggccac acccggcgcc agcacctgtc gtcagcgcca 4980
ttatgagcaa ggaaattccc acgccctaca tgtggagtta ccagccacaa atgggacttg 5040
cggctggagc tgcccaagac tactcaaccc gaataaacta catgagcgcg ggaccccaca 5100
tgatatcccg ggtcaacgga atccgcgccc accgaaaccg aattctcctc gaacaggcgg 5160
ctattaccac cacacctcgt aataacctta atccccgtag ttggcccgct gccctggtgt 5220
accaggaaag tcccgctccc accactgtgg tacttcccag agacgcccag gccgaagttc 5280
agatgactaa ctcaggggcg cagcttgcgg gcggctttcg tcacagggtg cggtcg 5336
<210> 61
<211> 3201
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 61
cccgggcgtt ttagggcgga gtaacttgca tgtattggga attgtagttt ttttaaaatg 60
ggaagtgacg tatcgtggga aaacggaagt gaagatttga ggaagttgtg ggttttttgg 120
ctttcgtttc tgggcgtagg ttcgcgtgcg gttttctggg tgttttttgt ggactttaac 180
cgttacgtca ttttttagtc ctatatatac tcgctctgta cttggccctt tttacactgt 240
gactgattga gctggtgccg tgtcgagtgg tgttttttaa taggtttttt tactggtaag 300
gctgactgtt atggctgccg ctgtggaagc gctgtatgtt gttctggagc gggagggtgc 360
tattttgcct aggcaggagg gtttttcagg tgtttatgtg tttttctctc ctattaattt 420
tgttatacct cctatggggg ctgtaatgtt gtctctacgc ctgcgggtat gtattccccc 480
gggctatttc ggtcgctttt tagcactgac cgatgttaac caacctgatg tgtttaccga 540
gtcttacatt atgactccgg acatgaccga ggaactgtcg gtggtgcttt ttaatcacgg 600
tgaccagttt ttttacggtc acgccggcat ggccgtagtc cgtcttatgc ttataagggt 660
tgtttttcct gttgtaagac aggcttctaa tgtttaaatg tttttttttt tgttatttta 720
ttttgtgttt aatgcaggaa cccgcagaca tgtttgagag aaaaatggtg tctttttctg 780
tggtggttcc ggaacttacc tgcctttatc tgcatgagca tgactacgat gtgcttgctt 840
ttttgcgcga ggctttgcct gattttttga gcagcacctt gcattttata tcgccgccca 900
tgcaacaagc ttacataggg gctacgctgg ttagcatagc tccgagtatg cgtgtcataa 960
tcagtgtggg ttcttttgtc atggttcctg gcggggaagt ggccgcgctg gtccgtgcag 1020
acctgcacga ttatgttcag ctggccctgc gaagggacct acgggatcgc ggtatttttg 1080
ttaatgttcc gcttttgaat cttatacagg tctgtgagga acctgaattt ttgcaatcat 1140
gattcgctgc ttgaggctga aggtggaggg cgctctggag cagattttta caatggccgg 1200
acttaatatt cgggatttgc ttagagacat attgataagg tggcgagatg aaaattattt 1260
gggcatggtt gaaggtgctg gaatgtttat agaggagatt caccctgaag ggtttagcct 1320
ttacgtccac ttggacgtga gggcagtttg ccttttggaa gccattgtgc aacatcttac 1380
aaatgccatt atctgttctt tggctgtaga gtttgaccac gccaccggag gggagcgcgt 1440
tcacttaata gatcttcatt ttgaggtttt ggataatctt ttggaataaa aaaaaaaaaa 1500
catggttctt ccagctcttc ccgctcctcc cgtgtgtgac tcgcagaacg aatgtgtagg 1560
ttggctgggt gtggcttatt ctgcggtggt ggatgttatc agggcagcgg cgcatgaagg 1620
agtttacata gaacccgaag ccagggggcg cctggatgct ttgagagagt ggatatacta 1680
caactactac acagagcgag ctaagcgacg agaccggaga cgcagatctg tttgtcacgc 1740
ccgcacctgg ttttgcttca ggaaatatga ctacgtccgg cgttccattt ggcatgacac 1800
tacgaccaac acgatctcgg ttgtctcggc gcactccgta cagtagggat cgcctacctc 1860
cttttgagac agagacccgc gctaccatac tggaggatca tccgctgctg cccgaatgta 1920
acactttgac aatgcacaac gtgagttacg tgcgaggtct tccctgcagt gtgggattta 1980
cgctgattca ggaatgggtt gttccctggg atatggttct gacgcgggag gagcttgtaa 2040
tcctgaggaa gtgtatgcac gtgtgcctgt gttgtgccaa cattgatatc atgacgagca 2100
tgatgatcca tggttacgag tcctgggctc tccactgtca ttgttccagt cccggttccc 2160
tgcagtgcat agccggcggg caggttttgg ccagctggtt taggatggtg gtggatggcg 2220
ccatgtttaa tcagaggttt atatggtacc gggaggtggt gaattacaac atgccaaaag 2280
aggtaatgtt tatgtccagc gtgtttatga ggggtcgcca cttaatctac ctgcgcttgt 2340
ggtatgatgg ccacgtgggt tctgtggtcc ccgccatgag ctttggatac agcgccttgc 2400
actgtgggat tttgaacaat attgtggtgc tgtgctgcag ttactgtgct gatttaagtg 2460
agatcagggt gcgctgctgt gcccggagga caaggcgtct catgctgcgg gcggtgcgaa 2520
tcatcgctga ggagaccact gccatgttgt attcctgcag gacggagcgg cggcggcagc 2580
agtttattcg cgcgctgctg cagcaccacc gccctatcct gatgcacgat tatgactcta 2640
cccccatgta ggcgtggact tccccttcgc cgcccgttga gcaaccgcaa gttggacagc 2700
agcctgtggc tcagcagctg gacagcgaca tgaacttaag cgagctgccc ggggagttta 2760
ttaatatcac tgatgagcgt ttggctcgac aggaaaccgt gtggaatata acacctaaga 2820
atatgtctgt tacccatgat atgatgcttt ttaaggccag ccggggagaa aggactgtgt 2880
actctgtgtg ttgggaggga ggtggcaggt tgaatactag ggttctgtga gtttgattaa 2940
ggtacggtga tcaatataag ctatgtggtg gtggggctat actactgaat gaaaaatgac 3000
ttgaaatttt ctgcaattga aaaataaaca cgttgaaaca taacatgcaa caggttcacg 3060
attctttatt cctgggcaat gtaggagaag gtgtaagagt tggtagcaaa agtttcagtg 3120
gtgtattttc cactttccca ggaccatgta aaagacatag agtaagtgct tacctcgcta 3180
gtttctgtgg attcactaga a 3201
<210> 62
<211> 743
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 62
tcgatgtagg atgttgcccc tcctgacgcg gtaggagaag gggagggtgc cctgcatgtc 60
tgccgctgct cttgctcttg ccgctgctga ggaggggggc gcatctgccg cagcaccgga 120
tgcatctggg aaaagcaaaa aaggggctcg tccctgtttc cggaggaatt tgcaagcggg 180
gtcttgcatg acggggaggc aaacccccgt tcgccgcagt ccggccggcc cgagactcga 240
accgggggtc ctgcgactca acccttggaa aataaccctc cggctacagg gagcgagcca 300
cttaatgctt tcgctttcca gcctaaccgc ttacgccgcg cgcggccagt ggccaaaaaa 360
gctagcgcag cagccgccgc gcctggaagg aagccaaaag gagcgctccc ccgttgtctg 420
acgtcgcaca cctgggttcg acacgcgggc ggtaaccgca tggatcacgg cggacggccg 480
gatccggggt tcgaaccccg gtcgtccgcc atgataccct tgcgaattta tccaccagac 540
cacggaagag tgcccgctta caggctctcc ttttgcacgg tctagagcgt caacgactgc 600
gcacgcctca ccggccagag cgtcccgacc atggagcact ttttgccgct gcgcaacatc 660
tggaaccgcg tccgcgactt tccgcgcgcc tccaccaccg ccgccggcat cacctggatg 720
tccaggtaca tctacggatt acg 743
<210> 63
<211> 9280
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 63
ggtacccaac tccatgctta acagtcccca ggtacagccc accctgcgtc gcaaccagga 60
acagctctac agcttcctgg agcgccactc gccctacttc cgcagccaca gtgcgcagat 120
taggagcgcc acttcttttt gtcacttgaa aaacatgtaa aaataatgta ctaggagaca 180
ctttcaataa aggcaaatgt ttttatttgt acactctcgg gtgattattt accccccacc 240
cttgccgtct gcgccgttta aaaatcaaag gggttctgcc gcgcatcgct atgcgccact 300
ggcagggaca cgttgcgata ctggtgttta gtgctccact taaactcagg cacaaccatc 360
cgcggcagct cggtgaagtt ttcactccac aggctgcgca ccatcaccaa cgcgtttagc 420
aggtcgggcg ccgatatctt gaagtcgcag ttggggcctc cgccctgcgc gcgcgagttg 480
cgatacacag ggttgcagca ctggaacact atcagcgccg ggtggtgcac gctggccagc 540
acgctcttgt cggagatcag atccgcgtcc aggtcctccg cgttgctcag ggcgaacgga 600
gtcaactttg gtagctgcct tcccaaaaag ggtgcatgcc caggctttga gttgcactcg 660
caccgtagtg gcatcagaag gtgaccgtgc ccggtctggg cgttaggata cagcgcctgc 720
atgaaagcct tgatctgctt aaaagccacc tgagcctttg cgccttcaga gaagaacatg 780
ccgcaagact tgccggaaaa ctgattggcc ggacaggccg cgtcatgcac gcagcacctt 840
gcgtcggtgt tggagatctg caccacattt cggccccacc ggttcttcac gatcttggcc 900
ttgctagact gctccttcag cgcgcgctgc ccgttttcgc tcgtcacatc catttcaatc 960
acgtgctcct tatttatcat aatgctcccg tgtagacact taagctcgcc ttcgatctca 1020
gcgcagcggt gcagccacaa cgcgcagccc gtgggctcgt ggtgcttgta ggttacctct 1080
gcaaacgact gcaggtacgc ctgcaggaat cgccccatca tcgtcacaaa ggtcttgttg 1140
ctggtgaagg tcagctgcaa cccgcggtgc tcctcgttta gccaggtctt gcatacggcc 1200
gccagagctt ccacttggtc aggcagtagc ttgaagtttg cctttagatc gttatccacg 1260
tggtacttgt ccatcaacgc gcgcgcagcc tccatgccct tctcccacgc agacacgatc 1320
ggcaggctca gcgggtttat caccgtgctt tcactttccg cttcactgga ctcttccttt 1380
tcctcttgcg tccgcatacc ccgcgccact gggtcgtctt cattcagccg ccgcaccgtg 1440
cgcttacctc ccttgccgtg cttgattagc accggtgggt tgctgaaacc caccatttgt 1500
agcgccacat cttctctttc ttcctcgctg tccacgatca cctctgggga tggcgggcgc 1560
tcgggcttgg gagaggggcg cttctttttc tttttggacg caatggccaa atccgccgtc 1620
gaggtcgatg gccgcgggct gggtgtgcgc ggcaccagcg catcttgtga cgagtcttct 1680
tcgtcctcgg actcgagacg ccgcctcagc cgcttttttg ggggcgcgcg gggaggcggc 1740
ggcgacggcg acggggacga cacgtcctcc atggttggtg gacgtcgcgc cgcaccgcgt 1800
ccgcgctcgg gggtggtttc gcgctgctcc tcttcccgac tggccatttc cttctcctat 1860
aggcagaaaa agatcatgga gtcagtcgag aaggaggaca gcctaaccgc cccctttgag 1920
ttcgccacca ccgcctccac cgatgccgcc aacgcgccta ccaccttccc cgtcgaggca 1980
cccccgcttg aggaggagga agtgattatc gagcaggacc caggttttgt aagcgaagac 2040
gacgaggatc gctcagtacc aacagaggat aaaaagcaag accaggacga cgcagaggca 2100
aacgaggaac aagtcgggcg gggggaccaa aggcatggcg actacctaga tgtgggagac 2160
gacgtgctgt tgaagcatct gcagcgccag tgcgccatta tctgcgacgc gttgcaagag 2220
cgcagcgatg tgcccctcgc catagcggat gtcagccttg cctacgaacg ccacctgttc 2280
tcaccgcgcg taccccccaa acgccaagaa aacggcacat gcgagcccaa cccgcgcctc 2340
aacttctacc ccgtatttgc cgtgccagag gtgcttgcca cctatcacat ctttttccaa 2400
aactgcaaga tacccctatc ctgccgtgcc aaccgcagcc gagcggacaa gcagctggcc 2460
ttgcggcagg gcgctgtcat acctgatatc gcctcgctcg acgaagtgcc aaaaatcttt 2520
gagggtcttg gacgcgacga gaaacgcgcg gcaaacgctc tgcaacaaga aaacagcgaa 2580
aatgaaagtc actgtggagt gctggtggaa cttgagggtg acaacgcgcg cctagccgtg 2640
ctgaaacgca gcatcgaggt cacccacttt gcctacccgg cacttaacct accccccaag 2700
gttatgagca cagtcatgag cgagctgatc gtgcgccgtg cacgacccct ggagagggat 2760
gcaaacttgc aagaacaaac cgaggagggc ctacccgcag ttggcgatga gcagctggcg 2820
cgctggcttg agacgcgcga gcctgccgac ttggaggagc gacgcaagct aatgatggcc 2880
gcagtgcttg ttaccgtgga gcttgagtgc atgcagcggt tctttgctga cccggagatg 2940
cagcgcaagc tagaggaaac gttgcactac acctttcgcc agggctacgt gcgccaggcc 3000
tgcaaaattt ccaacgtgga gctctgcaac ctggtctcct accttggaat tttgcacgaa 3060
aaccgcctcg ggcaaaacgt gcttcattcc acgctcaagg gcgaggcgcg ccgcgactac 3120
gtccgcgact gcgtttactt atttctgtgc tacacctggc aaacggccat gggcgtgtgg 3180
cagcaatgcc tggaggagcg caacctaaag gagctgcaga agctgctaaa gcaaaacttg 3240
aaggacctat ggacggcctt caacgagcgc tccgtggccg cgcacctggc ggacattatc 3300
ttccccgaac gcctgcttaa aaccctgcaa cagggtctgc cagacttcac cagtcaaagc 3360
atgttgcaaa actttaggaa ctttatccta gagcgttcag gaattctgcc cgccacctgc 3420
tgtgcgcttc ctagcgactt tgtgcccatt aagtaccgtg aatgccctcc gccgctttgg 3480
ggtcactgct accttctgca gctagccaac taccttgcct accactccga catcatggaa 3540
gacgtgagcg gtgacggcct actggagtgt cactgtcgct gcaacctatg caccccgcac 3600
cgctccctgg tctgcaattc gcaactgctt agcgaaagtc aaattatcgg tacctttgag 3660
ctgcagggtc cctcgcctga cgaaaagtcc gcggctccgg ggttgaaact cactccgggg 3720
ctgtggacgt cggcttacct tcgcaaattt gtacctgagg actaccacgc ccacgagatt 3780
aggttctacg aagaccaatc ccgcccgcca aatgcggagc ttaccgcctg cgtcattacc 3840
cagggccaca tccttggcca attgcaagcc atcaacaaag cccgccaaga gtttctgcta 3900
cgaaagggac ggggggttta cctggacccc cagtccggcg aggagctcaa cccaatcccc 3960
ccgccgccgc agccctatca gcagccgcgg gcccttgctt cccaggatgg cacccaaaaa 4020
gaagctgcag ctgccgccgc cgccacccac ggacgaggag gaatactggg acagtcaggc 4080
agaggaggtt ttggacgagg aggaggagat gatggaagac tgggacagcc tagacgaagc 4140
ttccgaggcc gaagaggtgt cagacgaaac accgtcaccc tcggtcgcat tcccctcgcc 4200
ggcgccccag aaattggcaa ccgttcccag catcgctaca acctccgctc ctcaggcgcc 4260
gccggcactg cctgttcgcc gacccaaccg tagatgggac accactggaa ccagggccgg 4320
taagtctaag cagccgccgc cgttagccca agagcaacaa cagcgccaag gctaccgctc 4380
gtggcgcggg cacaagaacg ccatagttgc ttgcttgcaa gactgtgggg gcaacatctc 4440
cttcgcccgc cgctttcttc tctaccatca cggcgtggcc ttcccccgta acatcctgca 4500
ttactaccgt catctctaca gcccctactg caccggcggc agcggcagcg gcagcaacag 4560
cagcggtcac acagaagcaa aggcgaccgg atagcaagac tctgacaaag cccaagaaat 4620
ccacagcggc ggcagcagca ggaggaggag cgctgcgtct ggcgcccaac gaacccgtat 4680
cgacccgcga gcttagaaat aggatttttc ccactctgta tgctatattt caacaaagca 4740
ggggccaaga acaagagctg aaaataaaaa acaggtctct gcgctccctc acccgcagct 4800
gcctgtatca caaaagcgaa gatcagcttc ggcgcacgct ggaagacgcg gaggctctct 4860
tcagcaaata ctgcgcgctg actcttaagg actagtttcg cgccctttct caaatttaag 4920
cgcgaaaact acgtcatctc cagcggccac acccggcgcc agcacctgtc gtcagcgcca 4980
ttatgagcaa ggaaattccc acgccctaca tgtggagtta ccagccacaa atgggacttg 5040
cggctggagc tgcccaagac tactcaaccc gaataaacta catgagcgcg ggaccccaca 5100
tgatatcccg ggtcaacgga atccgcgccc accgaaaccg aattctcctc gaacaggcgg 5160
ctattaccac cacacctcgt aataacctta atccccgtag ttggcccgct gccctggtgt 5220
accaggaaag tcccgctccc accactgtgg tacttcccag agacgcccag gccgaagttc 5280
agatgactaa ctcaggggcg cagcttgcgg gcggctttcg tcacagggtg cggtcgcccg 5340
ggcgttttag ggcggagtaa cttgcatgta ttgggaattg tagttttttt aaaatgggaa 5400
gtgacgtatc gtgggaaaac ggaagtgaag atttgaggaa gttgtgggtt ttttggcttt 5460
cgtttctggg cgtaggttcg cgtgcggttt tctgggtgtt ttttgtggac tttaaccgtt 5520
acgtcatttt ttagtcctat atatactcgc tctgtacttg gcccttttta cactgtgact 5580
gattgagctg gtgccgtgtc gagtggtgtt ttttaatagg tttttttact ggtaaggctg 5640
actgttatgg ctgccgctgt ggaagcgctg tatgttgttc tggagcggga gggtgctatt 5700
ttgcctaggc aggagggttt ttcaggtgtt tatgtgtttt tctctcctat taattttgtt 5760
atacctccta tgggggctgt aatgttgtct ctacgcctgc gggtatgtat tcccccgggc 5820
tatttcggtc gctttttagc actgaccgat gttaaccaac ctgatgtgtt taccgagtct 5880
tacattatga ctccggacat gaccgaggaa ctgtcggtgg tgctttttaa tcacggtgac 5940
cagttttttt acggtcacgc cggcatggcc gtagtccgtc ttatgcttat aagggttgtt 6000
tttcctgttg taagacaggc ttctaatgtt taaatgtttt tttttttgtt attttatttt 6060
gtgtttaatg caggaacccg cagacatgtt tgagagaaaa atggtgtctt tttctgtggt 6120
ggttccggaa cttacctgcc tttatctgca tgagcatgac tacgatgtgc ttgctttttt 6180
gcgcgaggct ttgcctgatt ttttgagcag caccttgcat tttatatcgc cgcccatgca 6240
acaagcttac ataggggcta cgctggttag catagctccg agtatgcgtg tcataatcag 6300
tgtgggttct tttgtcatgg ttcctggcgg ggaagtggcc gcgctggtcc gtgcagacct 6360
gcacgattat gttcagctgg ccctgcgaag ggacctacgg gatcgcggta tttttgttaa 6420
tgttccgctt ttgaatctta tacaggtctg tgaggaacct gaatttttgc aatcatgatt 6480
cgctgcttga ggctgaaggt ggagggcgct ctggagcaga tttttacaat ggccggactt 6540
aatattcggg atttgcttag agacatattg ataaggtggc gagatgaaaa ttatttgggc 6600
atggttgaag gtgctggaat gtttatagag gagattcacc ctgaagggtt tagcctttac 6660
gtccacttgg acgtgagggc agtttgcctt ttggaagcca ttgtgcaaca tcttacaaat 6720
gccattatct gttctttggc tgtagagttt gaccacgcca ccggagggga gcgcgttcac 6780
ttaatagatc ttcattttga ggttttggat aatcttttgg aataaaaaaa aaaaaacatg 6840
gttcttccag ctcttcccgc tcctcccgtg tgtgactcgc agaacgaatg tgtaggttgg 6900
ctgggtgtgg cttattctgc ggtggtggat gttatcaggg cagcggcgca tgaaggagtt 6960
tacatagaac ccgaagccag ggggcgcctg gatgctttga gagagtggat atactacaac 7020
tactacacag agcgagctaa gcgacgagac cggagacgca gatctgtttg tcacgcccgc 7080
acctggtttt gcttcaggaa atatgactac gtccggcgtt ccatttggca tgacactacg 7140
accaacacga tctcggttgt ctcggcgcac tccgtacagt agggatcgcc tacctccttt 7200
tgagacagag acccgcgcta ccatactgga ggatcatccg ctgctgcccg aatgtaacac 7260
tttgacaatg cacaacgtga gttacgtgcg aggtcttccc tgcagtgtgg gatttacgct 7320
gattcaggaa tgggttgttc cctgggatat ggttctgacg cgggaggagc ttgtaatcct 7380
gaggaagtgt atgcacgtgt gcctgtgttg tgccaacatt gatatcatga cgagcatgat 7440
gatccatggt tacgagtcct gggctctcca ctgtcattgt tccagtcccg gttccctgca 7500
gtgcatagcc ggcgggcagg ttttggccag ctggtttagg atggtggtgg atggcgccat 7560
gtttaatcag aggtttatat ggtaccggga ggtggtgaat tacaacatgc caaaagaggt 7620
aatgtttatg tccagcgtgt ttatgagggg tcgccactta atctacctgc gcttgtggta 7680
tgatggccac gtgggttctg tggtccccgc catgagcttt ggatacagcg ccttgcactg 7740
tgggattttg aacaatattg tggtgctgtg ctgcagttac tgtgctgatt taagtgagat 7800
cagggtgcgc tgctgtgccc ggaggacaag gcgtctcatg ctgcgggcgg tgcgaatcat 7860
cgctgaggag accactgcca tgttgtattc ctgcaggacg gagcggcggc ggcagcagtt 7920
tattcgcgcg ctgctgcagc accaccgccc tatcctgatg cacgattatg actctacccc 7980
catgtaggcg tggacttccc cttcgccgcc cgttgagcaa ccgcaagttg gacagcagcc 8040
tgtggctcag cagctggaca gcgacatgaa cttaagcgag ctgcccgggg agtttattaa 8100
tatcactgat gagcgtttgg ctcgacagga aaccgtgtgg aatataacac ctaagaatat 8160
gtctgttacc catgatatga tgctttttaa ggccagccgg ggagaaagga ctgtgtactc 8220
tgtgtgttgg gagggaggtg gcaggttgaa tactagggtt ctgtgagttt gattaaggta 8280
cggtgatcaa tataagctat gtggtggtgg ggctatacta ctgaatgaaa aatgacttga 8340
aattttctgc aattgaaaaa taaacacgtt gaaacataac atgcaacagg ttcacgattc 8400
tttattcctg ggcaatgtag gagaaggtgt aagagttggt agcaaaagtt tcagtggtgt 8460
attttccact ttcccaggac catgtaaaag acatagagta agtgcttacc tcgctagttt 8520
ctgtggattc actagaatcg atgtaggatg ttgcccctcc tgacgcggta ggagaagggg 8580
agggtgccct gcatgtctgc cgctgctctt gctcttgccg ctgctgagga ggggggcgca 8640
tctgccgcag caccggatgc atctgggaaa agcaaaaaag gggctcgtcc ctgtttccgg 8700
aggaatttgc aagcggggtc ttgcatgacg gggaggcaaa cccccgttcg ccgcagtccg 8760
gccggcccga gactcgaacc gggggtcctg cgactcaacc cttggaaaat aaccctccgg 8820
ctacagggag cgagccactt aatgctttcg ctttccagcc taaccgctta cgccgcgcgc 8880
ggccagtggc caaaaaagct agcgcagcag ccgccgcgcc tggaaggaag ccaaaaggag 8940
cgctcccccg ttgtctgacg tcgcacacct gggttcgaca cgcgggcggt aaccgcatgg 9000
atcacggcgg acggccggat ccggggttcg aaccccggtc gtccgccatg atacccttgc 9060
gaatttatcc accagaccac ggaagagtgc ccgcttacag gctctccttt tgcacggtct 9120
agagcgtcaa cgactgcgca cgcctcaccg gccagagcgt cccgaccatg gagcactttt 9180
tgccgctgcg caacatctgg aaccgcgtcc gcgactttcc gcgcgcctcc accaccgccg 9240
ccggcatcac ctggatgtcc aggtacatct acggattacg 9280
<210> 64
<211> 621
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2 Rep
<400> 64
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 65
<211> 198
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 65
gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 60
aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 120
tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 180
gtgtgggagg ttttttaa 198
<210> 66
<211> 4186
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 66
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgca gcattagctt ccatttatgc agtgtaaatg 240
gtgagaacag ccccgactga atacccagag catcatctcg tctgtgtcat tcatgcacat 300
aacatatctc agcgaggtgg cccttctgtc ctctttgcag agacccagcc accatactag 360
tacctagaga actggctgga tttcagcccc gatacctccg ggcttttgct catgttcgcc 420
tcatagggtc atctgggtgg ttgcctaagg aaaagtatgt catggagact aacttgcttg 480
gcattgaata aaaggtgagt tgagagtgga gcgtgtttaa attgcaatcc tgcctctatt 540
tctgtgcttg cagggaacag tcatccttaa ttgctatcct ccatcatcat catgattatt 600
tctggttttt ctctggttgc ggagaatcca tactccaggt attccaatgt ctcagcattg 660
ccaggcctgt ctgagcgtca ggatgtaggt agtctgggct ctctgccttc tattcttgtc 720
caggatactc tgccaaaaga atcatgttgt ggctgccacc cctcccacaa agcctcccgc 780
ttgggtcagt ccaggactgg agttgggtat ggactgttca tgtctatcca ctgctacgtc 840
agggcaacac ccactgagag tgaccttgta gactgcagtg ggagacaccc ttcaaaacct 900
ctcctctcct gtcctgagag ccaggttaaa accatcagcc ccgcatcctg agtgcaaact 960
tttcctaacc ctgctgctaa gctagacacc tcacttactg agagccagcc cctaaaatgg 1020
gcaaacattg caagcagcaa acagcaaaca cacagccctc cctgcctgct gaccttggag 1080
ctggggcaga ggtcagagac ctctctgggc ccatgccacc tccaacatcc actcgacccc 1140
ttggaatttc ggtggagagg agcagaggtt gtcctggcgt ggtttaggta gtgtgagagg 1200
ggaatgactc ctttcggtaa gtgcagtgga agctgtacac tgcccaggca aagcgtccgg 1260
gcagcgtagg cgggcgactc agatcccagc cagtggactt agcccctgtt tgctcctccg 1320
ataactgggg tgaccttggt taatattcac cagcagcctc ccccgttgcc cctctggatc 1380
cactgcttaa atacggacga ggacagggcc ctgtctcctc agcttcaggc accaccactg 1440
acctgggaca gtgaatcctc taaggtaaat ataaaatttt taagtgtata atgtgttaaa 1500
ctactgattc taattgtttc tctcttttag attccaacct ttggaactga ccgccaccat 1560
gtccaccgct gtgctggaga accctgggct ggggaggaaa ctgtcagact tcgggcagga 1620
gacttcatac attgaggata actgtaacca gaatggcgcc atctctctga tcttcagcct 1680
gaaggaggaa gtgggcgccc tggcaaaggt gctgcgcctg tttgaggaga acgacgtgaa 1740
tctgacccac atcgagtccc ggccttctag actgaagaag gacgagtacg agttctttac 1800
ccacctggat aagcggtccc tgccagccct gacaaacatc atcaagatcc tgaggcacga 1860
catcggagca accgtgcacg agctgtctcg ggacaagaag aaggataccg tgccctggtt 1920
ccctcggaca atccaggagc tggatagatt tgccaaccag atcctgtctt acggagcaga 1980
gctggacgca gatcaccctg gcttcaagga cccagtgtat cgggcccgga gaaagcagtt 2040
tgccgatatc gcctacaatt ataggcacgg acagccaatc cctcgcgtgg agtatatgga 2100
ggaggagaag aagacctggg gcacagtgtt caagaccctg aagagcctgt acaagacaca 2160
cgcctgctac gagtataacc acatcttccc cctgctggag aagtattgtg gctttcacga 2220
ggacaatatc cctcagctgg aggacgtgag ccagttcctg cagacctgca caggctttag 2280
gctgaggcca gtggcaggac tgctgagctc ccgggacttc ctgggaggac tggccttcag 2340
agtgtttcac tgcacccagt acatcaggca cggctccaag ccaatgtata caccagagcc 2400
cgacatctgt cacgagctgc tgggccacgt gcccctgttt agcgatagat ccttcgccca 2460
gttttcccag gagatcggac tggcatctct gggagcacct gacgagtaca tcgagaagct 2520
ggccaccatc tattggttca cagtggagtt tggcctgtgc aagcagggcg atagcatcaa 2580
ggcctacgga gcaggactgc tgtctagctt cggcgagctg cagtattgtc tgtccgagaa 2640
gccaaagctg ctgcccctgg agctggagaa gaccgccatc cagaactaca ccgtgacaga 2700
gttccagccc ctgtactatg tggccgagtc ttttaacgat gccaaggaga aggtgagaaa 2760
tttcgccgcc acaatcccta ggcccttcag tgtgcgttac gacccttata cccagaggat 2820
cgaggtgctg gataatacac agcagctgaa gatcctggct gactcaatca atagcgaaat 2880
cggaatcctg tgctccgccc tgcagaaaat caaatgagaa ttcaaggcct ctcgagcctc 2940
tagaactata gtgagtcgta ttacgtagat ccagacatga taagatacat tgatgagttt 3000
ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct 3060
attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt 3120
cattttatgt ttcaggttca gggggaggtg tgggaggttt tttaagcttt acgtacgatc 3180
gtcgagcagc tgttgtcctg gagaacggag tcctgagcag aaaactctca gactttgggc 3240
aggtaagcct gttgggcttc cactgctagg agagaattgg ttccccacat gtgaaagcag 3300
tctgggaaat gctggtattt ccagtctcct aaggctacta agaaatatga ctttatttag 3360
aggcgaggaa aatgcccagg aagtcaactg atgagactag tcttaacaag ttgaggatac 3420
agaaagttgg ggatctgagc tgctaccaac atctgtgtgt ctttgggtgg ctcattggta 3480
tcctctgcct attggcttta tcttctgtac actgaaagga aatggctggt ccttagtcac 3540
ctggggtggg agtccctatc tctccaggga tacttattca atcctttctt ctgggtatca 3600
aaatgacaag cttgtaagaa actgtcctct ttcggctttc aggaggtgat gtcgcatgaa 3660
gagaatttgg ggggggggac ttactcagaa ccaaggaggg agaaattaaa cagagaggga 3720
aatgaacagg agttagcccg gagcctgaag caccttgggg attatgctgg gggtggaggg 3780
aatccattgt cctccctagg gagggcttgc agaacatgtt cttttctgtg atatttgtac 3840
tttccccaga ttgcaaatca tggtttgtac actgagattc agtctctgga ggtaatatgc 3900
cttttctagc ttttccttgg acaggactaa ggggttgagg gttgcctgga gtcagagaaa 3960
tttgtgttaa agaaggttga tatgaaacct gcaggtctag atacgtagat aagtagcatg 4020
gcgggttaat cattaactac aaggaacccc tagtgatgga gttggccact ccctctctgc 4080
gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc 4140
gggcggcctc agtgagcgag cgagcgcgca gagagggagt ggccaa 4186
<210> 67
<211> 171
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 67
ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 60
tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 120
tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag g 171
<210> 68
<211> 122
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 68
aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60
aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120
ta 122
<210> 69
<211> 133
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 69
tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 60
aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 120
gaggtttttt aaa 133
<210> 70
<211> 3637
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 70
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgca gcattagctt ccatttatgc agtgtaaatg 240
gtgagaacag ccccgactga atacccagag catcatctcg tctgtgtcat tcatgcacat 300
aacatatctc agcgaggtgg cccttctgtc ctctttgcag agacccagcc accatactag 360
tacctagaga actggctgga tttcagcccc gatacctccg ggcttttgct catgttcgcc 420
tcatagggtc atctgggtgg ttgcctaagg aaaagtatgt catggagact aacttgcttg 480
gcattgaata aaaggtgagt tgagagtgga gcgtgtttaa attgcaatcc tgcctctatt 540
tctgtgcttg cagggaacag tcatccttaa ttgctatcct ccatcatcat catgattatt 600
tctggttttt ctctggttgc ggagaatcca tactccaggt attccaatgt ctcagcattg 660
ccaggcctgt ctgagcgtca ggatgtaggt agtctgggct ctctgccttc tattcttgtc 720
caggatactc tgccaaaaga atcatgttgt ggctgccacc cctcccacaa agcctcccgc 780
ttgggtcagt ccaggactgg agttgggtat ggactgttca tgtctatcca ctgctacgtc 840
agggcaacac ccactgagag tgaccttgta gactgcagtg ggagacaccc ttcaaaacct 900
ctcctctcct gtcctgagag ccaggttaaa accatcagcc ccgcatcctg agtgcaaact 960
tttcctaacc ctgctgctaa gctagacacc tcacttactg agagccagca tgtccaccgc 1020
tgtgctggag aaccctgggc tggggaggaa actgtcagac ttcgggcagg agacttcata 1080
cattgaggat aactgtaacc agaatggcgc catctctctg atcttcagcc tgaaggagga 1140
agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag aacgacgtga atctgaccca 1200
catcgagtcc cggccttcta gactgaagaa ggacgagtac gagttcttta cccacctgga 1260
taagcggtcc ctgccagccc tgacaaacat catcaagatc ctgaggcacg acatcggagc 1320
aaccgtgcac gagctgtctc gggacaagaa gaaggatacc gtgccctggt tccctcggac 1380
aatccaggag ctggatagat ttgccaacca gatcctgtct tacggagcag agctggacgc 1440
agatcaccct ggcttcaagg acccagtgta tcgggcccgg agaaagcagt ttgccgatat 1500
cgcctacaat tataggcacg gacagccaat ccctcgcgtg gagtatatgg aggaggagaa 1560
gaagacctgg ggcacagtgt tcaagaccct gaagagcctg tacaagacac acgcctgcta 1620
cgagtataac cacatcttcc ccctgctgga gaagtattgt ggctttcacg aggacaatat 1680
ccctcagctg gaggacgtga gccagttcct gcagacctgc acaggcttta ggctgaggcc 1740
agtggcagga ctgctgagct cccgggactt cctgggagga ctggccttca gagtgtttca 1800
ctgcacccag tacatcaggc acggctccaa gccaatgtat acaccagagc ccgacatctg 1860
tcacgagctg ctgggccacg tgcccctgtt tagcgataga tccttcgccc agttttccca 1920
ggagatcgga ctggcatctc tgggagcacc tgacgagtac atcgagaagc tggccaccat 1980
ctattggttc acagtggagt ttggcctgtg caagcagggc gatagcatca aggcctacgg 2040
agcaggactg ctgtctagct tcggcgagct gcagtattgt ctgtccgaga agccaaagct 2100
gctgcccctg gagctggaga agaccgccat ccagaactac accgtgacag agttccagcc 2160
cctgtactat gtggccgagt cttttaacga tgccaaggag aaggtgagaa atttcgccgc 2220
cacaatccct aggcccttca gcgtgcggta cgacccttat acccagagga tcgaggtgct 2280
ggataataca cagcagctga agatcctggc tgactcaatc aatagcgaaa tcggaatcct 2340
gtgctccgcc ctgcagaaaa tcaaatgaga attcaaggcc tctcgagcct ctagaactat 2400
agtgagtcgt attacgtaga tccagacatg ataagataca ttgatgagtt tggacaaacc 2460
acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta 2520
tttgtaacca ttataagctg caataaacaa gttaacaaca acaattgcat tcattttatg 2580
tttcaggttc agggggaggt gtgggaggtt ttttaagctt tacgtacgat cgtcgagcag 2640
ctgttgtcct ggagaacgga gtcctgagca gaaaactctc agactttggg caggtaagcc 2700
tgttgggctt ccactgctag gagagaattg gttccccaca tgtgaaagca gtctgggaaa 2760
tgctggtatt tccagtctcc taaggctact aagaaatatg actttattta gaggcgagga 2820
aaatgcccag gaagtcaact gatgagacta gtcttaacaa gttgaggata cagaaagttg 2880
gggatctgag ctgctaccaa catctgtgtg tctttgggtg gctcattggt atcctctgcc 2940
tattggcttt atcttctgta cactgaaagg aaatggctgg tccttagtca cctggggtgg 3000
gagtccctat ctctccaggg atacttattc aatcctttct tctgggtatc aaaatgacaa 3060
gcttgtaaga aactgtcctc tttcggcttt caggaggtga tgtcgcatga agagaatttg 3120
ggggggggga cttactcaga accaaggagg gagaaattaa acagagaggg aaatgaacag 3180
gagttagccc ggagcctgaa gcaccttggg gattatgctg ggggtggagg gaatccattg 3240
tcctccctag ggagggcttg cagaacatgt tcttttctgt gatatttgta ctttccccag 3300
attgcaaatc atggtttgta cactgagatt cagtctctgg aggtaatatg ccttttctag 3360
cttttccttg gacaggacta aggggttgag ggttgcctgg agtcagagaa atttgtgtta 3420
aagaaggttg atatgaaacc tgcaggtcta gatacgtaga taagtagcat ggcgggttaa 3480
tcattaacta caaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 3540
cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 3600
cagtgagcga gcgagcgcgc agagagggag tggccaa 3637
<210> 71
<211> 4075
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 71
ccttgctgtc ctgccccacc ccacccccca gaatagaatg acacctactc agacaatgcg 60
atgcaatttc ctcattttat taggaaagga cagtgggagt ggcaccttcc agggtcaagg 120
aaggcacggg ggaggggcaa acaacagatg gctggcaact agaaggcaca gcctcgagga 180
acgttttatt ttcccagaga caggctcagg gacttctggg tgtagtggct gtgcagggct 240
tcgtggagca cgctgcagct aaacacgttg ccctcttgcc atcggctctt gtccacggtc 300
agccgtgaat acaggaagaa gctgccatcg ctgtccagca ctggaggggt cgtcttgtag 360
ttgttttcag gctgtccgtt gctctcccat tcgacggcga tgtcgctggg gtagaagccc 420
ttcaccaggc aggtcagaga cacttggttc tttgtcattt cttcttgaga aggaggcagt 480
gtatagactt ggggctctct gggctggccc ttggcctttg agatggtctt ctcgatgctg 540
ctaggcaggc ccttgttaga caccttgcac ttgtactctt tgccgttcag ccagtcctgg 600
tgcagcactg tcagcacgga caccacccgg taggtgctgt taaactgttc ctcgcggggt 660
ttggtcttgg cattatgaac ttccactccg tcaacgtacc aattaaactg cacctcagga 720
tcctcctggg acacatccac caccacacat gtcacttcag gggtccggct gatcatcagg 780
gtgtctttgg gctttggtgg gaacaggaaa acagaagggc cggcgactgg tggagctgga 840
catggtgggc attccacgca gcactttctc tcaacggtct tatccacttt ggtgttgcta 900
ggcttgtggt ccacattaca ggtgtaggtc tgtgtgccga agttggagct aggaacggtg 960
accacgctac tcagagaata caggccagag ctctgcagca cggctgggaa ggtgtgcacg 1020
ccgcttgtca gggcgccgct gttccagctc actgtcacgg gttcggggaa gtagtctttg 1080
accagacaac ccagggcggc tgtgctttca gatgtgcttc tgctgcatgg ggccagtggg 1140
aacacgctgg gtcccttagt actggcgctg ctgacggtga caagggtgcc ttggccccac 1200
acgtcgaagt accagttagg ggatgagcca aaaaagtatc tggcgcagta gtacacagct 1260
gtgtcctcgc ttctcaggct gctcagttcc atgtacacgg tgcttgtgga ggtatctctg 1320
gtcatggtca ctctatcctt gaagttctct gtgtactcgg tgtggccaga tcctggcagg 1380
atctcgccca tccattccag gccttggcca ggggcctgcc gcacccactg gatccagtag 1440
ttgctgaaga tgtggccgct ggccttgcag gacaccttca cgctagctcc gggctttttc 1500
acttcggctc cgctttgaac cagctgcact tggctgtgca cgcctgtggc ggtggccacc 1560
aggaacagga tgatgcagga ccagcccatg gtggcactag ttcagttcca aaggttggaa 1620
tctaaaagag agaaacaatt agaatcagta gtttaacaca ttatacactt aaaaatttta 1680
tatttacctt agaggattca ctgtcccagg tcagtggtgg tgcctgaagc tgaggagaca 1740
gggccctgtc ctcgtccgta tttaagcagt ggatccagag gggcaacggg ggaggctgct 1800
ggtgaatatt aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccact 1860
ggctgggatc tgagtcgccc gcctacgctg cccggacgct ttgcctgggc agtgtacagc 1920
ttccactgca cttaccgaaa ggagtcattc ccctctcaca ctacctaaac cacgccagga 1980
caacctctgc tcctctccac cgaaattcca aggggtcgag tggatgttgg aggtggcatg 2040
ggcccagaga ggtctctgac ctctgcccca gctccaaggt cagcaggcag ggagggctgt 2100
gtgtttgctg tttgctgctt gcaatgtttg cccattttag ggccgcggca cgtgcttaag 2160
gccccctttt gcatccagtt tattcctaca tttgtcacac tgttaacagc ccaccccttc 2220
caatgagacc agtggtatca gtgagttgtg gagatcagga aaagggctca agagaaaggc 2280
agtcaaagcc ctttttctgt ccctgtccca gctgctttaa taagatctcc ataagagaag 2340
agggacagct atgactggga gtagtcagga gaggaggaaa aatctggcta gtaaaacatg 2400
taaggaaaat tttagggatg ttaaagaaaa aaataacaca aaacaaaata taaaaaaaat 2460
ctaacctcaa gtcaaggctt ttctatggaa taaggaatgg acagcagggg gctgtttcat 2520
atactgatga cctctttata gccaaccttt gttcatggca gccagcatat gggcatatgt 2580
tgccaaactc taaaccaaat actcattctg atgttttaaa tgatttgccc tcccatatgt 2640
ccttccgagt gagagacaca aaaaattcca acacactatt gcaatgaaaa taaatttcct 2700
ttattagcca gaagtcagat gctcaagggg cttcatgatg tccccataat ttttggcaga 2760
gggaaaaaga tctccggagg gggaggctgc tggtgaatat taaccaaggt caccccagtt 2820
atcggaggag caaacagggg ctaagtccac ctcgagccat ggcgatgctc taatctctct 2880
agacaaggtt catatttgta tgggttactt attctctctt tgttgactaa gtcaataatc 2940
agaatcagca ggtttgcagt cagattggca gggataagca gcctagctca ggagaagtga 3000
gtataaaagc cccaggctgg gagcagccat cagctagcgc cggcaagagg taagggttta 3060
agggatggtt ggttggtggg gtattaatgt ttaattacct ggagcacctg cctgaaatca 3120
ctttttttca ggttggaccg gtgccaccat ggacatgagg gtccctgctc agctgctggg 3180
gctcctgctg ctctggctca gcggtgccag atgtgatatc cagatgaccc agtctccatc 3240
tagcctgtcc gccagcgtgg gcgacagagt gaccatcacc tgcggcgcca gcgagaacat 3300
ctatggcgct ctgaactggt accagcagaa acctggcaag gcccctaagc tgctgatcta 3360
cggcgccacc aacctggccg atggcgtgcc tagtagattc agcggatctg gcagcggcac 3420
agacttcacc ctgaccatca gcagcctgca acctgaggac tttgccacat actactgcca 3480
gaacgtgctg aatacacctc tgacattcgg ccaaggaacc aaagtggaaa tcaagcggac 3540
cgtggccgct cctagcgtgt tcatcttccc tccttccgat gaacaactga agagcggaac 3600
cgcctctgtg gtgtgcctgc tgaacaactt ctaccctaga gaggccaagg tgcagtggaa 3660
ggtcgacaac gccctgcaga gcggcaacag ccaggagagc gtgacggaac aggacagcaa 3720
ggacagcacc tacagcctga gctccaccct tacactgtct aaagccgact acgagaagca 3780
caaggtgtac gcctgtgaag tgacacacca gggcctgagc agccctgtga ccaagtcttt 3840
taaccggggc gagtgctgaa ttcgaatcgt acctagggat ccagacatga taagatacat 3900
tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat 3960
ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa 4020
caattgcatt cattttatgt ttcaggttca gggggaggtg tgggaggttt tttaa 4075
<210> 72
<211> 2211
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 72
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020
acggtccagg tcttcgcgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320
gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440
ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500
tttgcttggc ctagagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680
accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740
gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800
atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860
aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920
aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980
gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040
gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100
tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160
tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211
<210> 73
<211> 4093
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 73
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
caaccttagt gaaggaattc gcgagtggtg ggctttgaaa cctggagccc ctcaacccaa 1980
ggcaaatcaa caacatcaag acaacgctcg aggtcttgtg cttccgggtt acaaatacct 2040
tggacccggc aacggactcg acaaggggga gccggtcaac gcagcagacg cggcggccct 2100
cgagcacgac aaggcctacg accagcagct caaggccgga gacaacccgt acctcaagta 2160
caaccacgcc gacgccgagt tccaggagcg gctcaaagaa gatacgtctt ttgggggcaa 2220
cctcgggcga gcagtcttcc aggccaaaaa gaggcttctt gaacctcttg gtctggttga 2280
ggaagcggct aagacggctc ctggaaagaa gaggcctgta gagcagtctc ctcaggaacc 2340
ggactcctcc gcgggtattg gcaaatcggg tgcacagccc gctaaaaaga gactcaattt 2400
cggtcagact ggcgacacag agtcagtccc agaccctcaa ccaatcggag aacctcccgc 2460
agccccctca ggtgtgggat ctcttacaat ggcttcaggt ggtggcgcac cagtggcaga 2520
caataacgaa ggtgccgatg gagtgggtag ttcctcggga aattggcatt gcgattccca 2580
atggctgggg gacagagtca tcaccaccag cacccgaacc tgggccctgc ccacctacaa 2640
caatcacctc tacaagcaaa tctccaacag cacatctgga ggatcttcaa atgacaacgc 2700
ctacttcggc tacagcaccc cctgggggta ttttgacttc aacagattcc actgccactt 2760
ctcaccacgt gactggcagc gactcatcaa caacaactgg ggattccggc ctaagcgact 2820
caacttcaag ctcttcaaca ttcaggtcaa agaggttacg gacaacaatg gagtcaagac 2880
catcgccaat aaccttacca gcacggtcca ggtcttcgcg gactcagact atcagctccc 2940
gtacgtgctc gggtcggctc acgagggctg cctcccgccg ttcccagcgg acgttttcat 3000
gattcctcag tacgggtatc tgacgcttaa tgatggaagc caggccgtgg gtcgttcgtc 3060
cttttactgc ctggaatatt tcccgtcgca aatgctaaga acgggtaaca acttccagtt 3120
cagctacgag tttgagaacg tacctttcca tagcagctac gctcacagcc aaagcctgga 3180
ccgactaatg aatccactca tcgaccaata cttgtactat ctctcaaaga ctattaacgg 3240
ttctggacag aatcaacaaa cgctaaaatt cagtgtggcc ggacccagca acatggctgt 3300
ccagggaaga aactacatac ctggacccag ctaccgacaa caacgtgtct caaccactgt 3360
gactcaaaac aacaacagcg aatttgcttg gcctagagct tcttcttggg ctctcaatgg 3420
acgtaatagc ttgatgaatc ctggacctgc tatggccagc cacaaagaag gagaggaccg 3480
tttctttcct ttgtctggat ctttaatttt tggcaaacaa ggaactggaa gagacaacgt 3540
ggatgcggac aaagtcatga taaccaacga agaagaaatt aaaactacta acccggtagc 3600
aacggagtcc tatggacaag tggccacaaa ccaccagagt gcccaagcac aggcgcagac 3660
cggctgggtt caaaaccaag gaatacttcc gggtatggtt tggcaggaca gagatgtgta 3720
cctgcaagga cccatttggg ccaaaattcc tcacacggac ggcaactttc acccttctcc 3780
gctgatggga gggtttggaa tgaagcaccc gcctcctcag atcctcatca aaaacacacc 3840
tgtacctgcg gatcctccaa cggccttcaa caaggacaag ctgaactctt tcatcaccca 3900
gtattctact ggccaagtca gcgtggagat cgagtgggag ctgcagaagg aaaacagcaa 3960
gcgctggaac ccggagatcc agtacacttc caactattac aagtctaata atgttgaatt 4020
tgctgttaat actgaaggtg tatatagtga accccgcccc attggcacca gatacctgac 4080
tcgtaatctg taa 4093
<210> 74
<211> 1353
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 74
tccaccgctg tgctggagaa ccctgggctg gggaggaaac tgtcagactt cgggcaggag 60
acttcataca ttgaggataa ctgtaaccag aatggcgcca tctctctgat cttcagcctg 120
aaggaggaag tgggcgccct ggcaaaggtg ctgcgcctgt ttgaggagaa cgacgtgaat 180
ctgacccaca tcgagtcccg gccttctaga ctgaagaagg acgagtacga gttctttacc 240
cacctggata agcggtccct gccagccctg acaaacatca tcaagatcct gaggcacgac 300
atcggagcaa ccgtgcacga gctgtctcgg gacaagaaga aggataccgt gccctggttc 360
cctcggacaa tccaggagct ggatagattt gccaaccaga tcctgtctta cggagcagag 420
ctggacgcag atcaccctgg cttcaaggac ccagtgtatc gggcccggag aaagcagttt 480
gccgatatcg cctacaatta taggcacgga cagccaatcc ctcgcgtgga gtatatggag 540
gaggagaaga agacctgggg cacagtgttc aagaccctga agagcctgta caagacacac 600
gcctgctacg agtataacca catcttcccc ctgctggaga agtattgtgg ctttcacgag 660
gacaatatcc ctcagctgga ggacgtgagc cagttcctgc agacctgcac aggctttagg 720
ctgaggccag tggcaggact gctgagctcc cgggacttcc tgggaggact ggccttcaga 780
gtgtttcact gcacccagta catcaggcac ggctccaagc caatgtatac accagagccc 840
gacatctgtc acgagctgct gggccacgtg cccctgttta gcgatagatc cttcgcccag 900
ttttcccagg agatcggact ggcatctctg ggagcacctg acgagtacat cgagaagctg 960
gccaccatct attggttcac agtggagttt ggcctgtgca agcagggcga tagcatcaag 1020
gcctacggag caggactgct gtctagcttc ggcgagctgc agtattgtct gtccgagaag 1080
ccaaagctgc tgcccctgga gctggagaag accgccatcc agaactacac cgtgacagag 1140
ttccagcccc tgtactatgt ggccgagtct tttaacgatg ccaaggagaa ggtgagaaat 1200
ttcgccgcca caatccctag gcccttcagc gtgcggtacg acccttatac ccagaggatc 1260
gaggtgctgg ataatacaca gcagctgaag atcctggctg actcaatcaa tagcgaaatc 1320
ggaatcctgt gctccgccct gcagaaaatc aaa 1353
<210> 75
<211> 3939
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 75
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240
caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300
cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360
agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420
cagctggggg taaggggggc ggattattca tataattgtt ataccagacg gtcgcaggct 480
tagtccaatt gcagagaact cgcttcccag gcttctgaga gtcccggaag tgcctaaacc 540
tgtctaatcg acggggcttg ggtggcccgt cgctccctgg cttcttccct ttacccaggg 600
cgggcagcga agtggtgcct cctgcgtccc ccacaccctc cctcagcccc tcccctccgg 660
cccgtcctgg gcaggtgacc tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga 720
caacgcccac gaggggcgtt actgtgcgga gatgcaccac gcaagagaca ccctttgtaa 780
ctctcttctc ctccctagtg cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc 840
tgcctgtacc tgaggcccta aaaagccaga gacctcactc ccggggagcc agcatgtcca 900
ctgcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 960
acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatctgaaga 1020
ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 1080
gagaatatcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 1140
atctgtcctc ggtggctttc acaggaaaag cttctgacct cttctcttcc tcccacaggg 1200
cggtaccaga tctggcagcg gagagggcag aggaagtctt ctaacatgcg gtgacgtgga 1260
ggagaatccc ggcccttcca ccgctgtgct ggagaaccct gggctgggga ggaaactgtc 1320
agacttcggg caggagactt catacattga ggataactgt aaccagaatg gcgccatctc 1380
tctgatcttc agcctgaagg aggaagtggg cgccctggca aaggtgctgc gcctgtttga 1440
ggagaacgac gtgaatctga cccacatcga gtcccggcct tctagactga agaaggacga 1500
gtacgagttc tttacccacc tggataagcg gtccctgcca gccctgacaa acatcatcaa 1560
gatcctgagg cacgacatcg gagcaaccgt gcacgagctg tctcgggaca agaagaagga 1620
taccgtgccc tggttccctc ggacaatcca ggagctggat agatttgcca accagatcct 1680
gtcttacgga gcagagctgg acgcagatca ccctggcttc aaggacccag tgtatcgggc 1740
ccggagaaag cagtttgccg atatcgccta caattatagg cacggacagc caatccctcg 1800
cgtggagtat atggaggagg agaagaagac ctggggcaca gtgttcaaga ccctgaagag 1860
cctgtacaag acacacgcct gctacgagta taaccacatc ttccccctgc tggagaagta 1920
ttgtggcttt cacgaggaca atatccctca gctggaggac gtgagccagt tcctgcagac 1980
ctgcacaggc tttaggctga ggccagtggc aggactgctg agctcccggg acttcctggg 2040
aggactggcc ttcagagtgt ttcactgcac ccagtacatc aggcacggct ccaagccaat 2100
gtatacacca gagcccgaca tctgtcacga gctgctgggc cacgtgcccc tgtttagcga 2160
tagatccttc gcccagtttt cccaggagat cggactggca tctctgggag cacctgacga 2220
gtacatcgag aagctggcca ccatctattg gttcacagtg gagtttggcc tgtgcaagca 2280
gggcgatagc atcaaggcct acggagcagg actgctgtct agcttcggcg agctgcagta 2340
ttgtctgtcc gagaagccaa agctgctgcc cctggagctg gagaagaccg ccatccagaa 2400
ctacaccgtg acagagttcc agcccctgta ctatgtggcc gagtctttta acgatgccaa 2460
ggagaaggtg agaaatttcg ccgccacaat ccctaggccc ttcagcgtgc ggtacgaccc 2520
ttatacccag aggatcgagg tgctggataa tacacagcag ctgaagatcc tggctgactc 2580
aatcaatagc gaaatcggaa tcctgtgctc cgccctgcag aaaatcaaat gagatccaga 2640
catgataaga tacattgatg agtttggaca aaccacaact agaatgcagt gaaaaaaatg 2700
ctttatttgt gaaatttgtg atgctattgc tttatttgta accattataa gctgcaataa 2760
acaagttaac aacaacaatt gcattcattt tatgtttcag gttcaggggg aggtgtggga 2820
ggttttttaa ctgggatggg atgtggaatc cttctagatt tcttttgtaa tatttataaa 2880
gtgctctcag caaggtatca aaatggcaaa attgtgagta actatcctcc tttcattttg 2940
ggaagaagat gaggcatgaa gagaattcag acagaaactt actcagacca ggggaggcag 3000
aaactaagca gagaggaaaa tgaccaagag ttagccctgg gcatggaatg tgaaagaacc 3060
ctaaacgtga cttggaaata atgcccaagg tatattccat tctccgggat ttgttggcat 3120
tttcttgagg tgaagaattg cagaatacat tctttaatgt gacctacata tttacccatg 3180
ggaggaagtc tgctcctgga ctcttgagat tcagtcataa agcccaggcc agggaaataa 3240
tgtaagtctg caggcccctg tcatcagtag gattagggag aagagttctc agtagaaaac 3300
agggaggctg gagagaaaag aatggttaat gttaacgtta atataactag aaagactgca 3360
gaacttagga ctgattttta tttgaatcct taaaaaaaaa atttcttatg aaaatagtac 3420
atggctctta ggagacagaa cttattgtac agaggaacag cgtgagagtc agagtgatcc 3480
cagaacaggt cctggctcca tcctgcacat agttttggtg ctgctggcaa tacggtcccc 3540
acaactgtgg gaaggggtta ggggcaggga tctcatcagg aaagcatagg ggtttaaagt 3600
tctttataga gcacttagaa gattgagaat ccacaaatta tattaataac aaacaaagta 3660
gtgtcgtgtt atatagtaaa tgtgaatttg cagacacatt tagggaaaag ttataattaa 3720
aaaaataggc tgtatatata cctgcaggtc tagatacgta gataagtagc atggcgggtt 3780
aatcattaac tacaaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 3840
ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc 3900
ctcagtgagc gagcgagcgc gcagagaggg agtggccaa 3939
<210> 76
<211> 2211
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 76
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgat 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020
acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320
gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440
ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500
tttgcttggc ctagagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680
accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740
gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800
atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860
aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920
aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980
gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040
gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100
tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160
tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211
<210> 77
<211> 4093
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 77
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
caaccttagt gaaggaattc gcgagtggtg ggctttgaaa cctggagccc ctcaacccaa 1980
ggcaaatcaa caacatcaag acaacgctcg aggtcttgtg cttccgggtt acaaatacct 2040
tggacccggc aacggactcg ataaggggga gccggtcaac gcagcagacg cggcggccct 2100
cgagcacgac aaggcctacg accagcagct caaggccgga gacaacccgt acctcaagta 2160
caaccacgcc gacgccgagt tccaggagcg gctcaaagaa gatacgtctt ttgggggcaa 2220
cctcgggcga gcagtcttcc aggccaaaaa gaggcttctt gaacctcttg gtctggttga 2280
ggaagcggct aagacggctc ctggaaagaa gaggcctgta gagcagtctc ctcaggaacc 2340
ggactcctcc gcgggtattg gcaaatcggg tgcacagccc gctaaaaaga gactcaattt 2400
cggtcagact ggcgacacag agtcagtccc agaccctcaa ccaatcggag aacctcccgc 2460
agccccctca ggtgtgggat ctcttacaat ggcttcaggt ggtggcgcac cagtggcaga 2520
caataacgaa ggtgccgatg gagtgggtag ttcctcggga aattggcatt gcgattccca 2580
atggctgggg gacagagtca tcaccaccag cacccgaacc tgggccctgc ccacctacaa 2640
caatcacctc tacaagcaaa tctccaacag cacatctgga ggatcttcaa atgacaacgc 2700
ctacttcggc tacagcaccc cctgggggta ttttgacttc aacagattcc actgccactt 2760
ctcaccacgt gactggcagc gactcatcaa caacaactgg ggattccggc ctaagcgact 2820
caacttcaag ctcttcaaca ttcaggtcaa agaggttacg gacaacaatg gagtcaagac 2880
catcgccaat aaccttacca gcacggtcca ggtcttcacg gactcagact atcagctccc 2940
gtacgtgctc gggtcggctc acgagggctg cctcccgccg ttcccagcgg acgttttcat 3000
gattcctcag tacgggtatc tgacgcttaa tgatggaagc caggccgtgg gtcgttcgtc 3060
cttttactgc ctggaatatt tcccgtcgca aatgctaaga acgggtaaca acttccagtt 3120
cagctacgag tttgagaacg tacctttcca tagcagctac gctcacagcc aaagcctgga 3180
ccgactaatg aatccactca tcgaccaata cttgtactat ctctcaaaga ctattaacgg 3240
ttctggacag aatcaacaaa cgctaaaatt cagtgtggcc ggacccagca acatggctgt 3300
ccagggaaga aactacatac ctggacccag ctaccgacaa caacgtgtct caaccactgt 3360
gactcaaaac aacaacagcg aatttgcttg gcctagagct tcttcttggg ctctcaatgg 3420
acgtaatagc ttgatgaatc ctggacctgc tatggccagc cacaaagaag gagaggaccg 3480
tttctttcct ttgtctggat ctttaatttt tggcaaacaa ggaactggaa gagacaacgt 3540
ggatgcggac aaagtcatga taaccaacga agaagaaatt aaaactacta acccggtagc 3600
aacggagtcc tatggacaag tggccacaaa ccaccagagt gcccaagcac aggcgcagac 3660
cggctgggtt caaaaccaag gaatacttcc gggtatggtt tggcaggaca gagatgtgta 3720
cctgcaagga cccatttggg ccaaaattcc tcacacggac ggcaactttc acccttctcc 3780
gctgatggga gggtttggaa tgaagcaccc gcctcctcag atcctcatca aaaacacacc 3840
tgtacctgcg gatcctccaa cggccttcaa caaggacaag ctgaactctt tcatcaccca 3900
gtattctact ggccaagtca gcgtggagat cgagtgggag ctgcagaagg aaaacagcaa 3960
gcgctggaac ccggagatcc agtacacttc caactattac aagtctaata atgttgaatt 4020
tgctgttaat actgaaggtg tatatagtga accccgcccc attggcacca gatacctgac 4080
tcgtaatctg taa 4093
<210> 78
<211> 2356
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 78
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggaatt cacgcgtgga 120
tctgaattca attcacgcgt ggtacctccc taaaatgggc aaacattgca agcagcaaac 180
agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg tcagagacct 240
ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg tggagaggag 300
cagaggttgt cctggcgtgg tttaggtagt gtgagagggg aatgactcct ttcggtaagt 360
gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag 420
atcccagcca gtggacttag cccctgtttg ctcctccgat aactggggtg accttggtta 480
atattcacca gcagcctccc ccgttgcccc tctggatcca ctgcttaaat acggacgagg 540
acagggccct gtctcctcag cttcaggcac caccactgac ctgggacagt gaatcctcta 600
aggtaaatat aaaattttta agtgtataat gtgttaaact actgattcta attgtttctc 660
tcttttagat tccaaccttt ggaactgacc gccaccatgt ccaccgctgt gctggagaac 720
cctgggctgg ggaggaaact gtcagacttc gggcaggaga cttcatacat tgaggataac 780
tgtaaccaga atggcgccat ctctctgatc ttcagcctga aggaggaagt gggcgccctg 840
gcaaaggtgc tgcgcctgtt tgaggagaac gacgtgaatc tgacccacat cgagtcccgg 900
ccttctagac tgaagaagga cgagtacgag ttctttaccc acctggataa gcggtccctg 960
ccagccctga caaacatcat caagatcctg aggcacgaca tcggagcaac cgtgcacgag 1020
ctgtctcggg acaagaagaa ggataccgtg ccctggttcc ctcggacaat ccaggagctg 1080
gatagatttg ccaaccagat cctgtcttac ggagcagagc tggacgcaga tcaccctggc 1140
ttcaaggacc cagtgtatcg ggcccggaga aagcagtttg ccgatatcgc ctacaattat 1200
aggcacggac agccaatccc tcgcgtggag tatatggagg aggagaagaa gacctggggc 1260
acagtgttca agaccctgaa gagcctgtac aagacacacg cctgctacga gtataaccac 1320
atcttccccc tgctggagaa gtattgtggc tttcacgagg acaatatccc tcagctggag 1380
gacgtgagcc agttcctgca gacctgcaca ggctttaggc tgaggccagt ggcaggactg 1440
ctgagctccc gggacttcct gggaggactg gccttcagag tgtttcactg cacccagtac 1500
atcaggcacg gctccaagcc aatgtataca ccagagcccg acatctgtca cgagctgctg 1560
ggccacgtgc ccctgtttag cgatagatcc ttcgcccagt tttcccagga gatcggactg 1620
gcatctctgg gagcacctga cgagtacatc gagaagctgg ccaccatcta ttggttcaca 1680
gtggagtttg gcctgtgcaa gcagggcgat agcatcaagg cctacggagc aggactgctg 1740
tctagcttcg gcgagctgca gtattgtctg tccgagaagc caaagctgct gcccctggag 1800
ctggagaaga ccgccatcca gaactacacc gtgacagagt tccagcccct gtactatgtg 1860
gccgagtctt ttaacgatgc caaggagaag gtgagaaatt tcgccgccac aatccctagg 1920
cccttcagcg tgcggtacga cccttatacc cagaggatcg aggtgctgga taatacacag 1980
cagctgaaga tcctggctga ctcaatcaat agcgaaatcg gaatcctgtg ctccgccctg 2040
cagaaaatca aatgaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac 2100
cattataagc tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt 2160
tcagggggag gtgtgggagg ttttttaaag catgctgggg agagatcgat ctgaggaacc 2220
cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 2280
accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg 2340
cagagaggga gtggcc 2356
<210> 79
<211> 1359
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 79
atgtccaccg ctgtgctgga gaaccctggg ctggggagga aactgtcaga cttcgggcag 60
gagacttcat acattgagga taactgtaac cagaatggcg ccatctctct gatcttcagc 120
ctgaaggagg aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg 180
aatctgaccc acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt 240
acccacctgg ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgaggcac 300
gacatcggag caaccgtgca cgagctgtct cgggacaaga agaaggatac cgtgccctgg 360
ttccctcgga caatccagga gctggataga tttgccaacc agatcctgtc ttacggagca 420
gagctggacg cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag 480
tttgccgata tcgcctacaa ttataggcac ggacagccaa tccctcgcgt ggagtatatg 540
gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca 600
cacgcctgct acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac 660
gaggacaata tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt 720
aggctgaggc cagtggcagg actgctgagc tcccgggact tcctgggagg actggccttc 780
agagtgtttc actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag 840
cccgacatct gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc 900
cagttttccc aggagatcgg actggcatct ctgggagcac ctgacgagta catcgagaag 960
ctggccacca tctattggtt cacagtggag tttggcctgt gcaagcaggg cgatagcatc 1020
aaggcctacg gagcaggact gctgtctagc ttcggcgagc tgcagtattg tctgtccgag 1080
aagccaaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgaca 1140
gagttccagc ccctgtacta tgtggccgag tcttttaacg atgccaagga gaaggtgaga 1200
aatttcgccg ccacaatccc taggcccttc agtgtgcgtt acgaccctta tacccagagg 1260
atcgaggtgc tggataatac acagcagctg aagatcctgg ctgactcaat caatagcgaa 1320
atcggaatcc tgtgctccgc cctgcagaaa atcaaatga 1359
<210> 80
<211> 4452
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 80
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgct tcaggagcag ttgtgcgaat agctggagaa 240
caccaggctg gatttaaacc cagatcgctc ttacatttgc tctttacctg ctgtgctcag 300
cgttcacgtg ccctctagct gtagttttct gaagtcagcg cacagcaagg cagtgtgctt 360
agaggttaac agaagggaaa acaacaacaa caaaaatcta aatgagaatc ctgactgttt 420
cagctggggg taaggggggc ggattattca tataattgtt ataccagacg gtcgcaggct 480
tagtccaatt gcagagaact cgcttcccag gcttctgaga gtcccggaag tgcctaaacc 540
tgtctaatcg acggggcttg ggtggcccgt cgctccctgg cttcttccct ttacccaggg 600
cgggcagcga agtggtgcct cctgcgtccc ccacaccctc cctcagcccc tcccctccgg 660
cccgtcctgg gcaggtgacc tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga 720
caacgcccac gaggggcgtt actgtgcgga gatgcaccac gcaagagaca ccctttgtaa 780
ctctcttctc ctccctagtg cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc 840
tgcctgtacc tgaggcccta aaaagccaga gacctcactc ccggggagcc agcatgtcca 900
ctgcggtcct ggaaaaccca ggcttgggca ggaaactctc tgactttgga caggtgagcc 960
acggcagcct gagctgctca gttaggggaa tttgggcctc cagagaaaga gatctgaaga 1020
ctgctggtgc ttcctggttt cataagctca gtaagaagtc tgaattcgtt ggaagctgat 1080
gagaatatcc aggaagtcaa cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac 1140
atctgtcctc ggtggctttc acaggaaccc taaaatgggc aaacattgca agcagcaaac 1200
agcaaacaca cagccctccc tgcctgctga ccttggagct ggggcagagg tcagagacct 1260
ctctgggccc atgccacctc caacatccac tcgacccctt ggaatttcgg tggagaggag 1320
cagaggttgt cctggcgtgg tttaggtagt gtgagagggg aatgactcct ttcggtaagt 1380
gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag 1440
atcccagcca gtggacttag cccctgtttg ctcctccgat aactggggtg accttggtta 1500
atattcacca gcagcctccc ccgttgcccc tctggatcca ctgcttaaat acggacgagg 1560
acagggccct gtctcctcag cttcaggcac caccactgac ctgggacagt gaatcctcta 1620
aggtaaatat aaaattttta agtgtataat gtgttaaact actgattcta attgtttctc 1680
tcttttagat tccaaccttt ggaactgacc gccaccatgt ccaccgctgt gctggagaac 1740
cctgggctgg ggaggaaact gtcagacttc gggcaggaga cttcatacat tgaggataac 1800
tgtaaccaga atggcgccat ctctctgatc ttcagcctga aggaggaagt gggcgccctg 1860
gcaaaggtgc tgcgcctgtt tgaggagaac gacgtgaatc tgacccacat cgagtcccgg 1920
ccttctagac tgaagaagga cgagtacgag ttctttaccc acctggataa gcggtccctg 1980
ccagccctga caaacatcat caagatcctg aggcacgaca tcggagcaac cgtgcacgag 2040
ctgtctcggg acaagaagaa ggataccgtg ccctggttcc ctcggacaat ccaggagctg 2100
gatagatttg ccaaccagat cctgtcttac ggagcagagc tggacgcaga tcaccctggc 2160
ttcaaggacc cagtgtatcg ggcccggaga aagcagtttg ccgatatcgc ctacaattat 2220
aggcacggac agccaatccc tcgcgtggag tatatggagg aggagaagaa gacctggggc 2280
acagtgttca agaccctgaa gagcctgtac aagacacacg cctgctacga gtataaccac 2340
atcttccccc tgctggagaa gtattgtggc tttcacgagg acaatatccc tcagctggag 2400
gacgtgagcc agttcctgca gacctgcaca ggctttaggc tgaggccagt ggcaggactg 2460
ctgagctccc gggacttcct gggaggactg gccttcagag tgtttcactg cacccagtac 2520
atcaggcacg gctccaagcc aatgtataca ccagagcccg acatctgtca cgagctgctg 2580
ggccacgtgc ccctgtttag cgatagatcc ttcgcccagt tttcccagga gatcggactg 2640
gcatctctgg gagcacctga cgagtacatc gagaagctgg ccaccatcta ttggttcaca 2700
gtggagtttg gcctgtgcaa gcagggcgat agcatcaagg cctacggagc aggactgctg 2760
tctagcttcg gcgagctgca gtattgtctg tccgagaagc caaagctgct gcccctggag 2820
ctggagaaga ccgccatcca gaactacacc gtgacagagt tccagcccct gtactatgtg 2880
gccgagtctt ttaacgatgc caaggagaag gtgagaaatt tcgccgccac aatccctagg 2940
cccttcagtg tgcgttacga cccttatacc cagaggatcg aggtgctgga taatacacag 3000
cagctgaaga tcctggctga ctcaatcaat agcgaaatcg gaatcctgtg ctccgccctg 3060
cagaaaatca aatgagaatt caaggcctct cgagcctcta gaactatagt gagtcgtatt 3120
acgtagatcc agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc 3180
agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta 3240
taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg 3300
gggaggtgtg ggaggttttt taagctttac gtacgatcgt cgactgggat gggatgtgga 3360
atccttctag atttcttttg taatatttat aaagtgctct cagcaaggta tcaaaatggc 3420
aaaattgtga gtaactatcc tcctttcatt ttgggaagaa gatgaggcat gaagagaatt 3480
cagacagaaa cttactcaga ccaggggagg cagaaactaa gcagagagga aaatgaccaa 3540
gagttagccc tgggcatgga atgtgaaaga accctaaacg tgacttggaa ataatgccca 3600
aggtatattc cattctccgg gatttgttgg cattttcttg aggtgaagaa ttgcagaata 3660
cattctttaa tgtgacctac atatttaccc atgggaggaa gtctgctcct ggactcttga 3720
gattcagtca taaagcccag gccagggaaa taatgtaagt ctgcaggccc ctgtcatcag 3780
taggattagg gagaagagtt ctcagtagaa aacagggagg ctggagagaa aagaatggtt 3840
aatgttaacg ttaatataac tagaaagact gcagaactta ggactgattt ttatttgaat 3900
ccttaaaaaa aaaatttctt atgaaaatag tacatggctc ttaggagaca gaacttattg 3960
tacagaggaa cagcgtgaga gtcagagtga tcccagaaca ggtcctggct ccatcctgca 4020
catagttttg gtgctgctgg caatacggtc cccacaactg tgggaagggg ttaggggcag 4080
ggatctcatc aggaaagcat aggggtttaa agttctttat agagcactta gaagattgag 4140
aatccacaaa ttatattaat aacaaacaaa gtagtgtcgt gttatatagt aaatgtgaat 4200
ttgcagacac atttagggaa aagttataat taaaaaaata ggctgtatat atacctgcag 4260
gtctagatac gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt 4320
gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa 4380
ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga 4440
gggagtggcc aa 4452
<210> 81
<211> 1735
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 81
atgcccccac ccaggaccgg aagaggcctg ctgtggctgg gcctggtgct ctcttccgtg 60
tgcgtggccc tgggaagcga aacccaggcc aacagcacaa ccgacgccct gaatgtgctg 120
ctgatcattg tggacgatct gagaccctcc ctgggctgtt acggcgacaa actggtgcgg 180
tccccaaaca tcgaccagct ggcctcccac tccctgctgt tccagaacgc cttcgcccag 240
caggccgtgt gtgcccccag cagggtgagc ttcctgaccg gcagaagacc tgacaccacc 300
aggctgtacg actttaacag ctactggcgg gtgcacgccg gcaatttcag caccattcct 360
cagtacttca aggagaatgg ctacgtgaca atgtccgtgg gcaaggtgtt tcatcccggc 420
attagctcca accacaccga cgatagccca tactcctggt ccttcccccc ctaccatccc 480
tccagcgaga agtacgagaa caccaaaacc tgcagaggcc ctgacggaga gctgcacgcc 540
aacctgctgt gccctgtgga tgtcctggat gtgcccgaag gtaagggttt aagggatggt 600
tggttggtgg ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc 660
aggcaccctg ccagacaagc agtccacaga gcaggccatc cagctgctgg agaagatgaa 720
gacaagcgcc agccccttct ttctggccgt gggataccac aagcctcaca ttccattccg 780
gtacccaaaa gagttccaga agctgtaccc tctggaaaac atcaccctgg cccctgaccc 840
cgaggtgcca gacgggctgc ctcctgtggc ctacaatccc tggatggaca tcagacagcg 900
ggaggatgtg caggccctga atatttccgt gccctatggg cccatccctg tggactttca 960
gcggaaaatc agacagtctt actttgccag cgtgtcctac ctggacaccc aggtgggccg 1020
cctgctctca gccctggacg acctgcagct ggccaattcc accatcatcg ccttcaccag 1080
cgatcacggc tgggccctgg gcgagcacgg ggagtgggcc aaatacagca acttcgatgt 1140
ggccacccac gtgcctctga ttttttatgt gcccggccgg acagccagcc tgcccgaggc 1200
cggggagaag ctctttcctt acctggaccc tttcgactct gccagccagc tgatggaacc 1260
tggcagacag agcatggacc tggtggagct ggtgagcctc ttccccactc tggccggcct 1320
ggctggcctg caggtgccac caagatgccc agtgccttct ttccacgtgg agctgtgtag 1380
agagggaaag aacctgctga agcacttcag atttagagat ctggaggagg atccctacct 1440
gccaggcaac ccaagggagc tgatcgccta cagccagtat cccagaccct ctgatatccc 1500
ccagtggaac agcgataagc cctccctgaa agacatcaag attatgggct actccatcag 1560
gaccattgac taccggtaca cagtgtgggt gggcttcaac cccgatgagt ttctggccaa 1620
cttcagcgac atccacgccg gcgagctgta ttttgtggac tccgaccccc tgcaggacca 1680
caacatgtac aacgactccc agggcggcga cctgttccag ctgctgatgc cctga 1735
<210> 82
<211> 2521
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 82
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgca actcacgggg atttccaagt ctccacccca 240
ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta 300
ataaccccgc cccgttgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa 360
gcagagctcg tttagtgaac cgtgccacca tgcccccacc caggaccgga agaggcctgc 420
tgtggctggg cctggtgctc tcttccgtgt gcgtggccct gggaagcgaa acccaggcca 480
acagcacaac cgacgccctg aatgtgctgc tgatcattgt ggacgatctg agaccctccc 540
tgggctgtta cggcgacaaa ctggtgcggt ccccaaacat cgaccagctg gcctcccact 600
ccctgctgtt ccagaacgcc ttcgcccagc aggccgtgtg tgcccccagc agggtgagct 660
tcctgaccgg cagaagacct gacaccacca ggctgtacga ctttaacagc tactggcggg 720
tgcacgccgg caatttcagc accattcctc agtacttcaa ggagaatggc tacgtgacaa 780
tgtccgtggg caaggtgttt catcccggca ttagctccaa ccacaccgac gatagcccat 840
actcctggtc cttccccccc taccatccct ccagcgagaa gtacgagaac accaaaacct 900
gcagaggccc tgacggagag ctgcacgcca acctgctgtg ccctgtggat gtcctggatg 960
tgcccgaagg taagggttta agggatggtt ggttggtggg gtattaatgt ttaattacct 1020
ggagcacctg cctgaaatca ctttttttca ggcaccctgc cagacaagca gtccacagag 1080
caggccatcc agctgctgga gaagatgaag acaagcgcca gccccttctt tctggccgtg 1140
ggataccaca agcctcacat tccattccgg tacccaaaag agttccagaa gctgtaccct 1200
ctggaaaaca tcaccctggc ccctgacccc gaggtgccag acgggctgcc tcctgtggcc 1260
tacaatccct ggatggacat cagacagcgg gaggatgtgc aggccctgaa tatttccgtg 1320
ccctatgggc ccatccctgt ggactttcag cggaaaatca gacagtctta ctttgccagc 1380
gtgtcctacc tggacaccca ggtgggccgc ctgctctcag ccctggacga cctgcagctg 1440
gccaattcca ccatcatcgc cttcaccagc gatcacggct gggccctggg cgagcacggg 1500
gagtgggcca aatacagcaa cttcgatgtg gccacccacg tgcctctgat tttttatgtg 1560
cccggccgga cagccagcct gcccgaggcc ggggagaagc tctttcctta cctggaccct 1620
ttcgactctg ccagccagct gatggaacct ggcagacaga gcatggacct ggtggagctg 1680
gtgagcctct tccccactct ggccggcctg gctggcctgc aggtgccacc aagatgccca 1740
gtgccttctt tccacgtgga gctgtgtaga gagggaaaga acctgctgaa gcacttcaga 1800
tttagagatc tggaggagga tccctacctg ccaggcaacc caagggagct gatcgcctac 1860
agccagtatc ccagaccctc tgatatcccc cagtggaaca gcgataagcc ctccctgaaa 1920
gacatcaaga ttatgggcta ctccatcagg accattgact accggtacac agtgtgggtg 1980
ggcttcaacc ccgatgagtt tctggccaac ttcagcgaca tccacgccgg cgagctgtat 2040
tttgtggact ccgaccccct gcaggaccac aacatgtaca acgactccca gggcggcgac 2100
ctgttccagc tgctgatgcc ctgagatcca gacatgataa gatacattga tgagtttgga 2160
caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt 2220
gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat 2280
tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aacctgcagg tctagatacg 2340
tagataagta gcatggcggg ttaatcatta actacaagga acccctagtg atggagttgg 2400
ccactccctc tctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 2460
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 2520
a 2521
<210> 83
<211> 3668
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 83
ttttcccaga gacaggctca gggacttctg ggtgtagtgg ctgtgcaggg cttcgtggag 60
cacgctgcag ctaaacacgt tgccctcttg ccatcggctc ttgtccacgg tcagccgtga 120
atacaggaag aagctgccat cgctgtccag cactggaggg gtcgtcttgt agttgttttc 180
aggctgtccg ttgctctccc attcgacggc gatgtcgctg gggtagaagc ccttcaccag 240
gcaggtcaga gacacttggt tctttgtcat ttcttcttga gaaggaggca gtgtatagac 300
ttggggctct ctgggctggc ccttggcctt tgagatggtc ttctcgatgc tgctaggcag 360
gcccttgtta gacaccttgc acttgtactc tttgccgttc agccagtcct ggtgcagcac 420
tgtcagcacg gacaccaccc ggtaggtgct gttaaactgt tcctcgcggg gtttggtctt 480
ggcattatga acttccactc cgtcaacgta ccaattaaac tgcacctcag gatcctcctg 540
ggacacatcc accaccacac atgtcacttc aggggtccgg ctgatcatca gggtgtcttt 600
gggctttggt gggaacagga aaacagaagg gccggcgact ggtggagctg gacatggtgg 660
gcattccacg cagcactttc tctcaacggt cttatccact ttggtgttgc taggcttgtg 720
gtccacatta caggtgtagg tctgtgtgcc gaagttggag ctaggaacgg tgaccacgct 780
actcagagaa tacaggccag agctctgcag cacggctggg aaggtgtgca cgccgcttgt 840
cagggcgccg ctgttccagc tcactgtcac gggttcgggg aagtagtctt tgaccagaca 900
acccagggcg gctgtgcttt cagatgtgct tctgctgcat ggggccagtg ggaacacgct 960
gggtccctta gtactggcgc tgctgacggt gacaagggtg ccttggcccc acacgtcgaa 1020
gtaccagtta ggggatgagc caaaaaagta tctggcgcag tagtacacag ctgtgtcctc 1080
gcttctcagg ctgctcagtt ccatgtacac ggtgcttgtg gaggtatctc tggtcatggt 1140
cactctatcc ttgaagttct ctgtgtactc ggtgtggcca gatcctggca ggatctcgcc 1200
catccattcc aggccttggc caggggcctg ccgcacccac tggatccagt agttgctgaa 1260
gatgtggccg ctggccttgc aggacacctt cacgctagct ccgggctttt tcacttcggc 1320
tccgctttga accagctgca cttggctgtg cacgcctgtg gcggtggcca ccaggaacag 1380
gatgatgcag gaccagccca tggtggcact agttcagttc caaaggttgg aatctaaaag 1440
agagaaacaa ttagaatcag tagtttaaca cattatacac ttaaaaattt tatatttacc 1500
ttagaggatt cactgtccca ggtcagtggt ggtgcctgaa gctgaggaga cagggccctg 1560
tcctcgtccg tatttaagca gtggatccag aggggcaacg ggggaggctg ctggtgaata 1620
ttaaccaagg tcaccccagt tatcggagga gcaaacaggg gctaagtcca ctggctggga 1680
tctgagtcgc ccgcctacgc tgcccggacg ctttgcctgg gcagtgtaca gcttccactg 1740
cacttaccga aaggagtcat tcccctctca cactacctaa accacgccag gacaacctct 1800
gctcctctcc accgaaattc caaggggtcg agtggatgtt ggaggtggca tgggcccaga 1860
gaggtctctg acctctgccc cagctccaag gtcagcaggc agggagggct gtgtgtttgc 1920
tgtttgctgc ttgcaatgtt tgcccatttt agggccgcgg cacgtgctta aggccccctt 1980
ttgcatccag tttattccta catttgtcac actgttaaca gcccacccct tccaatgaga 2040
ccagtggtat cagtgagttg tggagatcag gaaaagggct caagagaaag gcagtcaaag 2100
ccctttttct gtccctgtcc cagctgcttt aataagatct ccataagaga agagggacag 2160
ctatgactgg gagtagtcag gagaggagga aaaatctggc tagtaaaaca tgtaaggaaa 2220
attttaggga tgttaaagaa aaaaataaca caaaacaaaa tataaaaaaa atctaacctc 2280
aagtcaaggc ttttctatgg aataaggaat ggacagcagg gggctgtttc atatactgat 2340
gacctcttta tagccaacct ttgttcatgg cagccagcat atgggcatat gttgccaaac 2400
tctaaaccaa atactcattc tgatgtttta aatgatttgc cctcccatat gtccttccga 2460
gtgagagaca caaaaaattc caacacacta ttgcaatgaa aataaatttc ctttattagc 2520
cagaagtcag atgctcaagg ggcttcatga tgtccccata atttttggca gagggaaaaa 2580
gatctccgga gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg 2640
agcaaacagg ggctaagtcc acctcgagcc atggcgatgc tctaatctct ctagacaagg 2700
ttcatatttg tatgggttac ttattctctc tttgttgact aagtcaataa tcagaatcag 2760
caggtttgca gtcagattgg cagggataag cagcctagct caggagaagt gagtataaaa 2820
gccccaggct gggagcagcc atcagctagc gccggcaaga ggtaagggtt taagggatgg 2880
ttggttggtg gggtattaat gtttaattac ctggagcacc tgcctgaaat cacttttttt 2940
caggttggac cggtgccacc atggacatga gggtccctgc tcagctgctg gggctcctgc 3000
tgctctggct cagcggtgcc agatgtgata tccagatgac ccagtctcca tctagcctgt 3060
ccgccagcgt gggcgacaga gtgaccatca cctgcggcgc cagcgagaac atctatggcg 3120
ctctgaactg gtaccagcag aaacctggca aggcccctaa gctgctgatc tacggcgcca 3180
ccaacctggc cgatggcgtg cctagtagat tcagcggatc tggcagcggc acagacttca 3240
ccctgaccat cagcagcctg caacctgagg actttgccac atactactgc cagaacgtgc 3300
tgaatacacc tctgacattc ggccaaggaa ccaaagtgga aatcaagcgg accgtggccg 3360
ctcctagcgt gttcatcttc cctccttccg atgaacaact gaagagcgga accgcctctg 3420
tggtgtgcct gctgaacaac ttctacccta gagaggccaa ggtgcagtgg aaggtcgaca 3480
acgccctgca gagcggcaac agccaggaga gcgtgacgga acaggacagc aaggacagca 3540
cctacagcct gagctccacc cttacactgt ctaaagccga ctacgagaag cacaaggtgt 3600
acgcctgtga agtgacacac cagggcctga gcagccctgt gaccaagtct tttaaccggg 3660
gcgagtgc 3668
<210> 84
<211> 4483
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 84
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcaca cgtgacgcgt ccttgctgtc ctgccccacc ccacccccca 240
gaatagaatg acacctactc agacaatgcg atgcaatttc ctcattttat taggaaagga 300
cagtgggagt ggcaccttcc agggtcaagg aaggcacggg ggaggggcaa acaacagatg 360
gctggcaact agaaggcaca gcctcgagga acgttttatt ttcccagaga caggctcagg 420
gacttctggg tgtagtggct gtgcagggct tcgtggagca cgctgcagct aaacacgttg 480
ccctcttgcc atcggctctt gtccacggtc agccgtgaat acaggaagaa gctgccatcg 540
ctgtccagca ctggaggggt cgtcttgtag ttgttttcag gctgtccgtt gctctcccat 600
tcgacggcga tgtcgctggg gtagaagccc ttcaccaggc aggtcagaga cacttggttc 660
tttgtcattt cttcttgaga aggaggcagt gtatagactt ggggctctct gggctggccc 720
ttggcctttg agatggtctt ctcgatgctg ctaggcaggc ccttgttaga caccttgcac 780
ttgtactctt tgccgttcag ccagtcctgg tgcagcactg tcagcacgga caccacccgg 840
taggtgctgt taaactgttc ctcgcggggt ttggtcttgg cattatgaac ttccactccg 900
tcaacgtacc aattaaactg cacctcagga tcctcctggg acacatccac caccacacat 960
gtcacttcag gggtccggct gatcatcagg gtgtctttgg gctttggtgg gaacaggaaa 1020
acagaagggc cggcgactgg tggagctgga catggtgggc attccacgca gcactttctc 1080
tcaacggtct tatccacttt ggtgttgcta ggcttgtggt ccacattaca ggtgtaggtc 1140
tgtgtgccga agttggagct aggaacggtg accacgctac tcagagaata caggccagag 1200
ctctgcagca cggctgggaa ggtgtgcacg ccgcttgtca gggcgccgct gttccagctc 1260
actgtcacgg gttcggggaa gtagtctttg accagacaac ccagggcggc tgtgctttca 1320
gatgtgcttc tgctgcatgg ggccagtggg aacacgctgg gtcccttagt actggcgctg 1380
ctgacggtga caagggtgcc ttggccccac acgtcgaagt accagttagg ggatgagcca 1440
aaaaagtatc tggcgcagta gtacacagct gtgtcctcgc ttctcaggct gctcagttcc 1500
atgtacacgg tgcttgtgga ggtatctctg gtcatggtca ctctatcctt gaagttctct 1560
gtgtactcgg tgtggccaga tcctggcagg atctcgccca tccattccag gccttggcca 1620
ggggcctgcc gcacccactg gatccagtag ttgctgaaga tgtggccgct ggccttgcag 1680
gacaccttca cgctagctcc gggctttttc acttcggctc cgctttgaac cagctgcact 1740
tggctgtgca cgcctgtggc ggtggccacc aggaacagga tgatgcagga ccagcccatg 1800
gtggcactag ttcagttcca aaggttggaa tctaaaagag agaaacaatt agaatcagta 1860
gtttaacaca ttatacactt aaaaatttta tatttacctt agaggattca ctgtcccagg 1920
tcagtggtgg tgcctgaagc tgaggagaca gggccctgtc ctcgtccgta tttaagcagt 1980
ggatccagag gggcaacggg ggaggctgct ggtgaatatt aaccaaggtc accccagtta 2040
tcggaggagc aaacaggggc taagtccact ggctgggatc tgagtcgccc gcctacgctg 2100
cccggacgct ttgcctgggc agtgtacagc ttccactgca cttaccgaaa ggagtcattc 2160
ccctctcaca ctacctaaac cacgccagga caacctctgc tcctctccac cgaaattcca 2220
aggggtcgag tggatgttgg aggtggcatg ggcccagaga ggtctctgac ctctgcccca 2280
gctccaaggt cagcaggcag ggagggctgt gtgtttgctg tttgctgctt gcaatgtttg 2340
cccattttag ggccgcggca cgtgcttaag gccccctttt gcatccagtt tattcctaca 2400
tttgtcacac tgttaacagc ccaccccttc caatgagacc agtggtatca gtgagttgtg 2460
gagatcagga aaagggctca agagaaaggc agtcaaagcc ctttttctgt ccctgtccca 2520
gctgctttaa taagatctcc ataagagaag agggacagct atgactggga gtagtcagga 2580
gaggaggaaa aatctggcta gtaaaacatg taaggaaaat tttagggatg ttaaagaaaa 2640
aaataacaca aaacaaaata taaaaaaaat ctaacctcaa gtcaaggctt ttctatggaa 2700
taaggaatgg acagcagggg gctgtttcat atactgatga cctctttata gccaaccttt 2760
gttcatggca gccagcatat gggcatatgt tgccaaactc taaaccaaat actcattctg 2820
atgttttaaa tgatttgccc tcccatatgt ccttccgagt gagagacaca aaaaattcca 2880
acacactatt gcaatgaaaa taaatttcct ttattagcca gaagtcagat gctcaagggg 2940
cttcatgatg tccccataat ttttggcaga gggaaaaaga tctccggagg gggaggctgc 3000
tggtgaatat taaccaaggt caccccagtt atcggaggag caaacagggg ctaagtccac 3060
ctcgagccat ggcgatgctc taatctctct agacaaggtt catatttgta tgggttactt 3120
attctctctt tgttgactaa gtcaataatc agaatcagca ggtttgcagt cagattggca 3180
gggataagca gcctagctca ggagaagtga gtataaaagc cccaggctgg gagcagccat 3240
cagctagcgc cggcaagagg taagggttta agggatggtt ggttggtggg gtattaatgt 3300
ttaattacct ggagcacctg cctgaaatca ctttttttca ggttggaccg gtgccaccat 3360
ggacatgagg gtccctgctc agctgctggg gctcctgctg ctctggctca gcggtgccag 3420
atgtgatatc cagatgaccc agtctccatc tagcctgtcc gccagcgtgg gcgacagagt 3480
gaccatcacc tgcggcgcca gcgagaacat ctatggcgct ctgaactggt accagcagaa 3540
acctggcaag gcccctaagc tgctgatcta cggcgccacc aacctggccg atggcgtgcc 3600
tagtagattc agcggatctg gcagcggcac agacttcacc ctgaccatca gcagcctgca 3660
acctgaggac tttgccacat actactgcca gaacgtgctg aatacacctc tgacattcgg 3720
ccaaggaacc aaagtggaaa tcaagcggac cgtggccgct cctagcgtgt tcatcttccc 3780
tccttccgat gaacaactga agagcggaac cgcctctgtg gtgtgcctgc tgaacaactt 3840
ctaccctaga gaggccaagg tgcagtggaa ggtcgacaac gccctgcaga gcggcaacag 3900
ccaggagagc gtgacggaac aggacagcaa ggacagcacc tacagcctga gctccaccct 3960
tacactgtct aaagccgact acgagaagca caaggtgtac gcctgtgaag tgacacacca 4020
gggcctgagc agccctgtga ccaagtcttt taaccggggc gagtgctgaa ttcgaatcgt 4080
acctagggat ccagacatga taagatacat tgatgagttt ggacaaacca caactagaat 4140
gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat 4200
tataagctgc aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca 4260
gggggaggtg tgggaggttt tttaagcttg tttaaacgta cgtagataag tagcatggcg 4320
ggttaatcat taactacaag gaacccctag tgatggagtt ggccactccc tctctgcgcg 4380
ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg 4440
cggcctcagt gagcgagcga gcgcgcagag agggagtggc caa 4483
<210> 85
<211> 3533
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 85
gcttcaggag cagttgtgcg aatagctgga gaacaccagg ctggatttaa acccagatcg 60
ctcttacatt tgctctttac ctgctgtgct cagcgttcac gtgccctcta gctgtagttt 120
tctgaagtca gcgcacagca aggcagtgtg cttagaggtt aacagaaggg aaaacaacaa 180
caacaaaaat ctaaatgaga atcctgactg tttcagctgg gggtaagggg ggcggattat 240
tcatataatt gttataccag acggtcgcag gcttagtcca attgcagaga actcgcttcc 300
caggcttctg agagtcccgg aagtgcctaa acctgtctaa tcgacggggc ttgggtggcc 360
cgtcgctccc tggcttcttc cctttaccca gggcgggcag cgaagtggtg cctcctgcgt 420
cccccacacc ctccctcagc ccctcccctc cggcccgtcc tgggcaggtg acctggagca 480
tccggcaggc tgccctggcc tcctgcgtca ggacaacgcc cacgaggggc gttactgtgc 540
ggagatgcac cacgcaagag acaccctttg taactctctt ctcctcccta gtgcgaggtt 600
aaaaccttca gccccacgtg ctgtttgcaa acctgcctgt acctgaggcc ctaaaaagcc 660
agagacctca ctcccgggga gccagcatgt ccactgcggt cctggaaaac ccaggcttgg 720
gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 780
gaatttgggc ctccagagaa agagatctga agactgctgg tgcttcctgg tttcataagc 840
tcagtaagaa gtctgaattc gttggaagct gatgagaata tccaggaagt caacagacaa 900
atgtcctcaa caattgtttc taagtaggag aacatctgtc ctcggtggct ttcacaggaa 960
aagcttctga cctcttctct tcctcccaca gggcggtacc agatctggca gcggagaggg 1020
cagaggaagt cttctaacat gcggtgacgt ggaggagaat cccggccctt ccaccgctgt 1080
gctggagaac cctgggctgg ggaggaaact gtcagacttc gggcaggaga cttcatacat 1140
tgaggataac tgtaaccaga atggcgccat ctctctgatc ttcagcctga aggaggaagt 1200
gggcgccctg gcaaaggtgc tgcgcctgtt tgaggagaac gacgtgaatc tgacccacat 1260
cgagtcccgg ccttctagac tgaagaagga cgagtacgag ttctttaccc acctggataa 1320
gcggtccctg ccagccctga caaacatcat caagatcctg aggcacgaca tcggagcaac 1380
cgtgcacgag ctgtctcggg acaagaagaa ggataccgtg ccctggttcc ctcggacaat 1440
ccaggagctg gatagatttg ccaaccagat cctgtcttac ggagcagagc tggacgcaga 1500
tcaccctggc ttcaaggacc cagtgtatcg ggcccggaga aagcagtttg ccgatatcgc 1560
ctacaattat aggcacggac agccaatccc tcgcgtggag tatatggagg aggagaagaa 1620
gacctggggc acagtgttca agaccctgaa gagcctgtac aagacacacg cctgctacga 1680
gtataaccac atcttccccc tgctggagaa gtattgtggc tttcacgagg acaatatccc 1740
tcagctggag gacgtgagcc agttcctgca gacctgcaca ggctttaggc tgaggccagt 1800
ggcaggactg ctgagctccc gggacttcct gggaggactg gccttcagag tgtttcactg 1860
cacccagtac atcaggcacg gctccaagcc aatgtataca ccagagcccg acatctgtca 1920
cgagctgctg ggccacgtgc ccctgtttag cgatagatcc ttcgcccagt tttcccagga 1980
gatcggactg gcatctctgg gagcacctga cgagtacatc gagaagctgg ccaccatcta 2040
ttggttcaca gtggagtttg gcctgtgcaa gcagggcgat agcatcaagg cctacggagc 2100
aggactgctg tctagcttcg gcgagctgca gtattgtctg tccgagaagc caaagctgct 2160
gcccctggag ctggagaaga ccgccatcca gaactacacc gtgacagagt tccagcccct 2220
gtactatgtg gccgagtctt ttaacgatgc caaggagaag gtgagaaatt tcgccgccac 2280
aatccctagg cccttcagcg tgcggtacga cccttatacc cagaggatcg aggtgctgga 2340
taatacacag cagctgaaga tcctggctga ctcaatcaat agcgaaatcg gaatcctgtg 2400
ctccgccctg cagaaaatca aatgagatcc agacatgata agatacattg atgagtttgg 2460
acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat 2520
tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca 2580
ttttatgttt caggttcagg gggaggtgtg ggaggttttt taactgggat gggatgtgga 2640
atccttctag atttcttttg taatatttat aaagtgctct cagcaaggta tcaaaatggc 2700
aaaattgtga gtaactatcc tcctttcatt ttgggaagaa gatgaggcat gaagagaatt 2760
cagacagaaa cttactcaga ccaggggagg cagaaactaa gcagagagga aaatgaccaa 2820
gagttagccc tgggcatgga atgtgaaaga accctaaacg tgacttggaa ataatgccca 2880
aggtatattc cattctccgg gatttgttgg cattttcttg aggtgaagaa ttgcagaata 2940
cattctttaa tgtgacctac atatttaccc atgggaggaa gtctgctcct ggactcttga 3000
gattcagtca taaagcccag gccagggaaa taatgtaagt ctgcaggccc ctgtcatcag 3060
taggattagg gagaagagtt ctcagtagaa aacagggagg ctggagagaa aagaatggtt 3120
aatgttaacg ttaatataac tagaaagact gcagaactta ggactgattt ttatttgaat 3180
ccttaaaaaa aaaatttctt atgaaaatag tacatggctc ttaggagaca gaacttattg 3240
tacagaggaa cagcgtgaga gtcagagtga tcccagaaca ggtcctggct ccatcctgca 3300
catagttttg gtgctgctgg caatacggtc cccacaactg tgggaagggg ttaggggcag 3360
ggatctcatc aggaaagcat aggggtttaa agttctttat agagcactta gaagattgag 3420
aatccacaaa ttatattaat aacaaacaaa gtagtgtcgt gttatatagt aaatgtgaat 3480
ttgcagacac atttagggaa aagttataat taaaaaaata ggctgtatat ata 3533
<210> 86
<211> 4061
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 86
tgcggccgct tcaggagcag ttgtgcgaat agctggagaa caccaggctg gatttaaacc 60
cagatcgctc ttacatttgc tctttacctg ctgtgctcag cgttcacgtg ccctctagct 120
gtagttttct gaagtcagcg cacagcaagg cagtgtgctt agaggttaac agaagggaaa 180
acaacaacaa caaaaatcta aatgagaatc ctgactgttt cagctggggg taaggggggc 240
ggattattca tataattgtt ataccagacg gtcgcaggct tagtccaatt gcagagaact 300
cgcttcccag gcttctgaga gtcccggaag tgcctaaacc tgtctaatcg acggggcttg 360
ggtggcccgt cgctccctgg cttcttccct ttacccaggg cgggcagcga agtggtgcct 420
cctgcgtccc ccacaccctc cctcagcccc tcccctccgg cccgtcctgg gcaggtgacc 480
tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga caacgcccac gaggggcgtt 540
actgtgcgga gatgcaccac gcaagagaca ccctttgtaa ctctcttctc ctccctagtg 600
cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc tgcctgtacc tgaggcccta 660
aaaagccaga gacctcactc ccggggagcc agcatgtcca ctgcggtcct ggaaaaccca 720
ggcttgggca ggaaactctc tgactttgga caggtgagcc acggcagcct gagctgctca 780
gttaggggaa tttgggcctc cagagaaaga gatctgaaga ctgctggtgc ttcctggttt 840
cataagctca gtaagaagtc tgaattcgtt ggaagctgat gagaatatcc aggaagtcaa 900
cagacaaatg tcctcaacaa ttgtttctaa gtaggagaac atctgtcctc ggtggctttc 960
acaggaaccc taaaatgggc aaacattgca agcagcaaac agcaaacaca cagccctccc 1020
tgcctgctga ccttggagct ggggcagagg tcagagacct ctctgggccc atgccacctc 1080
caacatccac tcgacccctt ggaatttcgg tggagaggag cagaggttgt cctggcgtgg 1140
tttaggtagt gtgagagggg aatgactcct ttcggtaagt gcagtggaag ctgtacactg 1200
cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1260
cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1320
ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagggccct gtctcctcag 1380
cttcaggcac caccactgac ctgggacagt gaatcctcta aggtaaatat aaaattttta 1440
agtgtataat gtgttaaact actgattcta attgtttctc tcttttagat tccaaccttt 1500
ggaactgacc gccaccatgt ccaccgctgt gctggagaac cctgggctgg ggaggaaact 1560
gtcagacttc gggcaggaga cttcatacat tgaggataac tgtaaccaga atggcgccat 1620
ctctctgatc ttcagcctga aggaggaagt gggcgccctg gcaaaggtgc tgcgcctgtt 1680
tgaggagaac gacgtgaatc tgacccacat cgagtcccgg ccttctagac tgaagaagga 1740
cgagtacgag ttctttaccc acctggataa gcggtccctg ccagccctga caaacatcat 1800
caagatcctg aggcacgaca tcggagcaac cgtgcacgag ctgtctcggg acaagaagaa 1860
ggataccgtg ccctggttcc ctcggacaat ccaggagctg gatagatttg ccaaccagat 1920
cctgtcttac ggagcagagc tggacgcaga tcaccctggc ttcaaggacc cagtgtatcg 1980
ggcccggaga aagcagtttg ccgatatcgc ctacaattat aggcacggac agccaatccc 2040
tcgcgtggag tatatggagg aggagaagaa gacctggggc acagtgttca agaccctgaa 2100
gagcctgtac aagacacacg cctgctacga gtataaccac atcttccccc tgctggagaa 2160
gtattgtggc tttcacgagg acaatatccc tcagctggag gacgtgagcc agttcctgca 2220
gacctgcaca ggctttaggc tgaggccagt ggcaggactg ctgagctccc gggacttcct 2280
gggaggactg gccttcagag tgtttcactg cacccagtac atcaggcacg gctccaagcc 2340
aatgtataca ccagagcccg acatctgtca cgagctgctg ggccacgtgc ccctgtttag 2400
cgatagatcc ttcgcccagt tttcccagga gatcggactg gcatctctgg gagcacctga 2460
cgagtacatc gagaagctgg ccaccatcta ttggttcaca gtggagtttg gcctgtgcaa 2520
gcagggcgat agcatcaagg cctacggagc aggactgctg tctagcttcg gcgagctgca 2580
gtattgtctg tccgagaagc caaagctgct gcccctggag ctggagaaga ccgccatcca 2640
gaactacacc gtgacagagt tccagcccct gtactatgtg gccgagtctt ttaacgatgc 2700
caaggagaag gtgagaaatt tcgccgccac aatccctagg cccttcagtg tgcgttacga 2760
cccttatacc cagaggatcg aggtgctgga taatacacag cagctgaaga tcctggctga 2820
ctcaatcaat agcgaaatcg gaatcctgtg ctccgccctg cagaaaatca aatgagaatt 2880
caaggcctct cgagcctcta gaactatagt gagtcgtatt acgtagatcc agacatgata 2940
agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 3000
tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 3060
aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 3120
taagctttac gtacgatcgt cgactgggat gggatgtgga atccttctag atttcttttg 3180
taatatttat aaagtgctct cagcaaggta tcaaaatggc aaaattgtga gtaactatcc 3240
tcctttcatt ttgggaagaa gatgaggcat gaagagaatt cagacagaaa cttactcaga 3300
ccaggggagg cagaaactaa gcagagagga aaatgaccaa gagttagccc tgggcatgga 3360
atgtgaaaga accctaaacg tgacttggaa ataatgccca aggtatattc cattctccgg 3420
gatttgttgg cattttcttg aggtgaagaa ttgcagaata cattctttaa tgtgacctac 3480
atatttaccc atgggaggaa gtctgctcct ggactcttga gattcagtca taaagcccag 3540
gccagggaaa taatgtaagt ctgcaggccc ctgtcatcag taggattagg gagaagagtt 3600
ctcagtagaa aacagggagg ctggagagaa aagaatggtt aatgttaacg ttaatataac 3660
tagaaagact gcagaactta ggactgattt ttatttgaat ccttaaaaaa aaaatttctt 3720
atgaaaatag tacatggctc ttaggagaca gaacttattg tacagaggaa cagcgtgaga 3780
gtcagagtga tcccagaaca ggtcctggct ccatcctgca catagttttg gtgctgctgg 3840
caatacggtc cccacaactg tgggaagggg ttaggggcag ggatctcatc aggaaagcat 3900
aggggtttaa agttctttat agagcactta gaagattgag aatccacaaa ttatattaat 3960
aacaaacaaa gtagtgtcgt gttatatagt aaatgtgaat ttgcagacac atttagggaa 4020
aagttataat taaaaaaata ggctgtatat atacctgcag g 4061
<210> 87
<211> 2141
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 87
gcggccgcaa ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 60
tttggcacca aaatcaacgg gactttccaa aatgtcgtaa taaccccgcc ccgttgacgc 120
aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctcgt ttagtgaacc 180
gtgccaccat gcccccaccc aggaccggaa gaggcctgct gtggctgggc ctggtgctct 240
cttccgtgtg cgtggccctg ggaagcgaaa cccaggccaa cagcacaacc gacgccctga 300
atgtgctgct gatcattgtg gacgatctga gaccctccct gggctgttac ggcgacaaac 360
tggtgcggtc cccaaacatc gaccagctgg cctcccactc cctgctgttc cagaacgcct 420
tcgcccagca ggccgtgtgt gcccccagca gggtgagctt cctgaccggc agaagacctg 480
acaccaccag gctgtacgac tttaacagct actggcgggt gcacgccggc aatttcagca 540
ccattcctca gtacttcaag gagaatggct acgtgacaat gtccgtgggc aaggtgtttc 600
atcccggcat tagctccaac cacaccgacg atagcccata ctcctggtcc ttccccccct 660
accatccctc cagcgagaag tacgagaaca ccaaaacctg cagaggccct gacggagagc 720
tgcacgccaa cctgctgtgc cctgtggatg tcctggatgt gcccgaaggt aagggtttaa 780
gggatggttg gttggtgggg tattaatgtt taattacctg gagcacctgc ctgaaatcac 840
tttttttcag gcaccctgcc agacaagcag tccacagagc aggccatcca gctgctggag 900
aagatgaaga caagcgccag ccccttcttt ctggccgtgg gataccacaa gcctcacatt 960
ccattccggt acccaaaaga gttccagaag ctgtaccctc tggaaaacat caccctggcc 1020
cctgaccccg aggtgccaga cgggctgcct cctgtggcct acaatccctg gatggacatc 1080
agacagcggg aggatgtgca ggccctgaat atttccgtgc cctatgggcc catccctgtg 1140
gactttcagc ggaaaatcag acagtcttac tttgccagcg tgtcctacct ggacacccag 1200
gtgggccgcc tgctctcagc cctggacgac ctgcagctgg ccaattccac catcatcgcc 1260
ttcaccagcg atcacggctg ggccctgggc gagcacgggg agtgggccaa atacagcaac 1320
ttcgatgtgg ccacccacgt gcctctgatt ttttatgtgc ccggccggac agccagcctg 1380
cccgaggccg gggagaagct ctttccttac ctggaccctt tcgactctgc cagccagctg 1440
atggaacctg gcagacagag catggacctg gtggagctgg tgagcctctt ccccactctg 1500
gccggcctgg ctggcctgca ggtgccacca agatgcccag tgccttcttt ccacgtggag 1560
ctgtgtagag agggaaagaa cctgctgaag cacttcagat ttagagatct ggaggaggat 1620
ccctacctgc caggcaaccc aagggagctg atcgcctaca gccagtatcc cagaccctct 1680
gatatccccc agtggaacag cgataagccc tccctgaaag acatcaagat tatgggctac 1740
tccatcagga ccattgacta ccggtacaca gtgtgggtgg gcttcaaccc cgatgagttt 1800
ctggccaact tcagcgacat ccacgccggc gagctgtatt ttgtggactc cgaccccctg 1860
caggaccaca acatgtacaa cgactcccag ggcggcgacc tgttccagct gctgatgccc 1920
tgagatccag acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag 1980
tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata 2040
agctgcaata aacaagttaa caacaacaat tgcattcatt ttatgtttca ggttcagggg 2100
gaggtgtggg aggtttttta acctgcaggt ctagatacgt a 2141
<210> 88
<211> 2042
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 88
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360
ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 420
caccaccact gacctgggac agtgaatcct ctaaggtaaa tataaaattt ttaagtgtat 480
aatgtgttaa actactgatt ctaattgttt ctctctttta gattccaacc tttggaactg 540
accgccacca tgtccaccgc tgtgctggag aaccctgggc tggggaggaa actgtcagac 600
ttcgggcagg agacttcata cattgaggat aactgtaacc agaatggcgc catctctctg 660
atcttcagcc tgaaggagga agtgggcgcc ctggcaaagg tgctgcgcct gtttgaggag 720
aacgacgtga atctgaccca catcgagtcc cggccttcta gactgaagaa ggacgagtac 780
gagttcttta cccacctgga taagcggtcc ctgccagccc tgacaaacat catcaagatc 840
ctgaggcacg acatcggagc aaccgtgcac gagctgtctc gggacaagaa gaaggatacc 900
gtgccctggt tccctcggac aatccaggag ctggatagat ttgccaacca gatcctgtct 960
tacggagcag agctggacgc agatcaccct ggcttcaagg acccagtgta tcgggcccgg 1020
agaaagcagt ttgccgatat cgcctacaat tataggcacg gacagccaat ccctcgcgtg 1080
gagtatatgg aggaggagaa gaagacctgg ggcacagtgt tcaagaccct gaagagcctg 1140
tacaagacac acgcctgcta cgagtataac cacatcttcc ccctgctgga gaagtattgt 1200
ggctttcacg aggacaatat ccctcagctg gaggacgtga gccagttcct gcagacctgc 1260
acaggcttta ggctgaggcc agtggcagga ctgctgagct cccgggactt cctgggagga 1320
ctggccttca gagtgtttca ctgcacccag tacatcaggc acggctccaa gccaatgtat 1380
acaccagagc ccgacatctg tcacgagctg ctgggccacg tgcccctgtt tagcgataga 1440
tccttcgccc agttttccca ggagatcgga ctggcatctc tgggagcacc tgacgagtac 1500
atcgagaagc tggccaccat ctattggttc acagtggagt ttggcctgtg caagcagggc 1560
gatagcatca aggcctacgg agcaggactg ctgtctagct tcggcgagct gcagtattgt 1620
ctgtccgaga agccaaagct gctgcccctg gagctggaga agaccgccat ccagaactac 1680
accgtgacag agttccagcc cctgtactat gtggccgagt cttttaacga tgccaaggag 1740
aaggtgagaa atttcgccgc cacaatccct aggcccttca gcgtgcggta cgacccttat 1800
acccagagga tcgaggtgct ggataataca cagcagctga agatcctggc tgactcaatc 1860
aatagcgaaa tcggaatcct gtgctccgcc ctgcagaaaa tcaaatgaat gctttatttg 1920
tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa 1980
caacaacaat tgcattcatt ttatgtttca ggttcagggg gaggtgtggg aggtttttta 2040
aa 2042
<210> 89
<211> 720
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 89
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720
<210> 90
<211> 2162
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 90
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgcata tgcggccgca cgcgtggtac ctctggtcgt tacataactt 240
acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaataatg 300
acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg ggtggagtat 360
ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag tacgccccct 420
attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat gaccttatgg 480
gactttccta cttggcagta catctactcg aggccacgtt ctgcttcact ctccccatct 540
cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 600
tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 660
gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 720
cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 780
gagcgggatc agccaccgcg gtggcggcct agagtcgacg aggaactgaa aaaccagaaa 840
gttaactggt aagtttagtc tttttgtctt ttatttcagg tcccggatcc ggtggtggtg 900
caaatcaaag aactgctcct cagtggatgt tgcctttact tctaggcctg tacggaagtg 960
ttacttctgc tctaaaagct gcggaattgt acccgcggcc gatccaccgg tcgccaccat 1020
ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg 1080
cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg 1140
caagctgacc ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct 1200
cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca 1260
gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt 1320
caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt 1380
gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa 1440
gctggagtac aactacaaca gccacaacgt ctatatcatg gccgacaagc agaagaacgg 1500
catcaaggtg aacttcaaga tccgccacaa catcgaggac ggcagcgtgc agctcgccga 1560
ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta 1620
cctgagcacc cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct 1680
gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagtaaag 1740
cggccatcaa gcttatcgat accgtcgact agagctcgct gatcagcctc gactgtgcct 1800
tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 1860
gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 1920
tgtcattcta ttctgggggg tggggtgggg caggacagca aggcctgcag gtctagatac 1980
gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 2040
gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 2100
cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc 2160
aa 2162
<210> 91
<211> 2208
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 腺相关病毒2
<400> 91
ttacagatta cgagtcaggt atctggtgcc aatggggcga ggctctgaat acacgccatt 60
agtgtccaca gtaaagtcca cattaacaga cttgttgtag ttggaagtgt actgaatttc 120
gggattccag cgtttgctgt tttccttctg cagctcccac tcgatctcca cgctgacctg 180
tcccgtggag tactgtgtga tgaaggaagc aaactttgcc gcactgaagg tggtcgaagg 240
attcgcaggt accggggtgt tcttgatgag aatctgtgga ggagggtgtt taagtccgaa 300
tccacccatg aggggagagg ggtgaaaatg tccgtccgtg tgtggaatct ttgcccagat 360
gggcccctga aggtacacat ctctgtcctg ccagaccatg cctggaagaa cgccttgtgt 420
gttgacatct gcggtagctg cttgtctgtt gcctctctgg aggttggtag atacagaacc 480
atactgctcc gtagccacgg gattggttgt cctgatttcc tcttcgtctg taatcatgac 540
cttttcaatg tccacatttg ttttctctga gccttgcttc ccaaagatga gaaccccgct 600
ctgaggaaaa aacttttctt catcgtcctt gtggcttgcc atggccgggc ccggattcac 660
cagagagtct ctgccattga ggtggtactt ggtagctcca gtccacgagt attcactgtt 720
gttgttatcc gcagatgtct ttgatactcg ctgctggcgg taacagggtc caggaagcca 780
gttcctagac tggtcccgaa tgtcactcgc tccggcctga gaaaactgaa gccttgactg 840
cgtggtggtt ccacttggag tgtttgttct gctcaagtaa tacaggtact ggtcgatgag 900
aggattcatg agacggtcca gactctggct gtgagcgtag ctgctgtgga aaggaacgtc 960
ctcaaaagtg tagctgaagg taaagttgtt tccggtacgc agcatctgag aaggaaagta 1020
ctccaggcag taaaatgaag agcgtcctac tgcctgactc ccgttgttca gggtgaggta 1080
tccatactgt ggcaccatga agacgtctgc tgggaacggc gggaggcatc cttgatgcgc 1140
cgagccgagg acgtacggga gctggtactc cgagtcagta aacacctgaa ccgtgctggt 1200
aaggttattg gcaatcgtcg tcgtaccgtc attctgcgtg acctctttga cttgaatgtt 1260
aaagagcttg aagttgagtc tcttgggtcg gaatccccag ttgttgttga tgagtctttg 1320
ccagtcacgt ggtgaaaagt ggcagtggaa tctgttgaag tcaaaatacc cccaaggggt 1380
gctgtagcca aagtagtgat tgtcgttcga ggctcctgat tggctggaaa tttgtttgta 1440
gaggtggttg ttgtaggtgg gcagggccca ggttcgggtg ctggtggtga tgactctgtc 1500
gcccatccat gtggaatcgc aatgccaatt tcccgaggaa ttacccactc cgtcggcgcc 1560
ctcgttattg tctgccattg gtgcgccact gcctgtagcc atcgtattag ttcccagacc 1620
agagggggct gctggtggct gtccgagagg ctgggggtca ggtactgagt ctgcgtctcc 1680
agtctgacca aaattcaatc tttttcttgc aggctgctgg cccgcctttc cggttcccga 1740
ggaggagtct ggctccacag gagagtgctc taccggcctc ttttttcccg gagccgtctt 1800
aacaggttcc tcaaccaggc ccagaggttc aagaaccctc tttttcgcct ggaagactgc 1860
tcgtccgagg ttgcccccaa aagacgtatc ttctttaagg cgctcctgaa actccgcgtc 1920
ggcgtggttg tacttgaggt acgggttgtc tccgctgtcg agctgccggt cgtaggcttt 1980
gtcgtgctcg agggccgcgg cgtctgcctc gttgaccggc tctcccttgt cgagtccgtt 2040
gaagggtccg aggtacttgt acccaggaag cacaagaccc ctgctgtcgt ccttatgccg 2100
ctctgcgggc tttggtggtg gtgggccagg tttgagcttc caccactgtc ttattccttc 2160
agagagagtg tcctcgagcc aatctggaag ataaccatcg gcagccat 2208
<210> 92
<211> 4219
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 92
ttacagatta cgagtcaggt atctggtgcc aatggggcga ggctctgaat acacgccatt 60
agtgtccaca gtaaagtcca cattaacaga cttgttgtag ttggaagtgt actgaatttc 120
gggattccag cgtttgctgt tttccttctg cagctcccac tcgatctcca cgctgacctg 180
tcccgtggag tactgtgtga tgaaggaagc aaactttgcc gcactgaagg tggtcgaagg 240
attcgcaggt accggggtgt tcttgatgag aatctgtgga ggagggtgtt taagtccgaa 300
tccacccatg aggggagagg ggtgaaaatg tccgtccgtg tgtggaatct ttgcccagat 360
gggcccctga aggtacacat ctctgtcctg ccagaccatg cctggaagaa cgccttgtgt 420
gttgacatct gcggtagctg cttgtctgtt gcctctctgg aggttggtag atacagaacc 480
atactgctcc gtagccacgg gattggttgt cctgatttcc tcttcgtctg taatcatgac 540
cttttcaatg tccacatttg ttttctctga gccttgcttc ccaaagatga gaaccccgct 600
ctgaggaaaa aacttttctt catcgtcctt gtggcttgcc atggccgggc ccggattcac 660
cagagagtct ctgccattga ggtggtactt ggtagctcca gtccacgagt attcactgtt 720
gttgttatcc gcagatgtct ttgatactcg ctgctggcgg taacagggtc caggaagcca 780
gttcctagac tggtcccgaa tgtcactcgc tccggcctga gaaaactgaa gccttgactg 840
cgtggtggtt ccacttggag tgtttgttct gctcaagtaa tacaggtact ggtcgatgag 900
aggattcatg agacggtcca gactctggct gtgagcgtag ctgctgtgga aaggaacgtc 960
ctcaaaagtg tagctgaagg taaagttgtt tccggtacgc agcatctgag aaggaaagta 1020
ctccaggcag taaaatgaag agcgtcctac tgcctgactc ccgttgttca gggtgaggta 1080
tccatactgt ggcaccatga agacgtctgc tgggaacggc gggaggcatc cttgatgcgc 1140
cgagccgagg acgtacggga gctggtactc cgagtcagta aacacctgaa ccgtgctggt 1200
aaggttattg gcaatcgtcg tcgtaccgtc attctgcgtg acctctttga cttgaatgtt 1260
aaagagcttg aagttgagtc tcttgggtcg gaatccccag ttgttgttga tgagtctttg 1320
ccagtcacgt ggtgaaaagt ggcagtggaa tctgttgaag tcaaaatacc cccaaggggt 1380
gctgtagcca aagtagtgat tgtcgttcga ggctcctgat tggctggaaa tttgtttgta 1440
gaggtggttg ttgtaggtgg gcagggccca ggttcgggtg ctggtggtga tgactctgtc 1500
gcccatccat gtggaatcgc aatgccaatt tcccgaggaa ttacccactc cgtcggcgcc 1560
ctcgttattg tctgccattg gtgcgccact gcctgtagcc atcgtattag ttcccagacc 1620
agagggggct gctggtggct gtccgagagg ctgggggtca ggtactgagt ctgcgtctcc 1680
agtctgacca aaattcaatc tttttcttgc aggctgctgg cccgcctttc cggttcccga 1740
ggaggagtct ggctccacag gagagtgctc taccggcctc ttttttcccg gagccgtctt 1800
aacaggttcc tcaaccaggc ccagaggttc aagaaccctc tttttcgcct ggaagactgc 1860
tcgtccgagg ttgcccccaa aagacgtatc ttctttaagg cgctcctgaa actccgcgtc 1920
ggcgtggttg tacttgaggt acgggttgtc tccgctgtcg agctgccggt cgtaggcttt 1980
gtcgtgctcg agggccgcgg cgtctgcctc gttgaccggc tctcccttgt cgagtccgtt 2040
gaagggtccg aggtacttgt acccaggaag cacaagaccc ctgctgtcgt ccttatgccg 2100
ctctgcgggc tttggtggtg gtgggccagg tttgagcttc caccactgtc ttattccttc 2160
agagagagtg tcctcgagcc aatctggaag ataaccatcg gcagccatac ctggtttaag 2220
tcatttattg ttcaaagatg cagtcatcca aatccacatt gaccagatcg caggcagtgc 2280
aagcgtctgg cacctttccc atgatatgat gaatgtagca cagtttctga tacgcctttt 2340
tgacgacaga aacgggttga gattctgaca cgggaaagca ctctaaacag tctttctgtc 2400
cgtgagtgaa gcagatattt gaattctgat tcattctctc gcattgtctg cagggaaaca 2460
gcatcagatt catgcccacg tgacgagaac atttgttttg gtacctgtct gcgtagttga 2520
tcgaagcttc cgcgtctgac gtcgatggct gcgcaactga ctcgcgcacc cgtttgggct 2580
cacttatatc tgcgtcactg ggggcgggtc ttttcttggc tccacccttt ttgacgtaga 2640
attcatgctc cacctcaacc acgtgatcct ttgcccaccg gaaaaagtct ttgacttcct 2700
gcttggtgac cttcccaaag tcatgatcca gacggcgggt gagttcaaat ttgaacatcc 2760
ggtcttgcaa cggctgctgg tgttcgaagg tcgttgagtt cccgtcaatc acggcgcaca 2820
tgttggtgtt ggaggtgacg atcacgggag tcgggtctat ctgggccgag gacttgcatt 2880
tctggtccac gcgcaccttg cttcctccga gaatggcttt ggccgactcc acgaccttgg 2940
cggtcatctt cccctcctcc caccagatca ccatcttgtc gacacagtcg ttgaagggaa 3000
agttctcatt ggtccagttt acgcacccgt agaagggcac agtgtgggct atggcctccg 3060
cgatgttggt cttcccggta gttgcaggcc caaacagcca gatggtgttc ctcttgccga 3120
actttttcgt ggcccatccc agaaagacgg aagccgcata ttggggatcg tacccgttta 3180
gttccaaaat tttataaatc cgattgctgg aaatgtcctc cacgggctgc tggcccacca 3240
ggtagtcggg ggcggtttta gtcaggctca taatctttcc cgcattgtcc aaggcagcct 3300
tgatttggga ccgcgagttg gaggccgcat tgaaggagat gtatgaggcc tggtcctcct 3360
ggatccactg cttctccgag gtaatcccct tgtccacgag ccacccgacc agctccatgt 3420
acctggctga agtttttgat ctgatcaccg gcgcatcaga attgggattc tgattctctt 3480
tgttctgctc ctgcgtctgc gacacgtgcg tcagatgctg cgccaccaac cgtttacgct 3540
ccgtgagatt caaacaggcg cttaaatact gttccatatt agtccacgcc cactggagct 3600
caggctgggt tttggggagc aagtaattgg ggatgtagca ctcatccacc accttgttcc 3660
cgcctccggc gccatttctg gtctttgtga ccgcgaacca gtttggcaaa gtcggctcga 3720
tcccgcggta aattctctga atcagttttt cgcgaatctg actcaggaaa cgtcccaaaa 3780
ccatggattt caccccggtg gtttccacga gcacgtgcat gtggaagtag ctctctccct 3840
tctcaaattg cacaaagaaa agggcctccg gggccttact cacacggcgc cattccgtca 3900
gaaagtcgcg ctgcagcttc tcggccacgg tcaggggtgc ctgctcaatc agattcagat 3960
ccatgtcaga atctggcggc aactcccatt ccttctcggc cacccagttc acaaagctgt 4020
cagaaatgcc gggcagatgc tcgtcaaggt cgctggggac cttaatcaca atctcgtaaa 4080
accccggcat ggcggctgcg cgttcaaacc tcccgcttca aaatggagac cctgcgtgct 4140
cactcgggct taaataccca gcgtgaccac atggtgtcgc aaaatgtcgc aaaacactca 4200
cgtgacctct aatacagga 4219
<210> 93
<211> 2211
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 93
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acttgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcatcggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg atccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgcacctg ggccttgccc acctacaata accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg atttcaacag attccactgc cacttttcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaaactctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag cttccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcaatacgg ctacctgacg 1140
ctcaacaatg gcagccaagc cgtgggacgt tcatcctttt actgcctgga atatttccct 1200
tctcagatgc tgagaacggg caacaacttt accttcagct acacctttga ggaagtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
caatacctgt attacctgaa cagaactcaa aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgtgggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaat 1500
tttacctgga ctggtgcttc aaaatataac ctcaatgggc gtgaatccat catcaaccct 1560
ggcactgcta tggcctcaca caaagacgac gaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaagagag cgccggagct tcaaacactg cattggacaa tgtcatgatt 1680
acagacgaag aggaaattaa agccactaac cctgtggcca ccgaaagatt tgggaccgtg 1740
gcagtcaatt tccagagcag cagcacagac cctgcgaccg gagatgtgca tgctatggga 1800
gcattacctg gcatggtgtg gcaagataga gacgtgtacc tgcagggtcc catttgggcc 1860
aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920
aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggcg 1980
gagttttcag ctacaaagtt tgcttcattc atcacccaat actccacagg acaagtgagt 2040
gtggaaattg aatgggagct gcagaaagaa aacagcaagc gctggaatcc cgaagtgcag 2100
tacacatcca attatgcaaa atctgccaac gttgatttta ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt taccttaccc gtcccctgta a 2211
<210> 94
<211> 4263
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 94
ggtggagtcg tgacgtgaat tacgtcatag ggttagggag gtcctgtatt agaggtcacg 60
tgagtgtttt gcgacatttt gcgacaccat gtggtcacgc tgggtattta agcccgagtg 120
agcacgcagg gtctccattt tgaagcggga ggtttgaacg cgcagccgcc atgccggggt 180
tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc ggcatttctg 240
acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat tctgacatgg 300
atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag cgcgactttc 360
tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg caatttgaga 420
agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg aaatccatgg 480
ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt taccgcggga 540
tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc gccggaggcg 600
ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa acccagcctg 660
agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg aatctcacgg 720
agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag gagcagaaca 780
aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact tcagccaggt 840
acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag cagtggatcc 900
aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg tcccaaatca 960
aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc cccgactacc 1020
tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa attttggaac 1080
taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc acgaaaaagt 1140
tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag accaacatcg 1200
cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc aatgagaact 1260
ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg aagatgaccg 1320
ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc gtggaccaga 1380
aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc aacaccaaca 1440
tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg ttgcaagacc 1500
ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag gtcaccaagc 1560
aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg gagcatgaat 1620
tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca gatataagtg 1680
agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg gaagcttcga 1740
tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg aatctgatgc 1800
tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc ttcactcacg 1860
gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt tctgtcgtca 1920
aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg ccagacgctt 1980
gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa caataaatga 2040
cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga caacctctct 2100
gagggcattc gcgagtggtg ggacttgaaa cctggagccc cgaagcccaa agccaaccag 2160
caaaagcagg acgacggccg gggtctggtg cttcctggct acaagtacct cggacccttc 2220
aacggactcg acaaggggga gcccgtcaac gcggcggacg cagcggccct cgagcacgac 2280
aaggcctacg accagcagct caaagcgggt gacaatccgt acctgcggta taaccacgcc 2340
gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa cctcgggcga 2400
gcagtcttcc aggccaagaa gcgggttctc gaacctctcg gtctggttga ggaaggcgct 2460
aagacggctc ctggaaagaa acgtccggta gagcagtcgc cacaagagcc agactcctcc 2520
tcgggcatcg gcaagacagg ccagcagccc gctaaaaaga gactcaattt tggtcagact 2580
ggcgactcag agtcagtccc cgatccacaa cctctcggag aacctccagc aacccccgct 2640
gctgtgggac ctactacaat ggcttcaggc ggtggcgcac caatggcaga caataacgaa 2700
ggcgccgacg gagtgggtaa tgcctcagga aattggcatt gcgattccac atggctgggc 2760
gacagagtca tcaccaccag cacccgcacc tgggccttgc ccacctacaa taaccacctc 2820
tacaagcaaa tctccagtgc ttcaacgggg gccagcaacg acaaccacta cttcggctac 2880
agcaccccct gggggtattt tgatttcaac agattccact gccacttttc accacgtgac 2940
tggcagcgac tcatcaacaa caattgggga ttccggccca agagactcaa cttcaaactc 3000
ttcaacatcc aagtcaagga ggtcacgacg aatgatggcg tcacaaccat cgctaataac 3060
cttaccagca cggttcaagt cttctcggac tcggagtacc agcttccgta cgtcctcggc 3120
tctgcgcacc agggctgcct ccctccgttc ccggcggacg tgttcatgat tccgcaatac 3180
ggctacctga cgctcaacaa tggcagccaa gccgtgggac gttcatcctt ttactgcctg 3240
gaatatttcc cttctcagat gctgagaacg ggcaacaact ttaccttcag ctacaccttt 3300
gaggaagtgc ctttccacag cagctacgcg cacagccaga gcctggaccg gctgatgaat 3360
cctctcatcg accaatacct gtattacctg aacagaactc aaaatcagtc cggaagtgcc 3420
caaaacaagg acttgctgtt tagccgtggg tctccagctg gcatgtctgt tcagcccaaa 3480
aactggctac ctggaccctg ttatcggcag cagcgcgttt ctaaaacaaa aacagacaac 3540
aacaacagca attttacctg gactggtgct tcaaaatata acctcaatgg gcgtgaatcc 3600
atcatcaacc ctggcactgc tatggcctca cacaaagacg acgaagacaa gttctttccc 3660
atgagcggtg tcatgatttt tggaaaagag agcgccggag cttcaaacac tgcattggac 3720
aatgtcatga ttacagacga agaggaaatt aaagccacta accctgtggc caccgaaaga 3780
tttgggaccg tggcagtcaa tttccagagc agcagcacag accctgcgac cggagatgtg 3840
catgctatgg gagcattacc tggcatggtg tggcaagata gagacgtgta cctgcagggt 3900
cccatttggg ccaaaattcc tcacacagat ggacactttc acccgtctcc tcttatgggc 3960
ggctttggac tcaagaaccc gcctcctcag atcctcatca aaaacacgcc tgttcctgcg 4020
aatcctccgg cggagttttc agctacaaag tttgcttcat tcatcaccca atactccaca 4080
ggacaagtga gtgtggaaat tgaatgggag ctgcagaaag aaaacagcaa gcgctggaat 4140
cccgaagtgc agtacacatc caattatgca aaatctgcca acgttgattt tactgtggac 4200
aacaatggac tttatactga gcctcgcccc attggcaccc gttaccttac ccgtcccctg 4260
taa 4263
<210> 95
<211> 2175
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 95
atgtcttttg ttgatcaccc tccagattgg ttggaagaag ttggtgaagg tcttcgcgag 60
tttttgggcc ttgaagcggg cccaccgaaa ccaaaaccca atcagcagca tcaagatcaa 120
gcccgtggtc ttgtgctgcc tggttataac tatctcggac ccggaaacgg tctcgatcga 180
ggagagcctg tcaacagggc agacgaggtc gcgcgagagc acgacatctc gtacaacgag 240
cagcttgagg cgggagacaa cccctacctc aagtacaacc acgcggacgc cgagtttcag 300
gagaagctcg ccgacgacac atccttcggg ggaaacctcg gaaaggcagt ctttcaggcc 360
aagaaaaggg ttctcgaacc ttttggcctg gttgaagagg gtgctaagac ggcccctacc 420
ggaaagcgga tagacgacca ctttccaaaa agaaagaagg ctcggaccga agaggactcc 480
aagccttcca cctcgtcaga cgccgaagct ggacccagcg gatcccagca gctgcaaatc 540
ccagcccaac cagcctcaag tttgggagct gatacaatgt ctgcgggagg tggcggccca 600
ttgggcgaca ataaccaagg tgccgatgga gtgggcaatg cctcgggaga ttggcattgc 660
gattccacgt ggatggggga cagagtcgtc accaagtcca cccgaacctg ggtgctgccc 720
agctacaaca accaccagta ccgagagatc aaaagcggct ccgtcgacgg aagcaacgcc 780
aacgcctact ttggatacag caccccctgg gggtactttg actttaaccg cttccacagc 840
cactggagcc cccgagactg gcaaagactc atcaacaact actggggctt cagaccccgg 900
tccctcagag tcaaaatctt caacattcaa gtcaaagagg tcacggtgca ggactccacc 960
accaccatcg ccaacaacct cacctccacc gtccaagtgt ttacggacga cgactaccag 1020
ctgccctacg tcgtcggcaa cgggaccgag ggatgcctgc cggccttccc tccgcaggtc 1080
tttacgctgc cgcagtacgg ttacgcgacg ctgaaccgcg acaacacaga aaatcccacc 1140
gagaggagca gcttcttctg cctagagtac tttcccagca agatgctgag aacgggcaac 1200
aactttgagt ttacctacaa ctttgaggag gtgcccttcc actccagctt cgctcccagt 1260
cagaacctgt tcaagctggc caacccgctg gtggaccagt acttgtaccg cttcgtgagc 1320
acaaataaca ctggcggagt ccagttcaac aagaacctgg ccgggagata cgccaacacc 1380
tacaaaaact ggttcccggg gcccatgggc cgaacccagg gctggaacct gggctccggg 1440
gtcaaccgcg ccagtgtcag cgccttcgcc acgaccaata ggatggagct cgagggcgcg 1500
agttaccagg tgcccccgca gccgaacggc atgaccaaca acctccaggg cagcaacacc 1560
tatgccctgg agaacactat gatcttcaac agccagccgg cgaacccggg caccaccgcc 1620
acgtacctcg agggcaacat gctcatcacc agcgagagcg agacgcagcc ggtgaaccgc 1680
gtggcgtaca acgtcggcgg gcagatggcc accaacaacc agagctccac cactgccccc 1740
gcgaccggca cgtacaacct ccaggaaatc gtgcccggca gcgtgtggat ggagagggac 1800
gtgtacctcc aaggacccat ctgggccaag atcccagaga cgggggcgca ctttcacccc 1860
tctccggcca tgggcggatt cggactcaaa cacccaccgc ccatgatgct catcaagaac 1920
acgcctgtgc ccggaaatat caccagcttc tcggacgtgc ccgtcagcag cttcatcacc 1980
cagtacagca ccgggcaggt caccgtggag atggagtggg agctcaagaa ggaaaactcc 2040
aagaggtgga acccagagat ccagtacaca aacaactaca acgaccccca gtttgtggac 2100
tttgccccgg acagcaccgg ggaatacaga accaccagac ctatcggaac ccgatacctt 2160
acccgacccc tttaa 2175
<210> 96
<211> 4057
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 96
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga cttaaaccag gtatgtcttt tgttgatcac cctccagatt ggttggaaga 1920
agttggtgaa ggtcttcgcg agtttttggg ccttgaagcg ggcccaccga aaccaaaacc 1980
caatcagcag catcaagatc aagcccgtgg tcttgtgctg cctggttata actatctcgg 2040
acccggaaac ggtctcgatc gaggagagcc tgtcaacagg gcagacgagg tcgcgcgaga 2100
gcacgacatc tcgtacaacg agcagcttga ggcgggagac aacccctacc tcaagtacaa 2160
ccacgcggac gccgagtttc aggagaagct cgccgacgac acatccttcg ggggaaacct 2220
cggaaaggca gtctttcagg ccaagaaaag ggttctcgaa ccttttggcc tggttgaaga 2280
gggtgctaag acggccccta ccggaaagcg gatagacgac cactttccaa aaagaaagaa 2340
ggctcggacc gaagaggact ccaagccttc cacctcgtca gacgccgaag ctggacccag 2400
cggatcccag cagctgcaaa tcccagccca accagcctca agtttgggag ctgatacaat 2460
gtctgcggga ggtggcggcc cattgggcga caataaccaa ggtgccgatg gagtgggcaa 2520
tgcctcggga gattggcatt gcgattccac gtggatgggg gacagagtcg tcaccaagtc 2580
cacccgaacc tgggtgctgc ccagctacaa caaccaccag taccgagaga tcaaaagcgg 2640
ctccgtcgac ggaagcaacg ccaacgccta ctttggatac agcaccccct gggggtactt 2700
tgactttaac cgcttccaca gccactggag cccccgagac tggcaaagac tcatcaacaa 2760
ctactggggc ttcagacccc ggtccctcag agtcaaaatc ttcaacattc aagtcaaaga 2820
ggtcacggtg caggactcca ccaccaccat cgccaacaac ctcacctcca ccgtccaagt 2880
gtttacggac gacgactacc agctgcccta cgtcgtcggc aacgggaccg agggatgcct 2940
gccggccttc cctccgcagg tctttacgct gccgcagtac ggttacgcga cgctgaaccg 3000
cgacaacaca gaaaatccca ccgagaggag cagcttcttc tgcctagagt actttcccag 3060
caagatgctg agaacgggca acaactttga gtttacctac aactttgagg aggtgccctt 3120
ccactccagc ttcgctccca gtcagaacct gttcaagctg gccaacccgc tggtggacca 3180
gtacttgtac cgcttcgtga gcacaaataa cactggcgga gtccagttca acaagaacct 3240
ggccgggaga tacgccaaca cctacaaaaa ctggttcccg gggcccatgg gccgaaccca 3300
gggctggaac ctgggctccg gggtcaaccg cgccagtgtc agcgccttcg ccacgaccaa 3360
taggatggag ctcgagggcg cgagttacca ggtgcccccg cagccgaacg gcatgaccaa 3420
caacctccag ggcagcaaca cctatgccct ggagaacact atgatcttca acagccagcc 3480
ggcgaacccg ggcaccaccg ccacgtacct cgagggcaac atgctcatca ccagcgagag 3540
cgagacgcag ccggtgaacc gcgtggcgta caacgtcggc gggcagatgg ccaccaacaa 3600
ccagagctcc accactgccc ccgcgaccgg cacgtacaac ctccaggaaa tcgtgcccgg 3660
cagcgtgtgg atggagaggg acgtgtacct ccaaggaccc atctgggcca agatcccaga 3720
gacgggggcg cactttcacc cctctccggc catgggcgga ttcggactca aacacccacc 3780
gcccatgatg ctcatcaaga acacgcctgt gcccggaaat atcaccagct tctcggacgt 3840
gcccgtcagc agcttcatca cccagtacag caccgggcag gtcaccgtgg agatggagtg 3900
ggagctcaag aaggaaaact ccaagaggtg gaacccagag atccagtaca caaacaacta 3960
caacgacccc cagtttgtgg actttgcccc ggacagcacc ggggaataca gaaccaccag 4020
acctatcgga acccgatacc ttacccgacc cctttaa 4057
<210> 97
<211> 2220
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 97
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acttgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggatgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaaga gggttctcga acctcttggt ctggttgagg aaggtgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcattggc 480
aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540
tcagtccccg acccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgaacatg ggccttgccc acctataaca accacctcta caagcaaatc 780
tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840
gggtattttg atttcaacag attccactgc catttctcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaagctctt caacatccaa 960
gtcaaggagg tcacgacgaa tgatggcgtc acgaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag ttgccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcagtacgg ctacctaacg 1140
ctcaacaatg gcagccaggc agtgggacgg tcatcctttt actgcctgga atatttccca 1200
tcgcagatgc tgagaacggg caataacttt accttcagct acaccttcga ggacgtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
cagtacctgt attacctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgggggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt accggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac cttaatgggc gtgaatctat aatcaaccct 1560
ggcactgcta tggcctcaca caaagacgac aaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaggagag cgccggagct tcaaacactg cattggacaa tgtcatgatc 1680
acagacgaag aggaaatcaa agccactaac cccgtggcca ccgaaagatt tgggactgtg 1740
gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgttatggga 1800
gccttacctg gaatggtgtg gcaagacaga gacgtatacc tgcagggtcc tatttgggcc 1860
aaaattcctc acacggatgg acactttcac ccgtctcctc tcatgggcgg ctttggactt 1920
aagcacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggca 1980
gagttttcgg ctacaaagtt tgcttcattc atcacccagt attccacagg acaagtgagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaaac gctggaatcc cgaagtgcag 2100
tatacatcta actatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt tacctcaccc gtcccctgta tgcttgttaa 2220
<210> 98
<211> 4102
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 98
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
caacctctct gagggcattc gcgagtggtg ggacttgaaa cctggagccc cgaaacccaa 1980
agccaaccag caaaagcagg acgacggccg gggtctggtg cttcctggct acaagtacct 2040
cggacccttc aacggactcg acaaggggga gcccgtcaac gcggcggatg cagcggccct 2100
cgagcacgac aaggcctacg accagcagct caaagcgggt gacaatccgt acctgcggta 2160
taaccacgcc gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa 2220
cctcgggcga gcagtcttcc aggccaagaa gagggttctc gaacctcttg gtctggttga 2280
ggaaggtgct aagacggctc ctggaaagaa acgtccggta gagcagtcgc cacaagagcc 2340
agactcctcc tcgggcattg gcaagacagg ccagcagccc gctaaaaaga gactcaattt 2400
tggtcagact ggcgactcag agtcagtccc cgacccacaa cctctcggag aacctccagc 2460
aacccccgct gctgtgggac ctactacaat ggcttcaggc ggtggcgcac caatggcaga 2520
caataacgaa ggcgccgacg gagtgggtaa tgcctcagga aattggcatt gcgattccac 2580
atggctgggc gacagagtca tcaccaccag cacccgaaca tgggccttgc ccacctataa 2640
caaccacctc tacaagcaaa tctccagtgc ttcaacgggg gccagcaacg acaaccacta 2700
cttcggctac agcaccccct gggggtattt tgatttcaac agattccact gccatttctc 2760
accacgtgac tggcagcgac tcatcaacaa caattgggga ttccggccca agagactcaa 2820
cttcaagctc ttcaacatcc aagtcaagga ggtcacgacg aatgatggcg tcacgaccat 2880
cgctaataac cttaccagca cggttcaagt cttctcggac tcggagtacc agttgccgta 2940
cgtcctcggc tctgcgcacc agggctgcct ccctccgttc ccggcggacg tgttcatgat 3000
tccgcagtac ggctacctaa cgctcaacaa tggcagccag gcagtgggac ggtcatcctt 3060
ttactgcctg gaatatttcc catcgcagat gctgagaacg ggcaataact ttaccttcag 3120
ctacaccttc gaggacgtgc ctttccacag cagctacgcg cacagccaga gcctggaccg 3180
gctgatgaat cctctcatcg accagtacct gtattacctg aacagaactc agaatcagtc 3240
cggaagtgcc caaaacaagg acttgctgtt tagccggggg tctccagctg gcatgtctgt 3300
tcagcccaaa aactggctac ctggaccctg ttaccggcag cagcgcgttt ctaaaacaaa 3360
aacagacaac aacaacagca actttacctg gactggtgct tcaaaatata accttaatgg 3420
gcgtgaatct ataatcaacc ctggcactgc tatggcctca cacaaagacg acaaagacaa 3480
gttctttccc atgagcggtg tcatgatttt tggaaaggag agcgccggag cttcaaacac 3540
tgcattggac aatgtcatga tcacagacga agaggaaatc aaagccacta accccgtggc 3600
caccgaaaga tttgggactg tggcagtcaa tctccagagc agcagcacag accctgcgac 3660
cggagatgtg catgttatgg gagccttacc tggaatggtg tggcaagaca gagacgtata 3720
cctgcagggt cctatttggg ccaaaattcc tcacacggat ggacactttc acccgtctcc 3780
tctcatgggc ggctttggac ttaagcaccc gcctcctcag atcctcatca aaaacacgcc 3840
tgttcctgcg aatcctccgg cagagttttc ggctacaaag tttgcttcat tcatcaccca 3900
gtattccaca ggacaagtga gcgtggagat tgaatgggag ctgcagaaag aaaacagcaa 3960
acgctggaat cccgaagtgc agtatacatc taactatgca aaatctgcca acgttgattt 4020
cactgtggac aacaatggac tttatactga gcctcgcccc attggcaccc gttacctcac 4080
ccgtcccctg tatgcttgtt aa 4102
<210> 99
<211> 2217
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 99
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg cgctgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctgc aggcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
ggaaagaaga gaccggtaga gccatcaccc cagcgttctc cagactcctc tacgggcatc 480
ggcaagaaag gccaacagcc cgccagaaaa agactcaatt ttggtcagac tggcgactca 540
gagtcagttc cagaccctca acctctcgga gaacctccag cagcgccctc tggtgtggga 600
cctaatacaa tggctgcagg cggtggcgca ccaatggcag acaataacga aggcgccgac 660
ggagtgggta gttcctcggg aaattggcat tgcgattcca catggctggg cgacagagtc 720
atcaccacca gcacccgaac ctgggccctg cccacctaca acaaccacct ctacaagcaa 780
atctccaacg ggacatcggg aggagccacc aacgacaaca cctacttcgg ctacagcacc 840
ccctgggggt attttgactt taacagattc cactgccact tttcaccacg tgactggcag 900
cgactcatca acaacaactg gggattccgg cccaagagac tcagcttcaa gctcttcaac 960
atccaggtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taacctcacc 1020
agcaccatcc aggtgtttac ggactcggag taccagctgc cgtacgttct cggctctgcc 1080
caccagggct gcctgcctcc gttcccggcg gacgtgttca tgattcccca gtacggctac 1140
ctaacactca acaacggtag tcaggccgtg ggacgctcct ccttctactg cctggaatac 1200
tttccttcgc agatgctgag aaccggcaac aacttccagt ttacttacac cttcgaggac 1260
gtgcctttcc acagcagcta cgcccacagc cagagcttgg accggctgat gaatcctctg 1320
attgaccagt acctgtacta cttgtctcgg actcaaacaa caggaggcac ggcaaatacg 1380
cagactctgg gcttcagcca aggtgggcct aatacaatgg ccaatcaggc aaagaactgg 1440
ctgccaggac cctgttaccg ccaacaacgc gtctcaacga caaccgggca aaacaacaat 1500
agcaactttg cctggactgc tgggaccaaa taccatctga atggaagaaa ttcattggct 1560
aatcctggca tcgctatggc aacacacaaa gacgacgagg agcgtttttt tcccagtaac 1620
gggatcctga tttttggcaa acaaaatgct gccagagaca atgcggatta cagcgatgtc 1680
atgctcacca gcgaggaaga aatcaaaacc actaaccctg tggctacaga ggaatacggt 1740
atcgtggcag ataacttgca gcagcaaaac acggctcctc aaattggaac tgtcaacagc 1800
cagggggcct tacccggtat ggtctggcag aaccgggacg tgtacctgca gggtcccatc 1860
tgggccaaga ttcctcacac ggacggcaac ttccacccgt ctccgctgat gggcggcttt 1920
ggcctgaaac atcctccgcc tcagatcctg atcaagaaca cgcctgtacc tgcggatcct 1980
ccgaccacct tcaaccagtc aaagctgaac tctttcatca cgcaatacag caccggacag 2040
gtcagcgtgg aaattgaatg ggagctgcag aaggaaaaca gcaagcgctg gaaccccgag 2100
atccagtaca cctccaacta ctacaaatct acaagtgtgg actttgctgt taatacagaa 2160
ggcgtgtact ctgaaccccg ccccattggc acccgttacc tcacccgtaa tctgtaa 2217
<210> 100
<211> 4269
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 100
ggtggagtcg tgacgtgaat tacgtcatag ggttagggag gtcctgtatt agaggtcacg 60
tgagtgtttt gcgacatttt gcgacaccat gtggtcacgc tgggtattta agcccgagtg 120
agcacgcagg gtctccattt tgaagcggga ggtttgaacg cgcagccgcc atgccggggt 180
tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc ggcatttctg 240
acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat tctgacatgg 300
atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag cgcgactttc 360
tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg caatttgaga 420
agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg aaatccatgg 480
ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt taccgcggga 540
tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc gccggaggcg 600
ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa acccagcctg 660
agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg aatctcacgg 720
agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag gagcagaaca 780
aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact tcagccaggt 840
acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag cagtggatcc 900
aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg tcccaaatca 960
aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc cccgactacc 1020
tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa attttggaac 1080
taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc acgaaaaagt 1140
tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag accaacatcg 1200
cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc aatgagaact 1260
ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg aagatgaccg 1320
ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc gtggaccaga 1380
aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc aacaccaaca 1440
tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg ttgcaagacc 1500
ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag gtcaccaagc 1560
aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg gagcatgaat 1620
tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca gatataagtg 1680
agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg gaagcttcga 1740
tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg aatctgatgc 1800
tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc ttcactcacg 1860
gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt tctgtcgtca 1920
aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg ccagacgctt 1980
gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa caataaatga 2040
cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga caacctctct 2100
gagggcattc gcgagtggtg ggcgctgaaa cctggagccc cgaagcccaa agccaaccag 2160
caaaagcagg acgacggccg gggtctggtg cttcctggct acaagtacct cggacccttc 2220
aacggactcg acaaggggga gcccgtcaac gcggcggacg cagcggccct cgagcacgac 2280
aaggcctacg accagcagct gcaggcgggt gacaatccgt acctgcggta taaccacgcc 2340
gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa cctcgggcga 2400
gcagtcttcc aggccaagaa gcgggttctc gaacctctcg gtctggttga ggaaggcgct 2460
aagacggctc ctggaaagaa gagaccggta gagccatcac cccagcgttc tccagactcc 2520
tctacgggca tcggcaagaa aggccaacag cccgccagaa aaagactcaa ttttggtcag 2580
actggcgact cagagtcagt tccagaccct caacctctcg gagaacctcc agcagcgccc 2640
tctggtgtgg gacctaatac aatggctgca ggcggtggcg caccaatggc agacaataac 2700
gaaggcgccg acggagtggg tagttcctcg ggaaattggc attgcgattc cacatggctg 2760
ggcgacagag tcatcaccac cagcacccga acctgggccc tgcccaccta caacaaccac 2820
ctctacaagc aaatctccaa cgggacatcg ggaggagcca ccaacgacaa cacctacttc 2880
ggctacagca ccccctgggg gtattttgac tttaacagat tccactgcca cttttcacca 2940
cgtgactggc agcgactcat caacaacaac tggggattcc ggcccaagag actcagcttc 3000
aagctcttca acatccaggt caaggaggtc acgcagaatg aaggcaccaa gaccatcgcc 3060
aataacctca ccagcaccat ccaggtgttt acggactcgg agtaccagct gccgtacgtt 3120
ctcggctctg cccaccaggg ctgcctgcct ccgttcccgg cggacgtgtt catgattccc 3180
cagtacggct acctaacact caacaacggt agtcaggccg tgggacgctc ctccttctac 3240
tgcctggaat actttccttc gcagatgctg agaaccggca acaacttcca gtttacttac 3300
accttcgagg acgtgccttt ccacagcagc tacgcccaca gccagagctt ggaccggctg 3360
atgaatcctc tgattgacca gtacctgtac tacttgtctc ggactcaaac aacaggaggc 3420
acggcaaata cgcagactct gggcttcagc caaggtgggc ctaatacaat ggccaatcag 3480
gcaaagaact ggctgccagg accctgttac cgccaacaac gcgtctcaac gacaaccggg 3540
caaaacaaca atagcaactt tgcctggact gctgggacca aataccatct gaatggaaga 3600
aattcattgg ctaatcctgg catcgctatg gcaacacaca aagacgacga ggagcgtttt 3660
tttcccagta acgggatcct gatttttggc aaacaaaatg ctgccagaga caatgcggat 3720
tacagcgatg tcatgctcac cagcgaggaa gaaatcaaaa ccactaaccc tgtggctaca 3780
gaggaatacg gtatcgtggc agataacttg cagcagcaaa acacggctcc tcaaattgga 3840
actgtcaaca gccagggggc cttacccggt atggtctggc agaaccggga cgtgtacctg 3900
cagggtccca tctgggccaa gattcctcac acggacggca acttccaccc gtctccgctg 3960
atgggcggct ttggcctgaa acatcctccg cctcagatcc tgatcaagaa cacgcctgta 4020
cctgcggatc ctccgaccac cttcaaccag tcaaagctga actctttcat cacgcaatac 4080
agcaccggac aggtcagcgt ggaaattgaa tgggagctgc agaaggaaaa cagcaagcgc 4140
tggaaccccg agatccagta cacctccaac tactacaaat ctacaagtgt ggactttgct 4200
gttaatacag aaggcgtgta ctctgaaccc cgccccattg gcacccgtta cctcacccgt 4260
aatctgtaa 4269
<210> 101
<211> 2211
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 101
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020
acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320
gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440
ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500
tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680
accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740
gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800
atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860
aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920
aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980
gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040
gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100
tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160
tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211
<210> 102
<211> 4093
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 102
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
caaccttagt gaaggaattc gcgagtggtg ggctttgaaa cctggagccc ctcaacccaa 1980
ggcaaatcaa caacatcaag acaacgctcg aggtcttgtg cttccgggtt acaaatacct 2040
tggacccggc aacggactcg acaaggggga gccggtcaac gcagcagacg cggcggccct 2100
cgagcacgac aaggcctacg accagcagct caaggccgga gacaacccgt acctcaagta 2160
caaccacgcc gacgccgagt tccaggagcg gctcaaagaa gatacgtctt ttgggggcaa 2220
cctcgggcga gcagtcttcc aggccaaaaa gaggcttctt gaacctcttg gtctggttga 2280
ggaagcggct aagacggctc ctggaaagaa gaggcctgta gagcagtctc ctcaggaacc 2340
ggactcctcc gcgggtattg gcaaatcggg tgcacagccc gctaaaaaga gactcaattt 2400
cggtcagact ggcgacacag agtcagtccc agaccctcaa ccaatcggag aacctcccgc 2460
agccccctca ggtgtgggat ctcttacaat ggcttcaggt ggtggcgcac cagtggcaga 2520
caataacgaa ggtgccgatg gagtgggtag ttcctcggga aattggcatt gcgattccca 2580
atggctgggg gacagagtca tcaccaccag cacccgaacc tgggccctgc ccacctacaa 2640
caatcacctc tacaagcaaa tctccaacag cacatctgga ggatcttcaa atgacaacgc 2700
ctacttcggc tacagcaccc cctgggggta ttttgacttc aacagattcc actgccactt 2760
ctcaccacgt gactggcagc gactcatcaa caacaactgg ggattccggc ctaagcgact 2820
caacttcaag ctcttcaaca ttcaggtcaa agaggttacg gacaacaatg gagtcaagac 2880
catcgccaat aaccttacca gcacggtcca ggtcttcacg gactcagact atcagctccc 2940
gtacgtgctc gggtcggctc acgagggctg cctcccgccg ttcccagcgg acgttttcat 3000
gattcctcag tacgggtatc tgacgcttaa tgatggaagc caggccgtgg gtcgttcgtc 3060
cttttactgc ctggaatatt tcccgtcgca aatgctaaga acgggtaaca acttccagtt 3120
cagctacgag tttgagaacg tacctttcca tagcagctac gctcacagcc aaagcctgga 3180
ccgactaatg aatccactca tcgaccaata cttgtactat ctctcaaaga ctattaacgg 3240
ttctggacag aatcaacaaa cgctaaaatt cagtgtggcc ggacccagca acatggctgt 3300
ccagggaaga aactacatac ctggacccag ctaccgacaa caacgtgtct caaccactgt 3360
gactcaaaac aacaacagcg aatttgcttg gcctggagct tcttcttggg ctctcaatgg 3420
acgtaatagc ttgatgaatc ctggacctgc tatggccagc cacaaagaag gagaggaccg 3480
tttctttcct ttgtctggat ctttaatttt tggcaaacaa ggaactggaa gagacaacgt 3540
ggatgcggac aaagtcatga taaccaacga agaagaaatt aaaactacta acccggtagc 3600
aacggagtcc tatggacaag tggccacaaa ccaccagagt gcccaagcac aggcgcagac 3660
cggctgggtt caaaaccaag gaatacttcc gggtatggtt tggcaggaca gagatgtgta 3720
cctgcaagga cccatttggg ccaaaattcc tcacacggac ggcaactttc acccttctcc 3780
gctgatggga gggtttggaa tgaagcaccc gcctcctcag atcctcatca aaaacacacc 3840
tgtacctgcg gatcctccaa cggccttcaa caaggacaag ctgaactctt tcatcaccca 3900
gtattctact ggccaagtca gcgtggagat cgagtgggag ctgcagaagg aaaacagcaa 3960
gcgctggaac ccggagatcc agtacacttc caactattac aagtctaata atgttgaatt 4020
tgctgttaat actgaaggtg tatatagtga accccgcccc attggcacca gatacctgac 4080
tcgtaatctg taa 4093
<210> 103
<211> 2217
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 103
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acttgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
ggaaagaaga gaccggtaga gccatcaccc cagcgttctc cagactcctc tacgggcatc 480
ggcaagaaag gccagcagcc cgcgaaaaag agactcaact ttgggcagac tggcgactca 540
gagtcagtgc ccgaccctca accaatcgga gaaccccccg caggcccctc tggtctggga 600
tctggtacaa tggctgcagg cggtggcgct ccaatggcag acaataacga aggcgccgac 660
ggagtgggta gttcctcagg aaattggcat tgcgattcca catggctggg cgacagagtc 720
atcaccacca gcacccgaac ctgggccctc cccacctaca acaaccacct ctacaagcaa 780
atctccaacg ggacttcggg aggaagcacc aacgacaaca cctacttcgg ctacagcacc 840
ccctgggggt attttgactt taacagattc cactgccact tctcaccacg tgactggcag 900
cgactcatca acaacaactg gggattccgg cccaagagac tcaacttcaa gctcttcaac 960
atccaggtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taaccttacc 1020
agcacgattc aggtctttac ggactcggaa taccagctcc cgtacgtcct cggctctgcg 1080
caccagggct gcctgcctcc gttcccggcg gacgtcttca tgattcctca gtacgggtac 1140
ctgactctga acaatggcag tcaggccgtg ggccgttcct ccttctactg cctggagtac 1200
tttccttctc aaatgctgag aacgggcaac aactttgagt tcagctacca gtttgaggac 1260
gtgccttttc acagcagcta cgcgcacagc caaagcctgg accggctgat gaaccccctc 1320
atcgaccagt acctgtacta cctgtctcgg actcagtcca cgggaggtac cgcaggaact 1380
cagcagttgc tattttctca ggccgggcct aataacatgt cggctcaggc caaaaactgg 1440
ctacccgggc cctgctaccg gcagcaacgc gtctccacga cactgtcgca aaataacaac 1500
agcaactttg cctggaccgg tgccaccaag tatcatctga atggcagaga ctctctggta 1560
aatcccggtg tcgctatggc aacccacaag gacgacgaag agcgattttt tccgtccagc 1620
ggagtcttaa tgtttgggaa acagggagct ggaaaagaca acgtggacta tagcagcgtt 1680
atgctaacca gtgaggaaga aattaaaacc accaacccag tggccacaga acagtacggc 1740
gtggtggccg ataacctgca acagcaaaac gccgctccta ttgtaggggc cgtcaacagt 1800
caaggagcct tacctggcat ggtctggcag aaccgggacg tgtacctgca gggtcctatc 1860
tgggccaaga ttcctcacac ggacggaaac tttcatccct cgccgctgat gggaggcttt 1920
ggactgaaac acccgcctcc tcagatcctg attaagaata cacctgttcc cgcggatcct 1980
ccaactacct tcagtcaagc taagctggcg tcgttcatca cgcagtacag caccggacag 2040
gtcagcgtgg aaattgaatg ggagctgcag aaagaaaaca gcaaacgctg gaacccagag 2100
attcaataca cttccaacta ctacaaatct acaaatgtgg actttgctgt taacacagat 2160
ggcacttatt ctgagcctcg ccccatcggc acccgttacc tcacccgtaa tctgtaa 2217
<210> 104
<211> 4269
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 104
ggtggagtcg tgacgtgaat tacgtcatag ggttagggag gtcctgtatt agaggtcacg 60
tgagtgtttt gcgacatttt gcgacaccat gtggtcacgc tgggtattta agcccgagtg 120
agcacgcagg gtctccattt tgaagcggga ggtttgaacg cgcagccgcc atgccggggt 180
tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc ggcatttctg 240
acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat tctgacatgg 300
atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag cgcgactttc 360
tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg caatttgaga 420
agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg aaatccatgg 480
ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt taccgcggga 540
tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc gccggaggcg 600
ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa acccagcctg 660
agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg aatctcacgg 720
agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag gagcagaaca 780
aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact tcagccaggt 840
acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag cagtggatcc 900
aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg tcccaaatca 960
aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc cccgactacc 1020
tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa attttggaac 1080
taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc acgaaaaagt 1140
tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag accaacatcg 1200
cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc aatgagaact 1260
ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg aagatgaccg 1320
ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc gtggaccaga 1380
aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc aacaccaaca 1440
tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg ttgcaagacc 1500
ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag gtcaccaagc 1560
aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg gagcatgaat 1620
tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca gatataagtg 1680
agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg gaagcttcga 1740
tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg aatctgatgc 1800
tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc ttcactcacg 1860
gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt tctgtcgtca 1920
aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg ccagacgctt 1980
gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa caataaatga 2040
cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga caacctctct 2100
gagggcattc gcgagtggtg ggacttgaaa cctggagccc cgaaacccaa agccaaccag 2160
caaaagcagg acgacggccg gggtctggtg cttcctggct acaagtacct cggacccttc 2220
aacggactcg acaaggggga gcccgtcaac gcggcggacg cagcggccct cgagcacgac 2280
aaggcctacg accagcagct caaagcgggt gacaatccgt acctgcggta taaccacgcc 2340
gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa cctcgggcga 2400
gcagtcttcc aggccaagaa gcgggttctc gaacctctcg gtctggttga ggaaggcgct 2460
aagacggctc ctggaaagaa gagaccggta gagccatcac cccagcgttc tccagactcc 2520
tctacgggca tcggcaagaa aggccagcag cccgcgaaaa agagactcaa ctttgggcag 2580
actggcgact cagagtcagt gcccgaccct caaccaatcg gagaaccccc cgcaggcccc 2640
tctggtctgg gatctggtac aatggctgca ggcggtggcg ctccaatggc agacaataac 2700
gaaggcgccg acggagtggg tagttcctca ggaaattggc attgcgattc cacatggctg 2760
ggcgacagag tcatcaccac cagcacccga acctgggccc tccccaccta caacaaccac 2820
ctctacaagc aaatctccaa cgggacttcg ggaggaagca ccaacgacaa cacctacttc 2880
ggctacagca ccccctgggg gtattttgac tttaacagat tccactgcca cttctcacca 2940
cgtgactggc agcgactcat caacaacaac tggggattcc ggcccaagag actcaacttc 3000
aagctcttca acatccaggt caaggaggtc acgcagaatg aaggcaccaa gaccatcgcc 3060
aataacctta ccagcacgat tcaggtcttt acggactcgg aataccagct cccgtacgtc 3120
ctcggctctg cgcaccaggg ctgcctgcct ccgttcccgg cggacgtctt catgattcct 3180
cagtacgggt acctgactct gaacaatggc agtcaggccg tgggccgttc ctccttctac 3240
tgcctggagt actttccttc tcaaatgctg agaacgggca acaactttga gttcagctac 3300
cagtttgagg acgtgccttt tcacagcagc tacgcgcaca gccaaagcct ggaccggctg 3360
atgaaccccc tcatcgacca gtacctgtac tacctgtctc ggactcagtc cacgggaggt 3420
accgcaggaa ctcagcagtt gctattttct caggccgggc ctaataacat gtcggctcag 3480
gccaaaaact ggctacccgg gccctgctac cggcagcaac gcgtctccac gacactgtcg 3540
caaaataaca acagcaactt tgcctggacc ggtgccacca agtatcatct gaatggcaga 3600
gactctctgg taaatcccgg tgtcgctatg gcaacccaca aggacgacga agagcgattt 3660
tttccgtcca gcggagtctt aatgtttggg aaacagggag ctggaaaaga caacgtggac 3720
tatagcagcg ttatgctaac cagtgaggaa gaaattaaaa ccaccaaccc agtggccaca 3780
gaacagtacg gcgtggtggc cgataacctg caacagcaaa acgccgctcc tattgtaggg 3840
gccgtcaaca gtcaaggagc cttacctggc atggtctggc agaaccggga cgtgtacctg 3900
cagggtccta tctgggccaa gattcctcac acggacggaa actttcatcc ctcgccgctg 3960
atgggaggct ttggactgaa acacccgcct cctcagatcc tgattaagaa tacacctgtt 4020
cccgcggatc ctccaactac cttcagtcaa gctaagctgg cgtcgttcat cacgcagtac 4080
agcaccggac aggtcagcgt ggaaattgaa tgggagctgc agaaagaaaa cagcaaacgc 4140
tggaacccag agattcaata cacttccaac tactacaaat ctacaaatgt ggactttgct 4200
gttaacacag atggcactta ttctgagcct cgccccatcg gcacccgtta cctcacccgt 4260
aatctgtaa 4269
<210> 105
<211> 2217
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 105
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acctgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120
aacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctcc aagcgggtga caatccgtac ctgcggtata atcacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgcgc agtcttccag 360
gccaaaaagc gggttctcga acctctgggc ctggttgaat cgccggttaa gacggctcct 420
ggaaagaaga gaccggtaga gccatcaccc cagcgctctc cagactcctc tacgggcatc 480
ggcaagaaag gccagcagcc cgcaaaaaag agactcaatt ttgggcagac tggcgactca 540
gagtcagtcc ccgaccctca accaatcgga gaaccaccag caggcccctc tggtctggga 600
tctggtacaa tggctgcagg cggtggcgct ccaatggcag acaataacga aggcgccgac 660
ggagtgggta gttcctcagg aaattggcat tgcgattcca catggctggg cgacagagtc 720
atcaccacca gcacccgcac ctgggccctg cccacctaca acaaccacct ctacaagcaa 780
atctccaacg ggacctcggg aggaagcacc aacgacaaca cctacttcgg ctacagcacc 840
ccctgggggt attttgactt caacagattc cactgccact tttcaccacg tgactggcag 900
cgactcatca acaacaactg gggattccgg cccaagaggc tcaacttcaa gctcttcaac 960
atccaagtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taaccttacc 1020
agcacgattc aggtctttac ggactcggaa taccagctcc cgtacgtgct cggctcggcg 1080
caccagggct gcctgcctcc gttcccggcg gacgtcttca tgattcctca gtacgggtac 1140
ctgactctga acaatggcag tcaggctgtg ggccggtcgt ccttctactg cctggagtac 1200
tttccttctc aaatgctgag aacgggcaac aactttgaat tcagctacaa cttcgaggac 1260
gtgcccttcc acagcagcta cgcgcacagc cagagcctgg accggctgat gaaccctctc 1320
atcgaccagt acttgtacta cctgtcccgg actcaaagca cgggcggtac tgcaggaact 1380
cagcagttgc tattttctca ggccgggcct aacaacatgt cggctcaggc caagaactgg 1440
ctacccggtc cctgctaccg gcagcaacgc gtctccacga cactgtcgca gaacaacaac 1500
agcaactttg cctggacggg tgccaccaag tatcatctga atggcagaga ctctctggtg 1560
aatcctggcg ttgccatggc tacccacaag gacgacgaag agcgattttt tccatccagc 1620
ggagtcttaa tgtttgggaa acagggagct ggaaaagaca acgtggacta tagcagcgtg 1680
atgctaacca gcgaggaaga aataaagacc accaacccag tggccacaga acagtacggc 1740
gtggtggccg ataacctgca acagcaaaac gccgctccta ttgtaggggc cgtcaatagt 1800
caaggagcct tacctgggat ggtgtggcag aaccgggacg tgtacctgca gggtcccatc 1860
tgggccaaga ttcctcatac ggacggcaac tttcatccct cgccgctgat gggaggcttt 1920
ggactgaagc atccgcctcc tcagatcctg attaaaaaca cacctgttcc cgcggatcct 1980
ccgaccacct tcaatcaggc caagctggct tctttcatca cgcagtacag taccggccag 2040
gtcagcgtgg agatcgagtg ggagctgcag aaggagaaca gcaaacgctg gaacccagag 2100
attcagtaca cttccaacta ctacaaatct acaaatgtgg actttgctgt caatactgag 2160
ggtacttatt ccgagcctcg ccccattggc acccgttacc tcacccgtaa tctgtaa 2217
<210> 106
<211> 4099
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成多肽
<400> 106
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga cttaaaccag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
caacctctct gagggcattc gcgagtggtg ggacctgaaa cctggagccc cgaaacccaa 1980
agccaaccag caaaagcagg acaacggccg gggtctggtg cttcctggct acaagtacct 2040
cggacccttc aacggactcg acaaggggga gcccgtcaac gcggcggacg cagcggccct 2100
cgagcacgac aaggcctacg accagcagct ccaagcgggt gacaatccgt acctgcggta 2160
taatcacgcc gacgccgagt ttcaggagcg tctgcaagaa gatacgtctt ttgggggcaa 2220
cctcgggcgc gcagtcttcc aggccaaaaa gcgggttctc gaacctctgg gcctggttga 2280
atcgccggtt aagacggctc ctggaaagaa gagaccggta gagccatcac cccagcgctc 2340
tccagactcc tctacgggca tcggcaagaa aggccagcag cccgcaaaaa agagactcaa 2400
ttttgggcag actggcgact cagagtcagt ccccgaccct caaccaatcg gagaaccacc 2460
agcaggcccc tctggtctgg gatctggtac aatggctgca ggcggtggcg ctccaatggc 2520
agacaataac gaaggcgccg acggagtggg tagttcctca ggaaattggc attgcgattc 2580
cacatggctg ggcgacagag tcatcaccac cagcacccgc acctgggccc tgcccaccta 2640
caacaaccac ctctacaagc aaatctccaa cgggacctcg ggaggaagca ccaacgacaa 2700
cacctacttc ggctacagca ccccctgggg gtattttgac ttcaacagat tccactgcca 2760
cttttcacca cgtgactggc agcgactcat caacaacaac tggggattcc ggcccaagag 2820
gctcaacttc aagctcttca acatccaagt caaggaggtc acgcagaatg aaggcaccaa 2880
gaccatcgcc aataacctta ccagcacgat tcaggtcttt acggactcgg aataccagct 2940
cccgtacgtg ctcggctcgg cgcaccaggg ctgcctgcct ccgttcccgg cggacgtctt 3000
catgattcct cagtacgggt acctgactct gaacaatggc agtcaggctg tgggccggtc 3060
gtccttctac tgcctggagt actttccttc tcaaatgctg agaacgggca acaactttga 3120
attcagctac aacttcgagg acgtgccctt ccacagcagc tacgcgcaca gccagagcct 3180
ggaccggctg atgaaccctc tcatcgacca gtacttgtac tacctgtccc ggactcaaag 3240
cacgggcggt actgcaggaa ctcagcagtt gctattttct caggccgggc ctaacaacat 3300
gtcggctcag gccaagaact ggctacccgg tccctgctac cggcagcaac gcgtctccac 3360
gacactgtcg cagaacaaca acagcaactt tgcctggacg ggtgccacca agtatcatct 3420
gaatggcaga gactctctgg tgaatcctgg cgttgccatg gctacccaca aggacgacga 3480
agagcgattt tttccatcca gcggagtctt aatgtttggg aaacagggag ctggaaaaga 3540
caacgtggac tatagcagcg tgatgctaac cagcgaggaa gaaataaaga ccaccaaccc 3600
agtggccaca gaacagtacg gcgtggtggc cgataacctg caacagcaaa acgccgctcc 3660
tattgtaggg gccgtcaata gtcaaggagc cttacctggg atggtgtggc agaaccggga 3720
cgtgtacctg cagggtccca tctgggccaa gattcctcat acggacggca actttcatcc 3780
ctcgccgctg atgggaggct ttggactgaa gcatccgcct cctcagatcc tgattaaaaa 3840
cacacctgtt cccgcggatc ctccgaccac cttcaatcag gccaagctgg cttctttcat 3900
cacgcagtac agtaccggcc aggtcagcgt ggagatcgag tgggagctgc agaaggagaa 3960
cagcaaacgc tggaacccag agattcagta cacttccaac tactacaaat ctacaaatgt 4020
ggactttgct gtcaatactg agggtactta ttccgagcct cgccccattg gcacccgtta 4080
cctcacccgt aatctgtaa 4099

Claims (58)

1.一种第一核酸载体,其包含:
编码AAVRep蛋白的第一核苷酸序列;
包含含有转基因的重组AAV(rAAV)基因组的第二核苷酸序列;以及
编码AAV衣壳蛋白的第三核苷酸序列,
其中所述核酸载体不包含辅助病毒基因。
2.如权利要求1所述的核酸载体,其从5'至3'包含:
编码AAVRep蛋白的所述第一核苷酸序列;
包含含有转基因的重组AAV(rAAV)基因组的所述第二核苷酸序列;以及
编码AAV衣壳蛋白的所述第三核苷酸序列,
其中所述核酸载体不包含辅助病毒基因。
3.如权利要求1所述的核酸载体,其从5'至3'包含:
编码AAVRep蛋白的所述第一核苷酸序列;
包含含有转基因的重组AAV(rAAV)基因组的所述第二核苷酸序列;以及
编码AAV衣壳蛋白的所述第三核苷酸序列。
4.如权利要求1-3中任一项所述的核酸载体,其中所述核酸载体是DNA质粒或DNA最小载体。
5.一种重组AAV(rAAV)包装系统,其包含:
(i)第一核酸载体,其包含:
编码AAVRep蛋白的第一核苷酸序列;
包含含有转基因的重组AAV(rAAV)基因组的第二核苷酸序列;以及
编码AAV衣壳蛋白的第三核苷酸序列,以及
(ii)第二核酸载体,其包含辅助病毒基因。
6.如权利要求5所述的包装系统,其中所述第一核酸载体从5'至3'包含:
编码AAVRep蛋白的所述第一核苷酸序列;
包含含有转基因的重组AAV(rAAV)基因组的所述第二核苷酸序列;以及
编码AAV衣壳蛋白的所述第三核苷酸序列。
7.如权利要求5或6所述的包装系统,其中所述第一核酸载体是DNA质粒或DNA最小载体。
8.如权利要求5-7中任一项所述的包装系统,其中所述第二核酸载体是DNA质粒或DNA最小载体。
9.如权利要求1-8中任一项所述的核酸载体或包装系统,其中所述转基因编码多肽。
10.如权利要求1-8中任一项所述的核酸载体或包装系统,其中所述转基因编码miRNA、shRNA、siRNA、反义RNA、gRNA、antagomir、miRNA海绵、RNA适体核酶、RNA适体、lncRNA、核酶或mRNA。
11.如权利要求1-8中任一项所述的核酸载体或包装系统,其中所述转基因编码葡萄糖-6-磷酸酶(G6Pase)或共济蛋白(FXN)。
12.如任一前述权利要求所述的核酸载体或包装系统,其中所述rAAV基因组还包含与所述转基因可操作地连接的转录调控元件。
13.如权利要求12所述的核酸载体或包装系统,其中所述转录调控元件包含启动子元件和/或内含子元件。
14.如任一前述权利要求所述的核酸载体或包装系统,其中所述rAAV基因组还包含多聚腺苷酸化序列。
15.如权利要求14所述的核酸载体或包装系统,其中所述多聚腺苷酸化序列在所述转基因的3'。
16.如任一前述权利要求所述的核酸载体或包装系统,其中所述rAAV基因组还包含在所述转基因的5’的5’反向末端重复(5’ITR)核苷酸序列和在所述转基因的3’的3'反向末端重复(3’ITR)核苷酸序列。
17.如任一前述权利要求所述的核酸载体或包装系统,其中所述AAV Rep蛋白是野生型Rep蛋白或其变体。
18.如任一前述权利要求所述的核酸载体或包装系统,其中所述AAV Rep蛋白是AAV2Rep蛋白或其变体。
19.如任一前述权利要求所述的核酸载体或包装系统,其中所述第一核苷酸序列还包含与所述AAV Rep蛋白编码序列可操作地连接的转录调控元件。
20.如权利要求19所述的核酸载体或包装系统,其中所述转录调控元件包含选自组成型启动子、诱导型启动子或天然启动子的启动子。
21.如权利要求20所述的核酸载体或包装系统,其中所述启动子选自P5启动子、P19启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。
22.如任一前述权利要求所述的核酸载体或包装系统,其中所述AAV衣壳蛋白选自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh10、AAVRh32.33、AAVrh74、AAV-DJ、AAV-LK03、NP59、VOY101、VOY201、VOY701、VOY801、VOY1101、AAVPHP.N、AAVPHP.A、AAVPHP.B、PHP.B2、PHP.B3、G2A3、G2B4、G2B5和PHP.S。
23.如任一前述权利要求所述的核酸载体或包装系统,其中所述第三核苷酸序列还包含与所述AAV衣壳蛋白编码序列可操作地连接的转录调控元件。
24.如权利要求23所述的核酸载体或包装系统,其中所述转录调控元件包含选自组成型启动子、诱导型启动子或天然启动子的启动子。
25.如权利要求24所述的核酸载体或包装系统,其中所述启动子选自P40启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。
26.如权利要求5-25中任一项所述的包装系统,其中所述辅助病毒基因源自选自腺病毒、疱疹病毒、痘病毒、巨细胞病毒和杆状病毒的辅助病毒。
27.如权利要求5-26中任一项所述的包装系统,其中所述辅助病毒基因是源自选自E1、E2、E4和VA的腺病毒的RNA基因。
28.如权利要求5-27中任一项所述的包装系统,其中所述第二核酸载体还包含与所述辅助病毒基因可操作地连接的转录调控元件。
29.如权利要求28所述的包装系统,其中所述转录调控元件包含选自组成型启动子、诱导型启动子或天然启动子的启动子。
30.如权利要求29所述的包装系统,其中所述启动子选自RSV LTR启动子、CMV立即早期启动子、SV40启动子、二氢叶酸还原酶启动子、细胞质β-肌动蛋白启动子、磷酸甘油酸激酶(PGK)启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。
31.如权利要求5-30中任一项所述的包装系统,其中所述第二核酸载体包含与SEQ IDNO:60、61或62所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。
32.如权利要求5-31中任一项所述的包装系统,其中所述第二核酸载体包含与SEQ IDNO:63所示的核苷酸序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的核苷酸序列。
33.如权利要求5-32中任一项所述的包装系统,其中所述辅助病毒基因是源自选自UL5/8/52、ICP0、ICP4、ICP22和UL30/UL42的疱疹病毒的基因。
34.如权利要求33所述的包装系统,其中所述第二核酸载体还包含与所述辅助病毒基因可操作地连接的转录调控元件。
35.如权利要求34所述的包装系统,其中所述转录调控元件包含选自组成型启动子、诱导型启动子或天然启动子的启动子。
36.如权利要求35所述的包装系统,其中所述启动子选自RSV LTR启动子、CMV立即早期启动子、SV40启动子、二氢叶酸还原酶启动子、细胞质β-肌动蛋白启动子、磷酸甘油酸激酶(PGK)启动子、金属硫蛋白(MT)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、T7启动子、蜕皮激素昆虫启动子、四环素阻抑型启动子、四环素诱导型启动子、RU486诱导型启动子和雷帕霉素诱导型启动子。
37.一种宿主细胞,其包含权利要求1-4或9-25中任一项所述的核酸载体,或权利要求5-36中任一项所述的包装系统。
38.如权利要求37所述的宿主细胞,其中所述宿主细胞是哺乳动物细胞。
39.如权利要求38所述的宿主细胞,其中所述哺乳动物细胞选自COS细胞、CHO细胞、BHK细胞、MDCK细胞、HEK293细胞、HEK293T细胞、HEK293F细胞、NS0细胞、PER.C6细胞、VERO细胞、CRL7O3O细胞、HsS78Bst细胞、HeLa细胞、NIH 3T3细胞、HepG2细胞、SP210细胞、R1.1细胞、B-W细胞、L-M细胞、BSC1细胞、BSC40细胞、YB/20细胞和BMT10细胞。
40.如权利要求38或39所述的宿主细胞,其中所述哺乳动物细胞是HEK293细胞。
41.一种rAAV的重组制备方法,所述方法包括在产生所述rAAV的条件下将权利要求5-36中任一项所述的包装系统引入哺乳动物细胞中。
42.如权利要求41所述的方法,其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率选自1:0.2、1:0.4、1:0.6、1:0.8、1:1、1:2、1:3或1:4。
43.如权利要求41或42所述的方法,其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率为1:2。
44.如权利要求41或42所述的方法,其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率为1:0.2至1:1。
45.如权利要求44所述的方法,其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率为1:0.6。
46.如权利要求44所述的方法,其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率为1:0.8。
47.如权利要求44所述的方法,其中所述第一核酸载体与所述第二核酸载体的比率或所述第二核酸载体与所述第一核酸载体的比率为1:1。
48.如权利要求41-47中任一项所述的方法,其中所述方法包括引入所述包装系统的0.1至4μg DNA/1E6个细胞。
49.如权利要求41-48中任一项所述的方法,其中所述方法包括引入所述包装系统的0.5至1μg DNA/1E6个细胞。
50.如权利要求41-49中任一项所述的方法,其中所述方法包括引入所述包装系统的0.6、0.7、0.8、0.9或1μg DNA/1E6个细胞。
51.如权利要求41-49中任一项所述的方法,其中所述方法包括引入所述包装系统的0.75DNA/1E6个细胞。
52.如权利要求41-51中任一项所述的方法,其中所述方法与包括使用以下哺乳动物细胞产生rAAV的方法相比导致增加的rAAV滴度,所述哺乳动物细胞包含:
(i)包含编码所述AAV Rep蛋白和所述AAV衣壳蛋白的核苷酸序列的第一载体;
(ii)包含所述rAAV基因组的第二载体;以及
(iii)包含所述一种或多种辅助病毒基因的第三载体。
53.如权利要求41-51中任一项所述的方法,其中所述方法与包括使用以下哺乳动物细胞产生rAAV的方法相比导致增加的完整载体基因组的百分比,所述哺乳动物细胞包含:
(i)包含编码所述AAV Rep蛋白和所述AAV衣壳蛋白的核苷酸序列的第一载体;
(ii)包含所述rAAV基因组的第二载体;以及
(iii)包含所述一种或多种辅助病毒基因的第三载体。
54.如权利要求41-53中任一项所述的方法,其中所述哺乳动物细胞选自COS细胞、CHO细胞、BHK细胞、MDCK细胞、HEK293细胞、HEK293T细胞、HEK293F细胞、NS0细胞、PER.C6细胞、VERO细胞、CRL7O3O细胞、HsS78Bst细胞、HeLa细胞、NIH 3T3细胞、HepG2细胞、SP210细胞、R1.1细胞、B-W细胞、L-M细胞、BSC1细胞、BSC40细胞、YB/20细胞和BMT10细胞。
55.如权利要求41-54中任一项所述的方法,其中所述哺乳动物细胞为HEK293细胞。
56.如权利要求41-55中任一项所述的方法,其中所述哺乳动物细胞在细胞培养物中提供。
57.一种如权利要求37-40中任一项所定义的宿主细胞的群体,其中所述宿主细胞的群体在细胞培养物中提供。
58.如权利要求56所述的方法或如权利要求57所述的宿主细胞的群体,其中所述细胞培养物的体积为至少2升、至少50升或至少2000升。
CN202280044370.8A 2021-06-25 2022-06-24 腺相关病毒包装系统 Pending CN117716042A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US63/202817 2021-06-25
US63/262218 2021-10-07
US202263266646P 2022-01-11 2022-01-11
US63/266646 2022-01-11
PCT/US2022/073138 WO2022272297A1 (en) 2021-06-25 2022-06-24 Adeno-associated virus packaging systems

Publications (1)

Publication Number Publication Date
CN117716042A true CN117716042A (zh) 2024-03-15

Family

ID=90161125

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280044370.8A Pending CN117716042A (zh) 2021-06-25 2022-06-24 腺相关病毒包装系统

Country Status (1)

Country Link
CN (1) CN117716042A (zh)

Similar Documents

Publication Publication Date Title
EP1064393B1 (en) Compositions and methods for helper-free production of recombinant adeno-associated viruses
US9896665B2 (en) Proviral plasmids and production of recombinant adeno-associated virus
US6953690B1 (en) Compositions and methods for helper-free production of recombinant adeno-associated viruses
KR100403708B1 (ko) 재조합아데노-수반바이러스(aav)제조방법및이의용도
KR100510822B1 (ko) 재조합 아데노바이러스 제조용 세포
US5756283A (en) Method for improved production of recombinant adeno-associated viruses for gene therapy
US7115391B1 (en) Production of recombinant AAV using adenovirus comprising AAV rep/cap genes
CN113302201A (zh) 重组病毒载体和用于产生所述重组病毒载体的核酸
CA2945965C (en) Codon optimized nucleic acid encoding a retinitis pigmentosa gtpase regulator (rpgr)
JPH09509578A (ja) 組み込み可能な組み換えアデノウィルス、それらの製造及びそれらの治療的利用
JP2024059727A (ja) Cns変性のための遺伝子治療法
JP2003525590A (ja) Aav粒子中に組換えベクターをキャプシド形成するための方法、組成物、および細胞
JP2001506132A (ja) Aavベクターの産生における使用のためのリコンビナーゼ活性化可能aavパッケージングカセット
KR20230043869A (ko) Aav 벡터를 사용한 플라코필린-2(pkp2) 유전자 요법
CN115298316A (zh) 用于制备腺相关病毒载体的方法
KR20240025645A (ko) 아데노-연관된 바이러스 패키징 시스템
JP2003511037A (ja) AAVrep/cap遺伝子を含むアデノウイルスを使用する組換えAAVの産生
JP2001520051A (ja) 組換えaavベクターの産生のための増幅可能アデノ随伴ウイルス(aav)パッケージングカセット
EP4112731A1 (en) System for high-level raav production
CN117716042A (zh) 腺相关病毒包装系统
TW202229558A (zh) 用於同時基因活化的核酸構建體
Weger High-Level rAAV Vector Production by rAdV-Mediated Amplification of Small Amounts of Input Vector. Viruses 2023, 15, 64
JP2003501042A (ja) 非哺乳動物ウイルス由来のキャリアベクターを使用する、組換えウイルスの産生のための組成物および方法
WO2024081756A2 (en) Compositions and methods for adeno-associated viral production
TW202223094A (zh) 用於 va rna 轉錄之核酸構建體

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication